MASARYKOVA UNIVERZITA Filozofická fakulta Ústav české literatury a knihovnictví Kabinet informačních studií a knihovnictví Informační studia a knihovnictví
Tomáš Marek
Efektivní vizualizace dat se zaměřením na základní typy grafů Magisterská diplomová práce
Vedoucí práce: Mgr. Jan Boček 2014
…………………………………….. Vedoucí práce: Mgr. Jan Boček
Prohlašuji, že jsem diplomovou práci vypracoval samostatně s využitím uvedených pramenů a literatury.
…………………………………….. Tomáš Marek
Bibliografický záznam MAREK, Tomáš. Efektivní vizualizace dat se zaměřením na základní typy grafů. Brno, 2014. Magisterská práce. Masarykova univerzita, Filozofická fakulta, Ústav české literatury a knihovnictví, Kabinet informačních studií a knihovnictví. Vedoucí práce Mgr. Jan Boček.
Anotace Magisterská práce se zabývá problematikou efektivní vizualizace dat na nejnižší úrovni, tedy v oblasti základních typů grafů. Kromě obecného úvodu do grafů práce podrobněji představuje dosavadní koncepty efektivity a mapuje jejich diskuze. V moderní informační společnosti, kde je nutné se s daty vyrovnat a vizuálně je komunikovat, se efektivní vizualizace dat stává kritickou dovedností. Teoretické shrnutí problematiky efektivity vizualizace dat proto ústí v návrh studijního materiálu určeného na míru studentům oboru Informační studia a knihovnictví na FF MU.
Annotation This thesis primarily focuses on data visualization effectivity at the lowest level of form, i.e. basic graph and chart types. In addition to the general introduction of graphs and information graphics, this thesis provides insight into existing concepts of effective infovis and summarizes their discussions. Effective data analysis and visualization becoming an essential skill in our modern information society. That is why theoretical part of the thesis leads to draft study material intended to be used by students of Library and Information studies (KISK) at FF MU.
Klíčová slova Vizualizace dat, vizualizace informací, grafy, informační grafika, efektivita, data-ink poměr, chartjunk, vizuální vnímání.
Keywords Data visualization, information visualization, graphs, charts, information graphics, effectivity, data-ink ratio, chartjunk, visual cognition.
Obsah 1. Úvod do diplomové práce.............................................................................................................................8 1.1 Téma práce..................................................................................................................................................11 1.2 Cíl a očekávaný přínos práce.................................................................................................................11 1.3 Specifika a omezení práce......................................................................................................................12 2. Úvod do grafu..................................................................................................................................................14 2.1 Graf v širším kontextu............................................................................................................................14 2.2 Uvedení statistického grafu.................................................................................................................16 2.3 Komponenty grafu..................................................................................................................................17 2.3.1 Rámec grafu......................................................................................................................................19 2.3.2 Kontext grafu..................................................................................................................................20 2.3.3 Datové prvky...................................................................................................................................21 2.4 Typy grafů a jejich kategorizace.........................................................................................................22 2.5 Smysl a použití grafu.............................................................................................................................25 2.6 Stručná historie a současnost grafů..................................................................................................28 3. Problematika efektivního grafu................................................................................................................31 3.1 Co je to efektivní graf?...........................................................................................................................32 3.2 Problematika grafů z pozice akademika..........................................................................................34 3.2.1. Efektivní graf ve vzdělávání.......................................................................................................36 3.2.2 Efektivní graf v SW nástrojích...................................................................................................39 3.3 Osvěta k efektivnímu grafu.................................................................................................................40 4. Koncepty a diskuze efektivního grafu...................................................................................................42 4.1 Koncept data-ink poměr.......................................................................................................................43 4.2 Diskuze a výzkumy data-ink poměru...............................................................................................45 4.3 Koncept chartjunk.................................................................................................................................49 4.4 Diskuze a výzkumy chartjunku..........................................................................................................50 4.5 Koncept Lie Factor................................................................................................................................56 4.6 Diskuze a výzkumy Lie Factoru..........................................................................................................61 4.7 Rámec Trifecta........................................................................................................................................62 4.8 Diskuze koláčového grafu...................................................................................................................65 5. Kognitivní aspekty efektivního grafu.....................................................................................................68 5.1 Model mozku a paměti.........................................................................................................................69 5.2 Předpozornostní atributy.....................................................................................................................70 5.3 Gestalt a informační vizualizace .......................................................................................................72 5.4 Krátkodobá paměť a její limity..........................................................................................................74 5
5.5 Barvy a efektivní graf.............................................................................................................................76 6. Efektivní graf v diplomové práci.............................................................................................................80 6.1 Specifika analýzy....................................................................................................................................80 6.2 Metodologie.............................................................................................................................................81 6.3 Vzorek prací.............................................................................................................................................82 6.4 Deskriptivní výzkumné otázky..........................................................................................................82 6.5 Kódování a indikátory..........................................................................................................................82 6.6 Výstupy analýzy.....................................................................................................................................84 6.6.1 Jaké typy grafů jsou diplomanty nejčastěji využívány?......................................................84 6.6.2 Používají diplomanti grafy jen tam, kde je to vhodné?......................................................85 6.6.3 Obstojí grafy jako samostatně stojící jednotky bez textu?................................................85 6.6.4 Používají diplomanti v rámci estetiky nevhodné 3D efekty?...........................................85 6.6.5 Mapují diplomanti legendu k datovým prvkům?................................................................85 6.6.6 Dochází v diplomových pracích k manipulaci s grafy?....................................................86 6.6.7 Další pozorování...........................................................................................................................86 6.7. Příklady grafů z diplomových prací.................................................................................................87 7. Tvorba efektivního grafu v diplomové práci.........................................................................................91 8. Závěr...................................................................................................................................................................92 Seznam obrázků..................................................................................................................................................93 Seznam tabulek...................................................................................................................................................94 Bibliografické citace...........................................................................................................................................95 Zdroje převzatých grafů...................................................................................................................................108 Příloha I. Návrh studijního materiálu.........................................................................................................110
6
7
1.
Úvod do diplomové práce V historii vizualizace dat nacházíme mnohé příběhy ilustrující efektivitu vizuálního
zobrazení kvantitativních dat. Některé z příběhů ústí až v záchranu lidských životů. 1 Teprve u příběhů opačných, kdy nevhodná vizualizace lidské životy maří, si však uvědomujeme, jak potřebné je řešit otázku efektivní vizualizace a vizualizační gramotnosti a jak důležité je v moderní informační společnosti zahlcené daty dokázat tato data a výsledky jejich analýzy správně graficky komunikovat. I proto zřejmě slavný teoretik vizualizace Edward Tufte ve své knize Visual explanations: images and quantities, evidence and narrative (1997) předkládá příběh raketoplánu Challenger, jehož exploze krátce po startu není příběhem selhání stroje, nýbrž příběhem selhání člověka a jeho neschopnosti efektivně komunikovat data. V lednu roku 1986 se do historie amerického vesmírného programu zapsala jedna z jeho dosud největších tragédií. Raketoplán Challenger se několik desítek vteřin po svém startu vzňal, explodoval a rozpadl se na několik menších kusů. Následkem selhání nepřežil start raketoplánu jediný astronaut ze sedmičlenné posádky. Ačkoliv existuje více interpretací snažících se najít příčinu události a identifikovat původce, pro nás je zajímavý výklad, se kterým přichází právě Tufte (1997). Ten za viníka označuje neefektivní vizualizaci, pomocí které se snažili inženýři z firmy dodávající těsnění k raketoplánu přesvědčit NASA, že očekávané klimatické podmínky nejsou vhodné ke startu. Domnívali se, a z analýzy dat dosavadních startů a testů raketoplánů to též vyplývalo, že selhání těsnění korelují s teplotou: čím nižší byla teplota, tím vyšší pravděpodobnost disfunkce. Meteorologická služba předpovídala na den startu velmi nízké teploty, výrazně nižší než za jakých kdy raketoplány dosud startovaly, a bylo tak nutné tyto obavy směrem k NASA komunikovat. 1
Vzpomeňme například mapové vizualizace britského lékaře Johna Snowa, jež pomohly zastavit šíření cholery v Londýně (více viz Friendly, 2008 či protiargumentace McLeod, 2000) nebo dále ještě zmíněné polární vizualizace britské zdravotní sestry Florence Nightingale, skrze které se ji povedlo nastartovat reformu britského vojenského zdravotnictví (viz Friendly, 2008).
8
Obr. 1 Graf vytvořený inženýry ve společnosti Morton Thiokol s cílem komunikovat NASA nevhodnost startu raketoplánu. Převzato z Tufte (1997).
Vznikla vizualizace reprodukovaná na obrázku výše. Pomocí vizuální metafory raketoplánů je zde zobrazeno předchozích 24 startů, v horní části raket jsou pak uvedeny teploty při startu. Na samotných vypodobněních jsou následně namapovány jednotlivé zaznamenané defekty a jejich pozice na raketoplánu. Zvolená forma vizuální komunikace dat ovšem nereflektuje závěr analýzy, kterou se její tvůrci snažili předat, a nedaří se ji tento závěr zobrazit. Vizualizace sice efektivně komunikuje přesné lokalizační údaje o disfunkčních těsněních, ty jsou však pro předání sdělení irelevantní. Prezentovaná informační grafika tedy selhala v komunikaci vztahu mezi teplotou a defektem a o odložení startu raketoplánu NASA přesvědčit nedokázala. Pokud by inženýři z dodavatelské společnosti zvolili jinou formu komunikace, možná by se jim podařilo NASA přesvědčit o odložení startu. Efektivnějším řešením by bylo například podchytit obávaný vztah (teplota a defekty) a umístit jeho proměnné na dvě osy karteziánského souřadnicového systému. S takovým řešením přichází i Tufte (1997), když se snaží ukázat, jak 9
stejná data vizuálně prezentovat efektivněji: na osu x vynáší teplotu při startu raketoplánů (ve stupních Fahrenheita), na osu y pak počet defektů (jak vidíme, jejich lokace na raketoplánu není pro naše sdělení důležitá). Jednotlivé starty pak mapuje jako datové body a vzniká tak jednoduchý scatter plot, korelační graf. Extrapolací pak Tufte dochází k předpokládanému počtu defektů při předpovídané teplotě a tento bod taktéž zobrazuje. Vzhledem ke své pozici se dostává zcela mimo datovou oblast grafu, čímž se vizuální váha sdělení stává ještě urgentnější. Podpořena je též velikostí datového bodu.
Obr. 2 Návrh zobrazení dat o korelaci mezi teplotou při startu (na ose x) a počtem selhání (na ose y) dle Tufteho. Převzato a upraveno z Tufte (1997).
Neschopnost se efektivně graficky vyjádřit a efektivně prezentovat kvantitativní data se stala pro posádku raketoplánu Challenger osudnou. 2 Běžně neefektivní grafy nikoho na životě neohrožují, v profesním životě však mohou mít přímý dopad například na byznys a financování nebo na naši vědeckou důvěryhodnost.
2 Jednoznačné přiřazení viny u tak kontroverzní události je nebezpečné. Protiargument k Tufteho příběhu přinášejí např. Robinson et al. (2002).
10
1.1
Téma práce V současné informační společnosti, kdy jsme daty obklopeni a mnozí teoretici užívají
k popsání situace termíny typu big data či emočně negativnější datový smog, je nutné se umět s daty nejen vypořádat a analyzovat je, ale dokázat je i efektivně vizuálně prezentovat, a to ať už je našim cílem jejich objektivní komunikace, nebo argumentace a přesvědčování. V praxi ovšem stále neumíme volit vhodné vizuální metafory a jejich vlastnosti pro dané kontexty, a to ani v souvislosti s malými daty a základními druhy vizualizace. Tuto skutečnost podrobněji rozebírá a důvody současného stavu hledá kap. 3. Předkládaná diplomová práce se proto zabývá nejběžnějšími formami vizualizace, tedy základními statistickými grafy, z hlediska jejich efektivity. Představuje teoretické koncepty efektivity grafu a se snahou o objektivní nadhled mapuje jejich odborné diskuze. Práce též hledá vhodný přístup k efektivitě grafu v kontextu akademické práce, který následně aplikuje v praktické části. I zde, v akademickém prostředí, totiž stále narážíme na neefektivní grafy. „Vědecké grafy jsou aktuálně ve velmi chaotickém stavu. Stejné typy dat jsou prezentovány se signifikantní rozdílností, což vede ke ztrátě efektivity při interpretaci,“ popisuje stav v oblasti akademické vizuální komunikace kvantitativních dat Triglav (2014). S ohledem na skutečnost, že se běžné metafory informační vizualizace stávají stále důležitější součástí mezilidské/akademické komunikace, se musíme začít efektivitou vizuální reprezentace kvantitativních dat podrobněji zabývat.
1.2
Cíl a očekávaný přínos práce Cílem práce je usadit problematiku efektivity nejzákladnějších forem grafů do širšího
teoretického kontextu a představit ji komplexně v jejím současném stavu, který se vyznačuje obtížnou podchytitelností (viz dále kap. 1.3). Koncepty efektivního grafu a jejich diskuze dosud nebyly takto objektivně a z nadhledu popsány, a to nejen v českém jazykovém prostředí. Podobná komplexní shrnutí jsou obecně vzácná.
11
Aby se však nezastavila u teoretického zkoumání, pokouší se tato práce přispět též k tolik potřebné osvětě. Na základě kritické syntézy studovaných praktických příruček i dalších praktických zdrojů a jejich nahlížení skrze prezentované teorie efektivity a v kap. 5 shrnuté znalosti o lidské kognici, ústí práce v praktický studijní materiál. Ten jen určen primárně studentům oboru ISK na FF MU a může být použit ve výuce metodologických a vizualizačních/datově-analytických předmětů. Vyšším cílem studijního materiálu je vést studenty k tzv. aktivní tvorbě grafu, tedy změně přemýšlení o grafu: ke kritickému přístupu při čtení grafů a kontextově efektivnímu přístupu k jejich tvorbě.
1.3
Specifika a omezení práce Terminologie. V českém prostředí je téma efektivity vizualizace málo řešeno, a tak bylo
nutné poskytnout v práci obecný teoretický úvod do grafu, který zároveň slouží k ustálení terminologie. Ta se ukázala být jako problematická nejen v českém, ale i v anglickém jazykovém prostředí a na jejich přechodu. Práce tak poskytuje překlady a sjednocení některých základních termínů. Aktuálnost. Ačkoliv se téma efektivní vizualizace řeší již od počátku minulého století (viz např. Brinton, 1915), teprve nyní, spolu s laicizací možností tvorby vizualizací, se celá problematika stává akutní a hutně diskutovanou. Zachycení stavu diskuzí je tak momentální, k datu publikace práce, a lze předpokládat, že další výzkumy a debaty budou naše znalosti o efektivitě vnímání grafické reprezentace dat posouvat dále. Zaujatost diskuzí. Shrnutí diskuzí teoretických konceptů bylo zatíženo ideologickými a nekonstruktivními debatami, které se v rapidně se rozvíjející problematice objevují. Tyto debaty
kopírují
století
znatelný
rozkol
odborné
komunity
na
vědeckou
a uměleckou/designérskou část. Rozkol byl v posledních letech ještě posílen nástupem komunikace skrze osobní blogy a sociální média. Bylo třeba se nad diskuze povznést a podívat se na celé vizualizační pole a jeho odbornou komunitu jako celek. K udržování nadhledu se osvědčil dále představený koncept intencionalistické kritiky.
12
Analýza a aplikace. Aby byla aplikační část práce (tedy návrh studijního materiálu) založena kromě teorie i na reálných potřebách cílové skupiny, byla do jinak primárně teoreticko-aplikační práce vnořena i doplňující výzkumná část. Původní předpoklad polostrukturovaných rozhovorů se studenty cílového oboru byl po analýze případných přínosů zavržen jako s ohledem na cíle nepříliš vhodné řešení. Místo tvůrců byly nakonec analyzovány výtvory, které nám s přihlédnutím k účelu výzkumu v této práci přinesly mnohem více užitečných vhledů do stavu grafu v diplomových pracích. Zvolená metoda zjednodušené kvantitativní obsahové analýzy nese v kontextu zkoumání grafů jako jednotek výzkumu množství specifik, které jsou dále diskutovány v kap. 6.1. Citace. Seznam diplomových prací, ze kterých byly převzaty grafy použité ve studijním materiálu a v kap. 6.7, je uveden na konci práce a je vyčleněn od ostatních bibliografických zdrojů. Ilustrace použité ve studijním materiálu jsou původní a ukázky špatných grafů nejsou s ohledem na etický přístup k jejich autorům přímo ve studijním materiálu zdrojovány.
13
2.
Úvod do grafu Cílem úvodu do grafu je nejen uvést do tématu datové vizualizace se zaměřením na
základní typy statistických grafů, ale především poskytnout teoretický rámec navazujícím částem práce a skrze tento rámec ustanovit terminologii, která se ukazuje býti dosud neustálenou (jak upozorňuje i Cleveland, 1994), a to nejen v českém jazykovém prostředí, ale též v anglicky psaných zdrojích. Většina uvedené terminologie je proto v následujícím textu opatřena jak anglickými překlady (pocházejícími z vlastního zkoumání zdrojů a z referenční příručky Harris, 1996), tak poznámkami upozorňujícími na případné terminologické obtíže anglicky psané literatury a jejího překladu do českého prostředí. Kapitola představuje obecný úvod do grafů: zařazuje graf do širšího kontextu informační grafiky a vizualizace dat, představuje a definuje statistický graf, jeho vizuální syntax, seznamuje čtenáře s nejběžnějšími typy grafů a hledá smysl a účely užití grafu, které ilustruje na příkladech z historie vizualizace.
2.1
Graf v širším kontextu Podívejme se na grafy nejdříve z širšího pohledu vizualizace dat, kam jsou běžně řazeny.
Card, Mackinlay a Shneiderman (1999) definují ve sborníku Readings in Information Visualization vizualizaci dat jako „použití počítačem podpořené, interaktivní 3, vizuální reprezentace dat za účelem rozšíření kognice“4. Podobnou definici nabízí i TDKIV, která vizualizaci dat popisuje jako „proces převodu číselných a kvantitativních údajů a jejich vztahů do vizuálního, zpravidla grafického zobrazení s využitím počítačové grafiky, které napomáhá jejich percepci a porozumění.“ (Kučerová, 2003) Jde tedy o data, kvantitativní údaje, převedené za
3 Zmíněná interaktivita nevyjadřuje nutně interaktivitu na straně příjemce, nýbrž na straně tvůrce, tedy skutečnost, že tvůrce vizualizace při její tvorbě rozšiřuje a zužuje vstupní data, testuje různé formy a typy vizualizace a pod. 4 V orig.: “the use of computer-supported, interactive, visual representations of data to amplify cognition”.
14
pomoci počítače do vizuální podoby 'rozšiřující kognici', tj. pomáhající nám tato data rychleji a lépe vnímat a pochopit. Široké pole vizualizace dat můžeme rozdělit do třech podkategorií, které se liší především prostorovými vlastnostmi dat na vstupu. První oblastí vizualizace dat je vědecká vizualizace, neboli sciviz. Data, která zde do procesu vizualizace vstupují, mají přirozeně dáno prostorové rozložení (Mazza, 2009, str. 11). Nejlogičtější cestou je tak vizualizovat je na modelu prostoru, ve kterém byla měřena. Typickým příkladem může být medicínská vizualizace: například nejlogičtější a nejefektivnější cestou, jak zobrazit data o mozkové aktivitě, je vytvořit 3D model mozku a data následně graficky mapovat na něj. Podobný případ nastává např. u dat z měření intenzity proudů vzduchu na čelním skle automobilu, kdy je opět nejsmysluplnější cestou mapování těchto dat na počítačový 3D model čelního skla automobilu. Do procesu vizualizace dat však běžně vstupují i data, která v sobě nemají implicitně vnořeny žádné prostorové vlastnosti – jde například o data ekonomická či demografická. V takovém případě mluvíme o informační vizualizaci, zkráceně infoviz (Card, Mackinlay, Shneiderman, 1999). Zde je nutné hledat a vytvářet metafory, pomocí kterých data vizuálně zobrazíme. K ilustraci nám mohou posloužit data o souborech na počítačovém disku, která nemají žádné implicitní prostorové rozložení: při jejich vizualizaci musíme vytvořit vizuální metaforu a určit, že například každý soubor bude na 2D ploše reprezentován tvarem kruhu, jehož velikost bude dána velikostí souboru a vnitřní barva typem souboru. Jednotlivé kruhy/soubory poté můžeme shlukovat do větších kružnic dle toho, jak jsou na disku umístěny společně v adresářové struktuře. Výsledkem takového mapování je vizuální metafora, která nám pomohla neprostorová data převést a graficky vyjádřit ve 2D prostoru, a která ve výsledku "napomáhá naší percepci a porozumění" (Kučerová, 2003), tedy umožňuje nám například rychle určit, které adresáře zabírají na počítačovém disku nejvíce místa apod. V průběhu vývoje vizualizace dat se ustálilo množství takových metafor pro různé typy dat a různé účely. Řadíme mezi ně i základní typy statistických grafů a věnujeme se jim dále v kapitole 2.4. Rozdíl mezi vizualizací vědeckou a informační přehledně shrnují opět Card, Mackinlay a Shneiderman (1999, str. 7): „Vědecká vizualizace je vizualizace aplikovaná na vědecká data 15
a informační vizualizace je vizualizace aplikovaná na abstraktní data. Liší se proto, že vědecká data jsou obvykle fyzicky ukotvena, zatímco ekonomické informace a další abstraktní data většinou ukotvena nejsou“. Specifickou kategorii pak tvoří vizualizace, kde jsou data prostorově ukotvena, ale tímto prostorem je povrch Země. Taková data je možné vynášet nad mapu, což je však natolik specifickým procesem vizualizace, že Spence (2006) ustanovuje samostatnou kategorii geografické vizualizace, zkráceně geoviz. Tato práce je zaměřena na základní typy statistických grafů, které jsou ustálenými metaforami informační vizualizace. Nevěnuje se tedy ani vědeckým vizualizacím, kde se díky 3D prostoru z hlediska grafiky řeší především problémy spojené s vykreslováním, texturami, světlem a stínem (viz Ware, 2012), ani vizualizacím nad mapami.
2.2 Uvedení statistického grafu Pokud se zabýváme základními statistickými grafy 5, pohybujeme se v oblasti informační vizualizace (zkráceně infoviz), kategorii podřízené širší kategorii vizualizace dat a nad ní stojící kategorii informační grafiky (v anglické terminologii označované jako information graphic nebo problematicky charts). Informační grafika, jakožto souhrnná kategorie možných způsobů vizuálního
grafického
vyjádření
informací,
zahrnuje
právě
grafické
reprezentace
kvantitativních dat včetně grafů (v anglické terminologii jako graph nebo plot) a map, dále diagramy, tabulky a další informační grafiky, které nespadají pod žádnou z uvedených kategorií (dělení dle Harris, 1996). Protože grafy tvoří velmi významnou oblast informační grafiky, setkáváme se se zdroji, kde jsou označovány přímo jako charts, ale i s jiným rozvržením kategorií, a je tak nutné dbát na správné rozlišení terminologie užité v daném zdroji – viz např. Karsten (1923) užívá termínu graphs pro grafy a charts pro diagramy, nikoliv pro celou oblast informační grafiky.6
5 Jednotlivé typy grafů zařazeny pod tento termín jsou uvedeny dále v kapitole 2.4. 6 Zmatky v terminologii jsou nepříjemným průvodním jevem rapidně se rozvíjející oblasti. Přinášejí především nutnost znovu a znovu definovat na začátku publikací a výzkumů, co pod jednotlivými termíny daní výzkumníci myslí, aby nedošlo ke zmatení. Opomenutí skutečnosti, že je vizualizace dat terminologicky neustálenou oblastí, může někdy ústit až v nepříjemné selhání výzkumu (viz Wickham, 2013).
16
V první řadě je proto třeba rozlišit diagramy a grafy: zatímco diagramy jsou informační grafiky určené k vyjádření nekvantitativních vztahů a můžeme sem jako typické zástupce řadit například organizační diagram nebo myšlenkovou mapu, grafy jsou určeny k vizuální prezentaci kvantitativních dat a jejich vztahů. Další možné terminologické zmatení může vzniknout s ohledem na matematickou teorii grafů, kde se jako základní objekty běžně užívají diagramy vrcholů a hran označované jako grafy (viz např. Ruohonen, 2014). Matematická teorie grafů však není obsahem této práce a grafem se zde rozumí grafické zobrazení kvantitativních vztahů mezi dvěma nebo více skupinami informací (dle Harris, 1996). Dalším rozlišovacím prvkem mezi diagramy a grafy jsou kombinace jedné, dvou nebo tří rovných či kruhových os užívajících jedno či více kvantitativních měřítek, které nalézáme pouze u grafů (Harris, 1996, str. 164). Zjednodušeně můžeme tento rozpoznávací znak ilustrovat na příkladu organizačního diagramu a sloupcového grafu: zatímco organizační diagram užívá hierarchii grafických prvků v prostoru a vnímané vztahy se řídí polohou prvku, která určuje vztahy a není nijak kvantitativně dána (tj. podřízený prvek může být pod nadřazeným pět i deset centimetrů daleko, aniž by tento rozdíl vyjadřoval míru podřízenosti), u sloupcového grafu nalézáme dvě osy s jasně danými měřítky a poloha každého datového prvku (v tomto případě tedy sloupce) je zde kvantitativně dána a nese určitou informaci.
2.3 Komponenty grafu Abychom mohli dále v textu jednoznačně odkazovat na jednotlivé prvky grafu, musíme nyní podrobněji zmínit jeho skladbu. Jak poznamenává Kosslyn, všechny grafy, bez ohledu na to jak rozdílnými se zdají, se skládají ze stejných komponent. Jeho nejjednodušší dělení rozděluje graf na tři základní elementy: rámec, obsah a popisky 7 (Kosslyn, 1994). Rozšířené dělení pak Kosslyn (1989) uvádí ve své starší a odborněji zaměřené publikaci, kde jsou jako čtyři základní komponenty vyjmenovány pozadí, rámec, specifikátor (odpovídající výše zmíněnému obsahu) a popisky.8 7 V orig. framework, content a labels. 8 V orig. background, framework, specifier a labels.
17
Laicky přístupnější rozdělení komponent poskytuje Yau (2013, str. 93-115): součástmi grafu jsou a) vizuální vodítka, tedy prvky mapující samotná data, poté b) souřadnicový systém (tj. osy), do kterého jsou vodítka mapována: zde máme v souvislosti se základními typy statistických grafů na mysli především karteziánský souřadnicový systém a polární souřadnicový systém. Rozložení souřadnicového systému je pak určeno c) měřítkem. Celý graf následně funguje v určitém d) kontextu, jehož součástí jsou popisky, nadpisy a další pomocné komponenty, jež ho uvádějí a dovysvětlují.
Kosslyn (1989)
Kosslyn (1994)
Yau (2013)
Wallgren et al. (1996)
Harris (1996)
obsah
specifikátor
vizuální vodítka
linie sloupec ...
datová grafika linie markery
rámec
rámec
souř. systém osy měřítko
horizontální osa vertikální osa značky osy měřítko mřížka ...
horizontální osa vertikální osa značky os mřížka datový region ...
popisky
popisky pozadí
kontext
popisky legenda nadpisy popisky os zdroj pozadí ...
nadpis grafiky nadpis grafu podnadpis grafu název datové série legendy ...
datové prvky
nedatové prvky
Tab. 1 Prolínání terminologie komponent u vybraných autorů. S tučně zvýrazněnými termíny budeme dále v textu operovat nejčastěji.
Určení a popisu komponent grafu se věnují různí autoři, tabulka č. 1 proto ukazuje, jak se jednotlivé popisy některých zkoumaných autorů (Kosslyn 1989, 1994; Yau 2013; Wallgren et al., 1996; Harris, 1996) překrývají a jaké termíny k popisu komponent užívají. Pro další účely této práce rozdělme komponenty grafu na dvě hlavní kategorie: prvky datové a prvky nedatové. Nedatové prvky poskytují podporu prvkům datovým: jde tedy o veškeré rámce (osy, měřítka, značky na osách, apod.) a kontext (popisky, nadpisy, vysvětlivky, legendy apod.), viz tabulka.
18
Datové prvky jsou pak samotná vizuální vodítka, která graficky reprezentují kvantitativní informace, tedy např. u sloupcového grafu sloupec, u spojnicového grafu linie spojující datové body, atp.
Obr. 3 Běžné rozložení prvků v klasickém grafu s karteziánským souřadnicovým systémem.
2.3.1 Rámec grafu Obrázek č. 3 ukazuje běžné rozložení prvků klasického grafu. Součástí rámce grafu jsou zde především nedatové prvky osy a měřítka na nich vynesená, značky na osách, mřížky a případné pozadí celého grafu nebo jen pozadí datové plochy (zde ohraničené mřížkou). Osy (v ang. axis) jsou linie, jejichž poloha je určena zvoleným systémem souřadnic. V grafu především poskytují oporu, od které se vyměřují souřadnice datových prvků, orientují graf a komponenty na něm a slouží jako „nosič pro značky osy a měřítka“ (Harris, 1996, str. 23). V neposlední řadě formují rámec kolem datové plochy. V oblasti základních typů statistických 19
grafů (viz kap. 2.4), se setkáváme s karteziánským systémem souřadnic a polárním systémem souřadnic. Karteziánský systém souřadnic užívá dvou či tří vzájemně kolmých os, které se protínají v počátku souřadného systému. Využívají ho například sloupcový nebo spojnicový graf. V polární soustavě souřadnic se poloha bodu udává skrze úhel a vzdálenost od středu soustavy a s tímto druhem prostoru se setkáváme nejběžněji u výsečového grafu. Značky os (v ang. označovány jako tick marks, někdy jako stub, stub mark nebo scale point), jsou krátké linie obvykle kolmé k dané ose. Na ose vyznačují shodně velké úseky (Harris, 1996, str. 409). Značky na ose nejsou povinné a v mnoha případech, např. u sloupcového grafu na ose x, se běžně neuvádí. Měřítko (někdy také jako stupnice, ang. scale) zvolené tvůrcem grafu a vynesené na osách udává rozložení prvků a určuje prostor ustanovený osami. Mezi nejběžněji užívaná měřítka patří lineární (rovnoměrně rozložené hodnoty), logaritmické (zaměřené na procentuální změnu), kategorické (např. A, B, C), ordinální (kategorie, u kterých hraje roli jejich řazení; např. špatný, lepší, nejlepší), procentuální (vyjadřující části z celku) a časové (např. dny, měsíce); (Yau, 2013, str. 109). Mřížka (v ang. grid line nebo coordinate line) označuje linie užívané jako vizuální podpora v grafu. Slouží především jako nápomocný prvek poskytující záchytné body při čtení grafu, ačkoliv v minulosti hrála důležitou roli i při tvorbě grafu. 9 Zbytečná přítomnost a nadměrná vizuální síla mřížky byla kritizována Tuftem (1983) a stala se tak součástí konceptu chartjunk, kterému se budeme blíže věnovat v kapitole 4.
2.3.2 Kontext grafu Popisky a nadpisy dodávají grafu kontext a jsou v praxi často opomínány. Především jde o nadpisy a podnadpisy grafu, popisky os, určení zdroje dat a případné další poznámky, jejichž uvedení je nutné ke správnému a objektivnímu čtení grafu. 9 Při ruční tvorbě hrála mřížka roli i jako nástroj pro kódování informace do grafiky na straně tvůrce, jak uvádí např. Harris (1996, str. 180). V době digitálních nástrojů pro tvorbu grafu jsou však data do grafu vynášena automaticky a jejich polohu volí sám nástroj, proto dnes mřížka slouží především jako podpora na straně příjemce grafu.
20
Legenda (v ang. jako legend, případně key) popisuje a rozlišuje datové prvky a většinou bývá umístěna v samostatném prostoru vedle grafu. Její případná absence a umístění mají značný vliv na čitelnost a smysl grafu.
2.3.3 Datové prvky Marker pro účely práce označuje vynesený datový bod. Jeho vizuálního zobrazení se často užívá u spojnicového grafu, který je vynesením datových bodů pospojovaných linií. Datový prvek (v angl. data graphic, data measure, visual cues případně specificator) označuje body, linie/sloupce či plochy používané k reprezentaci samotných kvantitativních údajů v grafu (Harris, 1996). Jejich rozložení v grafu je dáno volbou typu grafu, volbou měřítka a způsobem jeho vynesení na osy. U datových prvků je nutné zmínit oblast grafické sémiotiky, která nám pomáhá osvětlit, jak datové prvky vlastně mapují kvantitativní data. Její základy položil Jacques Bertin v knize Semiology of graphics: diagrams, networks, maps (2010, v orig. 1967) pod dojmem své analýzy kartografických děl, kde se pokusil rozložit grafiku, tedy způsob mezilidské komunikace, na jednotlivé znaky a jejich vlastnosti. Rozpoznal, že data jsou v mapách vynášeny skrze znaky (v ang. marks), jež definoval výčtem: bod, linie, plocha, povrch a objem. Tyto znaky pak mapují data skrze tzv. grafické proměnné (v ang. visual variables nebo visual attributes), kterými jsou dle Bertina (2010): pozice, velikost, tvar, barva, orientace a textura. Bertinův koncept vizuálních proměnných se později rozšířil z kartografie a ujal se i v oblasti informační vizualizace, kde byly proměnné rozšířeny a pro účely infoviz redefinovány Mackinlayem (1986) na pozici, délku, úhel, spád, plochu, objem, hustotu, barevný odstín, barevnou sytost, texturu, spojitost a tvar. S příchodem interaktivních informačních vizualizací se další důležitou proměnnou stává pohyb (jak uvádí Carpendale, 2003). Například jednoduchý sloupcový graf tedy využívá datový prvek linie, na který jsou data vynesena pomocí proměnné velikost. Informační vizualizace většinou při mapování dat užívá více proměnných zároveň, jak poznamenává Mazza (2009): „Jelikož lidé vnímají vizuální atributy velmi dobře [...] můžeme velké množství různých dat reprezentovat jejich namapováním do 21
rozličných vizuálních atributů“.10 Takový případ můžeme ilustrovat spojnicovým grafem s dvěma datovými řadami, tj. s dvěma spojnicemi. Tyto linie v sobě data mapují nejen podle pozice datových bodů, ale vnímáme též spád spojnic a rozlišeny od sebe jsou obvykle také různým barevným odstínem nebo barevnou sytostí. Jednotlivé vizuální proměnné a schopnost lidské kognice je vnímat – a v důsledku tedy vhodnost jejich užití pro informační vizualizaci – byly podrobeny pečlivějším výzkumům (Cleveland, 1994) a vrátíme se k nim dále v kapitole 4, kde poskytnou argumentaci v debatě kognitivní efektivity výsečového grafu.
2.4 Typy grafů a jejich kategorizace Shrňme tedy postup konstrukce grafu s ohledem na jeho komponenty. Předně volíme rámec, tedy určíme typ souřadného systému, vynášíme osy a volíme měřítko, které na ose vyznačujeme. Do vzniklého datového prostoru pak vynášíme datové prvky, tedy mapujeme kvantitativní údaje jako vhodné grafické entity: znaky (body, linie, atp.) a jejich grafické proměnné (délka, tvar, odstín, atp.). Tento proces však dnes při tvorbě grafu běžně neprocházíme, respektive o něm takto podrobně nepřemýšlíme, protože při tvorbě grafu v tabulkovém procesoru či nástroji pro statistickou analýzu dat volíme z již předpřipravených ustálených forem běžně užívaných statistických grafů. Co chápeme za běžné statistické grafy jsou tedy v průběhu vývoje vizualizace dat ustálené metafory informační vizualizace. Ustálily se jako ověřené způsoby grafické reprezentace kvantitativních dat, sloužící různým typům dat a pro různé účely. Například sloupcový graf, vytvořený v 18. století Playfairem, se ukázal být vhodným pro zobrazování hodnot nespojitých kategorií (typ dat) a jejich rychlé vizuální porovnávání (účel) skrze sloupce umístěné v karteziánském souřadnicovém systému a jejich délku, a je proto nyní běžnou formou grafu dostupnou komukoliv v kancelářských aplikacích. Takovýchto metafor, tedy typů 10 V orig.: “Since humans perceive visual attributes very well [...] we can represent a great deal of different data by mapping them to different visual attributes.”
22
grafu, se ustálilo velké množství (objem možných způsobů informační vizualizace částečně zachycuje obsáhlá referenční příručka informační grafiky Harris, 1996), a proto se objevují pokusy toto množství kategorizovat. Nejrozšířenější forma kategorizace dělí grafy na základě jejich účelu, resp. dle souvislostí v datech, které nám graf umožňuje vidět, a kognitivních akcí, které nám umožňuje nad daty provádět (viz Abela, 2006; Camoes, 2013). Nutno poznamenat, že některé typy grafů jsou vhodné pro zobrazení více druhů dat s různými účely. Základními kategoriemi se v těchto klasifikacích stávají zobrazitelné souvislosti, mezi které řadíme: 11 •
porovnání, a to ať už mezi kategoriemi (sloupcový/pásový graf) nebo v průběhu času (spojnicový graf),
•
rozložení (histogram, scatter plot),
•
složení, a to jak statické v určitém časovém bodě (výsečový graf) tak v průběhu času (skládaný sloupcový graf),
•
vztahy, a to mezi dvěma (scatter plot) i více proměnnými (bublinový graf).
Protože v práci často operujeme s termínem základní typy statistických grafů, je nutné nyní ustanovit jeho obsah a tyto typy blíže popsat. Mezi základní statistické grafy řadíme především ty typy grafů, které ze základní analýzy diplomových prací studentů a absolventů oboru Informační studia a knihovnictví na FF MU (viz kap. 6) vyšly jako nejpoužívanější. Jedná se o sloupcové/pruhové grafy, výsečové grafy a spojnicové grafy. Tento výběr je podpořen i zdroji, které uvedené typy grafů taktéž uvádějí jako základní a nejběžnější (např. Bigwood, Spore, 2003; Wong, 2010; Camoes, 2013). Sloupcový graf (v ang. bar graph, problematicky též jako bar chart) zobrazuje kvantitativní údaje skrze datové prvky v podobě různě dlouhých sloupců umístěných v karteziánském souřadnicovém systému. Jednoduchý sloupcový graf je nejčastěji užíván ke zobrazení a porovnávání hodnot nespojitých kategorií v určitém časovém bodě (Harris, 1996), 11 Kategorie převzaty a upraveny z Abela (2006).
23
např. tedy populace pěti největších měst (nespojité kategorie) v červnu daného roku (bod v čase). Mezi nejběžněji užívané podtypy sloupcového grafu pak patří skupinový sloupcový graf a jednoduchý skládaný sloupcový graf či 100% skládaný sloupcový graf 12, užívané např. ke zobrazování změn ve složení celku v průběhu času pomocí skládání sloupců nad sebe. I u nejběžnějšího z grafů narážíme při porovnání anglických a českých zdrojů na terminologické nejasnosti. Anglicky psané zdroje velmi často striktně rozdělují bar graph a column graph a jsou vedeny jako samostatné typy grafů. 13 V českém prostředí se oba druhy, tedy jak horizontální, tak vertikální sloupce, často naopak označují termínem sloupcový graf, a to i přes to, že v tabulkovém procesoru Excel je dělení zachováno a formy přeloženy jako sloupcový graf (vertikální varianta) a pruhový graf (horizontální varianta). 14 Pro účely této práce budeme užívat pojem sloupcový graf a jeho prostorovou orientaci chápat pouze jako jednu z jeho vlastností (vertikální sloupcový graf, horizontální sloupcový graf). Spojnicový graf (také jako liniový graf, v ang. jako line graph nebo dle vlastností curve graph) zobrazuje kvantitativní informace pomocí linií (Harris, 1996, str. 207). Využívá karteziánského souřadnicového systému k vynesení datových bodů spojených linií za účelem hledání trendů v datech a porovnávání jednotlivých datových řad. Výsečový graf (v angl. pie chart15, v češtině také často jako koláčový graf nebo kruhový graf, občasně jako sektorový graf) využívá polárního souřadnicového systému ke zobrazení částí z celku pomocí výsečí/řezů, za účelem jejich rychlého vizuálního porovnání. Ačkoliv jde o populární formu grafu, jedná se o velmi kontroverzní graf, názorově rozdělující odbornou komunitu, a jeho použitelnost a čitelnost budou v dalších kapitolách podrobněji rozebrány.
12 Česká terminologie je převzata z tabulkového procesoru Excel ve verzi 2007. 13 Viz například Wong (2010) nebo Harris (1996). 14 Mimo uvedené terminologické zmatení se setkáváme ještě s dalšími obtížemi: zatímco některé anglické zdroje uvádí jak termín bar graph, tak bar chart pro označení shodné formy grafu, jiné zdroje (např. Harris, 1996) tyto dva termíny rozdělují a jako bar chart označují specifický druh grafu užívaného ve finančnictví. 15 I zde vidíme terminologické zmatení v plné síle. Ačkoliv je koláčový graf grafem, a nikoliv diagramem, v angličtině se označuje jako pie chart, nikoliv správně pie graph.
24
2.5 Smysl a použití grafu Důvod, proč se v průběhu vývoje vizualizace ustálilo a rozšířilo množství metafor vizuálního zobrazování dat a proč tyto metafory dosud užíváme, je zřejmý: zatímco v tabulkách čísel se nám orientuje jen velmi těžko, natož abychom z nich mohli vyvozovat závěry o trendech, poměrech či vztazích mezi údaji, grafické zobrazení dat skrze správně zvolenou metaforu nám data odhaluje přístupněji. „Grafika odhaluje data,“ jak poznamenává Tufte (1983, str. 13), když tvrdí, že grafické zobrazení dat může být dokonce přesnější a objevnější než běžné statistické výpočty. Grafické datové prvky a jejich vizuální atributy jsou totiž „...bezprostředně pojmuty a zpracovány percepční schopností zraku, a to ještě dříve, než přijdou na řadu komplexní procesy lidské mysli“
16
(Mazza, 2009). Mazza tuto skutečnost ilustruje zjednodušeným grafem, na
kterém je příjemce ponoukán najít nejmenší a největší hodnoty v datové řadě nejdříve v číslech a poté v grafu. Zatímco čísla musí lidská mysl vědomě zpracovat a uložit do krátkodobé paměti pro jejich porovnávání, velikosti grafických prvků jsou zpracovávány bezprostředně a jsou tedy pro daný úkol efektivnější. Podrobněji se zákonitostem kognitivního procesu čtení grafu věnujeme dále.
Obr. 4 Ilustrace efektivity vizualizace. Převzato a upraveno z Mazza (2009).
16 V orig.: "...immediately taken in and processed by the perceptual ability of vision, even before the complex cognitive processes of the human mind come into play."
25
Že je graf efektivním nástrojem pro exploraci i komunikaci dat, věděl již William Playfair, autor většiny základních forem informační vizualizace. Ve své významné publikaci The Commercial and Political Atlas z roku 1786, kde většinu nových17 forem/metafor uvádí a obsáhle komentuje, sám píše: „Oko jest nejlepším soudcem poměrů, schopno je určovat s větší rychlostí a přesností než jakýkoliv jiný z našich orgánů. [...] Tento způsob reprezentace [...] přináší jednoduchý, přesný a trvalý přehled tím, že dodává formu a tvar samostatně stojícím číslům, která jsou jinak abstraktní a nespojená.“18 (Playfair, 1786)19 Ve své publikaci vizualizuje ekonomická data a do informační vizualizace zavádí sloupcový, spojnicový i výsečový graf. Sílu grafů ukazuje i skutečnost, že ačkoliv byl Playfair nedůvěryhodnou osobou (jak zmiňují např. Spence a Wainer, 1997), a osobní pověst byla v 18. století pro přijetí vědecké práce důležitým aspektem, jeho grafy se nakonec uchytily. Grafy nám totiž slouží jako efektivní nástroje pro exploraci a prezentaci dat (Cairo, 2013). Předně je vytváříme a užíváme v procesu analýzy dat, kdy nám slouží k rychlému hledání trendů či výkyvů, a plní zde funkci nástroje explorace dat. Jakmile se rozhodneme výsledky analýzy publikovat v grafické formě, stává se graf nástrojem prezentace dat. Zatímco při exploraci je tvůrce grafu zároveň jeho příjemcem a nemusí dávat přílišný důraz na estetické hodnoty grafu, protože tzv. ví co v nich hledá, u prezentace se osoby tvůrce a příjemce liší, a je tak nutné brát v potaz estetiku a efektivitu grafu. Výhody grafu jako nástroje prezentace dat oceňujeme jak z pozice komunikátora, který usiluje o efektivní nezaujaté předání velkého množství informací, tak z pozice argumentátora, který ke grafu může přistupovat jako k nástroji určenému pro přesvědčování. Obě tyto pozice tvůrce si můžeme blíže ilustrovat příklady z historie vizualizace dat.
17 Novost je zde třeba brát s rezervou, historie vizualizace je spíše historií inspirací. Např. prvotní sloupcové grafy nalézáme již ve 14. století v díle francouzského učence Mikuláše Oresme (Drucker, 2014). 18 V orig.: "The eye is the best judge of proportion, being able to estimate it with more quickness and accuracy than any others of our organs. [...] This mode of representation [...] gives a simple, accurate, and permanent idea, by giving form and shape to number of separate ideas, which are otherwise abstract and unconnected.“ 19 Citováno z lépe dostupné faksimile.
26
Výbornou ilustrací přístupu komunikátora je známá informační grafika Charlese Minarda ztvárňující Napoleonovo tažení do Ruska a zpět, mapující bez emocí a osobního stanoviska autora velké množství dat, především data o pohybu armády, její velikosti v různých bodech tažení, úmrtích, a na zpáteční cestě též fatálně nízké teploty. Vojenský akt, který by historik musel popsat mnoha znaky textu, Minard komunikuje skrze grafiku mnohem efektivněji a úsporněji. Tufte jeho práci dokonce označuje za nejlepší statistickou informační grafiku kdy vytvořenou (Tufte, 1983, str. 40). Ilustrací přístupu argumentátora pak může být práce anglické zdravotní sestry Florence Nightingalové, která je zároveň i příběhem o nadřazenosti grafické prezentace dat nad tabulkami a texty. Nightingalová se po příjezdu do nevyhovujících podmínek vojenské nemocnice v Turecku za Krymské války rozhodla reformovat britské vojenské zdravotnictví. Po návratu do vlasti prvně sepsala obsáhlý elaborát na téma nevyhovujícího vojenského zdravotnictví.20 Tato forma komunikace však nedosáhla výrazných změn. Nightingalová tedy začala shromažďovat data a vytvořila soubor tabulek, skrze který se opět pokusila přesvědčit o nutnosti reforem. Vytvořila též slavnou grafiku, ve které namapovala data o úmrtí vojáků do tzv. coxcombu (polar area graph). Tato grafika pak již měla značný dopad a napomohla reformám britského vojenského zdravotnictví (více viz Wainer, 2000, str. 103-110). Role grafu v argumentaci a přesvědčování se stává oblastí zájmu a je v poslední době podrobována bližšímu zkoumání. Důkazem může být výzkum Pandeyho et al. (2014), kteří též věří, že se vizualizace jakožto nástroj argumentace stává nezbytným a je tak nutné lépe chápat jeho dopad a fungování v mezilidské komunikaci. Ve svém výzkumu se snažili odpovědět na otázku, která jako by kopírovala příběh Florence Nightingalové: má vizuální zobrazení dat větší přesvědčovací a argumentační efekt než tabulková a textová data? Skrze několik výzkumů na bázi crowdsourcingu pak docházejí k závěrům odvislým od výchozího přístupu participantů k danému tématu přesvědčování, obecně však můžeme konstatovat, že ano.
20 Více viz např. Magnello, 2010.
27
Rozšířením je pak nedávný výzkum Tala a Wansinka (2014) z oblasti zdravotnictví, který dochází k závěru, že i obyčejné a jednoduché grafy, pokud jsou použity v reklamě, zvyšují u příjemců důvěryhodnost produktu. Rozlišit přístup komunikátora a argumentátora je pro účely této práce nutné: graf jako nástroj argumentace může být často více či méně vědomě manipulován za účelem podpoření daného stanoviska. Tuto skutečnost pozorujeme už u Nightingalové. Tím, že zbytečná úmrtí namapovala výsečemi na okraje coxcombu zajistila, že se ve zvolené metafoře tyto zobrazí jako vizuálně výraznější než výseče blíže ke středu. Zdůraznila tím tak své stanovisko a užila graf jako argumentační nástroj. Zde však přistupujeme ke grafům v akademické publikaci jako k nástroji komunikátora, manipulaci grafů v diplomových pracích považujeme za problematickou a tato skutečnost se musí promítnout v aplikační části. K manipulaci a její diskuzi se vrátíme v kapitole 4.
2.6 Stručná historie a současnost grafů Jak již bylo řečeno, autorem výše definovaných základních typů statistických grafů je William Playfair, který je uvádí do oblasti informační vizualizace a aplikuje je na z hlediska prostorového rozložení abstraktní data z oblasti ekonomiky. Tyto grafy se tedy začínají objevovat v informační vizualizaci po roce 1786, ovšem jsou součástí statistických atlasů a nástroji statistiků a dalších odborníků pracujících s daty. Širší odborná a především neodborná veřejnost se s nimi setkává až v době tzv. vizualizačního temna po roce 1900, jak ve své periodizaci historie uvádí Friendly21 (2008). Ten ho definuje jako období, které je sice na milníky a novinky skoupé, ovšem na popularizaci nikoliv: formy grafů dosud výhradně určené pro odborníky se mimo jiné dostávají do novin a magazínů a začínají se masově rozšiřovat.
21 Jeho periodizace je založená na tzv. milnících, do kterých Friendly počítá nejen objevy nových forem vizualizace dat, ale též vynálezy a události, které vývoj vizualizace přímo ovlivnily: např. vynález pravítka a pod. Hustota těchto milníků v čase pak umožnila rozdělit vývoj na jednotlivá charakterizovatelná období.
28
Podívejme se, jak velkou popularizaci grafů v období po roce 1900 popisuje Karsten (1923, str. 37): „V období války a po ní je vývoj informační grafiky a její užívání značné. Ale tento vývoj není omezen jen na naši zemi a má velmi silný základ v reálné užitečnosti. Snad ani nelze pochybovat, že informační grafika představuje skutečnou úsporu času a duševní námahy."22 I on tedy souhlasí s názorem, že je graf efektivní formou zobrazení dat, když nám oproti tabulce umožňuje vyčíst data v „třetině, možná desetině času“. Masové rozšíření tvorby základních typů grafu však přichází až s nástupem osobního počítače (jak se shoduje i Few, 2004), tabulkových editorů a s nárůstem objemu dat, se kterými je třeba se vypořádat. Moderní digitální doba přinesla zahlcení daty a běžně dnes operujeme s termínem big data. Ačkoliv je jeho definice problematická a jednotná shoda o obsahu termínu nepanuje, většinou označuje velké množství dat, jejichž analýza a následné využití je možné skrze různé metody včetně nástrojů vizualizace. Dle nejnovějších odhadů vyprodukujeme v roce 2020 jako lidstvo 40 ZB dat, což v přepočtu dělá zhruba 5800 GB na osobu. IDC odhaduje, že zhruba 33 % těchto dat může mít reálnou hodnotu, pokud budou správně analyzována (Gantz a Reinsel, 2012), a právě vizualizace je zde jedním z nástrojů destilace smyslu z velkých objemů dat. Nejen objem však hraje svou roli v masovém rozšíření vizualizace, ale i dostupnost těchto dat. Ta se zvyšuje nejen pod tlakem různých hnutí za otevřená data, ale i změnami v praxi tvorby a sběru dat, kde v průběhu vývoje vizualizace běžné státy a jejich statistické úřady či vědce doplňují v moderní digitální době i korporace a v neposlední řadě jednotlivci (zde zmiňme především trend quantified-self). Dostupné a všudepřítomné velké množství dat spolu s demokratizovanými a laicizovanými nástroji pro jejich zpracování vyústilo ve stav, kdy nejen základní typy grafů může/musí tvořit kdokoliv a kdy se ze schopnosti graficky analyzovat a komunikovat data stává důležitá součást obecné informační gramotnosti. Pojem vizuální gramotnost užívá poprvé
22 V orig.: “In and since the War the use and development of charts has been almost phenomenal. But this development has not been confined to this coutry, and it has a very solid basis in practical utility. There is little question that the chart represents a genuine saving in time and in mental effort.”
29
v roce 1969 John Debes a jako vizuálně gramotného popisuje člověka, jenž je schopen vizuální komunikaci nejen dešifrovat, tedy číst, ale i šifrovat, mapovat data, tedy psát (Beránková, 2010). Vizuálně gramotný člověk tedy zrakem vidí obrazy a je schopen z nich destilovat smysl, a též opačně je schopen produkovat obrazy, kterým ostatní porozumí. Užší typ gramotnosti zaměřený na čtení map, grafů a diagramů (tedy informační grafiky) se v některých zdrojích též označuje jako graphicacy (viz např. Aldrich a Sheppard, 2000). Vzniká zde také prostor k definici ještě užší vizualizační gramotnosti, jež by označila schopnost zodpovědně vytvářet a kriticky přijímat informační vizualizace. V souvislosti s trendem big data však musíme postupovat opatrně. Než se vizuálně/vizualizačně gramotný člověk vydá k tvorbě složitých a komplexních informačních grafik založených na velkých datech, je nutné začít u small data informační grafiky. I proto se tato práce zaměřuje na základní typy grafů, které byly definovány výše v kapitole 2.4, a které představují základní formu vizuální komunikace kvantitativních dat. Jak ukazuje následující kapitola, ani s těmito formami totiž zatím neumíme z různých důvodů naše data efektivně vizuálně komunikovat.
30
3.
Problematika efektivního grafu „Miliony dolarů jsou ročně utráceny na sběr dat s očekáváním, že data automaticky napraví studované jevy. Ačkoliv jsou přesná data hodnotná, když přijde na výsledky, je způsob prezentace obvykle důležitějším než fakta samotná.“ Willard C. Brinton (1923, str. 1)
Oblast efektivity vizualizace dat především hledá odpověď na otázku jak poznáme, že je zvolená a vytvořená vizuální reprezentace dat vhodná a funkční? Tedy jednoduše: jak posoudit, zda je vytvořený graf dobrý? Odpověď zde není jednoznačná a jak uvidíme, odvisí především od definice efektivity, která se může přístup od přístupu lišit. Když se na tuto otázku bude snažit odpovědět vědecký pracovník, jehož intencí je rychlé, přesné a objektivní zobrazení dat, bude jeho odpověď zcela jistě jiná, než když bude efektivní vizualizaci posuzovat například novinář, cílíce v první řadě na zaujmutí pozornosti. Tato skutečnost je v mnohých diskuzích efektivních grafů ignorována a jsou tak často proti sobě stavěny názory na efektivní grafy, které v podstatě nelze vyvrátit ani na jedné straně. Stejný problém se týká i vizualizační kritiky, kdy jsou na grafy z novin mnohdy aplikovány koncepty vhodné spíše pro akademické vizualizace, a skrze které jsou vizualizace vytvářené např. grafickými designéry a ilustrátory často prohlašovány za neefektivní. V následujících dvou kapitolách se budeme věnovat teoretickému jádru problematiky této práce. V první kapitole se zaměříme na definici efektivního grafu, následně vysvětlíme, proč v práci předpokládáme, že jsou dovednosti v oblasti tvorby základních typů grafů nedostatečné, tedy že ani tyto grafy neumíme správně tvořit a prezentovat skrze ně kvantitativní data. Kapitola předkládá snahu definovat efektivní graf z pozice akademika, shrnuje problematiku práce a hledá důvody, které vedly k současnému problematickému stavu, 31
a to včetně exkurzu do vzdělávání k vizuální gramotnosti se zaměřením na základní grafy. Kapitola také shrnuje aktuální stav v oblasti grafové osvěty. V navazující kapitole pak představíme teoretické koncepty a nástroje, které vznikly ve snaze odpovědět na otázku po efektivním grafu. Tyto koncepty uvedeme v rámci jejich širší odborné diskuze a především pak v rámci dále navržené intencionalistické kritiky grafu, která nám pomůže některé z těchto diskuzí vnímat nezaujatě a především brát v potaz výše zmíněný problém různých pohledů na efektivitu.
3.1
Co je to efektivní graf? Jak již bylo naznačeno, přístup jednotlivých autorů k efektivnímu grafu se značně liší
a odvisí především od záměrů tvůrce. Svou roli hraje nejen přístup k prezentaci dat, tedy zda autor vizuálně prezentuje data z pozice komunikátora nebo argumentátora a jeho cíle, ale také jeho oborové pozadí: tedy zda je minimalista usilující o strohé objektivní předání informace (viz např. Tufte, 1983, 1997), nebo designér a ilustrátor usilující o zaujmutí příjemce a vyšší zapamatovatelnost grafu třeba v médiích (viz např. Holmes a Heller, 2006). Jak připouští Cairo (2013, str. 61), mezi těmi, kdo zastávají racionální a vědecký přístup k informační vizualizaci a těmi, kdo preferují spíše jakýsi „umělecký“ přístup zaměřený na emoce a estetiku existuje v oblasti vizualizace rozpor již od počátku. Tyto většinou protilehlé přístupy a z nich vyplývající diskuze ještě rozebereme, již zde je však nutné poznamenat, že zastáváme názor, že posuzovat kriticky efektivitu grafu je nutné právě s ohledem na cíle a záměry tvůrce. Pokud bychom si měli vypůjčit koncept z literární vědy, pak můžeme poznamenat, že je nutné praktikovat jakousi intencionalistickou kritiku grafů. Věříme, že např. na ilustrativní graf, jehož účelem je sloužit k humornému dokreslení článku v lifestylovém magazínu či zaujmout pozornost čtenáře, můžeme jen těžko smysluplně aplikovat níže diskutované Tufteho teoretické koncepty minimalistického grafu – což je zjednodušený překlad problému většiny debat v oblasti efektivní vizualizace.
32
K této problematice se dále vrátíme, nyní však jasně definujme, že cílem grafu v diplomové práci23 by vždy mělo být objektivní, rychlé, přesné, nemanipulující a esteticky střídmé předání kvantitativních dat, od čehož se bude dále odvíjet především aplikační část této práce a teoretické koncepty i praktická doporučení tam braná v potaz. Tuto naši definici efektivity podporují i definice jiných autorů, na které se nyní blíže zaměříme. Tufte (1983, str. 13) definuje tzv. excelenci ve statistické grafice hned v úvodu své knihy jako stav, kdy jsou komplexní myšlenky komunikovány s jasností, přesností a efektivitou. 24 Tyto tři vlastnosti jsou pak naplněny, pokud grafická zobrazení ukazují data, vedou příjemce k přemýšlení spíše o podstatě nežli o grafice samotné, nepřekrucují realitu v datech a prezentují mnoho čísel na malé ploše. Dále by měla být efektivní grafika dle Tufteho úzce integrována s verbálním popisem situace v datech (zde jde tedy především o zapojení grafiky do jejího kontextu) a v neposlední řadě by měla sloužit jasně udanému cíli, ať už se jedná o deskripci či exploraci na straně příjemce, nebo o prostou dekoraci textu – i Tufte zde, jak vidíme, naznačuje intencionalistickou kritiku, ačkoli dále ve své práci zastává striktní pravidla a přistupuje k informační grafice z pozice minimalisty a komunikátora. Bigwoodová a Sporeová (2003, str. 38) definují „dobrý graf“ jako ten, který komunikuje s jednoduchostí. Ty nejlepší grafy pak podle autorek ukazují trendy a vztahy a představují výhodu nad stejnými daty zobrazenými v tabulce či prezentovanými v textu. Grafy mohou být dle jejich názoru vylepšeny skrze akcentaci čtyř jejich vlastností: a) jasnost zprávy, b) jednoduchost designu, c) jasnost slov, d) integrita záměrů a akcí. Jasnost zprávy upozorňuje na nutnost znát při tvorbě grafu jeho sdělení a účel, jednoduchost designu pak připomíná, že znakem dobrého grafu je, že zpráva/informace je grafem podpořena, nikoliv v grafu umořena designem. Jasnost slov se věnuje kontextu grafu, důležitosti jasných a srozumitelných nadpisů, popisků a legend. Integrita pak představuje především závazek poctivého a pravdivého zobrazení dat, tedy nulovou manipulaci.
23 Definici však chápeme jako platnou pro jakoukoliv akademickou a vědeckou publikaci. 24 V orig.: “clarity, precision and efficiency”.
33
Robbinsová (2005, str. 11) definuje efektivní graf jednoduše jako ten, který umožňuje příjemci dekódovat kvantitativní data rychleji a jednodušeji než jiný graf. Jak vidíme, všechny zmíněné definice chápou efektivní graf z pohledu akademika, podporují naši definici efektivního grafu a můžeme je tedy aplikovat na grafy v diplomových pracích.
3.2 Problematika grafů z pozice akademika Pokud přemýšlíme o efektivním grafu z pozice akademika, můžeme též využít koncept kognitivní efektivity. Za dobrý a efektivní graf se zde považuje ten, u kterého došlo ke snížení množství úloh, jež musí příjemce při čtení vizualizace vykonat. Snižování kognitivních úloh má za následek snížení kognitivních nákladů (někdy též jako kognitivní zátěž, v orig. cognitive load, viz Cukier, 2011). Problémem je, že k takovémuto snižování kognitivní zátěže grafu v odborných publikacích často nedochází. Rozsáhlý výzkum odborných periodik, magazínů a novin Zackse et al. (1999) provedený na vzorku z let 1984 až 1994 dokázal, že nejen magazíny a noviny, kde může být záměrem tvůrce něco jiného než objektivně a esteticky střídmě předat data, a kde grafici a designeři často produkují grafy esteticky nestřídmé, ilustrativní a mnohdy i záměrně či nezáměrně manipulované25, ale (ač méně) i odborná periodika trpí neefektivními grafy. Jak jsme již ustanovili, v odborném periodiku a vlastně v jakékoliv akademické práci chápeme graf jako nástroj objektivní, rychlé a přesné komunikace dat, a proto je tato skutečnost problematická. Že se tato potíž týká i diplomových prací na oboru Informační studia a knihovnictví FF MU ukazuje též základní obsahová analýza grafů, jejíž výsledky jsou blíže představeny dále. Problém se s nástupem technologií jen multiplikuje. Nástup počítačové grafiky se dle výzkumu Zackse et al. projevuje ve sledovaném období na růstu počtu grafů v odborných periodikách, ten samý fakt má však často negativní dopad i na jejich efektivitu. Jak souhlasí i Wickham (2013), neexistuje žádný důkaz, že by se kvalita grafické reprezentace dat za poslední desetiletí vývoje technologií navýšila a technologie zde slouží spíše jako katalyzátor kvantity, 25 Jak již bylo řečeno, tento stav není v médiích nutně zavrženíhodný. Zde byly tyto vizualizace posuzovány právě z pozice akademické efektivity, jak jsme ji definovali výše, a nebyly brány v potaz odlišné cíle a záměry tvůrců.
34
nikoliv jako podpora kvality. Ačkoliv tedy jako akademici disponujeme moderními nástroji pro digitální tvorbu grafu, neumíme ani základní formy grafů užívat k objektivní, kognitivně efektivní grafické komunikaci dat. Že se v době, kdy vizuální komunikace a trendy související s nárůstem objemu a dostupnosti dat hrají důležitou roli v našem osobním i profesním životě, jedná o významný problém, souhlasí i Wongová (2010, str. 15): „Na rozdíl od jazykových dovedností se předmět informační grafiky na školách příliš nevyučuje a stejně tak nebývá součástí vzdělávání na pracovišti. Důsledkem je stav, kdy se odborníci v různých oblastech nejsou schopni graficky vyjadřovat“.26 K doplnění ještě můžeme parafrázovat informační designérku Schiverovou poznamenávající, že špatné dokumenty jsou tak běžné, že se rozšifrovávání špatného textu i špatného vizuálního designu stalo kritickou schopností pro život v informačním věku (via Few, 2004). Proč tomu tak je vysvětluje Stephen Few ve shodě s Wongovou skrze vzdělávání: jen velmi málo z nás je trénováno v navrhování efektivních tabulek a grafů. Neexistuje dle něj jak dostatek vhodných zdrojů, které by tyto schopnosti rozvíjely, tak ani dostatek motivace, jelikož mnozí z nás stále „neviděli takové množství příkladů dobrého designu, aby si začali uvědomovat neadekvátnost svých vlastních výtvorů“ (Few, 2004, str. 4). Proč vlastně neumíme ani v akademickém prostředí tvořit efektivní základní typy grafů je složitou otázkou. Identifikoval jsem dvě nejcitelnější oblasti: jak již naznačila Wongová i Few, a) graf ve vzdělávacím systému funguje pouze jako jakýsi doplněk a grafická komunikace obecně není příliš řešena, natož aby byly položeny základy a představeny koncepty efektivního grafu, b) výzkumy a teoretické koncepty efektivního grafu se nikdy nepromítly do nejběžnějších softwarových nástrojů užívaných k jejich tvorbě. Obě tyto implikace současného stavu považujeme za nutné podrobněji rozebrat.
26 V orig.: “Unlike, say, language arts, the subject of information graphics is rarely taught in schools, nor is it part of the on-the-job training. This leaves professionals in every industry scrambling to express themselves graphically”.
35
3.2.1. Efektivní graf ve vzdělávání Již v roce 1923 píše Brinton (1923, str. 3), že by se příprava a interpretace jednoduchých grafů měla učit na veřejných školách jako součást aritmetiky a navrhuje také jejich zapojení do školek, kdy by mohla být jejich tvorba pojímána jako hra. Pomohlo by to prý vymýtit tehdejší stav, kdy se byznysmeni vyhýbali grafům jako čemusi z vyšší matematiky, doslova „černé magii“ (Brinton, 1923). Graf si cestu do vzdělávání v posledních sto letech nalezl, vzdělávání k efektivní grafické komunikaci však nikoliv a trend vizuální/vizualizační gramotnosti začíná sílit až dnes. Shrňme si krátce současný stav grafu ve vzdělávání. „Čtení diagramu je naučená dovednost, neobjeví se jen tak sama od sebe. Dosud bylo čtení grafů a vizuální myšlení bráno jako náhodné výstupy studijních osnov. Tyto dovednosti jsou však natolik důležité, že nemohou být dány náhodě,“27 píší Dreyfus a Eisenberg (1990) a uvozují tak téma grafu ve vzdělávání. S ohledem na stále se rozšiřující potřebu analyzovat a komunikovat data vizuálně se základní statistické grafy, jejich čtení a vytváření, staly v průběhu času součástí kurikul a vzdělávacích rámců základních a středních škol. Vzdělávání k efektivním grafům však na těchto vzdělávacích úrovních naráží na mnohé problémy, které stojí v základu naší neschopnosti efektivně se graficky vyjadřovat (viz výše citovaná Wongová, 2010). Problematiku grafu ve vzdělávacím procesu zkoumáme již od sedmdesátých let. Potíže se čtením grafů a diagramů odhalily mnohé studie (jejich dobové shrnutí poskytují Dreyfus, Eisenberg, 1990) provedené ve školním prostředí na různých vzdělávacích stupních. Z jejich závěrů vyplývá, že studenti při řešení matematických problémů nedokázali užívat grafy a diagramy, protože jejich tvorbu vnímali jako oddělenou od samotného problému, tedy jako jakousi další problematickou nadstavbu k problému samotnému. Připomeňme, že výzkum v této oblasti probíhal nejsilněji v osmdesátých letech a tvorba grafů a diagramů tak zde odpovídá jejích ručnímu kreslení, které skutečně mohlo působit problematicky.
27 V orig. “Reading a diagram is a learned skill; it doesn’t just happen by itself. To this point in time, graph reading and thinking visually have been taken to be serendipitous outcomes of the curriculum. But these skills are too important to be left to chance.”
36
Nástup možností automatické tvorby grafů v digitálním prostředí tento problém sice omezil, odhalil však potíže mnohem zásadnější povahy: grafy sice mohou být tvořeny rychle, jejich napojení na reálné řešení životních problémů však chybí a výzkumy proto stále ukazují, že se studenti nejsou schopni dostatečně graficky vyjádřit. Podle Ainley et al. (2000) za fakt, že nejsou grafy napojovány na řešení reálných problémů, může částečně právě i skutečnost, že byly dříve vytvářeny jen ručně, což postupně vedlo k pohledu na graf jako na finální produkt procesu jeho tvorby a k odhlédnutí od interpretace grafu a k odklonu od role grafu jako nástroje k řešení problému. Z výzkumů vyplývá v první řadě nesoulad mezi kurikulem a možnostmi pedagogů, jejichž limity často nejsou v učebních plánech brány v potaz (tento názor zastávají např. Ainley a Monteiro, 2008), navíc se skrze subjektivní přístup pedagoga ke kurikulu předávané informace často liší (Monteiro a Pinto, 2005), což však není problém vzdělávání týkající se výhradně grafů, podobně jako se výhradně jen grafů netýká problém navázání probíraných témat na skutečné životní problémy. Například britská a brazilská vzdělávací kurikula se ve srovnávací studii Ainleyové a Monteira (2008) shodují v tom, že „k práci s daty by mělo být přistupováno jako k procesu řešení problému spojeného s kontextem běžného života žáka“ 28, aniž by však tyto rámce poskytovaly postupy, ze kterých mohou pedagogové vycházet. Ainleyová a Montero také kritizují logickou posloupnost, s jakou se jednotlivé typy grafů v kurikulech a rámcových programech objevují. Tato posloupnost je většinou odvozena od obtížnosti, s jakou se jednotlivé formy grafů vytvářejí při jejich ručním zpracování, nikoliv dle obtížnosti jejich faktického čtení a mentálního zpracování čtenářem. Tento nesoulad uvádějí na příkladu vzdělávacího kurikula Velké Británie. V něm zjišťujeme, že se žáci poprvé setkávají s tzv. block grafy (zjednodušené sloupcové grafy) ve věku mezi pátým až sedmým rokem, s klasickými sloupcovými grafy pak v osmi letech. Metoda piktogramů je představena zhruba ve stejnou dobu a to bez výrazného osvětlení smyslu jejího užití. S liniovými grafy by se pak žáci měli poprvé setkávat v deseti letech, koláčové grafy jsou představeny v jedenácti letech (Ainley
28 V orig.: “Data handling should be approached as a problem solving process and connected with pupils’ daily contexts.”
37
a Monteiro, 2008).29 Když nahlédneme do rámcových vzdělávacích plánů základního vzdělávání ČR 30, takto podrobné rozvržení nenajdeme, ačkoliv schopnost vizuálně pracovat s daty tu zahrnuta je: konkrétně v oblasti Závislosti, vztahy a práce s daty, jako očekávaný výstup M-5-2-02 „žák čte a sestavuje jednoduché tabulky a diagramy“ na prvním stupni a M-9-2-04 „žák vyjádří funkční vztah tabulkou, rovnicí, grafem“ na stupni druhém, kde se již jedná o porovnávání souborů dat a určování přímé či nepřímé úměrnosti. Jednotlivé typy grafů nejsou přesněji určeny a několik vodítek nacházíme až v doplňujících materiálech (viz Dvořáková et al., 2013), kde by na prvním stupni mělo jít o „sloupcový a kruhový diagram bez použití procent“. Na druhém stupni již „žák vyčte z grafu podstatné informace (např. nejmenší a největší hodnota, růst, pokles)“, přičemž v příkladu se pracuje se spojnicovými grafy. RVP pro gymnázia pak udávají schopnosti žáka následovně: „reprezentuje graficky soubory dat, čte a interpretuje tabulky, diagramy a grafy, rozlišuje rozdíly v zobrazení obdobných souborů vzhledem k jejich odlišným charakteristikám“. Tyto definice jsou velmi mělké, především však nevyžadují napojení tvorby grafů na reálné problémy z životního kontextu žáků a nemohou tak zaručit, že absolventi základních a středních škol se budou schopni při práci s daty efektivně graficky vyjadřovat. Předpokládaným výstupem je zde jen kolekce dat a produkce grafů stylem, který můžeme nazvat „pasivní tvorbou grafů“ (jak jej definuje Pratt, 1995). Při pasivní tvorbě grafů je na graf pohlíženo spíše jako na artefakt, než jako na nástroj k možnému řešení problému. Aktivní tvůrce grafu naopak přistupuje ke grafu jako k nástroji, který mu pomáhá řešit problém, efektivně komunikovat, a nenazírá na graf jen jako na ilustraci. Cílem vzdělávání pro efektivní grafy by kromě pravidel jejich tvorby měla být v dlouhodobém pohledu i snaha o příklon k aktivnímu přístupu ke tvorbě grafu.
29 V nejnovější verzi se již objevují např. i korelační grafy (scatter plot). 30 Rámcové vzdělávací programy jsou dostupné z webu Ministerstva školství, mládeže a tělovýchovy na adrese http://www.msmt.cz/.
38
Graf je silný nástroj k prezentaci dat a neměl by být vnímán jako cíl procesu nebo jako nutný doplněk textu, kde se hovoří o číslech. Současná situace vzdělávání v informační grafice k tomuto stavu bohužel směřuje. Cílem aplikační části tedy musí být také ukázat graf jako výhodu, nikoliv jako nutnost, a změnit způsob, jakým o něm studenti přemýšlejí.
3.2.2 Efektivní graf v SW nástrojích Druhým zásadním problémem jsou softwarové nástroje, které teoretické koncepty tvorby efektivních grafů nectí a jako výchozí podobu grafů nabízejí z našeho pohledu více či méně neefektivní grafy. Zacks et al. (1999) v závěru svého výzkumu vyjadřují naději, že se principy efektivních grafů promítnou do softwarových nástrojů a povedou tvůrce ke vhodným rozhodnutím. Ačkoliv sice uvádějí první příklady takových integrací u některých tehdy užívaných profesionálních nástrojů pro analýzu dat, i dnes musíme SW nástroje stále identifikovat jako jednu z hlavních implikací současného problematického stavu. Důvodem této identifikace je skutečnost, že nástrojem první volby bývá obvykle tabulkový procesor Microsoft Excel, což vyplývá i ze základní analýzy diplomových prací studentů ISK FF MU. Užití tohoto nástroje souvisí většinou s velikostí dat z výzkumů diplomantů, kdy se nejeví jako nutné pracovat s pokročilejšími nástroji na analýzu dat, a kdy je studenty graf většinou chápán jako jakýsi doplněk textu, nikoliv jako silný nástroj pro komunikaci dat, díky čemuž se nejeví nutné k jeho tvorbě užívat pokročilejších cest (např. statistický jazyk R a jeho grafické moduly nebo nástroj Statistica a podobné). Microsoft Excel jako tabulkový procesor je ovšem původně nástrojem pro byznys, a jeho grafický modul slouží manažerskému pohledu na graf, kde jde především o to ukázat čísla zábavně a někdy též s grafy mírně manipulovat. Nelze říci, že by tvůrci Excelu pravidla tvorby efektivního grafu ignorovali (jak lze dohledat, na svém blogu občasně operují s termíny z teoretických konceptů jako např. data-ink ratio, viz Wakefield, 2007), s ohledem na zacílení nástroje je však zatím výrazněji neimplementují.
39
Použití grafického modulu Microsoft Excel v akademickém prostředí 31 tak bez znalosti konceptů a základních pravidel efektivního grafu spolu s nepřemýšlením o grafu jako o silném nástroji komunikace dat končí diplomovými pracemi přeplněnými neefektivními a často i zbytečnými grafy, využívajícími výchozí podobu navrženou daným nástrojem, jenž má k efektivitě v našem chápání mnohdy velmi daleko.
3.3 Osvěta k efektivnímu grafu Napravit problematický stav a vzdělávat k efektivní informační vizualizaci, a to včetně základních typů statistických grafů, se snaží několik odborníků a projektů. Jejich přístupy jsou samozřejmě taktéž značně ovlivněny odborným zázemím a nazíráním na grafy. S prvními snahami předložit praktická doporučení pro efektivní grafy se překvapivě setkáváme už na počátku 20. století, dávno před prvními teoretickými koncepty, debatami a výzkumy. První přímé rady pro efektivní komunikaci dat vydává v roce 1901 Mezinárodní institut pro statistiku, jenž v pěti stručných bodech shrnuje principy dobrého grafu tak, jak byly viděny z tehdejšího pohledu (dle Wickham, 2013): jmenujme například doporučení udržovat symbolismus na minimu, vyvarovat se porovnávání velikostí dvou oblastí, nepodrážet osu y nebo brát v potaz kulturní kontext barev apod. Některá z doporučení byla experimentálně podložena až o desítky let později (např. právě kognitivní obtíže s porovnáváním plochy dvou oblastí). Od osmdesátých let minulého století se začínají objevovat moderní praktické osvětové příručky a učebnice efektivních grafů. Mezi ty, které ke grafu přistupují z pozice komunikátora, řadíme především The Wall Street Journal Guide to Information Graphics od Wongové (2010), Show Me the Numbers (2004) a další především na byznys zaměřené knihy Stephena Fewa, Presenting Numbers, Tables and Charts autorek Bigwoodové a Sporeové (2003), Creating More Effective Graphs Naomi Robbinsové (2005) či knihy Stephen M. Kosslyna Elements of Graph Design (1994) a Graph design for the eye and mind (2006).
31 Negativní názor na Excel ve vědě a výzkumu a bližší shrnutí této problematiky podává např. Orzel (2009).
40
Podrobným porovnáním zmíněných příruček ale i dalších osvětových zdrojů však zjistíme, že některá prezentovaná doporučení jdou proti sobě a že typy grafů, které jedni doporučují, jiní zavrhují, a praktické rady jsou mnohdy protichůdné. I výše zmíněné rady Mezinárodního institutu pro statistiku byly dle Funkhousera hned v počátku rozcupovány (jak cituje Wickham, 2013). Většina zmíněných a nejvyužívanějších příruček totiž není postavena primárně na výzkumech a znalostech, ale na osobních estetických preferencích jejich autorů. V aplikační části proto tyto příručky podrobujeme kritické syntéze a za přítomnosti teoretických konceptů a základních znalostí o vizuálním vnímání a kognitivní psychologii i nadhledu nad teoretickými debatami je přetavujeme do objektivnějšího materiálu, který by měl být také příspěvkem k osvětě, vytvořeným na míru studentům oboru ISK FF MU. Internet přinesl specializované blogy věnující se kritice špatných informačních grafik a návrhům lepších designů. Zde zmiňme především nejaktivnější Fungův blog Junk Charts (http://junkcharts.typepad.com/). Mimo specializované blogy pak vznikají první komunitní weby zaměřené na efektivní vizualizace. Prvním z nich je projekt Jona Schwabishe HelpMeViz (http://helpmeviz.com/), kde může kdokoliv prezentovat svou informační grafiku a vyžádat si zpětnou vazbu od odborníků, kteří zvolenou formu s ohledem na data a především pak s ohledem na záměr tvůrce schválí nebo zkritizují a navrhnou jiná efektivnější řešení. Jedná se tedy o formu jakéhosi vizualizačního crowdsourcingu.
41
4.
Koncepty a diskuze efektivního grafu Mezi důležité nástroje zkoumaní efektivní vizualizace patří koncepty, skrze které
můžeme nahlížet na vizualizaci při její evaluaci. Koncepty nám pomáhají určit, zda je ten či onen graf funkční, efektivní a nemanipulující. V některých případech jsou schopny tyto vlastnosti i kvantifikovat. Tyto rámce nám mohou odhalit, zda je vizualizace dat lživá a nakolik či jak je graficky efektivní nebo zda komplexně zpracovává všechny potřebné vstupy (data, výchozí otázky, výsledky analýzy) i výstupy (samotná vizuální grafická reprezentace), především pak ale zaměřují naši pozornost na otázky a oblasti, které je jak při evaluaci, tak při tvorbě efektivní vizualizace důležité brát v potaz. Většina konceptů určených ke kritickému nahlížení na datovou grafiku vzniká po roce 1980 v knihách Edwarda Tufteho (viz Tufte, 1983 a 1997), který se věnuje vizualizaci dat především z hlediska její estetiky. Novější teoretické koncepty a nástroje pak nacházíme až v současnosti, kdy se vizualizace masově rozšířila a cítíme potřebu širších a komplexnějších nástrojů, skrze které k ní můžeme kriticky přistupovat. V minulé kapitole zmíněné neshody v oblasti praktických doporučení mají svůj původ především zde v oblasti teoretických konceptů, které jsou objektem odborných diskuzí a výzkumů. Tyto diskuze velmi často souvisí s nekomplexním přístupem 32 k vizualizaci, kdy jsou např. Tufteho zásady kritizovány z pozice designéra, mnohdy ale otevírají zajímavé otázky, např. po vhodné míře minimalismu v informačním designu, manipulace ve vizualizaci apod. V následující kapitole si nejvýznamnější koncepty efektivní vizualizace představíme a uvedeme je v kontextu jejich diskuzí.
32 Tedy neaplikací naší intencionalistické kritiky.
42
4.1
Koncept data-ink poměr Prvním z Tufteho konceptů představených v publikaci The Visual Display of Quantitative
Information (1983) je data-ink ratio. Data-ink poměr představuje nástroj posuzující efektivitu grafu z hlediska jeho minimalistických estetických kvalit, a to skrze výpočty objemu, resp. plochy inkoustu užitého při vytištění vizualizace. Koncept je vyjádřen vzorcem
data – ink poměr=
data−ink celkový objeminkoustu
kde data-ink vyjadřuje plochu inkoustu použitého k vytištění datových prvků grafu v poměru k celkovému objemu inkoustu použitého na vytištění informační vizualizace jako celku, tedy včetně všech nedatových prvků. Výsledný data-ink poměr je pak dle Tufteho tím lepší, čím jest vyšší, neboť číslo blízké jedné vyjadřuje stav, kdy jsou datové prvky podpořeny a nedatové prvky v grafu utlumeny a omezeny, tj. nespotřebovaly tolik inkoustu jako důležité prvky datové. Navýšení data-ink poměru můžeme dle Tufteho (1983, str. 96) při tvorbě grafu dosáhnout mazáním, a to buď: a) mazáním nedatového inkoustu, nebo b) mazáním nadbytečného datového inkoustu. Koncept datového a nedatového inkoustu a jejich poměru shrnuje Tufte (1983, str. 105) do pěti zásad své teorie datové grafiky : •
Nad vším zobrazit především data.
•
Maximalizovat data-ink poměr.
•
Vymazat nedatový inkoust.
•
Vymazat redundantní datový datový inkoust.
•
Revidovat a upravovat.
43
Tufteho koncept data-ink a z něho vyvozené zásady však mohou vést až k velmi drastickému minimalismu: pokud bychom navýšili data-ink co nejvíce, tak aby data-ink poměr dosáhl jedné (tedy že inkoust užitý k vytištění/zobrazení datových prvků je zároveň veškerý inkoust užitý k produkci vizualizace) získáme samotné datové prvky bez jakéhokoliv kontextu.
Obr. 5 Tradiční datový prvek box plotu (vlevo) a Tufteho minimalistické verze. Převzato a upraveno z Tufte (1983)
Můžeme však zasahovat i do samotných datových prvků: porovnejme nyní tři datové prvky užité v box plotech na obrázku výše. Levý příklad je běžný datový prvek z box plotu tak, jak jej navrhl Turkey. Ostatní příklady jsou formy, které navrhuje Tufte, a kde došlo k absolutnímu navýšení data-ink poměru mazáním nadbytečného datového inkoustu. Pokud bychom k označení problému, který zde nastává, použili termín z oblasti designu definovaný Gibsonem (1986), museli bychom konstatovat, že nám zde chybí alespoň základní afordance, které by nám sdělovaly, jak s danou grafikou zacházet, a v případě že zcela omezíme nedatové prvky, že se vůbec jedná o graf. Nerozumné zvyšování data-ink poměru tak může být problematické. Tufte (1983) tuto skutečnost nezatajuje a sám dodává, že veškeré navyšování data-ink poměru by se mělo dít v „mezích rozumu“. Míru rozumného minimalismu však máme každý postavenou jinak a tato vágní definice je základem debat o vhodné míře minimalismu v grafické prezentaci dat.
44
Obr. 6 Totožné grafy zobrazené s různou mírou minimalismu, tedy s různým data-ink poměrem. Převzato a upraveno z Tufte (1983).
Porovnejme např. klasičtější podobu grafu s jeho minimalistickou verzí, kterou prezentuje Tufte (1983) na obrázku výše. Značné zjednodušení zde zasáhlo nejen nedatové (kontext, osy, značky, atp.), ale i samotné datové prvky, kdy se ze sloupců sloupcového grafu staly prosté linie (jimiž ovšem z hlediska Bertinovy grafické sémiotiky jsou). Podobné výrazně minimalistické estetické výstupy prosazuje např. i Cleveland (1994, kap. 2), který v díle The Elements of Graphing Data na základě svého výzkumu prezentuje sestavu doporučení k tvorbě efektivních grafů. Zda je až takovéto zjednodušení správně, jaká míra minimalismu je v pořádku a jakou roli hraje v celé problematice zvyk na straně příjemce, je otázkou diskuzí.
4.2 Diskuze a výzkumy data-ink poměru Inbar, Tractinsky a Meyer (2007) provedli výzkum zaměřený na vnímání extrémního minimalismu v grafech. Osmasedmdesáti univerzitním studentům, kteří se dosud nesetkali s koncepty minimalistického efektivního grafu, předložili výzkumníci dotazník se čtyřmi grafy, 45
u nichž se lišila míra data-ink poměru: od nejběžnějšího zobrazení sloupcového grafu, kde jsou grafické prvky linie ve formě sloupců, až po Tufteho minimalistický sloupcový graf, kde zůstávají úzkými liniemi. Účastníci pak evaluovali grafy dle šesti různých aspektů, např. z hlediska krásy, jednoduchosti a srozumitelnosti. Výsledky experimentu ukázaly převažující preferenci běžnějších, neminimalistických forem grafu nad Tufteho silně minimalistickými verzemi.
Obr. 7 Čtyři verze sloupcového grafu z výzkumu Inbara, Tractinského a Meyera (2007). Dvě prostřední verze byly upraveny spíše méně, aby nebyla s ohledem na zvyk narušena familiarita příjemců.
Z předkládaných verzí grafu si většina participantů vybírala mezi prvními třemi verzemi. Třetí variantu (na obr. výše vlevo dole), která data-ink poměr oproti první verzi grafu značně navyšuje, si vybralo 43 % participantů, což dle výzkumníků ukazuje, že participanti nebyli vůči minimalismu zcela uzavřeni. Silně minimalistická verze (vpravo dole) však již neuspěla.
46
Jak uznávají i sami výzkumníci, může být důvodem především fakt, že byli participanti zvyklí na tradiční vzhled sloupcového grafu, což vedlo k preferencím při rozhodování bez docenění případných reálných kognitivních výhod extrémního minimalismu. 33 Zvyk hraje v oblasti estetiky značnou roli. V industriálním designu se užívá zkratka MAYA (viz např. Hekkert, Snelders a van Wieringen, 2003), rozepsaně Most Advanced Yet Acceptable, vyjadřující přesvědčení Raymonda Loewyho, že příjemce designu není nutně připraven na logickou odpověď na své potřeby, pokud je tato odpověď příliš vzdálena od toho, k čemu dosud přistupoval jako k normě. Zjednodušeně řečeno a pokud zůstaneme v oblasti průmyslového designu, pokud by vysavač nebyl efektivní odpovědí na potřebu jeho uživatele vysávat, a pokud by designér přišel se zcela novým, od základu přebudovaným řešením, veřejnost ho nemusí, i přes jeho případnou genialitu, přijmout, pokud bude příliš vzdálený tomu, co si pod slovem vysavač představujeme jako normu. Nemusíme se však omezovat jen na průmyslový design a můžeme tento koncept aplikovat i do oblasti informačního designu: v případě výzkumu Inbara, Tractinského a Meyera se lze domnívat, že dvě prostřední verze grafu stále sdílí s původním grafem dostatek společných znaků tak, aby byly vnímány jako přípustně esteticky nové. Extrémně minimalistická verze už však nesdílí s naší estetickou normou grafu dostatek společných znaků, a proto není přijímána pozitivně, a to bez ohledu na to, zda jeho minimalistická estetika představuje či nepředstavuje reálnou kognitivní výhodu. Naše současná norma estetiky grafu je tvarována především estetikou prosazovanou kancelářskými aplikacemi, které k analýze a vizualizaci dat běžně používáme. Proč je tato skutečnost problematická jsme již zmínili výše v kapitole 3.2.2. Úspěšný informační design by tak měl hledat rovnováhu mezi „novostí a typičností“ (Inbar, Tractinsky a Meyer, 2007, str. 188), tedy v případě naší debaty: měl by se snažit
33 Zda je, nebo není výrazný minimalismus reálnou kognitivní výhodou oproti mírnějšímu minimalismu a jak může ovlivňovat příjem informací a jeho rychlost či přesnost, je též otázkou výzkumů, ač především zatím spíše v oblasti dynamických vizualizací. Zmiňme výzkum Blasia a Biszantové (2002), kteří zkoumali efekt zvyšování data-ink poměru na procesy vykonávané při monitoringu dynamických zobrazení dat. Ačkoliv celkový vhled do situace mírou data-ink ovlivněn nebyl, rychlost zaznamenání a reakce na výkyvy při monitoringu se zvyšovala s navyšováním data-ink poměru dynamických zobrazení dat.
47
o minimalismus, ale se zachováním typických prvků neminimalistické estetiky běžně rozšířeného grafu. Na otázku po rozumné míře minimalismu v estetice grafu tedy neexistuje jednoznačná odpověď a jde vždy o designovou volbu tvůrce, který musí brát v potaz mnoho dimenzí informačního designu. V rámci aplikační části této práce musíme tedy k Tufteho data-ink ratio zaujmout kritický postoj a zastávat pozici rozumného minimalismu, což se projeví v nasměrování designových rozhodnutí příjemce studijního materiálu do Most Advanced Yet Acceptable pozice.
Obr. 8 Sloupcový graf s různou mírou data-ink poměru a různou mírou minimalismu. Upraveno a doplněno z Gemigniani, 2009.
Tento středový bod zastávají i někteří autoři praktických příruček. Např. Few, jinak spíše Tufteho zastánce, v reakci na jeho minimalistický sloupcový graf prezentuje na svém blogu názor, že data-ink obvykle potřebuje jistou míru redundantnosti, aby mohl být graf jednoduše čten a užíván, a proto nevnímá Tufteho výrazný minimalismus jako nejvhodnější řešení. „Snížením velikosti a vizuální váhy datových prvků, jako například právě sloupců, nutíme naše oči k vyšším výkonům, což nás zpomaluje. Na základě mnoha malých, minimalistických příkladů v jeho knize podezřívám Tufteho, že má enormně dobrý zrak [...] Většina z nás profituje z textů a obrázků trochu větších, než jak je například kdysi dávno ustanovil telekomunikační průmysl v telefonních seznamech,“ 34 poznamenává s humorem Few (2009).
34 V orig.: "By reducing the size and visual weight of data-encoding objects, such as these bars, we force our eyes to work too hard, which slows us down. Based on several small, minimalist examples in his books, I suspect that Tufte has incredibly good eyesight. [...] Most of us benefit from making text and images a little larger than the minimum that the telecommunications industry decided long ago was acceptable for phone books."
48
4.3 Koncept chartjunk Dalším základním konceptem v oblasti efektivního grafu, který s výše zmíněným data-ink velmi úzce souvisí, je chartjunk. Termín zavádí do vizualizace dat v roce 1983 Edward R. Tufte opět v knize The Visual Display of Quantitative Information: „Vnitřní dekorace grafiky generují mnoho inkoustu35 který příjemci nesděluje nic nového. Účel dekorace se různí – má grafice dodat vědečtější vzhled, oživit ji nebo poskytnout designérovi příležitost k procvičování jeho uměleckých dovedností. Bez ohledu na účel se vždy jedná o nedatový inkoust nebo nadbytečný data-ink, a tedy jde často o chartjunk.“ 36 (Tufte, 1983, str. 107) Tufte se zaměřuje na tři základní formy chartjunku, které byly v době vydání knihy nejvíce znatelné v tisku a odborných publikacích. V první řadě uvádí různé formy černobílého šrafování datových prvků (Tufte, 1983, str. 108-112), způsobující optické efekty typu mihotání apod. S ohledem na postupy vytváření grafů v době publikace knihy 37 se jednalo o rozšířený způsob odlišování datových prvků, které byly šrafovány jak ručně, tak pomocí tzv. transfer sheets, předpřipravených vzorů šrafur obtiskávaných ze speciálních fólií. Ačkoliv Tufte uvádí, že počítače přináší stejný problém, dnes je špatně zvolená šrafura jen jednou z možných estetických obtíží a barevné displeje a tisk přenesly na místo potíží se šrafurou potíže s nevhodně volenými barvami.
35 Zde Tufte navazuje na svůj výše zmíněný koncept data-ink. 36 V orig. "The interior decoration of graphics generates a lot of ink which does not tell the viewer anything new. The purpose of the decoration varies - to make the graphic appear more scientific, to enliven the display, to give the designer an opportunity to exercise artistic skill. Regardless of the cause, it is all non-data-ink or redundant data-ink, and it is often chartjunk." 37 Dokladem ručního způsobu tvorby grafů, převládajícího od počátku vzniku vizualizace dat až do počátku devadesátých let, mohou být příručky statistických grafiků. Jmenujme např. Schmidta (1954), kde jsou první kapitoly věnovány rozložení pracovního prostoru, ostrosti tužek, práci s pravítkem apod., nebo příručku Robertsona, kde se o třicet let později taktéž dozvídáme, jaký užívat papír či jak pracovat s pravítkem a tvorba pomocí počítačů je zde zmíněna jen jako finančně nákladná a tedy prozatím okrajová cesta tvorby datové grafiky (viz Robertson, 1988, str. 30).
49
Tufte podrobuje kritice také příliš viditelné mřížky: tvrdí, že mřížka by měla tvořit podporu pro datové prvky, ale neměla by je zahlcovat až do té míry, aby se v ní ztrácely. Své stanovisko prezentuje na známých Mareyho časových osách odjezdů a příjezdů vlaků (Tufte, 1983, 115-116). V neposlední řadě prezentuje Tufte, ovlivněn uměním a architekturou, metaforu kachny převzatou z knihy Venturiho, Brownové a Izenoura. Ti se zabývali architekturou Las Vegas a ve své publikaci popsali obchodní řetězec Big Duck, jehož obchody jsou vyvedeny ve tvaru rozměrných kachen. Chápou je jako postup od architektury, kde se využívá ornamentu, k architektuře, která se stává sama o sobě ornamentem. Podobně i Tufte kritizuje nedatové prvky v grafu, které z grafu tvoří spíše ilustraci a zahlcují důležité datové prvky. Jmenovitě zde zmiňuje např. falešnou perspektivu (Tufte, 1983, str. 118). Po roce 1983, kdy Tufte termín poprvé používá, se objevuje ještě několik snah chartjunk popsat a především pevněji stanovit, co všechno jím je a co jím není. Například Wainer (1997) pod chartjunk kromě Tuftem přímo zmíněných prvků řadí jmenovitě ještě pseudo-3D efekty, špatně čitelné fonty a umělé zářivé barvy. Zřejmě nejotevřenější jmenovitý popis pak předkládá Harris (1996, str. 72): nepotřebné mřížky, příliš výrazné značky na osách, nadbytečná data a dále široká kategorie blíže nespecifikovaných prvků přidaných do grafu pro „kosmetické účely“. Jak vidíme, obsah termínu je často chápán velmi subjektivně a není přesně stanoveno, co je a co není chartjunk. Řídit se tedy můžeme jen obecnějšími definicemi, např. právě definicí Harrise (1996) nebo Kosary (2013), dle kterých jsou chartjunkem všechny prvky v grafu, které nejsou podstatné v procesu porozumění grafu nebo mohou od hlavního účelu grafu odpoutávat pozornost.
4.4 Diskuze a výzkumy chartjunku O smyslu a roli chartjunku a o vhodné míře jeho výskytu v grafech se vede debata, která se často překrývá s debatou o data-ink poměru a jeho navyšování. Vzpomeňme nejdříve extrémy: na jedné straně pomyslné škály stojí zastánci estetického minimalismu, zastoupení především Tuftem (viz 1983, 1997), Clevelandem (viz 1994) a Fewem (např. 2004), kteří chartjunk spíše odmítají a nad vším prosazují čitelnou jednoduchost. Na druhé straně debaty 50
pak stojí tvůrci, kteří věří, že chartjunk nemusí nutně snižovat přesnost grafu a může mít v grafu jisté pozitivní funkce, proto ho hojně a cíleně využívají. Nejikoničtějším zástupcem druhé strany debaty je designér Nigel Holmes, autor mnoha vizualizací pro magazín Time a další významná periodika, který již od sedmdesátých let často využívá sugestivní ilustrace, nezřídka zasahující do samotných datových prvků, které jsou pro zvýraznění sdělení mnohdy deformovány. Holmes zastává názor, že datová grafika musí především vzbudit zájem příjemce, čehož může být dosaženo právě skrze užití ilustrací (jak sám uvádí v Holmes, 1984). V jednom z rozhovorů Holmes svou pozici dokonce sám staví do opozice proti Tuftemu, když prohlašuje, že Tuftemu zřejmě uniká pointa jeho výtvorů: „Grafy v magazínu TIME byly zaměřeny na neodborné čtenáře, ne neinteligentní, jen zaneprázdněné. Věděl jsem, že se dostanou k pointě rychleji, když budou ke grafice nějak přitahováni.“ (Holmes, 2006, str. 75)38 Často až emotivní a citově zabarvené ideologické debaty mezi zastánci jedné či druhé strany odborné komunity nechme shrnuty v podobě předchozího odstavce. Výzkumy a experimenty, které by podpořily jednu či druhou stranu debaty empirickými argumenty, jsou mnohem vzácnější než ideologické debaty, ale o to zajímavější pohledy na chartjunk nám přinášejí.
Obr. 9 Holmesův graf vyžívající chartjunku a jeho minimalistická verze. Převzato z Bateman et al. (2010). 38 Své záměry, postupy a především počátky jeho přístupu k informační grafice podrobněji popisuje sám Holmes v krátké eseji pro AIGA. Viz Holmes (2014).
51
Otázkou, zda chartjunk opravdu tolik snižuje kognitivní efektivitu a zda může mít v informačním designu grafu nějakou pozitivní roli, a pokud ano, tak jakou, se jako první experimentálně zabývali Bateman et al. (2010) ve studii Useful Junk. Zde měřili především přesnost odčítání dat participanty a také zpětné vyvolání grafu z paměti, tedy jeho zapamatovatelnost. Přicházejí se dvěma důležitými výstupy: a) hodnoty se v případě Holmesových grafik a grafik podobného typu neodčítaly nepřesněji, než u minimalistických verzí grafu, a b) respondenti byli schopni si u Holmesových grafik i po určité době mnohem lépe vybavit nejen téma a jejich existenci vůbec, ale často i tvar dat: tedy trendy, křivky a výkyvy. Podrobnější výzkum role chartjunku se zohledněním kognitivních konceptů a procesů přinášejí Borgová et al. (2012). Na základě výsledků výzkumu docházejí k několika hypotézám funkce chartjunku v kognitivních procesech: a) z hlediska krátkodobé paměti chartjunk napomáhá efektivitě a rychlosti zpracování informace, b) z hlediska dlouhodobé paměti je pak možné, že chartjunk podporuje zapamatovatelnost a vyvolání grafu. Na druhou stranu však c) může mít chartjunk dle jejich výsledků negativní dopad na procesy zrakového vyhledávání. 39 V závěru však docházejí k podobnému závěru jako Bateman et al., tedy že chartjunk podporuje retenci informací. Na základě výstupů ze studie Batemana et al. se již výhradně zapamatovatelností a její mírou zabývali Borkinová et al. (2013). Zkoumali nejen zapamatovatelnost grafiky s chartjunkem a ilustracemi, ale i zapamatovatelnost mezi jednotlivými metaforami informační grafiky. Zde se logicky ukázalo, že typy grafů, kterým jsme vystaveni běžně, tedy výše definované základní formy statistických grafů, jsou méně zapamatovatelné než metafory neobvyklejší. V oblasti chartjunku pak výzkum potvrdil výše zmíněné studie: chartjunk zřejmě napomáhá zapamatování grafu. K podobným výsledkům dochází i nejnovější výzkum Liho a Moacdiehové (2014), kteří zapamatovatelnost a pochopení zkoumali pod různými časovými limity.
39 V orig. visual search. Český termín dle Sternberg (2002).
52
Obr. 10 Zapamatovatelnost grafů s ohledem na jejich data-ink poměr. Nejvyšších hodnot dosahují grafy s vysokým data-ink poměrem a chartjunkem. Převzato z Borkin et al. (2013)
Již po prvním výzkumu Batemana et al. přichází protinázory: Few (2011a) kritizuje jejich výzkum nejen pro silná prohlášení z úvodu, která zůstávají nepotvrzena, ale také pro zásadní metodologická selhání.40 Poukazuje též na zajímavou skutečnost: autoři výzkumu označují Holmesovy informační grafiky jako extrémní případy chartjunku. Holmes však dle Fewa extrémním v tomto ohledu není. Few zde zřejmě naznačuje, že Holmes jakožto informační designér užívající chartjunku dobře ví, jakou míru může zvolit, aby zcela neudusil data. Naproti tomu neprofesionál pracující v běžném tabulkovém procesoru může na základě prohlášení o užitečnosti chartjunku vytvořit grafiku, která sice bude velmi dobře zapamatovatelná, ale z hlediska předání dat zcela nefunkční. Few se proti výzkumům chartjunku ohrazuje téměř vždy. Kritizuje tedy jak výzkum Batemana et al. (viz Few, 2011a), tak snahu Hullmanové, Adara a Shaha (2011) aplikovat tento výzkum do teorie informační grafiky (viz Few, 2011b) i metodologii zmíněného novějšího 40 Nutno poznamenat, že jiní odborníci z oblasti se za studii postavili. Viz např. Kosara (2010).
53
výzkumu zapamatovatelnosti Borkinové et al. (viz Few, 2013). Do poukázaných metodologických selhání výzkumů chartjunku nebudeme podrobněji zabíhat, z Fewových kritik však přenesme jednu důležitou myšlenku: „Mějme na paměti, že dlouhodobá zapamatovatelnost není smyslem informační vizualizace,“ 41 píše (Few, 2011b). Názor Stephena Fewa ukazuje, jak důležité je brát při evaluaci vizualizace dat a obecně informační grafiky v potaz záměr42 jejího tvůrce a jak nám v tom může pomoci intencionalistická kritika grafů. Cílem autora grafu v akademické práci opravdu není dlouhodobá zapamatovatelnost, přesně jak uvádí Few. Zde jde především o rychlé a objektivní předání dat tak, jak jsme již definovali výše. Naproti tomu je však třeba brát v komplexním pohledu na informační vizualizaci v potaz i cíle např. novináře, kterému může jít primárně o zaujetí pozornosti a zapamatovatelnost a teprve až poté o přesné předání dat – a zde Few selhává. „Co mohou mnozí skalní fanoušci Tufteho považovat za chartjunk, může ve skutečnosti zabránit příjemci otočit na další stránku,“
43
poznamenává Camoes (2009). Nezapojení
intencionalistické kritiky nás proto může v oblasti debat o chartjunku či data-ink poměru a jejich roli omezit na nekonstruktivní ideologické a často až zbytečně emotivní debaty. V otázce chartjunku v diplomové práci tedy přistupujeme ke grafům skrze naši intencionalistickou kritiku a ptáme se po roli grafu v akademickém prostředí: co myslíme v tomto kontextu jeho efektivitou? Efektivní graf z pozice akademika jsme již ustanovili výše. Zapamatovatelnost grafu však mezi vlastnostmi akademicky efektivního grafu významnou roli nezastává. Taktéž je třeba poznamenat, že s ilustrovanými grafy typu Holmese nemáme v diplomových pracích na oboru ISK problém. Nejrozšířenějším chartjunkem je zde užití falešné perspektivy a zbytečných pseudo-3D efektů. Jejich přítomnost je otázkou SW nástrojů, které úžíváme k tvorbě grafů a též otázkou zvyku, jak to již bylo popsáno u debat data-ink
41 V orig.: "Let’s bear in mind that long-term recall is rarely the purpose of information visualization". 42 I Bateman et al. (2010) ve výzkumu upozorňují, že je třeba odlišovat různé "tasks" autorů vizualizace. 43 V orig.: "What many hardcore Tufte fans may consider chartjunk can actually keep the audience from turning the page".
54
poměru a role minimalismu. 3D efekty ve smyslu chartjunku však díky míře své přítomnosti v diplomových pracích zcela jistě neslouží zapamatovatelnosti: nejsou ničím novým, naopak se staly jakousi normou estetiky grafu a v mnoha případech způsobují vizuální deformaci dat. 44
Obr. 11 Holmesův graf vyžívající chartjunku a jeho minimalistická verze. Převzato z Bateman et al. (2010).
Chartjunk a jeho diskuze jsou též součástí širší debaty o objektivitě a manipulaci v grafu. Obecně se má za to, že pokud graf zbavíme chartjunku, stane se objektivnějším a méně zaujatým (viz. např. Tufte, 1983), což například v grafu Monstrous costs na obrázku č. 11 platí: ilustrace monstra zde vyvolává jisté emoce, které se u minimalistické verze neobjevují. I u minimalistické verze však musíme řešit objektivitu a i zde může být narušena, a to běžně prováděnými designovými rozhodnutími: o typu grafu, o řazení sloupců, o použití barev, výběrem šíře vstupních dat či rozložením měřítka a os. Jak uvidíme v navazující kapitole o manipulaci, tato rozhodnutí, pokud jim nevěnujeme pozornost, mohou velmi dramaticky ovlivnit finální působení grafu na příjemce.
44 3D efekty v grafech jsou samozřejmě též předmětem zkoumání. Mezi nejvýraznější patří práce Levyové et al. (1996), která zkoumala vzory užívání 3D efektů u studentů. Přístup k problematice nejčastěji kopíruje obecnější přístup ke zkoumání chartjunku: narážíme tedy na otázku, zda 3D efekty podporují zapamatování a retenci informací. Bez ohledu na různící se výsledky výzkumů (viz např. Carswell, Frankerberger, Bernhard, 1991 nebo Siegrist, 2010) zaujímáme v materiálu proti 3D efektům negativní postoj s ohledem na roli grafu v akademické práci.
55
4.5 Koncept Lie Factor Vytvořit efektivní graf znamená dle Tufteho mimo jiné též nepřekrucovat realitu v datech a zachovat graf čestný. Podobně jako můžeme lhát a překrucovat realitu slovem, ať už záměrně či nezáměrně, totiž můžeme zkreslovat skutečnost i skrze datovou grafiku. Problematika manipulace je v oblasti vizuální prezentace dat o to zásadnější, že je grafika považována za výrazně efektivnější formu komunikace. Upozornit příjemce studijního materiálu na záměrnou i nezáměrnou manipulaci grafem tak považujeme za důležitou součást aplikační části práce. Tufte (1983) si náchylnosti informační vizualizace k různým druhům manipulace všiml a pokusil se s nimi vyrovnat konceptem nazvaným lie factor, jenž je definován vzorcem
lie factor=
velikost jevu zobrazeného v grafice velikost jevu v datech
kde velikost jevu vypočítáme jako
velikost jevu=
finální hodnota − počáteční hodnota ∗100 počáteční hodnota
Vzorec tedy počítá procentuální nárůst jevu v datech a procentuální nárůst stejného jevu na datových prvcích, které pak poměřuje vůči sobě. Jestliže se výsledná hodnota lie factoru pohybuje v rozmezí od 0.95 do 1.05, můžeme dle Tufteho konceptu prohlásit graf za nelživý. Jednoduše řečeno: pokud se hodnota v datech navýšila o padesát procent a v např. sloupcovém grafu zobrazujícím stejná data datový prvek linie taktéž svou délku navýšil o padesát procent, výsledkem je hodnota lie factoru 1.0 a graf prohlásíme za nelživý. Tufte lie factor představuje na vizualizaci převzaté z novin:
56
Obr. 12 Příklad vizualizace s vysokým lie factorem. Převzato z Tufte (1983).
Informační grafika zobrazuje právní normy kongresu upravující spotřebu automobilů vyrobených v daném roce skrze jejich minimální dojezdovou vzdálenost v mílích na galon paliva. Vidíme, že zatímco automobil vyrobený v roce 1978 musel na galon paliva ujet nejméně 18 mil, automobil vyrobený v roce 1985 už musí na stejné množství ujet alespoň 27.5 míle. Velikost jevu v datech tedy vypočítáme jako 27.5−18.0 ∗100=53 18.0
a získáme hodnotu 53 %, udávající nárůst jevu v datech. Po změření velikosti 45 datových prvků v grafu stejným způsobem vypočítáme velikost shodného jevu v grafice jako 5.3−0.6 ∗100=783 0.6
a získáme hodnotu změny jevu v grafice, která pro tento příklad představuje 783% nárůst.
45 Tufte měří v palcích, ale s ohledem na následný převod do procentuální změny lze lie factor měřit a počítat v libovolných délkových mírách.
57
Výpočtem lie factoru skrze vzorec
lie factor=
783 =14.8 53
získáme bezrozměrnou hodnotu udávající míru lživosti grafu dle Tufteho. Jak vidíme, finální hodnota neleží v rozmezí 0.95 až 1.05 a graf tedy můžeme prohlásit za lživý. 46 Se záměrnou snahou ukazovat realitu v datech skrze grafy jinak, než jaká ve skutečnosti je, se setkáváme především v médiích. V souvislosti s manipulovanými grafy patří mezi nejcitovanější média televizní stanice FOX a její zpravodajství. Podseknutí osy y či machinace s měřítky na osách zde představují běžně užívané postupy při tvorbě vizualizací, které jsou ve výsledku zodpovědné za deformované zobrazení dat. Na obrázku č. 13 vidíme graf z vysílání FOX News, zobrazující počet obyvatel USA přihlášených do zdravotnického programu k aktuálnímu datu v jednom sloupci, a dle plánu očekávaný počet obyvatel přihlášených do programu k datu následujícímu o čtyři dny později ve sloupci druhém. Zatímco grafický datový prvek (sloupec) zde narostl o 186.84 %, reálný rozdíl v datech činí pouhých 17.76 % a lie factor tohoto grafu tak dosahuje hodnoty 10.52. Rozdílného efektu v datech a v grafice bylo dosaženo podseknutím osy y, která v grafu nezačíná na nule, aniž by byla tato skutečnost na ose y vyznačena, např. značkou podseknutí ╪. Pravý sloupec se tak vizuálně jeví jako třikrát větší než levý sloupec, což může být na televizní obrazovce, kde se graf zobrazí jen na pár vteřin, problematické.
46 Používat v souvislosti s grafem slovo lež však považujeme za problematické. Grafy přímo nelžou, nevymýšlí si, data na vstupu jsou u různě upravených grafů stále shodná, a data manipulujeme pouze vizuálně skrze jejich grafické zobrazení a úpravy datových i nedatových prvků.
58
Obr. 13 Manipulovaný graf z vysílání FOX News. Převzato z webu www.mediamatters.org.
Že jde o záměrnou manipulaci grafu můžeme vyvozovat i z vlastnické struktury televizní stanice FOX a její napojení na republikánskou politiku. Čestnost grafu však může být stejnými postupy, jako při záměrném lhaní, narušena i nezáměrně, nevědomě, při provádění běžných designových rozhodnutí. Nezáměrná manipulace je o to problematičtější, že si jí není vědom ani příjemce grafu, ani jeho tvůrce. Jelikož v procesu vzdělávání není graf běžně představován jako silný nástroj prezentace dat a chápeme ho spíše jako produkt pasivní tvorby grafu, nevěnujeme mu dostatek pozornosti a neuvědomujeme si, jak důležité je při procesu tvorby o těchto běžných designových rozhodnutích přemýšlet. Manipulovat graf můžeme např. nevhodnou volbou formy grafu, která ukazuje jisté vlastnosti dat jinak než by je ukázala vhodnější forma, též volbou velikosti datové plochy a volbou vlastností měřítka (rozestupy stupňů, podseknutí osy), volbou barvy (kde můžeme např. opomenout kulturní kontext barev nebo ho naopak záměrně použít ke vzbuzení žádaných emocí) či volbou rozpětí vstupních dat.
59
Obr. 14 Ilustrace volby rozsahu dat a jejího vlivu na působení grafu.
Podívejme se např. na obrázek výše, který vysvětluje problematiku volby šíře vstupních dat. Jako tvůrci grafu rozhodujeme, která data zobrazíme a která ne, a tuto skutečnost je nutné si uvědomit i z pozice příjemce. Pokud stojíme před grafem A, vnímáme ho jako pokles hodnot. Datový kontext grafu však může vyprávět zcela jiný příběh: pokud bychom rozšířili vstupní data o předchozí hodnoty, získáme graf B, který ukazuje delší období růstu zakončené poklesem: tedy zcela jinou situaci, než komunikuje graf A. Stejně tak můžeme při namapování dalších dat zjistit, že pokles je součástí cyklického výkyvu souvisejícího s jinou proměnnou (např. ročním obdobím) a že je tak pokles dat v grafu A jen součástí opakujícího se vývoje. Jakožto tvůrce grafu tedy rozhodujeme, jaká data stojí na vstupu do procesu tvorby grafu, a toto rozhodnutí má přímý dopad na finální sdělení grafu.
Obr. 15 Ilustrace vlivu volby měřítka na působení grafu.
60
Finální sdělení ovlivňujeme i prostými volbami designu: například volbou šířky grafu a spolu s ní velikostí rozestupů mezi stupni měřítka. Na obrázku č. 15 vidíme vždy totožný graf, který jsme jako obrázek v textovém editoru roztáhli do šířky. Změna velikosti datové plochy a rozšíření rozestupu stupňů měřítka má za následek zcela jiné vizuální působení datového prvku: z dramatického poklesu se pocitově stává pokles postupný. 47 Tato a další rozhodnutí prováděná při tvorbě grafu mohou mít tedy za následek záměrnou či nezáměrnou manipulaci. V aplikační části práce bude dán důraz na předání zodpovědnosti tvůrci grafu a upozornění na skutečnost, že zdánlivě běžné volby mohou ústit v nezáměrnou manipulaci grafem.
4.6 Diskuze a výzkumy Lie Factoru Nezáměrná manipulace je zcela jistě problematická a v rámci aplikační části je nutné nevědomost o zodpovědnosti tvůrce grafu z hlediska manipulace odstranit. I když si však jako tvůrci budeme vědomi faktu, že vizualizace může manipulovat a že toho docilujeme skrze různá designová rozhodnutí, stále zůstává důležitá otázka: máme lhát, nebo ne? Ačkoliv věříme, a to je třeba zmínit hned na počátku, že v oblasti akademické práce bychom lhát grafem záměrně neměli a měli bychom se snažit o co nejmenší manipulaci grafického zobrazení dat, což se promítne do aplikační části práce, v jiných oblastech by bylo uspěchané podávat takto jednoznačné hodnocení a otevírá se zde prostor zajímavé diskuzi. Nejen v médiích, ale i v oblasti byznysu často dochází k manipulaci grafů. V devadesátých letech prováděné výzkumy zjišťovaly, jak často k manipulaci dochází ve výročních zprávách firem, a zda je to manipulace záměrná, tedy zda bylo manipulováno k výhodě dané společnosti. Studie 240 výročních zpráv velkých britských firem Beattiové a Jonese (1992) dochází ke čtyřem hlavním závěrům: a) grafy jsou užívány často, b) firmy s lepšími výsledky užívají grafy častěji; tj. firmy s horšími výsledky jsou si vědomy, že jsou data v grafu lépe vidět, c) míra manipulace grafů je statisticky významná a d) manipulace grafů je většinou užívána k přilepšení vizuálního obrazu dat ve prospěch firmy. Podobné výzkumy nalézáme i u firem v USA (viz např. Steinbart, 1989) nebo v Austrálii (kde však není manipulace 47 Změnám ve spádu a jejich vnímání se dále věnuje např. Beattiová a Jones (2002).
61
ve vzorku tak signifikantní jako u předchozích výzkumů, viz Mather, Ramsay a Serry, 1996).48 Manipulace grafů v konkurenčním prostředí, kde jde o profit a kde ji nelze tak snadno odsoudit jako v akademické práci, je otázkou informační etiky a otevírá se zde zajímavá oblast nejen pro diskuzi, ale i pro další teorie a výzkum. 49 Připomeňme však, že někdy i jen mírná manipulace grafu může být otázkou existence a neexistence nejen komerčního subjektu, ale též subjektu závislého na veřejném financování, např. knihovny. I zde se tedy jako možná jeví aplikace intencionalistické kritiky, která posuzuje manipulující graf z hlediska záměru tvůrce.
4.7 Rámec Trifecta Náš koncept intencionalistické kritiky, vypůjčený z literární vědy, jsme v průběhu mapování diskuzí využili několikrát. Pomohl nám nahlížet na problematiku efektivního grafu bez zaujetí, nesklouznout k ideologickým diskuzím a chápat komplexněji různé přístupy k informační vizualizaci. S podobnými komplexnějšími přístupy se poslední dobou v odborné komunitě začínáme setkávat stále častěji a též praktické rady přestávají být předkládány jako jediná existující pravda: např. Duartesová (2014) ve svém praktickém příspěvku v Harvard Business Review hned na úvodu zmiňuje, že vizuální zobrazování dat je „ošemetné“, protože se v různých kontextech musí aplikovat různá pravidla. Asi nejdále ve snaze nahlížet na vizualizaci komplexně zašel Kaiser Fung, autor konceptuálního rámce Trifecta, který považujeme za nutné v rámci konceptů efektivního grafu taktéž zmínit. Trifecta vzešla z neutěšeného stavu vizualizační kritiky a diskuzí, které se často omezují na subjektivní nekomplexní a nesystematický přístup (Fung, 2014). Jako nástroj slouží k systematickému a komplexnímu posuzování cizích i vlastních vizualizací. Jeho autor se dlouhodobě věnuje vizualizační kritice a na svém blogu Junk Charts prezentuje především 48 Manipulaci v byznysu se věnuje množství dalších výzkumů: zmiňme ještě Courtise (1997), který se věnoval výročním zprávám firem z Hong Kongu, nebo starší výzkumy Johnsona, Rice a Roemmicha (1980). Další přehled výzkumů a zdrojů věnujících se manipulaci v oblasti byznysu poskytuje Penrose (2008). 49 Sedlack et al. (2009) například navrhují, aby byla ve vzorci definující lie factor nahrazena velikost jevu v datech velikostí obchodního jevu v datech. Ve vysoce konkurenčním prostředí totiž může být růst o několik málo procent důvodem výrazných profitů - v nemanipulující vizualizaci s lie factorem v rozpětí 0.95-1.05 však nebude tento důležitý růst znatelný.
62
špatné vizualizace, usazuje je do širšího kontextu a navrhuje lepší způsoby, jak pod nimi ležící data a otázky efektivněji prezentovat. „Kritické příspěvky k vizualizacím jsou většinou postaveny jako volné toky myšlenek. Označení informační grafiky za 'ohromující' nebo 'nejhorší grafiku století' nemá hodnotu, pokud autor nedokáže artikulovat, proč tomu tak je. Vizualizační kritika se dosud neposunula dále než za subjektivní proklamace.“ 50 (Fung, 2014) Trifecta ustanovuje způsob komplexního přístupu, kdy na graf pohlížíme z hlediska dat (D), z hlediska cíle a otázky, kterou vizualizace zpracovává (Q), a neposledně také z hlediska samotné vizuální stránky (V). Rámec Trifecta nejdříve existoval jako jednoduchá poučka zajišťující komplexnější pohled jejího autora na vizualizace, postupně však došlo k propracování do ustálenější podoby (viz Fung, 2014) včetně kategorizace selhávajících vizualizací. V úvodu každé evaluce dle Trifecty stojí tři základní otázky: •
Jaká je hlavní otázka na počátku vizualizace? (Q)
•
Co říkají data? (D)
•
Co říká jejich vizuální reprezentace? (V) Odpovědi na tyto otázky spolu musí souznít: naše pokud možno zajímavá vstupní
otázka by měla být zodpovězena daty, data by měla být relevantní našemu cíli. Zvolená vizuální reprezentace by taktéž měla odpovídat záměrům tvůrce a reflektovat formu vstupních dat. Pokud jsou všechny vrcholy trojjedinosti v harmonii, jedná se dle Trifekty o efektivní vizualizaci dat. V praxi však nastávají různé disharmonie a jejich kombinace: Typ neefektivní vizualizace Q. Taková vizualizace staví vhodnou a funkční grafickou reprezentaci na dobrých datech, ale neodpovídá vstupní otázce, tj. nelze zjistit, co její tvůrce zamýšlel, nebo nepodporuje jeho stanoviska, ačkoliv z hlediska dat a vizuálu je bezproblémová. Typ neefektivní vizualizace D. Vizualizace v této kategorii disponují zajímavou vstupní
50 V orig.: „Opinion pieces on specific data graphics frequently come across as stream of conscience. Proclaiming a chart "mind-blowing" or "worst of the century" isn't worth much if the author cannot articulate why. The state of dataviz criticism has not progressed further than assembling a set of 'rules of thumb'.“
63
otázkou a graficky dobře provedeným výstupem, problémy však nacházíme v datech, která mohou být neúplná, špatně zvolená či nevhodně upravená nebo z nedůvěryhodného zdroje. Typ neefektivní vizualizace V. Staví na zajímavé otázce a vhodných datech nedostačující grafický výstup. Nevhodně zvolený typ grafu, nevhodná volba barev a další grafické chyby znemožňují efektivní čtení vizualizace. Především touto oblastí se zabývá Tufte. Typ neefektivní vizualizace QD. Grafická stránka je efektivní, ovšem je vystavěna na nekvalitních či pochybných datech a především nevhodné vstupní otázce nebo nejasném záměru tvůrce. Typ neefektivní vizualizace QV. V případě typu QV byla data získána z kvalitního zdroje a práce s nimi byla správná, nepodařilo se však určit otázky a cíle a data efektivně namapovat do grafické podoby. Typ neefektivní vizualizace DV. Tvůrce vizualizace má jasný záměr a klade zajímavé otázky, ostatní vrcholy Trifecty ovšem nedokázal usměrnit: data jsou nevhodná a stejně tak jejich grafická reprezentace. Typ neefektivní vizualizace QDV. Nejvyšší kategorií špatné vizualizace je typ QDV. Tvůrce takové vizualizace nemá jasný záměr ani stanovené otázky, zvolil nevhodná data, nebo data nevhodně zpracoval a neefektivní grafická reprezentace neodpovídá ani záměru, ani datům. Pokud porovnáme Trifectu s výše popsanými Tufteho koncepty, zjistíme, že se jedná o mnohem komplexnější nástroj. Zatímco Tufte se věnuje téměř výhradně efektivitě grafického zpracování51 a to pouze z pohledu minimalisty a své definice efektivní vizualizace zaměřené na rychlé a přesné předání dat, Trifecta vede naši pozornost ke komplexnímu pohledu na graf. Naznačuje, že na všechny vizualizace nelze uplatňovat shodné nároky a při evaluaci vizualizace je nutné brát v potaz širší kontext, záměry i vstupy, nejen estetiku grafického výstupu.
51 I lie factor řeší pouze manipulaci skrze grafický prvek a manipulaci se samotnou grafikou, nikoliv manipulaci s daty na vstupu nebo manipulaci s výchozí otázkou.
64
4.8 Diskuze koláčového grafu Velmi zajímavou debatou relevantní k nám definovaným základním typům statistických grafů, kterou je třeba v rámci této kapitoly také zmínit, je diskuze o smyslu koláčového grafu a jeho kognitivní efektivitě. Počátek koláčového grafu spolu s ostatními základními formami datujeme do roku 1801, kdy s ním přichází William Playfair. Ten koláčový graf, na rozdíl od svých ostatních základních forem, ve svém díle nijak blíže nepopisuje ani nediskutuje, což může mít dva důvody: Playfair věřil, že něco tak jasného a intuitivního nepotřebuje další komentář, nebo nevěřil, že se podobná omezená forma vizualizace ve větším měřítku uchytí (Spence, 2005). Jak již víme, koláčové grafy se uchytily velmi dobře a např. v diplomových pracích na oboru ISK FF MU představují druhou nejpoužívanější formu vizuální reprezentace dat. Podobně jako chartjunk tak dnes koláčové grafy rozdělují odbornou komunitu na dvě skupiny: jedni koláčové grafy zcela odsuzují (např. Few, Cleveland, Tufte), druzí zastávají taktéž kritický, ale zároveň smířlivý postoj a spíše hledají cesty, jak koláčový graf vytvářet v co nejfunkčnější podobě (např. Wong, 2010). První kritiky koláčového grafu nalézáme již krátce po začátku období vizualizačního temna (viz dříve v textu), kdy se tato forma masově rozšiřuje do novin a magazínů. Brinton (1914, str. 6) kritizuje koláčové grafy za jejich „neflexibilitu“ a navrhuje místo nich používat skládané sloupcové grafy, které by se dle jeho názoru, pokud by byly užívány, velmi rychle staly oblíbenými a koláčové grafy by zcela nahradily. Brintonova kritika zažehla snahy jednoznačně odpovědět na otázku po smyslu koláčového grafu a oblíbená forma se tak od dvacátých let stává objektem mnoha, často však z dnešního pohledu metodologicky vratkých výzkumů. Mezi prvními přistupuje k výsečovému grafu empiricky Walter C. Eells (1926), když v článku The Relative Merits of Circles and Bars for Representing Component Parts zkoumá míru přesnosti odečítání hodnot z koláčového grafu a skládaného sloupcového grafu na vzorku studentů psychologie. Dochází k závěru, že mezi těmito formami není větších rozdílů: obě tedy k předání informace slouží dobře.
65
Protinázor se objevuje krátce po publikaci Eellsova výzkumu, kdy ho Croxton prohlašuje za nedostatečný a provádí vlastní výzkumy. V nich dochází k závěrům, že pro jednoduchá data je sice koláčový graf vhodný, obecně je ale lepší se této formy vyvarovat (Croxton a Stryker, 1927). Výzkumů proběhlo v první polovině 20. století mnoho, ani jednomu se však nepodařilo vyvrátit Eellsův první výzkum a přesvědčivě podložit nechutenství ke koláčovému grafu. Nicméně, jak poznamenává Ian Spence (2005), i přes nemožnost koláčový graf jednoznačně experimentálně odsoudit má na něj již v polovině 20. století mnoho statistiků silně negativní názor. Zajímavý argument v otázce koláčového grafu nám mohou poskytnout Cleveland a McGill, kteří se v sedmdesátých letech blíže zabývali grafickými proměnnými (viz kap. 2.3.3), a na základě existujících teorií (zde především Weberovy a Stevensovy psychofyzikální zákony) i vlastních výzkumů seřadili proměnné dle jejich schopnosti rychle a přesně předávat kvantitativní údaje od nejefektivnější po nejméně efektivní. Na prvním místě se v jejich klasifikaci umisťuje pozice, následovaná sestupně délkou, směrem, úhlem, plochou, objemem a nakonec barevným odstínem a barevnou sytostí (Cleveland a McGill, 1984). Dle jejich kategorizace tedy můžeme tvrdit, že skládaný sloupcový graf nebo běžný sloupcový graf (proměnné pozice a délky) má nižší kognitivní náklady než koláčový (proměnná úhel) a je tak pro grafické zobrazení kvantitativních dat lepší volbou. Ani Clevelandův a McGillův výzkum však při podrobnějším zkoumání nedává uspokojivou odpověď. Ačkoliv tvorba koláčového grafu proměnnou úhel sice užívá, již v prvotních výzkumech bylo dokázáno, že na straně příjemce existuje několik druhů čtení této formy grafu: a) skrze úhly, b) skrze plochy nebo c) skrze velikost tětiv (viz Eells, 1926). Každé z těchto čtení však, jak vidíme, užívá primárně jinou grafickou proměnnou, a tak může na stupnici Clevelanda a McGilla koláčový graf obsazovat u různých příjemců různou pozici. Již více než sto let trvající diskuzi se pokoušejí uzavřít jednoznačnou odpovědí i výzkumníci s přístupem k moderním metodám zkoumání mozku a mozkové aktivity. Nejpokročilejším pokusem je v této oblasti výzkum Pecka et al. (2013) založený na sledování mozkové aktivity technologií fNIRS, schopnou zaznamenat úroveň odkysličeného hemoglobinu 66
souvisejícího s kognitivní činností, zde činností prováděnou při čtení koláčových a sloupcových grafů. Výzkumný tým došel k závěru, že mezi zmíněnými formami vizuální reprezentace dat není z hlediska kognitivních nákladů žádný patrný rozdíl. Jejich výzkum, a především pak zvolená technologie, se však obratem staly objektem kritiky (viz Few, 2013b). Dle Spence (2005) se obecně kritika koláčového grafu objevuje především proto, že je jako velmi jednoduchá forma často užíván k úkolům, na které nedostačuje, tedy např. k mapování velkého množství dat, které ústí v nesmyslné koláče o desítkách výsečí. I zde koláčový graf považujeme za velmi omezenou formu vizualizace dat, kterou je nutné kriticky zvážit. Jeho naprosté vyloučení z akademické komunikace je ovšem s ohledem na zvyk nemožné a ani ho nepovažujeme za nutné. 52 Proto se v rámci studijního materiálu pokusíme alespoň o předání nutnosti kritického přístupu ke koláčovému grafu a poskytneme doporučení k jeho tvorbě, která by měla zajistit jeho použitelnost i v rámci diplomových prací.
52 Je třeba mu přiznat i jisté výhody: na rozdíl od skládaného sloupce např. budí dojem celku a poskytuje určité vizuální kotvy, podobně jako hodiny: čtvrt, půl, celá.
67
5.
Kognitivní aspekty efektivního grafu Praktická doporučení vzešlá výhradně z teoretických konceptů nemohou být brána
vážně, pokud nevykazují alespoň základní znalost kognitivních procesů. Abychom mohli ke zdrojům, teoretickým konceptům i praktickým doporučením přistoupit v rámci aplikační části práce kriticky, je nutné zde shrnout základní teorie lidského vizuálního vnímání, které ovlivňují efektivitu vizualizace a na které je při tvorbě informační vizualizace třeba brát ohled. Ambicí kapitoly není podat vyčerpávající přehled o fyziologii či anatomii lidského oka a psychologii zraku, nýbrž upřednostnit z široké oblasti pouze ta témata, která přímo ovlivňují tvorbu a efektivní čtení informačních vizualizací a která mohou mít dopad na praktická doporučení prezentovaná dále. Zrak je nejsilnějším z našich smyslů: uvádí se, že zrakem proudí do našeho mozku 90 % veškerých smyslových počitků (Jensen, 2008). Proces vidění počíná světlem vstupujícím do našeho oka, obsahujícího receptory uzpůsobené k absorbování světla a jeho překladu do nervových signálů. Tyto nervové signály jsou dále skrze optické nervy přenášeny do mozku, kde jsou zpracovávány (Few, 2004). Fyziologie oka, jeho stavba a podrobnější popis receptorů a optických nervů nejsou pro tuto práci relevantní a věnuje se jim např. Synek a Skorkovská (2014). Relevantními jsou teorie snažící se popsat následné zpracování vizuálních informací na různých úrovních paměti a mozku.
68
Obr. 16 Trojsložkový model mozku dle Atkinsona a Shiffrina, s naznačenými procesy na přechodu mezi úrovněmi a s procesy mazání informace.
5.1
Model mozku a paměti K mozku přistupme z pohledu kognitivní psychologie a k popisu paměti použijme
klasický model Atkinsona a Shiffrina ze 60. let dvacátého století (dle Sternberg, 2002), který popisuje paměť trojsložkově a dělí ji na: a) senzorickou paměť (z hlediska zraku ikonickou paměť), b) krátkodobou a c) dlouhodobou paměť. S ohledem na informační vizualizaci nás zajímají především procesy probíhající na přechodu mezi senzorickou a krátkodobou pamětí a dále specifika paměti krátkodobé. Senzorická paměť je většinou v trojsložkové metafoře mozku chápána jako vstupní úložiště pro veškeré informace, které se pak mohou nebo nemusí posunout dále do krátkodobé a následně dlouhodobé paměti (Sternberg, 2002, str. 186). Do senzorické paměti nejsme schopni sami vstupovat a informace se zde uchovávají po dobu kratší než vteřina (Few, 2004). Na přechodu mezi senzorickou a krátkodobou pamětí se pak odehrávají nevědomé a velmi rychlé procesy zrakového vnímání, které určují, jaké podněty budou z nepřeberného množství informací předány naší vědomé pozornosti a jakým způsobem. Tyto procesy pracují především s konceptem předpozornosti, a proto mluvíme o předpozornostním zpracování. Předpozornostní zpracování je velmi rychlý proces rozpoznávání; následné pozornostní zpracování je pak proces pomalejší a vědomý, který může ústit v poučení, porozumění či zapamatování (Few, 2004), a odehrává se až v oblasti krátkodobé paměti. Podobně tyto dva světy pozornosti zmiňuje v knize Myšlení pomalé a rychlé Daniel 69
Kahneman (2012): nazývá je Systém 1 a Systém 2 a též jimi popisuje nevědomé a vědomé procesy zpracování vizuálních stimulů v mozku.
5.2 Předpozornostní atributy Koncept předpozornosti a předpozornostního zpracování vychází z psychofyzikálního zkoumání vnímání lidských reakcí na fyzikální podněty a v oblasti zraku popisuje vizuální rozlišitelnost prvků (Ware, 2012). Na přestupu mezi senzorickou a krátkodobou pamětí funguje dle tohoto konceptu nevědomý proces, který hledá ve velkém množství podnětů vzory a výkyvy, jež následně předává naší vědomé pozornosti. Tyto vzory a výkyvy označujeme jako předpozornostní atributy a podle Gibsonova evolučního nazírání na zrakové vnímání se vyvinuly s ohledem k našemu přežití (viz Gibson, 1986). Například skutečnost, že v keřích v periferii našeho zraku velmi rychle zaznamenáme i nepatrný pohyb predátora, je výsledkem právě předpozornostního zpracování zrakových vjemů, které je na pohyb evolučně velmi citlivě nastaveno. Jednoduše můžeme předpozornostní atributy ilustrovat na obrázku níže. Pokud dostaneme za úkol v první tabulce čísel najít všechny číslice pět, musíme aktivně zapojit vědomou pozornost, protože tato forma zobrazení dat neužívá žádný z atributů, které by předpozornost mohla zachytit. Pokud ten samý úkol provádíme na druhé tabulce, předpozornost již identifikuje atribut, který se vymyká, a čísla pět jsou tak ihned jasně přijmuta vědomou pozorností.
70
Obr. 17 Tabulky čísel ilustrující předpozornostní atributy a jejich využití pro vedení pozornosti k důležitým prvkům.
Předpozornostní atributy jsou tedy jakékoliv vizuálně nápadné prvky a jejich vlastnosti. Ware (2012) kategorizoval předpozornostní atributy do čtyř skupin: a) forma, b) barva, c) pozice a d) pohyb. Přímo pak vyjmenovává např.: orientace linie, délka linie, šířka linie, velikost, zakřivení, poziční shlukování, barevný odstín, atd. Na obrázku 17 tedy bylo u druhé tabulky využito předpozornostního atributu formy tak, abychom vědomou pozornost nasměrovali skrze předpozornost na žádané prvky a snížili tak kognitivní náklady celého procesu zrakového vyhledávání. Předpozornostní atributy můžeme stejně dobře aplikovat i na informační vizualizaci, a to všude tam, kde je třeba zvýraznit důležité součásti informační grafiky a dát jim vyšší vizuální nápadnost (v ang. visual saliency; Ware, 2012), tedy přitáhnout k nim pozornost. Povědomí o předpozornostních atributech je silným nástrojem v rukou tvůrce grafu.
71
5.3 Gestalt a informační vizualizace Základní úlohou zrakového vnímání je dle Eysencka a Keana mimo jiné i tzv. percepční segregace, při níž se mozek rozhoduje, „které části příchozí informace přináležejí k sobě a tvoří tak samostatné celky-objekty“ (Eysenck a Keane, 2008, str. 42). Skutečnost, že na obr. 17 ihned zaměřujeme pozornost na tučně odlišené, tedy předpozornostními atributy zvýrazněné číslice, je totiž pouze počátek nevědomého zpracování informací. Ačkoliv jsou tyto číslice na různých místech tabulky, vnímáme je zároveň také jako jednu skupinu prvků, jako celek-objekt. Tato vlastnost vnímání se často ilustruje pomocí obr. 18, kde také určitou oblast skvrn vnímáme jako objekt-celek.
Obr. 18 Ilustrace percepční segregace. Mezi černými skvrnami na bílém pozadí jasně rozeznáváme psa. Převzato z Tuck (2010).
Osvětlit, proč na obrázku výše rozpoznáváme mezi skvrnami dalmatina a jakým způsobem vnímáme vzory, formy a jak organizujeme co vidíme, bylo cílem gestaltismu, psychologické školy rozvíjející se v prvních dekádách dvacátého století (Plháková, 2006). Gestaltisté přišli s principy a pravidly, které mají dosud vysokou relevanci pro grafický design, 72
informační vizualizace nevyjímaje, a které se odvíjejí od zákona dobrého tvaru. Mezi nejzákladnější zákony gestaltismu, které můžeme aplikovat i do informační vizualizace, patří (dle Eysenck a Keane, 2008; Cairo, 2013): •
zákon podobnosti (podobně vypadající prvky vnímáme jako celek),
•
zákon blízkosti (prvky blízko sebe vnímáme jako skupinu),
•
zákon propojenosti (prvky vizuálně propojené vnímáme jako celek),
•
zákon dobrého pokračování (tendence hledat vhodné návaznosti),
•
zákon uzavření (prvky uvnitř ohraničené oblasti vnímáme jako skupinu). Zákon podobnosti byl ilustrován již výše na obr. 17, kde popisuje fakt, že
předpozornostními atributy odlišené číslice zde vnímáme jako skupinu. Na obr. 19 je zákon podobnosti ilustrován na nákresu C. Zákon blízkosti je pak patrný např. na skupinových sloupcových grafech, kde jsou jednotlivé skupiny datových prvků v této metafoře umístěny blíže sobě, čímž jsou vnímány jako k sobě náležící celek (na obr. 19 nákres A). Zákon dobrého pokračování vnímáme především ve spojnicových grafech, kde i přes křížící se spojnice jsme schopni hledat jejich návaznosti (D). Zákon uzavření pak lze aplikovat např. v korelačním grafu, nebo i skupinovém sloupcovém grafu, k odlišení jednotlivých celků (E). Předpozornostní atributy spolu se zákony gestaltismu popisují vlastnosti našeho zrakového vnímání na prvních, nevědomých úrovních tohoto procesu. Snaží se pochopit pravidla, podle kterých jsou informace proudící do senzorické paměti zpracovávány a předávány dál, tj. v jakých celcích a které z nich jsou předkládány naší vědomé pozornosti. Základní chápání těchto pravidel tvůrcem grafu, nebo jejich aplikace do praktických doporučení, může k efektivitě grafů a snížení kognitivních nákladů výrazně napomoci.
73
Obr. 19 Ilustrace zákonů gestaltismu. Dle zákona blízkosti vnímáme prvky umístěné blízko sebe jako skupinu (A), dle zákona propojenosti vizuálně spojené prvky jako skupinu (B), zákon podobnosti popisuje vnímání celků z prvků vizuálně podobných (C), zákon dobrého pokračování popisuje fakt, že na nákresu (D) vnímáme křivky jako A-B a X-Y, nikoliv jako např. A-X, a zákon uzavření skutečnost, že prvky nějak vizuálně ohraničené vnímáme též jako jeden celek (E).
5.4 Krátkodobá paměť a její limity Výše popsanými procesy filtrované a zpracované informace ze senzorické paměti postupují ve zvoleném modelu dále, do krátkodobé paměti, kde jsou užívány vědomým pozorným procesem vnímání (Few, 2004).53 Jakožto tvůrci informačního designu grafů si musíme být vědomi dvou základních limitů krátkodobé paměti: a) je dočasná, b) má omezenou kapacitu. Dočasnost. Informace se v krátkodobé paměti udrží od několika vteřin až po několik hodin54, pokud je tato informace stále vědomě připomínána. Dalším opakováním a kódováním se pak informace přemisťuje do dlouhodobé paměti. 53 Některé modely rozdělují též vizuální a verbální krátkodobou paměť (viz Ware, 2012, str. 394). 54 Některé zdroje uvádí horní hranici pouze jako „několik minut“. (Sternberg, 2002, str. 190)
74
Kapacita. V jednu chvíli udrží krátkodobá paměť jen určitý omezený objem informací. Pro zjednodušení se užívá termínu chunks (přeložitelné jako položky) a počet položek, které jsme schopni v krátkodobé paměti najednou udržet, je objektem výzkumů. V odborné literatuře nalézáme různé hodnoty: čtyři (Few, 2004), pět (Ware, 2012), Miller uvádí až sedm plus mínus dva, čili nejvíce devět (Sternberg, 2002). Na tuto kapacitu samozřejmě působí různé vlivy, sklady slov, mnemotechnické pomůcky apod.55, důležité však je si jako designér uvědomit, že kapacita pracovní krátkodobé paměti není neomezená.
Obr. 20 Ukázka práce s limity krátkodobé paměti. Legenda je namapována přímo na datové prvky.
U grafů můžeme uvést jako příklad práce s limity krátkodobé paměti pozici legendy. U spojnicového grafu nebo koláčového grafu ji často necháváme v samostatném boxu vedle datové plochy a nutíme tak příjemce ukládat do krátkodobé paměti popisky z legendy, barvu odlišující kategorie/datové řady, tvary a další položky, a pak s nimi pracovat nad několika datovými prvky zároveň. Pokud jsme si jako tvůrci grafu vědomi limitů krátkodobé paměti, umístíme popisky přímo k datovým prvkům (pokud je to u dané formy možné) a snížíme tak kognitivní náklady čtení grafu na straně příjemce, podobně jako je tomu na obrázku výše.
55 Další výzkumy viz Sternberg, 2002, str. 190.
75
5.5 Barvy a efektivní graf V kap. 4.8 jsme zmínili experimenty Clevelanda a McGilla (1984), ze kterých vzešlo řazení grafických proměnných dle jejich schopnosti efektivně mapovat kvantitativní data. Barevný odstín a barevná sytost v těchto výzkumech skončily až na posledních místech, protože vnímání barvy a jejich variací je velmi problematickou subjektivní oblastí. Např. mapování kvantitativních dat barevnou sytostí do matice je kontroverzní metaforou vizualizace, protože stejný odstín jedné barvy se může jevit odlišným na dvou různých místech v matici a to podle momentálního barevného kontextu. Percepční efekt kontextu ilustruje obr. 21, kde jsou vždy dva středové čtverce vyplněny odstínem stejné barvy, který se však v různých barevných kontextech jeví být rozdílným, světlejším nebo tmavším. Stejný problém je ilustrován na příkladu odstínů šedi. Navíc zde působí též efekt simultánního kontrastu (viz Ploskotová, 1987), jehož následkem středové čtverce v procesu vidění „nasávají“ barvu převažujícího okolí.
Obr. 21 Percepční efekt kontextu na vnímání barev. Středové prvky mají vždy shodné odstíny, v závislosti na kontextu se však jeví být odlišnými.
V základních typech grafů se problematikou barevného kontextu příliš zaobírat nemusíme, protože zde barvu většinou nepoužíváme přímo k mapování kvantitativních 76
hodnot, jak byla posuzována ve výzkumech Clevelanda a McGilla, ale k odlišování kategorií. Nicméně nám problém barevných kontextů slouží jako dobrý vstupní příklad upozorňující na problematiku barev a subjektivitu jejich vnímání. Další problémy spojené s barvami, především poruchy barevného vidění a oblast kulturního kontextu barev, už pak ovšem mohou mít na námi zkoumané základní formy informační vizualizace přímý dopad. Dle výzkumů trpí některou z forem částečné barvosleposti 9 % populace mužů a 0.5 procenta populace žen (Beveren, 2012); úplná porucha barvocitu, kdy vidí osoba pouze v odstínech šedé, tzv. achromázie, je vzácnou (Pleskotová, 1987).
Obr. 22 Simulace barevného spektra přijímaného v různých typech poruchy barvocitu. Převzato a upraveno z CUDO, 2014.
Mezi nejběžnější poruchy barvocitu patří dichromázie, kdy jsou barvy míchány pouze ze dvou, nikoliv ze tří základních barev. Nejběžnější dichromázií je pak protanopie, porucha citlivosti k červené barvě (Pleskotová, 1987, str. 86). Oko protanopického člověka míchá červenou barvu pouze ze žluté a modré, a tak ji vidí jen jako velmi tmavou, nebo vůbec. Deuteranopické oko má naopak potíže s rozeznáním zelené barvy. Vzácnější je pak porucha barvocitu na modrou a fialovou barvu, tritanopie, která se dle Pleskotové vyskytuje většinou ve spojení s dalšími onemocněními zraku. Barevné škály barvoslepých v porovnání s vnímanou barevnou škálou běžného zraku ilustruje obr. 22. 77
Skutečnost, že ne každé oko vnímá barvy stejně a že se můžeme setkat s poruchami barvocitu, se musí projevit i v informačním designu, jenž by se měl v rámci efektivity snažit též o přístupnost. Pokud nevezmeme v potaz poruchy barvocitu tam, kde je barva přímo nositelem informace, nebude určitý zlomek příjemců schopen graf správně přečíst a informaci přijmout. V praxi se u základních forem grafu můžeme problémům s barvami mnohdy vyhnout. Předně jsou barvy často užívány zbytečně (viz analýza diplomových prací dále) a bylo by možné je nahradit odstíny jedné barvy nebo odstíny šedé, čímž se v rámci přístupnosti vyhneme nejen problémům s barvoslepostí, ale též problémům s achromázií, černobílým tiskem či nebarevnými zobrazovacími zařízeními, především elektronickými čtečkami. Vnímání barev není ovlivněno jen případnými fyziologickými nedostatky oka, ale též psychologickými aspekty a kulturním kontextem. Psychologie vnímání barev je často podrobována výzkumům (shrnutí např. Klaška, 2008), nepanuje zde však jasná shoda především proto, že emoce barvám přiřazujeme spíše subjektivně. 56 Podobně jsou barvám přiřazovány významy v rámci kulturního kontextu. Modrá, případně zelená a červená jsou například asociovány s pozitivními a negativními hodnotami ve finančnictví, černá je spojena s tragickými událostmi a smutkem, atp. Tyto asociace jsou však vymezeny pouze v rámci určité kultury a v jiných kulturách mohou mít shodné barvy zcela jiné asociace. Například oranžová, která je v USA asociována s dopravním značením a především nebezpečím na silnicích, je v Asii chápána jako barva pozitivní, barva duchovního osvícení (Bortoli a Maroto, 2001). Barevné preference se též mohou lišit podle převažujícího klimatu: lidé z oblastí kde je více slunečního záření mají tendence považovat za pozitivní zářivé barvy, naopak lidé z oblastí s menším množstvím slunce preferují chladnější, méně výrazné barvy (Zelanski a Fisherová, 2010, str. 41). Barevné zvyklosti a preference jsou taktéž ovlivněny pohlavím a věkem. Pochopení cílové skupiny a jejích kulturních i subjektivních barevných preferencí a asociací je dalším významným krokem k efektivnímu grafu.
56 Psychologický klíč k barvám poskytuje např. Ploskotová (1987, str. 118).
78
Nedávný výzkum Linové et al. (2013) dokázal též důležitost sémanticky rezonantní volby barvy v informační vizualizaci. Ta spočívá v hledání souvislostí mezi tématy, tedy kategoriemi, a jejich barevnými reprezentacemi na základě podobností. Pokud například mapujeme v grafu vývoz ovoce, volíme k jahodám sémanticky rezonantní barvu červenou, k banánům sémanticky rezonantní žlutou, apod. Aplikace sémanticky rezonantní volby barvy tam, kde je to smysluplné, má signifikantní efekt na rychlost pochopení grafu, jelikož dochází ke snižování kognitivních nákladů v procesu čtení grafu (Lin et al., 2013). Způsob zpracování zrakových vjemů v mozku a především pak koncepty předpozornostních atributů, zákony gestaltismu, znalosti o limitech krátkodobé paměti a základní orientace v problematice barev nám v aplikační části pomohou kriticky přistoupit k teoretickým konceptům a dosud publikovaným praktickým doporučením.
79
6.
Efektivní graf v diplomové práci K efektivitě grafu v diplomové práci přistupuji z pohledu akademika, tedy jak již bylo
definováno, chápu zde efektivní graf jako rychle, přesně, objektivně, bez manipulace a esteticky střídmě prezentující kvantitativní data. Tyto vlastnosti byly skrze teorie a koncepty efektivního grafu blíže rozebrány v předchozích kapitolách. Než se však přesuneme k aplikační části, musíme si blíže představit výstupy jednoduché základní kvantitativní a další subjektivní analýzy grafů v diplomových pracích studentů oboru ISK na FF MU. Tyto výstupy pomohou praktická doporučení blíže zacílit.
6.1
Specifika analýzy Cílem následující analýzy nebylo poskytnout podrobnou kvantifikaci efektivity grafů či
sledovat jejich vývoj v delším časovém úseku, ale spíše jen identifikovat základní formy a získat zběžný přehled o stavu grafu v diplomových pracích přímo na cílovém studijním oboru. Analýza byla s ohledem na cíle metodologicky zjednodušena 57 a vzorek grafů vybrán jako census. Podrobnější analýza a přesná kvantifikace grafické komunikace v závěrečných pracích, která by sledovala též vývoj v rámci delšího časového období, by rozsahem vydala na samostatnou studii. Při plném nasazení metody kvantitativní obsahové analýzy a s rozsáhlejší databází s více sledovanými znaky by však mohla být zajímavým tématem k samostatnému zpracování, a proto ji navrhuji k dalšímu zvážení. Zvážit je však též třeba omezení metody kvantitativní obsahové analýzy, na která jsem narážel již při její aplikaci pro takto jednoduchou analýzu. Specifika grafů a jejich efektivity by možná ocenily rozsáhlejší kombinaci s přístupem 57 Např. do kódování byl zapojen pouze jeden výzkumník, což může být u kvantitativní části analýzy s ohledem na koncept inter-coder reliability považováno za problematické. Jsem si vědom problematiky takového výzkumu, vzhledem k rozsahu analýzy a její vedlejší roli v této diplomové práci ho však považuji za dostatečný.
80
kvalitativní obsahové analýzy. Níže prezentovanou základní kvantitativní analýzu užšího vzorku prací, doplněnou o výstupy subjektivního zkoumání grafů, však považuji pro účely této diplomové práce za dostačující.
6.2 Metodologie Aplikace kvantitativní vizuální obsahové analýzy na informační vizualizace nese mnohá specifika a není tak příliš kde se metodologicky opřít. Postup zde prezentované základní analýzy byl inspirován metodologií Mayerse (2009), kde byly informační grafiky v novinách zkoumány deskriptivní kvantitativní obsahovou analýzou z hlediska jejich chybovosti a nepřesností. Metodologie tohoto širokého výzkumu, prezentovaného jako samostatná závěrečná magisterská práce, byla pro účely mé základní analýzy grafů zjednodušena a upravena. Především není brán takový důraz na kontext, ve kterém se grafika pohybuje, ale spíše naopak na její samostatnost. Položeny jsou deskriptivní výzkumné otázky, vzešlé z prvotní subjektivní analýzy diplomových prací nazíraných pohledem častých problémů prezentovaných v teoreticky i prakticky zaměřených zdrojích. Na základě otázek jsou dále definovány proměnné a jejich identifikátory a tyto znaky pak byly ve vzorku kódovány. Výstupy této jednoduché analýzy jsou spolu s dalšími subjektivními kvalitativními pozorováními a vhledy do stavu grafu v diplomových pracích prezentovány dále v kap. 6.6.
81
6.3 Vzorek prací Základní analýza proběhla nad 143 již obhajovanými bakalářskými i magisterskými diplomovými pracemi zadanými v roce 2011 a 2012. Jejich seznam byl převzat z oficiálního Archivu závěrečných prací na webu KISK58 a k jejich získání bylo využito úložiště Theses. V těchto 143 pracích bylo zaznamenáno celkem 763 grafů 59, které byly extrahovány. Každému grafu byl následně přidělen unikátní kód, zajišťující též jeho zpětnou dohledatelnost v diplomové práci. Jednotkou analýzy je tedy graf.
6.4 Deskriptivní výzkumné otázky Jaké typy grafů jsou diplomanty na oboru ISK FF MUNI nejčastěji využívány? Jak efektivní jsou grafy v diplomové práci na oboru ISK FF MUNI? – Používají diplomanti grafy pouze tam, kde je to vhodné? – Obstojí grafy jako samostatně stojící jednotky bez textu? – Používají diplomanti v rámci estetiky nevhodné 3D efekty? – Mapují diplomanti legendu k datovým prvkům tam, kde je to možné? – Dochází v diplomových pracích k manipulaci s grafy?
6.5 Kódování a indikátory Typ grafu. Proměnná nabývá hodnoty dle typu grafu. Základní typy grafu jsou shrnuty výše: jde o sloupcový, spojnicový a koláčový graf. Ostatní typy grafů jsou kódovány jako ostatní. Sloupcový graf je pro účely dalších proměnných dále specifikován na obyčejný, skupinový a skládaný a na vertikální a horizontální. 58 Dostupné na adrese http://kisk.phil.muni.cz/archiv-praci/. 59 Vzorek zde užitý může být označen za problematický: některé práce ze vzorku, které využívaly grafů, jich obsahovaly jen málo, některé práce naopak desítky. Dalo by se očekávat, že stejný autor grafu bude v práci své chyby opakovat u všech grafů, dalším zkoumáním však bylo zjištěno, že se hodnoty sledovaných proměnných mnohdy liší i u grafů v rámci jedné práce.
82
Vhodnost užití grafu. Analyzuje grafy z hlediska počtu hodnot, které mapují: tento přístup přejímáme z Tufteho konceptu data density, jenž posuzuje smysl využití grafu podle hustoty dat (Tufte, 1983). Pokud jsou v grafu vizualizovány např. pouze dvě hodnoty, je hustota dat velmi nízká a dle Tufteho by bylo vhodnější využít tabulku nebo prostý slovní popis. Pokud graf mapuje méně než tři hodnoty, je tato skutečnost zaznamenána. Samostatnost. Pochopitelnost grafu i bez samotného textu práce. Zkoumá správné užití nadpisů, popisků a dalších vysvětlivek, tedy zda graf komunikuje data sám o sobě a nemusí být další údaje dohledávány v textu diplomové práce. Pokud samostatně stojící graf není pochopitelný, tedy pokud v grafu chybí popisky či nadpisy, bez kterých je graf zmatečný natolik, že to může narušit jasné pochopení grafu, je to zaznamenáno. Pseudo-3D efekty. Proměnná sleduje, zda graf užívá falešné perspektivy a pseudo-3D efektů. Pokud ano, je to zaznamenáno. Případy, kde je třetího rozměru užito kvůli přidání třetí dimenze dat, se samozřejmě nepočítají jako pseudo-3D grafy. Mapování legendy. Zkoumá základní způsob práce s limity krátkodobé paměti, tedy zda je legenda u těch grafů, kde je to možné, namapována přímo na datové prvky. Pokud tomu tak není, je tak zaznamenáno. Umístění legendy je kvantifikováno mezi koláčovými, spojnicovými a běžnými sloupcovými grafy. Manipulace. Sleduje, zda graf mohl být manipulován, ať už záměrně či nezáměrně, a to skrze kvantifikaci grafů s podseknutou osou. Pokud graf vykazuje podseknutí osy, je tak zaznamenáno. U spojnicového grafu samozřejmě není podseknutí osy nutným znakem manipulace, kvantifikace podseknutí nám však může dodat představu, jak často se s touto technikou diplomanti setkávají.
83
6.6 Výstupy analýzy V následující části jsou shrnuty výsledky jednoduché kvantitativní analýzy, doplněné o vhledy z dalšího subjektivního zkoumaní grafů v diplomových pracích.
6.6.1 Jaké typy grafů jsou diplomanty nejčastěji využívány? Výsledky oblíbenosti jednotlivých metafor informační vizualizace představuje tab. č. 2. Mezi nejvyužívanější formu patří sloupcový graf ve všech svých variantách, na druhém místě pak graf koláčový a následně jen občasně graf spojnicový. Pod ostatní se skrylo vzácné užití radarového grafu. Další zkoumání ukázalo, že diplomanti využívají sloupcový graf i tam, kde by bylo vhodnější metaforou užití spojnicového, které by lépe komunikovalo, že se jedná o proměnu hodnot v jedné datové řadě v rámci určitého časového úseku.
Typ grafu
2011
2012
CELKEM
v % z celku
Sloupcový horizontální
60
55
115
15 %
Sloupcový vertikální
320
123
443
58 %
Sloupcový graf
380
178
558
73 %
Koláčový graf
101
73
174
23 %
Spojnicový graf
14
8
22
3%
Ostatní
3
6
9
1%
CELKEM
878
443
763
Tab. 2 Četnosti jednotlivých typů grafu ve vzorku.
V rámci zkoumání typů jsem se dále pokusil určit i nástroj užitý k tvorbě grafu, ačkoliv je takové určení problematické. Většina grafů ve výběru však nese znaky tvorby v kancelářských aplikacích typu Microsoft Excel. Malá část, jejichž estetika Excel nepřipomíná, pochází zřejmě přímo z výzkumných dotazníkových nástrojů.
84
6.6.2 Používají diplomanti grafy jen tam, kde je to vhodné? Na tuto otázku jsme dle konceptu data density odpovídali skrze kvantifikaci mapovaných hodnot. Celkem 85 grafů (11.1 %) z výběru mapovalo méně než tři hodnoty, tedy jedno nebo dvě čísla. Smysl takových grafů v případě jedné hodnoty je nulový, pro dvě hodnoty je diskutabilní. Další subjektivní kvalitativní analýzou výskytu těchto datově chudých grafů zjišťujeme, že se objevují především v diplomových pracích studentů, kteří ke grafu volí automatický pasivní přístup stylem dotazníková otázka rovná se povinný graf.
6.6.3 Obstojí grafy jako samostatně stojící jednotky bez textu? 21.4 % grafů ze vzorku (celkem 163) obsahuje nedostatky v oblasti nadpisů, popisků nebo legendy. Z dalšího zkoumání opět vychází, že se i v rámci jedné diplomové práce vyskytují shodné grafy provedené z hlediska kontextu správně i nevhodně. Mezi nejčastější pochybení patří neuvedení jednotek na ose, díky čemuž nelze často ani z popisků a nadpisů zjistit, v jakých jednotkách jsou data uvedena. V případě procent nebo absolutních četností se většinou dají tyto vlastnosti odvodit, narážíme však i na případy, kde vede opomenutí kontextu ke zcela špatnému pochopení grafu.
6.6.4 Používají diplomanti v rámci estetiky nevhodné 3D efekty? 279 grafů (36.6 %) z výběru bylo zvelebeno použitím falešných 3D efektů. Nejčastěji je 3D efektům podroben koláčový graf (52.3 % všech koláčových grafů ve vzorku), což je problematické, protože právě u koláčového grafu dochází použitím 3D efektů k nejzávažnější deformaci dat. Z dalšího zkoumání prací taktéž zjišťujeme, že se tendence k používání těchto efektů někdy liší i v rámci jedné diplomové práce.
6.6.5 Mapují diplomanti legendu k datovým prvkům? Mapování legendy přímo k datovým prvkům je základní formou práce s limity krátkodobé paměti. Přichází v úvahu především u koláčových grafů a liniových grafů. U koláčových grafů bylo takové mapování využito pouze u 12 grafů z celkového počtu 174 (tedy jen 6.9 %), zbytek koláčových grafů užívá legendy v samostatném boxu. U liniových grafů 85
nepracuje s krátkodobou pamětí skrze přímé mapování legendy žádný graf. V potaz zde přichází i specifické případy obyčejných vertikálních sloupcových grafů, které by užitím horizontální varianty mohly mapovat legendu přímo k datovým prvkům. Tohoto způsobu by se dalo využít u deseti grafů ze vzorku. Další subjektivní zkoumání legendy a popisků ukázalo častou duplikaci informací, kdy jsou legendy uvedeny dvakrát až třikrát, nadpisy se opakují jak v grafu, tak pod grafem, atp.
6.6.6 Dochází v diplomových pracích k manipulaci s grafy? Manipulace grafů ve smyslu podsekávání osy nebyla v diplomových pracích zaznamenána. U spojnicového grafu nebyly ve vzorku podseknuté osy zamlčeny, u sloupcových grafů byla na ose vždy nula. Ve studijním materiálu však bude manipulace zmíněna, protože se zřejmě nejedná o čestnost tvůrců grafů, ale o nevědomost.
6.6.7 Další pozorování Z dalšího subjektivního zkoumání grafů v diplomových pracích vychází především přesvědčení, že jsou zde diplomanty užívány shodné grafy jak pro exploraci, tak pro prezentaci dat. Kvantifikovat tuto skutečnost by bylo značně obtížné, nejvhodnějším identifikátorem by zde však mohlo být nevhodné řazení dat, jež je nejčastějším viditelným projevem chybného použití grafu z explorace též k prezentaci dat (viz Wong, 2010). Graf užitý k exploraci dat ovšem není povětšinou vhodný též k prezentaci dat: diplomant ví, co v narychlo softwarem automaticky vytvořeném grafu hledat. Když provede analýzu, je vhodné pak graf upravit tak, aby výsledky této analýzy byly jasně zřetelné a aby byly komunikovány všemi součástmi grafu, tedy kontextem (nadpisy, popisky) i datovými prvky (vzestupné/sestupné řazení, zvýrazňování, atp.). U značné části grafů nalezených v diplomových pracích si musí čtenář vizuální analýzu dat provést znovu sám. Značné problémy nalézáme též v oblasti barev. Tvůrci grafu se většinou spoléhají na barevné škály navolené přímo nástrojem, které však nejsou vhodné především z hlediska přístupnosti. Části problémů s barvami by se u běžných sloupcových grafů ve vzorku dalo předejít použitím horizontální formy grafu namísto vertikální formy a následným mapováním 86
popisků přímo k datovým prvkům. Opomenutí možnosti černobílé reprodukce a opomenutí poruch barvocitu je ve vzorku též běžné.
6.7. Příklady grafů z diplomových prací
Obr. 23 Koláčový graf z diplomové práce, který mapuje jen jednu hodnotu. Převzato z Brablíková (2011).
Obr. 24 Graf z explorace s neseřazenými hodnotami. Čtenář si musí nad grafem sám provést vlastní analýzu. Převzato z Gřešáková (2013).
87
Obr. 25 Zbytečné použití barev. Výrazná červená navíc poutá pozornost, aniž by to byl záměr tvůrce, a barvy mohou navozovat nechtěné emoce. Převzato z Svobodová (2013).
Obr. 26 Nedostatečné popisky, legendy a vysvětlivky zcela znemožňují čtení grafu. V některých případech, jak bude ukázáno ve studijním materiálu, graf přečíst lze, ale výstupy čtení jsou zcela jiné, než je diplomant zamýšlel. Převzato z Benešová (2013).
88
Obr. 27 Původní graf převedený do odstínů šedi. Při černobílém zobrazení nebo tisku není možné kategorie dle barev efektivně odečítat. Převzato a upraveno z Lichnovská (2011).
Obr. 28 Použití pseudo-3D efektů v grafu. Třetí dimenze nepřidává třetí rozměr dat, jen znemožňuje data správně odečítat. 28 % v přední části působí jinak než 28 % vzadu. Převzato z Benešová (2013).
89
Obr. 29 Zájem o nové služby v informačním centru. Použití nevhodné estetiky. Na ose y neuvedeny jednotky, při čtení grafu tak nevíme, zda se jedná o celkový počet respondentů, nebo procentuální hodnoty. Graf taktéž nepracuje s krátkodobou pamětí, užitím horizontálního rozložení by mohly být hodnoty namapovány přímo k sloupcům. Data též nejsou seřazena tak, jak by to v daném kontextu dávalo smysl. Převzato z Blažejová (2013).
Obr. 30 Neefektivní koláčový graf. Příliš mnoho výsečí a nulová práce s krátkodobou pamětí. Převzato z Otipková (2012).
90
7. Tvorba efektivního grafu v diplomové práci V příloze uvedený návrh studijního materiálu vznikl kritickou analýzou a syntézou praktických60 i teoretických zdrojů. Jejich kritické nahlížení skrze komplexní pohled na vizualizaci a skrze znalosti z oblasti vizuálního vnímání a kognitivní psychologie rozvrhlo finální obsah studijního materiálu. K ilustraci většiny doporučení, pokud to jen bylo možné, bylo využito grafů z diplomových prací, a stejně tak praktické příklady ilustrující aktivní tvorbu grafu pracují s reálnými grafy. Do obsahu materiálu též byly více začleněny některé problémy identifikované v kapitole 6, celkově se ale materiál profiluje komplexněji, a tak je zde např. zmíněna i manipulace s grafy přesto, že k ní v diplomových pracích dle základní analýzy obvykle nedochází. Povědomí o těchto nástrahách vizuální komunikace kvantitativních dat však považuji za nezbytnou součást jakési širší vizualizační gramotnosti. Materiál je přiložen ve verzi určené k přímému použití ve výuce a k tisku. Ve formátu PDF je dostupný na adrese http://material.jdem.cz/. Jazykový styl materiálu je volen spíše volnější, s ohledem na cílovou skupinu se však nemusí za každou cenu vyhýbat odborným výrazům či pojmenovávání teorie stojící za jednotlivými doporučeními. Cílem materiálu je předat čtenáři základní povědomí o informační vizualizaci skrze nejběžnější typy grafů v kontextu diplomové práce, upozornit na možná úskalí a poskytnout soubor doporučení, která zajistí alespoň základní smysluplnost grafu a povedou diplomanty směrem k přemýšlení o grafu jako o silném komunikačním nástroji, tedy směrem k aktivní tvorbě grafu.
60 Zde především zavedené publikace The Wall Street Journal Guide to Information Graphics od Wongové (2010), Show Me the Numbers (2004) Stephena Fewa, Presenting Numbers, Tables and Charts Bigwoodové a Sporeové (2003), Creating More Effective Graphs Naomi Robbinsové (2005) a knihy Stephen M. Kosslyna Elements of Graph Design (1994) a Graph design for the eye and mind (2006).
91
8. Závěr Jak moderní informační společnost prorůstá daty, roste i potřeba jejich vizualizace efektivně číst a též efektivní vizualizace tvořit. Téma efektivní vizuální reprezentace kvantitativních dat, jež bylo v této práci uvedeno, tak bude v následujících letech stoupat na významu a je třeba ho dále zkoumat a diskutovat. Určit, co je z hlediska kognitivních nákladů efektivní, nám v několika málo letech pomohou moderní metody výzkumu mozku a jeho aktivit. Též teoretické koncepty bude díky laicizaci oblasti a širokému spektru užití vizualizace nutné zasazovat do komplexnějších rámců. Za prvního zástupce takových rámců může být považována například zde představená Trifecta. Lze tedy očekávat, že naše představy o efektivitě či neefektivitě různých vlastností vizuálních metafor se budou výhledově stále více zpřesňovat. Různá aplikace těchto zjištění v odlišných kontextech a pod záštitou komplexních modelů bude více než žádaná. I s našimi současnými znalostmi o efektivitě grafů však musíme usilovat o praktickou osvětu. Zde prezentovaný studijní materiál přichází z hlediska zařazení do procesu vzdělávání pozdě: ačkoliv je osvěta na profesní či vysokoškolské úrovni žádaná a měla by k ní svou aplikační částí přispět i tato práce, otevírá se před námi pole osvěty na úrovních nižších, v oblasti středního a základního vzdělávání, kde se grafům a vizuální komunikaci obecně nevěnuje dostatek pozornosti. Jakékoliv snahy zapojit aktivní tvorbu a kritické čtení grafů do vzdělávání na nižších úrovních jsou vítané.
92
Seznam obrázků Obr. 1 Graf vytvořený inženýry ve společnosti Morton Thiokol...........................................................9 Obr. 2 Návrh zobrazení dat dle Tufteho.....................................................................................................10 Obr. 3 Běžné rozložení prvků v klasickém grafu......................................................................................19 Obr. 4 Ilustrace efektivity vizualizace.........................................................................................................25 Obr. 5 Tradiční datový prvek box plotu.....................................................................................................44 Obr. 6 Totožné grafy zobrazené s různou mírou minimalismu..........................................................45 Obr. 7 Čtyři verze sloupcového grafu dle míry minimalismu..............................................................46 Obr. 8 Sloupcový graf s různou mírou data-ink poměru.......................................................................48 Obr. 9 Holmesův graf vyžívající chartjunku...............................................................................................51 Obr. 10 Zapamatovatelnost grafů s ohledem na jejich data-ink poměr.............................................53 Obr. 11 Holmesův graf vyžívající chartjunku.............................................................................................55 Obr. 12 Příklad vizualizace s vysokým lie factorem.................................................................................57 Obr. 13 Manipulovaný graf z vysílání FOX News......................................................................................59 Obr. 14 Ilustrace volby rozsahu dat a jejího vlivu na působení grafu.................................................60 Obr. 15 Ilustrace vlivu volby měřítka na působení grafu.......................................................................60 Obr. 16 Trojsložkový model mozku dle Atkinsona a Shiffrina.............................................................69 Obr. 17 Tabulky čísel ilustrující předpozornostní atributy....................................................................71 Obr. 18 Ilustrace percepční segregace. .......................................................................................................72 Obr. 19 Ilustrace zákonů gestaltismu..........................................................................................................74 Obr. 20 Ukázka práce s limity krátkodobé paměti..................................................................................75 Obr. 21 Percepční efekt kontextu na vnímání barev. .............................................................................76 Obr. 22 Simulace barevného spektra...........................................................................................................77 Obr. 23 Koláčový graf z diplomové práce..................................................................................................87 Obr. 24 Graf z explorace s neseřazenými hodnotami............................................................................87 Obr. 25 Zbytečné použití barev....................................................................................................................88 Obr. 26 Nedostatečné popisky, legendy a vysvětlivky............................................................................88 Obr. 27 Původní graf převedený do odstínů šedi.....................................................................................89 Obr. 28 Použití pseudo-3D efektů v grafu..................................................................................................89 Obr. 29 Zájem o nové služby v informačním centru..............................................................................90 Obr. 30 Neefektivní koláčový graf................................................................................................................90 93
Seznam tabulek Tab. 1 Prolínání terminologie komponent u vybraných autorů..........................................................18 Tab. 2 Četnosti jednotlivých typů grafu ve vzorku..................................................................................84
94
Bibliografické citace ABELA, Andrew, 2006. Choosing a good chart. In: The Extreme Presentation Method [online]. [cit. 2014-10-08]. Dostupné z: http://extremepresentation.typepad.com/blog/2006/09/choosing _a_good.html AINLEY, Janet, Elena NARDI a Dave PRATT, 2000. The construction fo meanings for trend in active graphing. International Journal of Computers for Mathematical Learning. Vol. 5, issue 2, s. 85-114. DOI: 10.1023/A:1009854103737. AINLEY, Janet a Carlos MONTEIRO, 2008. Comparing curricular approaches for statistics in primary school in England and Brazil: a focus on graphing. In: Joint Study of International Commission on Mathematical Instruction and International Association for Statistical Education: Teaching Statistics in School Mathematics. Proceedings of the ICMI study. Washington, DC: Mathematical Association of America, s. 18-23. ALDRICH, F. a L. SHEPPARD, 2000. Graphicacy: the fourth ‘R’?. Primary Science Review. Č. 64, s. 8-11. Dostupné z: http://www.lifesci.sussex.ac.uk/reginald-phillips/graphicacyPaper.pdf BATEMAN, Scott et al., 2010. Useful junk?: The Effects of Visual Embellishment on Comprehension and Memorability of Charts. Proceedings of the 28th international conference on Human factors in computing systems - CHI '10. New York, New York, USA: ACM Press, s. 2573-2582. DOI: 10.1145/1753326.1753716. BEATTIE, Vivien a Michael John JONES, 1992. The Use and Abuse of Graphs in Annual Reports: Theoretical Framework and Empirical Study. Accounting and Business Research. Vol. 22, issue 88, s. 291-303. DOI: 10.1080/00014788.1992.9729446. Dostupné z: http://www.tandfonline. .com/doi/abs/10.1080/00014788.1992.9729446
95
BEATTIE, Vivien a Michael John JONES, 2002. The Impact of Graph Slope on Rate of Change Judgments in Corporate Reports. Abacus. 2002, vol. 38, issue 2, s. 177-199. DOI: 10.1111/14676281.00104. Dostupné z: http://doi.wiley.com/10.1111/1467-6281.00104 BERÁNKOVÁ, Růžena, 2010. Vizuální komunikace a vizuální gramotnost mimo oblast výtvarné výchovy. Brno. Dostupné z: http://is.muni.cz/th/94001/pedf_r/. Rigorózní práce. Masarykova univerzita. Pedagogická fakulta. Učitelství pro střední školy. BERTIN, Jacques, 2010. Semiology of graphics: diagrams, networks, maps. 1st ed. Redlands, Calif.: Ingram Publisher Services, xv., 438 p. ISBN 978-158-9482-616. BEVEREN, Tom Van, 2012. A quick introduction to colorblindness. In: We are Colorblind [online]. [cit. 2014-11-04]. Dostupné z: http://wearecolorblind.com/article/a-quick-introductionto-color-blindness/ BIGWOOD, Sally a Melissa SPORE, 2003. Presenting numbers, tables, and charts. Oxford: Oxford University Press, 128 p. ISBN 01-986-0722-9. BLASIO, Anthony J. a Ann M. BISANTZ, 2002. A comparison of the effects of data–ink ratio on performance with dynamic displays in a monitoring task. International Journal of Industrial Ergonomics. Vol. 30, issue 2, s. 89-101. DOI: 10.1016/S0169-8141(02)00074-4. BORGO, R., 2012. et al An Empirical Study on Using Visual Embellishments in Visualization. IEEE Transactions on Visualization and Computer Graphics. Vol. 18, issue 12, s. 2759-2768. DOI: 10.1109/TVCG.2012.197. BORKIN, Michelle A. et al., 2013. What Makes a Visualization Memorable? IEEE Transactions on Visualization and Computer Graphics. Vol. 19, issue 12, s. 2306-2315. DOI: 10.1109/TVCG.2013.234. BORTOLI, Mario De a Jesús MAROTO, 2001. Colours Across Cultures: Translating Colours in Interactive Marketing Communications [online]. Granada, Spain: Global Propaganda [cit. 201411-04]. Dostupné z: http://globalpropaganda.com/articles/TranslatingColours.pdf
96
BRINTON, Willard C., 1914. Graphic Methods for Presenting Facts. 1st ed. New York: The Engineering Magazine Company, 371 s. BRINTON, Willard C. et al., 1915. Joint Committee on Standards for Graphic Presentation. Publications of the American Statistical Association. Vol. 14, issue 112, s. 790-797. DOI: 10.2307/2965153. CAIRO, Alberto, 2013. The functional art: an introduction to information graphics and visualization. Berkeley, CA: New Riders, 363 pages. ISBN 03-218-3473-9. CAMOES, Jorge, 2009. Can Edward Tufte Do Business Charts? ExcelCharts [online]. [cit. 2014-10-08]. Dostupné z: http://www.excelcharts.com/blog/can-edward-tuftedo-business-charts/ CAMOES, Jorge, 2013. A classification of chart types. ExcelCharts [online]. [cit. 2014-10-08]. Dostupné z: http://www.excelcharts.com/blog/classification-chart-types CARD, Stuart K., Jock D. MACKINLAY a Ben SHNEIDERMAN, 1999. Readings in information visualization: using vision to think. San Francisco, California: Morgan Kaufmann Publishers, 686 s. ISBN 15-586-0533-9. CARPENDALE, M. S. T., 2003. Considering visual variables as a basis for information visualisation. Computer Science. Issue 1. Dostupné z: http://dspace.ucalgary.ca/jspui/handle/ 1880/45758 CARSWELL, Melody C., Sylvia FRANKERBERGER a Donald BERNHARD, 1991. Graphing in depth: perspectives on the use of three-dimensional graphs to represent lower-dimensional data. Behaviour. Vol. 10, issue 6, s. 459-474. DOI: 10.1080/01449299108924304. CLEVELAND, William S. a Robert MCGILL, 1984. Graphical Perception: Theory, Experimentation, and Application to the Development of Graphical Methods. Journal of the American Statistical Association. Vol. 79, issue 387, s. 531-554. DOI: 10.1080/01621459.1984. .10478080.
97
CLEVELAND, William S., 1994. The elements of graphing data. Rev. ed. Murray Hill, N.J.: AT, 297 p. ISBN 09-634-8841-4. COURTIS, John K., 1997. Corporate Annual Report Graphical Communication in Hong Kong: Effective or Misleading?. Journal of Business Communication. Vol. 34, issue 3, s. 269-284. DOI: 10.1177/002194369703400304. CROXTON, Frederick E. a Roy E. STRYKER, 1927. Bar Charts versus Circle Diagrams. Journal of the American Statistical Association. Vol. 22, issue 160, s. 473-482. DOI: 10.1080/ /01621459.1927.10502976. CUDO, 2014. Color Universal Design Organization: English pages [online]. Tokyo, Japan: CUDO [cit. 2014-11-04]. Dostupné z: http://www.cudo.jp/summary/cudo_e CUKIER, Jerome, 2011. Promising difficulties. In: Jerome Cukier: Communicating with data [online]. [cit. 2014-11-01]. Dostupné z: http://www.jeromecukier.net/blog/2011/11/13/promisingdifficulties/ DREYFUS, T. a T. EISENBERG, 1990. On difficulties with diagrams: Theoretical issues. In: Proceedings of the 14th Annual Conference of the International Group for the Psychology of Mathematics Education. vol. 1. Oaxtepex: PME, s. 27-36. DRUCKER, Johanna, 2014. Graphesis: visual forms of knowledge production. Harvard: Harvard University Press, 213 s. ISBN 978-067-4724-938. DUARTE, Nancy, 2014. The Quick and Dirty on Data Visualization. In: Harvard Business Review [online]. [cit. 2014-11-01]. Dostupné z: http://blogs.hbr.org/2014/04/the-quick-and-dirty-on-datavisualization/ DVOŘÁKOVÁ, Jana et al., 2013. Standardy pro základní vzdělávání: Matematika a její aplikace. [cit. 2014-10-27], 48 s. Dostupné z: http://clanky.rvp.cz/wpcontent/upload/prilohy/17383/matematika_a_jeji_aplikace.pdf
98
EELLS, Walter C., 1926. The Relative Merits of Circles and Bars for Representing Component Parts. Journal of the American Statistical Association. Volume 21, Issue 154. DOI: 10.1080/ /01621459.1926. EYSENCK, Michael W a Mark T KEANE, 2008. Kognitivní psychologie. Vyd. 1. Praha: Academia, 748 s. ISBN 978-80-200-1559-4. FEW, Stephen, 2004. Show me the numbers: designing tables and graphs to enlighten. Oakland, Calif.: Analytics Press, xii, 269 p. ISBN 09-706-0199-9. FEW, Stephen, 2009. Sometimes We Must Raise Our Voices. In: Visual Business Intelligence Newsletter [online]. [cit. 2014-10-26]. Dostupné z: http://www.perceptualedge.com/articles/ visual_business_intelligence/sometimes_we_must_raise_our_voices.pdf FEW, Stephen, 2011a. The Chartjunk Debate: A Close Examination of Recent Findings. In: Visual Business Intelligence Newsletter [online]. [cit. 2014-10-27]. Dostupné z: http://www.perceptualedge.com/articles/visual_business_intelligence/the_chartjunk_debate.pdf FEW, Stephen, 2011b. Benefitting InfoVis with Visual Difficulties?: Provocation Without a Cause. In: Visual Business Intelligence Newsletter [online]. [cit. 2014-10-27]. Dostupné z: http://www.perceptualedge.com/articles/visual_business_intelligence/visual_difficulties.pdf FEW, Stephen, 2013a. Chart Junk: A Magnet for Misguided Research. In: Visual Business Intelligence: A blog by Stephen Few [online]. [cit. 2014-10-27]. Dostupné z: http://www.perceptualedge.com/blog/?p=1770 FEW, Stephen, 2013b. A Pie in the Face for Information Visualization Research. In: Visual Business Intelligence: A blog by Stephen Few [online]. [cit. 2014-11-01]. Dostupné z: http://www.perceptualedge.com/blog/?p=1492 FRIENDLY, Michael, 2008. A Brief History of Data Visualization. Handbook of Data Visualization. Berlin, Heidelberg: Springer Berlin Heidelberg, s. 15. ISBN 978-3-540-33036-3; 10.1007/978-3-54033037-0_2.
99
FUNG, Kaiser, 2014. Junk Charts Trifecta Checkup: The Definitive Guide. In: Junk Charts [online]. 2014 [cit. 2014-09-30]. Dostupné z: http://junkcharts.typepad.com/junk_charts/junkcharts-trifecta-checkup-the-definitive-guide.html GANTZ, John a David REINSEL, 2012. The Digital Universe in 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East. IDC [cit. 2014-09-30], 16 s. Dostupné z: http://www.emc.com/collateral/analyst-reports/idc-the-digital-universe-in-2020.pdf GIBSON, James J., 1986. The ecological approach to visual perception. New York: Psychology Press, 332 s. ISBN 978-089-8599-596. GEMIGNANI, Zach, 2009. A Guide to Creating Dashboards People Love to Use. In: Dashboard Insight [online]. [cit. 2014-11-23]. Dostupné z: http://www.dashboardinsight.com/articles/ digital-dashboards/fundamentals/a-guide-to-creating-dashboards-people-love-to-use-part3.aspx?page=6 HARRIS, Robert L., 1996. Information graphics: a comprehensive illustrated reference. Management Graphics: Georgia, 448 s. ISBN 978-0-19-513532-9. HEKKERT, P., D. SNELDERS a P. C. Van WIERINGEN, 2003. 'Most advanced, yet acceptable': typicality and novelty as joint predictors of aesthetic preference in industrial design. British journal of psychology. Vol. 94, Iss. 1, s. 111-124. HOLMES, Nigel, 1984. Designer's Guide to Creating Charts and Diagrams. 1st ed. New York: Watson-Guptill, 192 s. ISBN 978-0823013388. HOLMES, Nigel a Steven HELLER, 2006. Nigel Holmes: on information design. New York: Jorge Pinto Books, xviii, 121 p. ISBN 978-097-7472-406. HOLMES, Nigel, 2014. Nigel Holmes on using humor to illustrate data that tells a story. In: AIGA [online]. [cit. 2014-11-01]. Dostupné z: http://www.aiga.org/Nigel-Holmes-on-UsingHumor-to-Illustrate-Data-That-Tells-a-Story/
100
HULLMAN, J., E. ADAR a P. SHAH, 2011. Benefitting InfoVis with Visual Difficulties. IEEE Transactions on Visualization and Computer Graphics. Vol. 17, issue 12, s. 2213-2222. DOI: 10.1109/ /TVCG.2011.175. INBAR, Ohad, Noam TRACTINSKY a Joachim MEYER, 2007. Minimalism in information visualization: attitudes towards maximizing the data-ink ratio. Proceedings of the 14th European conference on Cognitive ergonomics: invent! explore!. New York: ACM, s. 185-188. Dostupné z: http://dl.acm.org/citation.cfm?id=1362587 JENSEN, Eric, 2008. Brain-based learning: the new paradigm of teaching. 2nd ed. Thousand Oaks, CA.: Corwin Press, xvi, 266 p. ISBN 9781412962568. JOHNSON, J.R., R.R . RICE a R.A. ROEMMICH, 1980. Pictures That Lie: The Abuse of Graphs in Annual Reports. Management Accounting. Iss. 10, s. 50-56. KAHNEMAN, Daniel, 2012. Myšlení, rychlé a pomalé. Brno: Jan Melvil, 544 s. ISBN 978-80-87270-42-4. KARSTEN, Karl G., 1923. Charts and Graphs: An Introduction to Graphic Methods in the Control and Analysis of Statistics. New York: Prentice-Hall. KLAŠKA, Michal, 2008. Vliv barvy uživatelského rozhraní na pracovní výkon uživatele. Brno. Bakalářská práce. Masarykova univerzita. Fakulta sociálních studií. Mediální a komunikační studia. KOSARA, Robert, 2010. Chart Junk Considered Useful After All. In: Eagereyes: Visualization and Visual Communication [online]. [cit. 2014-11-01]. Dostupné z: https://eagereyes.org/criticism/ chart-junk-considered-useful-after-all KOSARA, Robert, 2013. A Better Definition of Chart Junk. In: Eagereyes: Visualization and Visual Communication [online]. [cit. 2014-11-01]. Dostupné z: https://eagereyes.org/blog/2013/ definition-chart-junk
101
KOSSLYN, Stephen Michael, 1989. Understanding Charts and Graphs. Applied Cognitive Psychology. Vol. 3, s. 185-226. KOSSLYN, Stephen Michael, 1994. Elements of graph design. New York: W.H. Freeman, xi, 309 p. ISBN 07-167-2362-X. KOSSLYN, Stephen Michael, 2006. Graph design for the eye and mind. New York: Oxford University Press, xii, 290 p. ISBN 978-0195311846. KUČEROVÁ, Helena, 2003. Vizualizace informací. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR. [cit. 2014-1009]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000000138 &local_base=KTD. LEVY, Ellen et al., 1996. Gratuitous graphics? Putting preferences in perspective. In: Proceedings of the SIGCHI conference on Human factors in computing systems common ground - CHI '96. New York, New York, USA: ACM Press, s. 42-49. ISBN 0897917774. DOI: 10.1145/238386.238400. LI, H. a N. MOACDIEH, 2014. Is "chart junk" useful? An extended examination of visual embellishment. In: Proceedings of the Human Factors and Ergonomics Society Annual Meeting. Santa Monica, CA: HFES, s. 1516-1520. ISSN 1541-9312. DOI: 10.1177/1541931214581316. LIN, Sharon et al., 2013. Selecting Semantically-Resonant Colors for Data Visualization. Computer Graphics Forum. Vol. 32, 3pt4, s. 401-410. DOI: 10.1111/cgf.12127. MACKINLAY, Jock, 1986. Automating the design of graphical presentations of relational information. ACM Transactions on Graphics. Vol. 5, issue 2, s. 110-141. DOI: 10.1145/22949.22950. MAGNELLO, Eileen, 2010. Florence Nightingale: The compassionate statistician. In: +plus magazine [online]. [cit. 2014-11-01]. Dostupné z: http://plus.maths.org/content/florencenightingale-compassionate-statistician
102
MATHER, Paul, Alan RAMSAY a Alan SERRY, 1996. The Use and Representational Faithfulness of Graphs in Annual Reports: Australian Evidence. Australian Accounting Review. Vol. 6, issue 12, s. 56-63. DOI: 10.1111/j.1835-2561.1996.tb00017.x. MAZZA, Riccardo, 2009. Introduction to information visualization. London: Springer, xviii, 139 p. ISBN 978-184-8002-197. MCLEOD, Kari S., 2000. Our sense of Snow: the myth of John Snow in medical geography. Social Science. Vol. 50, 7-8, s. 923-935. DOI: 10.1016/S0277-9536(99)00345-7. Dostupné z: http://linkinghub.elsevier.com/retrieve/pii/S0277953699003457 MONTEIRO, Carlos E. Ferreira a Márcia M. Fusaro PINTO, 2005. Challenges facing the teaching of mathematics student teachers. In: 5th ICMI Study Conference: The Professional Education and Development of Teachers of Mathematics. Brazílie: ICMI, s. 15-20. MYERS, Seth, 2009. A quantitative content analysis of errors and inaccuracies in Missouri newspaper information graphics. Missouri. Magisterská práce. Faculty of Arts. University of Missouri-Columbia. ORZEL, Chad, 2009. Why Does Excel Suck So Much?. In: Science Blogs: Uncertain Principles [online]. [cit. 2014-11-01]. Dostupné z: http://scienceblogs.com/principles/2009/03/18/why-doesexcel-suck-so-much/ PANDEY, Anshul Vikram et al., 2014. The Persuasive Power of Data Visualization.
IEEE
Transactions on Visualization and Computer Graphics. Iss. 1, s. 1-10. DOI: 10.1109/ /TVCG.2014.2346419. PECK, Evan M. et al., 2013. Using fNIRS brain sensing to evaluate information visualization interfaces. In: Proceedings of the SIGCHI Conference on Human Factors in Computing Systems CHI '13. New York, New York, USA: ACM Press, s. 473-482. ISBN 9781450318990. DOI: 10.1145/2470654.2470723.
103
PENROSE, John M., 2008. Annual Report Graphic Use: A Review of the Literature. Journal of Business Communication. Vol. 45, issue 2, s. 158-180. DOI: 10.1177/0021943607313990. PLAYFAIR, William, 1786. The Commercial and Political Atlas: Representing, by Means of Stained Copper-Plate Charts, the Progress of the Commerce, Revenues, Expenditure and Debts of England during the Whole of the Eighteenth Century. London: b.n. via PLAYFAIR, William, 2005. Commercial and political atlas and Statistical breviary. New York: Cambridge University Press. ISBN 05-218-5554-3. PLHÁKOVÁ, Alena, 2006. Dějiny psychologie. Vyd. 1. Praha: Grada, 328 s. Psyché. ISBN 978-80-247-0871-3. PLOSKOTOVÁ, Petra, 1987. Svět barev. Praha: Albatros, 1987, 199 s. PRATT, D., 1995. Young children's active and passive graphing. Journal of Computer Assisted Learning. Vol. 11, issue 3, s. 157-169. DOI: 10.1111/j.1365-2729.1995.tb00130.x. ROBBINS, Naomi B., 2005. Creating more effective graphs. Hoboken, N.J.: Wiley-Interscience, xviii, 402 p. ISBN 04-712-7402-X. ROBERTSON, Bruce, 1988. How to Draw Charts & Diagrams. Cincinnati, Ohio: North Light Books, 192 s. ISBN 978-0788163531. ROBINSON, Wade et al.. 2002. Representation and misrepresentation: Tufte and the Morton Thiokol engineers on the Challenger. Science and Engineering Ethics. Vol. 8, issue 1, s. 59-81. DOI: 10.1007/s11948-002-0033-2. RUOHONEN, Keijo, 2014. Keijo Ruohonen: Home Page [online]. [cit. 2014-10-07]. Dostupné z: http://math.tut.fi/~ruohonen/english.html SEDLACK, Robert P., Barbara Lynne SHWOM a Karl P. KELLER, 2009. Graphics and visual communication for managers. 2nd ed. Mason, Ohio: South-Western Cengage Learning, xxi, 106 p. ISBN 03-245-8418-0.
104
SCHMID, Calvin F., 1954. Handbook of Graphic Presentation. New York: Ronald Press Company, 316 s. SIEGRIST, Michael, 2010. The use or misuse of three-dimensional graphs to represent lowerdimensional data. Behaviour. Vol. 15, issue 2, s. 96-100. DOI: 10.1080/014492996120300. SPENCE, Ian a Howard WAINER, 1997. Who Was Playfair?. Chance. Roč. 10, č. 1, s. 35-37. SPENCE, Ian, 2005. No Humble Pie: The Origins and Usage of a Statistical Chart. Journal of Educational and Behavioral Statistics. Vol. 30, issue 4, s. 353-368. DOI: 10.3102/ /10769986030004353. SPENCE, Robert, 2006. Information Visualization: Design for Interaction. 2nd ed. New Yersey: Prentice Hall, 304 s. ISBN 978-0132065504. STEINBART, P.J., 1989. The Auditor’s Responsibility for the Accuracy of Graphs in Annual Reports: Some Evidence of the Need for Additional Guidance. Accounting Horizons. American Accounting Association, č. 7, s. 60-70. STERNBERG, Robert J., 2002. Kognitivní psychologie. Vyd. 1. Praha: Portál, 636 s. ISBN 80-717-8376-5. SYNEK, Svatopluk a Šárka SKORKOVSKÁ, 2014. Fyziologie oka a vidění. 2., doplň. a přeprac. vyd. Praha: Grada, 108 s. ISBN 978-802-4739-922. TAL, A. a B. WANSINK, 2014. Blinded with science: Trivial graphs and formulas increase ad persuasiveness and belief in product efficacy.
Public Understanding of Science.
Publikováno online před tiskem. DOI: 10.1177/0963662514549688. Dostupné z: http://pus. .sagepub.com/cgi/doi/10.1177/0963662514549688 TRIGLAV, Jure, 2014. Standards for Scientific Graphic Presentation. In: Jure Triglav [online]. [cit. 2014-11-23]. Dostupné z: http://www.juretriglav.si/standards-for-graphic-presentation/
105
TUCK, Michael, 2010. Gestalt Principles Applied in Design. In: Six Revisions [online]. [cit. 201411-17]. Dostupné z: http://sixrevisions.com/web_design/gestalt-principles-applied-in-design/ TUFTE, Edward R., 1983. The visual display of quantitative information. 1st ed. Cheshire: Graphics Press, 197 s. ISBN 978-0-9613921-4-7. TUFTE, Edward R., 1997. Visual explanations: images and quantities, evidence and narrative. Cheshire, Conn.: Graphics Press, 156 p. ISBN 09-613-9212-6. WAINER, Howard, 1997. Visual revelations: graphical tales of fate and deception from Napoleon Bonaparte to Ross Perot. Mahwah: Lawrence Erlbaum. ISBN 978-080-5838-787. WAKEFIELD, Robin, 2009. How to Create a Professional Chart using Excel 2007. In: Office Blogs [online]. [cit. 2014-10-26]. Dostupné z: http://blogs.office.com/2009/02/24/how-to-create-aprofessional-chart-using-excel-2007/ WALLGREN, Anders, et al., 1996. Graphing statistics: creating better charts. Thousand Oaks, Calif.: Sage Publications, 94 p. ISBN 07-619-0599-5. WARE, Colin, 2012. Information visualization: perception for design. 3rd ed. Burlington, Mass.: Morgan Kaufmann, xx, 512 pages. ISBN 978-012-3814-647. WICKHAM, Hadley, 2013. Graphical Criticism: Some Historical Notes. Journal of Computational and Graphical Statistics. Roč. 22, č. 1. DOI: 10.1080/10618600.2012.761140. WONG, Dona M., 2010. The Wall Street journal guide to information graphics: the dos and don'ts of presenting data, facts, and figures. 1st ed. New York: W. W. Norton, 157 p. ISBN 03-930-7295-9. YAU, Nathan, 2013. Data points: visualization that means something. 1st ed. Indianapolis: Wiley, 320 s. ISBN 11-184-6219-X. ZACKS, Jeff et al., 1999. Graphs in Print. [cit. 2014-10-07]. Dostupné z: http://dcl.wustl.edu/pubs/ZacksGIP.pdf
106
ZELANSKI, Paul a Mary Pat FISHER, 2010. Color. 6th ed. Upper Saddle River, N.J.: Prentice Hall, 200 s. ISBN 978-020-5635-603.
107
Zdroje převzatých grafů61 BRABLÍKOVÁ, Kamila. Informační akademie: mimoškolní vzdělávání dospělých v Knihovně Kroměřížska. Brno, 2011. Bakalářská diplomová práce. Masarykova univerzita. Filozofická fakulta. Ústav české literatury a knihovnictví. Kabinet informačních studií a knihovnictví. Vedoucí práce Mgr. Daniela Hebnarová. GŘEŠÁKOVÁ, Vanda. Výzkum využívanosti citačních stylů na filozofických fakultách Univerzity Karlovy, Západočeské univerzity, Univerzity Palackého a Ostravské univerzity. Brno, 2013. Diplomová práce. Masarykova univerzita, Filozofická fakulta, Kabinet informačních studií a knihovnictví. Vedoucí práce PhDr. Martin Krčál, DiS. SVOBODOVÁ, Lucie. Nelegální stahování e-knih v ČR: analýza současné situace a výzkum mezi studenty MU. Brno, 2013. Magisterská diplomová práce. Masarykova univerzita, Filozofická fakulta, Kabinet informačních studií a knihovnictví. Vedoucí práce PhDr. Martin Krčál, Dis. BENEŠOVÁ, Dagmar. Potřeba a přínos praxí pro studenty oboru Informační studia a knihovnictví v oblasti komerční sféry. Brno, 2013. Magisterská diplomová práce. Masarykova univerzita, Filozofická fakulta, Kabinet Informačních studií a knihovnictví. Vedoucí práce PhDr. Petr Škyřík, Ph.D. BLAŽEJOVÁ, Michaela. Středoškolská knihovna jako součást vzdělávacího procesu i života školy. Brno, 2013. Bakalářská diplomová práce. Masarykova univerzita. Filozofická fakulta. Kabinet informačních studií a knihovnictví. Vedoucí práce Mgr. Pavlína Mazáčová, Ph.D. LICHNOVSKÁ, Pavla. Hodnocení kvality a přínosu e-learningu se zaměřením na kurz eLKA. Brno, 2011. Magisterská diplomová práce. Masarykova univerzita. Filozofická fakulta. Kabinet informačních studií a knihovnictví. Vedoucí diplomové práce Mgr. Jiří Zounek, Ph.D. 61 Řazeny dle výskytu v diplomové práci a studijním materiálu.
108
OTIPKOVÁ, Lenka. Postoje k Open Access v ČR a ve střední Evropě: sekundární analýza dat SOAP. Brno, 2012. Bakalářská diplomová práce. Masarykova univerzita. Filozofická fakulta. Ústav české literatury a knihovnictví. Kabinet informačních studií a knihovnictví. Vedoucí práce PhDr. Ladislava Suchá. SRBECKÁ, Gabriela. Informační potřeby žen na mateřské dovolené. Brno, 2011. Bakalářská diplomová práce. Masarykova univerzita. Filozofická fakulta. Ústav české literatury a knihovnictví. Kabinet informačních studií a knihovnictví. Vedoucí práce Mgr. Martin Krčál. BÁRNETOVÁ, Pavla. Význam benchmarkingového měření pro vybrané veřejné knihovny: zaměřené na parametry související s poskytováním služeb. Brno, 2012. Bakalářská diplomová práce. Masarykova univerzita. Filozofická fakulta. Ústav české literatury a knihovnictví. Kabinet informačních studií a knihovnictví. Vedoucí práce Mgr. Zdeňka Dohnálková. ŠTRUNCOVÁ, Kateřina. Třídění v elektronickém systému veřejné správy. Brno, 2011. Bakalářská diplomová práce. Masarykova univerzita. Filozofická fakulta. Ústav české literatury a knihovnictví. Kabinet informačních studií a knihovnictví. Vedoucí práce Ing. Zdeněk Kadlec, Dr. KADANÍKOVÁ, Lada. Výzkum spokojenosti uživatelů Městské knihovny v Jevíčku. Brno, 2013. Bakalářská diplomová práce. Masarykova univerzita. Filozofická fakulta. Ústav české literatury a knihovnictví. Kabinet informačních studií a knihovnictví. Vedoucí práce PhDr. Ladislava Zbiejczuk Suchá. MÁJKOVÁ, Lucie. Metody kontroly a omezení přístupu k ICT v knihovnách. Brno, 2013. Magisterská diplomová práce. Masarykova univerzita. Filozofická fakulta. Ústav české literatury a knihovnictví. Kabinet informačních studií a knihovnictví. Vedoucí práce PhDr. Pavla Kovářová.
109
Příloha I. Návrh studijního materiálu
110
Tvorba efektivních grafů Doporučení pro diplomovu práci
Takhle efektivní graf nevypadá. Nejasné sdělení, nevhodná forma, 3D efekty, špatně zvolené barvy, slabé umístění legendy, barevná pozadí a stíny. S tím vším se v tomto studijním materiálu popereme.
Již od vzniku prvních grafů v 18. století víme, že jsou silnými nástroji ke komunikaci dat a že dokáží čísla a vztahy mezi nimi ukázat mnohem efektivněji, než prosté tabulky. Stačí hodnoty graficky zobrazit, tedy převést je například do výšky sloupců, a vztahy i trendy dosud ukryté v číslech hned zřetelně vidíme a můžeme je efektivně prezentovat dál. Až tak jednoduché to ovšem není. Podobně jako se učíme psát akademicky správný text, tedy text přesný jasný a stručný, se musíme naučit vytvářet správně i grafy, aby je čtenáři našich výzkumů a diplomek dokázali rychle a správně pochopit. Úroveň grafů v diplomových pracích zatím obecně není nejlepší. Mohou za to z části softwarové nástroje, jež k tvorbě grafů užíváme a které nikdy nebyly určeny
Všechna prezentovaná doporučení lze samozřejmě
k vytváření akademických grafů, a z části skutečnost, že jsou grafy a vlastně efek-
aplikovat v běžně používaných
tivní grafická komunikace jako celek jen vzácně součástí studijních osnov. Grafy
procesorech, jen budeme
bezmyšlenkovitě vytvářené např. v kancelářském tabulkovém procesoru Excel totiž ani trochu neaplikují naše dosavadní znalosti z oblasti výzkumu lidského zraku, vizuálního vnímání a efektivní grafické komunikace kvantitativních dat. V tomto studijním materiálu se proto na grafy podíváme podrobněji a prakticky si ukážeme, jak ty úplně nejjednodušší vytvářet smysluplně. A protože jde o diplomky, ukážeme si některé nešvary na skutečných příkladech z diplomových prací.
1 Tvorba efektivních grafů
kancelářských tabulkových muset přestat spoléhat na jejich automatické výstupy a s neefektivními grafy si dát trochu více práce.
1. Smysl grafu Graf v diplomové práci není jen povinnou ilustrací textu. Dříve než začneme tvořit graf, měli bychom si položit jednoduchou otázku: co vlastně chceme sdělit? K čemu jsme analýzou dat došli a co hodláme čtenáři předat? Odpověď na tuto otázku pak určuje všechny další kroky a zajistí nám, že graf, který vytvoříme, bude dávat smysl. Následující podotázky nám s tím pomohou.
Kdy použít graf a kdy raději tabulku? Graf sice dokáže čísla a jejich vztahy komunikovat efektivněji než tabulky, není však nutné ho používat úplně všude, kde o číslech mluvíme. Jedním z prvních neduhů některých výzkumných diplomek je právě nadužívání grafu. Ke každé otázce z dotazníku nemusí být v práci nutně jak tabulka, tak i graf. V některých případech je totiž tabulka nebo prosté textové sdělení plně dostačující. Tabulku používáme všude tam, kde chceme sdělit přesné hodnoty nebo kde je hodnot málo. Graf naopak ukazuje lépe vztahy mezi hodnotami a je často vhodnější např. k porovnávání více datových řad, tedy pokud je sdělení obsaženo spíš v tzv. tvaru dat (např. pády a vzestupy linie ve spojnicovém grafu) a v porovnávání hodnot (např. mezi sloupci) než v samotných přesných hodnotách.
Graf použitý k zobrazení přesných hodnot. Velký zmatek, který neříká ale vůbec nic. Místo něho by bylo v této podobě vhodnější použít tabulku.
2 Tvorba efektivních grafů
Graf také není nutné používat tam, kde v něm ukazujeme jen několik málo hodnot, např. jedno nebo dvě čísla. Jedno číslo obvykle nedává smysl vizualizovat. Dvě hodnoty jsou na zvážení. Pokud existuje např. značný nepoměr mezi pohlavím respondentů, koláčový graf tuto informaci předá rychle a efektivně. Pokud je však respondentů mužů i žen podobně, stačí takovou informaci obvykle uvést v prosté větě a šetřit si barevný inkoust.
Koláčový graf, který mapuje jen jedno číslo. Takový graf nedává příliš smysl. Výsledek analýzy hodnocení by bylo možné shrnout v textu. A k těm 3D efektům se ještě dostaneme.
Jaký typ grafu mám zvolit? Sloupcový graf slouží hlavně ke zobrazování a porovnávání hodnot pro různé, většinou nespojité nominální a ordinální kategorie (např. počet výpůjček podle různých literárních žánrů). Sloupcový graf přestavuje nejzákladnější způsob vizualizace a patří i v diplomkách nepřekvapivě k těm nejpoužívanějším. Kromě obyčejného sloupcového můžeme v některých případech využít i jeho podtypy: skupinový a skládaný sloupcový graf. Skupinový sloupcový graf nám umožňuje navíc zobrazovat další dimenzi dat, kterou jsou podskupiny jednotlivých hlavních kategorií. Skládaný sloupcový graf nám pak umožňuje totéž, ovšem hodí se pro případy, kdy podskupiny dohromady tvoří celou hlavní kategorii — takže sloupce tu skládáme nad sebe. Vždy je nutné přemýšlet, zda jsme zvolili správný typ grafu a zda odpovídá tomu, co říkají data a co vlastně chceme sdělit. Koláčový graf zobrazuje procentuální podíl z celku pomocí výsečí. Ve vizualizační komunitě platí za poněkud kontroverzní základní typ grafu. Ačkoliv mu v diplomkách náleží v užívanosti druhé místo, odborníci se už přes sto let dohadují, zda je
3 Tvorba efektivních grafů
vhodné koláčový graf vůbec brát v úvahu a zda by nebylo lepší ho zakázat. Veškeré dohady pramení hlavně ze skutečnosti, že jde o velmi omezenou formu vizuální komunikace dat a musíme si dávat pozor, abychom koláče nezahltily mnoha daty. Na to už pak většinou nestačí. K doporučením, kdy koláče používat a jak je vytvářet, aby byly funkční, se vrátíme později. Spojnicový graf je vlastně soubor vynesených datových bodů/hodnot, tzv. markerů, spojených linií/spojnicí, díky které můžeme jednoduše vnímat růsty, poklesy a výkyvy v datech. Většinou se používá ke zobrazování datových řad v rámci určitého časového úseku. Takže např. data o ceně registrace v knihovně za posledních deset let nebo data zaznamenávající vývoj počtu čtenářů knihovny XY mezi lety 2000 až 2010 o spojnicový graf přímo žadoní. Samozřejmě bychom je mohli zobrazit i pomocí sloupcového grafu, díky spojnicím mezi body však bude mnohem jasněji vidět, že jde o vývoj jedné proměnné. Tyto tři základní typy grafů samozřejmě nejsou vše, co vizualizace nabízí. Existuje
Že je názor nezaujatého čte-
mnoho ustálených typů vhodných pro různé druhy dat nebo pro různé způsoby
náře nejlepší zpětnou vazbou
jejich pokročilejší analýzy. Ačkoliv existují poučky, kdy zvolit který typ, a můžete
ví i projekt HelpMeViz
využít např. nástrojů jakygraf1.jdem.cz nebo jakygraf2.jdem.cz, nejdůležitějším
kde vám odborníci i laici
(www.helpmeviz.com),
hlediskem nakonec stejně zůstává, zda výsledný graf říká přesně to, co z naší ana-
zdarma poskytnou zpětnou
lýzy vyšlo a co jsme chtěli sdělit. Není proto jednodušší kontrolou smyslu grafu,
hou s jejich úpravami.
než ho někomu ukázat a požádat o jeho nezaujatou interpretaci. Pokud se informace, kterou z grafu získá kontrolní osoba shoduje s tím, co jsme chtěli a měli říct, zvolili jsme správnou formu.
Mám použít jeden nebo více grafů? Především u liniových grafů se někdy stává, že je v něm už tolik dat a spojnic, že je nelze efektivně číst a graf tak přestane dávat smysl. V textu zůstává jako barevná přehlídka čar, někdy až desítek. Občas se to týká i skupinových sloupcových grafů (třeba toho z příkladu výše) a skládaných sloupcových grafů. Někdy je proto vhodné začít uvažovat o tzv. small multiples řešení. To využívá místo jednoho společného grafu několik menších, každý s totožnými osami a měřítky, ale každý jen pro jednu proměnnou/kategorii. Když je pak seřadíme vedle sebe do jakési matice, jsou jednoduše samostatně čitelné, ale záro-
4 Tvorba efektivních grafů
vazbu na vaše grafy a pomo-
veň i navzájem porovnatelné. Takové řešení samozřejmě volíme opět jen pokud to dává smysl s ohledem na sdělení, které chceme grafem předat. Důležité však je si uvědomit, že není nutné dostat do jednoho grafu všechna naše data. Prakticky si použití small multiples ještě ukážeme dále.
Příliš mnoho linií? Pokud by nám šlo o jednu, zvýraznili bychom ji, Protože nám jde o všechny samostatně i o jejich vzájemné porovnávání, možná bude lepší zvolit small multiples řešení.
Lze graf z analýzy použít rovnou v práci? Graf, nad kterým si děláme sami vlastní vizuální analýzu dat, většinou není vhodný k přímé publikaci. Jako autoři výzkumu a diplomky totiž víme, co v grafu hledat. Čtenář to ovšem vědět nemusí. Cílem grafu je navíc přeci většinou ukázat výsledek naší analýzy dat, nikoliv poskytnout čtenáři médium, nad kterým si může provést svou vlastní analýzu zase znovu od začátku. Použití stejného grafu pro analýzu i výslednou prezentaci se projevuje několika nejcitelnějšími nešvary: neseřazenými daty, nic neříkajícími nadpisy a chybějícími popisky. Podíváme se na ně podrobněji.
V Excelu zatím není možné sloupce nebo výseče ručně přehazovat. Seřadit si budeme muset data na vstupu do grafu, ještě v tabulce.
Seřadit si data Seřadit si data na vstupu do grafu je prvním krokem ke smysluplnějšímu grafu. Představte s například, že zkoumáte dvacet nejznámějších autorů sci-fi literatury
5 Tvorba efektivních grafů
a jejich půjčovanost v knihovně XY. Data zobrazíte pomocí sloupcového grafu, ale autory necháte na ose seřazeny např. podle abecedy a nebo prostě jen náhodně tak, jak přišli pod ruku. Čtenář, který takový graf začne číst, si musí sám udělat analýzu: hledá v náhodně seřazených sloupcích největší, pak druhý největší, atd. Kolik práce bychom mu ušetřili, kdybychom sloupce v grafu seřadili třeba sestupně?
Jako příjemce grafu si musíme udělat vlastní analýzu a seřadit si vědní disciplíny od nejvíce po nejméně zastoupené. Takovou analýzu už ovšem jistě autor grafu provedl, jen ji do grafu nezanesl v podobě seřazení dat.
Občas se řazení dat samozřejmě nehodí: většinou tehdy, je-li na ose nějaká přirozená posloupnost (čas, měsíce, roky, dosažené vzdělání, atp.). Tam dává smysl nechat sloupce seřazeny přirozeně, protože nás obvykle více než největší/nejmenší zajímá rozložení hodnot např. v rámci nějakého časového úseku. Ale co nás zajímá a co chceme ukázat, na to jsme si odpověděli už dávno před samotnou tvorbou grafu a i zde je potřeba na to myslet.
Správné nadpisy Správný název grafu by měl připravit čtenáře na hlavní sdělení. „Graf 28“ je vhodný začátek popisu pod graf, ale ne vhodný nadpis grafu. „Nejpůjčovanější autoři sci-fi v knihovně XY“ je mnohem lepším řešením. Pokud chceme přímo odkázat na výsledek analýzy, nemusíme se bát ani nadpisu „Nejpůjčovanějším sci-fi autorem v knihovně XY je Pratchett“, ačkoliv takový nadpis se hodí spíše do novin než do akademické práce, a proto s tímto typem zacházejme raději opatrně.
6 Tvorba efektivních grafů
Popisky a vysvětlivky Graf by měl obstát nejen v rámci textu práce, ale i samostatně. Grafika obecně poutá pozornost, takže když bude vaší prací čtenář listovat, spíše se zastaví u grafu a nebude tolik zkoumat jeho textový kontext. Proto je dobré dávat si pozor na popisky a zajistit, aby byl graf čitelný a správně pochopitelný i sám o sobě. V jakých jednotkách je tato osa? Co ony sloupce a linie vlastně ukazují? Ve většině případů lze odpovědi na tyto otázky po chvíli přemýšlení odvodit, někdy se ovšem stane, že čtenář odchází úplně zmaten: třeba jako v následujícím grafu. Co z něho můžeme vyvodit?
Popisky jsou důležité. Ovšem na druhou stranu není třeba to s nimi přehánět a informace duplikovat. I na tomto grafu vidíme, že legenda ke kategorii vpravo je tu jaksi navíc. Ani nadpis nám příliš nepomáhá.
Zdá se, že knihovna v Luhačovicích má jen kolem dvaceti registrovaných uživatelů a tento stav se nijak výrazně nemění ani v průběhu let. Ve skutečnosti jde však o procentuální objem z obsluhované populace, tedy 20 % obyvatel města a jeho okolí a mnohem více než 20 osob. Tuto skutečnost se však dozvíte jen v textu práce a to někdy i na zcela jiné straně, než kde je graf umístěn. Popisky, legendy a vysvětlivky je nutné si hlídat.
7 Tvorba efektivních grafů
2. Manipulace grafem Odpověď na otázku Co chceme v grafu říct? by v případě diplomové práce měla být jasná: chceme ukázat, k čemu výzkum došel, nezaujatě a pravdivě. Jenže podobně jako můžeme lhát slovy, můžeme lhát i grafem a pomocí různého zobrazení stejných dat můžeme ukazovat realitu takovou, jak se nám zrovna hodí, aniž bychom si museli vymyslet jediné číslo nebo data jakkoliv falšovat. A občas to děláme i nevědomky. Že jde grafy manipulovat a není to ani tak složité, vědí především média. Podívejte se nejprve na grafy z televizního vysílání stanice FOX a pokuste se zjistit, co na nich nesedí. Jakými fígly grafické zobrazení dat manipulují?
Sledujte blog Junk Charts (junkcharts.typepad.com) kde se čas od času objevují další příklady špatných a manipulovaných grafů. FOX News jsou ovšem legendou.
Když vytváříme graf, děláme množství rozhodnutí, které mohou mít — a také mají — přímý dopad na to, jak data v grafů působí na příjemce. Nad stejnými daty můžeme vytvořit spojnicový graf, který vypadá jako obrovský růst, ale i graf, který působí jako velmi pomalý růst a to jen tím, že jinak navrhneme osy a měřítka na nich. Abychom mohli grafy vytvářet správně, musíme si být těchto skutečností vědomi. Být si vědomi způsobů manipulace s grafy se ovšem hodí i v roli příjemce. Můžeme pak kriticky přistupovat ke grafům, které vidíme, a dávat si pozor, zda se nás někdo nepokouší obelhat. Mezi nejběžnější metody manipulace s grafem patří manipulace s osami. Podsekávání osy a volba měřítka má totiž přímý dopad na to, jak data v grafu působí na příjemce.
8 Tvorba efektivních grafů
Podskenutí se na ose obvykle vyznačuje speciální značkou. Mnohem důležitější ale je osu ukázat a nezatajit ji, jak to občas dělají média.
Podseknutí osy zvolila i televizní stanice FOX v grafech výše: díky tomu se např. sloupec vpravo na prvním z grafů jeví jako třikrát větší než levý sloupec, což republikány vlastněné televizní stanici hraje v případě Obamova plánu zdravotní péče do karet. U sloupců jsou sice uvedeny přesné hodnoty, ale v těch několika vteřinách, kdy se graf objeví na obrazovce, si je těžko porovnáte. Ve skutečnosti je mezi hodnotami mnohem menší rozdíl. Podseknutí osy není žádná šedá nebo zakázaná praktika: běžně s ní musíme pracovat třeba u spojnicového grafu. Když se například hodnoty pohybují v rozmezí +-100 od 9000 a graf nepodsekneme (tedy osa y začne na nule), ze spojnice bude rovná čára a výkyvy nebudou znatelné. Jako tvůrci grafu tak musíme hledat rozumnou míru, abychom ukázali, co ukázat chceme, a přitom data v grafu příliš nerozostřili. Hlavně o svých volbách musíme dát vědět: takže když podsekáváme osu, mělo by to být vždy vidět. Nevypustíme ji jako stanice FOX, ale necháme ji tam, aby si čtenář mohl uvědomit, že ve výchozím bodě os protentokrát není nula.
Data můžeme stejně dobře manipulovat i volbou měřítka nebo volbou rozestupy mezi stupni měřítka na ose, tedy jednoduše volbou velikosti a tvaru grafu. Když obyčejný spojnicový graf v textovém editoru stáhneme z obdélníkového tvaru na čtverec, spojnice bude mít ihned mnohem příkřejší sklon a růst tak bude na první pohled působit jako mnohem větší.
9 Tvorba efektivních grafů
Jednoduchá změna vlastností měřítka a stejná data se najednou jeví úplně jinak. Když vytváříme graf, musíme si být těchto skutečností vědomi.
Všech těchto možností si jsou vědoma nejen média, ale i firmy, které si ve výročních zprávách často dávají záležet, aby i malý růst působil velkolepě. Vytváření grafu je tak činností s celkem vysokou morální zodpovědností. Když budeme např. vedoucí knihovny a malá manipulace grafu nám může zajistit nesnížení finančního rozpočtu od města na příští rok, uděláme to? Na to tu odpověď nenajdete. V diplomové práci však nikoho manipulovat nechceme a musíme si proto dávat pozor, zda to nevědomě neděláme. Pomoci nám mohou i některá pravidla, které si uvedeme níže, u doporučení pro jednotlivé základní typy grafů. Manipulovat graf můžeme i tím, že prostě některá data v grafu neukážeme. Graf zobrazující růst prodeje výrobků společnosti YZ v posledních dvou měsících může působit pozitivně — co na tom, že deset měsíců před tím prodeje jen klesaly, a to až trojnásobného objemu, než jak je tomu nyní. V grafu už to ukázáno není... Jako tvůrce grafu tedy rozhodujeme, jak rozsáhlý úsek dat do grafu vstupuje a tento rozsah opět odvisí od vstupní otázky: co chceme/musíme říct? Představte si následující příklad: v červnu došlo v námi zkoumané knihovně XY k instalaci robotického knihovníka (na chvíli předstírejme, že něco takového existuje). Na konci roku si shromáždíme data o výpůjčkách a zobrazíme je v grafu, abychom zjistili, jak náš nový knihovník ovlivnil tuto metriku. Použijeme data od června, kdy k instalaci došlo, do prosince a zjišťujeme, že po instalaci nového automatického knihovníka se každý měsíc počet výpůjček navýšil o 20 %. Taková data nás těší. Jenže: co tomuto grafu předchází? Když si zobrazíme data i z období před instalací zařízení, můžeme zjistit, že výpůjčky opravdu klesaly a elektronický knihovník to zastavil, ale také můžeme zjistit, že výpůjčky stoupají konstantně už od začátku roku a instalace nového zařízení v červnu neměla na růst objemu výpůjček
10 Tvorba efektivních grafů
Stoupající objem výpůjček. Co se ale dělo před tím? Stoupá objem už dlouho, nebo nárůst následuje za výrazným propadem? Jako autoři grafu rozhodujeme, co v grafu ukážeme.
žádný vliv. Opět narážíme na morální dilemata: pokud budeme vedoucím knihovny a budeme muset u svého zřizovatele obhájit nákup robotického knihovníka, který graf použijeme? V diplomové práci však dilema mít nemusíme, protože nikoho manipulovat grafem nechceme: zkoumáme příčiny a snažíme se objektivně popsat, co se v knihovně XY stalo. Lepší je tedy vždy uvést širší kontext, pokud vypráví pravdivější příběh. Uvědomit si, že poselství, které nám graf předává, lze jednoduše manipulovat i volbou rozsahu vstupních dat, je však potřeba i z pozice příjemce.
3. Estetika grafu Když k tvorbě grafu používáme kancelářský tabulkový procesor, musíme mít na paměti jednu věc: software jako Microsoft Excel nikdy neměl sloužit akademikům k práci s jejich výzkumnými daty, nýbrž manažerům, účetním a sekretářkám. V oblasti byznysu se však vždy mělo (a dosud částečně má) za to, že čísla obecně jsou nudná. Aby manažeři na poradách neusínali, musí být nudná čísla v grafech ukázána barevně ve 3D s odlesky, stíny a podobnými ozdobami. Díky tomu se všechny estetické nešvary s 3D efekty v čele rozšířili i do akademických prací. Tady však nemají co dělat: naším hlavním cílem v diplomové práci není ukázat čísla zábavně, ale ukázat je pravdivě. A třeba 3D efekty někdy čísla velmi nepříjemně zkreslují. Odborně se všemu, co v akademickém grafu nemá co dělat, říká chartjunk. Je to vše, co samotná vizualizovaná data (tedy ty linie, sloupce a výseče) dusí a vizuálně zanáší. Například příliš silná a výrazná mřížka na pozadí spolehlivě zadusí linii spoj-
11 Tvorba efektivních grafů
nicového grafu. Vždy je proto třeba přemýšlet nad tím, které prvky jsou důležité (linie, sloupce, atd. — říkáme jim datové prvky) a které už méně a můžeme je proto vizuálně omezit, např. je udělat světlejším odstínem šedé. Vizuálně zobrazená data jsou v grafu to nejdůležitější, takže je nechte vyniknout a nepohřběte je pod mřížkami, 3D efekty, šrafovanými nebo barevnými pozadími a ozdobnými písmy.
3D efekty u koláčového grafu, který je navíc rozložený. 17 % vpředu působí mnohem větším dojmem než 17 % v pozadí.
Nejrozšířenějším a nejproblematičtějším chartjunkem jsou 3D efekty. Ve skutečnosti nejde o reálný třetí rozměr, protože naše data jsou dvourozměrná, a třetí dimenze tu slouží jen ozdobným účelům. Pomocí 3D efektů můžeme ovšem taky velmi jednoduše manipulovat data, a to hlavně u koláčových grafů: pamatujete na Vladimíra Železného, jak v pořadu Volejte řediteli každý týden nadšeně prezentoval, kolik si Nova ukousla z koláčového grafu sledovanosti? Hádejte, proč byla výseč se jmenovanou televizí vždy vpředu. 3D efekty se proto doporučuje v diplomových pracích nepoužívat, a to nejen u koláčů.
12 Tvorba efektivních grafů
4. Graf a mozek Efektivní graf v diplomové práci nejenže ví, co říká a zdržuje se manipulace a nevhodných ozdobných efektů, ale také by měl respektovat limity a specifika našeho vizuálního vnímání a mozku a vědět, co si může s ohledem na ně dovolit. Podíváme se na několik základních doporučení, díky kterým se naše grafy budou příjemcům mnohem lépe a rychleji číst.
Zvýraznit, co je důležité. Základní cesta, jak zamířit pozornost čtenáře na to, co chceme nad našimi daty sdělit.
Zvýraznit, co je důležité Nejjednodušší doporučení na začátek: zvýrazněte to, co je v grafu důležité. Součástí naší snahy něco sdělit je občas i potřeba v grafu poukázat na to nejzajímavější. Pokud nám ze všech sloupců jde hlavně o jeden, který je v kontextu našeho výzkumu/zjištění důležitý, můžeme ho například zvýraznit jinou barvou nebo tučnější linií, čímž zajistíme, že si ho příjemce všimne hned, jak se na graf poprvé podívá. Děje se tak díky předpozornosti, což je velmi rychlý a autonomní proces našeho vnímání, který ve všech vizuálních podnětech přicházejících do našeho oka vyhledává ty nejvýraznější, jež pak předává naší vědomé pozornosti.
Popisky co nejblíže k datům Naše krátkodobá paměť není neomezená. Uvádí se, že jsme do ní schopni uložit zhruba šest položek, což jsou jednoduše řečeno kousky informací: čísla, slova, atd. Podívejme se na následující graf. Data zobrazuje pomocí několika spojnic. Pokuste se některé z nich porovnat vůči sobě a vyvodit závěry o vývoji počtu časopisů v OA v různých zemích. Jak se třeba vyvíjela Česká republika ve srovnání s našimi východními sousedy v daných deseti letech?
13 Tvorba efektivních grafů
Graf objemu časopisů vydávaných v OA dle zemí a v průběhu deseti let. Osm linií, osm barev, osm zemí. Příliš mnoho zátěže pro naši krátkodobou paměť.
Nakonec se nám povedlo graf přečíst, ale v rámci procesu čtení jsme se u jednoho místa značně zdržovali: u legendy. Legenda se v automaticky tvořených grafech v Excelu obvykle zobrazí v samostatném boxu vedle grafu. Graf nás tak ale nutí využít svou krátkodobou paměť naplno, pamatovat si barvy, státy k nim náležící a pak s těmito informacemi dále pracovat nad liniemi v grafu a provádět analýzu. O kolik jednodušší by bylo popisky přiřadit přímo k liniím?
Popisky přímo u linií snižují tzv. kognitivní zátěž čtení grafu. Nemusíme zrakem přeskakovat mezi grafem a legendou a snažit se zapamatovat, co k čemu patří,
Kdykoliv to je jen možné, a to je většinou u spojnicového a koláčového grafu, umístěme popisky přímo k datovým prvkům. Zbavíme se tak nejen náročného čtení, ale
14 Tvorba efektivních grafů
vyhneme se i případným problémům s barvami. Když si předchozí graf v původní podobě například někdo vytiskne černobíle, nebude mít s přiřazením popisků ke spojnicím žádný problém. Na barvy se za okamžik ještě podíváme podrobněji.
Obyčejný sloupcový graf je někdy lepší vytvořit v horizontální podobě. Díky ní můžeme popisky namapovat přímo ke sloupcům a ušetřit tak četnáři námahu. Vertikální popisky se obvykle nedoporučují.
U obyčejného sloupcového grafu se také obvykle dají přiřadit popisky ke sloupcům. Pokud jsou moc dlouhé a pod osu x se nevejdou, stačí místo vertikálního sloupcového grafu použít horizontální sloupcový (v Excelu jako pruhový), tedy prostě otočit graf o 90 stupňů a popisky kategorií umístit přímo k ose. I tady se vyhneme obtížím s barvami a můžeme je tak nahradit různými odstíny jedné barvy nebo nechat všechny sloupce stejnou barvou, například odstínem šedé. Barva tu už nenese žádnou informaci.
Pozor na barvy Ačkoliv se nás Excel vždy pokouší přesvědčit o opaku, výběr barev není otázkou náhody. Nesmíme zapomínat, že barvy si nejen nesou jistý kulturní kontext (takže různé barvy vnímají lidé z různých částí světa jinak), ale též nesmíme opomenout skutečnost, že určitá část populace má s vnímání barev potíže a může je vidět zcela jinak, než jak předpokládáme. Zapomínat nesmíme také na černobílý tisk a černobílé zobrazovací zařízení, především elektronické čtečky. Jednoduchá doporučení nám pomohu poprat se s barvami v grafu: Pozor na kulturní kontext barev. Barvy si nesou význam. A tento význam není nijak autoritativně dán, liší se podle kultur. Co u nás považujeme za barvu smutku,
Kulturní kontext barev šikovně zpracoval David Mc-
může být v jiné části světa považováno za barvu radosti a zrození. Je tedy důležité
Candless ve své infografice
myslet na příjemce: jaké barvy má asociovány s negativními a pozitivními hodno-
(kultury.jdem.cz).
tami? Jakou barvu vnímá jako výstražnou a která tak nejlépe zaujme jeho pozor-
15 Tvorba efektivních grafů
Colours in Cultures
nost? Např. červená a modrá, případně zelená jsou v západním světě nejčastěji spojovány s kladnými a zápornými hodnotami. Nejen kulturní kontext barvy, ale také sémantické souvislosti hrají při čtení grafu roli. Pokud mapujeme například dovoz ovoce, je vhodné použít k jahodám červenou barvu, k banánům žlutou barvu atd. Tomuto principu se říká sémanticky rezonantní volba barvy a bylo dokázáno, že citelně pomáhá zrychlit čtení grafu.
Původní graf (vlevo) a stejný graf, jak ho vidí osoba s poruchou barvocitu. Dvě barvy se stávají téměř totožnými a není možné výseče odlišit. Problém by kromě lepší volby barev vyřešily i popisky přímo u řezů.
Nejen každá kultura vnímá barvy jinak, ale i každý člověk vidí barvy odlišně. Výrazné odlišnosti ve vnímání barev se souhrnně označují jako barvoslepost. Existuje několik druhů poruchy barvocitu, obecně ale můžeme tvrdit, že zhruba 10 % populace vidí barevné spektrum jinak, než zbytek lidstva. Častěji se poruchy barvocitu týkají mužů. Pokud je v grafu barva nositelem informace (např. skrze ní rozpoznáváme kategorie a přiřazujeme legendu), musíme vzít barvoslepost v potaz a zajis-
Nikdy není dobré spoléhat
tit, že bude náš graf čitelný a pochopitelný i pro barvoslepé osoby.
na barvy automaticky volené
Barevný tisk je drahý a barevné elektronické čtečky na své masové rozšíření teprve
čistě volbou tvůrců/designe-
čekají. Hodí se proto počítat také se situacemi, kdy příjemce uvidí naše vypiplané
Color Brewer, určený k tvorbě
barevné grafy černobíle. Vždy si proto ověřme, že ani převedení grafu do odstínů šedi nepřivodí ztrátu informace kritické pro správné přečtení grafu. Jak barvoslepost, tak potíže s případným černobílým zobrazením nebo tiskem, můžeme vyřešit jednoduše: použitím různých odstínů jedné barvy (např. od nejsvětlejšího po nejtmavší modrou) nebo rovnou využitím odstínů šedé.
16 Tvorba efektivních grafů
kancelářskou aplikací — jsou rů. Pomoci nám může nástroj barevných škál, u kterých je zajištěno, že je dokáží přečíst i lidé se všemi typy barvosleposti. Byl vytvořen na základě podrobných výzkumů vnímání barev. (colorbrewer2.org)
Další doporučení pro sloupcové grafy
Rozestupy mezi sloupci by měly být menší nebo
U sloupcového grafu by měla osa vždy začínat
větší než šířka sloupců. Rozhodně ne stejné: nedě-
na nule. Vyhneme se tím případné manipulaci.
lá to dobře oku a tam, kde je sloupců víc, by mohl vznikat optický klam. Pozor na dlouhé popisky kategorií a vertikální po-
Rozhodně se vyhněte 3D efektům, žádné kulaté
pisky, kvůli kterým musíme celou diplomku otočit,
a vystínované sloupce nedodají vašim datům
abychom je dokázali přečíst. Udělejte z grafu raději
na důvěryhodnosti.
horizontální sloupcový nebo popisky zkraťte.
Negativní čísla patří do negativní oblasti, tedy od
U každého sloupce nemusí být přesná hodnota.
osy x dolů a od osy y doleva. Tak jsme na to navyklí.
Uveďte třeba jen ty důležité.
17 Tvorba efektivních grafů
Další doporučení pro koláčové grafy I.
Používejme ho jen rozvážně. Rozhodně by neměl
Tzv. explode, tedy vysunutí jednoho řezu z koláče,
mít více než pět řezů, potom raději použijte sloupco-
používejte jen výjimečně a rozhodně ne na všechny
vý nebo skládaný sloupcový graf.
řezy zároveň. Vysunujte jen jeden výseč nebo výseče raději zvýrazňujte tmavší barvou.
Hlavní otázkou tu je: chcete porovnávat části k celku, nebo části mezi sebou? Pokud části mezi sebou, volte sloupcový graf. Pokud části k celku, koláčový poslouží dobře. Taky se nehodí pro zobrazování změn: třeba podíl žánrů v celkovém objemu výpůjček v roce 2010 a 2011 není vhodné zobrazit dvěma koláči. zde by se hodil spíše skládaný sloupcový graf. Koláč nejvíce trpí 3D efekty. V diplomové práci je rozhodně nepoužívejte. Bílé linie mezi výsečemi zajistí čtení i tam, kde by ho mohly znepříjemňovat problémy s barvami.
18 Tvorba efektivních grafů
Popisky v koláči patří vždy přímo k řezům. Legenda v samostatném boxu je u koláčového grafu zbytečná. Umístění popisků přímo přes řezy se ale nedoporučuje.
Další doporučení pro koláčové grafy II.
Doporučuje se také specifické řazení výsečí, které
Pokud jsou některé výseče velké a některé malé,
koresponduje s tím, jak čteme text i odečítáme hodi-
umístíme nejdříve tu největší od dvanácti po směru
ny. Pokud jsou všechny výseče zhruba stejně velké,
hodinových ručiček a pak ty zbylé od druhé největší
řadíme je od dvanácti hodin po směru hodinových
po nejmenší od dvanácti proti směru hodinových
ručiček, od největší po nejmenší.
ručiček. Díky tomu se ty malé a méně významné řezy dostanou do spodní části koláče a jako první jsou vidět ty největší. V Excelu tohoto řazení dosáhneme tím, že si data seřadíme vzestupně a pak největší hodnotu z posledního řádku přehodíte na začátek.
Pokud jsou malé řezy významné, můžeme je pak zvýraznit tmavším odstínem barvy.
19 Tvorba efektivních grafů
Další doporučení pro spojnicové grafy
Zajistěte, že se spojnice dají rozpoznat. Pokud mož-
Maximálně by mělo být spojnic v grafu zhruba pět
no přiřaďte popisky přímo k liniím.
(doporučení se liší), nad pěti už přemýšlejme o small multiples řešení, pokud by dávalo smysl s ohledem
Spojnice by neměla být příliš slabá, aby se ztrácela, ale také ne příliš silná, protože by se nám v místech s detaily mohla slít v jeden chumel. Sílu linie volte s rozumem. Každý bod na spojnici nemusí mít přesnou hodnotu. K tomu je tabulka. Ukažme přesné hodnoty třeba jen tam, kde se s daty děje něco důležitého.
U spojnicového grafu nikdy nezatajujte podseknutí osy, spíše se na něj snažte upozornit. Na nule jako u sloupcového grafu se tu samozřejmě začínat nemusí.
20 Tvorba efektivních grafů
na to, co chceme sdělit.
Praktické příklady Na několika příkladech si teď některá z doporučení ukážeme. První příklad pochází z diplomky, která mimo jiné zkoumala spokojenost uživatelů knihovny a jejich obeznámenost se službami. Z dat vzešly některé zajímavé informace: především že 100 % respondentů neví o donáškové a 90 % respondentů o rešeršní službě. Předpokládjeme nyní, že nás v kontextu práce zajímá především rešeršní služba. Diplomant v práci vytvořil následující graf.
Graf použitý k analýze. Čtenáři nepředává nic a musí si v něm důležitá zjištění najít sám, tedy provést si nad daty vlastní analýzu. Navíc nevhodné 3D efekty a žádný nadpis. Napravíme to.
Řekněme, že diplomat chtěl předat především neznalost čtenářů o rešeršní službě. To se grafu ale nedaří. Zkusme nyní identifikovat chyby s ohledem na smysl a plánované sdělení a navrhnout nové, lepší řešení:
Chyby:
21 Tvorba efektivních grafů
Ty prvky, které nejou tak důležité jako sloupce, barevně utlumíme, aby v grafu nerušily. Přesné hodnoty na všech sloupcích nepotřebujeme a 3D efekty rozhodně také ne. Teď už to vypadá lépe.
Stoprocentní skládaný sloupcový graf není špatně zvolenou formou a horizontální rozložení je také v pořádku. Prvním problémem jsou ovšem neseřazená data. Ty zde můžeme s ohledem na sdělení seřadit sestupně podle míry neznalosti. Obrátíme též použití barev: zatímco v původním grafu je tmavou, výraznější barvou vědomost a spokojenost se službou, nás zajímá spíše nevědomost, a proto ji zvýrazníme. Malou nespokojenost pak můžeme ukázat např. šrafurou.
Ještě více podpořené hlavní sdělení. Nadpis připravuje čtenáře na sdělení grafu. A přesná hodnota je jen tam, kde se děje něco důležitého.
I nadpisy tu jasně říkají, o co jde. Pokud bychom chtěli naše sdělení ještě více protlačit, můžeme sloupec s rešeršními službami zvýraznit např. použitím barvy. Kdokoliv může namítnout, že naše nové řešení není nejlepší možné a obecně platí, že kolik hlav, tolik řešení. Každé jiné řešení je ale lepší než to výchozí, které nám nabídne Excel.
22 Tvorba efektivních grafů
Druhý příklad. Představte si, že jste v diplomové práci zkoumali biblioboxy. Kromě jejich výzkumů v knihovnách jste sledovali i oblíbenost a prodeje biblioboxů ve spolupráci s jejich výrobcem. Ten má ve svém portfoliu celkem šest typů zařízení, ale ne všechny se prodávají dobře. Cílem vašeho výzkumu bylo mimo jiné navrhnout zúžení produktového portfolia. Data o prodeji boxů za poslední roky můžeme namapovat do spojnicového grafu.
Typický graf, jak ho nad našimi daty vytvoří Excel. Tady většina diplomantů končí. K naší prvotní analýze je graf dostatečný, pro finální prezentaci se ale nehodí. Chceme příjemci zjednodušit porovnání jednotlivých variant vůči ostatním.
Našim cílem je ovšem spíše ukázat jednotlivé varianty s možností porovnat je vůči ostatním. Šest linií ještě není mnoho, takže by bylo možné popisky přiřadit přímo k liniím a graf zušlechtit i v této podobě, my si však pro příklad ukážeme použití small multiples řešení. Vytvoříme tedy šest totožných grafů, které seřadíme vedle sebe, např. sestupně podle výchozí hodnoty. Následně pak vždy utlumíme ostatní linie a zvýrazníme tu hlavní. Takový formát je s ohledem na náš cíl lepší.
Small multiples řešení. Zvýraznili jsme dvě varianty, které považujeme za neefektivní. Nyní stačí už jen správný nadpis typu „Varianty A a E jsou ekonomicky nezajímavé“ a můžeme graf publikovat. V každém grafu nemusí být všechny linie, vždy stačí ta jedna, zde ale s ohledem na naše cíle dává smysl ponechat je utlumené vždy všechny.
23 Tvorba efektivních grafů
Koláčové grafy nejvíce trpí 3D efekty. Následující koláč pochází z diplomky, která mimo jiné zkoumala blokování obsahu v knihovnách. 3D efekty spolu s nepřiřazenou legendou a zřejmě náhodně volenými nevhodnými barvami (např. červená pro ano, která láká vnímat výseč jako zápor atp.) znemožňují efektivní čtení grafu. K zamyšlení je i uvedení kategorie „nevím“. Někdy je vhodnější ji v grafu vynechat a uvést toto vynechání v popisku pod grafem. To už je ovšem spíše metodologická otázka.
Předně je třeba vědět, co chceme sdělit: u 43 % knihoven můžeme s jistotou říct, že blokují nevhodný obsah. To je zajímavé zjištění a pokud to s ohledem na naše výzkumné otázky dává smysl, můžeme ho v grafu vypíchnout:
Lépe vystavěný koláčový graf. Správně seřazené výseče. Bílé ohraničení zajišťuje rozpoznatelnost výsečí, proto si můžeme dovolit ty „nezajímavé“ zobrazit jedním slabým odstínem šedé a ty zajímavé, tedy pozitivní responze na blokování, odstíny jiné barvy. Pokud bychom chtěli spíše poukázat na neblokování obsahu, použijeme červenou a zvýrazníme s ní jiné odpovídající výseče. Modrá se obvykle používá jako barva neutrální, nehodnotící.
24 Tvorba efektivních grafů
Shrnutí studijního materiálu V materiálu jsme se věnovali základním typům grafu a jejich efektivní tvorbě v diplomové práci. Všechna doporučení můžeme shrnout do několika bodů, které je dobré mít na paměti, když vytváříme graf:
Graf není povinnost, graf je výhoda. Nevytvářejme bezobsažné grafy. Definujme si, co chceme říct. Graf by měl obstát i sám o sobě. Ověřme si, že bude graf správně přečten. Zbavme se chartjunku, utlumme nepodstatné, odstraňme 3D efekty. Pozor na barvy. Mysleme na barvoslepost a černobílý tisk. Při tvorbě grafů v diplomce používejme selský rozum.
25 Tvorba efektivních grafů