Použití základních typů grafu v programu EXCEL (doplňující výukový text, únor 2013) Václav Synek
1
Použití základních typů grafu v programu EXCEL Václav Synek
Graf sloupcový Graf spojnicový Graf XY bodový Časová řada I Časová řada II Kalibrační přímka Křivka potenciometrické titrace Graf sloupcový je vhodný při vzájemném porovnání hodnot sledované veličiny pro různé kategorie; např. průměrné platy pro různá odvětví hospodářství, nebo koncentrace různých znečisťujících látek v ovzduší nebo obsahy kovů v prachu na obr. 1. Na svislou osu je jako výška sloupců vynášena hodnota sledované veličiny (číselný znak) a dole na vodorovné ose je k sloupcům uvedeno značení odpovídajících případů ‐ názvy kategorií. Názvy sledovaných kategorií mohou být např. tzv. slovní znaky nominální, tj. názvy, které jednotlivé kategorie od sebe pouze rozlišují, např. symboly sledovaných prvků na obr. 1 nebo názvy sledovaných oborů hospodářství nebo krajů republiky, pro které sledujeme určitý číselný ukazatel, např. průměrné mzdy (příklad 1). Použité názvy mohou být také tzv. slovní znaky ordinální, což značí, že sledované kategorie, je možné řadit podle jejich rostoucí či klesající úrovně. Nejde pak o seřazení čistě formální, např. seřazení názvů kategorií dle abecedy (obr. 1), ale příkladně o seřazení názvů stupnice hodnocení v klesající nebo rostoucí řadu, např. řada výborný, chvalitebný, dobrý, dostatečný a nedostatečný, nebo o seřazení slovních znaků podle logiky problému, v případě znaků na obr. 1 by to mohlo být seřazení značek prvků podle jejich klesajícího obsahu v zemské kůře, což je přírodní zdroj těchto prvků pro prach v ovzduší.
Obr. 1 Sloupcový graf ‐ průměrné obsahy sledovaných prvků v prachu odebraném ze vzdušného aerosolu (PM< 2,5 um) v Litoměřicích v roce 2010
Velmi často se sloupcové diagramy používají také při sledování vývoje dané veličiny podle narůstajícího času – tzv. časové řady, kdy na vodorovnou osu je vynášen čas, tedy znak číselný (numerický). Výšky sloupců mohou značit přírůstky nebo úbytky sledované veličiny za časové intervaly, např. počet živě narozených dětí za rok v ČR 2
v jednotlivých rocích (viz obr. 2) nebo hodnoty, jichž nabývá sledovaná veličina v za sebou řazených okamžicích – v časových bodech, např. hodnota státního dluhu ČR na konci jednotlivých roků (viz obr. 3a).
140 120 100 80 60 40 20
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
2000
1999
1998
1997
1996
1995
1994
1993
1992
1991
1990
1989
1988
1987
1986
0 1985
Počet narozených dětí v tis.
160
Obr. 2 Graf sloupcový – Počet živě narozených dětí ČR v letech 1985 až 2011 ‐ časová řada (zdroj http://www.uzis.cz/category/tematicke‐rady/zdravotnicka‐statistika/demografie, Narození a zemřelí do 1 roku 2011, 14. 2. 2013
Obr. 3a Graf sloupcový – vývoj státního dluhu ČR ‐ časová řada (zdroj http://cs.wikipedia.org/wiki/St%C3%A1tn%C3%AD_dluh_%C4%8Cesk%C3%A9_republiky)
Časová řada bývá často znázorňována grafem spojnicovým, např. časový vývoj státního dluhu je znázorněn na obr. 3b také spojnicovým grafem. Ve spojnicových grafech lze samozřejmě vynášet na vodorovnou osu i jiné veličiny než pouze čas. Při použití spojnicového grafu nebo případně sloupcového grafu v takovém případě je však třeba si uvědomit, že stupnice na vodorovné ose je vynášena ve smyslu: první, druhá, třetí 3
případně další sledovaná hodnota (např. 1., 2., nebo 3. časový úsek, stupeň či interval). Tzn., že případy na vodorovné ose jsou v těchto grafech odstupňovány stejně dlouhými úseky, i když pod stupnicí mohou být napsány různě velké úseky či intervaly, viz např. obr. 4, kde v histogramu jsou na spodní ose některá z rozpětí delší než 2 tisíce. Čísla vyznačená u spodní osy spojnicového nebo sloupcového grafu představují jen slovní popis. V mnoha případech to není na závadu, protože autor i čtenář bere hodnoty na vodorovné ose skutečně jen jako 1., 2., a další měřený případ měření veličiny vynášené na vodorovnou osu. Činí to ovšem potíže tehdy, když očekáváme, že různě dlouhé např. časové intervaly jsou na vodorovné ose znázorněny skutečně odpovídajícími, různě dlouhými úseky. Stejně tak při výpočtu v takovém grafu (při použití funkce spojnice trendu), je pak chybně počítáno s čísly 1, 2, 3 atd., nikoliv s těmi hodnotami, které jsou zapsány pod osou. Studenti tuto skutečnost často nerespektují a konstruují v programu EXCEL nesmyslně grafy spojnicové nebo sloupcové i pro vyjádření vtahů mezi dvěma kvantitativními veličinami (číselnými znaky), kdy na vodorovnou osu mají být vynášeny skutečně naměřené hodnoty, s kterými má být počítáno (jiné než 1, 2, 3) ‐ viz další výklad. Pozn. V programu EXCEL existuje však výjimka, a to je případ, kdy ve spojnicovém nebo sloupcovém grafu jsou vynášeny na vodorovnou osu údaje ve formátu „datum“, viz text níže.
Obr. 3b Graf spojnicový – vývoj státního dluhu ČR ‐ časová řada. Porovnáme‐li vyjádření oběma grafy, můžeme si všimnout, že na spojnicovém jsou patrny vlny ‐ změny rychlosti růstu, které se ve sloupcovém grafu ztrácejí. (zdroj http://cs.wikipedia.org/wiki/St%C3%A1tn%C3%AD_dluh_%C4%8Cesk%C3%A9_republiky)
4
Obr. 4 Rozdělení mezd v ČR – na ose x jsou různě široká rozmezí tisíců Kč (0 až 8 tisíc, pak po 2 tisících, 28 až 35 tisíc) znázorněna stejně širokými geometrickými intervaly
Pokud do grafu vynášíme na vodorovnou osu veličinu (kvantitativní údaje), jejíž hodnoty musí být v grafu skutečně respektovány, je třeba použít v programu EXCEL graf XY bodový, viz obr. 5a. Na obr. 5a je jako příklad vynesena kalibrační přímka pro polarografické měření koncentrace kadmia. Proud (tzv. limitní difúzní proud) procházející při tomto stanovení měřeným roztokem roste přímo úměrně s koncentrací kadmia v roztoku. Jestliže proměříme limitní difúzní proudy roztoků kadmia připravených tak, aby měly určité zvolené koncentrace, lze naměřené výsledky vynést do grafu jako body. Každý bod představuje dvojici odpovídajících si hodnot koncentrace – proud (proud při tomto stanovení představuje měřenou fyzikální veličinu závislou na koncentraci, tzv. signál). Naměřené hodnoty jsou uvedeny v tabulce 1. Koncentrace kadmia jsou, jak říká označení os, vynášeny na osu vodorovnou a odpovídající proudy (signály) na osu svislou. Vzhledem k výše uvedené závislosti mezi oběma veličinami jsou naměřené body vynesené do grafu rozptýleny kolem přímky (chyby měření způsobují, že body neleží přesně na přímce). Tuto přímku (její nejlepší odhad) proložíme v grafu metodou lineární regrese. V programu EXCEL použijeme funkci „Přidat spojnici trendu“. Tímto způsobem určíme závislost mezi limitním difúzním proudem a koncentrací kadmia – tzv. kalibrační přímku. Nyní stačí měřit limitní difúzní proudy pro roztoky o neznámých koncentracích kadmia (např. nalezená hodnota proudu 4,362 nA) a na grafu kalibrační závislosti určovat koncentrace kadmia ve sledovaných roztocích, viz naskenovaný příklad A. Pro co nejpřesnější odečet koncentrací v grafu byly v programu EXCEL osy naformátovány s dostatečně jemnými měřítky, graf vytisknout na dostatečně velký papír (na šířku ve formátu a4). Při odečtu byly do vytištěného grafu zakresleny pravoúhlé souřadnice za použití pravítka a řádně ořezané tužky, koncentrace odečtená 4,9 ng/ml). 5
Tabulka 1 Výsledky měření kalibrační křivky pro polarografické měření kadmia číslo měření koncentrace proud (signál měřený)
č. koncentrace proud měření [ng/ml] [nA] 1 0,000 0,08 2 0,562 0,58 3 1,124 0,88 4 1,686 1,50 5 2,248 2,34 6 2,810 2,63 7 3,372 3,12 8 3,934 3,62 9 5,058 4,25 10 6,182 5,78 11 7,306 6,37 12 8,430 7,13 13 9,554 8,39
Obr. 5a Kalibrační přímka při polarografickém stanovení kadmia – graf XY bodový; body vyznačeny samostatnými značkami bez propojování spojnicemi, mezi body proložena hledaná přímka funkcí „spojnice trendu“ (program počítá metodu nejmenších čtverců).
6
Přesněji lze koncentraci vypočítat z odpovídající rovnice kalibrační přímky vypočtené z naměřených bodů (pro výpočet regrese je možné použít i jiné nástroje nabízené programem EXCEL, např. funkce intercept a slope nebo maticovou funkci linregrese, případně nástroj analýzy dat – regrese): y= 0,8596·x+0,1341, kde y značí proud a x značí koncentraci. Nalezené konstanty přímky je třeba určit na vhodný počet platných míst. Ze zde vypočtené rovnice dostaneme po dosazení 4,362 nA za proud (y) a úpravou rovnice, že koncentrace (x) kadmia v měřeném roztoku byla y 0,1341 4,362 0,1341 x 4,918ng / ml 0,8596 0,8596
Při prokládání odpovídající nalezené závislosti mezi naměřenými body není vhodné spojovat vynesené body bod od bodu (spojovat je lámanou nebo ohýbanou čarou), ale je třeba vynášet naměřené hodnoty jako samostatné značky (program EXCEL nabízí různé značky, barevné, s výplní; našem případě byly použity křížky), a přímku závislosti proložit „spojnicí trendu“. Program EXCEL umožňuje takto prokládat i některé matematické funkce s křivkovým průběhem (polynom, mocninná, logaritmická a exponenciální funkce). Příklad nevhodného spojování naměřených bodů „hadem“ je na obr. 5b.
Obr. 5b Kalibrační přímka při polarografickém stanovení kadmia – graf XY bodový, ukázka nevhodného propojování vyznačených naměřených bodů spojnicemi – k vyznačení závislosti je vhodná jasně proložená přímka nalezená funkcí „spojnice trendu“, viz obr. 5a.
Jako ukázka obvyklé hrubé chyby studentů při vyhodnocování kalibrační přímky v programu EXCEL je na obr. 5c uveden případ, kdy data z tabulky 1 jsou zpracována spojnicovým grafem namísto grafem XZ bodovým (viz upozornění v odstavci o spojnicovém grafu). Hodnoty koncentrací na vodorovné ose jsou vyneseny všechny se stejným odstupňováním, ačkoliv jsou mezi nimi různě velké rozdíly (viz tabulka 1). Větší rozdíly mezi koncentracemi na vyšší koncentrační úrovni se při tomto nesmyslném vynesení projeví zlomem na grafu – viz zalomení šedomodrého propojování bodů. Rovnice přímky vypočtená funkcí „spojnice trendu“ je zcela nesmyslná, protože, místo koncentrací uvedených v tabulce a připisovaných na vodorovné ose je počítáno s čísly 1, 2, 3 atd. (čísly měření). 7
Obr 5c Kalibrační přímka při polarografickém stanovení kadmia – ukázka chybného zpracování při použití spojnicového grafu; na vodorovnou osu nejsou vynášený hodnoty koncentrací, ale hodnoty 1, 2, 3 atd. – pořadí měření.
V příkladu 2 je uveden jiný příklad závislosti mezi dvěma veličinami (dvěma kvantitativními znaky), která nemůže být znázorňována spojnicovým nebo případně sloupcovým grafem, a kdy je nutno použít graf XY bodový. Na tomto příkladu se můžete zároveň znovu přesvědčit o nevhodnosti propojování vyznačených naměřených bodů spojnicemi, pokud prokládáte závislost funkcí „spojnice trendu“. Propojování naměřených bodů spojováním bod od bodu nelze ovšem zavrhnout obecně, je naopak v některých případech vhodné. Jako jeden z možných případů je na obr. 6a uveden příklad vyhlazování křivky, kdy je vhodné propojení bod k bodu. Body jsou propojovány vyhlazujícími křivkami a nikoliv přímkami mezi spojovanými body. Takové propojení můžeme použít pro grafické vyhodnocení závislosti představující složitější křivku, kterou nejsme schopni jednoduše proložit v programu EXCEL regresní funkcí odpovídající vhodnému matematickému modelu. Pokud vyznačení jednotlivých naměřených bodů působí při dalším zpracování rušivě, je možné body naznačit jen nenápadně nebo je nevyznačovat vůbec. V příkladu na obr. 6a,b je uvedena křivka potenciometrické titrace (závislost pH titrovaného roztoku na objemu přidávaného titračního činidla).
8
Obr. 6a,b Titrační křivka při potenciometrické indikaci – graf XY bodový; vyznačené body proměřené body na obr. 6 b působí při vyhodnocování spíše rušivě, i když poskytují důležitou informaci.
9
Obr.6c Příklad chybně vyhodnocené titrační křivky při potenciometrické indikaci – použit graf spojnicový místo XY bodového, Na osu hodnot jsou vynášeny pořadí měření ‐ 1, 2, 3 atd. a nikoliv skutečně měřené objemy; k dokumentování rušivého vlivu jsou slabě vyznačeny měřené body,
Na obr. 6c jsou tatáž data vynesena ve spojnicovém grafu, výsledkem je chybné zkreslení, neboť různé objemy titračního činidla jsou znázorněny stejně dlouhými úseky. Vzhledem k použití správně nakreslené potenciometrické křivky na obr. 6a (určení objemu titračního činidla spotřebovaného do dosažení bodu ekvivalence – viz analytická chemie), je nutné v programu EXCEL naformátovat vodorovnou osu (osa objemu titračního činidla) s dostatečně jemným měřítkem, vytisknout graf na dostatečně velký papír (na šířku ve formátu a4). Zakreslit za použití pravítka a řádně ořezané tužky do vytištěného grafu přímky pro nalezení prvního a druhého bodu ekvivalence. Na vodorovné ose se pak odečtou objemy spotřebované do dosažení bodů ekvivalence, viz skenovaná potenciometrická křivka. Jako další z možných případů, kdy je vhodné propojovat body spojnicemi, je na obr. 7a uvedena časová řada, kde se používá propojení vyznačených bodů bod od bodu lomenými spojnicemi; i v husté řadě rozlítaných bodů je pak zřetelně vidět, jak jdou časově za sebou. Pokud znázorníme jen jednotlivé body (obr. 7b) nebo naopak vyneseme jej spojovací čáry (7c), máme problémy s řazením bodů v čase za sebou, v druhém případě se zase ztrácí informace o tom, které hodnoty byly skutečně naměřeny.
10
12,0
-3
As [ng m ]
10,0 8,0 6,0 4,0 2,0 0,0
1.1.07
1.1.08
31.12.08
31.12.09
1.1.11
12,0
12,0
10,0
10,0
8,0
8,0
-3
As [ng m ]
As [ng m-3]
Obr 7a Časová řada – průběh koncentrací As v ovzduší měřených v Litoměřicích v letech 2007 až 2010– graf XY bodový, ukázka vhodného vyznačení měřených bodů s jejich propojováním spojnicemi – značka (trojúhelník) udává čas měření a hodnotu naměřené koncentrace, propojení ukazuje, jak jsou hodnoty řazeny v čase.
6,0 4,0
4,0 2,0
2,0
0,0
0,0
1.1.07
6,0
1.1.08
31.12.08
31.12.09
1.1.07
1.1.11
1.1.08
31.12.08
31.12.09
1.1.11
Obr. 7b a 7c Časová řada (viz obr. 6a) ‐ graf XY bodový; ukázky ilustrují, že vyznačení pouze samostatných bodů nebo pouhé propojení nevyznačených bodů není dostačující. Propojení bez vyznačených bodů se používá při znázorňování časových řad kontinuálních měření nebo velmi hustých, tj. prakticky kontinuálních měření.
Podle informací dosud uvedených o spojnicových a XY bodových grafech, by bylo třeba v programu EXCEL každou časovou řadu, která nemá mezi proměřenými časovými body stejně velké intervaly, nutné zpracovávat grafem XY bodovým. Pokud jsou však proměřené hodnoty v časové řadě přiřazeny ke dnům měření (viz např. graf na obr. 7a), které jsou udávány ve formátu datum, je možné použít jak graf XY bodový, tak i spojnicový graf; spojnicový graf bude u takto formátovaných dat počítat s jejich skutečnými hodnotami a nikoliv s jejich pořadovými hodnotami, jak je tomu u hodnot formátovaných jako čísla. Zpracování časové řady spojnicovým grafem bude dokonce o něco snazší než s grafem XY bodovým. V příkladu 3 jsou ukázky vytvoření grafu časové řady s hodnotami času uváděnými v různém formátu a různě posunutými.
11