STATISTIKA S EXCELEM Martina Litschmannová
MODAM, 8. 4. 2016
Obsah Motivace aneb Máme data a co dál? Základní terminologie
Analýza kvalitativního znaku – rozdělení četnosti, vizualizace Analýza kvantitativního znaku – míry polohy, míry variability, vizualizace Analýza závislosti dvou kvantitativních znaků – koeficient korelace, vizualizace
Motivace Dotazník pro studenty (např. pomocí Google Apps) -http://goo.gl/forms/Z289s0ALPY
Základní pojmy Výška (cm)
Váha (kg)
Přivyděláváte si v rámci prezenčního studia na brigádách?
Jak často brigádu máte?
Jak byste svou brigádu charakterizoval(a)?
180
70
ano
každý pracovní den
1.4.2016 10:41
muž
186
85
ano
nepravidelně
1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
muž žena žena
172 166 188
75 56 70
ano ano ano
nepravidelně Různě, 2-3 týdně 3 dny v tydnu
praxe v oboru během studia kancelářská práce a na ní navazující práce manuální při realizaci projektů praxe v oboru během studia Hlídání dětí praxe v oboru během studia
Kolik času týdně obvykle věnujete studiu?
Pohlaví muž
Kolik času týdně obvykle věnujete brigádě?
Časová značka 1.4.2016 10:38
20
15
30
20
5 12 24
36 10 26
Statistika se zabývá zkoumáním hromadných jevů. Statistický soubor – soubor osob, věcí, událostí, časových období, … Statistická jednotka – prvek statistického souboru (v dotazníkovém šetření nazýváme statistické jednotky respondenty) Statistický znak – atribut statistické jednotky (to, co u stat. jednotek zkoumáme)
Základní pojmy
frekvence brigády
charakteristika brigády
180
70
ano
každý pracovní den
186
85
ano
nepravidelně
172 166 188
75 56 70
ano ano ano
nepravidelně Různě, 2-3 týdně 3 dny v tydnu
praxe v oboru během studia kancelářská práce a na ní navazující práce manuální při realizaci projektů praxe v oboru během studia Hlídání dětí praxe v oboru během studia
1.4.2016 10:41
muž
1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
muž žena žena
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
muž
Jak byste svou brigádu charakterizoval(a)?
1.4.2016 10:38
Jak často brigádu máte?
pohlaví
Přivyděláváte si v rámci prezenčního studia na brigádách?
Váha (kg)
Výška (cm)
Pohlaví
Časová značka
výška váha (cm) (kg)
ID
čas věnovaný brigádě (h/týden) 20
čas věnovaný studiu (h/týden) 15
30
20
5 12 24
36 10 26
Statistický znak – atribut statistické jednotky (to, co u stat. jednotek zkoumáme)
Základní pojmy
frekvence brigády
charakteristika brigády
180
70
ano
každý pracovní den
186
85
ano
nepravidelně
172 166 188
75 56 70
ano ano ano
nepravidelně Různě, 2-3 týdně 3 dny v tydnu
praxe v oboru během studia kancelářská práce a na ní navazující práce manuální při realizaci projektů praxe v oboru během studia Hlídání dětí praxe v oboru během studia
1.4.2016 10:41
muž
1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
muž žena žena
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
muž
Jak byste svou brigádu charakterizoval(a)?
1.4.2016 10:38
Jak často brigádu máte?
pohlaví
Přivyděláváte si v rámci prezenčního studia na brigádách?
Váha (kg)
Výška (cm)
Pohlaví
Časová značka
výška váha (cm) (kg)
ID
čas věnovaný brigádě (h/týden) 20
čas věnovaný studiu (h/týden) 15
30
20
5 12 24
36 10 26
Statistický znak – atribut statistické jednotky (to, co u stat. jednotek zkoumáme) Kvantitativní znak – znak, jehož varianty nabývají číselných hodnot
Základní pojmy
frekvence brigády
charakteristika brigády
180
70
ano
každý pracovní den
186
85
ano
nepravidelně
172 166 188
75 56 70
ano ano ano
nepravidelně Různě, 2-3 týdně 3 dny v tydnu
praxe v oboru během studia kancelářská práce a na ní navazující práce manuální při realizaci projektů praxe v oboru během studia Hlídání dětí praxe v oboru během studia
1.4.2016 10:41
muž
1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
muž žena žena
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
muž
Jak byste svou brigádu charakterizoval(a)?
1.4.2016 10:38
Jak často brigádu máte?
pohlaví
Přivyděláváte si v rámci prezenčního studia na brigádách?
Váha (kg)
Výška (cm)
Pohlaví
Časová značka
výška váha (cm) (kg)
ID
čas věnovaný brigádě (h/týden) 20
čas věnovaný studiu (h/týden) 15
30
20
5 12 24
36 10 26
Statistický znak – atribut statistické jednotky (to, co u stat. jednotek zkoumáme) Kvantitativní znak – znak, jehož varianty nabývají číselných hodnot
Základní pojmy
frekvence brigády
charakteristika brigády
180
70
ano
každý pracovní den
186
85
ano
nepravidelně
172 166 188
75 56 70
ano ano ano
nepravidelně Různě, 2-3 týdně 3 dny v tydnu
praxe v oboru během studia kancelářská práce a na ní navazující práce manuální při realizaci projektů praxe v oboru během studia Hlídání dětí praxe v oboru během studia
1.4.2016 10:41
muž
1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
muž žena žena
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
muž
Jak byste svou brigádu charakterizoval(a)?
1.4.2016 10:38
Jak často brigádu máte?
pohlaví
Přivyděláváte si v rámci prezenčního studia na brigádách?
Váha (kg)
Výška (cm)
Pohlaví
Časová značka
výška váha (cm) (kg)
ID
čas věnovaný brigádě (h/týden) 20
čas věnovaný studiu (h/týden) 15
30
20
5 12 24
36 10 26
Statistický znak – atribut statistické jednotky (to, co u stat. jednotek zkoumáme) Kvantitativní znak – znak, jehož varianty nabývají číselných hodnot Kvalitativní znak – znak, jehož varianty se liší kvalitou (může jít i o číselné hodnoty – např. známka z matematiky)
Základní pojmy
frekvence brigády
charakteristika brigády
180
70
ano
každý pracovní den
186
85
ano
nepravidelně
172 166 188
75 56 70
ano ano ano
nepravidelně Různě, 2-3 týdně 3 dny v tydnu
praxe v oboru během studia kancelářská práce a na ní navazující práce manuální při realizaci projektů praxe v oboru během studia Hlídání dětí praxe v oboru během studia
1.4.2016 10:41
muž
1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
muž žena žena
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
muž
Jak byste svou brigádu charakterizoval(a)?
1.4.2016 10:38
Jak často brigádu máte?
pohlaví
Přivyděláváte si v rámci prezenčního studia na brigádách?
Váha (kg)
Výška (cm)
Pohlaví
Časová značka
výška váha (cm) (kg)
ID
čas věnovaný brigádě (h/týden) 20
čas věnovaný studiu (h/týden) 15
30
20
5 12 24
36 10 26
Statistický znak – atribut statistické jednotky (to, co u stat. jednotek zkoumáme) Kvantitativní znak – znak, jehož varianty nabývají číselných hodnot Kvalitativní znak – znak, jehož varianty se liší kvalitou (může jít i o číselné hodnoty – např. známka z matematiky)
Základní pojmy
frekvence brigády
charakteristika brigády
180
70
ano
každý pracovní den
186
85
ano
nepravidelně
172 166 188
75 56 70
ano ano ano
nepravidelně Různě, 2-3 týdně 3 dny v tydnu
praxe v oboru během studia kancelářská práce a na ní navazující práce manuální při realizaci projektů praxe v oboru během studia Hlídání dětí praxe v oboru během studia
1.4.2016 10:41
muž
1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
muž žena žena
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
muž
Jak byste svou brigádu charakterizoval(a)?
1.4.2016 10:38
Jak často brigádu máte?
pohlaví
Přivyděláváte si v rámci prezenčního studia na brigádách?
Váha (kg)
Výška (cm)
Pohlaví
Časová značka
výška váha (cm) (kg)
ID
čas věnovaný brigádě (h/týden) 20
čas věnovaný studiu (h/týden) 15
30
20
5 12 24
36 10 26
Statistický znak – atribut statistické jednotky (to, co u stat. jednotek zkoumáme)
Kvantitativní znak – znak, jehož varianty nabývají číselných hodnot Kvalitativní znak – znak, jehož varianty se liší kvalitou (může jít i o číselné hodnoty – např. známka z matematiky) Alternativní znak – kvalitativní znak, který nabývá pouze dvou možných variant
Základní pojmy
frekvence brigády
charakteristika brigády
180
70
ano
každý pracovní den
186
85
ano
nepravidelně
172 166 188
75 56 70
ano ano ano
nepravidelně Různě, 2-3 týdně 3 dny v tydnu
praxe v oboru během studia kancelářská práce a na ní navazující práce manuální při realizaci projektů praxe v oboru během studia Hlídání dětí praxe v oboru během studia
1.4.2016 10:41
muž
1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
muž žena žena
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
muž
Jak byste svou brigádu charakterizoval(a)?
1.4.2016 10:38
Jak často brigádu máte?
pohlaví
Přivyděláváte si v rámci prezenčního studia na brigádách?
Váha (kg)
Výška (cm)
Pohlaví
Časová značka
výška váha (cm) (kg)
ID
čas věnovaný brigádě (h/týden) 20
čas věnovaný studiu (h/týden) 15
30
20
5 12 24
36 10 26
Statistický znak – atribut statistické jednotky (to, co u stat. jednotek zkoumáme)
Kvantitativní znak – znak, jehož varianty nabývají číselných hodnot Kvalitativní znak – znak, jehož varianty se liší kvalitou (může jít i o číselné hodnoty – např. známka z matematiky) Alternativní znak – kvalitativní znak, který nabývá pouze dvou možných variant
Popisná statistika aneb Jak jednoduše a přehledně prezentovat výsledky šetření? Část I. Kvalitativní znak
Popisná statistika – kvalitativní znak
frekvence brigády
charakteristika brigády
180
70
ano
každý pracovní den
186
85
ano
nepravidelně
172 166 188
75 56 70
ano ano ano
nepravidelně Různě, 2-3 týdně 3 dny v tydnu
praxe v oboru během studia kancelářská práce a na ní navazující práce manuální při realizaci projektů praxe v oboru během studia Hlídání dětí praxe v oboru během studia
1.4.2016 10:41
muž
1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
muž žena žena
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
muž
Jak byste svou brigádu charakterizoval(a)?
1.4.2016 10:38
Jak často brigádu máte?
pohlaví
Přivyděláváte si v rámci prezenčního studia na brigádách?
Váha (kg)
Výška (cm)
Pohlaví
Časová značka
výška váha (cm) (kg)
ID
čas věnovaný brigádě (h/týden) 20
čas věnovaný studiu (h/týden) 15
30
20
5 12 24
36 10 26
Popisná statistika – kvalitativní znak
frekvence brigády
charakteristika brigády
180
70
ano
každý pracovní den
186
85
ano
nepravidelně
172 166 188
75 56 70
ano ano ano
nepravidelně Různě, 2-3 týdně 3 dny v tydnu
praxe v oboru během studia kancelářská práce a na ní navazující práce manuální při realizaci projektů praxe v oboru během studia Hlídání dětí praxe v oboru během studia
1.4.2016 10:41
muž
1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
muž žena žena
POZOR na nutnost čištění databáze!
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
muž
Jak byste svou brigádu charakterizoval(a)?
1.4.2016 10:38
Jak často brigádu máte?
pohlaví
Přivyděláváte si v rámci prezenčního studia na brigádách?
Váha (kg)
Výška (cm)
Pohlaví
Časová značka
výška váha (cm) (kg)
ID
čas věnovaný brigádě (h/týden) 20
čas věnovaný studiu (h/týden) 15
30
20
5 12 24
36 10 26
Popisná statistika – kvalitativní znak
frekvence brigády
charakteristika brigády
ano ano ano ano ano
každý pracovní den nepravidelně nepravidelně jinak jinak
praxe v oboru během studia jinak praxe v oboru během studia jinak praxe v oboru během studia
POZOR na nutnost čištění databáze!
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
70 85 75 56 70
Jak byste svou brigádu charakterizoval(a)?
180 186 172 166 188
Jak často brigádu máte?
muž muž muž žena žena
výška váha (cm) (kg)
Přivyděláváte si v rámci prezenčního studia na brigádách?
1.4.2016 10:38 1.4.2016 10:41 1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
Váha (kg)
pohlaví
Výška (cm)
Pohlaví
Časová značka ID
čas věnovaný brigádě (h/týden) 20 30 5 12 24
čas věnovaný studiu (h/týden) 15 20 36 10 26
Popisná statistika – kvalitativní znak Rozdělení četnosti
+ Modus (název nejčetnější varianty)
Popisná statistika – kvalitativní znak Rozdělení četnosti
Popisná statistika – kvalitativní znak Rozdělení četnosti
Jak zaokrouhlovat relativní četnost?
1% … 0,85 osob 0,1% … 0,085 osob
Popisná statistika – kvalitativní znak Rozdělení četnosti
POZOR na zaokrouhlovací chybu!
Jak zaokrouhlovat relativní četnost?
1% … 0,85 osob 0,1% … 0,085 osob
Popisná statistika – kvalitativní znak Rozdělení četnosti
POZOR na zaokrouhlovací chybu! Dopočet do 100%!
Jak zaokrouhlovat relativní četnost?
1% … 0,85 osob 0,1% … 0,085 osob
Popisná statistika – kvalitativní znak Rozdělení četnosti
Relativní četnosti uvádějme vždy pouze jako doplněk absolutních četností, nikoliv samostatně!
Popisná statistika – kvalitativní znak Rozdělení četnosti
Modus = muž (Mezi respondenty převažovali muži.)
Popisná statistika – kvalitativní znak Jak výsledky vizualizovat?
Popisná statistika – kvalitativní znak Sloupcový graf (Bar Chart) 70
počet respondentů
60 50 40 30 20
10 0 muž
žena
Popisná statistika – kvalitativní znak Sloupcový graf (Bar Chart) 70
počet respondentů
60 50 40 30 20
10 0 muž
žena
Popisná statistika – kvalitativní znak Sloupcový graf (Bar Chart) 70
počet respondentů
60 50 40 30 20
10 0 muž
žena
Popisná statistika – kvalitativní znak Sloupcový graf (Bar Chart)
počet respondentů
66
19
muž
žena
Popisná statistika – kvalitativní znak
počet respondentů
Sloupcový graf (Bar Chart)
66
19 muž
žena
241
240
Určete pravdivost tvrzení: V žádných dvou letech nebyl počet studentů stejný.
Zdroj: Testové příklady určené žákům 9. tříd.
Popisná statistika – kvalitativní znak
70
70
60
60
počet respondentů
počet respondentů
Sloupcový graf (Bar Chart)
50 40 30
20
50 40 30
10
0
0 žena
19
20
10 muž
66
muž
žena
Nejsou-li v grafu uvedeny absolutní četnosti, obvykle je nedokážeme „od oka“ přesně odečíst.
Popisná statistika – kvalitativní znak Sloupcový graf (Bar Chart) 70
66
80
78
70
60
60
50
50
40
40
30 19
20
30 20
10
10
0
0 muž
žena
22
muž
žena
Nejsou-li v grafu uvedeny absolutní (relativní) četnosti, obvykle je nedokážeme „od oka“ přesně odečíst.
Popisná statistika – kvalitativní znak Sloupcový graf (Bar Chart) 66
80
počet respondentů
60 50
40 30 19
20 10 0
relativní počet respondentů (%)
70
78
70 60 50 40
30
22
20 10 0
muž
žena
muž
žena
Nejsou-li v grafu uvedeny absolutní (relativní) četnosti, obvykle je nedokážeme „od oka“ přesně odečíst. Pozor na uvádění popisu os!
Popisná statistika – kvalitativní znak Výsečový graf
19; 22%
muž žena
66; 78%
Popisná statistika – kvalitativní znak Prstencový graf 19; 22% muž žena
66; 78%
Popisná statistika – kvalitativní znak Výsečový graf 19; 22%
muž žena
66; 78%
Popisná statistika – kvalitativní znak Výsečový graf 66; 78%
muž žena
19; 22%
Anketa Jste pro navýšení hodinové dotace matematiky?
TAKHLE NE!!!
Zdroj: Testové příklady určené žákům 9. tříd. Co je to A, B, C, D?
Jsou výseče odpovídající variantám B a D stejně velké?
Lze velikosti jednotlivých výsečí charakterizovat v absolutních číslech i v procentech?
Určete pravdivost tvrzení: a) Místo otazníku patří 20%. b) Místo otazníku patří 126 Kč. c) Část C je dvojnásobkem části D. Rozdělení četností kvalitativního znaku se znázorňuje kruhovým diagramem, kde různým hodnotám znaku odpovídají kruhové výseče, jejichž plošné obsahy jsou úměrné četnostem. (Prometheus)
Popisná statistika aneb Jak jednoduše a přehledně prezentovat výsledky šetření? Část II. Kvantitativní znak
Popisná statistika – kvantitativní znak
frekvence brigády
charakteristika brigády
ano ano ano ano ano
každý pracovní den nepravidelně nepravidelně jinak jinak
praxe v oboru během studia jinak praxe v oboru během studia jinak praxe v oboru během studia
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
70 85 75 56 70
Jak byste svou brigádu charakterizoval(a)?
180 186 172 166 188
Jak často brigádu máte?
muž muž muž žena žena
výška váha (cm) (kg)
Přivyděláváte si v rámci prezenčního studia na brigádách?
1.4.2016 10:38 1.4.2016 10:41 1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
Váha (kg)
pohlaví
Výška (cm)
Pohlaví
Časová značka ID
čas věnovaný brigádě (h/týden) 20 30 5 12 24
čas věnovaný studiu (h/týden) 15 20 36 10 26
Popisná statistika – kvantitativní znak
frekvence brigády
charakteristika brigády
ano ano ano ano ano
každý pracovní den nepravidelně nepravidelně jinak jinak
praxe v oboru během studia jinak praxe v oboru během studia jinak praxe v oboru během studia
Míry polohy (aritmetický průměr, kvantily) Míry variability (rozptyl, směrodatná odchylka, variační koeficient) Odlehlá pozorování
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
70 85 75 56 70
Jak byste svou brigádu charakterizoval(a)?
180 186 172 166 188
Jak často brigádu máte?
muž muž muž žena žena
výška váha (cm) (kg)
Přivyděláváte si v rámci prezenčního studia na brigádách?
1.4.2016 10:38 1.4.2016 10:41 1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
Váha (kg)
pohlaví
Výška (cm)
Pohlaví
Časová značka ID
čas věnovaný brigádě (h/týden) 20 30 5 12 24
čas věnovaný studiu (h/týden) 15 20 36 10 26
Popisná statistika – kvantitativní znak Míry polohy
Aritmetický průměr: 𝑥ҧ =
σ𝑛 𝑖=1 𝑥𝑖 𝑛
POZOR! Průměr je číslo, které nemusí patřit do definičního oboru analyzovaného znaku. (např. průměrný počet dětí jedné ženy)
Popisná statistika – kvantitativní znak Míry polohy
Aritmetický průměr: 𝑥ҧ =
σ𝑛 𝑖=1 𝑥𝑖 𝑛
V malé vesnici někde v Americe žije 6 lidí, jejichž roční plat je uveden níže. $25 000 $27 000 $29 000 $35 000 $37 000 $38 000 Určete průměrný plat obyvatel této vesnice. ($31 830) Do vesnice se přistěhoval Bill Gates, jehož roční příjem je $40 000 000. $25 000 $27 000 $29 000 $35 000 $37 000 $38 000 $40 000 000 Určete průměrný plat obyvatel této vesnice. ($5 741 571)
Popisná statistika – kvantitativní znak Míry polohy
Aritmetický průměr: 𝑥ҧ =
σ𝑛 𝑖=1 𝑥𝑖 𝑛
POZOR! Průměr je číslo, které nemusí patřit do definičního oboru analyzovaného znaku. (např. průměrný počet dětí jedné ženy)
Průměr není rezistentní vůči odlehlým pozorováním.
Popisná statistika – kvantitativní znak Míry polohy
Aritmetický průměr: 𝑥ҧ =
σ𝑛 𝑖=1 𝑥𝑖 𝑛
Medián 𝑴𝒆𝒅 (50% kvantil – 50% hodnot je menších nebo rovných mediánů) Dolní kvartil 𝑸𝟏 (25% kvantil – 25% hodnot je menších nebo rovných dolnímu kvartilu) Horní kvartil 𝑸𝟑 (75% kvantil – 75% hodnot je menších nebo rovných hornímu kvartilu)
100p% kvantil – 100p% hodnot je menších nebo rovných 100p% kvantilu
Popisná statistika – kvantitativní znak Míry polohy Míry polohy minimum dolní kvartil průměr medián horní kvartil maximum
140 130 120
100p% kvantil váhy (kg)
110 100 90 80 70 60 50 40 30 20 10 0 0
10
20
30
40
50
60
100p%
Kvantilová funkce
70
80
90
100
Váha (kg) 50 68 78 76 85 130
Popisná statistika – kvantitativní znak Míry polohy 18 16 12
10 8 6 4 2
váha (kg)
Histogram
Další
130
125
120
115
110
105
100
95
90
85
80
75
70
65
60
55
0
50
Četnost
14
Míry polohy minimum dolní kvartil průměr medián horní kvartil maximum
Váha (kg) 50 68 78 76 85 130
Popisná statistika – kvantitativní znak Míry polohy 30 25
Četnost
20 15 10 5 0 50
59
68
77
86
94
103
112
121
Další
váha (kg)
Histogram
Tvar histogramu závisí na počtu tříd („sloupečků“).
Míry polohy minimum dolní kvartil průměr medián horní kvartil maximum
Váha (kg) 50 68 78 76 85 130
Popisná statistika – kvantitativní znak Míry polohy 30 25
Četnost
20 15 10 5 0 50
59
68
77
86
94
váha (kg)
Histogram
103
112
121
Další
Míry polohy minimum dolní kvartil průměr medián horní kvartil maximum
Váha (kg) 50 68 78 76 85 130
Popisná statistika – kvantitativní znak Odlehlá pozorování váha - rozptylogram 1 0 40
60
80
100
váha (kg)
120
140
Míry polohy minimum dolní kvartil průměr medián horní kvartil maximum
Váha (kg) 50 68 78 76 85 130
Popisná statistika – kvantitativní znak Odlehlá pozorování 1 0 40
60
80
100
váha (kg)
medián
120
140
Míry polohy minimum dolní kvartil průměr medián horní kvartil maximum
Váha (kg) 50 68 78 76 85 130
Popisná statistika – kvantitativní znak Odlehlá pozorování 1 0 40
60
80
100
120
váha (kg)
dolní kvartil
horní kvartil
140
Míry polohy minimum dolní kvartil průměr medián horní kvartil maximum
medián Mezikvartilové rozpětí: 𝐼𝑄𝑅 = 𝑄3 − 𝑄1 𝑥 < 𝑄1 − 1,5 ∙ 𝐼𝑄𝑅 ∨ 𝑥 > 𝑄3 + 1,5 ∙ 𝐼𝑄𝑅
vnitřní hradby
⇒ 𝑥 je odlehlé pozorování
Váha (kg) 50 68 78 76 85 130
Popisná statistika – kvantitativní znak Odlehlá pozorování
1 0 40
60
80
100
120
váha (kg)
dolní kvartil
horní kvartil
140
Míry polohy minimum dolní kvartil průměr medián horní kvartil maximum
medián Mezikvartilové rozpětí: 𝐼𝑄𝑅 = 𝑄3 − 𝑄1 𝑥 < 𝑄1 − 1,5 ∙ 𝐼𝑄𝑅 ∨ 𝑥 > 𝑄3 + 1,5 ∙ 𝐼𝑄𝑅
vnitřní hradby
⇒ 𝑥 je odlehlé pozorování
Váha (kg) 50 68 78 76 85 130
Popisná statistika – kvantitativní znak Odlehlá pozorování
1 0 40
60
80
100
120
váha (kg)
dolní kvartil
horní kvartil medián
140
Míry polohy minimum dolní kvartil průměr medián horní kvartil maximum
Váha (kg) 50 68 78 76 85 130
Váha* (kg) 50 68 77 75 83 105
*po odstranění odlehlých pozorování Mezikvartilové rozpětí: 𝐼𝑄𝑅 = 𝑄3 − 𝑄1 𝑥 < 𝑄1 − 1,5 ∙ 𝐼𝑄𝑅 ∨ 𝑥 > 𝑄3 + 1,5 ∙ 𝐼𝑄𝑅
vnitřní hradby
⇒ 𝑥 je odlehlé pozorování
Popisná statistika – kvantitativní znak Míry variability
Výběrový rozptyl:
𝑠2
=
2 σ𝑛 𝑖=1 𝑥𝑖 −𝑥ҧ
𝑛−1
POZOR! – Jednotka rozptylu je kvadrátem jednotky analyzovaného znaku. Výběrová směrodatná odchylka: 𝑠 =
2 σ𝑛 𝑖=1 𝑥𝑖 −𝑥ҧ
𝑛−1
Neumožňuje srovnání variability znaků s různými jednotkami.
Variační koeficient: 𝑉 =
𝑠 𝑥ҧ
∙ 100 %
Čím nižší var. koeficient, tím homogennější soubor. 𝑉 > 50% značí silně rozptýlený soubor.
Popisná statistika – kvantitativní znak Míry variability Váha (kg) rozptyl 215,3893 směrodatná odchylka 14,67615 variační koeficient (%) 18,90576 *po odstranění odlehlých pozorování
Váha* (kg) 169,5506311 13,0211609 17,0078917
Jak zaokrouhlovat výběrové charakteristiky? Směrodatnou odchylku jakožto míru nejistoty měření zaokrouhlujeme nahoru na jednu, maximálně dvě platné cifry a míry polohy (průměr, kvantily…) zaokrouhlujeme tak, aby nejnižší zapsaný řád odpovídal nejnižšímu zapsanému řádu směrodatné odchylky.
Popisná statistika – kvantitativní znak Jak zaokrouhlovat výběrové charakteristiky? Směrodatnou odchylku jakožto míru nejistoty měření zaokrouhlujeme nahoru na jednu, maximálně dvě platné cifry a míry polohy (průměr, kvantily…) zaokrouhlujeme tak, aby nejnižší zapsaný řád odpovídal nejnižšímu zapsanému řádu směrodatné odchylky. Míry polohy minimum dolní kvartil průměr medián horní kvartil maximum Míry variability směrodatná odchylka variační koeficient (%)
Váha (kg) 50 68 77,62791 75,5 84,5 130 14,67615 18,90576
zaokrouhleno
Popisná statistika – kvantitativní znak Jak zaokrouhlovat výběrové charakteristiky? Směrodatnou odchylku jakožto míru nejistoty měření zaokrouhlujeme nahoru na jednu, maximálně dvě platné cifry a míry polohy (průměr, kvantily…) zaokrouhlujeme tak, aby nejnižší zapsaný řád odpovídal nejnižšímu zapsanému řádu směrodatné odchylky. Míry polohy minimum dolní kvartil průměr medián horní kvartil maximum Míry variability směrodatná odchylka variační koeficient (%)
Váha (kg) 50 68 77,62791 75,5 84,5 130
zaokrouhleno
14,67615 18,90576
15
Popisná statistika – kvantitativní znak Jak zaokrouhlovat výběrové charakteristiky? Směrodatnou odchylku jakožto míru nejistoty měření zaokrouhlujeme nahoru na jednu, maximálně dvě platné cifry a míry polohy (průměr, kvantily…) zaokrouhlujeme tak, aby nejnižší zapsaný řád odpovídal nejnižšímu zapsanému řádu směrodatné odchylky. Míry polohy minimum dolní kvartil průměr medián horní kvartil maximum Míry variability směrodatná odchylka variační koeficient (%)
Váha (kg) 50 68 77,62791 75,5 84,5 130
zaokrouhleno 50 68 78 76 85 130
14,67615 18,90576
15
Popisná statistika – kvantitativní znak Jak zaokrouhlovat výběrové charakteristiky? Směrodatnou odchylku jakožto míru nejistoty měření zaokrouhlujeme nahoru na jednu, maximálně dvě platné cifry a míry polohy (průměr, kvantily…) zaokrouhlujeme tak, aby nejnižší zapsaný řád odpovídal nejnižšímu zapsanému řádu směrodatné odchylky. Míry polohy minimum dolní kvartil průměr medián horní kvartil maximum Míry variability směrodatná odchylka variační koeficient (%)
Váha (kg) 50 68 77,62791 75,5 84,5 130
zaokrouhleno 50 68 78 76 85 130
14,67615 18,90576
15 18,9
zaokrouhlujeme na desetiny %
Popisná statistika aneb Jak jednoduše a přehledně prezentovat výsledky šetření? Část III. Analýza závislosti dvou kvantitativních znaků
Analýza závislosti dvou kvantitativních znaků
frekvence brigády
charakteristika brigády
ano ano ano ano ano
každý pracovní den nepravidelně nepravidelně jinak jinak
praxe v oboru během studia jinak praxe v oboru během studia jinak praxe v oboru během studia
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
70 85 75 56 70
Jak byste svou brigádu charakterizoval(a)?
180 186 172 166 188
Jak často brigádu máte?
muž muž muž žena žena
výška váha (cm) (kg)
Přivyděláváte si v rámci prezenčního studia na brigádách?
1.4.2016 10:38 1.4.2016 10:41 1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
Váha (kg)
pohlaví
Výška (cm)
Pohlaví
Časová značka ID
čas věnovaný brigádě (h/týden) 20 30 5 12 24
čas věnovaný studiu (h/týden) 15 20 36 10 26
Analýza závislosti dvou kvantitativních znaků
frekvence brigády
charakteristika brigády
ano ano ano ano ano
každý pracovní den nepravidelně nepravidelně jinak jinak
praxe v oboru během studia jinak praxe v oboru během studia jinak praxe v oboru během studia
Vizualizace – bodový graf Korelační koeficient
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
70 85 75 56 70
Jak byste svou brigádu charakterizoval(a)?
180 186 172 166 188
Jak často brigádu máte?
muž muž muž žena žena
výška váha (cm) (kg)
Přivyděláváte si v rámci prezenčního studia na brigádách?
1.4.2016 10:38 1.4.2016 10:41 1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
Váha (kg)
pohlaví
Výška (cm)
Pohlaví
Časová značka ID
čas věnovaný brigádě (h/týden) 20 30 5 12 24
čas věnovaný studiu (h/týden) 15 20 36 10 26
Analýza závislosti dvou kvantitativních znaků Vizualizace – bodový graf Výběrový korelační koeficient:
110 100
σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത 1 𝑟= ∙ 𝑛−1 𝑠𝑋 ∙ 𝑠𝑌
váha (kg)
90 80 70 60 50 40 160
170
180 výška (cm)
190
200
Analýza závislosti dvou kvantitativních znaků Vizualizace – bodový graf Výběrový korelační koeficient:
110 100
σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത 1 𝑟= ∙ 𝑛−1 𝑠𝑋 ∙ 𝑠𝑌
váha (kg)
90 80 70 60 50 40 160
170
180 výška (cm)
190
200
Analýza závislosti dvou kvantitativních znaků Vizualizace – bodový graf Výběrový korelační koeficient:
110 100
σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത 1 𝑟 𝑋, 𝑌 = ∙ 𝑛−1 𝑠𝑋 ∙ 𝑠𝑌
váha (kg)
90 80 70 60 50 40 160
170
180 výška (cm)
190
200
Analýza závislosti dvou kvantitativních znaků Vizualizace – bodový graf Výběrový korelační koeficient: 𝑟 𝑋, 𝑌 =
σ𝑛 𝑥 −𝑥ҧ 𝑦𝑖 −𝑦ത 1 ∙ 𝑖=1 𝑖 𝑛−1 𝑠𝑋 ∙𝑠𝑌
1. −1 ≤ 𝑟 𝑋, 𝑌 ≤ 1, 2. 𝑟 𝑋, 𝑌 = 𝑟 𝑌, 𝑋 , 3. 𝑟 𝑋, 𝑋 = 1, 4.
je-li 𝑟 𝑋, 𝑌 = 0, říkáme, že 𝑋, 𝑌 jsou nekorelované náhodné veličiny,
5.
je-li 𝑟 𝑋, 𝑌 > 0, říkáme, že 𝑋, 𝑌 jsou pozitivně korelované (s rostoucím 𝑋 roste 𝑌),
6.
je-li 𝑟 𝑋, 𝑌 < 0, říkáme, že 𝑋, 𝑌 jsou negativně korelované (s rostoucím 𝑋 klesá 𝑌),
7.
je-li 𝑟 𝑋, 𝑌
= 1, pak je mezi 𝑋 a 𝑌 lineární závislost.
Korelační koeficient y 25
20 15 10 5 0 0
10 x
20
Korelační koeficient y 25
20 15 10 5
𝑟=1
0 0
10 x
20
Korelační koeficient y 25
y 20
20
15
15
10
10 5
5
𝑟=1
0
0 0
10 x
20
0
10 x
20
Korelační koeficient y 25
y 20
20
15
15
𝑟=−1
10
10 5
5
𝑟=1
0
0 0
10 x
20
0
10 x
20
Korelační koeficient y 25
20 15
y 20
y 25
15
20
10
10 5
𝑟=1
0 0
10 x
20
15
𝑟=−1
10
5
5
0
0 0
10 x
20
0
10 x
20
Korelační koeficient y 25
20 15
y 20
y 25
15
20
5
𝑟=1
0 0
10 x
20
15
𝑟=−1
10
10
𝑟=0,10
10
5
5
0
0 0
10 x
20
0
10 x
20
Korelační koeficient y 25
20 15
y 20
y 25
15
20
5
𝑟=1
0 0
10
20
y 25 20 15 10 5 0 0
10 x
10
5
5
0
0 0
10 x
x
20
15
𝑟=−1
10
10
𝑟=0,10
20
0
10 x
20
Korelační koeficient y 25
20 15
y 20
y 25
15
20
5
𝑟=1
0 0
10
20
y 25 20 15 10 5
𝑟=0,88
0 0
10
5
5
0
0 0
10 x
x
10 x
20
15
𝑟=−1
10
10
𝑟=0,10
20
0
10 x
20
Korelační koeficient y 25
y 20
y 25
20
15
20
15 10 5
15
𝑟=−1
10
10
5
𝑟=1
5
0
0 0
10
0
20 y 25
20
20
15
15
10
10
5
5 𝑟=0,88
0 0
10 x
10
20
x
x y 25
0
10 x
0 0
10 x
0 20
𝑟=0,10
20
20
Korelační koeficient y 25
y 20
y 25
20
15
20
15 10 5
15
𝑟=−1
10
10
5
𝑟=1
5
0
0 0
10
0
20 y 25
20
20
15
15
10
10
5
5
𝑟=0,88
0 0
10 x
20
0
10 x
0 0
10 x
𝑟=−0,86
0 20
10 x
x y 25
𝑟=0,10
20
20
Korelační koeficient y 25
y 20
y 25
20
15
20
15 10 5
15
𝑟=−1
10
10
5
𝑟=1
5
0
0 0
10
0
20 y 25
20
20
15
15
10
10
5
5
𝑟=0,88
0 0
10 x
20
0
0
10 x
10
20
x y 70 60 50 40 30 20 10 0
𝑟=−0,86
0 20
10
0
x
x y 25
𝑟=0,10
20
0
10 x
20
Korelační koeficient y 25
20 15
y 20
y 25
15
20
5
𝑟=1
0 0
10
10
5
5
0
0 0
20
y 25
y 25
20
20
15
15
10
10
5
5
𝑟=0,88 0
10 x
10
20
0
x
x
0
15
𝑟=−1
10
10
𝑟=0,10
20
0
10 x
20
x y 70 60 50 40 30 20 10 0
𝑟=−0,86
0
10
20
𝑟=0,04
0
10 x
20
Korelační koeficient y 3,5 3 2,5 2 1,5 1 0,5 0 0
10 x
20
Korelační koeficient y 3,5 3 2,5 2 1,5 1 0,5 0
𝑟=0,93 0
10 x
20
Korelační koeficient y 100
y 3,5 3 2,5 2 1,5 1 0,5 0
80
60 40 20 𝑟=0,93 0
10 x
0 20
0
10
x
20
Korelační koeficient y 100
y 3,5 3 2,5 2 1,5 1 0,5 0
80
60 𝑟=0
40 20 𝑟=0,93 0
10 x
0 20
0
10
x
20
Korelační koeficient y 100
y 3,5 3 2,5 2 1,5 1 0,5 0
80
60 𝑟=0
40 20 𝑟=0,93 0
10
0 20
x y 70 60 50 40 30 20 10 0 0 10 20 30 40 50 60 x
0
10
x
20
Korelační koeficient y 100
y 3,5 3 2,5 2 1,5 1 0,5 0
80
60 𝑟=0
40 20 𝑟=0,93 0
10
0 0
20
20
x
x y 70 60 50 40 30 20 10 0
10
y 70 60 50 40 30 20 10 0
𝑟=−0,85
0 10 20 30 40 50 60
0 10 20 30 40 50 60
x
x
Analýza závislosti dvou kvantitativních znaků Vizualizace – bodový graf Výběrový korelační koeficient:
110 100
𝑟 = 0,6146
váha (kg)
90 80 70 60 50 40 160
170
180 výška (cm)
190
200
Analýza závislosti dvou kvantitativních znaků Vizualizace – bodový graf Výběrový korelační koeficient:
140
váha (kg)
120
𝑟 = 0,6146 vs. 𝑟 = 0,2832
100 80 60 40 140
150
160
170 výška (cm)
180
190
200
Analýza závislosti dvou kvantitativních znaků
frekvence brigády
charakteristika brigády
ano ano ano ano ano
každý pracovní den nepravidelně nepravidelně jinak jinak
praxe v oboru během studia jinak praxe v oboru během studia jinak praxe v oboru během studia
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
70 85 75 56 70
Jak byste svou brigádu charakterizoval(a)?
180 186 172 166 188
Jak často brigádu máte?
muž muž muž žena žena
výška váha (cm) (kg)
Přivyděláváte si v rámci prezenčního studia na brigádách?
1.4.2016 10:38 1.4.2016 10:41 1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
Váha (kg)
pohlaví
Výška (cm)
Pohlaví
Časová značka ID
čas věnovaný brigádě (h/týden) 20 30 5 12 24
čas věnovaný studiu (h/týden) 15 20 36 10 26
Analýza závislosti dvou kvantitativních znaků
frekvence brigády
charakteristika brigády
ano ano ano ano ano
každý pracovní den nepravidelně nepravidelně jinak jinak
praxe v oboru během studia jinak praxe v oboru během studia jinak praxe v oboru během studia
Kolik času týdně obvykle věnujete studiu?
brigáda
Kolik času týdně obvykle věnujete brigádě?
70 85 75 56 70
Jak byste svou brigádu charakterizoval(a)?
180 186 172 166 188
Jak často brigádu máte?
muž muž muž žena žena
výška váha (cm) (kg)
Přivyděláváte si v rámci prezenčního studia na brigádách?
1.4.2016 10:38 1.4.2016 10:41 1.4.2016 10:41 1.4.2016 10:45 1.4.2016 10:52
Váha (kg)
pohlaví
Výška (cm)
Pohlaví
Časová značka ID
čas věnovaný brigádě (h/týden) 20 30 5 12 24
čas věnovaný studiu (h/týden) 15 20 36 10 26
Analýza závislosti dvou kvantitativních znaků
obvyklý čas strávený v týdnu studiem (h)
Vizualizace – bodový graf Výběrový korelační koeficient:
80 70
𝑟 = −0,1370 vs. 𝑟 = 0,2027
60 50 40 30 20 10 0 0
10
20
30
40
50
obvyklý čas strávený v týdnu na brigádě (h)
60
70
Analýza závislosti dvou kvantitativních znaků Vizualizace – bodový graf obvyklý čas strávený v týdnu studiem (h)
80
Výběrový korelační koeficient:
70 60
𝑟 = −0,1370
50 40 30 20 10 0 0
10
20
30
40
50
obvyklý čas strávený v týdnu na brigádě (h)
60
70
Korelační koeficient Pokud jsou dvě náhodné veličiny korelované, znamená to pouze to, že jsou lineárně závislé. Nelze z toho však ještě usoudit, že by jedna z nich musela být příčinou a druhá následkem. To samotná korelovanost nedovoluje rozhodnout.
Silná korelace
Korelační koeficient Pokud jsou dvě náhodné veličiny korelované, znamená to pouze to, že jsou lineárně závislé.
10
35
9
30
8 7
25
6
20
5
𝑟=0,99
4 3
15 10
2
5
1 0 1998
2000
2002
2004
2006
2008
0 2010
Sebevraždy oběšením a uškrcením (počet mertvých v USA) Americké výdaje na vědu, vesmírná výzkum a technologie (miliardy dolarů)
Americké výdaje na vědu, vesmírná výzkum a technologie (miliardy dolarů)
tisíce
Sebevraždy oběšením a uškrcením (počet mertvých v USA)
Nelze z toho však ještě usoudit, že by jedna z nich musela být příčinou a druhá následkem. To samotná korelovanost nedovoluje rozhodnout.
Zdroj: http://zpravy.aktualne.cz/zahranici/k-nobelove-cene-dopomahacokolada-naznacuje-studie/r~i:article:760147/
Korelační koeficient V praxi se zpravidla hodnota koeficientu korelace interpretuje takto: Korelační koeficient
Typ lineární závislosti
𝑟 = 0,0
neexistující
𝑟 ∈ ሺ0,0; 0,3ۧ
velmi slabá
𝑟 ∈ ሺ0,3; 0,7ۧ
středně silná
𝑟 ∈ ሺ0,7; 1,0ሻ
těsná
𝑟 = 1,0
funkční
• Mezi proudem a napětím na odporu byl zjištěn korelační koeficient 0,6. • Mezi školním prospěchem a pocitem deprese u dětí byl zjištěn korelační koeficient 0,6. Výsledky interpretujte!
DĚKUJI ZA POZORNOST!