KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA Charakteristiky variability
Mgr. Jakub Němec
VY_32_INOVACE_M4r0120
CHARAKTERISTIKY VARIABILITY Charakteristika variability se určuje pouze u kvantitativních znaků. Mimo četnost a charakteristiky polohy, které jsme si představovali v minulých lekcích, existují ještě tzv. charakteristiky variability, které jsou v podstatě založeny na vlastnostech charakteristik polohy. Charakteristiky variability nám říkají, jaké hodnoty kolem charakteristik polohy kolísají – např. chodí v průměru o pět minut pozdě (charakteristika polohy), + – dvě minuty (charakteristika variability).
ROZPTYL
Základní charakteristikou variability je tzv. rozptyl, značíme 𝒔𝟐𝒙 . Má podobnou funkci jako aritmetický průměr pro charakteristiky polohy. Jejich kombinací hodnotíme vlastnosti většiny statistických souborů. Rozptyl nám přibližuje, jak jsou velké odchylky hodnot souboru od aritmetického průměru. Čím větší hodnotu dostaneme, tím je rozptyl souboru větší. Pokud je hodnota rozptylu nula, mají všechny prvky statistického souboru stejnou hodnotu, rozptyl je tedy nulový. Vztah pro výpočet rozptylu je následující, kde n je počet prvků, kde x prvek souboru a kde 𝑥 aritmetický průměr:
𝒔𝟐𝒙
𝟏 𝒏
= ∙
𝒏 𝒊=𝟏
𝒙𝒊 − 𝒙
𝟐
=
𝒙𝟏 −𝒙 𝟐 + 𝒙𝟐 −𝒙 𝟐 +⋯+ 𝒙𝒏 −𝒙 𝟐 𝒏
Podobně jako u aritmetického průměru jej lze zjednodušit:
𝒔𝟐𝒙 =
𝒙𝟏 − 𝒙
𝟐
∙ 𝒌𝟏 + 𝒙 𝟐 − 𝒙
𝟐
∙ 𝒌𝟐 + ⋯ + 𝒙 𝒓 − 𝒙
𝟐
∙ 𝒌𝒓
𝒏
kde 𝑘1 + 𝑘2 + ⋯ + 𝑘𝑟 = 𝑛 a 𝑟 ∈ ℕ odpovídá počtu různých prvků.
SMĚRODATNÁ ODCHYLKA
Směrodatnou odchylku, značíme 𝒔𝒙 , využijeme v případech, kdy charakterizujeme soubor, v němž se hodnoty měří pomocí fyzikálních veličin. Hodnota rozptylu je totiž v druhých mocninách jednotek, což je pro soubory tohoto typu nevhodné. Díky této hodnotě zjistíme, o kolik jsme se při jednotlivých měřeních průměrně odchýlili, tedy zhodnotí nepřesnost měření. Úpravou vzorce pro rozptyl získáme vztah pro směrodatnou odchylku, kde n je počet prvků, kde x prvek souboru a kde 𝑥 aritmetický průměr: 𝑠𝑥 =
𝟏 𝒏
∙
𝒏 𝒊=𝟏
𝒙𝒊 − 𝒙
𝟐
=
𝒙𝟏 −𝒙 𝟐 + 𝒙𝟐 −𝒙 𝟐 +⋯+ 𝒙𝒏 −𝒙 𝟐 𝒏
Po úpravě:
𝑠𝑥 =
𝒙𝟏 −𝒙 𝟐 ∙𝒌𝟏 + 𝒙𝟐 −𝒙 𝟐 ∙𝒌𝟐 +⋯+ 𝒙𝒓 −𝒙 𝟐 ∙𝒌𝒓 𝒏
VARIAČNÍ KOEFICIENT Pokud chceme zjistit přesnost, resp. nepřesnost měření určitého pokusu, je vhodné využít směrodatnou odchylku. Pokud chceme tuto odchylku vyjádřit pomocí procent, je vhodné využít variační koeficient, značíme 𝒗𝒙 . Znaky souboru, na nějž chceme aplikovat variační koeficient, musí mít nezáporné hodnoty. Vztah pro variační koeficient, kde 𝑠𝑥 je směrodatná odchylka a kde 𝑥 je aritmetický průměr: 𝒔 𝒗𝒙 = 𝒙 ∙ 𝟏𝟎𝟎%
𝒙
Petr měřil ve stejných intervalech pokojovou teplotu. Během hodiny naměřil tyto hodnoty: 21,3 °C, 22,1 °C, 21,7 °C, 21,9 °C, 22 °C, 21,5°C, 22,1 °C, 21,9 °C, 22,3 °C a 21,6 °C. Urči přesnost jeho měření pomocí směrodatné odchylky a variačního koeficientu. Teplota v °C Počet
21,3 1
21,5 1
21,6 1
21,7 1
21,9 2
22 1
22,1 2
22,3 1
21,3 + 21,5 + 21,6 + 21,7 + 2 ∙ 21,9 + 22 + 2 ∙ 22,1 + 22,3 = 10 218,4 𝑥= = 𝟐𝟏, 𝟖𝟒 10 𝑥=
21,3 − 21,84 2 + 21,5 − 21,84 2 + 21,6 − 21,84 2 + 21,7 − 21,84 2 + +2 ∙ 21,9 − 21,84 2 + 22 − 21,84 2 + 2 ∙ 22,1 − 21,84 2 + 22,3 − 21,84 2 𝑠𝑥2 = = 10
0,2916 + 0,1156 + 0,0576 + 0,0196 + +0,0072 + 0,0256 + 0,1352 + 0,2116 0,864 𝑠𝑥2 = = = 𝟎, 𝟎𝟖𝟔𝟒 10 10
𝑠𝑥 = 𝑣𝑥 =
0,0864 = 𝟎, 𝟐𝟗𝟑𝟗𝟒 0,29394 ∙ 100% = 𝟏, 𝟑𝟓% 21,84
Nejprve si určíme tabulku absolutní četnosti.
Určíme si aritmetický průměr. Poté aplikujeme vzorec pro výpočet rozptylu.
Výsledek použijeme pro zjištění směrodatné odchylky. Hodnotu směrodatné odchylky a aritmetického průměru využijeme pro zjištění variačního koeficientu.
MEZIKVARTILOVÁ ODCHYLKA
Mezikvartilová odchylka, značíme 𝑸 𝒙 , pohlíží na statistický soubor jinou optikou, podobně jako u charakteristik polohy modus a medián. Její využití záleží na zkušenosti statistika, který určí postup analýzy souboru. Využívá se především v případech, kdy je soubor ovlivněn jednou extrémní hodnotou. Pro zjištění hodnoty mezikvartilové odchylky je potřeba znát tzv. první (𝑄1 )a třetí (𝑄3 ) kvartil, které získáme tak, že po seřazení prvků podle velikosti, určíme čtvrtinové hodnoty (podobně jako u mediánu hodnotu v polovině). Přesněji je 𝑸𝟏 mediánem první poloviny souboru, tedy z hodnot 𝒙𝟏 ≤ 𝒙𝟐 ≤ ⋯ ≤ 𝑴𝒆𝒅(𝒙), a 𝑸𝟑 je mediánem druhé poloviny souboru, tedy z hodnot 𝑴𝒆𝒅 𝒙 ≤ ⋯ ≤ 𝒙𝒏−𝟏 ≤ 𝒙𝒏 . Mezikvartilová odchylka je poté určena vztahem: 𝟏 𝑸 𝒙 = ∙ 𝑸𝟑 − 𝑸𝟏 𝟐
Petr prováděl měření podobně jako v předchozím příkladu. Během hodiny naměřil tyto hodnoty: 21,3 °C, 22,1 °C, 18 °C, 21,9 °C, 21,9 °C, 21,7°C, 22,1 °C, 21,9 °C, 22,1 °C a 21,9 °C. Nechce se mu kvůli jedné nepřesnosti měření opakovat. Pokuste se pomocí mezikvartilové odchylky určit nepřesnost jeho měření. Teplota v °C Počet
𝑀𝑒𝑑 𝑥 =
18 1
21,3 1
21,7 1
21,9 4
22,1 3
𝑥5 + 𝑥6 21,9 + 21,9 = = 21,9 2 2
18 ≤ 21,3 ≤ 21,7 ≤ 21,9 ≤ 𝑀𝑒𝑑(𝑥) ≤ 21,9 ≤ 22,1 ≤ 22,1 ≤ 22,1
𝑄1 = 𝑥3 = 21,7
𝑄3 = 𝑥8 = 22,1
𝑄3 + 𝑄1 22,1 − 21,7 0,4 𝑄 𝑥 = = = = 𝟎, 𝟐 2 2 2
Sestavíme tabulku absolutní četnosti. Určíme medián souboru (je nutné vědět, zda bude tvořen dvěma prvky, nebo pouze jedním). Určíme hodnotu prvního a třetího kvartilu. Zjistíme mezikvartilovou odchylku.
ÚKOL ZÁVĚREM 1) Na mistrovství světa ve sportovní střelbě byly jednomu závodníkovi naměřeny tyto hodnoty: 9,7; 9,9; 9,8; 9,4; 9,7; 9,8; 9,5; 9,9; 9,5 a 9,8. Určete jeho průměrné skórování. Určete odchylku jeho průměrného výsledku od reálného skórování (pomocí hodnoty i pomocí procent). 2) Filip se rozhodl udělat průzkum průměrného platu ve své práci a zjistil tyto částky (v Kč): třikrát 15250, osmkrát 17380, šestkrát 18190, pětkrát 19420 a jednou 38400. Poté si uvědomil, že se mimo dělníky zeptal na plat jednoho manažera, ale nechtěl data falšovat. Vhodným způsobem určete průměrný plat dělníka a jaká je jeho odchylka od platu dělníků.
ZDROJE
Literatura:
Calda, Emil; DUPAČ, Václav. Matematika pro gymnázia: Kombinatorika, pravděpodobnost, statistika. Dotisk 4. vydání. Praha: Prometheus, 2003, 170 s. ISBN 987-80-7196-362-2.