SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY
Váha studentů
Kučerová Eliška, Pazdeříková Jana septima červen 2005
Zadání: My dvě studentky jsme si vylosovaly zjistit statistickým šetřením v celém ročníku septim našeho gymnázia tělesnou váhu v kg a to pro dívky a chlapce zvlášť. V závěru práce máme otestovat hypotézu, že tělesná váha je na pohlaví nezávislá. Základní údaje: statistický soubor 1: všechny studentky septim studující ve školním roce 2004/2005 na G statistický soubor 2: všichni studenti septim studující ve školním roce 2004/2005 na G statistická jednotka: jednotliví studenti/studentky statistický znak: tělesná váha v kg Použitý způsob sběru dat: V ročníku septim studuje v roce 2004/2005 celkem 91 studentů ve třech třídách. Vytvořily jsme tři seznamy studentů po třídách a nechaly je kolovat s prosbou o vyplnění tělesné váhy ke svému jménu. Pokud se vyskytly nejasnosti, vyřešily jsme je operativně o přestávkách. Nemůžeme si stěžovat na neochotu spolužáků, jen na jejich častou nepřítomnost. Nakonec se nám podařilo získat potřebné údaje od všech studentů septim ve vymezeném čase. Uvědomujeme si, že kvalitnější výsledky bychom dostaly, kdybychom osobně každého převážily na váze. Tomu bránily nejrůznější překážky a tak jsme se musely spokojit s údaji, které nám jednotlivci sami poskytli. Postup zpracování: Statistické soubory 1 a 2 jsme si mezi sebou rozdělily (Eliška dívky, Jana chlapce) a každá z nás zpracovala soubor samostatně ale stejnou metodikou. Zjistily jsme si rozsah hodnot sledovaného znaku a podle něho stanovily intervaly tříd. Třídy jsme určily společné, pro snazší porovnání obou souborů v grafickém provedení. Získané hodnoty jsme zpracovaly do četnostní tabulky a z ní následně určily všechny potřebné údaje pro výpočet potřebných statistik (modus, medián, aritmetický průměr, směrodatná odchylka, variační koeficient) podle dále uvedených vzorců. Hodnoty jsme zaokrouhlovaly na jedno desetinné místo, přesnější údaje postrádají vzhledem ke způsobu sběru dat smysl. Kromě výpočtu statistik jsme data z četnostních tabulek zobrazily také graficky: sloupkovým a kruhovým diagramem pro jednotlivé soubory a jeden sloupkový k porovnání obou souborů. V závěru jsme se věnovaly ověření hypotézy, že tělesná váha nezávisí na pohlaví.
Použité vzorce a značky: k – počet tříd xi – hodnota znaku (střed třídy) ni – absolutní četnost hodnoty znaku xi Ni – kumulativní četnost k
N - rozsah souboru
N
ni i 1
fi – relativní četnost Fi – relativní kumulativní četnost
fi
ni / N
x
1 N
x~ - modus, nejčetnější hodnota znaku xˆ - medián, prostřední hodnota x - aritmetický průměr
k
ni xi i 1 k
sx - směrodatná odchylka
sx
v x - variační koeficient v %
vx
ni xi2
Nx 2
i 1
N
sx 100 x
pro testování hypotézy použité veličiny (index 1 platí pro dívky, 2 pro chlapce) N1, N2 = rozsah x1, x2 = aritmetický průměr s1, s2 = směrodatná odchylka
t – testová statistika Studentova rozdělení t
x1
x2
N1 s12 N 2 s22 N1 N 2 2
N1 N 2 N1 N 2
t0.5 = 1,99 - hodnota Studentova rozdělení na hladině významnosti 5 %.
Soubor 1 – dívky třída 46-50 51-55 56-60 61-65 66-70 71-75 76-80 81-85
xi 48 53 58 63 68 73 78 83
ni 8 9 15 9 3 1 1 0
součet
Ni 8 17 32 41 44 45 46 46
fi 0,17 0,20 0,32 0,20 0,07 0,02 0,02 0,00
46
Fi 0,17 0,37 0,69 0,89 0,96 0,98 1,00 1,00
1,00 modus medián aritmetický průměr směrodatná odchylka
58 kg 65,5 kg 57,7 kg 6,9 kg
variační koeficient
12 %
četnost
váha v kg - dívky 16 14 12 10 8 6 4 2 0
46-50 51-55 56-60 61-65 66-70 71-75 76-80 81-85 třídy
2% 2% 7%
0% 46-50
17%
51-55 56-60
20%
61-65
20% 32%
váha v kg - dívky
66-70 71-75 76-80 81-85
nixi 384 477 870 567 204 73 78 0
nixi2 18432 25281 50460 35721 13872 5329 6084 0
2653
155179
Soubor 2 – chlapci třída 46-50 51-55 56-60 61-65 66-70 71-75 76-80 81-85
xi 48 53 58 63 68 73 78 83
ni 0 2 3 9 5 6 11 9
součet
Ni 0 2 5 14 19 25 36 45
fi 0,00 0,04 0,06 0,21 0,11 0,13 0,24 0,21
45
Fi 0,00 0,04 0,10 0,31 0,42 0,55 0,79 1,00
1,00 modus medián aritmetický průměr směrodatná odchylka variační koeficient
78 kg 65,5 kg 71,8 kg 9,0 kg 12 %
váha v kg - chlapci 12
četnost
10 8 6 4 2 0
46-50 51-55 56-60 61-65 66-70 71-75 76-80 81-85 třídy
0% 4% 46-50
7%
20%
51-55
20%
56-60 61-65 66-70 71-75
25% 13%
11%
váha v kg - chlapci
76-80 81-85
nixi 0 106 174 567 340 438 858 747
nixi2 0 5618 10062 35721 23120 31974 66924 62001
3230
235450
Dívky versus chlapci Naším úkolem také bylo porovnání dívek a chlapců mezi sebou. Porovnání vypočítaných statistik uvádíme jednak v tabulce hodnot a graficky sloupkovým diagramem.
modus medián aritmetický průměr směrodatná odchylka variační koeficient
dívky 58 kg 65,5 kg 57,7 kg 6,9 kg 12 %
chlapci 78 kg 65,5 kg 71,8 kg 9,0 kg 12 %
Kupodivu medián má stejnou hodnotu, ale všechny ostatní hodnoty jsou u chlapců mnohem vyšší. Variační koeficient ukazuje stejnou míru přesnosti sběru dat, odpovídá použité metodice.
četnosti
váha v kg - dívky x chlapci 16 14 12 10 8 6 4 2 0 46-50
51-55
56-60
61-65
66-70
71-75
76-80
81-85
třídy dívky
chlapci
Naším úkolem také bylo rozhodnout, jestli rozdíly mezi dívkami a chlapci, které naměříme a ve statistikách napočítáme jsou pouze náhodné nebo signifikantní. Graf i tabulka hodnot naznačuje, že to náhoda asi nebude, ale spokojit se „asi“ odhadem nemůžeme. Podle teorie hypotéz formulujeme nulovou hypotézu: Rozdíl mezi dívkami a chlapci je pouze náhodný, neboli výběrový soubor dívek i výběrový soubor chlapců pochází ze stejného souboru (stejná střední hodnota i stejný rozptyl). Pro tento typ hypotéz je vytvořen Studentův test, jehož statistika t = 8,35, což vysoko překračuje limitní hodnotu t0,05 = 1,99. Proto musíme zamítnout nulovou hypotézu a prohlásit, že rozdíl mezi pohlavími existuje: chlapci jsou celkově těžší než dívky a není to náhoda na signifikantní úrovni 5 %. Střední odchylka v obou souborech je hodně velká (12 % variační koeficient), jsou tedy značné rozdíly mezi jednotlivci. Proto můžeme odpovědně prohlásit, že dívky septim zdaleka nemají důvod kk držení razantních diet, přestože si to mnohé myslí. Co se týče chlapců, někteří by měli více sportovat, jiní by naopak měli začít více jíst.