ZÁKLADY STATISTIKY
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
Obsah
1
strana .............................................................................................................................. 1
I. teoretická část Práce s daty v softwarovém prostředí Microsoft Office Excel a Statistika 6.0 .............
2
1
Abecední slovníček vybraných termínů používaných ve statistice …….................
2
2
Koeficienty „efekt size“ jako vodítko pro posuzování věcné významnosti statisticky testovaných rozdílů ................................................................................... 2.1 Korelační koeficient rP a rS ...................................................................................... 2.2 Koeficient determinace d ........................................................................................ 2.3 Další koeficienty efekt size - kritéria pro jejich výběr a hodnocení efektu ............
14 14 16 17
3
Microsoft Office Excel ................................................................................................ 22 3.1 Představení ............................................................................................................ 3.2 Příklad – Efekt dvouměsíčního intervenčního programu aerobiku na habituální pohybovou aktivitu děvčat ve věku 15-19 let ................................... 3.2.1 Příprava dat do tabulky ................................................................................. 3.2.2 Výpočet základních charakteristik (aritmetický průměr, směrodatná odchylka a korelační koeficient) …...............................................................
4
22 24 24 25
Statistika 6.0 ................................................................................................................ 31 4.1 4.2 4.3 4.4 4.5
Představení .............................................................................................................. Příprava dat to tabulky ............................................................................................ Uložení tabulky dat v Excelu a import do Statistiky ............................................. Výpočet základních popisných statistických proměnných ve Statistice ................. Použití ANOVY ve Statistice ................................................................................. 4.5.1 Vytvoření identifikační (grupovací, faktorové) proměnné ........................... 4.5.2 Výpočet ANOVY ..........................................................................................
31 31 34 36 38 38 40
II. praktická část Ukázka použití statistického zpracování dat v konkrétním článku ……….….............. 44 5
Příklad – Efekt dvouměsíčního intervenčního programu aerobiku na habituální pohybovou aktivitu děvčat ve věku 15-19 let ............................................................ 44 5.1 5.2 5.3 5.4
Abstrakt ................................................................................................................... Abstract ................................................................................................................... Úvod ........................................................................................................................ Metodika ................................................................................................................. 5.4.1 Účastníci ......................................................................................................... 5.4.2 Přístroje a dotazníky ....................................................................................... 5.4.3 Postup ....................................................…..................................................... 5.4.4 Softwarové a statistické zpracování dat ......................................................... 5.5 Výsledky ................................................................................................................. 5.6 Diskuse .................................................................................................................... 5.7 Limity a doporučení práce ...................................................................................... 5.8 Závěry ..................................................................................................................... 5.9 Referenční seznam ..................................................................................................
44 45 45 47 47 47 48 49 49 53 55 55 55
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
2
I teoretická část Práce s daty v softwarovém prostředí Microsoft Office Excel a Statistika 6.0 1 Abecední slovníček vybraných termínů používaných ve statistice Analýza variance=rozptylu (jednofaktorová – ANOVA; vícefaktorová – MANOVA) Progresivní statistická metoda umožňující zjistit zda mezi dvěma nebo více metrickými proměnnými jsou významné rozdíly. Progresivita této metody spočívá ve skutečnosti, že nesrovnáváme přímo aritmetické průměry, ale rozptyly, které přesněji než aritmetický průměr charakterizují „rozptýlenost“ nebo „blízkost“ dat okolo aritmetického průměru. Základní myšlenkou analýzy variance je práce se dvěma rozpyly. Máme-li soubor metrických dat, který je rozdělěn do dvou či více skupin, pak můžeme vypočítat dva na sobě nezávislé odhady rozptylů: (a) mezi průměry skupin, (b) uvnitř skupin. Rozptyl uvnitř skupin lze vypočítat tak, že nejdříve vypočítáme rozptyly pro všechny skupiny a z nich pak určíme průměr. Tento rozptyl „uvnitř“ skupin je lepším a spolehlivějším odhadem, protože není ovlivněn možnými rozdíly mezi skupinami a je dán pouze náhodným kolísáním dat. Naproti tomu je rozptyl „mezi“ průměry skupin závislý na rozdílech mezi skupinami. Jestliže je rozptyl „mezi“ skupinami významně vyšší než rozptyl „uvnitř“ skupin, znamená to, že skupiny nejsou náhodnými výběry z téhož základního souboru (tzn. výsledky ve skupinách se statisticky významně liší). K objektivnímu posouzení poměru obou rozptylů se používá F-testu:
F
rozptyl „mezi“ skupinami rozptyl „uvnitř“ skupin
přibližně platí, že při F 4 je p 0,05
Podmínky užití analýzy variance jsou následující: o metrická data o náhodné rozdělení dat o homogenita (rovnost) rozptylu uvnitř skupin (ANOVA nevyžaduje stejné počty prvků n ve srovnávaných souborech. Avšak výrazná odlišnost v počtu prvků mezi srovnávanými soubory (n=30 n=500; n=80 n=1000) může narušit podmínku homogenity rozptylu uvnitř skupin. Proto se při plánování výzkumu snažme užívat alespoň přibližně stejně velké soubory (Lepš, 1996). Při nesplnění podmínek ANOVY lze použít neparametrickou obdobu – Kruskal-Wallisův test. Při testování vlivu jednoho faktoru, např. pohlaví, tělesné zdatnosti či věku, samostatně používáme jednofaktorovou analýzu variance (ANOVA). Při testování současného vlivu faktorů (např. pohlaví tělesná zdatnost, pohlaví věk, pohlaví tělesná zdatnost věk) využijeme vícefaktorovou analýzu variance (MANOVA). EXCEL: STATISTICA:
Vložit funkci Statistické FTEST Statistika ANOVA jednofaktorová (vícefaktorová) ANOVA
Aritmetický průměr „…je definován jako součet všech naměřených údajů vydělený jejich počtem“ (Hendl, 2004, 93). Základní charakteristika míry polohy metrických dat (měření). n
x M
i 1
n
i
M - aritmetický průměr xi - naměřené hodnoty proměnné x n - počet prvků v souboru
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
EXCEL: STATISTICA:
3
Vložit funkci Statistické PRŮMĚR Statistika Základní statistiky/tabulky Popisné statistiky
Hladina spolehlivosti je pravděpodobnost, s jakou zjistíme tytéž výsledky pro danou proměnnou při opakovaném provádění výběru z téhož základního souboru. Nejpoužívanější hladiny jsou 90 %, 95 % nebo 99 %. Pracujeme-li s 95 % hladinou spolehlivosti, znamená to, že ze 100 opakovaných výběrů v 95 případech zjistíme tytéž výsledky pro danou proměnnou (Hendl, 2004; Chráska, 2000). Hladina významnosti „Rozhodování o platnosti nulové, resp. alternativní hypotézy má vždy pravděpodobnostní charakter…. Pravděpodobnost (riziko), že neoprávněně odmítneme nulovou hypotézu (a tudíž nesprávně přijmeme alternativní hypotézu) se nazývá hladina významnosti“ (Chráska, 2000, 160). „Jestliže provedeme test významnosti na hladině významnosti 0,05, znamená to, že pravděpodobnost, že nesprávně přijmeme alternativní hypotézu je 5 % (jinak řečeno: nulovou hypotézu odmítáme s jistotou 95 %)“ (Chráska, 2000, 160). „…je pravděpodobnost, že se zamítne nulová hypotéza, ačkoliv ona platí. Tato hladina… se volí velmi malá, např. 0,05 nebo 0,01“ (Hendl, 2004, 177). Uvedeme-li, že testovaná proměnná je významná‚ na hladině pěti procent, myslíme tím, že pozorovaná odchylka od nuly bude překročena v méně než v pěti procentech podobných výběrů, je-li nulová hypotéza správná, popř. že si můžeme být jisti na 95 procent, že je nulová hypotéza nesprávná (Lindquist, 1967, 30). Dále podle Lindquista (1967, 30) platí, že při normálním rozložení dat musí být testovaná proměnná „…2,576krát větší než její standardní chyba, má-li být významná na jednoprocentní hladině, nebo 1,960krát větší než její standardní chyba, má-li být významná na pětiprocentní hladině“. Hypotéza Hypotéza vzniká na základě prostudované literatury, kdy je již čtenář zorientován ve sledované problematice a může si vytvořit „…předběžné názory na vazby mezi jednotlivými proměnnými, na kauzalitu studovaných jevů, na možná řešení zkoumaného problému“ (Pelikán, 2004, 42). Nikdy nemůžeme změřit, otestovat celou populaci (základní soubor), ale pouze její náhodně, záměrně, stratifikovaně či kontrolovaně vybranou část (Lindquist, 1967). Přesto nás zajímá jak by dopadlo měření kdybychom místo vybrané části testovali celou populaci. Také proto formulujeme hypotézy, abychom se pokoušeli zjištěné skutečnosti zobecňovat na celou populaci. Ukázkovými příklady jsou předvolební průzkumy, kde na základě dotazování u náhodné části populace se usuzuje na volební výsledky populace celorepublikové. Hypotéza je podle Pelikána (2004, 44) „…podmíněným výrokem o vztazích mezi dvěma nebo více proměnnými… hypotéza je vždy tvrzením, byť i podmíněně formulovaným“. Podle Chrásky (2000, 11) hypotézami rozumíme „…pokusné, předběžné, prozatímní odpovědi na položené otázky…. Hypotézy jsou predikcemi (předpověďmi o vztazích mezi proměnnými. Hypotéza tedy říká, že nastane-li jev A, nastane také jev B“. Hypotézy dělíme na hypotézy nulové a alternativní. „Nulová hypotéza je domněnka, která prostřednictvím statistických termínů tvrdí, že mezi proměnnými, které zkoumáme, není žádný vztah“ (Chráska, 2000, 159). Obsahuje termíny: neovlivňuje, neexistuje vztah, není rozdíl apod. Další podobou hypotézy je hypotéza alternativní. V její formulaci již badatel předpokládá významnou vazbu mezi proměnnými a může stanovovat i „směr“ ovlivnění prostřednictvím termínů: zvýší, sníží, nezvýší, nesníží, apod.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
4
Alternativní hypotéza H1 znamená situaci, kdy nulová hypotéza H0 neplatí. Obvykle se vyjadřuje jako ‚existence diference‘ mezi skupinami nebo ‚existence závislosti‘ mezi proměnnými. Nemusí jít o přesný logický opak nulové hypotézy, protože někdy máme důvod pracovat s tzv. jednostrannou alternativní hypotézou (jestliže nulová hypotéza říká, že neexistuje rozdíl mezi středními hodnotami pro dvě populace, pak jednostranná alternativní hypotéza může např. tvrdit, že druhá populace má střední hodnotu vyšší) (Hendl, 2004, 176-177). Gavora (2000, 53) stanovuje tzv. „zlatá pravidla hypotézy“. 1. Hypotéza je tvrzení. Vyjadřuje se oznamovací větou. Na konci výzkumu musíme toto tvrzení přijmout (je to pravda) nebo vyvrátit (není to pravda). 2. Hypotéza vyjadřuje vztah mezi dvěma proměnnými. 3. Hypotéza se musí dát testovat (empiricky zkoumat). Její proměnné se musí dát měřit nebo kategorizovat. Frömel (2002) klade tyto hlavní požadavky na správnou formulaci hypotéz: vědeckost – cílem ověření hypotézy jsou nová fakta, která utvářejí základ nové vědecké teorie. V případě diplomových prací se však jedná většinou o potvrzení platné hypotézy v jiných podmínkách, ověření dílčích hypotéz. „Plodnost“ hypotézy je právě v přínosu nových poznatků, neměli by se proto objevovat hypotézy nelogické a tautologické. Výrok typu „zařazení posilovacích cvičení do tréninkového procesu basketbalistů zvýší silový základ a celkovou zdatnost hráčů“ je špatnou hypotézou a navíc hypotézou tautologického typu. Posilovací cvičení je určeno k tomu, aby zlepšilo silové schopnosti. Navíc jsou v hypotéze uvedené dvě závislé proměnné (silový základ a celková zdatnost). jednoznačnost – správná hypotéza je vždy založena na vztahu nezávisle a závisle proměnné. „Nezávisle proměnná je vlastnost (jev), která je příčinou nebo podmínkou vzniku jiné vlastnosti (jevu). Závisle proměnná je vlastnost, která je výsledkem (následkem, důsledkem) působení nezávisle proměnné“ (Chráska, 2000, 11). Proměnné jsou jednoznačně a jednosměrně vymezeny bez dalších doplňujících vazeb či podmínek. „Nestačí proměnnou pouze pojmenovat, ale je třeba ji jednoznačně vymezit (je třeba jednoznačně říci, co jí myslíme)“ (Chráska, 2000, 233). Nejstručněji vyjádřeno, když nastane A, změní se B nebo když nastane A, tak B bude lepší než.... Kerlinger (1972, 35) uvádí, že „...hypotézy jsou v podstatě predikcemi tvaru 'jestliže A, pak B které zavádíme, abychom ověřovali vztahy mezi A a B“. Zpravidla se jedná o jasně vymezený vztah (závislost, souvislost), rozdíl nebo shodu, případně důsledek nebo příčinu. Hypotéza nesmí formulačně umožňovat alternativní výklad. ověřitelnost – každou hypotézu musí být možno ověřit (nebo vyvrátit). Nejsou přípustné tzv. metafyzické hypotézy např. hypotéza o existenci Boha je metafyzickou hypotézou. Současnými „měřitelnými“ nástroji vědy nelze tuto hypotézu ověřit či vyvrátit. Neověřitelné hypotézy jsou např. pro dosud nevypracované potřebné výzkumné techniky, pro množství zcela nekontrolovatelných proměnných, pro nereálnost ověřování v přirozených podmínkách, z etických důvodů apod. Při uvedení hypotéz je pro jejich vyšší názornost a úplnost často vhodné doplnění o vysvětlující komentář obsahující např. stanovení hladiny statistické významnosti, na které budu tvrzení hypotézy vyvracet nebo přijímat, bližší charakteristiku proměnných, stanovení věcné (logické, empirické) významnosti rozdílů, apod. Pokud hypotéza obsahuje proměnnou např. „bolestivost“, „zkrácení“ (kterou určuje více charakteristik - například 3) je v komentáři nutné zdůraznit za jakých podmínek hypotézu potvrdím či nepotvrdím (např. u všech 3 charakteristik najdu signifikantní rozdíl či stačí aby 2 ze 3 byly signifikantně rozdílné). „Diplomové práci prospěje, když jsou hypotézy doplněny zdůvodněním, popřípadě i doplňujícím výkladem. Jsou-li hypotézy vytčeny, musí být v práci uvedeno, zda byly
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
5
potvrzeny nebo vyvráceny. Hypotézy nelze potvrzovat částečně, téměř, s výjimkami apod.“ Frömel, 2002, 33). Kruskal-Wallisův test Jedná se o neparametrickou verzi jednofaktorové analýzy variance ANOVA. Používá se při nesplnění podmínek pro použití ANOVY (nejen pro metrická data, která mají náhodné rozdělení a jejichž rozptyly „uvnitř“ skupin jsou přibližně stejné). Při použití KruskalWalisova testu „nulová hypotéza předpokládá, že měření ve skupinách mají stejné mediány“ (Hendl, 2004, 347). Protože pracujeme na úrovni ordinálního měření, nejdříve uspořádáme všechna data podle velikosti. Pak nahradíme jejich hodnoty pořadími a vypočítáme koeficienty SRi jako součty pořadí dat ve skupině i. Podle následujícího vzorce spočítáme tetsovací kritérium H, která udává rozdílnost aritmetických průměrů pořadí ve skupinách: 2 n 12 SRi H n n 1 i 1 ni
3 n 1
přibližně platí, že při H 4 je p 0,05
STATISTICA: Statistika Neparametrická statistika Porovnávání více nezávislých vzorků (skupiny) Kruskal-Wallisova ANOVA & mediánový test Mann-Whitneyův test Jedná se o neparametrickou obdobu T-testu pro nemetrická data. Slouží ke srovnání mediánů dvou nezávislých proměnných. Předpokladem je pouze skutečnost, že obě proměnné pocházejí ze dvou různých souborů (nemusí mít normální rozdělení dat). Nulovou hypotézu testujeme pomocí testového kritéria U, které vypočítáme z rovnice: U n1 n 2
n1 n1 1 R1 2
U n1,2 Ri
- testové kritérium - součet počtu pozorování první a druhé proměnné - součet pořadí první proměnné
STATISTICA: Statistika Neparametrická statistika Porovnání dvou nezávislých vzorků (proměnné) Mann-Whitneyův U test Medián „…znamená hodnotu, jež dělí řadu podle velikosti seřazených výsledků na dvě stejně početné poloviny“ (Hendl, 2004, 94). Charakteristika míry, která se používá u ordinálních dat (měření). Na rozdíl od aritmetického průměru je medián málo citlivý k odlehlým hodnotám. EXCEL: STATISTICA:
Vložit funkci Statistické MEDIAN Statistika Základní statistiky/tabulky Popisné statistiky
Měření (data) „…je přiřazování čísel předmětům nebo jevům podle pravidel“ (Kerlinger, 1972, 404). Při měření se v podstatě snažíme pozorovanou vlastnost jevu nebo předmětu vyjádřit pomocí číselné hodnoty. „Stanovení pravidla pro přiřazování je nejdůležitější a zároveň nejobtížnější částí měření“ (Chráska, 2000, 38). Při zkoumání reality se často setkáváme se situacemi, kdy
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
6
proměnnou, kterou chceme zachytit, nelze přímo měřit (tvořivost, nálada, subjektivní pocit bolesti pacienta, sebevědomí, apod.). V těchto případech měříme ukazatele (indikátory), které s velkou pravděpodobností s danou proměnnou souvisejí. Podle přiřazování čísel objektům a jevům rozlišujeme následující úrovně měření: nominální (klasifikace) – čísel se zde používá pouze pro označení proměnné např. označení pohlaví (1 – muž, 2 – žena), plavecké dovednosti (1 – plavec, 2 – neplavec), výskytu (1 – má, 2 – nemá). Nominální měření (data) umožňují „pouze“ třídění, čísla nemají kvantitativní význam, můžeme je nahradit písmeny nebo jinými symboly. POZOR nelze s nimi jako s čísly počítat. • použitelná statistika: modus, četnost jednotlivých číselných symbolů, sčítání četností v každé kategorii, frekvenční statistika chí-kvadrát 2, výpočet procent % apod. ordinální (pořadí) – čísla se objektům přiřazují tak, že vyjadřují pořadí podle daného kritéria např. seřazení žáků podle tělesné výšky (1 – nejvyšší žák …28 – nejnižší žák ve třídě), pořadí zapojování svalů (1 – první, 2 – druhý… 9 – poslední). POZOR tato čísla však „…poskytují informaci pouze o pořadí měřených objektů, nikoli o velikostech rozdílů mezi nimi“ (Chráska, 2000, 40). • použitelná statistika: medián, kvartilová odchylka, Spearmanův koeficient pořadové korelace rS, Wilcoxonův párový test, Mann-Whitneyův U-test, Kruskal–Wallisův test. V některých případech se však používají i postupy, které předpokládají intervalové měření (aritmetický průměr, směrodatná odchylka apod.). intervalové – přiřazujeme čísla tak, že vyjadřují kvantitativní míru vlastnosti (jevu) i velikost rozdílů mezi nimi. Je zde definovaná jednotka měření, která však nemá přirozený nulový bod. Čísla získaná intervalovým měřením LZE sčítat +, odečítat - , NELZE je ale násobit a dělit: • použitelná statistika: aritmetický průměr, směrodatná odchylka, Pearsonův součinový korelační koeficient rP, Studentův t-test, F-test, analýza rozptylu atd. poměrové – přiřazené hodnoty čísel vyjadřují kvantitativní míru vlastnosti i velikosti násobků mezi nimi. Kromě přesně definované jednotky měření, zde existuje i přirozená nula. Lze využívat všech vlastností reálných čísel (+, -, · , :, 2, √). „Jednotlivé výsledky poměrového měření lze srovnávat na základě otázek ‚o kolik‘, ale i ‚kolikrát‘“ (Chráska, 2000, 41). Měření intervalová a poměrová se souborně označují jako měření metrická. • použitelná statistika: lze využít všech výše uvedených procedur. Použijeme-li však pro poměrová data postupy určené pro data ordinální nebo nominální, dochází vždy k určité ztrátě informace. Millova pravidla Ačkoli současná statistika umožňuje přesnější analýzu příčin a účinků jevů Millova pravidla (především pravidla jediné shody a jediného rozdílu) lze využít již při předběžných úvahách o možných příčinách určitých jevů a při plánování upořádání výzkumného projektu. pravidlo jediné shody – „Mají-li dva nebo více případů společnou jedinou okolnost, je právě tato okolnost příčinou nebo účinkem jevu…. Uplatňuje-li se u zkoumaných objektů jediný shodný zásah (ostatní podmínky přitom zůstávají nezměněny), potom můžeme předpokládat, že právě tento zásah je příčinou nebo účinkem změn, které u objektů pozorujeme“ (Chráska, 2004, 36). pravidlo jediného rozdílu – „Mají-li dva případy (jeden, v němž se zkoumaný jev vyskytuje, a druhý, v němž se nevyskytuje) všechny okolnosti společné až na jednu, která se objevuje jen v prvním případě, pak tato jediná okolnost, jíž se oba případy liší, je účinkem nebo příčinou… jevu“ (Chráska, 2004, 36). pravidlo kombinace shody a rozdílu – „Mají-li dva nebo více zkoumaných případů, v nichž se vyskytuje určitý jev, pouze jednu společnou okolnost, kdežto dva nebo více
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
7
případů, v nichž se jev nevyskytuje, mají společné jenom to, že se u nich tato okolnost neobjevuje, pak právě tato okolnost, jíž se obě skupiny případů liší, je účinkem nebo příčinou… zkoumaného jevu“ (Chráska, 2004, 36). pravidlo sdružených změn – „Jestliže se určitý jev jakýmkoli způsobem mění a vždy se také mění jiný jev nějakým způsobem, pak je první jev příčinou nebo účinkem tohoto jevu, anebo je sním spojen nějakým příčinným vztahem“ (Chráska, 2004, 36-37). Model Zjednodušená grafická nebo slovní charakteristika použitých proměnných a jejich vzájemných vztahů. Modus Hodnota proměnné, která se v daném souboru vyskytuje nejčastěji. Charakteristika míry, která se používá u nominálních dat (měření). EXCEL: STATISTICA:
Vložit funkci Statistické MODE Statistika Základní statistiky/tabulky Popisné statistiky
Post-hoc testy Při statistickém srovnávání aritmetických průměrů dvou proměnných nám výsledné testové kritérium (t – t-testu, F – ANOVY, T – Wilcoxonova testu, H – Kruskal-Wallisova, U – Mann-Whitneyho testu apod.) přímo vypovídá o statistické významnosti (či nevýznamnosti) rozdílů těchto proměnných. Avšak při statistickém srovnávání aritmetických průměrů více než dvou proměnných nás kromě výsledného testového kritéria především zajímá konkrétně mezi kterými aritmetickými průměry je či není statisticky významný rozdíl. K tomuto určení nám slouží post-hoc testy, které pomocí kombinační tabulky zobrazí hladiny statistické výzmanosti p mezi všemi aritmetickými průměry srovnávaných proměnných. Podle síly testu (od nejsilnějšího, nejkonzervativnějšího po nejměkčí, nejliberálnější) rozeznáváme: Scheffeho test, Tukeyův test, Bonferroniho test a Fischerův LSD test. Zvláštními případy jsou Duncanův test a HSD test při nestejných n. Neexistuje přesné, obecně platné pravidlo pro výběr konkrétního post-hoc testu k použití. Hendl (2004, 345) doporučuje „… použít test více konzervativní, jinak vzroste nekontrolovatelně pravděpodobnost chyby I. druhu“. STATISTICA: Statistika ANOVA jednofaktorová (vícefaktorová) ANOVA výběr proměnných a faktorů OK Více výsledků Post-hoc Pravděpodobnostní rozdělení dat (binomické, poissonovo a normální) Nám modelují, popisují, předpovídají náhodné chování proměnných. Lze je popsat pomocí pravděpodobnostní, distribuční či frekvenční funkce (frekvenčního histogramu) (Hendl, 2004). Normální rozdělení se týká spojité proměnné, zatímco binomické a poissonovo rozdělení popisuje náhodné chování diskrétní proměnné. Použití některých statistických testů je podmíněno konkrétním typem rodělení dat. binomické rozdělení – modeluje chování četností prvků s pevně danou vlastností, které skončily… jež skončily specifikovaným výsledkem. Předpoklady pro vznik náhodné proměnné s binomickým rozdělením jsou podle Hendla (2004, 135) tyto: o provádíme n pozorování (nebo pokusů); o pozorování jsou nezávislá – znalost výsledku v jednom pozorování nám nic nevypovídá o výsledku v pozorování jiném;
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
8
o výsledky pozorování mohou být pouze dva, např. „úspěch“ a „neúspěch“; o pravděpodobnost každého „úspěchu“ je stejná pro všechna pozorování nebo pokusy. poissonovo rozdělení – mají náhodné proměnné (např. počet telefonních hovorů, nehod, či přijímaných pacientů za danou časovou jednotku, počet překlepů na jedné stránce, apod.), které popisují četnosti jevů s těmito vlastnostmi: o výskyt (nebo nevýskyt) jevu v daném čase závisí na tom, co se stalo jindy nebo jinde; o pravděpodobnost výskytu jevu je pro každý malý časový okamžik stejná; o neexistuje případ, že by dva jevy nastaly současně přesně v jednom časovém okamžiku. normální rozdělení – nejčastěji používané rozdělení pro modelování náhodného chování proměnných v empirických vědách. Ve výzkumech se velmi často setkáváme se situací, kdy měřenou proměnnou ovlivňuje současně větší počet poměrně slabých náhodných vlivů. Toto současné působení více vlivů se projevuje tím, že značná část výsledků se soustřeďuje kolem střední hodnoty a na obě strany od ní jsou výsledky stále méně časté, přičemž extrémní hodnoty se vyskytují jen ojediněle (Chráska, 2003, 73). Toto rozdělení lze graficky vyjádřit pomocí křivky (Gaussova křivka – Obrázek 1), kterou lze sestrojit pomocí aritmetického průměru M a směrodatné odchylky SD. Jedná se o jednovrcholovou, zvonovitou křivku, symetrickou podle svislé osy procházející aritmetickým průměrem M. Pro normální rozdělení dat platí, že v intervalu (M-SD, M+SD) se vyskytuje přibližně 2/3 (68,27 %) všech hodnot. V intervalu (M-2SD, M+2SD) se již vyskytuje 95,4 % hodnot a v intervalu (M-3SD, M+3SD) již 99,73 % hodnot (Chráska, 2003). Řada statistických procedur byla odvozena od normálního rozdělení, proto je jejich použití podmíněno normálním rozdělením dat testované proměnné. Existuje řada postupů jak ohodnotit normální rozdělení dat (např. test špičatosti, resp. šikmosti, který vyjadřuje koncentraci, resp. symetrii dat kolem střední hodnoty; pro normální rozdělení vychází špičatost=0 a šikmost=0). Jedním z nich je posouzení podle frekvenčního histogramu (Obrázek 2). Hodnotíme „jednovrcholovost“ a symetrii podle svislé osy aritmetického průměru M (Obrázek 1). 99,73 % 95,4 % pravděpodobnost
četnost výskytu (%)
68,27 %
-3SD -2SD -SD M
+SD +2SD +3SD
Obrázek 1. Gaussova křivka
tělesná výška (cm)
Obrázek 2. Frekvenční histogram normálního rozdělení dat
t-rozdělení – V případě, že neznáme teoretickou směrodatnou odchylku měřené náhodné proměnné, lze místo ní dosadit vypočítanou směrodatnou odchylku. Pak hovoříme o trozdělení, jehož tvar závisí na stupních volnosti. Je podobné normálnímu rozdělení v tom, že je symetrické kolem nuly, má jediný vrchol a zvonovitý tvar. Na rozdíl od něj má výraznější oba okraje.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
9
Proměnná Vlastnost nabývající kvantitativních nebo kvalitativních hodnot. Z hlediska formulování hypotéz rozeznáváme především závisle a nezávisle proměnné. „Nezávisle proměnná je vlastnost (jev), která je příčinou nebo podmínkou vzniku jiné vlastnosti (jevu). Závisle proměnná je vlastnost, která je výsledkem (následkem, důsledkem) působení nezávisle proměnné“ (Chráska, 2000, 11). „Nezávisle proměnná je proměnná, která z hlediska našeho výzkumu (nikoliv absolutně) nezávisí na proměnné jiné. Intervenující proměnná je pak ta nezávisle proměnná, která ovlivňuje změny proměnných dalších, které nazýváme proměnnými závislými“ (Pelikán, 2004, 39). Podle možnosti nabývání hodnot dělíme proměnné na spojité a diskrétní. „Spojitá proměnná může teoreticky nabývat libovolných hodnot z určitého intervalu reálných čísel. Diskrétní proměnné „…nabývají naopak pouze konečného počtu hodnot“ (Hendl, 2004, 44-45). Příkladem spojité proměnné je čas, tlak, teplota, apod. a diskrétní pak pořadí v závodě, počet bodů v desetiboji apod. Reliabilita (spolehlivost a přesnost) Stálost dosahování stejných (velmi podobných) výsledků při opakování měření za stejných podmínek - spolehlivost. Nezatíženost chybami měření - přesnost. „Za přesné považujeme takové měření, při kterém se dopouštíme jen malého počtu chyb a tyto chyby nejsou příliš velké“ (Chráska, 2000, 42). Vysoká reliabilita je nutnou podmínkou dobré validity měření, ale samotná vysoká reliabilita ještě nezaručuje dobrou validitu. Jinými slovy: „Pokud měření není spolehlivé, nemůže být ani validní“ (Hendl, 2004, 48). Stupeň reliability měření vyjadřujeme koeficientem reliability rtt. Nabývá hodnot od 0 (nulový stupeň reliability) do 1 (maximální stupeň reliability). Definujeme jej jako poměr rozptylu chyb k celkové variabilitě dat odečtený od 1. rtt - koeficient reliability s s se se - rozptyl chyb rtt 1 e t st st st - celková variabilita dat Koeficient reliability rtt lze určit těmito čtyřmi základními metodami: opakovaného měření (test-retest) – stejné měření se za stejných podmínek provádí opakovaně v čase a koeficient reliability je vypočítán jako korelační koeficient pro opakovaně změřená data. Vypovídá o shodě opakovaných měření v čase. paralelního měření – stejné měření se opakovaně, ale za použití ekvivalentních technik (např. existují dvě verze A a B téhož testu). Koeficient reliability se vypočítá jako korelační koeficient mezi oběma měřeními. půlení – provedené měření se rozdělí na dvě části, které se samostatně vyhodnotí a výsledky se pak navzájem korelují. Ze stupně korelace se usuzuje na stupeň reliability. vnitřní konzistence – při této metodě je výpočet koeficientu reliability založen na použití dvojnásobné analýzy variance (tzn. Cronbachův korelační koeficient alfa ά). Cronbachův korelační koeficient alfa ά odhaduje očekávanou korelaci jednoho testu s alternativní formou jiného, obsahujícího stejný počet měřených proměnných. Pro konzistentní test by ά měl nabývat hodnoty alespoň 0,8 (Meloun & Militký, 2002). Rozptyl a směrodatná odchylka „…obě se vztahují k aritmetickému průměru – měří rozptýlenost dat kolem aritmetického průměru….“ (Hendl, 2004, 96). „Rozptyl je definován jako průměrná kvadratická odchylka měření od aritmetického průměru…“ (Hendl, 2004, 96). Obě jsou základními charakteristikami variability dat.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
10
n
s
2
(M i M ) 2
i 1
n 1
s2 - rozptyl M - aritmetický průměr n - počet prvků v souboru
Směrodatná odchylka SD je pak druhou odmocninou z rozptylu: n
SD s 2
EXCEL: STATISTICA:
(M
i
M )2
i 1
n 1
SD s2 M n
- směrodatná odchylka - rozptyl - aritmetický průměr - počet prvků v souboru
Vložit funkci Statistické SMODCH.VÝBĚR Statistika Základní statistiky/tabulky Popisné statistiky
Rozsah souboru Označuje počet prvků v souboru, jeho četnost. Zpravidla jej označujeme písmenem n. Rozsah souboru výrazně ovlivňuje statistickou významnost testovaných rozdílů mezi proměnnými. Naopak koeficienty efekt size tuto závislost na rozsahu souboru při zjišťování rozdílů mezi proměnnými částečně eliminují. Statistické testy významnosti Jsou to postupy (procedury), pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Jestliže na základě provedeného testu významnosti rozhodneme, že určitý výsledek šetření je statisticky významný (signifikantní), znamená to, že je velmi nepravděpodobné, že by tento výsledek byl způsoben pouhou náhodou (Chráska, 2003, 78). Rozlišujeme testy parametrické a neparametrické. o Parametrické testy vyžadují splnění řady podmínek (např. metrická data – aritmetický průměr, směrodatná odchylka apod., normální rozdělení proměnné), aby bylo jejich použití oprávněné. U těchto testů se nulová hypotéza týká některého parametru rozdělení náhodné proměnné (např. aritmetického průměru, směrodatné odchylky apod.). o U neparametrických testů se nulová hypotéza netýká parametrů rozdělení proměnné, nýbrž jiné obecné vlastnosti (nominální a ordinální data). Použití neparametrických testů není tak přísně podmíněno jako aplikace testů parametrických (všechny typy dat a případy, kdy není znám typ rozdělení proměnné). Avšak větší univerzálnost neparametrických testů je vykoupena jejich menší statistickou účinností. Přičemž účinnost statistického testu významnosti definujeme jako „…schopnost testu rozpoznat i malé odchylky od nulové hypotézy“ (Chráska, 2003, 79). Parametrické testy mají vyšší statistickou účinnost, ale nejsou tak univerzálně použitelné jako neparametrické testy, které ve srovnání s parametrickými testy vyžadují větší rozsah testovaného souboru n. Stupeň volnosti Je číslo o jednu menší než rozsah souboru n. Platí tedy, že stupeň volnosti = n–1. T-test Jeden z nejnámějších statistických testů významnosti pro metrická data. Slouží ke srovnání aritmetických průměrů dvou nezávislých proměnných. Předpokladem je, že obě proměnné
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
11
pocházejí ze dvou různých souborů a mají normální rozdělení dat. Nulovou hypotézu testujeme pomocí testového kritéria t, které vypočítáme z rovnice: t - testové kritérium M1,2 - aritmetické průměry první a druhé proměnné n1,2 - počty prvků v souborech SD - směrodatná odchylka n n 2 2 M1i - jednotlivé hodnoty první M 1i M 1 M 2 j M 2 i 1 j 1 proměnné kde SD n1 n 2 2 M2j - jednotlivé hodnoty druhé proměnné EXCEL: Vložit funkci Statistické TTEST STATISTICA: Statistika Základní statistiky/tabulky t-test M M2 n1 n 2 t 1 SD n1 n2
1
2
Validita (platnost a pravdivost) Kerlinger (1972, 435) konstatuje, že „…nejobecnější definice validity je ve stručnosti obsažená v otázce: Měříme to, o čem se domníváme, že měříme“. V současnosti se však vychází z požadavku, že „…uživatel má z výsledků měření odvodit správná rozhodnutí“ (Hendl, 2004, 48). Podle Hendla (2004, 48) „validita odkazuje na přiměřenost, smysluplnost a užitečnost specifických závěrů, jež se provádějí na základě výsledku měření“. Podle toho, k čemu se validita vztahuje, ji lze děli na: obsahová – „…zjišťuje, do jaké míry měření skutečně reprezentuje dané vlastnosti nebo kvality“ (Hendl, 2004, 49). Obsahová validita zjišťuje nakolik jsou reprezentativní položky testu, vzhledem k obsahu, který má měřit (Pelikán, 2004). Podle Kerlingera (1972) je obsahová validita v podstatě úsudková. souběžná – se posuzuje při zavádění nové metody (testu) srovnáním s již ověřenou metodou (testem). „Ověřenou proceduru někdy nazýváme ‚zlatý standard‘. S měřením ‚zlatého standardu‘ srovnáváme výsledky nové měřící procedury“ (Hendl, 2004, 49). Ke srovnání vztahu mezi výsledky nového testu a ověřeného testu používáme korelačních koeficientů. predikční – posuzuje, „…do jaké míry provedené měření vypovídá o budoucím chování objektů“ (Chráska, 2000, 42). Podle Pelikána (2004, 59) „Nejde jen o předpověď toho, jak se daný jedinec uplatní, jak bude probíhat určitý jev atd., jde spíše o předpověď určitého vztahu. Validitu výzkumného zjištění určitého vztahu… ověřujeme v podstatě konfrontací s realitou“ (Pelikán, 2004, 59). K jejímu výpočtu používáme korelačních koeficientů. Souběžná a predikční validita je souhrnně nazývána jako validita kriteriální. konstruktová – posuzuje „…do jaké míry ovlivňuje výsledky provedeného měření nějaký faktor – konstrukt“ (Chráska, 2000, 42). „Důkazy o konstruktové validitě mohou mít konvergentní charakter (test prokazuje vztahy k těm proměnným, jež podle teorie očekáváme) nebo diskriminační charakter (naopak nemá vztah k proměnným, když tento vztah neočekáváme)“ (Hendl, 2004, 49). Z dalších typů validit se ještě zmíním o validitě ekologické, která se týká vlivu prostředí, v němž je výzkum realizován. Zahrnuje vliv počasí, denní a roční doby i vliv barevnosti a osvětlení prostoru apod. Variační rozpětí Charakteristika variability R, která je dána rozdílem maximální a minimální hodnoty v souboru. Nevýhodou variačního rozpětí je velká citlivost vůči odlehlým hodnotám.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
12
Wilcoxonův neparametrický test Je obdobou parametrického párového t-testu. Podmínkou jeho použití je alespoň ordinální typ dat. Používá se při opakovaných měřeních stejných souborů. STATISTICA: Statistika Neparametrická statistika Porovnávání dvou závislých vzorků (skupiny) Wilcoxonův párový test Základní a výběrový soubor „Základní soubor je množina všech prvků, patřících do okruhu osob nebo jevů, které mají být zkoumány v daném výzkumu“ (Pelikán, 2004, 47). Základní soubor ale může být velice rozsáhlý až nedostupný a neproveditelný. Proto se ze základního souboru pořizuje výběrový soubor (vzorek), který by měl být co nejpřesnější zmenšenou kopií onoho původního základního souboru. „Co možná největší přiblížení výběru (vzorku) základnímu souboru je důležité zejména proto, abychom i na základě výzkumu uskutečněného na výrazně menším souboru, vybraném ze souboru původního, mohli dělat obecnější závěry, platné i pro celý základní soubor“ (Pelikán, 2004, 47). Proto se dále budu zabývat jednotlivými typy výběru: náhodný výběr – je definován tak, že „…každý prvek populace má stejnou pravděpodobnost, že se do výběru dostane“ (Hendl, 2004, 53). Podle Lindquista (1967, 19) je „…náhodný výběr pořízen tak, že všechny jiné možné kombinace stejného počtu členů základního souboru mají stejnou možnost dostat se do výběru“. Pro realizaci náhodného výběru musíme mít k dispozici očíslovaný seznam všech prvků základního souboru a funkci generující náhodná čísla, pomocí níž vybereme očíslovaný prvek ze základního souboru. Takovýto seznam lze vytvořit v softwarovém prostředí Microsoft Office Excel, v němž zároveň lze náhodná čísla generovat pomocí funkce „CELÁ.ČÁST((horní-mez – dolní-mez + 1)*NAHČÍSLO()) + dolní-mez“ (Brož, 2003, 537). Výsledky měření na tomto typu výběru mají obecnou platnost, lze je jen s minimální chybou zobecňovat na celý základní soubor. V praxi je náhodný výběr často neproveditelný nebo nákladný, především z důvodů značné rozsáhlosti základního souboru. Následující 4 typy výběru jsou přijatelnými náhradními metodami, jež ve výběru využívají náhodný mechanismus. stratifikovaný výběr – „…vychází z rozdělení základního souboru na skupiny podle předem stanovených kritérií, z nichž se pak dělá náhodný výběr“ (Pelikán, 2004, 53). „Tato technika je vhodná, jestliže populaci lze stratifikovat podle pohlaví, věku nebo demografických parametrů a výzkumník chce zajistit reprezentaci každé podskupiny“ (Hendl, 2004, 54). „Tím nenarušíme princip náhodnosti a přitom zajistíme, že nedojde k nerovnoměrnosti zastoupení základních prvků nebo znaků, které nás při výzkumu zajímají“ (Pelikán, 2004, 53). kontrolovaný výběr – je zvláštním případem stratifikovaného výběru, v němž není selekce ponechána náhodě. „…rozdělení určitého vybraného znaku je provedeno tak, aby bylo shodné s předem stanovenou proporcí“ (Lindquist, 1967, 21). Počet vybraných prvků z podskupiny je proporcionální počtu prvků v základním souboru. Dejme tomu, že chceme u daného souboru školních dětí zkoumat např. tělesnou hmotnost. Víme, že tělesná hmotnost nějak souvisí s pohlavím, a chceme se ujistit, že náš výběr nemá nevhodnou proporci obou pohlaví. Víme-li, že v celkovém základním souboru je stejný počet chlapců a děvčat, můžeme pak ze všech chlapců (resp. děvčat) náhodně vybrat stejný počet chlapců a stejný počet děvčat. Tento výběr jsme učinili reprezentativním vzhledem k pohlaví. vícestupňový shlukový výběr – opakovaně prováděný náhodný výběr v jednotlivých skupinách, které jsou podmnožinou té předcházející. Pro statistické zpracování takto získaných dat se používají speciální techniky, někdy lze však použít postupy zpracování dat z náhodných výběrů.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
13
Často se používá pro získání informací o veřejném mínění. Například chceme-li zjistit názory lidí z panelových sídlišť měst určité velikosti. Postupuje se např. takto: 1. vybere se náhodně vzorek okresů; 2. z takto vybraných okresů se v každém okresu vybere náhodně určitý počet měst o dané velikosti; 3. pro takto vybraná města se vybere náhodně vzorek jejich sídlišť; 4. z vybraných sídlišť se náhodně vyberou domácnosti, ve kterých se provede dotazování. V každé vrstvě shluků se provádí náhodný výběr. Tato vícestupňová procedura vypadá velmi komplikovaně, ale ve skutečnosti je velmi efektivní a méně nákladná než prostý náhodný výběr (Hendl, 2004, 54). systematický výběr – je prováděn podle předem stanovaného kritéria. Stejně jako u náhodného výběru se nejprve vytvoří očíslovaný seznam všech prvků základního souboru. Avšak na rozdíl od náhodného výběru se výběr z tohoto seznamu nepořizuje náhodně, ale systematicky podle předem pevně stanoveného kritéria. Například se bude vybírat vždy jeden prvek z padesáti. Nejdříve se zvolí náhodně prvek z první padesátky…. V dalším kroku se k tomuto číslu postupně přičítává číslo 50 a prvky s takto získaným pořadovým číslem se zařazují do výběru. Aby byl systematický výběr validní, musí výzkumník zajistit, že číslování prvků není závislé na charakteristikách jedinců, jež se mají zkoumat (Hendl, 2004, 54-55). záměrný výběr – „…se liší od předcházejících druhů výběrů v tom, že zde o výběru jistého prvku nerozhoduje náhoda, ale buď záměr výzkumníka, anebo úsudek zkoumané osoby“ (Chráska, 2000, 22). Záměrný výběr lze pořídít trojím způsobem: 1) prvky se dostávají do výběru samy (např. dobrovolně přihlášení lidé do anket); 2) záměrný výběr „průměrných jednotek“, při kterém se vybírá určitý objekt (škola, třída, žák), jenž výzkumník považuje za typický (průměrný) příklad; 3) výběr pomocí kvót (kvótní výběr), který je jako jediný ze záměrných výběrů přijatelný pro zobecňování zjištěných výsledků na základní soubor, ze kterého byl kvótní výběr pořízen. Zákon (zákonitost) „Určuje všeobecnou platnost závislostí, procesů, jevů a jejich vlastností za určitých, přesně popsaných podmínek“ (Pelikán, 2004, 33). Na rozdíl od exaktních přírodních věd však v pedagogickém výzkumu hledáme spíše zákonitosti, protože vysoká variabilita proměnných působících v pedagogickém procesu znemožňuje jednoznačně definovat jeho absolutní, bezvýjimečnou platnost. Zákonitost je „...zjištěná vazba mezi různými proměnnými, platná pro statisticky významnou část případů v pevně definovaných podmínkách. Hovoříme-li o statisticky významné vazbě, neznamená tento vztah absolutní platnost“ (Pelikán, 2004, 33). Brož, M. (2003). Mistrovství v Microsoft Excel 2000. Brno: Computer Press. Frömel, K. (2002). Kompendium psaní a publikování v kinantropologii. Olomouc: Univerzita Palackého. Gavora, P. (2000). Úvod do pedagogického výzkumu. Brno: Paido. Hendl, J. (2004). Přehled statistických metod zpracování dat. Praha: Portál. Chráska, M. (2000). Základy výzkumu v pedagogice. Olomouc: Univerzita Palackého. Chráska, M. (2003). Úvod do výzkumu v pedagogice (základy kvantitativně orientovaného výzkumu). Olomouc: Univerzita Palackého. Kerlinger, F. N. (1972). Základy výzkumu chování. Praha: Academia. Lepš, J. (1996). Biostatistika. České Budějovice: Jihočeská Univerzita. Lindquist, E. F. (1967). Statistická analýza v pedagogickém výzkumu. Praha: Státní pedagogické nakladatelství. Meloun, M., & Militký, J. (2002). Kompendium statistického zpracování dat. Praha: Academia. Pelikán, J. (2004). Základy empirického výzkumu pedagogických jevů. Praha: Karolinum.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
14
2 Koeficienty „efekt size“ jako vodítko pro posuzování věcné významnosti statisticky testovaných rozdílů 2.1 Korelační koeficient rP a rS Rozšířenými, srozumitelnými a často používanými koeficienty efekt size jsou korelační koeficienty (rP - Pearsonův součinový korelační koeficient a rS - Spearmanův koeficient pořadové korelace). „Přes některé své nedostatky zůstává Pearsonův korelační koeficient r nejdůležitější mírou síly vztahu dvou náhodných spojitých proměnných X a Y“ (Hendl, 2004, 243). Korelační koeficienty (rP, rS) určují míru těsnosti (síly) vztahu mezi dvěma proměnnými. nabývají hodnot -1 ≤ r ≤ +1. při r=0 jsou proměnné X a Y naprosto nezávislé (nesouvislé, beze vztahu). Čím vyšší je hodnota korelačního koeficientu tím vyšší je závislost (při příčinném vztahu) či souvislost (při asociačním vztahu) mezi proměnnými X a Y (viz tabulka 1). Jestliže je r kladné tak se zvyšující se hodnotou X roste i hodnota Y. Při záporném r s rostoucí hodnotou X klesá hodnota Y. Příčinný vztah mezi proměnnými X a Y existuje, pokud X jednoznačně způsobuje, ovlivňuje Y (změna X způsobuje změnu Y). Při asociačním vztahu „jen“ víme, že při ovlivňování, změně X (resp. Y) se mění i Y (resp. X), nevíme však zda tuto změnu způsobuje X nebo Y či jiná další proměnná. vysoká hodnota korelačního koeficientu sama o sobě ještě nepotvrzuje existenci příčinného vztahu. Ze schématu, typu výzkumu musíme jednoznačně vědět která z proměnných je potencionální příčinou a která důsledkem (musíme znát zda hledáme příčinný nebo asociační vztah). nerozlišují mezi závisle a nezávisle proměnnou. „Nezávisle proměnná je vlastnost (jev), která je příčinou nebo podmínkou vzniku jiné vlastnosti (jevu). Závisle proměnná je vlastnost, která je výsledkem (následkem, důsledkem) působení nezávisle proměnné“ (Chráska, 2000, 11). nezmění se, když změníme jednotky měření proměnných X a Y. Pearsonův korelační koeficient rP se vypočítává přímo z naměřených párových hodnot proměnných X a Y a je, podobně jako aritmetický průměr a směrodatná odchylka, velmi ovlivněn odlehlými hodnotami. Používá se u metrických dat (např. tělesná hmotnost v [kg]; čas v [s]; síla v [N]... tyto veličiny mají pevně stanovenou nulovou hodnotu, po celé měřitelné stupnici je stejný dílek měření (rozdíl 10-9 kg je stejný jako 199-198 kg) a lze dělit (lze např. vypočítat procentuální snížení tělesné hmotnosti, zlepšení času při běhu na 100 metrů či zvýšení síly o 10 %), které mají normální rozdělení a očekáváme lineární vztah. n
n
n
n X i Yi X i Yi rP
i 1
n n 2 n X i X i i 1 i 1
i 1
2
i 1
n 2 n 2 n Yi Yi i 1 i 1
rP n X Y
- Pearsonův korelační koeficient - počet srovnávaných dvojic hodnot - závisle proměnná - nezávisle proměnná
Pearsonův korelační koeficient není vhodné použít, pokud: jedna z proměnných X, Y nemá náhodný charakter (její hodnoty jsou pevně dány). nelze předpokládat linearitu očekávaného vztahu. nelze předpokládat normální rozdělení proměnných X a Y.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
15
Spearmanův korelační koeficient rS se nevypočítává přímo z naměřených párových hodnot proměnných X a Y, ale z jejich pořadí (skutečné naměřené hodnoty proměnných X a Y se převedou na pořadí např. výsledky atletického desetiboje (proměnná X) 5235 bodů = 1; 5200 bodů = 2; 4876 bodů = 3; 4446 bodů = 4 apod., a např. tělesná výška desetibojaře (proměnná Y) 188 cm = 1; 182 cm = 2; 179 cm = 3; 173 cm = 4 apod. a teprve pak se vypočítá korelační koeficient rS z pořadí (1, 2, 3, 4) jednotlivých proměnných X a Y). rS - Spearmanův korelační koeficient Di - rozdíly z pořadí hodnot proměnných X a Y vzhledem k ostaním hodnotám seřazeného výběru podle velikosti n - počet srovnávaných dvojic hodnot
n
6 Di rS 1
i 1 2
n n 1
Spearmanův korelační koeficient je, na rozdíl od Pearsonova korelačního koeficientu, odolný vůči odlehlým hodnotám. Lze jej použít ve všech případech, kdy již nelze použít Pearsonův korelační koeficient. Používá se u všech ordinálních dat a dat metrických, které nesplňují podmínky normálního rozdělení a očekávání lineárního vztahu. Interpretace konkrétní hodnoty korelačního koeficientu se v různých situacích posuzuje různě (v závislosti na prostředí výzkumu: laboratorní terénní, počtu sledovaných osob, přesnosti použitých meřících technik, apod.). Hendl (2004) udává sílu asociace, vztahu jako: malou při |rp|=0,1-0,3. střední při |rp|=0,3-0,7. velkou při |rp|=0,7-1. Podle Chrásky (2000, 201) „..prakticky použitelná závislost je minimálně r = 0,40. Uvedená tabulka 1 slouží jen k orientačnímu posouzení vypočítaného koeficientu korelace. Určitá hodnota korelačního koeficientu může být hodnocena v různých výzkumných situacích různě“. Tabulka 1. Přibližná interpretace hodnot korelačního koeficientu. (převzato z Chráska, M. (2000). Základy výzkumu v pedagogice. Olomouc: Univerzita Palackého, str. 201) Koeficient korelace |r| =
Interpretace
1
naprostá závislost (funkční závislost)
1,00
|r|
0,90
velmi vysoká závislost
0,90
|r|
0,70
vysoká závislost
0,70
|r|
0,40
střední závislost
0,40
|r|
0,20
nízká závislost
0,20
|r|
0,00
slabá (nepoužitelná) závislost
0
naprostá nezávislost
|r| =
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
16
Podobnou interpretaci korelačního koeficientu udává Pett (1997): r 0,90 extrémně silná závislost (souvislost, vztah); 0,70 – 0,89 silná závislost; 0,50 – 0,69 střední závislost; 0,30 – 0,49 nízká závislost a r 0,30 slabá závislost mezi sledovanými proměnnými. Při zjišťování statistické významnosti velikosti korelačního koeficientu (program Statistika ji zobrazuje současně s hodnotou koeficientu, program Excel ji nevypočítává) musíme mít na paměti, že každý „statistický“ výpočet je ovlivněn počtem analyzovaných dat (resp. počtem sledovaných osob). Tabulka 2 nám znázorňuje vliv počtu korelovaných hodnot na velikost korelačního koeficientu statisticky významného na hladině p=0,05). Zatímco při srovnávání dat u 30 osob může být střední závislost statisticky nevýznamná, tak při korelování dat 300 osob může být prakticky nevýznamný, nepoužitelný vztah vysoce statisticky významný. Tabulka 2. Velikosti Pearsonova a Spearmanova korelačního koeficientu statisticky významné na hladině p=0,05 v závislosti na počtu srovnávaných dat (upraveno podle Chrásky (2000, 2003) a Hendla (2004)) Počet korelovaných hodnot 5 20 30 50 100 200 300 400 500
r0,05…minimální hodnota korelačního koeficientu významná na hladině p=0,05 rP - Pearsonův korelační koeficient rS - Spearmanův korelační koeficient 0,805 0,900 0,378 0,564 0,306 0,377 0,235 0,305 0,165 0,117 0,095 0,082 0,074
Z tabulky 2 je zřejmé, že hladina statistické významnosti korelačního koeficientu je výrazně ovlivněna rozsahem souboru, navíc intervaly pro „přibližnou“ interpretaci jeho hodnot jsou dosti široké (tabulka 1). Proto se nabízí otázka, zda lze vyjádřit vztah mezi proměnnými přesněji, přitom co možná nejjednoduššeji? Odpovědí může být koeficient determinace, který se vypočíává z korelačního koeficientu. EXCEL: STATISTICA:
Vložit funkci Statistické CORREL/PEARSON Statistika Základní statistiky/tabulky Korelační matice
2.2 Koeficient determinace d Umožňuje velice srozumitelně vysvětlit souvislost (závislost) mezi dvěma proměnnými, neboť jeho hodnotu lze převézt na procenta. Vypočítá se jako druhá mocnina korelačního koeficientu a jeho hodnota vynásobená 100 nám říká kolika procenty se podílí sledovaný faktor na výsledném efektu (Kerlinger, 1972).
d r2
variabilita vysvětlená nezávislou proměnnou celková variabilita
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
17
Neboť dělíme variabilitu variabilitou je koeficient determinace bezrozměrný (nemá jednotku), je poměrem. Vynásobíme-li jej 100 převedeme jeho hodnotu na procenta %. Podle Hendla (2004, 270) „...číslo 100r2 udává v procentech tu část celkové variability proměnné Y, resp. X, která je vysvětlena znalostí hodnoty X, resp. Y. Tuto hodnotu nazýváme koeficient determinace. Koeficient determinace je poměr vysvětlené variability k celkové variabilitě proměnné Y“. 2.3 Další koeficienty efekt size - kritéria pro jejich výběr a hodnocení efektu Pro posouzení významnosti rozdílů máme k dispozici minimálně tři dostupné nástroje: Prvním je klasická statistická významnost na zvolené hladině významnosti, nejčastěji p=0,05 nebo p=0,01. Testy statistické významnosti umožňují rozhodnout však pouze o tom zda sledovaný (měřený) efekt je či není nulový. Bližší informace o velikosti a významnosti efektu schází (Borenstein, 1997). Testy statistické významnosti jsou navíc značně závislé na rozsahu souboru n (Levine & Hullett, 2002; Tolson, 1980). Druhým je logický úsudek (věcná – logická významnost), kdy předem stanovíme rozdíly, které považujeme za významné na základě zkušenosti z předchozích výzkumů nebo rešerše z literatury. Při volbě věcně významnosti výcházejte také z chyby měření. Předem stanovený věčně významný rozdíl nemůže samozřejmě být menší než chyba měření. Třetím nástrojem pro posouzení věcné významnosti rozdílů jsou koeficienty efekt size (např. d, r2, 2, 2, ...), jejichž popis a použití bude objasněno v následujícím textu. Pro úplnější porozumění zjištěným výsledkům doporučuje řada zahraničních časopisů uvádět mimo statistické výzmanosti také některý z koeficientů efekt size (American Psychological Association, 2002; McCartney & Rosenthal, 2000). Koeficienty efekt size „eliminují“ statistickou závislost na rozsahu souboru n. Často se při statistickém testování výsledků stává, že věcně významný rozdíl mezi dvěma (nebo více) proměnnými je vlivem nízkého rozsahu souboru statisticky nevýznamný, a obráceně při testování rozdílů proměných u souboru s n≥1000 jsou i zjevně věcně nevýznamné rozdíly statisticky velmi významné. Tabulka 3. Kritéria výběru koeficientů efekt size a hodnocení jejich efektu DATA/ POUŽITÁ STATISTIKA KOEFICIENT HODNOCENÍ PROMĚNNÉ efekt size efektu r=0,10 malý efekt Nominální Chí kvadrát 2x2 r r=0,30 střední efekt r=0,50 velký efekt Ordinální, % vyjádření podílu Koeficient intervalová, Korelační koeficient faktoru na výsledném determinace r2 poměrová efektu M + SD, t-test, ANOVA, d=0,2 malý efekt Nezávislé proměnné/ Z-test, Opakovaná měření Cohenovo d d=0,5 střední efekt metrická data (pouze pro 2 opakování) d=0,8 velký efekt Neparametrická data, více než dva Kruskal-Wallisův test 2 2= malý efekt nezávislé vzorky 2= 0,06 střední efekt Neparametrická data, Friedmanova Two-way 2= 0,14 velký efekt více než dva závislé 2 ANOVA vzorky Nezávislé proměnné/ 2 ≥0,1 vypovídá o F-test, t-test 2 metrická data významnosti vztahu
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
18
Pokud to charakter dat dovoluje (ordinální a metrická data) můžeme jako koeficienty efekt size vždy použít korelační koeficienty rP, rS a koeficient determinace d (=r2) (Tabulka 3). Přičemž hodnoty rP=0,10 (resp. rP=0,30 a rP=0,50) jsou běžně interpretovány jako nízký (resp. střední a výrazný) efekt (Cohen, 1988; Dishman & Buckworth, 1996). Tabulka 3 podává přehled podmínek použití a hodnocení základních koeficientů efekt size. Bližší vysvětlení výpočtu a hodnocení základních koeficientů efekt size následuje níže: r - lze jednoduše vypočítat z t, F nebo 2 statistiky podle rovnic 1-3 (McCartney & Rosenthal, 2000) a jejich nejčastější způsob hodnocení je r = 0,10 malý efekt, r = 0,30 střední efekt, r = 0,50 velký efekt.
t2 t 2 df
(1)
r
2 n
(2)
r
F F df error
(3)
r
t 2 F n df dferror
- vypočítaná hodnota t-testu - vypočítaná hodnota chí-kvadrát testu - vypočítaná hodnota analýzy variance ANOVA - celkový rozsah souboru - stupeň volnosti - vypočítaná hodnota chí-kvadrátu
Koeficient r lze použít při testování míry závislosti mezi dvěma dichotomickými proměnnými, např. pohlaví (muž, žena), nebo úkol (splnil, nesplnil) pro kontingenční tabulku 2 x 2. Měří důležitost vztahu mezi dvěma skupinami znaků nominálních dat, kde každý z nich může nabývat pouze dvou hodnot (Pett, 1997; Siegel & Castellan, 1988). Je obvykle používán po signifikantním výsledku 2 testu pro dva nezávislé soubory či pro měření reliability na nominálních datech. Podmínky pro použití jsou dichotomické proměnné, nezávislá pozorování a jejich hodnocení se skládají z četností, ne ze skóre. Jedno z možných hodnocení koeficientu r > 0,90 extrémně silná závislost (souvislost, vztah); 0,70 - 0,89 silná závislost; 0,50 - 0,69 střední závislost; 0,30 - 0,49 nízká závislost a < 0,30 slabá závislost mezi sledovanými proměnnými (Pett, 1997). Koeficient determinace r2 - vyjadřuje procentuální podíl z celkové variance, který vysvětluje vliv faktoru na sledovaný efekt, doplněk do 100 % vysvětlují ostatní faktory (Blahuš, 2000; Thomas & Nelson, 2001). Tolson (1980) považuje sledovaný vztah za významný při r2 0,1. Cohenovo d - lze použít pro hodnocení efektu mezi dvěma nezávislými skupinami (proměnnými). Nejjednodušší vyjádření je dáno rovnicí 4, kde rozdíl aritmetických průměrů mezi skupinami, M1 a M2 nebo Me, resp. Mcontrol (aritmetický průměr experimentální, resp. kontrolní skupiny) vydělíme směrodatnou odchylkou kontrolní skupiny – pokud existuje. V případě, že žádná ze skupin není kontrolní, ve jmenovateli je SDpooled (rovnice 5) (Cortina & Nouri, 2000; Thomas, Lochbaum, Landers, & He, 1997; Thomas & Nelson, 2001). Čitatel M1-M2 je číslo nezáporné, v případě, že M1-M2 <0, bereme v úvahu absolutní hodnotu rozdílu nebo M2-M1.
d
M1 M 2 (4) SDcontrol
d
M1 M 2 (5), kde SD pooled SD pooled
n
1
1 SD12 n2 1 SD22 n1 n2 2
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
19
Nejčastější hodnocení efekt size d je 0,2 - malý efekt; 0,5 - střední a 0,8 - velký efekt (McCartney & Rosenthal, 2000; Thomas, Lochbaum, Landers, & He, 1997; Thomas & Nelson, 2001; Thomas, Salazar, & Landers, 1991). Koeficient 2 - k některým typům statistických testů existují konkrétní koeficienty efekt size a vzorce pro hodnocení velikosti jejich účinku. Koeficient 2 lze použít u testu Kruskal - Wallis ANOVA by Ranks (rovnice 6) a Friedman’s Two - Way ANOVA (rovnice 7) s hodnocením 2= 0,01 malý efekt, 2= 0,06 střední efekt a 2= 0,14 velký efekt (Morse, 1999). Efekt size pro nezávislé soubory je určen rovnicí 8 (Cortina & Nouri, 2000).
2
H (6) n 1
2
2 krit (7) n df
2
SS total SS error (8) SS total
H - vypočítaná hodnota Kruskal-Wallisova testu 2 - vypočítaná hodnota chí-kvadrát testu n - celkový rozsah souboru SStotal - celkový součet čtverců celkový rozptyl SSerror - součet čtverců uvnitř skupiny „within group (error term)“ „chybový“ rozptyl
Koeficient 2 - je jedním z prvních koeficientů efekt size (rovnice 9), který umožňuje kvantifikaci síly statistické asociace u sledovaných zdrojů odchylek (Tolson, 1980). Pro jeho výpočet lze použít také F a t statistiky (rovnice 10 a 11) (Tolson, 1980). 2 vyjadřuje procentuální podíl z celkové variance, který vysvětluje vliv faktoru na sledovaný efekt, doplněk do 100 % vysvětlují ostatní faktory (Blahuš, 2000; Thomas & Nelson, 2001). Tolson (1980) považuje sledovaný vztah za významný při 2 0,1. Pro vícefaktorovou ANOVU je výpočet 2 dán rovnicemi 12-14. Kde p je počet úrovní faktoru A a q je počet úrovní faktoru B a n je celkový rozsah souboru. Při ANOVĚ 3x2 je p=3 a q=2.
2
SS between k 1 MS within (9) SS total MS within
2
F k 1 k 1 F k 1 n k 1
2
t 2 1 (11) t 2 n1 n 2 1
(10)
F t k n SStotal SSbetween MSwithin
- vypočítaná hodnota analýzy variance ANOVA - vypočítaná hodnota t-testu - počet sledovaných skupin - celkový rozsah souboru - celkový součet čtverců (celkový rozptyl) - součet čtverců mezi skupinami („mezi-skupinový“ rozptyl) - průměr čtverců uvnitř skupiny („vnitřně-skupinový“ rozptyl)
A2
p 1 FA p 1 p 1 FA q 1 FB p 1 q 1 FAB n p q 1
B2
q 1 FB p 1 (13) p 1 FA q 1 FB p 1 q 1 FAB n p q 1
2 AB
(12)
p 1 q 1 FAB p 1 q 1 p 1 FA q 1 FB p 1 q 1 FAB n p q 1
(14)
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
20
Při znalosti statistické významnosti a koeficientu efekt size, lze pro celkové posouzení výsledků využít praktického návodu z tabulky 4 (Fan, 2001). Tabulka 4. Interpretace výsledků při znalosti statistické významnosti a koeficientu efekt size EFFEKT SIZE Malý efekt „small“
Není statistický ani praktický efekt, ledaže by budoucí výzkum ukázal něco jiného.
S i N g E n H0 přijímáme jak statisticky tak i věcně f i k Statistická významnost není a doprovázena věcnou n významností. Mělo by se c přihlédnout k síle testu a e A N rozsahu souboru. O Při interpretaci statistické významnosti bychom měli být obezřetní, nelze z toho vyvodit přímý praktický význam.
Střední efekt „moderate“
Efekt je střední, ale jistá obezřetnost v interpretaci výsledků je na místě. Zdá se že efekt má jistý praktický význam, pozor- interpretace má mnoho možností. Znepokojivá je chyba II. druhu. Sledujte sílu testu při malém rozsahu souboru nemusí být odhalen významný efekt. Je nepravděpodobné že sledovaný efekt je významný jen díky možnostem statistiky. Velikost efektu má praktický význam v mnoha oblastech sociálních a behaviorálních věd. Usuzujeme že výsledek je významný jak statisticky tak věcně.
Velký efekt „large“
Smysluplný efekt existuje, ale zůstaňme rozvážní. Velká hodnota effect size se může vyskytovat u malých souborů. Pokud jsme znepokojeni chybou II. druhu, podívejme se kriticky na sílu testu. Předběžně můžeme podpořit signifikanci efektu-zůstaneme otevření budoucím výsledkům.
Téměř s jistotou není výsledek ovlivněn možnostmi statistiky. Efekt hodnotíme významný jak statisticky tak i věcně.
Pro přesné zjištění efektu testovaného faktoru je důležitý výběr správných koeficientů. Použití klasických vzorců na neparametrické modely není vhodné, protože již při malých odchylkách v rozdělení dat dochází k velkým rozdílům při výpočtu efekt size. Koeficienty efekt size jsou velmi citlivé na změny v distribuční funkci hlavně při malé varianci - pak při nesprávné volbě koeficientu vychází efekt size téměř vždy vysoké (Wilcox & Muska, 1999). Pro hodnocení významnosti u neparametrických testů existují koeficienty jako jsou: Cramerův koeficient C, r, , Kendalovo , Kendalův koeficient concordance W, Goodman Kruskalův koeficient a a další (American Psychological Association, 2002). Neexituje přesný návod jak nejlépe vyhodnotit výsledky po stránce statistické, logického úsudku a pomocí koeficientů efekt size. Celkové posouzení výsledků by mělo být založeno na logicky správné dedukci všech oblastí hodnocení. American Psychological Association. (2002). Publication Manual of the American Psychological Association (5th ed.). Washington, DC: Author. Blahuš, P. (2000). Statistická významnost proti vědecké průkaznosti výsledků výzkumu. Česká kinantropologie, 4(2), 53-71. Borenstein, M. (1997). Hypothesis testing and effect size estimation in clinical trials. Annals of Allergy, Asthma, and Immunology, 78(1), 5-11. Cohen, J. (1988). Statistical power analysis for the behavioral sciences. (4th ed.). New York: Academic Press. Cortina, J. M., & Nouri, H. (2000). Effect size for ANOVA design. Thousand Oaks, CA: Sage. Dishman, R. K., & Buckworth, J. (1996). Increasing physical activity: A quantitative synthesis. Medicine and Science in Sports and Exercise, 28, 706-719.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
21
Fan, X. (2001). Statistical significance and effect size in education research: Two sides of a coin. The Journal of Educational Research, 94(5), 275-282. Hendl, J. (2004). Přehled statistických metod zpracování dat. Praha: Portál. Chráska, M. (2000). Základy výzkumu v pedagogice. Olomouc: Univerzita Palackého. Chráska, M. (2003). Úvod do výzkumu v pedagogice (základy kvantitativně orientovaného výzkumu. Olomouc: Univerzita Palackého. Levine, T. R., & Hullett, C. R. (2002). Eta squared, partial eta squared, and misreporting of effect size in communication research. Human Communication Research, 28(4), 612-625. Kerlinger, F. N. (1972). Základy výzkumu chování. Praha: Academia. McCartney, K., & Rosenthal, R. (2000). Effect size, practical importance, and social policy for children. Child Development, 71(1), 173-180. Morse, D. T. (1999). Minisize2: A computer program for determining effect size and minimum sample for statistical significance for univariate, multivariate, and nonparametric tests. Educational and Psychological Measurement, 59(3), 518-531. Pett, M. A. (1997). Nonparametric statistics for health care research: Statistics for small samples and unusual distributions. Thousand Oaks, CA: Sage. Siegel, S., & Castellan, N. J. (1988). Nonparametric statistics for the behavioral sciences (2nd ed.). Boston, MA: McGraw-Hill. Thomas, J. R., Lochbaum, M. R., Landers, D. M., & He, C. (1997). Planning significant and meaningful research in exercise science: Estimating sample size. Research Quarterly for Exercise and Sport, 68(1), 33-43. Thomas, J. R., & Nelson, J. K. (2001). Research methods in physical activity (4th ed.). Champaign, IL: Human Kinetics. Thomas, J. R., Salazar, W., & Landers, D. M. (1991). What is missing in p< .05? Effect size. Research Quarterly for Exercise and Sport, 62(3), 344-348. Tolson, H. (1980). An adjunct to statistical significance: ω2. Research Quarterly for Exercise and Sport, 51(3), 580-584. Wilcox, R. R., & Muska. J. (1999). Measuring effect size: A non-parametric analogue of 2. British Journal of Mathematical and Statistical Psychology, 52, 93-110.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
22
3 Microsoft Office Excel 3.1 Představení Program určený k zadávání a statistické analýze dat a jejich grafickému zpracování je součástí softwarového balíčku firmy Microsoft a je nainstalován téměř v každém počítači. V počítači jej najdeme následovně (Obrázek 3): START (dolní lišta vlevo) Programy (uprostřed v rolující nabídce) Microsoft Office Microsoft Office Excel
Obrázek 3. Cesta spuštění progamu Microsoft Office Excel Excelový list je v podstatě „čtverečkovaným sešitem“ z jednotlivých buněk tvořící „síť“ řádků a sloupců, který nám v první řadě umožní přepis naměřených dat z papíru do počítače. Abychom si nekomplikovali následné zpracování dat (i v software Statistika), je výhodné při jejich přepisu do tabulky v Excelu dodržet následující pravidla: o Jediný list – než vytvářet několik tabulek na několika excelovských listech je výhodnější sestavit jedinou tabulku se společným označením všech proměnných pro všechny analyzované skupiny jedinců. V případě, že některá ze sledovaných skupin neobsahuje některé proměnné, ponecháme tyto buňky prázdné. Při výpočtech, převodu do Statistiky ušetříme čas a máme zaručenou jednotnost ve zkratkách proměnných a dostatečnou variabilitu všech dat pro následné složitější statistické postupy (ANOVA, post-hoc testy, apod). o První řádek – vymezit na zkratkovitý popis proměnných. Nejlépe využívat velkých a malých písmen a číslic. Ve zkratkách nepoužívejte diakritiku a mezery. Dbejte na logické a smysluplné sestavení zkratek proměnných tak, aby jste se vnich vyznali i po delším časovém odstupu (mezi naměřením dat a jejich statistickém zpracovávání do diplomové práce). Jako první proměnnou je vhodné uvést kód účastníka (pokud máte souhlas tak jméno a příjmení), pokračovat základními skupinovými (např. školní třída, tělesná zdatnost, typ onemocnění, apod.) a somatickými proměnnými (pohlaví, tělesná hmotnost a výška, věk, apod.) a pak konkrétními proměnnými podle projektu práce (Obrázek 4). Při opakovaném zjišťování téže proměnné ji uvádějte do dalšího sloupce s odlišením např. v posledním znaku zkratky číslicí 1, 2 atd. o První sloupec – je nejlépe vyhradit na kód (v případě souhlasu na jméno a příjmení) účastníka (Obrázek 4).
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
23
o Formát buněk – u každého sloupce vyberte (kliknutí na sloupec kliknutí na pravé tlačítko na myši Formát buněk Číslo/Obecný – Obrázek 4) jaký typ (zpravidla číselné nebo textové) proměnné v něm budete zadávat.
Obrázek 4. Specifikace formátu buněk v Excelu Vytváření jediné tabulky pro všechny sledované skupiny (např. pacienti zdraví; kontrolní experimentální; děvčata chlapci) je vhodné z důvodu zjednodušení výpočtů a úspory času. Ve Statistice pak lze z jediné tabulky testované faktory (např. pacienti zdraví; kontrolní experimentální; děvčata chlapci) opět jednoduše vybrat. Detailně rozmyšlený projekt (jasně formulovaný hlavní cíl a cíle dílčí; přesně formulované výzkumné otázky a hypotézy spolu s rozdělením operacionalizovaných proměnných na závislé a nezávislé, atd.) vybízí k logicky správnému a přehlednému sestavení tabulky tak, aby bylo možno jednotlivé proměnné testovat. Operacionalizovatelnost proměnných znamená, že lze dané proměnné přiřadit číslo (nebo kategorii) vyjadřující její hodnotu. Podmínka operacionalizovatelnosti proměnných je obsažena v Gavorově (2000) třetím „zlatém pravidle hypotézy“ (viz termín hypotéza v kapitole 1 Abecední slovníček termínů používaných ve statistice). Jednou z nesporných výhod Excelu je skutečnost, že vybranou popisnou funci (např. aritmetický průměr nebo směrodatnou odchylku) pro jednu proměnnou (jeden sloupec) lze jednoduše pomocí funkce kopírovat (Ctrl C ) vložit (Ctrl V) použít i pro další proměnné (sloupce) (viz Obrázek 16 v kapitole 3.3.2 Výpočet základních charakteristik (aritmetický průměr, směrodatná odchylka a korelační koeficient). Naopak jednou z nevýhod Excelu je nezobrazování hladin statistické významnosti u statistických testů významnosti (ty je pak nutno dohledávat v tabulkách) a nemožnost najednou vypočítávat a přehledně zobrazovat více korelačních vztahů mezi více proměnnými (matici korelačních vztahů). Konkrétní postup vytvoření datové tabulky v Excelu spolu se základními statistickými výpočty budu pro ještě větší názornost ilustrovat na třech příkladech.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
24
3.2 Příklad – Efekt dvouměsíčního intervenčního programu aerobiku na habituální pohybovou aktivitu děvčat ve věku 15-19 let Hlavním cílem této studie je zjistit vliv intervenčního pohybového programu aerobiku na na habituální pohybovou aktivitu (dále PA) a pohybovou inaktivitu (dále PI) děvčat v pracovních a víkendových dnech. Dalším cílem je podle počtů kroků z pedometru Omron HJ–102, aktivního energetického výdeje z akcelerometru Caltrac, a doby trvání PA z individuálního záznamu posoudit efekt realizované PA ve vztahu ke zdravotním doporučením. Ke hlavnímu a dalšímu cíli této studie je nutné objasnit operacionalizaci (tzn. vyjádření pomocí čísel) kvantitativních proměnných: počet kroků, aktivní energetický výdej, doba trvání PA a jejich přípravu do tabulky (Obrázek 6). Pojmem efekt je myšlen vliv, dopad, působení intervenčního pohybového programu na běžnou, každodenní pohybovou aktivitu a je posuzován pomocí rP – Pearsonova korelačního koeficientu. 3.2.1 Příprava dat do tabulky Tabulka (Obrázek 6) pro další statistické zpracování dat ctí pravidla pro vytváření tabulek v Excelu. Je vytvořena na jediném listě, první řádek zkratkovitý popis proměnných bez mezer a bez použití diakritiky, první sloupec příjmení a jméno.
Obrázek 6. Tabulka se základními proměnnými Intervenční program aerobiku byl realizován ve čtyřech městech (proměnná MESTO) u gymnaziálních studentek prvního a třetího ročníku (proměnná ROCNIK). Následují základní somatické charakteristiky (proměnné – tělesná hmotnost HM, tělesná výška VYSKA, kalendářní věk VEK a body mass index BMI). Výpočet aritmetického průměru, směrodatné odchylky a Pearsonova korelačního koeficientu rP budu demonstrovat na těchto proměnných: INTsteps5 – denní počet kroků v pracovních dnech prvního intervenčního týdne, INTsteps2 – denní počet kroků v pracovních dnech druhého habitálního týdne, HABsteps5 – denní počet kroků ve víkendových dnech prvního intervenčního týdne, HABsteps2 – denní počet kroků ve víkendových dnech druhého habitálního týdne.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
25
3.2.2 Výpočet základních charakteristik (aritmetický průměr, směrodatná odchylka a korelační koeficient) a) aritmetický průměr Funkci výpočtu aritmetického průměru najdeme v Excelu následovně: Vložit funkci Vybrat kategorii Statistické na svislém posouvátku nalistovat PRŮMĚR (Obrázek 7).
Obrázek 7. Cesta funkce výpočtu aritmetického průměru v Excelu
Obrázek 8. Výpočet aritmetického průměru konkrétní proměnné INTsteps5 v Excelu
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
26
Konkrétní hodnotu aritmetického průměru proměnné INTsteps5 (denního počtu kroků v pracovních dnech intervenčního týdne) v Excelu vypočteme takto: Vložit funkci Vybrat kategorii Statistické nalistovat PRŮMĚR OK zobrazí se okno s názvem Argumenty funkce Číslo 1, do kterého napíšu počáteční a koncovou pozici vektoru čísel, z nichž požaduji aritmetický průměr vypočítat. V našem případě chci vypočítat aritmetický průměr proměnné INTsteps5, která v excelovské tabulce začíná na pozici I2 a končí na pozici I91 (Obrázek 8). Výsledek se zobrazí bezprostředně po zapsání pozice koncového čísla. Před samotným výpočtem aritmetického průměru je vhodné v datové tabulce kurzorem vybrat první prázdnou buňku pod koncovou pozicí proměnné; do této buňky se pak zapíše výsledná hodnota aritmetického průměru (Obrázek 9). Pokud je tabulka dat v Excelu připravená tak, že v každém sloupci je jediná proměnná (jako v našem příkladě) a u některé z nich je již aritmetický průměr vypočítán, lze jednoduše pomocí funkce kopírovat (Ctrl C) vložit (Ctrl V) vypočítat aritmetické průměry i pro další proměnné (Obrázek 9). Buňku s vypočtenou hodnotou konkrétního aritmetického průměru vyberu a pomocí funkce kopírovat (Ctrl C) vložit (Ctrl V) ji „překopíruji“ do prázdné buňky pod další proměnnou. Nepřekopíruji totožný obsah buňky, nýbrž funkci aritmetického průměru, která automaticky vypočte aritmetický průměr další proměnné (Obrázek 9).
Obrázek 9. Výpočet aritmetického průměru další proměnné pomocí funkce kopírovat (Ctrl C) vložit (Ctrl V) b) směrodatná odchylka Funkci výpočtu směrodatné odchylky v Excelu najdeme následovně: Vložit funkci Vybrat kategorii Statistické na svislém abecedně seřazeném posouvátku nalistovat SMODCH.VÝBĚR (Obrázek 10). Výpočet hodnoty směrodatné odchylky vybrané proměnné obvykle předchází výpočet aritmetického průměru této proměnné, jehož výsledek je v excelovské tabulce vhodné zapsat do prázdné buňky pod sloupec s vybranou proměnnou (Obrázky 9 a 10). Pro přehledné umístění hodnoty směrodatné odchylky v excelovské tabulce nastavím kurzor na další prázdnou buňku pod hodnotou aritmetického průměru (Obrázek 10). Výpočet hodnoty směrodatné odchylky konkrétní proměnné INTsteps5 pak provedu takto: Vložit funkci Vybrat kategorii Statistické na svislém abecedně seřazeném posouvátku nalistovat SMODCH.VÝBĚR OK Argumenty funkce, kde do obdélníku Číslo 1 vypíšu počáteční:koncovou (I2:I91) pozici vektoru proměnné INTsteps5 (Obrázek 11). Potvrzením tlačitkem OK zapíšu vypočtenou hodnotu na vybranou pozici (I93) v excelovské tabulce (Obrázek 12).
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
27
Obrázek 10. Cesta funkce výpočtu směrodatné odchylky proměnné v Excelu
Obrázek 11. Výpočet směrodatné odchylky konkrétní proměnné INTsteps5 v Excelu Máme-li datovou tabulku v Excelu sestavenou tak, že v každém sloupci je jediná proměnná (jako v našem příkladu) a u některé z nich je již směrodatná odchylka vypočítána, lze rychle pomocí funkce kopírovat (Ctrl C) vložit (Ctrl V) vypočítat směrodatné odchylky i u
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
28
dalších proměnných (Obrázek 13). Buňku již s vypočtenou hodnotou konkrétní směrodatné odchylky kurzorem označím a pomocí funkce kopírovat (Ctrl C) vložit (Ctrl V) ji „překopíruji“ do prázdné buňky pod další proměnnou. Nepřekopíruji totožný obsah označené buňky, nýbrž funkci směrodatné odchylky, která automaticky vypočte hodnoty směrodatných odchylek dalších proměnných (Obrázek 13).
Obrázek 12. Zobrazení výpočítané hodnoty směrodatné odchylky v excelovské tabulce
Obrázek 13. Výpočet směrodatné odchylky dalších proměnných pomocí funkce kopírovat (Ctrl C) vložit (Ctrl V) c) korelační koeficient Již v názvu Příkladu (Efekt dvouměsíčního intervenčního programu aerobiku na habituální pohybovou aktivitu děvčat ve věku 15-19 let) se vyskytuje slovo efekt, kterým myslím vliv, dopad, působení intervenčního pohybového programu na běžnou, každodenní pohybovou aktivitu v pracovních a víkendových dnech a posuzuji jej pomocí rP – Pearsonova korelačního koeficientu. Cestu výpočtu korelačního koeficientu rP v Excelu zachycuje Obrázek 14 (Vložit funkci Vybrat kategorii Statistické na svislém abecedně řazeném posouvátku najít PEARSON). Konkrétní hodnotu korelačního koeficientu rP mezi počtem kroků v pracovních dnech intervenčního a habituálního týdne (proměnné INTsteps5 a HABsteps5) vypočteme následovně: Vložit funkci Vybrat kategorii Statistické na svislém abecedně řazeném posouvátku najít PEARSON (Obrázek 21) OK Argumenty funkce, kde do obdélníku Pole 1 vypíšu počáteční a koncovou (I2:I92) pozici proměnné INTsteps5 a do Pole 2 počáteční a koncovou (K2:K92) pozici proměnné HABsteps5 (Obrázek 15). Výsledek rP=0,54 je zobrazen ihned po zápisu koncové pozice proměnné HABsteps5 (Obrázek 16). Hladinu statistické významnosti p vypočteného korelačního koeficientu rP=0,54 Excel nezobrazuje. Mohu ji konfrontovat s tabulkou 2.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
29
Obrázek 14. Cesta funkce výpočtu Pearsonova korelačního koeficientu v Excelu
Obrázek 15. Výpočet Pearsonova korelačního koeficientu mezi proměnnými INTsteps5 a HABsteps5 Hodnotu dalšího korelačního koeficientu rP mezi proměnnými INTsteps2 a HABsteps2 lze vypočítat odbobným způsobem jako hodnotu korelačního koeficientu mezi proměnnými INTsteps5 a HABsteps5 (Obrázky 14 a 15) s jediným rozdílem, že do Pole 1 vypíšu počáteční a koncovou pozici proměnné INTsteps2 (J2:J92) a do Pole 2 počáteční a koncovou pozici proměnné HABsteps2 (L2:L92). Anebo mohu využít funkce kopírovat (Ctrl C) vložit (Ctrl V) jako u předchozích výpočtů hodnot aritmetických průměrů (Obrázek 9) a směrodatných
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
30
odchylek (Obrázek 13). Kurzor v excelovské tabulce nastavím na buňku s vypočtenou hodnotou korelačního koeficientu rP mezi proměnnými INTsteps5 a HABsteps5 pomocí funkce kopírovat (Ctrl C) vložit (Ctrl V) ji překopíruji do sousední prázdné buňky (Obrázek 16). Nepřekopíruji však obsah buňky, nýbrž její funci (výpočet Pearsonova korelačního koeficientu), která automaticky pozná, že chci vypočítat hodnotu Pearsonova korelačního koeficientu rP mezi INTsteps2 a HABsteps2 rP=0,48 (Obrázek 16).
Obrázek 16. Výpočet korelačního koeficientu rP mezi proměnnými INTsteps2 a HABsteps2 pomocí funkce kopírovat (Ctrl C) vložit (Ctrl V)
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
31
4 Statistika 6.0 4.1 Představení Jedná se o vyspělý statistický software umožňující zadávaní a statistické zpracování dat spolu s jejich a tabulkovým a grafickým výstupem (Obrázek 17). Univerzita Palackého má zakoupená licenční práva na jeho používání a v součásné době jsou studentům a zaměstnancům Fakulty tělesné kultury přístupné jeho plovoucí verze.
Obrázek 17. Úvodní okno software Statistica 6.0 Protože je software Statistika plovoucí verze (umístěná na společném síťovém serveru) s omezeným počtem současných uživatelů, DOPORUČUJI časté ukládání tabulek s mezivýpočty do vlastního adresáře. Nejvhodnější však je připravit si tabulku s daty v software Excel a tu pak importovat do software Statistika. 4.2 Příprava dat do tabulky Základní formát listu je velice podobný formátu listu v Excelu – „čtverečkovaná síť“ vytvořená z prázdných buněk v řádcích a sloupcích. Tato „podobnost“ zaručuje převeditelnost datové tabulky z Excelu do Statistiky. Pro přípravu tabulky dat ve Statistice doporučuji dodržovat stejná pravidla jako pro vytváření tabulky v Excelu: o Jediný list – vhodnější než vytvářet několik tabulek na několika excelovských listech je vytvořit jedinou tabulku se společným označením všech proměnných pro všechny analyzované skupiny jedinců. V případě, že některá ze sledovaných skupin neobsahuje některé proměnné, ponecháme tyto buňky prázdné. Při výpočtech, převodu do Statistiky
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
32
ušetříme čas a máme zaručenou jednotnost ve zkratkách proměnných a dostatečnou variabilitu všech dat pro následné složitější statistické postupy (ANOVA, post-hoc testy, apod). o První řádek – vymezit na zkratkovitý popis proměnných. Ve statistice lze přímo pojmenovat proměnnou, blíže specifikovat formát zobrazení dat, typ písma apod., kliknutím na záhlaví sloupce (Obrázek 18). Pro zkratky proměnných využívejte velkých a malých písmen a číslic; nepoužívejte diakritiku a mezery. Dbejte na logické a smysluplné sestavení zkratek proměnných tak, aby jste se vnich vyznali i po delším časovém odstupu (mezi naměřením dat a jejich statistickém zpracovávání do diplomové práce). Jako první proměnnou je vhodné uvést kód účastníka (pokud máte souhlas tak jméno a příjmení), pokračovat základními skupinovými (např. školní třída, tělesná zdatnost, typ onemocnění, apod.) a somatickými proměnnými (pohlaví, tělesná hmotnost a výška, věk, apod.) a pak konkrétními proměnnými podle projektu práce (Obrázek 19). Při opakovaném zjišťování téže proměnné ji uvádějte do dalšího sloupce s odlišením např. v posledním znaku zkratky číslicí 1, 2 atd. o První sloupec – je nejlépe vyhradit na kód (v případě souhlasu na jméno a příjmení) účastníka (Obrázek 19). o Formát buněk – Nabídku formátu buněk ve Statistice zobrazíte kliknutím na záhlaví konkrétního sloupce (Obrázek 18).
Obrázek 18. Pojmenování a specifikace proměnné ve Statistice
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
33
Obrázek 19. Příprava tabulky dat ve Statistice pro výpočet základních popisných statistických proměnných
Obrázek 20. Příprava tabulky dat ve Statistice s identifikační proměnnou OPAK pro použití ANOVY Pro výpočet základních popisných statistických proměnných (aritmetický průměr, medián, modus, směrodatná odchylka, variační rozpětí apod.), matic korelačních závislostí a některých testů neparametrické statistiky (Znaménkový a Wilcoxonův test) je nejvhodnější připravit si tabulku dat podle výše uvedených pravidel (Obrázek 19). Pro použití ANOVY a MANOVY a dalších neparametrických testů (Mann–Whitneyova, Kruskal–Wallisova a Mediánového testu) je nutné tabulku dat z obrázku 19 upravit tak, že proměnné INTsteps5 a HABsteps5 „sjednotíme“ do jediné proměnné steps5 a k ni vytvoříme novou „identifikační“ proměnnou OPAK (Obrázek 20). Pomocí hodnot 1 a 2 této nové „identifikační“ proměnné rozlišíme
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
34
počet kroků v intervenčním (OPAK=1) a habituálním (OPAK=2) týdnu. Pak hodnoty proměnné steps5 s příslušnou hodnotou proměnné OPAK=1 odpovídají hodnotám proměnné INTsteps5 a hodnoty proměnné steps5 s příslušnou hodnotou proměnné OPAK=2 odpovídají hodnotám proměnné HABsteps5 (Obrázek 20). 4.3 Uložení tabulky dat v Excelu a import do Statistiky Po dokončení datové tabulky v Excelu (bez vypočítaných základních statistických proměnných) ji uložíme v automaticky nabízeném formátu s koncovkou .xls a zavřeme tak, abychom ji mohli najít a importovat do software Statistika. Cesta otevření excelovského souboru s tabulkou dat ve formátu .xls ve Statistice je následující: Spustit software Statistika na horní liště rozbalit nabídku Soubor zvolit Otevřít v oblasti hledání najít adresář s uloženým souborem dat ve spodní rozbalovací liště Soubory typu najít Soubory typu Excel Files (*.xls) (Obrázek 21) myší je vybrat zobrazí se všechny soubory ve zvoleném adresáři s koncovkou .xls (Obrázek 22). Po výběru konkrétního souboru se zobrazí nabídka Import souboru zvolíme: Importovat vybraný list do tabulky (Obrázek 23 A ) vybereme: List1 (Obrázek 24 B ) v zobrazeném okně Otevřít soubor MS Excel (Obrázek 23 C ) zatrhneme možnosti: 1.řádek jako názvy proměnných a Importovat formáty buněk (Obrázek 23 D ) OK zobrazí se připravená tabulka dat ve Statistice pro výpočet základních popisných statistických proměnných (Obrázek 19).
Obrázek 21. Cesta otevření excelovského souboru s tabulkou dat ve formátu .xls ve Statistice
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
35
Obrázek 22. Výběr excelovského souboru ve formátu .xls pro otevření ve Statistice
Obrázek 23. Výběr excelovského souboru ve formátu .xls pro otevření ve Statistice
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
36
4.4 Výpočet základních popisných statistických proměnných ve Statistice
Obrázek 24. Cesta výpočtu základních popisných statistických proměnných ve Statistice Výpočet základních popisných statistických proměnných ve Statistice je velice jednoduchý a elegantní, pokud máme tabulku dat správně vytvořenou (1 sloupec = 1 proměnná). Na horní liště rozbalíme nabídku Statistika (Obrázek 24) a vybereme funkci: Základní statistiky/tabulky (Obrázek 24) v nich pak Popisné statistiky (Obrázek 25). Po potvrzení funkce Popisné charakteristiky OK se zobrazí nabídka výběru konkrétních popisných charakteristik a proměnných (Obrázek 26).
Obrázek 25. Cesta výpočtu základních popisných statistických proměnných ve Statistice
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
37
Obrázek 26. Výběr konkrétních popisných charakteristik
Obrázek 27. Výběr konkrétních proměnných Jako příklad konkrétních popisných charakteristik jsem zatrhnutím zvolil následující: Míry polohy – počet platných proměnných, aritmetický průměr, medián a modus; Variace,
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
38
momenty – směrodatná odchylka, rozptyl, šikmost, špičatost; Kvantity – minimum a maximum (Obrázek 26). Z konkrétních proměnných (kliknutím na políčko Proměnné ) jsem buď zmáčknutím klávesy Ctrl a současně levým tlačítkem na myši nebo současným zmáčknutím klávesy Shift a pomocí kláves vybral proměnné HM, VYSKA, VEK, BMI, INTsteps5, INTsteps2, HABsteps5, HABsteps2 (Obrázek 27). Po potvrzení výběru proměnných OK a následného kliknutí na Souhrn dostávám finální tabulku s vypočítanými základními popisnými charakteristikami (Obrázek 28).
Obrázek 28. Zobrazení výsledků základních popisných statistických proměnných ve Statistice V prvním sloupci na obrázku 28 jsou pod sebou seřazeny vybrané proměnné a v následujících pak jim odpovídající výsledky zvolených popisných charakteristik. Z nich lze přímo vytvářet grafy a tabulky, podle směrodatných odchylek posuzovat „rozptýlenost“ dat okolo aritmetických průměrů anebo podle testu šikmosti (=0) a špičatosti (=0) hodnotit normalitu rozdělení dat pro výběr vhodného parametrického či neparametrického testu, apod. 4.5 Použití ANOVY ve Statistice Pro použití ANOVY ve Statistice, stejně jako dalších neparametrických testů (Mann– Whitneyova, Kruskal–Wallisova a Mediánového testu), je nutné základní tabulku dat z obrázku 29 upravit (viz kapitola 4.2 Příprava dat do tabulky). 4.5.1 Vytvoření identifikační (grupovací, faktorové) proměnné Úprava spočívá v tom, že k testované proměnné musíme vytvořit novou „identifikační“ proměnnou, kterou vyžaduje formát software Statistika pro použití ANOVY a Mann– Whitneyova, Kruskal–Wallisova a Mediánového neparametrického testu (Obrázek 30).
Obrázek 29. Základní tabulka dat k Příkladu ve Statistice
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
39
Obrázek 30. Upravená tabulka dat k Příkladu 2 pro použití ANOVY ve Statistice V případě použití ANOVY se tato proměnná nazýva faktorem, u neparametrických testů pak grupovací proměnnou. Vytvoření faktorové proměnné budu demonstrovat na konkrétním příkladu statistického testování rozdílu mezi počtem kroků v pracovních dnech intervenčního (proměnná INTsteps5) a habituálního (proměnná HABsteps5) týdne použitím ANOVY. Tyto dvě proměnné INTsteps5 a HABsteps5 (Obrázek 29) „sjednotíme“ do jediné proměnné pojmenované steps5 a k ni vytvoříme faktorovou proměnnou s názvem OPAK (Obrázek 30). „Sjednocení“ nejlépe provedeme překopírováním hodnot proměnné HABsteps5 (K2:K91) pod poslední hodnotu proměnné INTsteps5 na pozici (I92) v Excelu. Proměnnou INTsteps5 přepsáním přejmenuji na steps5. Pak přidám nový sloupec pro faktorovou proměnnou OPAK rozbalením nabídky Vložit Sloupec na horní liště v Excelu (Obrázek 31). Vepsáním hodnot 1 a 2 v nově přidaném faktoru pojmenovaném OPAK rozlišíme počet kroků v intervenčním (OPAK=1) a habituálním (OPAK=2) týdnu (Obrázek 32). Pak hodnoty proměnné steps5 s příslušnou hodnotou faktoru OPAK=1 odpovídají hodnotám proměnné INTsteps5 a hodnoty proměnné steps5 s příslušnou hodnotou faktoru OPAK=2 odpovídají hodnotám proměnné HABsteps5 (Obrázek 32).
Obrázek 31. Vytvoření nového sloupce pro grupovací proměnnou OPAK v Excelu Obdobně postupuji při přípravě proměnné steps2 pro použití ANOVY. Překopíruji hodnoty proměnné HABsteps2 (M2:M91) pod poslední hodnotu proměnné INTsteps2 na pozici (K92). Proměnnou INTsteps2 přejmenuji na steps2. Již vytvořený faktor OPAK rozlišuje také
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
40
proměnnou steps2 na část odpovídající počtu kroků ve víkendových dnech intervenčního (proměnná INTsteps2) a habitulního (proměnná HABsteps2) týdne (Obrázek 33).
Obrázek 32. Rozlišení proměnné steps5 pomocí faktoru OPAK v Excelu
Obrázek 33. Rozlišení proměnné steps2 pomocí faktoru OPAK v Excelu Po odstranění proměnných HABsteps5 a HABsteps2, uložení a zavření souboru v Excelu máme připravenou tabulku dat pro použití ANOVY ve Statistice. Zobrazení připravené tabulky dat po importu do Statistiky znázorňuje již zmiňovaný obrázek 30. 4.5.2 Výpočet ANOVY Pro použití testování rozdílu mezi dvěma či více proměnnými prostřednictvím ANOVY ve Statistice je nezbytné připravit tabulku dat jako na obrázku 30 (1 sloupec = 1 testovaná proměnná + faktorová proměnná (proměnné) rozdělující testovanou proměnnou (proměnné) do faktorem určených skupin). Cesta výběru ANOVY v software Statistika je následující: rozbalením nabídky Statistika ANOVA se dostáváme k nabídce jednotlivých druhů ANOVY (jednofaktorová, vícefaktorová, při opakovaných měřeních) (Obrázek 34). V našem konkrétním příkladě – statistického testování rozdílu mezi počtem kroků v pracovních (proměnná steps5) a víkendových (proměnná steps2) dnech intervenčního a habituálního týdne (faktor OPAK) pomocí ANOVY zvolím jednofaktorovou analýzu variance. V nabídce Proměnné jednofaktorové ANOVY vyberu ze seznamu Závisle proměnných 10. proměnnou steps5 a faktor 5. proměnnou OPAK (Obrázek 35). Po potvrzení OK výběru se zobrazí vybraná závisle proměnná steps5 a faktor OPAK, u nějž je ještě navíc potřeba zvolit kódy faktoru vybírám všechny (1 označuje intervenční režim, 2 režim habituální) (Obrázek 36). Po dvojím potvrzení OK (výběru kódů faktoru a druhu ANOVY) se zobrazí nabídka výsledků jednofaktorové ANOVY, ve které volím Všechny efekty (Obrázek 37).
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
41
Obrázek 34. Cesta výběru z jednotlivých druhů ANOVY ve Statistice
Obrázek 35. Výběr závisle proměnné a faktoru u jednofaktorové ANOVY ve Statistice
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
42
Obrázek 36. Výběr kódů faktoru u jednofaktorové ANOVY ve Statistice Při statistickém testování rozdílu mezi počtem kroků v pracovních dnech (proměnná steps5) intervenčního a habituálního týdne prostřednictvím jednofaktorové ANOVY vychází F=1,20 a p=0,2757 (Obrázek 37). Tudíž testovaný rozdíl není statisticky významný na dostatečně nízké hladině statistické významnosti. Pro statistické testování rozdílu mezi počtem kroků ve víkendových dnech (proměnná steps2) intervenčního a habituálního týdne použiji již vypočtenou ANOVU pro pracovní dny (proměnná steps5), v níž pomocí funkce Změnit vyměním proměnnou steps5 za steps2 při zachování stejného faktoru OPAK i jeho kodů. Testovaný rozdíl mezi počtem kroků ve víkendových dnech intervenčního a habituálního týdne je statisticky významný F=5,15 na dostatečně nízké hladině statistické významnosti p=0,0245 (Obrázek 38).
Obrázek 37. Výsledky testu signifikance jednofaktorové ANOVY pro proměnnou steps5
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
43
Obrázek 38. Výsledky testu signifikance jednofaktorové ANOVY pro proměnnou steps2
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
44
II praktická část Ukázka použití statistického zpracování dat v konkrétním článku 5 Příklad – Efekt dvouměsíčního intervenčního programu aerobiku na habituální pohybovou aktivitu děvčat ve věku 15-19 let☻ 5.1 Abstrakt Optimální pohybová aktivita výrazně přispívá k dobrému zdraví, normální tělesné hmotnosti a aktivnímu životnímu stylu. Cílem této studie je posoudit efekt intervenčního pohybového programu aerobiku na habituální pohybovou aktivitu a pohybovou inaktivitu v pracovních a víkendových dnech. Intervenční pohybový program byl sestaven ze dvou extrakurikulárních vyučovacích jednotek tělesné výchovy aerobiku týdně. Dvouměsíční intervenční pohybový program byl u děvčat (n=90; M±SD; kalendářní věk 16,76±1,76 let; tělesná výška 164,54±5,18 cm; tělesná hmotnost 53,60±7,34 kg) srovnáván s jejich habituální týdenní pohybovou aktivitou. Intervenční pohybový program byl realizován v měsících únor a březen (resp. březen a duben) roku 2003. Habituální týdenní pohybová aktivita byla monitorována jeden měsíc po ukončení intervenčního programu. Pohybová aktivita byla hodnocena podle počtu kroků z pedometru Omron HJ–102, aktivního energetického výdeje z akcelerometru Caltrac a její skladby z individuálního sedmidenního záznamu. Extrakurikulární vyučovací jednotky aerobiku vysvětlují ze 40 % (resp. 30 %) aktivní energetický výdej ve volném čase v intervenční (resp. habituální) týdenní pohybové aktivitě. V pracovních dnech nenacházíme rozdíly mezi intervenční a habituální pohybovou aktivitou. Avšak o víkendu je habituální pohybová aktivita výrazně (F=5,15; p=0,02; d=0,22) vyšší než intervenční pohybová aktivita. Intervenční pohybový program aerobiku výrazně přispívá ke zmírňování rozdílů mezi pohybovou aktivitou ve víkendových a pracovních dnech zúčastněných děvčat. Dvě extrakurikulární vyučovací jednotky tělesné výchovy s přitažlivým obsahem mohou zvýšit habituální pohybovou aktivitu na zdravotně doporučovanou úroveň. Klíčová slova: Vyučovací jednotka tělesné výchovy, pracovní dny, víkendové dny, kroky, pohybová inaktivita, Omron. Zpravidla základní část rozhodující o následné četbě celé odborné práce je abstrakt. Vhodně sestavený abstrakt obsahuje maximálně jednu větu o řešené problematice, formulace cíle práce, přesný popis metodiky včetně účastníků, hlavní dosažené cíle a nejvýraznější závěry či zobecnění. Nedílnou součástí jsou nejfrekventovaněji používaná a práci charakterizující klíčová slova. Slovem efekt je myšlen vliv, dopad, působení intervenčního pohybového programu na běžnou, každodenní pohybovou aktivitu a je posuzován pomocí rP – Pearsonova korelačního koeficientu (viz 5.4.4 Softwarové a statistické zpracování dat). Základní somatické charakteristiky lze nejen v abstraktu ale i v metodice (viz 5.4.1 Účastníci) vyjádřit prostřednictvím aritmetického průměru (M) a směrodatné odchylky (SD) pomocí znaku ±. Čtenáři tak sděluji, že při normálním rozdělení dat se v intervalu (M-SD, M+SD) vyskytuje přibližně 68,3 % účastníků. V intervalu (M-2SD, M+2SD) se již vyskytuje 95,5 % účastníků a v intervalu (M-3SD, M+3SD) již 99,7 % účastníků (Hendl, 2004). Takže, např. pro tělesnou výšku se 68 % tzn. 61 z monitorovaných děvčat nachází v intervalu (159,36-169,72) cm a 86 děvčat (95 % z celkového počtu n=90) má tělesnou výšku v rozmezí 154,18 až 174,9 cm.
☻
publikováno: Sigmund, E., Frömel, K., Sigmundová, D., Pelclová, J., & Skalik, S. (2004). Efekt dvouměsíčního intervenčního programu aerobiku na habituální pohybovou aktivitu děvčat ve věku 15-19 let. Česká kinantropologie, 8(2), 17-30.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
45
Koeficient determinace d=rP2 názorně vyjadřuje procentuální vliv vyučovacích jednotek aerobiku na pohybovou aktivitu v intervenčním a běžném školním režimu. Hendl, J. (2004). Přehled statistických metod zpracování dat. Praha: Portál. Slovní formulace: výrazně, významně, signifikantně vyšší nebo nižší... při srovnávání výsledků by měly doplňovat nebo předcházet statisticky vypočtené informace např. (F=5,15; p=0,02; d=0,22) tzn. zjištěný rozdíl je, srovnáním pomocí analýzy variance, statisticky významný na hladině p=0,02 při středním efektu koeficientu „efekt size“ d (viz 6.4.4 Softwarové a statistické zpracování dat). Chráska, M. (2000). Základy výzkumu v pedagogice. Olomouc: Univerzita Palackého. 5.2 Abstract (Effect of two-months aerobics intervene program on habitual physical activity of girls aged 15-19) Optimal physical activity markedly contributes to good health, normal body weight and active lifestyle. Purpose of this study is to assess effects of aerobic intervene physical activity program on weekdays and weekends habitual PA and physical inactivity. Intervene physical activity program was designed as 2 extra-curriculum physical education lessons of aerobic per week. Two-months intervene physical activity of girls (n=90, M±SD, 16.76±1.76 years, height 164.54±5.18 cm, weight 53.60±7.34 kg) was compared with their habitual weekly physical activity. Intervene physical activity program was realized in February and March (March and April, respectively) 2003. Habitual physical activity was monitored one month after the end of intervene program. Physical activity was assessed according to number of steps from Omron HJ–102 pedometer, active energy expenditure from Caltrac accelerometer and their structure from individual 7-day logs. Extra-curriculum aerobic lessons explained 40% (30%, respectively) of active energy expenditure of leisure in intervene (habitual, respectively) weekly physical activity. There are no differences between intervene and habitual physical activity on weekdays. However, weekendhabitual physical activity is significantly higher (F=5.15, p=0.02, d=0.22) than weekendintervene physical activity. Aerobic intervene physical activity program markedly contributed to reduce discrepancies between higher-level weekdays and lower-level weekends physical activity of participant girls. Two extra-curriculum physical education lessons with favorite content can increase weekly habitual physical activity on health-recommended level. Key words: Physical education lesson, weekday, weekend, steps, physical inactivity, Omron. 5.3 Úvod Ačkoliv je prokázán inverzní vztah mezi pohybovou aktivitou (dále PA) a rizikovými faktory způsobujícími některá chronická onemocnění (obezita, cukrovka, ischemická choroba srdeční) (Sirard & Pate, 2001) nedaří se výskyt těchto onemocnění v širokém populačním spektru uspokojivě snižovat. Pohybová inaktivita (dále PI) a s ní úzce související nemoci (ischemická choroba srdeční, vysoký krevní tlak, cukrovka, obezita, osteoporóza, deprese a stavy úzkosti) představují nejdražší léčené zdravotní komplikace u států s výrazným podílem sedavého zaměstnání a motorizované dopravy (Colditz, 1999). Aplikace intervenčních stravovacích a pohybových programů (Sahota et al., 2001; Sallis et al., 2003) je vedle klinických a medikačních zásahů snahou o zmírnění výrazného nárůstu obezity, cukrovky a srdečních onemocnění patrných dokonce již u dětí (Ball & McCargar, 2003; Fox, 2004). Nejpalčivějším a také nejčastěji intervenčně řešeným problémem u dětí, mládeže i dospělých je obezita (Goran et al., 1999; Sahota et al., 2001; Sallis et al., 2003). Nejefektivnější intervenční PA programy u dětí a mládeže mají zahrnovat školní a komunální intervence za výrazné podpory rodiny (Goran et al., 1999; Pate et al., 2000).
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
46
Efektivita intervenčního PA programu je podle Sallise et al. (1992) podmíněna komplexností při jeho tvorbě a realizaci v oblasti kognitivní, sociální a environmentální. Pro efektivní redukci obezity u dětí a mládeže je vedle kognitivní složky nezbytná kombinace optimální PA a diety – zvýšení energetického výdeje a snížení energetického příjmu (Crespo et al., 2001; Sahota et al., 2001; Sallis et al., 2003). Multidisciplinární přístup při tvorbě intervenčních PA programů má vyústit v pohybově a zdravotně zaměřených kurikulech, změnách ve školním i mimoškolním prostředí, které podporuje bezpečnost a prožitek při PA před začátkem, v průběhu a po skončení školního vyučování (Goran et al., 1999). Komplexně pojímané intervenční PA programy jsou však v praxi často obtížně realizovatelné. Příkladem komplexního intervenčního PA programu ověřeného na základních školách je CATCH (McKenzie et al., 1996; Stone et al., 1998) a intervenčního PA programu v tělesné výchově (dále TV) pak SPARK (Sallis, 1994). Intervenční projekt CATCH byl zaměřen na redukci rizikových kardiovaskulárních faktorů u 8-10 letých dětí z 96 základních škol prostřednictvím úprav ve školním stravování a v kurikulech TV, zavedením zdravotní výchovy ve třídách a účasti rodičů. Prokázalo se zvýšení střední a intenzivní PA nejen v TV, ale i ve volném čase zúčastněných dětí (McKenzie, 1996). Intervenční PA program v TV SPARK je založen na sociálně–kognitivní teorii. Kvaziexperimentální design projektu byl ověřen na sedmi základních školách. Monitorování PA pomocí akcelerometru Caltrac a individuálního záznamu, měření zdatnosti, tloušťky kožních řasa BMI bylo realizováno po dobu dvou let. Výsledky ukazují zvýšenou PA děvčat i chlapců v TV, neprokázal se však efekt zvýšení volnočasové PA. Přestože se po dvou letech prokázal výrazný efekt v běhu na 1 míli a počtu leh-sedů za 1 minutu u děvčat a ne u chlapců, je právě u děvčat obtížnější sestavit a ověřit efektivní intervenční PA program (McKenzie et al., 2000; Powers et al., 2002; Sallis et al., 2003; Stone et al., 1996). Pro děti a mládež je škola a školní prostředí nejvhodnější pro realizaci intervenčních PA programů také proto, že více než 97 % dětí absolvuje vyučovací jednotky TV (Sallis et al., 1992). Ve kvalitně připravených a vedených vyučovacích jednotkách TV může docházet ke zmírňování rozdílů mezi PA děvčat a chlapců (Katzmarzyk & Malina, 1998; McKenzie et al., 2000), více a méně dovedných chlapců (Hastie & Trost, 2002) či mezi sportovně organizovanou a neorganizovanou mládeží (Katzmarzyk & Malina, 1998). Ačkoliv se vyučovací jednotky TV podílejí pouze ze 3 % na celkovém týdenním času věnovanému PA, z hlediska aktivního energetického výdeje z akcelerometru Caltrac tvoří u děvčat ve věku 18-19 let nezastupitelných 22 % (Sigmund et al., 2003). Přibližně 12 % z denního množství kroků je u děvčat (n=300) ve věku 6-12 let realizováno v jednotce TV (Morgan et al., 2003). Katzmarzyk a Malina (1998) při třídenním monitoringu PA 12-14letých dětí dokonce zjišťují, že 65 % (resp. 55 %) denního aktivního energetického výdeje děvčat (resp. chlapců) připadá na organizovanou PA. Před 20 lety byly děti pohybově aktivnější ve volném čase mimo školu, v organizované PA a o víkendových dnech (Goran et al., 1999). V současnosti jsou z hlediska PA dětí a mládeže naopak kritičtější právě víkendové a prázdninové dny ve srovnání s pracovními, školními dny (Gavarry et al., 2003; Hovell et al., 1999; Sigmund et al., 2002). O víkendových dnech dochází vlivem výrazného nárůstu pohybové inaktivity také ke snižování rozdílů v objemu a skladbě PA mezi děvčaty a chlapci, kteří jsou ve školních dnech pohybově aktivnější než děvčata (Gavarry et al., 2003). Powersová et al. (2002) a Stoneová et al. (1996) doporučují ověřovat intervenční PA projekty na zvýšení právě mimoškolní, volnočasové PA. Hlavním cílem této studie je zjistit vliv intervenčního pohybového programu aerobiku na na habituální PA a PI děvčat v pracovních a víkendových dnech. Dalším cílem je podle počtů kroků z pedometru Omron HJ–102, aktivního energetického výdeje z akcelerometru Caltrac,
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
47
a doby trvání PA z individuálního záznamu posoudit efekt realizované PA ve vztahu ke zdravotním doporučením. 5.4 Metodika 5.4.1 Účastníci Dvouměsíční intervenční pohybový program dokončilo 90 (M±SD; 16,76±1,76 let, tělesná výška 164,54±5,18 cm; tělesná hmotnost 53,60±7,34 kg) z celkového počtu 122 děvčat. Zúčastněna děvčata byla z náhodně vybraných tříd prvního a třetího ročníku ze čtyřech stratifikovaně vybraných gymnázií z katowického regionu. Stratifikačním faktorem bylo umístění škol v centru města s hustou bytovou zástavbou, se zhoršenými podmínkami pro mimoškolní venkovní PA. Účast děvčat na intervenčním pohybovém programu byla dobrovolná. Způsob výběru souboru zkoumaných jedinců je nutno uvést také z důvodu výběru vhodné statistické metody pro zpracování dat, popř. hladiny statistické významnosti pro zamítnutí či přijetí testovaných hypotéz. Způsob výběru zkoumaného souboru nám také určuje míru zobecnění zjištěných výsledků. Pokud náhodně, např. losováním, vybírám 40 studentů ze 150 studentů prvních ročníků, mohu si dovolit zjištěná fakta u 40 studentů zobecnit na všech 150 studentů tak, jako kdybych je zkoumal všechny. Pokud se však jedná o záměrný výběr nemohu zjištěna fakta prakticky zobecňovat vůbec, platí pouze pro záměrně vybranou a sledovanou skupinu jedinců. 5.4.2 Přístroje a dotazníky Monitoring PA je založen na sedmidenním kontinuálním sledování PA pomocí akcelerometru Caltrac, pedometru Omron HJ–102 a individuálního záznamu (Frömel et al., 1999). Sledování a hodnocení PA akcelerometrem Caltrac bylo převzato z amerického projektu SPARK (Sallis, 1994) a v našich podmínkách standardizováno na Fakultě tělesné kultury Univerzity Palackého (Novosad et al., 1995/96). Při monitoringu PA je účastníky zaznamenáván celkový a aktivní energetický výdej z akcelerometru Caltrac (kcal·den-1), počet kroků z pedometru Omron (počet·den-1) a jednotlivé druhy PA (min·den-1). Individuálním záznamem byla navíc sledována také PI (Sigmund et al., 2002). Aplikací dotazníku sportovních zájmů (Frömel et al., 2002) byly zjišťovány preference zúčastněných děvčat v oblasti PA. Pro určování aktivního energetického výdeje byl Caltrac v terénních podmínkách validován srovnáním se snímačem srdeční frekvence (Montoye et al., 1996) také při sedmidenním monitoringu českých adolescentů (Frömel et al., 1999). Aktivní energetický výdej z Caltracu signifikantně koreluje s počtem kroků z pedometru Omron (rP=0,62; p=0,0000) a dobou trvání PA z individuálního záznamu (rP=0,48; p=0,0000) při celodenním terénním monitoringu PA u 190 děvčat a chlapců ve věku 11–12 let (Sigmund, 2000). Ačkoliv pedometry umožňují stanovit také aktivní energetický výdej přesnější jsou při určování kroků a poskoků při PA (Tudor-Locke et al., 2002). Každá studie by měla v kapitole metodika obsahovat informace o přesnosti a spolehlivosti požívaných přístrojů, dotazníků apod., a údaje o jejich standardizaci. V případě, že se jedná o nestandardizovanou techniku, je vhodné toto viditelně uvést. Ve výše uvedeném případě je míra shody mezi proměnnou aktivní energetický výdej z jednoho přístroje a proměnnou počet kroků z druhého přístroje (resp. proměnnou doba trvání pohybové aktivity z individuálního zápisu) na střední úrovni - vyjádřená pomocí rP – Pearsonova korelačního koeficientu.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
48
5.4.3 Postup Pomocí dotazníku sportovních zájmů byly před sestavením intervenčního pohybového programu zjištěny u zúčastněných děvčat jejich oblíbené druhy PA. Z hledika podmínek v tělesné výchově na vybraných školách (velikost a vybavení tělocvičen, nekoedukovaná výuka) jsme jako nejvhodnější obsah intervenčního pohybového programu zvolili aerobik. Intervenční pohybový program byl sestaven ze dvou 45minutových extrakurikulárních vyučovacích jednotek TV týdně. Kurikulární i extrakurikulární vyučovací jednotky TV vyučovaly čtyři studentky Akademie Wychowania Fizycznego v Katowicích, držitelky cvičitelské licence aerobiku. Všechny vyučovací jednotky TV byly nekoedukované. Akcelerometr Caltrac (resp. pedometr Omron) byl podle indiviuálních hodnot (hmotnost, výška, kalendářní věk a pohlaví; resp. délka kroku a hmotnost) naprogramován pro měření aktivního energetického výdeje v kilokaloriích (resp. počtu kroků a poskoků při PA). Všechna zúčastněná děvčata byla bezprostředně před začátkem první vyučovací jednotky TV aerobiku detailně seznámena s Caltracem a Omronem a instruována jak je správně „nosit“. Elastický monitorovací pás s kapsami pro Caltrac a Omron zajišťoval jejich pevné a přesné umístění na pravém boku děvčat v průběhu intervenčního pohybového programu i celodenního monitoringu. Po skončení první vyučovací jednotky TV jsme spolu s děvčaty provedli první záznam naměřených dat z Caltracu (aktivní a celkový energetický výdej v kcal) a Omronu (počet kroků, překonanou vzdálenost v milích a aktivní energetický výdej v kcal) do jejich individuálních záznamů. Každé ráno po probuzení a večer před spaním zaznamenávala monitorovaná děvčata do svých individuálních záznamů denní čas a příslušné údaje z Caltracu a Omronu. Večer pak také typ, dobu trvání a intenzitu (střední nebo vysoká) PA prováděné v průběhu celého dne a skladbu PI. Vzhledem k možnosti určování podílu organizované PA na celodenní PA zapisovali účastníci monitoringu denní čas a data z Caltracu a Omronu také na začátku a konci školního vyučování (resp. vyučovacích jednotek TV, tréninkových a cvičebních jednotek). Poslední zápis do individuálních záznamů jsme provedli společně s účastníky za sedm dní, před začátkem vyučovací jednotky TV. Intervenční PA program byl realizován v měsících únor a březen (resp. březen a duben) roku 2003. Habituální týdenní PA byla monitorována stejným způsobem jako intervenční PA jeden měsíc po ukončení intervenčního pohybového programu. Na konci monitoringu habituální týdenní PA byly opět pomocí dotazníku sportovních zájmů zjišťovány preference v oblasti PA. Pro hodnocení efektu intervenčního programu aerobiku na habituální PA byla vybrána pouze děvčata, která absolvovala monitoring obou týdenních režimů. Každá z monitorovaných děvčat obdržela bezprostředně po vyhodnocení dat individuální grafický výstup o úrovni a skladbě realizované PA a PI s možností anonymního srovnání se spolužáky. Učitelé a ředitelé škol obdrželi průměrné, souhrnné a komparativní výsledky. Vysvětlení individuálních a skupinových výsledků žákům a učitelům TV proběhlo v každé ze zúčastněných ve speciální vyučovací jednotce TV. Vysvětlování výsledků doprovázela doporučení pro další provádění PA ve vztahu ke zdraví, k úpravě tělesné hmotnosti, k rozvoji tělesné zdatnosti apod. „Technologický“ popis postupu měření, vyšetřování, pozorování, apod. je nedílnou součástí každé práce. Lze ji uvést v několika odstavcích, lépe však v samostatné podkapitole tak, aby si čtenář vytvořil jednoznačnou představu o přípravě (organizační, technické, lidské,…) a samotné realizaci měření, zaznamenávání a následné zpracování zjištěných dat a informací. Popis tvořte tak, aby poučený čtenář moh podobné měření realizovat také.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
49
5.4.4 Softwarové a statistické zpracování dat Pro zpracování a analýzu dat z monitoringu byl použit software umožňující také zpětnovazební servis pro účastníky monitoringu a jejich rodiče, učitelé TV a ředitele škol (Chytil, 2000). Statistická analýza dat byla provedena v softwarovém prostředí STATISTICA 6. Ke statistickému srovnání proměnných aktivní energetický výdej z akcelerometru Caltrac (kcal·den-1) a denní počet kroků z pedometru Omron při intervenční a habituální PA byla použita jednorozměrná analýza variance při opakovaném měření (Friedmanův test). Pro srovnání počtu kroků v pracovních a víkendových dnech v jednotlivých režimech jsme využili jednorozměrnou analýzu variance (F–test). Procentuální podíl organizované PA v týdenní PA v intervenčním a habituálním režimu byl srovnáván Kruskal–Wallisovým testem. Vodítkem při posuzování věcné významnosti statisticky srovnávaných proměnných byly koeficienty „efekt size“ – d pro Friedmanův test a η2 pro Kruskal–Wallisův test. Velikost koeficientu d=0,2 (resp. d=0,5 a d=0,8) lze interpretovat jako malý (resp. střední a velký) efekt (McCartney & Rosenthal, 2000). Při η2=0,01 (resp. η2=0,06 a η2=0,14) shledáváme podle Morseho (1999) efekt jako malý (resp. střední a velký). Efekt intervenčního pohybového programu na habituální týdenní PA byl také posuzován pomocí rP – Pearsonova korelačního koeficientu. Běžně používané statistické ukazatele pro hodnocení velikosti efektu rP jsou následující: nízký – rP=0,10, sřední – rP=0,30 a velký, výrazný efekt – rP=0,50 (Cohen, 1988; Dishman & Buckworth, 1996). Koeficientem determinace (rP2) názorně vyjadřujeme procentuální vliv intervenční PA na habituální PA zúčastněných děvčat. V každé práci je povinností uvést software využívaný pro statistickou analýzu a způsob kvantifikace dat (pokud s takovými daty pracujeme). V našem případě je úroveň pohybové aktivity charakterizována pomocí aktivního energetického výdeje a počtu kroků. V kvalitních pracích je dbáno na rozepsání použitých statistických metod (v našem případě analýza variance a neparametrický Kruskal–Wallisův test), které je nezbytně doplněné „věcnou“, „praktickou“, „lékařskou“, „experimentální“ a jinak nazývanou (nestatistickou) významností. Když se např. zkrácení doby úplné rekonvalescence o pět dní ukáže statisticky nevýznamné, může ještě v celorepublikovém měřítku státu ušetřit značné finanční prostředky. Podobně se například každodenním cvičením, charakterizovaným např. dobou trvání, řekněme 15 minut, nedosáhne u skupiny seniorů významného (myšleno statisticky) zvýšení objemu sledovaného svalu, ale prokáže se např. významně (myšleno terapeuticky) lepší koordinace při chůzi do schodů. Tato „věcná“, „praktická“, „experimentální“ významnost je často považována za přínosnější než významnost statistická. V našem případě se opírám o „vodítka“, kterými jsou koeficienty „efekt size“ - d, η2, rP a rP2. 5.5 Výsledky V pracovních dnech nenacházíme rozdíly v denním počtu kroků mezi intervenční a habituální PA děvčat. Avšak víkendová habituální PA je i s přihlédnutím ke velikosti směrodatných odchylek věcně i statisticky významně vyšší než víkendová PA v intervenčním režimu (Tabulky 5 a 6). O víkendových dnech zjišťujeme podle rp nižší efekt intervenční PA na habituální PA než ve dnech pracovních. Avšak i tento vliv intervenční PA o víkendových dnech na habituální PA je téměř stejně výrazný jako ve dnech pracovních (Tabulky 5 a 6). Ačkoliv jsou směrodatné odchylky proměnné počet kroků při pohybové aktivitě ve víkendových dnech intervenčního i habituálního režimu vysoké (4930 a 6040) shledávám
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
50
rozdíl v průměrných hodnotách 1865 kroků za věcně významný. Tento rozdíl přibližně odpovídá průměrné vyučovací jednotce tělesné výchovy, která mi slouží jako hranice pro posuzování věcné významnosti výsledků. Tabulky je vhodné sestavovat tak, abyste čtenáře co nejméně zatěžovali „luštěním“ zkratek, popisu proměnných, „přilišností“ informací, grafickými ekvilibristikami apod. Statistickou významnost lze vyznačit pomocí symbolů uvedených jako horní index bezprostředně za číselnou hodnotou anebo tučně. Ve vysvětlivkách je pak nutné použité označení objasnit. Tabulka 5. Srovnání počtu kroků v pracovních dnech intervenčního a habituálního týdenního režimu Děvčata (n=90) Intervenční týdenní režim
Kroky při PA (počet·den-1) v pracovních dnech – pedometr Omron HJ–102 M SD F rp d 16486
4402 1,20
Habituální týdenní režim
15702
0,54**
0,00
5186
Tabulka 6. Srovnání počtu kroků ve víkendových dnech intervenčního a habituálního týdenního režimu Děvčata (n=90) Intervenční týdenní režim
Kroky při PA (počet·den-1) ve víkendových dnech – pedometr Omron HJ–102 M SD F rp d 10345
4930 5,15*
Habituální týdenní režim
12210
0,48**
0,22
6040
Vysvětlivky k tabulkám 5 a 6: PA – pohybová aktivita; M – aritmetický průměr; SD – směrodatná odchylka; F – ANOVA (Friedmanův test); *p=0,01; **p<0,000; rp – Pearsonův korelační koeficient; d – koeficient efekt size. Obdobné výsledky zjišťujeme při srovnání aktivního energetického výdeje z akcelerometru Caltrac. V pracovních dnech intervenčního (resp. habituálního) režimu děvčata vykazují 611 kcal·den-1 (resp. 608 kcal·den-1). O víkendových dnech je aktivní energetický výdej z Caltracu v habituálním režimu téměř o 100 kcal·den-1 vyšší než v intervenčním režimu (429 versus 342 kcal·den-1). V intervenčním týdenním režimu nacházíme značný rozdíl v počtu kroků mezi pracovními a víkendovými dny (F=77,69; p<0,000; rp=0,73), který se téměř dvojnásobně zmírnil v habituálním režimu (Tabulky 5 a 6).
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
51
Při vyjádření srovnávaných rozdílů v textu nepoužívejte pouze údaj testovacího kritéria (v našem případě F) samostatně, ale doplňte jej hladinou statistické významnosti (v našem případě p<0,000) a také některým z koeficientu efekt size či korelačním koeficientem (v našem případě rp=0,73). Dáváte tak čtenáři jednoznačnou informaci zda rozdíl je či není statisticky (hladina statistické významnosti) ale i „věcně“ (koeficienty efekt size, korelační koeficient) významný. Dvě kurikulární a dvě extrakurikulární vyučovací jednotky TV představují 171±45 kcal·45min-1 a spolu s další organizovanou PA zastupují v intervenčním režimu 26 % z celkového denního aktivního energetického výdeje z Caltracu (Tabulka 7). Tabulka 7. Srovnání organizované PA v intervenčním a habituálním týdenním režimu Děvčata (n=90) Intervenční týdenní režim
AEE z Caltracu (kcal·45min-1) při vyučovacích jednotkách TV M SD F rp d
Podíl (%) organizované PA v týdenní PA – podle AEE η2 M SD H rp
171
26
45 64,45*
Habituální týdenní režim
97
49
9
0,62* 1,05
23,64* 0,58* 19
0,27
9
Vysvětlivky: AEE – aktivní energetický výdej; TV – tělesná výchova; PA – pohybová aktivita; M – aritmetický průměr; SD – směrodatná odchylka; F – ANOVA (Friedmanův test); H – Kruskal-Wallisův test; *p<0,000; rp – Pearsonův korelační koeficient; d, η2 – koeficienty efekt size. Tato tabulka je na samé „hranici“ s množstvím informací. Vzhledem k limitovaným počtům stran v časopisu Česká kinantropologie jsem „šetřil“ místem kde se dalo. Vhodnější by bylo vytvořit tabulky dvě (jedna AEE z Caltracu a druhá Podíl (%) organizované PA). Organizovaná PA v tabulce 7 zahrnuje kurikulární a extrakurikulární vyučovací jednotky TV a jiné cvičební nebo tréninkové jednotky. Intervenční vyučovací jednotky TV vysvětlují ze 40 % (resp. 30 %) aktivní energetický výdej volnočasové PA v intervenčním (resp. habituálním) týdenním režimu. V habituálním režimu zjišťujeme významný pokles v zastoupení organizované PA v týdenní PA. Aktivní energetický výdej 97±49 kcal·45min-1 v habituálním režimu představuje u námi sledovaných děvčat průměr za dvě kurikulární vyučovací jednotky TV (Tabulka 7). V kurikulárních vyučovacích jednotkách TV i podílu organizované PA v habituálním režimu nacházíme podle rp výrazný efekt intervenční PA. Tento údaj: ...Intervenční vyučovací jednotky TV vysvětlují ze 40 % (resp. 30 %) aktivní energetický výdej volnočasové PA v intervenčním (resp. habituálním) týdenním režimu byl vypočten z hodnot korelačních koeficientů rp pomocí koeficientu determinace d následovně: koeficient determinace d = (rp)2 rp1 = 0,63 a rp2 = 0,54 d1 = (rp1)2 = (0,63)2 = 0,397 40 % d2 = (rp2)2 = (0,54)2 = 0,292 30 %
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
52
526
chůze
448 153
aerobik
91 135
domácí práce
92 31 16 25 42
gymnastika sportovní hry
intervenční týdenní PA habituální týdenní PA
23
jízda na kole
48 21 10 18 25
jiná PA tanec
17 23
běh + jogging 0
100
200
300
500 (min)
400
Obrázek 39. Skladba PA (min·týden-1) děvčat (n=90) v intervenčním a habituálním týdenním režimu 810 sezení ve škole 812 546
sezení nebo ležení při učení, čtení a hře
516 516
sezení nebo ležení při sledování televize
429 82
sezení u počítače 88
intervenční týdenní PA habituální týdenní PA
85
sezení v restauraci, kině, parku
67 0
100
200
300
400
500
600
700
800 (min)
Obrázek 40. Skladba PI (min·týden-1) děvčat (n=90) v intervenčním a habituálním týdenním režimu
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
53
V průběhu dvouměsíčního intervenčního PA programu byly náhodně monitorovány 4 extrakurikulární vyučovací jednotky TV pomocí snímačů srdeční frekvence S610. Zatížení děvčat (n=360) charakterizované srdeční frekvencí představovalo ve zmiňovaných vyučovacích jednotkách průměrně 151±14 (M±SD) tepů·min-1. Doba strávená v těchto vyučovacích jednotkách při PA střední a vysoké intenzity v průměru činila více než 58 % z celkové doby trvání vyučovacích jednotek TV. Vyučovací jednotky aerobiku motivovaly více než 68 % děvčat k spontánnímu opakování a osvojování nových aerobických a tanečních prvků ve volném čase. Děvčata také častěji navštěvovala diskotéky a taneční zábavy konané především o víkendových dnech. V žádné z monitorovaných tříd nebylo zaznamenáno zhoršení kázně či prospěchu v průběhu ani po skončení intervenčního pohybového programu. Při hledání vztahu mezi aktivním energetickým výdejem z akcelerometru Caltrac (resp. počtem kroků z pedometru Omron) a dobou trvání PA nacházíme nízké korelace v intervenčním (rS=0,17; p=0,11; resp. rS=0,21; p=0.04) i habituálním (rS=0,16; p=0,12; resp. rS=0,14; p=0,20) týdenním režimu. Přes tyto nízké korelační vztahy je z obrázku 39 patrné, že vyšší realizace aerobiku v intervenčním režimu byla v habituálním režimu vystřídána především zvýšenou jízdou na kole a vyšší realizací sportovních her. Tyto korelační vztahy považuji za nízké také proto, že doba trvání PA z individuálního záznamu je ve srovnání z údaji z přístrojů Caltrac a Omron nejvíce ovlivněna pečlivostí a věrohodností zapisovatele. U časových údajů z individuálního záznamu nacházíme nejvýraznější směrodatné odchylky svědčící o vysokém rozptylu daných proměnných. U vysoce přesně změřených veličin nám i nízký korelační koeficient může poukazovat na významný vztah, ale u méně přesně zachycené veličiny musíme být skeptičtější. Proto je i následující tučně vyznačený statisticky významný vztah ...(rS= -0,30; p=0,006; resp. rS= 0,21; p=0.06) zcela správně věcně interpretován výrazně opatrněji. Dominantní zastoupení chůze ve skladbě týdenní PA (intervenční i habituální) je určeno skutečností, že více než 50 % ze zúčastněných děvčat chodí do a ze školy pěšky anebo kombinují (90 % z děvčat) městskou dopravu s chůzí. Poměr chůze k ostatním PA je podle doby trvání z individuálních záznamů 1:0,80 v intervenčním a 1:0,77 v habituálním režimu. Analýza skladby PI neodhaluje zjevné rozdíly mezi intervenčním a habituálním režimem (Obrázek 40). Vzhledem k nevysokým korelacím mezi týdenní dobou PI a počtem kroků z Omronu nebo aktivním energetickým výdejem z Caltracu (rS= -0,30; p=0,006; resp. rS= -0,21; p=0.06) nemůžeme považovat mírné snížení doby sledování televize a sezení či ležení při učení, čtení nebo hře v habituálním režimu za samotný efekt intervenčního PA programu aerobiku. Denní doba sledování televize v intervenčním (resp. habituálním) režimu v průměru činí méně než 75 (resp. 62) minut. Vedle sezení ve škole je druhou nejvýraznější PI v intervenčním i habituálním režimu sezení nebo ležení při učení, čtení a hře (více než 70 minut denně – Obrázek 40). Poměr doby trvání PA včetně chůze k PI bez spánku je příznivější v intervenčním 1:2,15 než habituálním 1:2,41 týdenním režimu. I přesto však podle individuálního záznamu připadá v habituálním režimu na jednu minutu PA pouze 2,41 minuty PI. 5.6 Diskuse Při analýze 32 studií vztahujících se k monitorování počtu kroků u různých populačních skupin Tudor-Locke a Myers (2001) uvádějí, že u zdravých mladších dospělých můžeme očekávat denní počet kroků 7000–13000 (méně u žen než u mužů). Pro snížení tělesné hmotnosti je nezbytné dosáhnout nejméně 15000 kroků za den (Leermakers et al., 2000).
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
54
U námi sledovaných adolescentek nacházíme v pracovních dnech v intervenčním i habituálním týdnu dokonce vyšší denní počet kroků než 15000. Denní počet kroků z pedometru Omron HJ–102 (resp. aktivní energetický výdej z akcelerometru Caltrac) v pracovních dnech intervenčního i habituálního režimu převyšuje zdravotně doporučovaný objem PA (Corbin & Pangrazi, 1996; Leermakers et al., 2000; Pate et al., 1995; Tudor-Locke et al., 2002; Tudor-Locke & Myers, 2001). Ačkoli v této studii nesledujeme přímo zdravotní efekt PA („pouze“ přímo zjišťujeme efekt intervenční PA na habituální PA), můžeme v diskusi, na základě zjištěných dat, polemizovat i o tomto zdravotním vlivu, srovnáním s výsledky s obdobně zaměřených studií. Značný pokles denního počtu kroků ve víkendových dnech lze především v intervenčním režimu spatřovat v „kompenzaci“ nové intervenční PA dvou extrakurikulárních vyučovacích jednotek TV realizovaných v pracovních dnech. Spolu s intervenčními vyučovacími jednotkami TV se na vyšší PA v pracovních dnech výrazně podílela především chůze, kterou samostaně (resp. v kombinaci s městskou dopravou) využívalo více než 50 % (resp. 90 %) ze zúčastněných děvčat k cestě do školy. Z hlediska doby trvání PA by již každodenní chůze v intervenčním (více než 75 minut·denně) i habituálním (více než 64 minut denně) režimu splňovala zdravotně doporučovaný objem PA (Biddle et al., 1998; Corbin & Pangrazi, 1996). Chůze či případná kombinace s městskou dopravou nebo jízdou na kole je nejrozšířenějším způsobem přemisťování do a ze školy, mimoškolních zájmových aktivit, návštěv a při nakupování u námi sledovaných adolescentek. I přes zvyšující se životní úroveň doprovázenou nárůstem pohybové inaktivity a „automobilizací“ (Colditz, 1999), je nanejvýš žádoucí toto chodecké pohybové chování zachovávat a dále podporovat (Eyler et al., 2003). Právě podpora chůze a jiných druhů středně intenzivní PA může u mladých žen zmírnit pokles PA se vzrůstajícím věkem (Leslie et al., 2001). Aerobik, tanec a další PA s hudbou jsou vhodnými druhy PA pro adolecentky a ženy vedoucí ke zmírnění poklesu PA s věkem nebo k redukci tělesné hmotnosti (Andersen et al., 1999). Intervenční vyučovací jednotky aerobiku splňovaly doporučení strávit 50 % a více času z vyučovací jednotky TV při PA střední a vysoké intenzity. Navíc každá z intervenčních vyučovacích jednotek TV obsahovala více než 5 minutovou pasáž věnovanou strečinku a část zaměřenou na rozvoj svalové síly. Kondiční 20 minutové části vedoucí k rozvoji aerobní vytrvalosti byly vedle „tradičních“ krokových prvků doplněny krokovými variacemi z rock and rollu, mamby, čači a hip hopu, makareny a jiných „diskotékových“ tanců. Na atraktivním a přitažlivém obsahu a kvalitním vedení intervenčních vyučovacích jednotek aerobiku se výrazně pozitivně projevila vysoká aprobovanost, zkušenost a entuziasmus studentek Akademie Wychowania Fizycznego. Aerobik a tanec mohou vedle pozitivních psychických pocitů - sociální sounáležitosti, zvýšení významu tělesného dojmu a vzhledu, motiv účasti (Daley & Buchanan, 1999) navíc silně rozvíjet estetické a rytmické vnímání účastnic a kreativitu. Tyto PA s hudbou realizované v nesoutěživém a nekonkurenčním prostředí vyzvihují „ženskost“ a směřují proti nežádoucímu smazávání rozdílů mezi „typicky“ mužskou a „typicky“ ženskou PA. K monitoringu PA se častěji používají přesnější akcelerometry než Caltrac (např. třídimenzionální Tritrac-R3D nebo jednodimenzionální Actigraph). Tyto však, na rozdíl od akcelerometru Caltrac a pedometru Omron HJ–102 nemají zabudovaný displej, který umožňuje okamžitě po skončení vyučovací jednotky TV nebo celého dne vizualizovat množství spálených kalorií nebo vykonaných kroků při PA. Tato zpětná vazba je zvláště u dětí silným motivačním faktorem k další realizaci PA. Na základě nutričních hodnot z konzumované potravy a bezprostředních hodnot o PA z akcelerometru Caltrac nebo
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
55
pedometru Omron lze určit denní energetickou bilanci. Efektivitu intervenčního PA programu pak lze samotným účastníkem pomocí Caltracu a Omronu jednoduše kontrolovat. Vzhledem k nízké ceně a jednoduché obsluze doporučují Beighle, Pangrazi a Vincent (2001) širší zavedení pedometrů do školního prostředí. Učitel má možnost kvantifikovat PA ve vztahu ke zdravotním doporučením a pomocí pedometrů motivovat žáky k vyšší PA ve vyučovacích jednotkách TV. Při hledání závislostí mezi denním počtem kroků z Omronu a denní dobou trvání PA a PI z individuálního záznamu nacházíme překvapivě vyšší korelace mezi počtem kroků a dobou trvání PI než dobou trvání PA. Ke stejným výsledkům docházíme při hledání závislostí mezi aktivním energetickým výdejem z Caltracu a dobou trvání PA a PI. Příčinou může být večerní sumace celodenní skladby realizované PA a PI, která se zdá být jednodušší u PI ve srovnání s PA. PI představuje pouze sezení (popř. ležení) při několika málo možnostech (ve škole, u televize, počítače, v restauraci, kině, parku). Kdežto skladba PA je několikanásobně pestřejší než PI. Na základě srovnání „číselných“ zjištění (korelačních závislostí) lze usuzovat na např. složitost použité metodiky, kriticky hodnotit její přesnost apod. 5.7 Limity a doporučení práce Limitem studie je sledovaní efektu intervenčního pohybového programu pouze jedenkrát, a to po čtyřech týdnech po jeho skončení. Následující pohybově intervenční projekty zaměřit také na analyzování trvání vlivu intervence v čase po jejím ukončení. Vliv intervenčního pohybového programu aerobiku na habituální týdenní PA byl potvrzen u adolescentek, které mají pozitivní vztah k PA a které se projektu účastnily dobrovolně. Celosvětově řešenou otázkou zůstává jak motivovat k vyšší PA adolecentky, které neinklinují k PA. Sezonní vliv – intervenční pohybový program začal v únoru a březnu, v měsících se sníženou PA a zvýšenou pohybovou inaktivitou (Pivarnik et al., 2003) a končil v dubnu a květnu, v období s vhodnějšími klimatickými podmínkami pro venkovní PA. Zařazení intervenčního pohybového programu do měsíců s celosvětově nižší PA z hlediska celoročního režimu bylo záměrné, avšak v následujících projektech doporučujeme sledovat také faktor počasí a ročního období. 5.8 Závěry Intervenční pohybový program aerobiku nezanedbatelně spolupůsobil na žádoucím zvýšení pohybové aktivity ve víkendových dnech a současně na snížení rozdílu mezi pohybovou aktivitou realizovanou ve víkendových a pracovních dnech. Dvě extrakurikulární vyučovací jednotky tělesné výchovy s přitažlivým obsahem mohou zvýšit týdenní habituální pohybovou aktivitu na zdravotně doporučovanou úroveň. Intervenční pohybový program aerobiku nesnížil školní ani mimoškolní pohybovou inaktivitu v habitualním režimu. Z hlediska celoroční pohybové aktivity je pro školní mládež žádoucí zařazovat extrakurikulární vyučovací jednotky tělesné výchovy do období listopadu až března, t.j.v měsících se zhoršenými podmínkami pro každodenní venkovní PA. Metodika terénního monitoringu pohybové aktivity založená na triangulačním přístupu jejího hodnocení (aktivní energetický výdej – akcelerometr Caltrac, kroky – pedometr Omron a doba trvání, typ a frekvence pohybové aktivity a inaktivity – individuální záznam) je vyhovující pro posuzování efektivity intervenčních pohybových programů. 6.9 Referenční seznam
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
56
Andersenen, R. E., Wadden, T. A., Bartlett, S. J., Zemel, B., Verde, T. J., & Franckowiak, S. C. (1999). Effects of lifestyle activity vs structured aerobic exercise in obese women. Journal of the American Medical Association, 281(4), 335-340. Ball, G. D. C., & McCargar, L .J. (2003). Childhood obesity in Canada: A review of prevalence estimates and risk factors for cardiovascular diseases and type 2 diabetes. Canadian Journal of Applied Physiology, 28(1), 117-140. Beighle, A., Pangrazi, R. P., & Vincent, S. D. (2001). Pedometers, physical activity, and accountability. Journal of Physical Education, Recreation, and Dance, 72(9), 16-19. Biddle, S., Sallis, J. F., & Cavill, N. A. (Eds.). (1998). Young and active? Young people and health enhancing physical activity: Evidence and implications. London: Health Education Authority. Cohen, J. (1988). Statistical power analysis for the behavioral sciences. (4th ed.). New York: Academic Press. Colditz, G. A. (1999). Economic costs of obesity and inactivity. Medicine and Science in Sports and Exercise, 31(11 suppl.), 663-667. Corbin, C. B., & Pangrazi, R. P. (1996). How much physical activity is enough? Journal of Physical Education, Recreation, and Dance, 67(4), 33-37. Crespo, C. J., Smit, E. & Troiano, R. P., Bartlett, S. J., Macera, C. A., & Andersen, R. E. (2001). Television watching, energy intake and obesity in US children: Results from the third National Health and Nutrition Examination Survey, 1988-1994. Arch. Pediatr. Adolesc. Med., 155(3), 360-365. Daley, A. J., & Buchanan, J. (1999). Aerobic dance and physical self-perceptions in female adolescents: some implications for physical education. Research Quarterly for Exercise and Sport, 70(2), 196-200. Dishman, R. K., & Buckworth, J. (1996) Increasing physical activity: A quantitative synthesis. Medicine and Science in Sports and Exercise, 28(6), 706-719. Eyler, A. A., Brownson, R. C., Bacak, S. J., & Housemann, R. A. (2003). The epidemiology of walking for physical activity in the United States. Medicine and Science in Sports and Exercise, 35(9), 1529-1536. Fox, K. R. (2004). Tackling obesity in children through physical activity: A perspective from the United Kingdom. Quest, 56(1), 28-40. Frömel, K., Formánková, S., & Sallis, J. F. (2002). Physical activity and sport preferences of 10 to 14-year-old children: A 5-year prospective study. Acta Universitatis Palackianae Olomucensis Gymnica, 32(1), 11-16. Frömel, K., Novosad, J., & Svozil, Z. (1999). Pohybová aktivita a sportovní zájmy mládeže. Olomouc: Univerzita Palackého. Gavarry, O., Giacomoni, M., Bernard, T., Seymat, M., & Falgairette, G. (2003). Habitual physical activity in children and adolescents during school and free days. Medicine and Science in Sports and Exercise, 35(3), 525-531. Goran, M. I., Reynolds, K. D., & Lindquist, C. (1999). Role of physical activity in the prevention of obesity. International Journal of Obesity, 23(3 suppl.), 18-33. Hastie, P. A., & Trost, S. G. (2002). Student physical activity levels during a season of sport education. Pediatric Exercise Science, 14(1), 64-74. Hovell, M. F., Sallis, J. F., Kolody, B., & McKenzie, T. L. (1999). Children’s physical activity choices: A developmental analysis of gender, intensity levels, and time. Pediatric Exercise Science, 11(2), 158-168. Chytil, J. (2000). Program PaTj2000 - program pro sledování, záznam a hodnocení pohybové aktivity, vyučovacích, cvičebních a tréninkových jednotek v týdenním režimu [Computer software]. Olomouc: SoftWareCentrum.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
57
Katzmarzyk, P. T., & Malina, R.M. (1998). Contribution of organized sports participation to estimated daily energy expenditure in youth. Pediatric Exercise Science, 10(3), 378-386. Leermakers, E. A., Dunn, A. L., & Blair, S. N. (2000). Exercise management of obesity. Medical Clinics of North America, 84(2), 419-440. Leslie, E., Fotheringham, M. J., Owen, N., & Bauman, A. (2001). Age-related differences in physical activity levels of young adults. Medicine and Science in Sports and Exercise, 33(2), 255-258. McCartney, K., & Rosenthal, R. (2000). Effect size, practical importance, and social policy for children. Child Development, 71(1), 173-180. McKenzie, T. L., Marshall, S. J., Sallis, J. F., & Conway, T. L. (2000). Student activity levels, lesson context, and teacher behavior during middle school physical education. Research Quarterly for Exercise and Sport, 71(3), 249-259. McKenzie, T. L., Nader, P. R., Strikmiller, P. K., Yang, M., Stone, E. J., Perry, C. L., Taylor, W. C., Epping, J. N., Feldman, H. A., Leupker, R. V., & Kelder, S. H. (1996). School physical education: Effect of the child and adolescent trial for cardiovascular health. Preventive Medicine, 25, 423-431. Montoye, H. J., Kemper H. C. G., Saris, W. H. M., & Washburn, R. A. (1996). Measuring physical activity and energy expenditure. Champaign, IL: Human Kinetics. Morgan, C. F. Jr., Pangrazi, R. P., & Beighle, A. (2003). Using pedometers to promote physical activity in physical education. Journal of Physical Education, Recreation and Dance, 74(7), 33-38. Morse, D.T. (1999). Minisize2: A computer program for determining effect size and minimum sample for statistical significance for univariate, multivariate, and nonparametric tests. Educational and Psychological Measurement, 59(3), 518-531. Novosad, J., Frömel, K., Hřebíček, J., Válková, H., & Sallis, J. F. (1995/96). Determinanty pohybové aktivity u vybraných souborů českých adolescentů. Tělesná kultura, 26(1), 118140. Pate, R. R., Pratt, M., Blair, S. N., Haskell, W. L., Macera, C. A., Bouchard, C., Buchner, D., Ettinger, W., Heath, G. W., King, A. C., Kriska, A., Leon, A. S., Marcus, B. H., Morris, J., Paffenbarger, R. S., Patrick, K., Pollock, M. L., Rippe, J. M., Sallis, J. F., & Wilmore, J. H. (1995). Physical activity and public health: A recommendation from the Centers for Disease Control and Prevention and the American College of Sports Medicine. Journal of the American Medical Association, 273, 402-407. Pate, R. R., Trost, S. G., Mullis, R., Sallis, J. F., Wechsler, H. & Brown, D. R. (2000). Community interventions to promote proper nutrition and physical activity among youth. Preventive Medicine, 31(suppl.), 138-149. Pivarnik, J. M., Reeves, M. J., & Rafferty, A. P. (2003). Seasonal variation in adult leisuretime physical activity. Medicine and Science in Sports and Exercise, 35(6), 1004-1008. Powers, H. S., Conway, T. L., McKenzie, T. L., Sallis, J. F., & Marshall, J. (2002). Participation in extracurricular physical activity programs at middle schools. Research Quarterly for Exercise and Sport, 73(2), 187-192. Sahota, P., Rudolf, M. C. J., Dixey, R., Hill, A. J., Barth, J. H., & Cade, J. (2001). Evaluation of implementation and effect of primary school based intervention to reduce risk factors for obesity. BMJ, 323(3), 1027-1029. Sallis, J. F. (1994). Effects of a two-year health - related physical education program on physical activity and fitness in elementary school students [Project SPARK]. San Diego: San Diego State University. Sallis, J. F., McKenzie, T. L., Conway, T. L., Elder, J. P., Prochaska, J. J., Brown, M., Zive, M. M., Marshall, S. J., & Alcaraz, J. E. (2003). Environmental interventions for eating and
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ZÁKLADY STATISTIKY
58
physical activity. A randomized controlled trial in middle schools. American Journal of Preventive Medicine, 24(3), 209-217. Sallis, J. F., Simons-Morton, B. G., Stone, E. J., Corbin, C. B., Epstein, L. H., Faucette, N., Iannotti, R. J., Killen, J. D., Klesges, R. C., Petray, C. K., Rowland, T. W., & Taylor, W. C. (1992). Determinants of physical activity and interventions in youth. Medicine and Science in Sports and Exercise, 24(6 suppl.), 248-257. Sigmund, E. (2000). Pohybová aktivita v životním způsobu dětí ve věku 11-12 let. Disertační práce, Univerzita Palackého, Fakulta tělesné kultury, Olomouc. Sigmund, E., Frömel, K., Neuls, F., Skalik, K., & Groffik, D. (2002). Inactivity in life style of adolescent girls classified according to the level of their body weight. Acta Universitatis Palackianae Olomucensis Gymnica, 32(1), 17-25. Sigmund, E., Frömel, K., Sigmundová, D., & Sallis, J. F. (2003). Role školní tělesné výchovy a organizované pohybové aktivity v týdenní pohybové aktivitě adolescentů. Telesná Výchova a Šport, 13(4), 6-9. Sirard, J., & Pate, R. R. (2001). Physical activity assessment in children and adolescents. Sports Medicine, 31(6), 439-454. Stone, E. J., McKenzie, T. L., Welk, G. J., & Booth, M. L. (1998). Effects of physical activity interventions in youth review and synthesis. American Journal of Preventive Medicine, 15(4), 298-315. Stone, E. J., Osganian, S. K., McKinlay, S. M., Wu, M., Webber, L. S., Leupker, R. V., Perry, C. L., Parcel G. S., & Elder, J. P. (1996). Operational design and quality control in the CATCH multicenter trial. Preventive Medicine, 25, 384-399. Tudor-Locke, C., Ainsworth, B. E., Thompson, R. W., & Matthews, C. E. (2002). Comparison of pedometer and accelerometer measures of free-living physical activity. Medicine and Science in Sports and Exercise, 34(12), 2045-2051. Tudor-Locke, C., & Myers, A. M. (2001). Methodological considerations for researchers and practicioners using pedometers to measure physical (ambulatory) activity. Research Quarterly for Exercise and Sport, 72(1), 1-12.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)