ˇ ESˇENI´ PRAKTICKY ´ LOH UZˇITI´M ´ CH U R SOFTWARE STAT1 A R
Obsah 1
Uzˇitı´ software STAT1
1
2
Uzˇitı´ software R
3
Literatura
4
Prˇ´ıklady k procvicˇenı´
6
1
Uzˇitı´ software STAT1
Prakticke´ uzˇitı´ aplikace STAT1 si ukazˇme na dvou konkre´tnı´ch prˇ´ıkladech. Prˇ´ıklad 1.1 V ra´mci teˇlesne´ prˇ´ıpravy byla u jedne´ skupiny voja´ku˚ (experimenta´lnı´ skupina) zavedena inovovana´ alternativnı´ forma teˇlesne´ prˇ´ıpravy. Cı´lem bude zodpoveˇdeˇt ota´zku, zda tento novy´ prˇ´ıstup vede ke zlepsˇenı´ fyzicke´ vy´konnosti voja´ka, konkre´tneˇ se zameˇrˇ´ıme na pocˇet sedu˚-lehu˚ za minutu. Ma´me k dispozici 2 datove´ soubory obsahujı´cı´ vy´kony v dane´ disciplı´neˇ pro sledovanou experimenta´lnı´ skupinu (46 voja´ku˚), u nı´zˇ byla teˇlesna´ prˇ´ıprava prova´deˇna novy´mi alternativnı´mi postupy, a pro kontrolnı´ skupinu (57 voja´ku˚), kde probı´hala teˇlesna´ prˇ´ıprava obvykly´m zpu˚sobem. Vstupnı´ vy´konnostnı´ u´rovenˇ obou skupin v uvedene´ disciplı´neˇ byla shodna´. Rˇesˇenı´: Ke statisticke´mu rˇesˇenı´ dane´ho proble´mu uzˇijeme aplikaci STAT1. Oba datove´ soubory vlozˇ´ıme do datove´ho listu pod na´zvy sed/leh – experimenta´lnı´ skupina a sed/leh – kontrolnı´ skupina, viz obr. 1. Vy´chodiskem pro rˇesˇenı´ u´lohy bude exploratornı´ analy´za dat, kterou provedeme na obou souborech. Vzhledem k povaze dat provedeme intervalove´ rozdeˇlenı´ cˇetnostı´ (list intervalove´ rozdeˇlenı´), ze ktere´ho je patrne´ (viz obr. 2), zˇe data jsou homogennı´, rozdeˇlenı´ te´meˇrˇ symetricke´ a bez odlehly´ch hodnot, soucˇa´stı´ jsou i vy´beˇrove´ charakteristiky (na obr. 2 je uvedeno intervalove´ rozdeˇlenı´ cˇetnostı´ pro data kontrolnı´ skupiny, pro intervalove´ rozdeˇlenı´ cˇetnostı´ dat sed/leh – experimenta´lnı´ skupina platı´ tote´zˇ). Da´le lze pro oba vy´beˇry oveˇrˇit, zˇe pocha´zı´ z norma´lnı´ho rozdeˇlenı´ (pro data sed/leh – experimenta´lnı´ skupina viz obr. 3). ˇ esˇenı´ dane´ u´lohy ma´ charakter dvouvy´beˇrove´ho proble´mu, v ra´mci ktere´ho je nutne´ porovnat R strˇednı´ hodnoty vy´konu˚ u experimenta´lnı´ a kontrolnı´ skupiny. Zavedenı´ inovovane´ teˇlesne´ prˇ´ıpravy se rea´lneˇ projevilo tak, zˇe se zvy´sˇila hodnota vy´beˇrove´ho pru˚meˇru u experimenta´lnı´ skupiny vzhledem ke kontrolnı´ skupineˇ (viz obr. 4). Proto budeme testovat shodu strˇednı´ch hodnot µ1 = µ2 proti alternativnı´ Operacˇnı´ program Vzdeˇla´va´nı´ pro konkurenceschopnost Na´zev projektu: Inovace magisterske´ho studijnı´ho programu Fakulty ekonomiky a managementu Registracˇnı´ cˇı´slo projektu: CZ.1.07/2.2.00/28.0326 ˇ TEM C ˇ ESKE´ REPUBLIKY. ´ LNI´M FONDEM A STA´TNI´M ROZPOC PROJEKT JE SPOLUFINANCOVA´N EVROPSKY´M SOCIA
Rˇesˇenı´ prakticky´ch u´loh uzˇitı´m software STAT1 a R
Obra´zek 1: Datove´ soubory hypote´ze µ1 < µ2 . Obeˇ promeˇnne´ majı´ norma´lnı´ rozdeˇlenı´, pouzˇijeme tedy list 2V-norma´lnı´, v jehozˇ hornı´ cˇa´sti provedeme vy´beˇr obou promeˇnny´ch a zvolı´me rovneˇzˇ hladinu vy´znamnosti testu α = 0, 05. Nejprve je nutne´ prove´st test na shodu rozptylu˚ (naprˇ. v [5]) a v za´vislosti na jeho vy´sledku pokracˇujeme testem o shodeˇ strˇednı´ch hodnot (prˇedpokla´da´me homoskedasticitu, tedy stejne´ rozptyly, nebot’ test tuto shodu nezamı´tl). Vy´sledkem je konstatova´nı´, zˇe na hladineˇ vy´znamnosti 5 % se hypote´za o shodeˇ obou strˇednı´ch hodnot zamı´ta´, viz obr. 4. Prakticky to tedy znamena´, zˇe s 95% spolehlivostı´ mu˚zˇeme tvrdit, zˇe inovovana´ forma teˇlesne´ prˇ´ıpravy vede k lepsˇ´ım vy´konu˚m v disciplı´neˇ sed-leh. Otevı´ra´ se samozrˇejmeˇ prostor pro formulace dalsˇ´ıch prakticky´ch proble´mu˚, ktere´ lze na za´kladeˇ nasˇich obou meˇrˇenı´ rˇesˇit. Naprˇ´ıklad je mozˇne´ vyuzˇ´ıt list 2V-pa´rovy´ test pro posouzenı´ progrese ve vy´konnosti vybrane´ skupiny za dane´ obdobı´ apod. Prˇi rˇesˇenı´ na´sledujı´cı´ u´lohy pouzˇijeme chı´-kvadra´t test neza´vislosti v kontingencˇnı´ tabulce, ktery´ lze v praxi vyuzˇ´ıt naprˇ. prˇi zpracova´nı´ nejru˚zneˇjsˇ´ıch typu˚ dotaznı´kovy´ch sˇetrˇenı´. Jedna´ se o vyhodnocenı´ odpoveˇdı´ na jednu konkre´tnı´ ota´zku z dotaznı´ku urcˇene´ho pro sbeˇr empiricky´ch dat, ktere´ budou podkladem pro vyhodnocenı´ stavu dalsˇ´ıho profesnı´ho vzdeˇla´va´nı´ skupiny personalistu˚ Spolecˇny´ch sil ACˇR. Prˇ´ıklad 1.2 V na´sledujı´cı´ tabulce 1 jsou shrnuty odpoveˇdi 112 na´hodneˇ vybrany´ch respondentu˚ na ota´zku „Je soucˇa´stı´ pla´nova´nı´ Vasˇeho karie´rnı´ho rozvoje pla´n dalsˇ´ıho profesnı´ho vzdeˇla´va´nı´?“. ´ kolem bude na hladineˇ vy´znamnosti 5 % proka´zat za´vislost mezi popsany´m zpu˚sobem pla´nova´nı´ U karie´rnı´ho rozvoje (respondenti vybrali jednu nabı´dnutou odpoveˇd’ na sˇka´le urcˇiteˇ ano – spı´sˇe ano – spı´sˇe ne – urcˇiteˇ ne) a dosazˇeny´m stupneˇm vzdeˇla´nı´ respondentu˚. Rˇesˇenı´: Nejprve je zapotrˇebı´ sloucˇit vhodne´ kategorie sledovane´ velicˇiny tak, abychom dosa´hli dostatecˇne´ho pocˇtu odpoveˇdı´ ve vsˇech bunˇka´ch kontingencˇnı´ tabulky a splnili tak nutnou podmı´nku pro provedenı´ chı´-kvadra´t testu v kontingencˇnı´ tabulce. V nasˇem prˇ´ıpadeˇ je tato podmı´nka splneˇna. 2
Rˇesˇenı´ prakticky´ch u´loh uzˇitı´m software STAT1 a R
Obra´zek 2: Intervalove´ rozdeˇlenı´ cˇetnostı´ a vy´beˇrove´ charakteristiky Hodnoty zapı´sˇeme do listu Kontingencˇnı´ tabulka – cˇa´st Empiricke´ cˇetnosti (viz obr. 5). Za´veˇrem je konstatova´nı´, zˇe na zvolene´ hladineˇ vy´znamnosti 5 % je za´vislost v kontingencˇnı´ tabulce statisticky vy´znamna´, neboli s 95% spolehlivostı´ mu˚zˇeme tvrdit, zˇe nejvysˇsˇ´ı dosazˇene´ vzdeˇla´nı´ personalistu˚ ACˇR ma´ vliv na zpu˚sob pla´nova´nı´ karie´rnı´ho rozvoje.
2
Uzˇitı´ software R
3
Rˇesˇenı´ prakticky´ch u´loh uzˇitı´m software STAT1 a R
Obra´zek 3: Oveˇrˇenı´ normality
Literatura Za´kladnı´ MANN, P.S. Introductory Statistics. 6th edition. Hoboken: Wiley, 2007. ISBN 978-0-471-75530-2. ´ DL, P. Matematika pro studenty ekonomie. 1. vyd. Grada 2010. ISBN 978-80MOUCˇKA, J., RA 247-3260-2. NEUBAUER, J., SEDLACˇ´IK, M., KRˇ´IZˇ, O. Za´klady statistiky – Aplikace v technicky´ch a ekonomicky´ch oborech. Grada 2012.ISBN: 978-80-247-4273-1. vzdeˇla´nı´ urcˇiteˇ ano spı´sˇe ano spı´sˇ ne urcˇiteˇ ne Celkem SSˇ VSˇ
13
17
10
11
51
36
14
9
2
61
Celkem
49
31
19
13
112
Tabulka 1: Kontingencˇnı´ tabulka 4
Rˇesˇenı´ prakticky´ch u´loh uzˇitı´m software STAT1 a R
Obra´zek 4: Dvouvy´beˇrovy´ test o shodeˇ strˇednı´ch hodnot ˇ EZANKOVA ´ , H. Analy´za dat z dotaznı´kovy´ch sˇetrˇenı´. 2. vyda´nı´, Professional Publishing, 2010. R ISBN: 9788074310195.
Doporucˇena´ AGRESTI, A. Categorical Data Analysis. Second Edition. Wiley 2002. ISBN: 0-471-36093-7. ANDEˇL, J. Statisticke metody. 3. vyda´nı´. Praha: Matfyzpress, 2003. ISBN 80-86732-08-8. ANDEˇL, J. Za´klady matematicke´ statistiky. 2. vyd. Praha: Matfyzpress, 2007, 358 s. ISBN 97880-7378-001-2. ´ GNER, M. Integra´lnı´ pocˇet funkcı´ jedne´ promeˇnne´. 1. vyda´nı´. Brno: UO, 2005,126 s. ISBN VA 80-7231-025-9. ´ GNER, M., KASˇTA ´ NKOVA ´ , V. Posloupnosti a rˇady. 1. vyda´nı´. Brno: UO, 2006. ISBN 80VA 7231-131-X.
5
Rˇesˇenı´ prakticky´ch u´loh uzˇitı´m software STAT1 a R
Obra´zek 5: Test neza´vislosti v kontingencˇnı´ tabulce
Samostatna´ pra´ce Zpracova´nı´ semestra´lnı´ pra´ce na zadane´ te´ma (formulace proble´mu, sbeˇr dat, statisticke´ vyhodnocenı´ uzˇitı´m zvolene´ho software, interpretace), struktura a obsah pra´ce v pozˇadovane´m forma´tu. Pra´ce zahrnuje eplorativnı´ analy´zu dat, induktivnı´ statistiku a za´kladnı´ analy´zu za´vislostı´.
6