Masarykova univerzita v Brnˇe Pˇr´ırodovˇedeck´a fakulta
ˇ ´IKLADU ˚ K PREDM ˇ ˇ SB´IRKA PR ETU ´ STATISTIKA I APLIKOVANA
Brno, 2015
1 - Z´ akladn´ı pr´ ace se softwarem R - Pˇ r´ıkazy V u ´vodn´ı hodinˇe se sezn´am´ıme se statistick´ ym softwarem R a nauˇc´ıme se pouˇz´ıvat z´akladn´ı pˇr´ıkazy, naˇc´ıtat datov´e soubory, kreslit grafy a exportovat je do pdf soubor˚ u. Pˇ r´ıklad ˇ c.1: Vyzkouˇsejte si n´asleduj´ıc´ı pˇr´ıkazy a do n´asleduj´ıc´ı hodiny si zautomatizujte pouˇz´ıvanou syntaxi. # promenna , vektor , matice a <-3 a <-c (1 ,2 ,3) vec <-c (1.1 ,5.3 ,6.4) ( A <- matrix ( c (1 ,2 ,3 ,4 ,5 ,6) ,2 ,3 , byrow = T ) ) ( B <- matrix ( c (1 ,2 ,3 ,4 ,5 ,6) , ncol =3 , nrow =2 , byrow = T ) ) # zakladni operace 3+2 -6 * 9 / (8+9 -5) a <- 15 b <-5 (a+b)/b # scitani vektoru a matic x <-c (1 ,2 ,3) y <-c (3 ,2 ,1) x+y z <-c (0 ,1 ,2 ,3) x+y+z B <- matrix ( c (1 ,1 ,1 ,1 ,1 ,1) ,2 ,3) A-B # dimenze vektoru a matice length ( a ) dim ( A ) # Operace s promennymi # mocnina 3^2 a <-4 ( a2 <-a ^2) ( x2 <-x ^2) ( A2 <-A ^2) # odmocnina sqrt (9) sqrt ( a2 ) sqrt ( x2 ) sqrt ( A2 ) # min a max min ( a ) max ( a ) min ( x ) max ( x ) min ( A ) max ( A )
1
# absolutni hodnota ( C <- ( -1) * A ) abs ( C ) ( y <-c ( -1 ,0 ,2 , -5) ) abs ( y ) # log / exp log (3) # ln () log (3 ,10) log (9 ,3) exp (3) exp ( log (3) ) # sum sum ( x ) sum ( A ) # zaokrouhlovani ( odmocnina <- sqrt (2) ) round ( odmocnina , digits =3) round ( odmocnina , digits =2) ceiling ( odmocnina ) floor ( odmocnina ) signif ( odmocnina , digits =6) signif ( odmocnina , digits =3) # vytvareni posloupnosti # CTRL + L # Clear workspace ( x <- 1:10) ( y <- 50:55) ( pst1 <- seq ( from =0 , to =1 , length =1000) ) ( pst2 <- seq ( from =0 , to =1 , by =0.1) ) vaha <-c (58.7 , 61.6 , 57.8 , 59.5 , 59.9 , 53.9 ,63.6 , 71.0 , 66.1 , 69.8) ( divky <- rep (1 ,6) ) ( chlapci <- rep (2 ,4) ) ( pohlavi <-c ( divky , chlapci ) ) # rbind / cbind vaha pohlavi ( hmotnost <- matrix ( c ( vaha , pohlavi ) , nrow =10) ) ( hmotnost . c <- cbind ( vaha , pohlavi ) ) ( hmotnost . r <- rbind ( vaha , pohlavi ) ) # podmnoziny hmotnost hmotnost [ ,1] hmotnost [ ,2] hmotnost [6 , ] hmotnost [1 , ] hmotnost [8 ,1] vyska <-c (133 ,132 ,145 ,129)
2
vyska [4] apply ( hmotnost ,1 , sum ) apply ( hmotnost ,2 , sum ) # porovnavani < > == <= >= teploty <-c (10 ,9 ,9 ,8 ,8 ,9 ,11 ,12 ,13 ,14 ,16 ,18 ,18 ,19 ,18 ,16 ,15 ,14 ,14 ,13 ,13 ,14 ,14 ,14) hodiny <- 1:24 mean ( teploty ) teploty ==13.0 (1 * ( teploty ==13) ) 1 * ( teploty <13) 1 * ( teploty <=13) 1 * ( teploty >13) sum (1 * ( teploty ==13) ) sum (1 * ( teploty >13) ) sum (1 * ( teploty <13) ) # grafy plot ( hodiny , teploty , main = ’ Teplota 12.9.14 ’ , xlab = ’ hodina ’ , ylab = ’ teplota ’ , cex =1.2 , pch =19 , col = ’ orchid4 ’ , lwd =2 , bg = ’ orchid4 ’ , type = ’l ’ , xlim = c (0 ,25) , ylim <-c (7 ,20) ) legend (18 ,10 , legend = ’ teplota - 12.9 ’ , fil = ’ orchid4 ’) plot ( hodiny , teploty , main = ’ Teplota 12.9.14 ’ , xlab = ’ hodina ’ , ylab = ’ teplota ’ , cex =1.2 , pch =19 , col = ’ orchid1 ’ , lwd =2 , type = ’l ’ , xlim = c (0 ,25) , ylim <-c (7 ,20) ) points ( hodiny , teploty , cex =1.2 , pch =19 , col = ’ orchid4 ’) legend (18 ,10 , legend = ’ teplota - 12.9 ’ , fil = ’ orchid4 ’) # export grafu do pdf souboru pdf ( ’ pocasi . pdf ’) plot ( hodiny , teploty , main = ’ Teplota 12.9.14 ’ , xlab = ’ hodina ’ , ylab = ’ teplota ’ , cex =1.2 , pch =19 , col = ’ dodgerblue ’ , lwd =2 , bg = ’ red ’ , type = ’n ’ , xlim = c (0 ,25) , ylim <-c (7 ,20) ) lines ( hodiny , teploty , lwd =2 , col = ’ orchid1 ’) points ( hodiny , teploty , cex =1.2 , pch =19 , col = ’ orchid4 ’) legend (18 ,10 , legend = ’ teplota - 12.9 ’ , fil = ’ orchid4 ’) dev . off () # prace s datovym souborem getwd () setwd ( ’C : / Users / Veronika / Documents ’) dir () setwd ( ’C : / Users / Veronika / Documents / Data _ cviceni _ txt ’) getwd () dir () data <- read . delim ( ’ znamky . txt ’ , sep = ’ ’ , dec = ’. ’) data head ( data ) dim ( data ) ( matematika <- data $ math ) ( english <- data $ english ) ( pohlavi <- data $ sex ) data [ data $ sex ==0 ,]
3
2 - Bodov´ e a intervalov´ e rozloˇ zen´ı ˇ cetnost´ı Pˇ r´ıklad ˇ c.1: Naˇctˇete datov´ y soubor znamky.txt. 1. Vytvoˇrte variaˇcn´ı ˇradu (tabulku rozloˇzen´ı ˇcetnost´ı) (a) zn´amek z matematiky (znak X); (b) zn´amek z angliˇctiny (znak Y). 2. Vytvoˇrte sloupkov´ y diagram absolutn´ıch ˇcetnost´ı znak˚ u X a Y. 3. Vytvoˇrte polygon absolutn´ıch ˇcetnost´ı znak˚ u X a Y. 4. Vytvoˇrte variaˇcn´ı ˇrady (tabulky rozloˇzen´ı ˇcetnost´ı) zn´amek z matematiky a angliˇctiny (a) pouze pro ˇzeny; (b) pouze pro muˇze. 5. Vytvoˇrte kontingenˇcn´ı tabulku simult´ann´ıch absolutn´ıch ˇcetnost´ı znak˚ u X a Y. 6. Vytvoˇrte kontingenˇcn´ı tabulku sloupcovˇe a ˇr´adkovˇe podm´ınˇen´ ych relativn´ıch ˇcetnost´ı znak˚ u X a Y. Zamyslete se nad odpovˇed’mi na n´asleduj´ıc´ı ot´azky: • Kolik procent student˚ u, kteˇr´ı prospˇeli z angliˇctiny, neudˇelalo zkouˇsku z matematiky? • Jak´ y je pod´ıl student˚ u, kteˇr´ı neudˇelali zkouˇsku z angliˇctiny a neprospˇeli ani z matematiky? Kolik je to student˚ u? • Kolik procent student˚ u, kteˇr´ı prospˇeli z matematiky, neudˇelalo zkouˇsku z angliˇctiny? • Jak´ y je pod´ıl student˚ u, kteˇr´ı neudˇelali zkouˇsku z matematiky a neprospˇeli ani z angliˇctiny? Kolik je to student˚ u? Pˇ r´ıklad ˇ c.2: Naˇctˇete soubor ocel.txt. 1. Podle Sturgersova pravidla najdˇete optim´aln´ı poˇcet tˇr´ıdic´ıch interval˚ u pro znaky plasticita a pevnost a vhodnˇe stanovte meze tˇr´ıdic´ıch interval˚ u pro kaˇzd´ y znak. D´ale urˇcete stˇredy tˇechto interval˚ u a pˇr´ısluˇsn´e variaˇcn´ı ˇrady. 2. Vytvoˇrte histogram pro plasticitu a pro pevnost. 3. Sestavte kontingenˇcn´ı tabulky absolutn´ıch ˇcetnost´ı a relativn´ıch ˇcetnost´ı dvourozmˇern´ ych tˇr´ıdic´ıch interval˚ u pro dvojici znak˚ u (plasticita, pevnost). 4. Nakreslete dvourozmˇern´ y teˇckov´ y diagram pro (plasticita, pevnost). 5. Dobrovoln´ yu ´kol: Vytvoˇrte stereogram pro (plasticita, pevnost).
4
3 - V´ ypoˇ cet ˇ c´ıseln´ ych charakteristik jednorozmˇ ern´ eho a dvourozmˇ ern´ eho datov´ eho souboru Pˇ r´ıklad ˇ c.1 U 100 n´ahodnˇe vybran´ ych osob jsme zjiˇst’ovali barvu jejich vlas˚ u (znak X, varianty 1=blond, 2=ˇcern´e, 3=hnˇed´a) a barvu jejich oˇc´ı. (znak Y, varianty 1 = hnˇed´a, 2 = zelen´a, 3 = modr´a).
blond ˇcern´a hnˇed´a
hnˇed´a 13 11 19
zelen´a 15 7 9
modr´a 14 2 10
(a) Pro oba znaky urˇcete modus. (b) Urˇcete, zda mezi znaky vlasy a oci existuje nˇejak´a z´avislot (Pokud ano, jak´a?). (N´apovˇeda: Protoˇze oba znaky jsou nomin´aln´ıho typu, pouˇzijeme na zhodnocen´ı z´avislosti Cram´ er˚ uv koeficient.) Pro pˇripomenut´ı zde uv´ad´ıme tabulku stupˇ n˚ u line´arn´ı z´avislosti pro Cram´er˚ uv koeficient: Cram´er˚ uv koeficient 0 – 0,1 0.1 – 0.3 0.3 – 0.7 0.7 – 1
interpretace zanedbateln´a z´avislost slab´a z´avislost stˇredn´ı z´avislost siln´a z´avislost
Pˇ r´ıklad ˇ c.2 Otevˇrete datov´ y soubor znamky.txt. (a) Pro zn´amky z matematiky a angliˇctiny vypoˇctˇete medi´an, doln´ı a horn´ı kvartil, kvartilovou odchylku a vytvoˇrte krabicov´ y diagram. (b) Urˇcete vz´ajemnou z´avislot zn´amek z matematiky a zn´amek z angliˇctiny pro vˇsechny studenty, pak zvl´aˇst’ pro muˇze a zvl´aˇst’ pro ˇzeny. Z´ıskan´e v´ ysledky interpretujte. (N´apovˇeda: Protoˇze oba znaky jsou ordin´aln´ıho charakteru, pouˇzijeme na zhodnocen´ı z´avislosti Spearman˚ uv korelaˇ cn´ı koeficient.) Pro pˇripomenut´ı zde uv´ad´ıme tabulku stupˇ n˚ u poˇradov´e z´avislosti pro Spearman˚ uv korelaˇcn´ı koeficient: Abs.hod. korel.koef. 0 (0; 0.1) [0.1; 0.3) [0.30; 0.50) [0.50; 0.70) [0.70; 0.90) [0.90; 1) 1
Interpretace hodnoty poˇradov´a nez´avislost velmi n´ızk´ y stupeˇ n z´avislosti n´ızk´ y stupeˇ n z´avislosti m´ırn´ y stupeˇ n z´avislosti v´ yznaˇcn´ y stupeˇ n z´avislosti vysok´ y stupeˇ n z´avislosti velmi vysok´ y stupeˇ n z´avislosti u ´pln´a poˇradov´a z´avislost 5
(c) Sv˚ uj z´avˇer o (ne)z´avislost znak˚ u zn´amka z matematiky a zn´amka z angliˇctiny doloˇzte teˇckov´ ymi diagramy. Pˇ r´ıklad ˇ c.3 Otevˇrete datov´ y soubor ocel.txt. (a) Pro mez plasticity a mez pevnosti vypoˇctˇete aritmetick´ y pr˚ umˇer, smˇerodatnou odchylku, rozptyl, koeficient variace, ˇsikmost a ˇspiˇcatost. (b) Vypoˇctˇete a interpretujte Pearson˚ uv koeficient korelace meze plasticity a meze pevnosti. D´ale vypoˇctˇete tak´e kovarianci a kovarianˇcn´ı matici. Pro pˇripomenut´ı zde uv´ad´ıme tabulku stupˇ n˚ u line´arn´ı z´avislosti pro Pearson˚ uv korelaˇcn´ı koeficient: Abs.hod. korel.koef. 0 (0; 0.1) [0.1; 0.3) [0.30; 0.50) [0.50; 0.70) [0.70; 0.90) [0.90; 1) 1
Interpretace hodnoty line´arn´ı nez´avislost velmi n´ızk´ y stupeˇ n z´avislosti n´ızk´ y stupeˇ n z´avislosti m´ırn´ y stupeˇ n z´avislosti v´ yznaˇcn´ y stupeˇ n z´avislosti vysok´ y stupeˇ n z´avislosti velmi vysok´ y stupeˇ n z´avislosti u ´pln´a line´arn´ı z´avislost
Pˇ r´ıklad ˇ c.4 Je tˇreba si uvˇedomit, ˇze pr˚ umˇer a rozptyl nepopisuj´ı rozloˇzen´ı ˇcetnost´ı jednoznaˇcnˇe. Existuj´ı datov´e soubory, kter´e maj´ı shodn´ y pr˚ umˇer i rozptyl, ale pˇresto se jejich rozloˇzen´ı ˇcetnost´ı velmi liˇs´ı. Tuto skuteˇcnost dobˇre ilustruje n´asleduj´ıc´ı pˇr´ıklad: Tˇri skupiny student˚ uo poˇctech 149, 69 a 11 odpov´ıdaly pˇri testu na 10 ot´azek. Znak X je poˇcet spr´avnˇe zodpovˇezen´ ych ot´azek. Zn´ame absolutn´ı ˇcetnosti znaku X ve vˇsech tˇrech skupin´ach. Pozn´amka: Data k tomuto c.sk / X 1 2 3
0 2 4 1
1 5 3 0
2 15 2 0
3 20 1 0
4 25 0 0
5 15 49 9
6 25 0 0
7 20 1 0
8 15 2 0
9 5 3 0
10 2 4 1
pˇr´ıkladu lze nal´ezt v souboru odpovedi.txt. Vypoˇctˇete pr˚ umˇer, rozptyl, ˇsikmost a ˇspiˇcatost poˇctu spr´avnˇe zodpovˇezen´ ych ot´azek ve vˇsech tˇrech skupin´ach. Nakreslete sloupkov´e diagramy absolutn´ıch ˇcetnost´ı.
6
4 - Vyuˇ zit´ı syst´ emu R pˇ ri ˇ reˇ sen´ı pˇ r´ıklad˚ u na opakovan´ e pokusy Vyˇreˇste n´ asleduj´ıc´ı pˇr´ıklady. Ke kaˇzd´emu pˇr´ıkladu zobrazte tvar pˇr´ısluˇsn´e distribuˇcn´ı funkce a hustoty. Binomick´ e rozloˇ zen´ı pravdˇ epodobnost´ı: Pˇ r´ıklad ˇ c.1: Pojiˇst’ovna zjistila, ˇze 12 % pojistn´ ych ud´alost´ı je zp˚ usobeno vloup´an´ım. Jak´a je pravdˇepodobnost, ˇze mezi 30 n´ahodnˇe vybran´ ymi pojistn´ ymi ud´alostmi bude zp˚ usobeno vloup´an´ım (a) nejv´ yˇse 6; (b) alespoˇ n 6; (c) pr´avˇe 6; (d) od dvou do pˇeti? Pˇ r´ıklad ˇ c.2: V rodinˇe je 10 dˇet´ı. Za pˇredpokladu, ˇze chlapci i d´ıvky se rod´ı s pravdˇepodobnost´ı 0.5 a pohlav´ı se formuje nez´avisle na sobˇe, urˇcete pravdˇepodobnost, ˇze v t´eto rodinˇe je (a) pr´avˇe 5 chlapc˚ u; (b) nejm´enˇe 3 a nejv´ yˇse 8 chlapc˚ u. Pˇ r´ıklad ˇ c.3: Na dvoukolejn´em ˇzelezniˇcn´ım mostˇe se potkaj´ı bˇehem 24 hodin nejv´ yˇse dva vlaky, a to s pravdˇepodobnost´ı 0.2. Za pˇredpokladu, ˇze denn´ı provozy jsou nez´avisl´e, urˇcete pravdˇepodobnost, ˇze bˇehem t´ ydne se dva vlaky na mostˇe potkaj´ı (a) pr´avˇe tˇrikr´at; (b) nejv´ yˇse tˇrikr´at; (c) alespoˇ n tˇrikr´at. Pˇ r´ıklad ˇ c.4: Je pravdˇepodobnˇejˇs´ı vyhr´at se stejnˇe siln´ ym soupeˇrem tˇri partie ze ˇctyˇr nebo pˇet ´ ech je v´ parti´ı z osmi, kdyˇz nerozhodn´ y v´ ysledek je vylouˇcen a v´ ysledky jsou nez´avisl´e? Uspˇ yhra partie se stejnˇe siln´ ym soupeˇrem, kdyˇz rem´ıza je vylouˇcena, pravdˇepodobnost u ´spˇechu ϑ = 0.5. Pˇ r´ıklad ˇ c.5: Dvacetkr´at nez´avisle na sobˇe h´az´ıme tˇremi mincemi. Jak´a je pravdˇepodobnost, ˇze alespoˇ n v jednom hodˇe padnou tˇri l´ıce?
7
V´ ysledek testu A (pozitivn´ı) A (negativn´ı) celkem
skuteˇcnost H (pozitivn´ı) H (negativn´ı) a=50 b=300 c=25 d=870 75 1170
Celkem 350 895 1245
Geometrick´ e rozloˇ zen´ı pravdˇ epodobnost´ı: ˇ eˇce, nezlob se!“ nasad´ıme figurku nejPˇ r´ıklad ˇ c.6: Jak´a je pravdˇepodobnost, ˇze pˇri hˇre Clovˇ ” pozdˇeji pˇri tˇret´ım hodu? Pˇ r´ıklad ˇ c.7: Studenti biologie zkoumaj´ı barvu oˇc´ı octomilek. Pravdˇepodobnost, ˇze octomilka m´a b´ılou barvu oˇc´ı, je 0.25, ˇcervenou 0.75. Jak´a je pravdˇepodobnost, ˇze aˇz ˇctvrt´a zkouman´a octomilka m´a b´ılou barvu oˇc´ı?
Hypergeometrick´ e rozloˇ zen´ı pravdˇ epodobnost´ı: Pˇ r´ıklad ˇ c.8: Koupili jsme 10 cibulek ˇcerven´ ych tulip´an˚ u a 5 cibulek ˇzlut´ ych tulip´an˚ u. Zasadili jsme 8 n´ahodnˇe vybran´ ych cibulek. (a) Jak´a je pravdˇepodobnost, ˇze ˇz´adn´a cibulka nebude cibulka ˇzlut´ ych tulip´an˚ u? (b) Jak´a je pravdˇepodobnost, ˇze jsme zasadili vˇsech 5 cibulek ˇzlut´ ych tulip´an˚ u? (c) Jak´a je pravdˇepodobnost, ˇze aspoˇ n dvˇe cibulky budou cibulky ˇzlut´ ych tulip´an˚ u? Pˇ r´ıklad ˇ c.9: D´ıtˇe dostalo s´aˇcek, v nˇemˇz bylo 5 ˇcerven´ ych a 5 ˇzlut´ ych bonb´on˚ u. D´ıtˇe n´ahodnˇe vybralo ze s´aˇcku 6 bonb´on˚ u. Jak´a je pravdˇepodobnost, ˇze mezi vybran´ ymi bonb´ony budou pr´avˇe 2 ˇcerven´e?
Diagnostick´ e testy - Nepovinn´ e Pˇ r´ıklad ˇ c.10: Prov´adˇelo se ovˇeˇrov´an´ı kvality nov´eho testu pro diagnostikov´an´ı jist´e poruchy sluchu, kter´a se vyskytuje u 12% osob v populaci. Test byl ovˇeˇrov´an u 1245 osob, u nichˇz byl stav sluchu vyˇsetˇren jiˇz dˇr´ıve podrobn´ ymi klinick´ ymi postupy. V´ ysledky m´ame v tabulce: Vypoˇctˇete prediktivn´ı validitu pozitivn´ıho i negativn´ıho testu.
8
5 - Pravdˇ epodobnostn´ı funkce, hustoty a distribuˇ cn´ı funkce v syst´ emu R, v´ ypoˇ cet pravdˇ epodobnost´ı pomoc´ı distribuˇ cn´ıch funkc´ı Vyˇreˇste n´ asleduj´ıc´ı pˇr´ıklady. Ke kaˇzd´emu pˇr´ıkladu zobrazte tvar pˇr´ısluˇsn´e distribuˇcn´ı funkce a hustoty. Poissonovo rozloˇ zen´ı Pˇ r´ıklad ˇ c.1: Pˇri provozu balic´ıho automatu vznikaj´ı bˇehem smˇeny n´ahodn´e poruchy, kter´e se ˇr´ıd´ı rozloˇzen´ım Po(2). Jak´a je pravdˇepodobnost, ˇze bˇehem smˇeny dojde k aspoˇ n jedn´e poruˇse?
Rovnomˇ ern´ e rozloˇ zen´ı Pˇ r´ıklad ˇ c.2: Na automatick´e lince se pln´ı l´ahve ml´ekem. P˚ usoben´ım n´ahodn´ ych vliv˚ u mnoˇzstv´ı ml´eka kol´ıs´a v intervalu (980 ml; 1020 ml). Kaˇzd´e mnoˇzstv´ı ml´eka v tomto intervalu povaˇzujeme za stejnˇe moˇzn´e. Jak´a je pravdˇepodobnost, ˇze v n´ahodnˇe vybran´e l´ahvi bude aspoˇ n 1010 ml ml´eka?
Exponenci´ aln´ı rozloˇ zen´ı Pˇ r´ıklad ˇ c.3: Doba do ukonˇcen´ı opravy v opravnˇe obuvi je n´ahodn´a veliˇcina, kter´a se ˇr´ıd´ı exponenci´aln´ım rozloˇzen´ım se stˇredn´ı dobou opravy 3 dny. Jak´a je pravdˇepodobnost, ˇze oprava bude ukonˇcena do dvou dn˚ u? Pˇ r´ıklad ˇ c.4: Doba (v hodin´ach), kter´a uplyne mezi dvˇema nal´ehav´ ymi pˇr´ıjmy v jist´e nemocnici, se ˇr´ıd´ı exponenci´aln´ım rozloˇzen´ım se stˇredn´ı dobou ˇcek´an´ı 2 h. Jak´a je pravdˇepodobnost, ˇze uplyne v´ıce neˇz 5 h bez nal´ehav´eho pˇr´ıjmu?
Norm´ aln´ı rozloˇ zen´ı ˇ jsou norm´alnˇe rozloˇzeny s parametry Pˇ r´ıklad ˇ c.5: V´ ysledky u pˇrij´ımac´ıch zkouˇsek na jistou VS µ = 550 bod˚ u, σ = 100 bod˚ u. S jakou pravdˇepodobnost´ı bude m´ıt n´ahodnˇe vybran´ y uchazeˇc aspoˇ n 600 bod˚ u? ˇ Pˇ r´ıklad ˇ c.6: : Zivotnost baterie v hodin´ach je n´ahodn´a veliˇcina, kter´a m´a norm´aln´ı rozloˇzen´ı se stˇredn´ı hodnotou 300 hodin a smˇerodatnou odchylkou 35 hodin. Jak´a je pravdˇepodobnost, ˇze n´ahodnˇe vybran´a baterie bude m´ıt ˇzivotnost (a) aspoˇ n 320 hodin? (b) nejv´ yˇse 310 hodin? Pˇ r´ıklad ˇ c.7: Na v´ yrobn´ı lince jsou automaticky baleny bal´ıˇcky r´ yˇze o deklarovan´e hmotnosti 1000 g. P˚ usoben´ım n´ahodn´ ych vliv˚ u hmotnost bal´ıˇck˚ u kol´ıs´a. Lze ji povaˇzovat za n´ahodnou veliˇcinu, kter´a se ˇr´ıd´ı norm´aln´ım rozloˇzen´ım se stˇredn´ı hodnotou 996 g a smˇerodatnou odchylkou 18 g. Jak´a je pravdˇepodobnost, ˇze n´ahodnˇe vybran´ y bal´ıˇcek r´ yˇze neprojde v´ ystupn´ı kontrolou, jestliˇze je povolen´a tolerance ±30 g od deklarovan´e hmotnosti 1000 g? 9
6 - V´ ypoˇ cet ˇ c´ıseln´ ych charakteristik n´ ahodn´ ych veliˇ cin pomoc´ı softwaru R Pˇ r´ıklad ˇ c.1: (a) Necht’ U ∼ N (0, 1). Najdˇete medi´an a horn´ı a doln´ı kvartil. (b) Necht’ X ∼ N (3, 5). Najdˇete doln´ı kvartil. (c) Urˇcete χ20.025 (25). (d) Urˇcete t0.99 (30) a t0.05 (14). (e) Urˇcete F0.975 (5, 20) a F0.05 (2, 10). Pˇ r´ıklad ˇ c.2: Postupnˇe se zkouˇs´ı spolehlivost ˇctyˇr pˇr´ıstroj˚ u. Dalˇs´ı pˇr´ıstroj se zkouˇs´ı jen tehdy, kdyˇz pˇredchoz´ı je spolehliv´ y. Kaˇzd´ y z pˇr´ıstroj˚ u vydrˇz´ı zkouˇsku s pravdˇepodobnost´ı 0.8. N´ahodn´a veliˇcina X ud´av´a poˇcet zkouˇsen´ ych pˇr´ıstroj˚ u. Vypoˇctˇete stˇredn´ı hodnotu a rozptyl n´ahodn´e veliˇciny X. Pˇ r´ıklad ˇ c.3: N´ahodn´a veliˇcina X ud´av´a poˇcet ok pˇri hodu kostkou. Vypoˇctˇete stˇredn´ı hodnotu a rozptyl n´ahodn´e veliˇciny X. Pˇ r´ıklad ˇ c.4: N´ahodn´a veliˇcina X ud´av´a pˇr´ıjem manˇzela (v tis´ıc´ıch dolar˚ u) a n´ahodn´a veliˇcina Y pˇr´ıjem manˇzelky (v tis´ıc´ıch dolar˚ u). Je zn´ama simult´ann´ı pravdˇepodobnostn´ı funkce π(x, y) diskr´etn´ıho n´ahodn´eho vektoru (X, Y ): Vypoˇctˇete koeficient korelace pˇr´ıjm˚ u manˇzela a manˇzelky. Tabulka simult´ ann´ı pstn´ı fce π(X, Y ) Y - pˇr´ıjem manˇzelky X - pˇr´ıjem manˇzela
10 20 30 40
10 0.2 0.1 0 0
20 30 40 0.04 0.01 0 0.36 0.09 0 0.05 0.1 0 0 0 0.05
Vytvoˇrte, funkci corel.koef, jej´ımˇz vstupem bude matice simult´ann´ıch pstn´ıch fc´ı A, vektor x = (10, 20, 30, 40) a vektor y = (10, 20, 30, 40) a v´ ystupem bude hledan´ y koeficient korelace. Pˇ r´ıklad ˇ c.5: Diskr´etn´ı n´ahodn´ y vektor (X1 , X2 ) m´a simult´ann´ı pravdˇepodobnostn´ı funkci s hodnotami π(0, −1) = c, π(0, 0) = π(0, 1) = π(1, −1) = π(2, −1) = 0, π(1, 0) = π(1, 1) = π(2, 1) = 2c, π(2, 0) = 3c, π(x, y) = 0 jinak. Urˇcete konstantu c a vypoˇctˇete R(X1 , X2 ).
10
7 - Z´ akladn´ı pojmy matematick´ e statistiky Pˇ r´ıklad ˇ c.1: Ve 12-ti n´ahodnˇe vybran´ ych prodejn´ach ve mˇestˇe byly zjiˇstˇeny n´asleduj´ıc´ı ceny urˇcit´eho v´ yrobku (v Kˇc): 102, 99, 106, 103, 96, 98, 100, 105, 103, 98, 104, 107. Tˇechto 12 hodnot povaˇzujeme za realizace n´ahodn´eho v´ ybˇeru X1 , . . . , X12 z rozloˇzen´ı, kter´e m´a stˇredn´ı hodnotu 2 µ a rozptyl σ . (a) Urˇcete nestrann´e bodov´e odhady nezn´am´e stˇredn´ı hodnoty µ a nezn´am´eho rozptylu σ 2 a smˇerodatn´e odchylky σ. (b) Najdˇete v´ ybˇerovou distribuˇcn´ı funkci F12 (x) a nakreslete jej´ı graf. Pˇ r´ıklad ˇ c.2: Pˇr´ır˚ ustky cen akci´ı v % na burze v New Yorku u 10-ti n´ahodnˇe vybran´ ych spoleˇcnost´ı dos´ahly tˇechto hodnot: 10, 16, 5, 10, 12, 8, 4, 6, 5, 4. Odhadnˇete stˇredn´ı hodnotu µ a smˇerodatnou odchylku σ r˚ ustu cen akci´ı a d´ale odhadnˇete pravdˇe-podobnost r˚ ustu cen akci´ı aspoˇ n o 8.5 %. Pˇ r´ıklad ˇ c.3: Bylo zkoum´ano 9 vzork˚ u p˚ udy s r˚ uzn´ ym obsahem fosforu (veliˇcina X). Hodnoty veliˇciny Y oznaˇcuj´ı obsah fosforu v obiln´ ych kl´ıˇcc´ıch (po 38 dnech), jeˇz vyrostly na tˇechto vzorc´ıch p˚ udy. ˇc´ıslo vzorku X Y
1 1 64
2 4 71
3 5 54
4 5 6 7 8 9 11 13 23 23 81 76 93 77 95
9 28 109
Tˇechto 9 dvojic hodnot povaˇzujeme za realizace n´ahodn´eho v´ ybˇeru (X1 , Y1 ), . . . , (X9 , Y9 ) z dvourozmˇern´eho rozloˇzen´ı s kovarianc´ı σ12 a koeficientem korelace ρ. Najdˇete bodov´e odhady kovariance σ12 a koeficientu korelace ρ. V´ yslednou hodnotu koeficientu korelace interpretujte. Pozn´amka: Interpretace hodnot koeficient˚ u korelace |ρ|: (a) v pˇr´ırodn´ıch vˇed´ach: hodnota |ρ| h0 ; 0.4) h0.4 ; 0.6) h0.6 ; 0.8) h0.8 ; 1i
interpretace ˇza´dn´a/t´emˇeˇr ˇz´adn´a z´avislost slab´a z´avislost m´ırn´a z´avislost siln´a z´avislost
(b) v soci´aln´ıch vˇed´ach: Nesm´ıme zapomenout, ˇze kromˇe m´ıry z´avislosti m˚ uˇzeme pomoc´ı koeficientu korelace urˇcit, zda jde o z´avislost pˇr´ımou (koef.korelace je kladn´ y) nebo nepˇr´ımou (koef.korelace je z´aporn´ y). Pˇ r´ıklad ˇ c.4: Pˇet muˇz˚ u zjistilo a zapsalo svou hmotnost (v kg) a v´ yˇsku (v cm): Najdˇete nestrann´ y bodov´ y odhad rozptylu hmotnosti, rozptylu v´ yˇsky a kovariance hmotnosti a v´ yˇsky. Vypoˇctˇete rovnˇeˇz realizaci v´ ybˇerov´eho koeficientu korelace hmotnosti a v´ yˇsky. 11
hodnota |ρ| h0 ; 0.15) h0.15 ; 0.3) h0.3 ; 0.5) h0.5 ; 0.6) h0.6 ; 0.8) h0.8 ; 1i ˇ ıslo muˇze C´ Hmotnost V´ yˇska
interpretace ˇza´dn´a/t´emˇeˇr ˇz´adn´a z´avislost slab´a z´avislost m´ırn´a z´avislost celkem siln´a z´avislost siln´a z´avislost velmi siln´a z´avislost
1 76 170
2 86 177
3 73 169
4 84 174
5 79 175
V´ yslednou hodnotu koeficientu korelace interpretujte. D´ale vytvoˇrte histogramy pro hmotnost a v´ yˇsku. Pˇ r´ıklad ˇ c.5: Pˇri kontroln´ıch zkouˇsk´ach ˇzivotnosti 16-ti ˇza´rovek byl stanoven odhad m = 3000 h stˇredn´ı hodnoty jejich ˇzivotnosti. Z dˇr´ıvˇejˇs´ıch zkouˇsek je zn´amo, ˇze ˇzivotnost ˇza´rovky se ˇr´ıd´ı norm´aln´ım rozloˇzen´ım se smˇerodatnou odchylkou σ = 20 h. Vypoˇctˇete (a) 99 % empirick´ y interval spolehlivosti pro stˇredn´ı hodnotu ˇzivotnosti; (b) 90 % levostrann´ y empirick´ y interval spolehlivosti pro stˇredn´ı hodnotu ˇzivotnosti; (c) 95 % pravostrann´ y empirick´ y interval spolehlivosti pro stˇredn´ı hodnotu ˇzivotnosti. Pozn´amka: V´ ysledek zaokrouhlete na jedno desetinn´e m´ısto a vyj´adˇrete v hodin´ach a minut´ach. Pˇ r´ıklad ˇ c.6: V´ıme, ˇze v´ yˇska hoch˚ u ve vˇeku 9.5 let aˇz 10 let m´a norm´aln´ı rozloˇzen´ı s nezn´amou stˇredn´ı hodnotou µ a zn´am´ ym rozptylem σ 2 = 39.112 cm2 . Dˇetsk´ y l´ekaˇr n´ahodnˇe vybral 15 hoch˚ u uveden´eho vˇeku, zmˇeˇril je a vypoˇc´ıtal realizaci v´ ybˇerov´eho pr˚ umˇeru m = 139.13 cm. Podle jeho n´azoru by v´ yˇska hoch˚ u v tomto vˇeku nemˇela pˇres´ahnout 142 cm s pravdˇepodobnost´ı 0.95. Lze tvrzen´ı l´ekaˇre akceptovat?
12
8 - Ovˇ eˇ rov´ an´ı normality a parametrick´ e u ´ lohy o jednom n´ ahodn´ em v´ ybˇ eru z norm´ aln´ıho rozloˇ zen´ı a dvourozmˇ ern´ eho rozloˇ zen´ı Pˇ r´ıklad ˇ c.1: Pˇri nan´aˇsen´ı tenk´ ych kovov´ ych vrstev stˇr´ıbra na polymern´ı materi´al se vyˇzaduje, ’ aby tlouˇst ka vrstvy byla 0.020 µm. Pomoc´ı atomov´e absorpˇcn´ı spektroskopie se zjistily hodnoty, jeˇz jsou uvedeny v tabulce a uloˇzeny v souboru vrstva stribra.txt. Posud’te Q-Q grafem, zda se v´ ysledky mˇeˇren´ı ˇr´ıd´ı norm´aln´ım rozloˇzen´ım. Pˇ r´ıklad ˇ c.2: ˇ v Praze byla zjiˇst’ov´ana v´ 1. U 48 studentek VSE yˇska a obor studia (1 – n´arodn´ı hospod´aˇrstv´ı, 2 – informatika). Hodnoty jsou uloˇzeny v souboru vyska.txt. Pomoc´ı Q-Q grafu posud’te vizu´alnˇe pˇredpoklad normality. Na hladinˇe v´ yznamnosti α = 0.05 testujte hypot´ezu, ˇze data poch´azej´ı z norm´aln´ıho rozloˇzen´ı. Hypot´ezu otestujte pomoc´ı (a) Lillieforsovy modifikace K-S testu; (b) Shapirova-Wilkova testu; (c) Andersonova-Darlingova testu; (d) Pearsonova χ2 testu; 2. Testy normality a grafick´e ovˇeˇren´ı normality proved’te jak pro v´ yˇsky studentek oboru n´arodn´ı hospod´aˇrstv´ı, tak pro v´ yˇska studentek oboru informatiky. Pˇ r´ıklad ˇ c.3: Pˇredpokl´adejme, ˇze velk´ y roˇcn´ık na vysok´e ˇskole m´a v´ ysledky ze statistiky norm´alnˇe rozloˇzeny kolem stˇredn´ı hodnoty 72 bod˚ u se smˇerodatnou odchylkou 9 bod˚ u. Najdˇete pravdˇepodobnost, ˇze pr˚ umˇer v´ ysledk˚ u n´ahodn´eho v´ ybˇeru 10-ti student˚ u bude vˇetˇs´ı neˇz 80 bod˚ u. Pˇ r´ıklad ˇ c.4: Z populace stejnˇe star´ ych selat t´ehoˇz plemene bylo vylosov´ano ˇsest selat a po dobu p˚ ul roku jim byla pod´av´ana t´aˇz v´ ykrmn´a dieta. Byly zaznamen´av´any pr˚ umˇern´e denn´ı pˇr´ır˚ ustky hmotnosti v Dg. Z dˇr´ıvˇejˇs´ıch pokus˚ u je zn´amo, ˇze v populaci m´ıvaj´ı takov´e pˇr´ır˚ ustky norm´aln´ı rozloˇzen´ı, avˇsak stˇredn´ı hodnota i rozptyl se mˇen´ıvaj´ı. Pˇr´ır˚ ustky v Dg: 62, 54, 55, 60, 53, 58. (a) Najdˇete 95% empirick´ y levostrann´ y interval spolehlivosti pro nezn´amou stˇredn´ı hodnotu µ pˇri nezn´am´e smˇerodatn´e odchylce σ. (b) Najdˇete 95% empirick´ y interval spolehlivosti pro smˇerodatnou odchylku σ. Pozn´amka: Nezapomeˇ nte pˇred tvorbou interval˚ u spolehlivosti ovˇ eˇ rit normalitu dat, kter´a je nezbytn´ ym pˇredpokladem zaruˇcuj´ıc´ım spolehlivost interval˚ u. Pˇ r´ıklad ˇ c.5: Systematick´a chyba mˇeˇric´ıho pˇr´ıstroje se eliminuje nastaven´ım pˇr´ıstroje a mˇeˇren´ım etalonu, jehoˇz spr´avn´a hodnota je µ = 10.00. Nez´avisl´ ymi mˇeˇren´ımi za stejn´ ych podm´ınek byly z´ısk´any hodnoty: 10.24, 10.12, 9.91, 10.19, 9.78, 10.14, 9.86, 10.17, 10.05, kter´e povaˇzujeme za realizace n´ahodn´eho v´ ybˇeru rozsahu 9 z rozloˇzen´ı N (µ, σ 2 ). Je moˇzn´e pˇri riziku 0.05 vysvˇetlit odchylky od hodnoty 10.00 p˚ usoben´ım n´ahodn´ ych vliv˚ u? Hypot´ezu otestujte pomoc´ı (a) kritick´eho oboru; 13
(b) intervalu spolehlivosti; (c) p-hodnoty. Pˇ r´ıklad ˇ c.6: U 25-ti n´ahodnˇe vybran´ ych dvoulitrov´ ych lahv´ı s nealkoholick´ ym n´apojem byl zjiˇstˇen pˇresn´ y objem n´apoje. V´ ybˇerov´ y pr˚ umˇer ˇcinil m = 1.99 l a v´ ybˇerov´a smˇerodatn´a odchylka s = 0.1 l. Pˇredpokl´adejme, ˇze objem n´apoje v l´ahvi je n´ahodn´a veliˇcina s norm´aln´ım rozloˇzen´ım. Na hladinˇe v´ yznamnosti α = 0.05 ovˇeˇrte tvrzen´ı v´ yrobce, ˇze smˇerodatn´a odchylka je 0.08 l. Tvrzen´ı ovˇeˇrte pomoc´ı (a) kritick´eho oboru; (b) intervalu spolehlivosti; (c) p-hodnoty. Pˇ r´ıklad ˇ c.7: Bylo vylosov´ano 6 vrh˚ u selat a z nich vˇzdy dva sourozenci. Jeden z nich vˇzdy dostal n´ahodnˇe dietu ˇc.1 a druh´ y dietu ˇc.2. Pˇr´ır˚ ustky v Dg jsou n´asleduj´ıc´ı: (62;52), (54;56), (55;49), (60;50), (53;51), (58;50). Za pˇredpokladu, ˇze uveden´e dvojice tvoˇr´ı n´ahodn´ y v´ ybˇer z dvourozmˇern´eho rozloˇzen´ı s vektorem stˇredn´ıch hodnot (µ1 , µ2 ) a jejich rozd´ıly se ˇr´ıd´ı norm´aln´ım rozloˇzen´ım, sestrojte 95% interval spolehlivosti pro rozd´ıl stˇredn´ıch hodnot. Pomoc´ı tohoto intervalu otestujte hypot´ezu, ˇze v´ ykrmn´a dieta nem´a vliv na hmotnostn´ı pˇr´ır˚ ustky selat. Pˇ r´ıklad ˇ c.8: Bylo vybr´ano ˇsest nov´ ych voz˚ u t´eˇze znaˇcky a po urˇcit´e dobˇe bylo zjiˇstˇeno, o kolik mm se sjely jejich lev´e a prav´e pˇredn´ı pneumatiky. V´ ysledky: (1.8; 1.5), (1.0; 1.1), (2.2; 2.0), (0.9; 1.1), (1.5; 1.4), (1.6; 1.4). Za pˇredpokladu, ˇze uveden´e dvojice tvoˇr´ı n´ahodn´ y v´ ybˇer z dvourozmˇern´eho rozloˇzen´ı s vektorem stˇredn´ıch hodnot (µ1 , µ2 ) a jejich rozd´ıly se ˇr´ıd´ı norm´aln´ım rozloˇzen´ım, testujte na hladinˇe v´ yznamnosti α = 0.05 hypot´ezu, ˇze obˇe pneumatiky se sj´ıˇzdˇej´ı stejnˇe rychle.
14
9 - Parametrick´ e u ´ lohy o dvou nez´ avisl´ ych n´ ahodn´ ych v´ ybˇ erech z norm´ aln´ıch rozloˇ zen´ı a jednom n´ ahodn´ em v´ ybˇ eru z alternativn´ıho rozloˇ zen´ı Pˇ r´ıklad ˇ c.1: Intervaly spolehlivosti pro parametrick´ e funkce µ1 − µ2 , σ12 /σ22 ˇ Bylo vylosov´ano 11 stejnˇe star´ ych selat t´ehoˇz plemene. Sesti z nich byla pˇredeps´ana v´ ykrmn´a dieta ˇc.1 a zbyl´ ym pˇeti v´ ykrmn´a dieta ˇc.2. Pr˚ umˇern´e denn´ı pˇr´ır˚ ustky v Dg za dobu p˚ ul roku jsou n´asleduj´ıc´ı: dieta ˇc.1: dieta ˇc.2:
62 52
54 56
55 49
60 50
53 51
58
Zjiˇstˇen´e hodnoty povaˇzujeme za realizace dvou nez´avisl´ ych n´ahodn´ ych v´ ybˇer˚ u poch´azej´ıc´ıch 2 2 z rozloˇzen´ı N (µ1 , σ1 ) a N (µ2 , σ2 ). (a) Sestrojte 95 % empirick´ y interval spolehlivosti pro pod´ıl rozptyl˚ u. Pomoc´ı tohoto intervalu otestujte hypot´ezu, ˇze rozptyly σ12 a σ22 jsou shodn´e. (b) Za pˇredpokladu, ˇze data poch´azej´ı z rozloˇzen´ı N (µ1 , σ12 ) a N (µ2 , σ22 ), sestrojte 95 % empirick´ y interval spolehlivosti pro rozd´ıl stˇredn´ıch hodnot µ1 − µ2 . Pˇ r´ıklad ˇ c.2: Jsou d´any dva nez´avisl´e n´ahodn´e v´ ybˇery o rozsaz´ıch n1 = 25, n2 = 10, prvn´ı 2 y z rozloˇzen´ı N (µ2 , σ22 ), kde parametry µ1 , µ2 , σ12 , σ22 poch´az´ı z rozloˇzen´ı N (µ1 , σ1 ), druh´ nezn´ame. Byly vypoˇcteny realizace v´ ybˇerov´ ych rozptyl˚ u: σ12 = 1.7482, σ22 = 1.7121. Sestrojte 95 % empirick´ y interval spolehlivosti pro pod´ıl rozptyl˚ u. Pˇ r´ıklad ˇ c.3: Testov´ an´ı hypot´ ez o parametrick´ ych funkc´ıch µ1 − µ2 , σ12 /σ22 Pro datov´ y soubor z pˇr´ıkladu ˇc.1 testujte na hladinˇe v´ yznamnosti α = 0.05 hypot´ezu, ˇze (a) rozptyly hmotnostn´ıch pˇr´ır˚ ustk˚ u selat pˇri obou v´ ykrmn´ ych diet´ach jsou shodn´e; (b) obˇe v´ ykrmn´e diety maj´ı stejn´ y vliv na hmotnostn´ı pˇr´ır˚ ustky selat. D´ale sestrojte krabicov´e grafy pro hmotnostn´ı pˇr´ır˚ ustky selat obou v´ ykrmn´ ych diet. ˇ Pˇ r´ıklad ˇ c.4: Naˇctˇete datov´ y soubor vyska.txt, kter´ y obsahuje u ´daje o v´ yˇsce 48 studentek VSE v Praze (promˇenn´a vyska) a obor jejich studia (1 – n´arodn´ı hospod´aˇrstv´ı, 2 – informatika). (a) Pomoc´ı S-W testu ovˇeˇrte na hladinˇe v´ yznamnosti α = 0.1 pˇredpoklad o normalitˇe v´ yˇsek v obou skupin´ach studentek. (b) Na hladinˇe v´ yznamnosti α = 0.1 testujte hypot´ezu o shodˇe rozptyl˚ u v´ yˇsek studentek v dan´ ych dvou oborech studia. (c) Na hladinˇe v´ yznamnosti α = 0.1 testujte hypot´ezu o shodˇe stˇredn´ıch hodnot v´ yˇsek studentek v dan´ ych dvou oborech studia. (d) V´ ypoˇcet doplˇ nte krabicov´ ymi diagramy.
15
Pˇ r´ıklad ˇ c.5: Asymptotick´ y interval spolehlivosti pro parametr θ alternativn´ıho rozloˇ zen´ı M˚ uˇze politick´a strana, pro niˇz se v pˇredvolebn´ım pr˚ uzkumu vyslovilo 60 z 1000 dot´azan´ ych osob, oˇcek´avat se spolehlivost´ı 0.95, ˇze by v t´eto dobˇe ve volb´ach pˇrekroˇcila 5 % hranici pro vstup do parlamentu? Pro stanoven´ı z´avˇeru vyuˇzijte interval spolehlivosti. Pozn´amka: Nezapomeˇ nte pˇred samotn´ ym v´ ypoˇctem ovˇ eˇ rit tzv. podm´ınku dobr´ e aproximace (Haladovu podm´ınku), jej´ıˇz splnˇen´ı je nezbytn´e pro relevantnost z´avˇeru. Pˇ r´ıklad ˇ c.6: Pˇr´ır˚ ustky cen akci´ı na burze (v %) u 10-ti n´ahodnˇe vybran´ ych spoleˇcnost´ı dos´ahly tˇechto hodnot: 10, 16, 5, 10, 12, 8, 4, 6, 5, 4. Sestrojte 95 % asymptotick´ y empirick´ y interval spolehlivosti pro pravdˇepodobnost, ˇze pˇr´ır˚ ustek ceny akcie pˇrekroˇc´ı 8.5 %. Pˇ r´ıklad ˇ c.7: Urˇcit´a cestovn´ı kancel´aˇr organizuje zahraniˇcn´ı z´ajezdy podle individu´aln´ıch pˇra´n´ı z´akazn´ık˚ u. Z nˇekolika minul´ ych let v´ı, ˇze 30 % vˇsech takto organizovan´ ych z´ajezd˚ u m´a za c´ıl zemi X. Po zhorˇsen´ı politick´ ych podm´ınek v t´eto zemi se cestovn´ı kancel´aˇr ob´av´a, ˇze se z´ajem o tuto zemi mezi z´akazn´ıky sn´ıˇz´ı. Ze 150-ti n´ahodnˇe vybran´ ych z´akazn´ık˚ u v tomto roce m´a 38 za c´ıl pr´avˇe zemi X. Potvrzuj´ı nejnovˇejˇs´ı data pokles z´ajmu o tuto zemi? Volte hladinu v´ yznamnosti α = 0.05.
16
10 - Anal´ yza rozptylu jednoduch´ eho tˇ r´ıdˇ en´ı Pˇ r´ıklad ˇ c.1: V jist´e tov´arnˇe se mˇeˇril ˇcas, kter´ y potˇreboval kaˇzd´ y ze tˇr´ı dˇeln´ık˚ u k uskuteˇcnˇen´ı ˇ t´ehoˇz pracovn´ıho u ´konu. Cas v minut´ach: 1.dˇeln´ık: 2.dˇeln´ık: 3.dˇeln´ık:
3.6 4.3 4.2
3.8 3.9 4.5
3.7 4.2 4.0
3.5 3.9 4.1
4.4 4.5
4.7 4.4
Na hladinˇe v´ yznamnosti α = 0.05 testujte hypot´ezu, ˇze v´ ykony tˇechto tˇr´ı dˇeln´ık˚ u jsou stejn´e. Zam´ıtnete-li nulovou hypot´ezu, urˇcete, v´ ykony kter´ ych dˇeln´ık˚ u se liˇs´ı na dan´e hladinˇe v´ yznamnosti α = 0.05. Pozn´amka: Pˇred samotn´ ym testov´an´ım nezapomeˇ nte ovˇ eˇ rit, ˇ ze vˇ sechny tˇ ri v´ ybˇ ery poch´ az´ı z norm´ aln´ıch rozloˇ zen´ı a ˇ ze rozptyly tˇ echto v´ ybˇ er˚ u jsou shodn´ e. Jsou to d˚ uleˇzit´e pˇredpoklady, kter´e mus´ı b´ yt splnˇeny, abychom mohli anal´ yzu rozptylu pouˇz´ıt. Normalitu otestujte pomoc´ı S-W testu a graficky pomoc´ı Q-Q grafu, shodu rozptyl˚ u potom ovˇeˇrte pomoc´ı Levenova testu a graficky pomoc´ı krabicov´ ych diagram˚ u. Proˇc nem˚ uˇzeme k otestov´an´ı shody rozptyl˚ u pouˇz´ıt Bartlett˚ uv test? Pˇ r´ıklad ˇ c.2 Na stˇredn´ı ˇskole byl uskuteˇcnˇen experminet zjiˇst’uj´ıc´ı efektvitu jednotliv´ ych pedagogick´ ych metod. Studenti byli rozdˇeleni do pˇeti supin a kaˇzd´a skupina byla vyuˇcov´ana pomoc´ı jedn´e z pedagogick´ ych metod: tradiˇcn´ı zp˚ usob, programov´a v´ yuka, audiotechnika, audiovizu´aln´ı technika a vizu´aln´ı technika. Z kaˇzd´e skupiny byl potom vybr´an n´ahodn´ y vzorek student˚ ua vˇsichni byli podrobeni t´emuˇz p´ısemn´emu testu. V´ ysledky testu jsou uvedeny v n´asleduj´ıc´ı tabulce a v souboru vyukove metody.txt: metoda tradicni programova audio audiovizualni vizualni
76.2 85.2 67.3 75.8 50.5
48.3 74.3 60.1 81.6 70.2
85.1 76.5 55.4 90.3 88.8
poˇcet 63.7 80.3 72.3 78.0 67.1
bod˚ u 91.6 67.4 40.0 67.8 77.7
87.2 67.9 72.1
60.4
57.6 73.9
Na hladinˇe v´ yznamnosti α = 0.05 testujte hypot´ezu, ˇze znalosti vˇsech student˚ u jsou stejn´e a nez´avis´ı na pouˇzit´e pedagogick´e metodˇe. V pˇr´ıpadˇe zam´ıtnut´ı hypot´ezy zjistˇete, kter´e v´ ybˇery se liˇs´ı na hladinˇe v´ yznamnosti 0.05. Pozn´amka: Pˇred samotn´ ym testov´an´ım nezapomeˇ nte ovˇ eˇ rit, ˇ ze vˇ sechny tˇ ri v´ ybˇ ery poch´ az´ı z norm´ aln´ıch rozloˇ zen´ı a ˇ ze rozptyly tˇ echto v´ ybˇ er˚ u jsou shodn´ e. Jsou to d˚ uleˇzit´e pˇredpoklady, kter´e mus´ı b´ yt splnˇeny, abychom mohli anal´ yzu rozptylu pouˇz´ıt. Normalitu otestujte pomoc´ı S-W testu a graficky pomoc´ı Q-Q grafu, shodu rozptyl˚ u potom ovˇeˇrte pomoc´ı Levenova testu a Bartlettova testu a graficky pomoc´ı krabicov´ ych diagram˚ u.
17
Pˇ r´ıklad ˇ c.3 Pan Nov´ak m˚ uˇze cestovat z m´ısta bydliˇstˇe do m´ısta pracoviˇstˇe tˇremi r˚ uzn´ ymi zp˚ usoby: tramvaj´ı (zp˚ usob A), autobusem (zp˚ usob B) a metrem s n´asledn´ ym pˇrestupem na tramvaj (zp˚ usob C). M´ame k dispozici jeho namˇeˇren´e ˇcasy cestov´an´ı do pr´ace v dobˇe rann´ı ˇspiˇcky (vˇcetnˇe ˇcek´an´ı na pˇr´ısluˇsn´ y spoj) v minut´ach: zp˚ usob A: zp˚ usob B: zp˚ usob C:
32 30 40
39 34 37
42 28 31
37 26 39
34 32 38
38 33
34
Pro vˇsechny tˇri zp˚ usoby dopravy vypoˇctˇete pr˚ umˇern´e ˇcasy cestov´an´ı. Na hladinˇe v´ yznamnosti α = 0.05 testujte hypot´ezu, ˇze doba cestov´an´ı do pr´ace nez´avis´ı na zp˚ usobu dopravy. V pˇr´ıpadˇe zam´ıtnut´ı nulov´e hypot´ezy zjistˇete, kter´e zp˚ usoby dopravy do pr´ace se od sebe liˇs´ı na hladinˇe v´ yznamnosti α = 0.05. Pozn´amka: Pˇred samotn´ ym testov´an´ım nezapomeˇ nte ovˇeˇrit, ˇze vˇsechny tˇri v´ ybˇery poch´az´ı z norm´aln´ıch rozloˇzen´ı a ˇze rozptyly tˇechto v´ ybˇer˚ u jsou shodn´e.
18
11 - Neparametrick´ eu ´ lohy o medi´ anech Pˇ r´ıklad ˇ c.1: P´ arov´ y znam´ enkov´ y test a p´ arov´ y Wilcoxon˚ uv test ’ Pˇri zjiˇst ov´an´ı kvality jedn´e sloˇzky p˚ udy se pouˇz´ıvaj´ı dvˇe metody oznaˇcen´e A a B. V´ ysledky jsou uvedeny v n´asleduj´ıc´ı tabulce: Vzorek A B
1 0.275 0.28
2 3 4 0.312 0.284 0.3 0.312 0.288 0.298
5 6 7 8 9 10 11 12 0.365 0.298 0.312 0.315 0.242 0.321 0.335 0.307 0.361 0.307 0.319 0.315 0.242 0.323 0.341 0.315
Na hladinˇe v´ yznamnosti α = 0.05 testujte hypot´ezu, ˇze metody A a B d´avaj´ı stejn´e v´ ysledky. K testov´an´ı pouˇzijte jak p´arov´ y znam´enkov´ y test, tak p´arov´ y Wilcoxon˚ uv test. Pro lepˇs´ı pˇredstavu sestrojte krabicov´e diagramy pro obˇe metody. Pˇ r´ıklad ˇ c.2: Jednov´ ybˇ erov´ y znam´ enkov´ y test a jednov´ ybˇ erov´ y Wilcoxon˚ uv test Vyr´abˇen´e ocelov´e tyˇce maj´ı kol´ısavou d´elku s pˇredpokl´adanou hodnotou medi´anu 10 m. N´ahodn´ y v´ ybˇer 10-ti tyˇc´ı poskytl tyto v´ ysledky: 9.83, 10.10, 9.72, 9.91, 10.04, 9.95, 9.82, 9.73, 9.81, 9.90. Na hladinˇe v´ yznamnosti 0.05 testujte hypot´ezu, ˇze pˇredpoklad o medi´anu d´elky tyˇc´ı je opr´avnˇen´ y. K testov´an´ı pouˇzijte jak jednov´ ybˇerov´ y znam´enkov´ y test, tak jednov´ ybˇerov´ y Wilcoxon˚ uv test. Pro lepˇs´ı pˇredstavu sestrojte krabicov´ y diagram. Pˇ r´ıklad ˇ c.3: Dvouv´ ybˇ erov´ y Wilcoxon˚ uv test Majitel obchodu chtˇel zjistit, zda velikost n´akup˚ u (v dolarech) placen´ ych kreditn´ımi kartami Master/EuroCard a Visa jsou pˇribliˇznˇe stejn´e. N´ahodnˇe vybral • 7 n´akup˚ u placen´ ych Master/EuroCard: 42, 77, 46, 73, 78, 33, 37; • 9 n´akup˚ u placen´ ych Visou: 39, 10, 119, 68, 76, 126, 53, 79, 102. Lze na hladinˇe v´ yznamnosti α = 0.05 tvrdit, ˇze velikost n´akup˚ u placen´ ych tˇemito dvˇema typy karet se shoduj´ı? K testov´an´ı pouˇzijte dvouv´ ybˇerov´ y Wilcoxon˚ uv test a Kolmogor˚ uv-Smirnov˚ uv test. Pro lepˇs´ı pˇredstavu sestrojte krabicov´e diagramy pro oba typy platebn´ıch karet. Pˇ r´ıklad ˇ c.4: Kruskal˚ uv – Wallis˚ uv test a medi´ anov´ y test ´ Voda po holen´ı jist´e znaˇcky se prod´av´a ve ˇctyˇrech r˚ uzn´ ych lahviˇck´ach stejn´eho obsahu. Udaje o poˇctu prodan´ ych lahviˇcek za t´ yden v r˚ uzn´ ych obchodech jsou uvedeny v n´asleduj´ıc´ı tabulce: 1.typ: 2.typ: 3.typ: 4.typ:
50 31 27 35
35 37 19 39
43 59 32 37
30 67 20 38
62 44 18 28
52 49 23 33
43 54
57 62
33 34
70 64 42 40
58
53
65
39
Posud’te na 5 % hladinˇe v´ yznamnosti, zda typ lahviˇcky ovlivˇ nuje u ´roveˇ n prodeje. V pˇr´ıpadˇe zam´ıtnut´ı nulov´e hypot´ezy zjistˇete, prodeje kter´ ych typ˚ u lahviˇcek se od sebe v´ yznamnˇe liˇs´ı. K testov´an´ı pouˇzijte Kruskal˚ uv – Wallis˚ uv test i medi´anov´ y test; v pˇr´ıpadˇe zam´ıtnut´ı nulov´e hypot´ezy pouˇzijte k zjiˇstˇen´ı v´ yznamn´ ych rozd´ıl˚ u vhodnou metodu mnohon´asobn´eho porovn´av´an´ı. Pro lepˇs´ı pˇredstavu sestrojte krabicov´e diagramy pro vˇsechny typy lahviˇcek.
19
Pˇ r´ıklad ˇ c.5: Ve skupinˇe 12-ti student˚ u se sledovala srdeˇcn´ı frekvence pˇri zmˇenˇe polohy z lehu do stoje. Z´ıskaly se tyto rozd´ıly poˇctu tep˚ u srdce za 1 minutu: -2, 4, 8, 25, -5, 16, 3, 1, 12, 17, 20, 9. Za pˇredpokladu, ˇze tyto rozd´ıly maj´ı symetrick´e rozloˇzen´ı, testujte na hladinˇe v´ yznamnosti α = 0.05 hypot´ezu, ˇze medi´an rozd´ıl˚ u obou tepov´ ych frekvenc´ı je 15 proti oboustrann´e alternativˇe. Sestrojte krabicov´ y diagram. Pˇ r´ıklad ˇ c.6: Z produkce tˇr´ı podnik˚ u vyr´abˇej´ıc´ıch televizory bylo vylosov´ano 10, 8 a 12 kus˚ u. ’ Byly z´ısk´any n´asleduj´ıc´ı v´ ysledky zjiˇst ov´an´ı citlivosti tˇechto televizor˚ u v mikrovoltech: 1.podnik: 2.podnik: 3.podnik:
420 400 450
560 420 700
600 580 630
490 470 590
550 470 420
570 500 590
340 480 520 530 610 540
510
460
740
690
540
670
Ovˇeˇrte na hladinˇe v´ yznamnosti α = 0.05 hypot´ezu o shodˇe u ´rovnˇe citlivosti televizor˚ u v jednotliv´ ych podnic´ıch. Sestrojte krabicov´e diagramy pro vˇsechny tˇri podniky.
20
12 - Hodnocen´ı kontingenˇ cn´ıch tabulek Pˇ r´ıklad ˇ c.1: Testov´ an´ı hypot´ ezy o nez´ avislosti, mˇ eˇ ren´ı s´ıly z´ avislosti V roce 1950 zkoumali Yule a Kendall barvu oˇc´ı a vlas˚ u u 6800 muˇz˚ u. V´ ysledky zkoum´an´ı jsou uvedeny v n´asleduj´ıc´ı tabulce a v souboru vlasy oci.txt. Barva oˇc´ı
svˇetl´a 1768 946 115
modr´a ˇsed´a/zelen´a hnˇed´a
Barva vlas˚ u kaˇstanov´a ˇcern´a rezav´a 807 180 47 1387 746 53 438 288 16
Na asymptotick´e hladinˇe v´ yznamnosti α = 0.05 testujte hypot´ezu o nez´avislosti barvy oˇc´ı a barvy vlas˚ u. Vypoˇctˇete Cram´er˚ uv koeficient. Pozn´amka: Nezapomeˇ nte pˇred samotn´ ym testov´an´ım ovˇeˇrit podm´ınky dobr´e aproximace. Pˇ r´ıklad ˇ c.2: Otevˇrete si soubor ped hodnost.txt. Na hladinˇe v´ yznamnosti α = 0.05 testujte hypot´ezu o nez´avislosti pedagogick´e hodnosti a pohlav´ı. D´ale vypoˇctˇete Cram´er˚ uv koeficient vyjadˇruj´ıc´ı intenzitu z´avislosti pedagogick´e hodnosti na pohlav´ı. Data v souboru maj´ı n´asleduj´ıc´ı tvar: Pohlav´ı muˇz ˇzena
Pedagogick´a hodnost odb. asistent docent profesor 32 15 8 34 8 3
Pozn´amka: Nezapomeˇ nte pˇred samotn´ ym testov´an´ım ovˇeˇrit podm´ınky dobr´e aproximace. Pˇ r´ıklad ˇ c.3: Fisher˚ uv faktori´ alov´ y test 100 n´ahodnˇe vybran´ ych muˇz˚ u a ˇzen bylo dot´az´ano, ´ zda d´avaj´ı pˇrednost nealkoholick´emu n´apoji A ˇci B. Udaje jsou uvedeny ve ˇctyˇrpoln´ı kontingenˇcn´ı tabulce. pohlav´ı muˇz ˇzena 20 30 30 20
pref. n´apoj A B
Na hladinˇe v´ yznamnosti α = 0.05 testujte pomoc´ı Fisherova faktori´alov´eho testu hypot´ezu, ˇze preferovan´ y typ n´apoje nez´aleˇz´ı na pohlav´ı respondenta. Pˇ r´ıklad ˇ c.4: Pod´ıl ˇ sanc´ı Pro u ´daje z pˇr´ıkladu ˇc.3 vypoˇctˇete pod´ıl ˇsanc´ı a sestrojte 95 % asymptotick´ y interval spolehlivosti pro logaritmus pod´ılu ˇsanc´ı. Pomoc´ı tohoto intervalu spolehlivosti testujte na asymptotick´e hladinˇe v´ yznamnosti α = 0.05 hypot´ezu, ˇze preferovan´ y typ n´apoje nez´aleˇz´ı na pohlav´ı respondenta.
21
Pˇ r´ıklad ˇ c.5: 36 muˇz˚ u onemocnˇelo urˇcitou chorobou. Nˇekteˇr´ı z nich se l´eˇcili, jin´ı ne. Nˇekteˇr´ı se ´ uzdravili, jin´ı zemˇreli. Udaje jsou uvedeny ve ˇctyˇrpoln´ı kontingenˇcn´ı tabulce. pˇreˇzit´ı ano ne
l´eˇcen´ı ano ne 10 6 12 8
Vypoˇctˇete a interpretujte pod´ıl ˇsanc´ı. Pomoc´ı intervalu spolehlivosti pro logaritmus pod´ılu ˇsanc´ı testujte na asymptotick´e hladinˇe v´ yznamnosti α = 0.05 hypot´ezu, ˇze pˇreˇzit´ı nez´avis´ı na l´eˇcen´ı proti tvrzen´ı, ˇze l´eˇcen´ı zvyˇsuje ˇsance na pˇreˇzit´ı.
22
13 - Jednoduch´ a korelaˇ cn´ı anal´ yza Pˇ r´ıklad ˇ c.1: Testov´ an´ı nez´ avislosti ordin´ aln´ıch veliˇ cin 12 r˚ uzn´ ych softwarov´ ych firem nab´ız´ı speci´aln´ı programov´e vybaven´ı pro veden´ı u ´ˇcetnictv´ı. Jednotliv´e programy byly posouzeny odbornou komis´ı sloˇzenou z poˇc´ıtaˇcov´ ych odborn´ık˚ u a komis´ı sloˇzenou z profesion´aln´ıch ´ u ´ˇcetn´ıch. Ukolem bylo doporuˇcit vhodn´ y program na z´akladˇe stanoven´ı poˇrad´ı jednotliv´ ych program˚ u. V´ ysledky posouzen´ı: Produkt firmy ˇc´ıslo 1 Poˇrad´ı dle odborn´ık˚ u 6 Poˇrad´ı dle u ´ˇcetn´ıch 4
2 7 5
3 1 2
4 5 6 7 8 8 4 2.5 9 12 10 6 1 7 11
9 10 8
10 11 2.5 5 3 12
12 11 9
Vypoˇctˇete Spearman˚ uv koeficient poˇradov´e korelace a na hladinˇe v´ yznamnosti α = 0.05 testujte hypot´ezu, ˇze hodnocen´ı obou komis´ı jsou nez´avisl´a. Pˇ r´ıklad ˇ c.2: Bylo sledov´ano 10 ˇza´k˚ u. Na z´akladˇe psychologick´eho vyˇsetˇren´ı byli tito ˇza´ci seˇrazeni podle nervov´e lability (ˇc´ım byl ˇza´k labilnˇejˇs´ı, t´ım dostal vyˇsˇs´ı poˇrad´ı Ri ). Kromˇe toho sledov´an´ı ˇz´aci dostali poˇrad´ı Qi na z´akladˇe sv´ ych v´ ysledk˚ u v matematice (nejlepˇs´ı ˇza´k v matematice dostal poˇrad´ı 1). V´ ysledky jsou uvedeny v tabulce: Poˇrad´ı Ri Poˇrad´ı Qi
1 9
2 3
3 8
4 5
5 4
6 2
7 8 9 10 10 1 7 6
Vypoˇctˇete Spearman˚ uv koeficient poˇradov´e korelace a na hladinˇe v´ yznamnosti α = 0.05 testujte hypot´ezu, ˇze nervov´a labilita a v´ ysledky v matematice jsou nez´avisl´e. Pˇ r´ıklad ˇ c.3: Testov´ an´ı nez´ avislosti intervalov´ ych a pomˇ erov´ ych veliˇ cin Zjiˇst’ovalo se, kolik mg kyseliny ml´eˇcn´e je ve 100 ml krve matek prvorodiˇcek (veliˇcina X) a u jejich novorozenc˚ u (veliˇcina Y) tˇesnˇe po porodu. Byly z´ısk´any tyto v´ ysledky: ˇ ıslo matky C´ xi yi
1 40 33
2 64 46
3 34 23
4 15 12
5 57 56
6 45 40
Nakreslete dvourozmˇern´ y teˇckov´ y diagram, vypoˇctˇete v´ ybˇerov´ y korelaˇcn´ı koeficient, sestrojte 95 % interval spolehlivosti pro korelaˇcn´ı koeficient a na hladinˇe v´ yznamnosti α = 0.05 testujte hypot´ezu o nez´avislosti v´ ysledk˚ u obou mˇeˇren´ı.
23
Pˇ r´ıklad ˇ c.4: V n´ahodn´em v´ ybˇeru 10-ti dvouˇclenn´ ych dom´acnost´ı byl zjiˇst’ov´an mˇes´ıˇcn´ı pˇr´ıjem (veliˇcina X, v tis´ıc´ıch Kˇc) a vyd´an´ı za potraviny (veliˇcina Y, v tis´ıc´ıch Kˇc). xi yi
15 3
21 4.5
34 35 6.5 6
39 7
42 8
58 9
64 75 8 9.5
90 10.5
Vypoˇctˇete v´ ybˇerov´ y koeficient korelace. Na hladinˇe v´ yznamnosti 0.05 testujte hypot´ezu o nez´avislosti veliˇcin X, Y. Sestrojte 95 % asymptotick´ y interval spolehlivosti pro ρ. (Data jsou uloˇzena v souboru prijem vydani.sta). Pˇ r´ıklad ˇ c.5: Porovn´ an´ı dvou korelaˇ cn´ıch koeficient˚ u V psychologick´em v´ yzkumu bylo vyˇsetˇreno 426 hoch˚ u a 430 d´ıvek. Ve skupinˇe hoch˚ u ˇcinil v´ ybˇerov´ y koeficient korelace mezi verb´aln´ı a performaˇcn´ı sloˇzkou IQ 0.6033, ve skupinˇe d´ıvek ˇcinil 0.5833. Za pˇredpokladu dvourozmˇern´e normality dat testujte na hladinˇe v´ yznamnosti α = 0.05 hypot´ezu, ˇze korelaˇcn´ı koeficienty se neliˇs´ı. Pˇ r´ıkald ˇ c.6: Naˇctˇete datov´ y soubor IQ.sta. Za pˇredpokladu dvourozmˇern´e normality dat (orientaˇcnˇe ovˇeˇrte pomoc´ı dvourozmˇern´eho teˇckov´eho diagramu) testujte na hladinˇe v´ yznamnosti α = 0.1 hypot´ezu, ˇze korelaˇcn´ı koeficienty mezi verb´aln´ı a performaˇcn´ı sloˇzkou IQ jsou stejn´e u dˇet´ı z mˇesta a venkova.
24
14 - Porovn´ an´ı empirick´ eho a teoretick´ eho rozloˇ zen´ı Pˇ r´ıklad ˇ c.1: Ze souboru rodin s pˇeti dˇetmi bylo n´ahodnˇe vybr´ano 84 rodin a byl zjiˇst’ov´an poˇcet chlapc˚ u: Poˇcet chlapc˚ u 0 Poˇcet rodin 3
1 10
2 22
3 31
4 5 14 4
Na asymptotick´e hladinˇe v´ yznamnosti α = 0.05 testujte hypot´ezu, ˇze rozloˇzen´ı poˇctu chlapc˚ u se ˇr´ıd´ı binomick´ ym rozloˇzen´ım Bi(5; 0.5). Pˇ r´ıklad ˇ c.2: Jsou zn´amy poˇcty obˇcan˚ u mˇesta Brna podle mˇes´ıce narozen´ı (stav k 31.12.2001). mˇes´ıc narozen´ı poˇcet osob leden 32309 u ´nor 30126 bˇrezen 35010 duben 34761 kvˇeten 34955 ˇcerven 32883 ˇcervenec 33255 srpen 31604 z´aˇr´ı 31173 ˇr´ıjen 30536 listopad 28571 prosinec 29467 celkem 384650
Na asymptotick´e hladinˇe v´ yznamnosti α = 0.05 ovˇeˇrte hypot´ezu, ˇze rozloˇzen´ı porodnosti je bˇehem roku rovnomˇern´e. Poˇcty narozen´ ych lid´ı v jednotliv´ ych mˇes´ıc´ıch roku rovnˇeˇz zn´azornˇete graficky. Pˇ r´ıklad ˇ c.3: Firma, kter´a vlastn´ı nˇekolik supermarket˚ u, se zaj´ım´a, zda z´akazn´ıci d´avaj´ı pˇrednost nˇekter´emu dnu v t´ ydnu pro n´akup. N´ahodnˇe bylo vybr´ano 300 z´akazn´ık˚ u, kteˇr´ı mˇeli ˇr´ıci, kter´ y den v t´ ydnu nejˇcastˇeji nakupuj´ı v supermarketu. V´ ysledky jsou uvedeny v n´asleduj´ıc´ı tabulce: Den Poˇcet
pondˇel´ı u ´ter´ y 10 20
stˇreda ˇctvrtek 40 40
p´atek 80
sobota 60
nedˇele 50
Na asymptotick´e hladinˇe v´ yznamnosti α = 0.05 testujte hypot´ezu, ˇze ˇza´dn´ y den v t´ ydnu nem´a pˇri nakupov´an´ı v supermarketu pˇrednost pˇred jin´ ymi dny. Pˇ r´ıklad ˇ c.4: Do rybn´ıka bylo um´ıstˇeno 5 past´ı, pˇriˇcemˇz kaˇzd´a past sv´ıtila jin´ ym svˇetlem (b´ıl´ ym, ˇzlut´ ym, modr´ ym, zelen´ ym, ˇcerven´ ym). Do tˇechto past´ı se chytilo 56, 72, 41, 53 a 38 jedinc˚ u. Na asymptotick´e hladinˇe v´ yznamnosti α = 0.05 testujte hypot´ezu, ˇze barva svˇetla v pasti nem´a vliv na poˇcet chycen´ ych jedinc˚ u. 25