Testov´an´ı hypot´ez – motivaˇcn´ı pˇr´ıklad Matematick´ a statistika
Matematick´ a statistika
Opakov´ an´ı
Opakov´ an´ı
Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
Matematick´a statistika
Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test
P´ arov´ y t-test
Dvouv´ ybˇ erov´ y t-test
Dvouv´ ybˇ erov´ y t-test
ˇarka Hudecov´ S´ a
mˇes´ıˇcn´ı plat ˇzen X 35 = 20 685.5 Kˇc mˇes´ıˇcn´ı plat muˇz˚ u Y 65 = 21 364.4 Kˇc
letn´ı semestr 20121
lze z tˇechto v´ysledk˚ u usuzovat, ˇze muˇzi maj´ı (v dan´e firmˇe) obecnˇe vyˇsˇs´ı platy neˇz ˇzeny?
Zaloˇzeno na materi´ alech doc. Michala Kulicha
Testov´an´ı hypot´ez – motovaˇcn´ı pˇr´ıklad Matematick´ a statistika
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
firma provedla ˇsetˇren´ı s c´ılem zjistit, zda doch´ az´ı k platov´e diskriminaci ˇzen do studie zahrnuto 100 n´ ahodnˇe vybran´ych zamˇestnanc˚ u, z toho 35 ˇzen a 65 muˇz˚ u
Katedra pravdˇ epodobnosti a matematick´ e statistiky Matematicko-fyzik´ aln´ı fakulta Univerzity Karlovy
1
Pˇr´ıklad (Platov´a diskriminace)
Testov´an´ı hypot´ez Matematick´ a statistika
Ot´ azka: Maj´ı muˇ zi vyˇsˇs´ı pˇr´ıjem neˇ zˇ zeny? pˇresnˇejˇs´ı formulace zaj´ım´ a n´ as zˇrejmˇe porovn´an´ı u muˇz˚ u a ˇzen, E X a E Y stˇredn´ıch hodnot plat˚ porovn´ an´ı X a Y n´ahodn´e veliˇciny jin´y n´ahodn´y v´ybˇer by zahrnul jin´ych 100 zamˇestnanc˚ u dostali bychom odliˇsn´e v´ybˇerov´e pr˚ umˇery X a Y
Je rozd´ıl Y − X = 678.9 > 0 Kˇc dostateˇcnˇe pr˚ ukazn´y na to, abychom mohli tvrdit, ˇze muˇzi maj´ı (v dan´e firmˇe) obecnˇe vyˇsˇs´ı platy neˇz ˇzeny? Nebo je to jen vliv n´ahody?
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
Testov´ an´ı hypot´ ez = vyhodnocov´an´ı pravdivostn´ı hodnoty v´yrok˚ u na z´ akladˇe n´ahodn´eho v´ybˇeru (tj. ovˇeˇrov´an´ı platnosti nˇejak´eho v´yroku) − prov´ad´ıme pomoc´ı statistick´ych test˚ u Hypot´ eza = v´yrok, o jehoˇz pravdivosti chceme rozhodnout nulov´ a hypot´ eza H0 tvrzen´ı o populaci, o jehoˇz platnosti rozhodujeme (nen´ı rozd´ıl, nez´avis´ı, neliˇs´ı se, . . . )
alternativn´ı hypot´ eza H1 : alternativa (doplˇnuj´ıc´ı moˇznost) k H0 ˇcasto tvrzen´ı, kter´e chceme prok´azat
Statistick´y test Matematick´ a statistika
Matematick´ a statistika
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
Chyba I. a II. druhu
Opakov´ an´ı
Statistick´ y test = rozhodovac´ı pravidlo, na jehoˇz z´akladˇe zam´ıt´ ame nebo nezam´ıt´ ame H0 testov´ a statistika Tn = Tn (X1 , . . . , Xn ) = n´ahodn´a veliˇcina, kter´ a je funkc´ı pozorov´ an´ı X1 , . . . , Xn
Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
rozhodujeme na z´ akladˇe n´ ahodn´eho v´ybˇeru nem˚ uˇzeme testovanou ot´azku zodpovˇedˇet s absolutn´ı jistotou m˚ uˇzeme se dopustit chyby tyto chyby se budeme snaˇzit omezit (resp. kontrolovat jejich pravdˇepodobnosti)
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
kritick´y obor C = moˇzn´e v´ysledky pokusu, kdy H0 zam´ıt´ ame
H0 zam´ıt´ ame H0 plat´ı chyba 1. druhu H0 neplat´ı OK
H0 nezam´ıt´ ame OK chyba 2. druhu
Oznaˇc´ıme: α = P(chyba 1. druhu) = P(zam´ıt´ ame H0 | H0 plat´ı)
β = P(chyba 2. druhu) = P(nezam´ıt´ ame H0 | H0 neplat´ı)
Pˇrirozen´y poˇzadavek: α, β → min ! bohuˇzel nelze souˇcasnˇe
Chyba I. a II. druhu Matematick´ a statistika
Dosaˇzen´a hladina testu Matematick´ a statistika
zvol´ıme hladinu testu α (zpravidla α = 0.05) Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
maxim´aln´ı dovolen´a pst chyby 1. druhu maxim´aln´ı pst faleˇsn´eho prok´az´an´ı vˇedeck´e hypot´ezy vol´ıme pˇred pokusem, nez´avisle na jeho v´ysledku
pro dan´e α chceme minim´ aln´ı β ! maxim´aln´ı 1 − β s´ıla testu 1 − β
pst zam´ıtnut´ı neplatn´e H0 pst, s jakou prok´aˇzeme platnou vˇedeckou hypot´ezu H1 nem´ame pod kontrolou (z´avis´ı na tom, co opravdu plat´ı) m˚ uˇzeme ovlivnit volbou statistick´eho testu, poˇctem pozorov´an´ı, . . .
α m´ ame plnˇe pod kontrolou, o β toho moc nev´ıme (chyba avaˇznˇejˇs´ı) 1. druhu je z´
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
Dosaˇ zen´ a hladina testu p-hodnota (angl. p-value) pravdˇepodobnost, ˇze dostaneme v´ysledek, kter´y stejnˇe nebo jeˇstˇe m´enˇe podporuje H0 , jestliˇze H0 plat´ı nejmenˇs´ı hladina α, na kter´e lze jeˇstˇe H0 zam´ıtnout stupeˇ n d˚ uvˇery“ v platnost H0 ” v´ysledek proveden´ı statistick´eho testu pomoc´ı softwaru Pravidlo: je-li p ≤ α je-li p > α
zam´ıt´ ame H0 nezam´ıt´ ame H0
(Zapamatovat!)
Nesymetrie H0 a H1 Matematick´ a statistika
Opakov´an´ı
H0 a H1 nejsou posuzov´ any symetricky:
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
Matematick´ a statistika
H0 povaˇzujeme a priori za platnou a zam´ıt´ame ji jen tehdy, pokud k tomu m´ ame dostateˇcnˇe siln´e d˚ uvody
Opakov´ an´ı
pokud jsme zam´ıtli H0 m˚ uˇzeme tvrdit, ˇze data svˇedˇc´ı o tom, ˇze H0 neplat´ı (a prokazujeme platnost H1 ) pokud jsme H0 nezam´ıtli pak
P´ arov´ y t-test
Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
Dvouv´ ybˇ erov´ y t-test
bud’ H0 opravdu plat´ı anebo H0 neplat´ı, ale data neposkytuj´ı dostateˇcn´e d˚ ukazy“ k jej´ımu zam´ıtnut´ı (mal´a s´ıla testu) ”
Minule: filozofie testov´an´ı hypot´ez testy stˇredn´ı hodnoty v norm´ aln´ım rozdˇelen´ı (pˇri zn´ am´em a nezn´am´em σ 2 ) spec. jednov´ybˇerov´y t-test Studentovo t-rozdˇelen´ı
intervalov´e odhady
nutn´e volit opatrn´e formulace z´ avˇer˚ u (hypot´ezu H0 nelze na z´ akladˇe naˇsich dat zam´ıtnout apod.) Z´ avˇer Hypot´ezu H0 nem˚ uˇzeme prok´ azat, ale pouze vyvr´atit
Opakov´an´ı: Jednov´ybˇerov´y t-test: Matematick´ a statistika
Situace: X1 , . . . , Xn n´ ahodn´y v´ybˇer z norm´ aln´ıho rozdˇelen´ı N(µ, σ 2 ), kde σ 2 nezn´ ame. Chceme testovat
Opakov´ an´ı
Matematick´ a statistika
Opakov´ an´ı
Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test
Pˇr´ıklad
H0 : µ = µ0
Pˇr´ıklad Prov´ad´ıme pr˚ uzkum, jak´y skuteˇcn´y objem piva toˇc´ı v nejmenovan´e hospodˇe. Zakoupeno bylo 10 piv a jejich objem byl (v litrech):
P´ arov´ y t-test
proti
Dvouv´ ybˇ erov´ y t-test
Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
H1 : µ 6= µ0 Testov´ a statistika Tn =
√ X − µ0 n Sn
m´ a tn−1 rozdˇelen´ı. Test: je-li |Tn | > tn−1 (1 − α2 ), pak zam´ıt´ ame H0 . Jin´e moˇzn´e altervativy: H1 : µ < µ0 nebo H1 : µ > µ0 modifikace testu
Dvouv´ ybˇ erov´ y t-test
0.510, 0.462, 0.491, 0.466, 0.461, 0.503, 0.495, 0.488, 0.512, 0.505.
Z pohledu z´akazn´ıka bychom chtˇeli otestovat, zda hostinsk´y netoˇc´ı pod m´ıru. Model: Pˇredpokl´adejme, ˇze dat˚ um odpov´ıdaj´ı nez´ avisl´e n´ahodn´e veliˇciny s norm´ aln´ım rozdˇelen´ım N(µ, σ 2 ) Hypot´ ezy: H0 : µ = 0.5 proti H1 : µ < 0.5
Pˇr´ıklad – pokraˇc.
Pˇr´ıklad – v´ypoˇcet v programu R
Matematick´ a statistika
Matematick´ a statistika
spoˇcteme X = 0.4893,
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
S = 0.0197.
odtud
P´ arov´ y t-test
Tn =
Dvouv´ ybˇ erov´ y t-test
√ X − 0.5 √ 0.4893 − 0.5 n = 10 = −1.7148 S 0.0197
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
H0 zam´ıt´ ame, pokud Tn < −t9 (0.95) = −1.833 H0 nelze na hladinˇe v´yznamnosti 5 % nerovnost neplat´ı zam´ıtnout nelze prok´ azat, ˇze by hostinsk´y toˇcil pivo pod m´ıru (bud’ skuteˇcnˇe pod m´ıru netoˇc´ı nebo tak m´alo, ˇze tuto odchylku nem˚ uˇzeme na z´ akladˇe naˇsich dat prok´azat)
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
na kaˇzd´em subjektu mˇeˇr´ımˇe dvˇe veliˇciny ot´ azka: Maj´ı tyto dvˇe veliˇciny stejnou stˇredn´ı hodnotu? Neboli, jsou co do polohy stejn´e? Pˇr´ıklad Vˇek rodiˇc˚ u: Jsou otcov´e starˇs´ı neˇz matky? ´ cinnost redukˇcn´ı diety: Je hmotnost po dietˇe niˇzˇs´ı neˇz Uˇ pˇred n´ı? ´ eˇsnost reklamn´ı kampanˇe: Je prodejnost v´yrobku vyˇsˇs´ı Uspˇ po kampani neˇz pˇred n´ı? Jsou dvojˇcata stejnˇe inteligentn´ı? ...
t = -1.7148, df = 9, p-value = 0.06026 alternative hypothesis: true mean is less than 0.5 95 percent confidence interval: −Inf 0.5007382 sample estimates: mean of x 0.4893
p-hodnota < 0.05
Probl´em Matematick´ a statistika
>t.test(pivo,mu=0.5,alternative=‘‘less‘‘) One Sample t-test data: pivo
nezam´ıt´ ame H0 na hladinˇe 5 %
Matematick´y z´apis Matematick´ a statistika
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
p´arov´a pozorov´ an´ı (X1 , Y1 ), . . . , (Xn , Yn ) nez´avisl´e dvojice n´ ahodn´ych veliˇcin n´ahodn´y v´ybˇer z dvourozmˇern´eho rozdˇelen´ı
P´ arov´ y t-test
Xi a Yi mˇeˇreny na stejn´em subjektu i
Dvouv´ ybˇ erov´ y t-test
pˇr´ıklady: vˇek matky a vˇek otce, hmotnost pˇred a po redukˇcn´ı dietˇe, . . . µX = E X i , µY = E Y i
chceme otestovat hypot´ezu
H0 : µX = µY proti H1 : µX 6= µY . (pˇr´ıp. proti jednostrann´ym H1 )
P´arov´y t-test
P´arov´y t-test
Matematick´ a statistika
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
Matematick´ a statistika
Idea:
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
zavedeme Zi = Xi − Yi rozd´ıly (napˇr. rozd´ıl vˇeku rodiˇc˚ u)
P´ arov´ y t-test
pˇredpoklad Z1 , . . . , Zn stejn´e rozdˇelen´ı ! norm´aln´ı zjevnˇe µZ = µX − µY , a proto H0 : µX = µY plat´ı
Dvouv´ ybˇ erov´ y t-test
definujeme Zi = Xi − Yi , i = 1, . . . , n
pˇredpokl´ad´ame, ˇze Z1 , . . . , ZN n´ ahodn´y v´ybˇer z N(µZ , σ 2 ) test
H0 : µZ = 0
proti
H1 : µZ 6= 0
jednov´ybˇerov´y t-test: spoˇcteme Z odhad µZ , S 2 odhad σ 2 testov´a statistika Tn =
⇔ plat´ı µZ = 0
√ Z √ X −Y n = n S S
H0 zam´ıt´ame
stˇredn´ı hodnota Xi a Yi je stejn´ a ⇔ Xi kol´ısaj´ı kolem nuly u ´loha pˇrevedena na jednov´ybˇerov´y test
ve prospˇech H1 : µ 6= 0, pokud |Tn | > tn−1 (1 − α/2) ve prospˇech H1 : µ > 0, pokud Tn > tn−1 (1 − α)
ve prospˇech H1 : µ < 0, pokud Tn < −tn−1 (1 − α)
P´arov´y t-test: Pozn´amky Matematick´ a statistika
Pˇr´ıklad — vˇek otce vs. vˇek matky Matematick´ a statistika
Obecnˇ ejˇs´ı hypot´ ezy: Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
lze testovat obecnˇeji H0 : µX − µY = δ √ Zn − δ testov´ a statistika: Tn = n S Poruˇsen´ı pˇredpoklad˚ u: test dodrˇzuje poˇzadovanou hladinu α, pokud Zi maj´ı norm´aln´ı rozdˇelen´ı, nebo poˇcet pozorovan´ych dvojic n je dost velk´y (n > 50)
jestliˇze normalitu nelze pˇredpokl´ adat je-li n dost velk´e lze p´arov´y t-test je-li n mal´e p´arov´y test m˚ uˇze d´avat nespr´avn´e v´ysledky nutn´e pouˇz´ıt jin´y postup (Wilcoxon˚ uv p´arov´y test)
Ot´ azka: Jsou otcov´e student˚ u vyˇsˇs´ı neˇz matky student˚ u? Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
n = 256 student˚ u z let 2006 – 2011 matky
vˇek otce a vˇek
X - vˇek otce, Y - vˇek matky, Z = X − Y rozd´ıl vˇek˚ u
test H0 : µZ = 0 proti H1 : µZ > 0 na hladinˇe α = 0.05 vypoˇcteme X = 48.88, Y = 46.60, Z = 2.28, S = 4.12 testov´a statistika Tn =
√
256
2.28 = 8.85 4.12
kritick´a hodnota t255 (0.95) = 1.65
Pˇr´ıklad — vˇek otce vs. vˇek matky Matematick´ a statistika
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
Pˇr´ıklad – Vˇek otce vs. vˇek matky Matematick´ a statistika
Tn = 8, 85 > t255 (0.95) = 1.65 ⇒ zam´ıt´ame hypot´ezu H0 : µX = µY ve prospˇech H1 : µX > µY p-hodnota < 10−16 Z´ avˇer: Prok´ azali jsme, ˇze stˇredn´ı vˇek otc˚ u je statisticky v´yznamnˇe vyˇsˇs´ı neˇz stˇredn´ı vˇek matek
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
Ot´ azka: Je stˇredn´ı hodnota vˇeku otce pˇresnˇe o dva roky vyˇsˇs´ı neˇz stˇredn´ı hodnota vˇeku matky? nyn´ı test H0 : µZ = 2 proti H0 : µZ 6= 0 testov´a statistika:
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
Tn =
√
256
2.28 − 2 = 1.078 4.12
kritick´a hodnota t255 (0.975) = 1.970
Ovˇ eˇren´ı pˇredpokladu normality:
neplat´ı |Tn | > 1.97 (p-hodnota 0.282)
graficky— histogram, QQ graf Shapir˚ uv-Wilk˚ uv test: p-hodnota 6 · 10−14
nelze zam´ıtnout H0
Z´avˇer: Stˇredn´ı vˇek otc˚ u je bud’ pˇresnˇe o dva roky vyˇsˇs´ı neˇz stˇredn´ı vˇek matek anebo je rozd´ıl stˇredn´ıho vˇeku tak bl´ızko 2 rok˚ um, ˇze odchylku od 2 let na z´ akladˇe nasb´ıran´ych dat nedok´aˇzeme rozpoznat.
normalitu dat nelze pˇredpokl´ adat; nicm´enˇe n dostateˇcnˇe vysok´e p´ arov´y t-test lze pouˇz´ıt
Pˇr´ıklad – Vˇek otce vs. vˇek matky Matematick´ a statistika
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
Matematick´ a statistika
95 % intervalov´y odhad rozd´ılu vˇeku rodiˇc˚ u: obecn´y vzorec S S Z − √ tn−1 (1 − α/2), Z + √ tn−1 (1 − α/2) n n dosad´ıme: (1.771, 2.784) interval, kter´y s pravdˇepodobnost´ı 95 % pokryje skuteˇcn´y rozd´ıl stˇredn´ıch hodnot vˇeku rodiˇc˚ u hodnota 2 leˇz´ı v tomto intervalu
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
ˇ sen´ı v programu R: Reˇ > t.test(vek.otce,vek.matky,mu=2,paired=T) Paired t-test data: vek.otce and vek.matky t = 1.0782, df = 255, p-value = 0.282 alternative hypothesis: true difference in means is not equal to 2 95 percent confidence interval: 1.770783 2.783904 sample estimates: mean of the differences 2.277344
Dvouv´ybˇerov´y probl´em Matematick´ a statistika
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
Matematick´y z´apis
jedna veliˇcina mˇeˇren´ a ve dvou nez´ avisl´ych skupin´ach m nez´ avisl´ych pozorov´ an´ı Xi a n nez´ avisl´ych pozorov´an´ı Yj navz´ ajem nez´ avisl´e zaj´ım´ a n´ as porovn´ an´ı jejich stˇredn´ıch hodnot Pˇr´ıklad
Matematick´ a statistika
Model: Opakov´ an´ı
P´ arov´ y t-test
dva nez´avisl´e n´ ahodn´e v´ybˇery X1 , . . . , Xm z norm´ aln´ıho rozdˇelen´ı N(µX , σX2 ) Y1 , . . . , Yn z norm´ aln´ıho rozdˇelen´ı N(µY , σY2 )
Dvouv´ ybˇ erov´ y t-test
pˇredpoklad: shodn´e rozptyly σX2 = σY2
Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
Chceme otestovat
v´yˇska muˇz˚ u a ˇzen ! jsou muˇzi vyˇsˇs´ı neˇz ˇzeny? (je v jejich pr˚ umˇern´e v´yˇsce systematick´y rozd´ıl?)
H0 : µX = µY proti H1 : µX 6= µY
plat muˇz˚ u a ˇzen ! je plat muˇz˚ u stejn´y jako plat ˇzen? (je v platech muˇz˚ u a ˇzen rozd´ıl, kter´y se projevuje ve stˇredn´ı hodnotˇe?)
(resp. proti jednostrann´ym alternativ´ am) dvouv´ybˇerov´y t-test
liˇs´ı se v´yˇse cholesterolu u kuˇr´ ak˚ u a nekuˇr´ak˚ u?
Dvouv´ybˇerov´y t-test: odvozen´ı Matematick´ a statistika
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
Matematick´ a statistika
Idea: porovn´ ame pr˚ umˇery X a Y velk´y rozd´ıl zam´ıtnut´ı hypot´ezy H0 je tˇreba br´ at v u ´vahu tak´e rozsahy v´ybˇer˚ u a rozptyl
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
Dvouv´ybˇerov´y t-test: odvozen´ı
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
Spoleˇ cn´ y odhad rozptylu: um´ıme odhadnout σ 2 z kaˇzd´eho v´ybˇeru zvl´ aˇst’ pomoc´ı v´ybˇerov´ych rozptyl˚ u m
P´ arov´ y t-test
T =
X −Y = S.E.(X − Y )
r
mn X m − Y n , m+n S
kde S je spoleˇcn´y odhad rozptylu σ 2 spoˇc´ıtan´y z obou v´ybˇer˚ u S2 =
SX2 =
Dvouv´ ybˇ erov´ y t-test
Testov´ a statistika:
1 (m − 1)SX2 + (n − 1)SY2 m+n−2
SY2 =
1 X (Xi − X m )2 m−1 1 n−1
i =1 n X i =1
(Yi − Y n )2
vezmeme v´aˇzen´y pr˚ umˇer 2 Sm,n =
1 (m − 1)SX2 + (n − 1)SY2 m+n−2
Rozdˇelen´ı testov´e statistiky Matematick´ a statistika
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
Dvouv´ybˇerov´y t-test: Matematick´ a statistika
Model:
Opakov´ an´ı
dva nez´ avisl´e n´ ahodn´e v´ybˇery X1 , . . . , Xm z norm´ aln´ıho rozdˇelen´ı N(µX , σX2 ) Y1 , . . . , Yn z norm´ aln´ıho rozdˇelen´ı N(µY , σY2 ) shodn´e rozptyly σX2 = σY2
Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
Pak za H0 : µX = µY m´ a testov´ a statistika r mn X m − Y n , T = m+n S
lze obecnˇejˇs´ı hypot´eza H0 : µX − µY = δ testov´ a statistika r mn X m − Y n − δ T = m+n S
Ovˇeˇren´ı pˇredpoklad˚ u
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
Pˇr´ıklad – plat Matematick´ a statistika
Normalita ovˇeˇren´ı normality pro kaˇzd´y v´ybˇer zvl´ aˇst’ pro velk´ a n, m poruˇsen´ı normality velmi nevad´ı Shoda rozptyl˚ u
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test
SX2 a SY2 podobn´e F-test shody rozptyl˚ u pochyby o shodˇe
zam´ıt´ame-li H0 , ˇr´ık´ame, ˇze rozd´ıl ve v´ybˇerov´ych pr˚ umˇerech je statisticky v´yznamn´y Pozn´ amka
tm+n−2 rozdˇelen´ı, tj. t-rozdˇelen´ı s m + n − 2 stupni volnosti.
Matematick´ a statistika
H0 : µX = µY zam´ıt´ ame ve prospˇech alternativy H1 : µX 6= µY kdyˇz |T | > tm+n−2 1 − α2 H1 : µX > µY kdyˇz T > tm+n−2 1 − α H1 : µX < µY kdyˇz T < −tm+n−2 1 − α
H0 : σX2 = σY2 proti H1 : σX2 6= σY2
Welsch˚ uv test (modifikace t-testu)
Probl´ em: Je plat muˇz˚ u vyˇsˇs´ı neˇz plat ˇzen? 100 n´ahodnˇe vybran´ych zamˇestnanc˚ u X – plat ˇzen, Y – plat muˇz˚ u
Dvouv´ ybˇ erov´ y t-test
ˇzeny muˇzi
rozsah 35 65
pr˚ umˇer 20 686 21 364
smˇer. odchylka 5 180 4 334
Welsch˚ uv test: model: nez´ avisl´e v´ybˇery X1 , . . . , Xm z norm´aln´ıho rozdˇelen´ı aln´ıho rozdˇelen´ı N(µY , σY2 ) N(µX , σX2 ) a Y1 , . . . , Yn z norm´
mˇes´ıˇcn´ı plat v Kˇc
35 ˇzen a 65 muˇz˚ u
Pˇredpoklady: normalita muˇzi
p-hodnota 0.134
stejn´ a testov´ a statistika T
normalita ˇzeny
p-hodnota 0.310
T jiˇz nem´ a rozdˇelen´ı tm+n−2
test shody rozptyl˚ u
p-hodnota 0.218
Pˇr´ıklad – grafick´e zn´azornˇen´ı
Pˇr´ıklad – pˇredpoklady
Matematick´ a statistika
Matematick´ a statistika
10000
15000
20000
zena
25000
30000
muz
25
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
25000
P´ arov´ y t-test
10
5
Dvouv´ ybˇ erov´ y t-test
0 10000
15000
20000
25000
Plat
−2
−1
0
1
Theoretical Quantiles
Pˇr´ıklad – ˇreˇsen´ı Matematick´ a statistika
Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
25000
Sample Quantiles
15000
Pohlavi
20000
25000 10000
muz
30000
30000
Q−Q graf
20000
Sample Quantiles
10000
zena
Opakov´ an´ı
30000
Q−Q graf
15000
Plat
15
20000
Dvouv´ ybˇ erov´ y t-test
20
15000
Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test
Percent of Total
30000
Opakov´ an´ı
2
−2
−1
0
1
2
Theoretical Quantiles
Pˇr´ıklad – ˇreˇsen´ı Matematick´ a statistika
H0 : µX = µY proti H1 : µX < µY spoleˇcn´y odhad rozptylu S2 =
65 − 1 35 − 1 43342 + 51802 = 23 797 116 35 + 65 − 1 35 + 65 − 1
testov´ a statistika r 35 · 65 20686 − 21364 · √ = −0.700 T = 100 23 797 116 kritick´ a hodnota −t98 (0.95) = −1.661
na z´ akladˇe naˇsich dat nelze zam´ıtnout H0
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
ˇ sen´ı v programu R: Reˇ > t.test(zeny,muzi,var.equal=T,alternative=‘‘less‘‘) Two Sample t-test data: zeny and muzi t = -0.6971, df = 98, p-value = 0.2437 alternative hypothesis: true difference in means is less than 0 95 percent confidence interval: -Inf 938.2113 sample estimates: mean of x mean of y 20685.51 21364.37
Shrnut´ı Matematick´ a statistika
Testy o stˇredn´ı hodnotˇ e 1 jeden v´ ybˇer jednov´ybˇerov´y t-test normalita (nen´ı nezbytn´e pˇri dostateˇcnˇe velk´em rozsahu v´ybˇeru)
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test
Poruˇsen´ı normality
2
Dvouv´ ybˇ erov´ y t-test
p´ arov´ a pozorov´ an´ı p´arov´y t-test normalita rozd´ılu (nen´ı nezbytn´e pˇri dostateˇcnˇe velk´em rozsahu v´ybˇeru)
3
dva nez´ avisl´e v´ybˇery dvouv´ybˇerov´y t-test nez´avislost normalita (nen´ı nezbytn´e pˇri dostateˇcnˇe velk´em rozsahu v´ybˇeru) shoda rozptyl˚ u (neplat´ı-li pouˇz´ıt Welsh˚ uv test)
Matematick´ a statistika
Opakov´ an´ı Testov´ an´ı hypot´ ez Jednov´ ybˇ erov´ y t-test
P´ arov´ y t-test Dvouv´ ybˇ erov´ y t-test
Jestliˇze nelze normalitu pˇredpokl´ adat a rozsah v´ybˇeru je mal´y nutn´e pouˇz´ıt jin´e testy, kter´e pˇredpoklad normality nepotˇrebuj´ı neparametrick´e testy zaloˇzeny na poˇrad´ı
poˇradov´e testy
Uvedeme si jednov´ybˇerov´y Wilcoxon˚ uv test dvouv´ybˇerov´y Wilcoxon˚ uv test