Aproximace binomick´eho rozdˇelen´ı norm´aln´ım
Aproximace binomick´ eho rozdˇ elen´ı norm´ aln´ım
Pˇr´ıklad Sybilla a Kassandra tvrd´ı, ˇze maj´ı telepatick´e schopnosti, a chtˇej´ı to dok´azat n´asleduj´ıc´ım pokusem: V jedn´e m´ıstnosti Sybille uk´aˇzou kartu jedn´e z pˇeti barev a ve druh´e m´ıstnosti Kassandra ˇrekne, jakou barvu Sybilla pr´avˇe vidˇela. Takto postupnˇe Sybille uk´aˇzou 100 karet. Jestliˇze Kassandra ve skuteˇcnosti barvy h´ad´a jen n´ahodnˇe, jak´a je pravdˇepodobnost, ˇze barvu spr´avnˇe urˇc´ı alespoˇ n v 25 pˇr´ıpadech? V´ypoˇcet je velmi pracn´y.
Aproximace binomick´ eho rozdˇ elen´ı norm´ aln´ım
Graf pravdˇepodobnostn´ı funkce Binomicke rozdeleni n = 100, p = 0.2 0.12
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
25
30
35
40
Aproximace binomick´ eho rozdˇ elen´ı norm´ aln´ım
Moivre-Laplaceova vˇeta Jestliˇze X je n´ahodn´a veliˇcina s binomick´ym rozdˇelen´ım, X ∼ Bi(n, p), n je velk´e a p nen´ı pˇr´ıliˇs bl´ızk´e nule ani jedniˇcce, pak X lze aproximovat norm´aln´ım rozdˇelen´ım se stejnou stˇredn´ı hodnotou a rozptylem, jako mˇelo p˚ uvodn´ı binomick´e rozdˇelen´ı: X ∼ Bi(n, p)
⇒
pˇribliˇznˇe X ∼ No(µ, σ 2 ),
kde µ = n · p, . P(a < X < b) = P
σ 2 = n · p · (1 − p),
a−µ b−µ
Aproximace binomick´ eho rozdˇ elen´ı norm´ aln´ım
Kdy lze aproximaci pouˇz´ıt – empirick´a podm´ınka Aproximace je dobr´a, je-li n · p > 5 a souˇcasnˇe n · (1 − p) > 5. Jin´a podm´ınka: n · p · (1 − p) > 9
Aproximace binomick´ eho rozdˇ elen´ı norm´ aln´ım
Pˇr´ıpad, kdy n je mal´e
Geometrick´y v´yznam P(1 ≤ X ≤ 2)
0.45 0.4
0.45
0.35
0.4
0.3
0.35
0.25
0.3
0.2
0.25
0.15
0.2
0.1
0.15
0.05
0.1
0
0.05 0
1
2
3
0 1
Obyˇcejn´a“ aproximace ” 0.45
2
Lepˇs´ı aproximace 0.45
0.4
0.4
0.35
0.35
0.3
0.3
0.25
0.25
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
0
0 1
2
1
2
Aproximace binomick´ eho rozdˇ elen´ı norm´ aln´ım
Aproximace s korekc´ı Lepˇs´ı v´ysledky d´av´a aproximace s korekc´ı: Jestliˇze a, b jsou cel´a ˇc´ısla a X ∼ Bi(n, p), pak . P(a ≤ X ≤ b) = P(a − 0,5 < X < b + 0,5) = b + 0,5 − µ a − 0,5 − µ Φ −Φ . σ σ
Aproximace binomick´ eho rozdˇ elen´ı norm´ aln´ım
Pˇr´ıklad (pokraˇcov´an´ı) Vypoˇctˇete pravdˇepodobnost z pˇredchoz´ıho pˇr´ıkladu pomoc´ı aproximace norm´aln´ım rozdˇelen´ım a) obyˇcejnˇe“, bez korekce, ” b) s korekc´ı.
Testov´an´ı hypot´ez
Testov´ an´ı hypot´ ez
Pˇr´ıklad Hladina jist´e l´atky v krvi tr´enovan´ych lid´ı m´a norm´aln´ı rozdˇelen´ı se stˇredn´ı hodnotou µ = 20, σ 2 = 9. V´ıme, ˇze doping zvyˇsuje hladinu t´eto l´atky. Urˇcit´emu sportovci bylo namˇeˇreno 25 jednotek. Je tato hodnota v´yznamnˇe vyˇsˇs´ı, neˇz by se u obyˇcejn´eho“ ” sportovce ˇcekalo? Nebo je tento v´ysledek jeˇstˇe v normˇe“? ”
Testov´ an´ı hypot´ ez
ˇ sen´ı Reˇ Co to znamen´a v´yznamnˇe vyˇsˇs´ı“? – Stanov´ıme hladinu ” v´yznamnosti testu, napˇr. α = 0,05. Pro zaˇc´atek pˇredpokl´ad´ame, ˇze plat´ı tzv. nulov´a hypot´eza, v naˇsem pˇr´ıpadˇe, ˇze sportovec nedopoval. Alternativn´ı hypot´eza je, ˇze sportovec dopoval. Najdeme tzv. kritickou hodnotu Tk – hranici pro hladinu on´e l´atky, kter´a bude pˇrekroˇcena jen v α · 100 % = 5 % pˇr´ıpad˚ u: P(X > Tk ) = α Vyˇslo Tk = 24,95. Je namˇeˇren´a hodnota vyˇsˇs´ı neˇz kritick´a? Ano, 25 > 24,95 ⇒ v´ysledek nen´ı v normˇe, sportovec dopoval, nulovou hypot´ezu zam´ıt´ame.
Testov´ an´ı hypot´ ez
Obecn´y postup pˇri testov´an´ı hypot´ez I
Vyslov´ıme nulovou hypot´ezu H0 a alternativn´ı hypot´ezu H1 .
I
Zvol´ıme testov´e krit´erium. Pˇredpokl´ad´ame, ˇze plat´ı H0 . Za tohoto pˇredpokladu zn´ame rozdˇelen´ı testov´eho krit´eria.
I
Najdeme kritick´y obor pro testov´e krit´erium - mnoˇzinu (interval), do kter´eho padne jen s pravdˇepodobnost´ı α.
I
Leˇz´ı hodnota testov´eho krit´eria v kritick´em oboru? Pokud ano, nulovou hypot´ezu H0 zam´ıt´ame. Hypot´eza H1 byla testem prok´az´ana. Pokud ne, nulovou hypot´ezu H0 nezam´ıt´ame. Hypot´eza H1 nebyla prok´az´ana.
Testov´ an´ı hypot´ ez
Moˇzn´e v´ysledky testov´an´ı PP PP Skuteˇcnost PP PP Rozhodnut´ı P
H0 nezam´ıt´ame H0 zam´ıt´ame
H0 plat´ı spr´avnˇe chyba 1. druhu
H0 neplat´ı chyba 2. druhu spr´avnˇe
Pravdˇepodobnost chyby 1. druhu je α. Pravdˇepodobnost chyby 2. druhu znaˇc´ıme β. ˇ ım vˇetˇs´ı je α, t´ım je β menˇs´ı a naopak. C´
S´ıla testu S´ıla testu je pravdˇepodobnost, ˇze spr´avnˇe zam´ıtneme H0 , kdyˇz ve skuteˇcnosti plat´ı H1 . S´ıla testu = 1 − β.
Testov´ an´ı hypot´ ez
Pˇr´ıklad Stanovte s´ılu testu z pˇredchoz´ıho pˇr´ıkladu, v´ıme-li, ˇze hladina zkouman´e l´atky v krvi dopuj´ıc´ıch sportovc˚ u m´a norm´aln´ı rozdˇelen´ı s µ = 24, σ 2 = 4.
Testov´ an´ı hypot´ ez
Jednostrann´e a oboustrann´e testy Nulov´a hypot´eza b´yv´a zpravidla typu urˇcit´y parametr = urˇcit´a ” hodnota“. Je-li napˇr. H0 : µ = µ 0 , alternativn´ı hypot´eza H1 pak m˚ uˇze b´yt nˇekolika r˚ uzn´ych typ˚ u: I
H1 : µ 6= µ0 – oboustrann´y test, kritick´y obor je tvaru (−∞, Tk1 ) ∪ (Tk2 , ∞)
I
H1 : µ > µ0 – jednostrann´y (a to pravostrann´y) test, kritick´y obor je tvaru (Tk , ∞)
I
H1 : µ < µ0 – jednostrann´y (a to levostrann´y) test, kritick´y obor je tvaru (−∞, Tk )
Test stˇredn´ı hodnoty pr˚ umˇeru pˇri zn´am´em rozptylu
Test stˇredn´ı hodnoty pr˚ umˇ eru pˇri zn´ am´ em rozptylu
N´ahodn´y v´ybˇer N´ahodn´y v´ybˇer rozsahu n je vektor (X1 , X2 , . . . , Xn ), kde X1 , X2 , . . . , Xn jsou navz´ajem nez´avisl´e n´ahodn´e veliˇciny, kter´e maj´ı vˇsechny stejn´e rozdˇelen´ı pravdˇepodobnosti.
V´ybˇerov´y pr˚ umˇer V´ybˇerov´y pr˚ umˇer z n´ahodn´eho v´ybˇeru (X1 , X2 , . . . , Xn ) je n
1X X = Xi n i=1
V´ybˇerov´y pr˚ umˇer X je n´ahodn´a veliˇcina.
Test stˇredn´ı hodnoty pr˚ umˇ eru pˇri zn´ am´ em rozptylu
Rozdˇelen´ı pravdˇepodobnosti v´ybˇerov´eho pr˚ umˇeru z No(µ, σ 2 ) Jestliˇze n´ahodn´y v´ybˇer poch´az´ı z norm´aln´ıho rozdˇelen´ı se stˇredn´ı hodnotou µ a rozptylem σ 2 , pak v´ybˇerov´y pr˚ umˇer X m´a tak´e norm´aln´ı rozdˇelen´ı, X ∼ No(µX , σX2 ), kde µX = µ,
σX2 =
σ2 . n
Test stˇredn´ı hodnoty pr˚ umˇ eru pˇri zn´ am´ em rozptylu
Pˇr´ıklad V´yˇska n´ahodnˇe vybran´eho studenta m´a norm´aln´ı rozdˇelen´ı s µ = 180 cm a σ 2 = 36 (cm)2 . Jestliˇze n´ahodnˇe vybereme 10 student˚ u, jak´a je pravdˇepodobnost, ˇze jejich pr˚ umˇern´a v´yˇska bude menˇs´ı neˇz 177 cm?
Test stˇredn´ı hodnoty pr˚ umˇ eru pˇri zn´ am´ em rozptylu
Pˇr´ıklad (Test hypot´ezy o stˇredn´ı hodnotˇe pr˚ umˇeru) Plnic´ı linka pln´ı plechovky pivem. Ze zkuˇsenosti je zn´amo, ˇze mnoˇzstv´ı piva v plechovce m´a norm´aln´ı rozdˇelen´ı se smˇerodatnou odchylkou σ = 0,005 l. Bylo n´ahodnˇe vybr´ano 25 plechovek, pr˚ umˇern´e mnoˇzstv´ı piva v nich bylo 0,498 l. Na hladinˇe v´yznamnosti α = 0,05 testujte hypot´ezu H0 : µ = 0,5 proti alternativn´ı hypot´eze H1 : µ 6= 0,5 (oboustrann´y test).