ˇ ˇ Výberová rozdelení Teorie odhadu
ˇ Pravdepodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016
Tutoriál cˇ . 5: Bodové a intervalové odhady, testování hypotéz
Jan Kracík
[email protected]
ˇ ˇ Výberová rozdelení Teorie odhadu
Obsah: ˇ ˇ Výberová rozdelení Bodové a intervalové odhady Testování hypotéz
ˇ ˇ Výberová rozdelení Teorie odhadu
ˇ ˇ Výberová rozdelení
ˇ ˇ Výberová rozdelení Teorie odhadu
ˇ Výberové charakteristiky (opakování): ˇ cˇ íslné charakteristiky výberového souboru ˇ ˇ výberový ˇ výberový prum ˚ er, rozptyl, relativní cˇ etnost, . . . náhodné veliˇciny (funkce pozorování)
ˇ ˇ Výberová rozdelení Teorie odhadu
ˇ Výberové charakteristiky (opakování): ˇ cˇ íslné charakteristiky výberového souboru ˇ ˇ výberový ˇ výberový prum ˚ er, rozptyl, relativní cˇ etnost, . . . náhodné veliˇciny (funkce pozorování) ¯ ] = E[ 1 Pn Xi ] = 1 · n · E[X ] = µX E[X i=1 n n ¯ ] = D[ 1 Pn Xi ] = 12 · n · D[X ] = 1 · σ 2 D[X i=1 n n n X 2 σ ¯ ∼N ˇ centrální limitní veta: X ˙ µx , nx ˇ další aplikace CLV: rozdelení souˇctu náhodných veliˇcin, ˇ u, rozdílu prum ˚ er ˚ rozdílu relativních cˇ etností, . . .
ˇ ˇ Výberová rozdelení Teorie odhadu
ˇ ˇ Výberová rozdelení: ˇ ˇ ˇ rozdelení pravdepodobnosti duležitých ˚ výberových charakteristik vyžití pro odhady parametru, ˚ testování hypotéz, . . . ˇ 3 duležitá ˚ rozdelení: ˇ χ2 -rozdelení ˇ Studentovo rozdelení ˇ Fisher-Snedecorovo rozdelení
ˇ ˇ Výberová rozdelení Teorie odhadu
ˇ χ2 -rozdelení (“chí kvadrát”) ˇ Mejme Z1 , Z2 , . . . , Zn nezávislé náhodné veliˇciny s ˇ rozdelením N(0, 1). P Oznaˇcme X = ni=1 Zi2 . ˇ Potom X má rozdelení χ2 s n stupni volnosti. Zapisujeme X ∼ χ2n . Duležitá ˚ vlastnost: Pro nezávislé X1 , X2 , . . . , Xn ∼ N(µ, σ 2 ) platí (n − 1)S 2 ∼ χ2n−1 , σ2 ˇ kde S 2 je výberový rozptyl, n
1 X ¯ )2 . (Xi − X S = n−1 2
i=1
ˇ ˇ Výberová rozdelení Teorie odhadu
ˇ Studentovo (t) rozdelení Necht’ Z a X jsou nezávislé náhodné veliˇciny. Z ∼ N(0, 1) X ∼ χ2n Oznaˇcme T =
qZ
X n
.
ˇ Potom T má Studentovo t rozdelení s n stupni volnosti. Zapisujeme T ∼ tn . Duležitá ˚ vlastnost: Pro nezávislé X1 , X2 , . . . , Xn ∼ N(µ, σ 2 ) platí ¯ − µ√ X n ∼ tn−1 . S
ˇ ˇ Výberová rozdelení Teorie odhadu
ˇ Fisher-Snedecorovo (F ) rozdelení Necht’ V a W jsou nezávislé náhodné veliˇciny. V ∼ χ2m W ∼ χ2n Oznaˇcme F =
V m W n
.
ˇ Potom F má Fisher-Snedecorovo rozdelení o m a n stupních volnosti. Zapisujeme F ∼ Fm,n . Duležtá ˚ vlastnost: Pro nezávislé X1 , X2 , . . . , Xm ∼ N(µX , σX2 ) a Y1 , Y2 , . . . , Yn ∼ N(µY , σY2 ) platí SX2 m SY2 n
∼ Fm−1,n−1 .
ˇ ˇ Výberová rozdelení Teorie odhadu
Teorie odhadu
ˇ ˇ Výberová rozdelení Teorie odhadu
ˇ Cílem odhadu je urˇcení neznámého parametru rozdelení populace (náhodné veliˇciny X ) na základeˇ informace obsažené ˇ ve výberovém souboru (realizacích náhodné veliˇciny, datech). Pˇríklad: Hod nesymetrickou mincí lze modelovat jako ˇ Bernoulliovský pokus s alternativním (Bernoulliho) rozdelením. ˇ ˇ Parametrem rozdelení muže ˚ být pravdepodobnost padnutí orla. ˇríci o neznámém parametru, pokud Co mužeme ˚ pˇri 10 hodech padne 3 krát orel?
ˇ ˇ Výberová rozdelení Teorie odhadu
ˇ Cílem odhadu je urˇcení neznámého parametru rozdelení populace (náhodné veliˇciny X ) na základeˇ informace obsažené ˇ ve výberovém souboru (realizacích náhodné veliˇciny, datech). Pˇríklad: Hod nesymetrickou mincí lze modelovat jako ˇ Bernoulliovský pokus s alternativním (Bernoulliho) rozdelením. ˇ ˇ Parametrem rozdelení muže ˚ být pravdepodobnost padnutí orla. ˇríci o neznámém parametru, pokud Co mužeme ˚ pˇri 10 hodech padne 3 krát orel? pˇri 2 hodech orel nepadne ani jednou?
ˇ ˇ Výberová rozdelení Teorie odhadu
ˇ Cílem odhadu je urˇcení neznámého parametru rozdelení populace (náhodné veliˇciny X ) na základeˇ informace obsažené ˇ ve výberovém souboru (realizacích náhodné veliˇciny, datech). Pˇríklad: Hod nesymetrickou mincí lze modelovat jako ˇ Bernoulliovský pokus s alternativním (Bernoulliho) rozdelením. ˇ ˇ Parametrem rozdelení muže ˚ být pravdepodobnost padnutí orla. ˇríci o neznámém parametru, pokud Co mužeme ˚ pˇri 10 hodech padne 3 krát orel? pˇri 2 hodech orel nepadne ani jednou? pˇri 100 hodech padne 30 krát orel? pˇri 10000000 hodech padne 3000000 orel? pˇri 2 hodech nepadne ani jednou orel, pˇritom mince je ˇ bežná 1 Kˇc, jen lehce poškrábaná
ˇ ˇ Výberová rozdelení Teorie odhadu
Pˇri odhadování se zajímáme o hodnotu odhadu (pˇribližnou hodnotu neznámého parametru), pˇresnost odhadu - odhad na základeˇ koneˇcného poˇctu dat bude vždy pouze pˇribližný.
ˇ ˇ Výberová rozdelení Teorie odhadu
Pˇri odhadování se zajímáme o hodnotu odhadu (pˇribližnou hodnotu neznámého parametru), pˇresnost odhadu - odhad na základeˇ koneˇcného poˇctu dat bude vždy pouze pˇribližný. Rozlišujeme dva základní typy odhadu: Bodový odhad - neznámý parametr charakterizujeme ˇ jedinou hodnotou, pokud možno blízko skuteˇcné hodnote. Hodnota bodového odhadu nevypovídá nic o pˇresnosti odhadu. Intervalový odhad - neznámý parametr charakterizujeme ˇ intervalem, který s velkou pravdepodobností obsahuje skuteˇcnou hodnotu. Délka intervalu vypovídá o pˇresnosti odhadu.
ˇ ˇ Výberová rozdelení Teorie odhadu
Bodový odhad
ˇ ˇ Výberová rozdelení Teorie odhadu
Bodový odhad ˇ ˇ z neznámého rozdelení ˇ Mejme X1 , X2 , . . . , Xn náhodný výber závislého na parametru Θ. Bodovým odhadem parametru Θ je ˇ obecneˇ libovolná výberová charakteristika (funkce náhodného ˇ výberu) T (X1 , X1 , . . . , Xn ). Pˇríklady T (X1 , X2 , . . . , Xn ) =
1 n
Pn
i=1 Xi
ˇ ˇ Výberová rozdelení Teorie odhadu
Bodový odhad ˇ ˇ z neznámého rozdelení ˇ Mejme X1 , X2 , . . . , Xn náhodný výber závislého na parametru Θ. Bodovým odhadem parametru Θ je ˇ obecneˇ libovolná výberová charakteristika (funkce náhodného ˇ výberu) T (X1 , X1 , . . . , Xn ). Pˇríklady P T (X1 , X2 , . . . , Xn ) = n1 ni=1 Xi (bodový odhad stˇrední hodnoty) 1 Pn ¯ 2 T (X1 , X2 , . . . , Xn ) = n−1 i=1 (Xi − X )
ˇ ˇ Výberová rozdelení Teorie odhadu
Bodový odhad ˇ ˇ z neznámého rozdelení ˇ Mejme X1 , X2 , . . . , Xn náhodný výber závislého na parametru Θ. Bodovým odhadem parametru Θ je ˇ obecneˇ libovolná výberová charakteristika (funkce náhodného ˇ výberu) T (X1 , X1 , . . . , Xn ). Pˇríklady P T (X1 , X2 , . . . , Xn ) = n1 ni=1 Xi (bodový odhad stˇrední hodnoty) 1 Pn ¯ 2 T (X1 , X2 , . . . , Xn ) = n−1 i=1 (Xi − X ) (bodový odhad rozptylu) T (X1 , X2 , . . . , Xn ) = arctg(X1 · X2 · . . . · Xn )
ˇ ˇ Výberová rozdelení Teorie odhadu
Bodový odhad ˇ ˇ z neznámého rozdelení ˇ Mejme X1 , X2 , . . . , Xn náhodný výber závislého na parametru Θ. Bodovým odhadem parametru Θ je ˇ obecneˇ libovolná výberová charakteristika (funkce náhodného ˇ výberu) T (X1 , X1 , . . . , Xn ). Pˇríklady P T (X1 , X2 , . . . , Xn ) = n1 ni=1 Xi (bodový odhad stˇrední hodnoty) 1 Pn ¯ 2 T (X1 , X2 , . . . , Xn ) = n−1 i=1 (Xi − X ) (bodový odhad rozptylu) T (X1 , X2 , . . . , Xn ) = arctg(X1 · X2 · . . . · Xn ) ˇ bodový odhad - mimo jiné cˇ ehokoliv) (podle definice rovnež
ˇ ˇ Výberová rozdelení Teorie odhadu
Vlastnosti, které zaruˇcují, že danný bodový odhad je v jistém smyslu dobrý: nestrannost (nevychýlenost) - odhad T (·) parametru Θ je nestranný, jestliže E[T ] = Θ pro každé Θ
ˇ ˇ Výberová rozdelení Teorie odhadu
Vlastnosti, které zaruˇcují, že danný bodový odhad je v jistém smyslu dobrý: nestrannost (nevychýlenost) - odhad T (·) parametru Θ je nestranný, jestliže E[T ] = Θ pro každé Θ vydatnost, eficience - nejlepší nestranný (vydatný, eficientní)
ˇ ˇ Výberová rozdelení Teorie odhadu
Vlastnosti, které zaruˇcují, že danný bodový odhad je v jistém smyslu dobrý: nestrannost (nevychýlenost) - odhad T (·) parametru Θ je nestranný, jestliže E[T ] = Θ pro každé Θ vydatnost, eficience - nejlepší nestranný (vydatný, eficientní) konzistence - odhad Tn (X1 , . . . , Xn ) je konzistentní, pokud E[Tn ] → Θ a D[Tn ] → 0, tj.odhad se s rostoucím poˇctem ˇ dat zpˇresnuje
ˇ ˇ Výberová rozdelení Teorie odhadu
Pˇríklad: ˇ z rozdelení ˇ X1 , X2 , . . . , Xn nezávislý náhodný výber se stˇr. 2 hodnotou µ a rozptylem σ . Snadno lze ukázat, že P E[ n1 ni=1 Xi ] = µ, Pn ¯ )2 ] = σ 2 . E[ 1 (Xi − X n−1
i=1
ˇ ˇ je nestranným odhadem Odtud plyne, že výberový prum ˚ er ˇ stˇrední hodnoty a výberový rozptyl je nestranným odhadem rozptylu.
ˇ ˇ Výberová rozdelení Teorie odhadu
Intervalový odhad
ˇ ˇ Výberová rozdelení Teorie odhadu
Interval spolehlivosti (konfidenˇcní interval) pro parametr θ se spolehlivostí 1 − α, kde α ∈ h0, 1i, je dvojice statistik (TD (·), TH (·)) taková, že P(TD ≤ θ ≤ TH ) = 1 − α. Poznámka: Meze intervalu spolehlivosti TD (·), TH (·) jsou náhodné veliˇciny
ˇ ˇ Výberová rozdelení Teorie odhadu
Interval spolehlivosti (konfidenˇcní interval) pro parametr θ se spolehlivostí 1 − α, kde α ∈ h0, 1i, je dvojice statistik (TD (·), TH (·)) taková, že P(TD ≤ θ ≤ TH ) = 1 − α. Poznámka: Meze intervalu spolehlivosti TD (·), TH (·) jsou náhodné veliˇciny Intervalový odhad htD , tH i je konkrétní realizace intervalu spolehlivosti.
ˇ ˇ Výberová rozdelení Teorie odhadu
Interval spolehlivosti (konfidenˇcní interval) pro parametr θ se spolehlivostí 1 − α, kde α ∈ h0, 1i, je dvojice statistik (TD (·), TH (·)) taková, že P(TD ≤ θ ≤ TH ) = 1 − α. Poznámka: Meze intervalu spolehlivosti TD (·), TH (·) jsou náhodné veliˇciny Intervalový odhad htD , tH i je konkrétní realizace intervalu spolehlivosti. Koeficient α nazýváme hladina významnosti.
ˇ ˇ Výberová rozdelení Teorie odhadu
Délka intervalového odhadu charakterizuje pˇresnost, kratší interval (pˇri stejném α) ˇ lokalizaci skuteˇcné hodnoty pˇredstavuje pˇresnejší parametru ˇ klesá s rostoucím poˇctem dat (odhad se zpˇresnuje) roste s (1 − α), vyšší spolehlivost vyžaduje širší interval
ˇ ˇ Výberová rozdelení Teorie odhadu
Délka intervalového odhadu charakterizuje pˇresnost, kratší interval (pˇri stejném α) ˇ lokalizaci skuteˇcné hodnoty pˇredstavuje pˇresnejší parametru ˇ klesá s rostoucím poˇctem dat (odhad se zpˇresnuje) roste s (1 − α), vyšší spolehlivost vyžaduje širší interval V praxi volíme α = 0.05 nebo α = 0.01 (pˇri požadavku na vyšší spolehlivost).
ˇ ˇ Výberová rozdelení Teorie odhadu
Typy intervalových odhadu˚ oboustranný P(θ < TD ) = P(θ ≥ TH ) =
α 2
jednostranný - je-li pro nás duležitá ˚ pouze jedna mez levostranný P(TD∗ ≤ θ) = 1 − α pravostranný P(θ ≤ TH∗ ) = 1 − α
ˇ ˇ Výberová rozdelení Teorie odhadu
Postup pˇri tvorbeˇ intervalového odhadu 1
ˇ Zvolíme vhodnou výberovou charakteristiku T (X ), jejíž ˇ rozdelení (závislé na θ) známe.
2
Urˇcíme
3
Z podmínky x α2 ≤ T (X ) ≤ x1− α2 stanovíme meze pro θ.
4
Obdobneˇ pro jednostranné odhady.
α 2
a (1 − α2 )-kvantily x α2 a x1− α2 veliˇciny T .
ˇ ˇ Výberová rozdelení Teorie odhadu
Pˇríklad: Intervalový odhad stˇrední hodnoty normálního ˇ ení ˇ s neznámým rozptylem se spolehlivostí 0.95. Máme rozdel ¯ a výberovým ˇ ˇ ˇ vzorek velikosti n s výberovým prum ˚ erem X 2 rozptylem S . Statistika T (X ) =
¯ −µ √ X n. S
ˇ Z vlastností Studentova rozdelení: T (X ) ∼ tn−1 . ¯ − µ√ X P t α2 ≤ n ≤ t1− α2 = 0.95 S Úpravou nerovností dostaneme (využijeme t α2 = −t1− α2 ) S S ¯ ¯ P X − √ t1− α2 ≤ µ ≤ X + √ t1− α2 = 0.95. n n
ˇ ˇ Výberová rozdelení Teorie odhadu
Výpoˇcet intervalového odhadu Pro výpoˇcet lze využít tabulky se vzorci (u zk. legální tahák), nejlépe však vhodný software (Statgraphics, R commander, applety ML, ...). Nutný pˇredpoklad pro získání smysluplného ˇ rení pˇredpokladu. výsledku je správná volba typu odhadu a oveˇ ˚ Další odhady viz skripta a tabulky.
ˇ ˇ Výberová rozdelení Teorie odhadu
Testování hypotéz
ˇ ˇ Výberová rozdelení Teorie odhadu
ˇ rit, zda data nepopírají Cílem testování hypotéz je oveˇ ˇ pˇredpoklad (hypotézu), který jsme uˇcinili o rozdelení populace pˇred provedením testu. Terminologie: ˇ Statistická hypotéza - tvrzení o rozdelení náhodné veliˇciny Nulová hypotéza H0 - výchozí (defaultní) stanovisko, které jsme ochotni akceptovat, pokud data nebudou mluvit výrazneˇ proti; napˇr: neexistuje závislost, systematická výchylka je 0, . . . Alternativní hypotéza H1 (HA ) - popírá nulovou hypotézu Na základeˇ výsledku testu pak bud’ zamítáme H0 , nebo nezamítáme H0 . H0 nelze na základeˇ testu potvrdit. Lze pouze ˇríci, že data nesvedˇ ˇ cí proti ní.
ˇ ˇ Výberová rozdelení Teorie odhadu
Typy testu˚ Parametrické - tvrzení o parametru (parametrech) jedné, dvou, nebo více populací ˇ Neparametrické - tvrzení o jiné vlastnosti rozdelení ˇ populace - typ rozdelení, závislost mezi sledovanými znaky, . . .
ˇ ˇ Výberová rozdelení Teorie odhadu
Postup pˇri testování hypotéz (klasický pˇrístup) 1 Formulujeme nulovou H0 a alternativní hypotézu H1 . 2 ˇ Zvolíme testovou statistiku. Rozdelení testové statistiky za pˇredpokladu platnosti nulové hypotézy nazýváme nulové ˇ ení. ˇ rozdel 3 ˇ ríme pˇredpoklady testu! Oveˇ 4 Urˇcíme kritický obor W ∗ , tj. množinu v níž se za pˇredpokladu platnosti H0 hodnoty testové statistiky ˇ ˇ vyskytují s velmi malou pravdepodobností. Doplnkem W∗ ∗ ∗ ∗ je tzv. obor pˇrijetí V . Hranici mezi W a V oznaˇcujeme jako kritickou hodnotu tkrit . 5 ˇ urˇcíme pozorovanou hodnotu Na základeˇ realizace výberu testové statistiky xOBS . 6 Na základeˇ vztahu xOBS a tkrit (tj. podle toho zda xOBS ∈ W ∗ nebo xOBS ∈ V ∗ ) rozhodujeme o výsledku testu (zamítnutí nebo nezamítnutí H0 ).
ˇ ˇ Výberová rozdelení Teorie odhadu
V závislosti na platnosti H0 a výsledku testu mohou nastat 4 situace: Platí H0 Platí H1
Nezamítáme H0 Správné rozhodnutí ˇ Pravdepodobnost: 1−α Chyba II. druhu ˇ Pravdepodobnost: β
Zamítáme H0 Chyba I. druhu: ˇ Pravdepodobnost: α Správné rozhodnutí ˇ Pravdepodobnost: 1−β
Chybám I. a II. druhu se z podstaty problému nelze vyhnout, ˇ protože rozhodujeme na základeˇ náhodného výberu. α: hladina významnosti testu, v praxi volíme 0.05 nebo 0.01 1 − β: síla testu; nevolíme je urˇcena hladinou významnosti a konstrukcí testu
ˇ ˇ Výberová rozdelení Teorie odhadu
ˇ testy s nízkou hladinou významnosti a Ideálneˇ bychom chteli vysokou sílou - protichudné ˚ požadavky. Snížit α i β lze pouze zvýšením poˇctu dat.
ˇ ˇ Výberová rozdelení Teorie odhadu
ˇ Cistý test významnosti (pomocí p-hodnoty) 1
Formulace nulové a alternativní hypotézy.
2
Volba testové statistiky T (X ).
3
ˇ rení pˇredpokladu˚ testu. Oveˇ
4
Výpoˇcet pozorované hodnoty testové statistiky xOBS .
5
ˇ Výpoˇcet p-hodnoty, tj. pravdepodobnosti alesponˇ tak extrémního výsledku jako xOBS za pˇredpokladu nulové hypotézy.
ˇ ˇ Výberová rozdelení Teorie odhadu
tvar H1 θ ≤ θ0 θ ≥ θ0 θ 6= θ0
p-hodnota p-hodnota = F0 (xOBS ) p-hodnota = 1 − F0 (xOBS ) p-hodnota = 2min(F (xOBS ), 1 − F0 (xOBS ))
Rozhodnutí o výsledku testu: p-hodnota Rozhodnutí ˇ H1 p-hodnota < α Zamítáme H0 ve prospech p-hodnota > α Nezamítáme H0 Výhodou cˇ istého testu významnosti je, že rovnou vidíme, na jaké hladineˇ významnosti lze ješteˇ rozhodnout o zamítnutí H0 . ˇ Bývá výstupem Tento typ testu se v praxi používá cˇ asteji. statistického software.
ˇ ˇ Výberová rozdelení Teorie odhadu
Pˇríklad: Spotˇreba automobilu byla testována 11 ˇridiˇci s výsledky: 8,8; 8,9; 9,0; 8,7; 9,3; 9,0; 8,7; 8,8; 9,4; 8,6; 8,9 (l/100 km). Lze výrobcem udávanou spotˇrebu 8,8 l/100 km považovat za pravdivou? Náhodná veliˇcina X . . . spotˇreba l/100 km Pˇredpokládáme: X ∼ N (µ, σ 2 ) ¯ = 8.92, S 2 = 0.06. Z dat vypoˇcteme: X H0 : µ = 8.8 H1 : µ > 8.8 √ ¯ T (X ) = X S−µ n, T ∼ t10 TOBS = 1.62 p-value: 2(1 − F (TOBS )) = 0.068 p-value > 0.05 ⇒ na hladineˇ významnosti 0.05 nezamítáme H0 . Nelze tvrdit, že spotˇreba není rovna 8.8l.