Következtetı statisztika 5.
Hipotézis-ellenırzés (Statisztikai próbák)
1
Hipotézis-vizsgálat Áttekintés Egymintás próbák • • •
Átlagra, arányra, Szórásra
Egymintás nem paraméteres próbák • •
Függetlenségvizsgálat Illeszkedésvizsgálat – Egyenletes eloszlásra – Normalitásra
Kétmintás próbák: • • •
Átlagra, arányra (szórásra)
Többmintás próba: ANOVA (Variancia-analízis) 2
1
Hipotézis-vizsgálat Bevezetı példa: Eldöntendı kérdés (hipotézis): igaz-e, hogy az 50 g feliratú kávés zacskók átlagos tömege valóban 50 g? Mintavétel: n=100, mintaátlag 48 g, a minta (korrigált) szórása 3 g. Megoldás az átlag-becslés módszerével:
µ = X = x ± z⋅
s n
µ = X = 48 ± 1,96 ⋅
3 100
Következtetés: A kapott intervallumba a hivatalos 50 g nem esik bele. A hipotézist nem fogadjuk el. 3
Megoldás a hipotézis-vizsgálat módszerével: 1) A hipotézisünk az, hogy a zacskók átlagos tömege 50 g. 2) Ha ez igaz, akkor a
x − X0 z= sx
X 0 = 50
kifejezés értéke (jó közelítéssel) standard normál eloszlású. 3) Tehát a minta-átlag standardizált értékének 95 % valószínőséggel az [- 1,96; 1,96] intervallumba kellene esni.
4) A z függvény értéke
z=
x − X 0 48 − 50 = = −6,67 3 sx 100
Ez kívülesik a fenti [- 1,96; 1,96] intervallumon, tehát nagy valószínőséggel nem igaz a hipozézis! 4
2
A hipotézis-vizsgálat alapfogalmai A hipotézis: a sokaság egy paraméterére vagy tulajdonságára vonatkozó feltevés, (amelynek a fennállását a minta alapján ellenırizzük.) • Null-hipotézis H0 • Ellen-hipotézis (alternatív hipotézis) H1 • Egyoldali és • kétoldali próba Próba-fv: Olyan fv, amely a mintelemek értékéhez egy ismert eloszlású értéket (valószínőségi változót) rendel. (Azaz: egy mintából számolható olyan érték, amely mintáról mintára változik.)
5
Alapfogalmak (folyt.)
• Elfogadási tartomány: ha a nullhipotézis helytálló, akkor (adott megbízhatósági szinten) a próbafüggvény értéke ebbe a tartományba esik. Ha a próbafv értéke ide esik, akkor H0-t elfogadjuk. • Elutasítási (kritikus tartomány): ha a próbafüggvény értéke ide esik, a nullhipotézist el kell vetnünk. • Kritikus érték: az elfogadási és az elutasítási tartományt elválasztó érték (az elutasítási tartomány részének tekintjük).
6
3
Az egy- és kétoldali próba A null-hipotézis (H0) mindig egyenlıség
(X = X ,
P = P0 , σ 2 = σ 0
0
2
)
Ha az alternatív hipotézis (H1) nem egyenlı
nagyobb
kisebb
(X ≠ X , 0
P ≠ P0 , σ 2 ≠ σ 0
2
)
(X > X , P > P , σ > σ ) (X < X , P < P , σ < σ ) 2
2
0
0
jobboldali próba
0
2
2
0
0
kétoldali próba
0
baloldali próba 7
A statisztikai próba lépései és általános logikája a) A hipotézisek: H0 és H1 felállítása b) Próba-fv megválasztása és kiszámítása c) A kritikus érték(ek) meghatározása, és ezzel az elfogadási és elutasítási tartomány meghatározása adott α szignifikancia-szinten d) Ennek alapján döntés a hipotézisekrıl. Logika: Ha a 0-hipotézis igaz, akkor 95 % valószínőséggel a próba-fv értékének az elfogadási tartományba kell esnie. - Ha odaesik, nincs okunk kétségbe vonni a 0-hipotézist. - Ha nem esik bele, akkor viszont elutasítjuk a 0-hipotézist és az alternatíváját fogadjuk el. 8
4
Az átlagra vonatkozó hipotézis-ellenırzés próbafüggvényei A sokaság NORM, A szórás ismert:
z=
x − X0
Standard normális eloszlás
σ
n t=
A sokaság Norm, A szórás nem ismert:
x − X0 s n
t-eloszlású: (Szabadságfok: n-1
Nagy n esetén a Student eloszlás helyett z eloszlás.
z=
x − X0 s n
9
A sokasági átlagra vonatkozó próba a) Hiptozésisek
H0 : X = X 0
b) A próbafüggvény:
z=
H1 : X ≠ X 0
Vagy:
H1 : X > X 0
Vagy:
H1 : X < X 0
x − X0
σ
n
Vagy:
t=
x − X0 s n
c) Kritikus érték (tábl.-ból): d) Következtetés: 10
5
PÉLDA
A korábbi példa: Eldöntendı kérdés (hipotézis): igaz-e, hogy az 50 g feliratú kávés zacskók átlagos tömege valóban 50 g? Mintavétel: n=100, mintaátlag 48 g, a minta (korrigált) szórása 3 g.
11
Megoldás: H1: X ≠ 50
•
Hipotézisek: (Kétoldali)
•
Próba-fv:
•
Kritikus érték: α = 0,05 esetén za = - 1,96 és zf = 1,96
•
Következtetés: z értéke az elutasítási tartományba esett, H1-et fogadjuk el, H0-t elutasítjuk 5%-os szignifikancia szinten
z=
H0: X = 50
x − X0 sx
=
48 − 50 = −6,67 3 100
12
6
Elkövethetı hibák
H0 hipotézist elfogadjuk
elvetjük
Igaz
Helyes döntés
Elsıfajú hiba
Hamis
Másodfajú hiba
Helyes döntés
H0 hipotézis
13
15. Példa Egy TV képcsı típus átlagos élettartama a gyártó vállalat szerint 20 ezer óra. Az élettartam közelítıleg normáleloszlást követ. Egyszerő véletlen mintavétellel kiválasztott 25 képcsı átlagos élettartama 19,4 ezer óra volt, az átlagtól való eltérés átlagosan 1,2 ezer óra. Állapítsa meg, van-e szignifikáns különbség a gyártó állítása és a megfigyelt élettartam között! (α = 0,05) 14
7
16. Példa Egy személygépkocsifajta átlagos fogyasztása a gyártó vállalat szerint 7 liter/100 km EV mintavétellel kiválasztott 25 gépkocsi átlagos fogyasztása 7,5 volt, az átlagtól való eltérés átlagosan 1,8 liter / 100 km volt. A sokasági eloszlás közelítıleg normálisnak tekinthetı. Állapítsa meg, van-e szignifikáns különbség a gyártó állítása és a tényleges fogyasztás között! (a = 0,05) 15
Sokasági arányra vonatkozó próba
Ha kisminta, akkor :
Binomiális eloszlás
Ha elég nagy a minta, és P és (1 – P) nem túl kicsi, akkor :
z=
p − P0 P0 ⋅ (1 − P0 ) n
Stand norm
16
8
A sokasági arányra vonatkozó próba a) Hiptozésisek
H 0 : P = P0
H1 : P ≠ P0
Vagy:
H1 : P > P0
Vagy:
H1 : P < P0
b) A próbafüggvény:
z=
p − P0 P0 ⋅ (1 − P0 ) n
c) Kritikus érték (tábl.-ból): d) Következtetés: 17
17. Példa
Egy új típusú TV készülékre vonatkozóan a fejlesztık és technológusok elvárása, hogy a készülékek maximum 10%-a fog garanciális javításra szorulni. Az új típus 300 kisérleti darabjából 26 db-ot kellett garanciális idıszakban javítani. Ellenırizze 5%-os szignifikancia szinten azt a hipotézist, hogy az új típusnál valóban 10% alatti a garanciális javítási arány!
18
9
18. Példa Egy mammut-cég dolgozóiból vett 400 fıs mintából 140 fı válaszolta, hogy dohányzik. Az országos átlag 31 %. Ellenırizze 5%-os szignifikancia szinten azt a hipotézist, hogy a) a cégnál a dohányosok aránya megegyezik az országos átlaggal! b) a cégnál a dohányosok aránya nagyobb, mint az országos átlag! c) Nincs-e ellentmondásban a két eredmény?
19
19. Példa Egy ember telepatikus képességét kell tesztelni. Azt állítja, hogy megérzi, hogy a szomszéd szobában fehér vagy feketeruhás egyén van. A kísérletet 100-szor elvégezve 60-szor talált. a) Elfogadjuk-e 2%-os szignifikancia szinten, hogy emberünk rendelkezik telepatikus képességgel? b)
Elfogadjuk-e 5%-os szinten?
20
10
20. Példa Tesztelünk egy pénzérmét, szabályos-e 200-szor feldobtuk, 88-szor fej lett. Elfogadható-e az állítás, hogy szabályos az érme?
21
A szórásnégyzetre vonatkozó próba menete A Khi-négyzet próba feltétele: a sokasági eloszlás normális
H0 : σ 2 = σ 02
a) Hipotézisek:
b) Próba-fv:
χ =
c) Kritikus érték (táblázatból):
2
(n −1) ⋅ s 2
2 χ krit
σ 02
H1 : σ 2 ≠ σ 02 H1 : σ 2 < σ 02 H1 : σ 2 > σ 02 Szabadságfok: n -1
Jobboldali Baloldali: Kétoldali:
d) Következtetés: …
α
(1− α )
α 2 és (1 − α 2)
valószínőséghez tartozó érték 22
11
Példa a szórásnégyzet tesztelésére Igaz-e, hogy a testmagasság sokasági szórása 15 cm? Véletlen minta, n = 100, s = 14 cm. A testmagasság normális eloszlású.
a) Hipotézisek: b) Próba-fv: c) Kritikus érték (táblázatból): d) Következtetés: 23
Köszönöm a figyelmüket!
24
12