Statisztika I. 9. előadás Előadó: Dr. Ertsey Imre
Statisztikai hipotézis vizsgálatok
¾ elsősorban a biometriában alkalmazzák, ¾ újabban
reprezentatív
jellegű
ökonómiai
vizsgálatoknál, ¾ üzemi szinten élelmiszeripari termékek minőségi
vizsgálatánál. ¾ A hipotézis vizsgálat során a minta vagy minták
jellemzőit vizsgáljuk.
¾ Feltételezzük,
jellemzők
hogy
között
az
nincs
összehasonlítandó különbség,
úgynevezett nullhipotézis. ¾ Ez a különbség vonatkozhat: 9 átlagokra, 9 szórásnégyzetre, 9 eloszlásokra, 9 az összefüggésekre és azok jellemzőire
ez
az
¾ A
0
hipotézisünk
helytállóságát
statisztikai
próbával döntjük el. ¾ A
minta
jellemzői
valószínűségi
változók
–
érvényes a központi határeloszlás tétele. ¾ Statisztikai biztonság: normális eloszlás esetén
a
megadott
szórás
intervallumon
elhelyezkedő értékek valószínűsége.
belül
¾ Határvalószínűség vagy szignifikancia határ: a
döntés
valószínűség
szintje,
azaz
normális
eloszlás esetén a megadott szórás intervallumon kívül elhelyezkedő értékek valószínűsége. ¾ A statisztikai biztonság és a határvalószínűség
100%-ra egészíti ki egymást .
Szórás intervallum +1,960 +2,576 +3,291
Statisztikai biztonság 95,0% 99,0% 99,9%
Határvalószínűség 5,0% 1,0% 0,1%
¾ Statisztikai
szolgálnak
próbák: hipotézisek ellenőrzésére
¾ - legfontosabbak: a véletlen minta
átlagainak és szórásnégyzeteinek összehasonlítása.
¾ A
középértékek összehasonlításakor a „t” próbát szórások összehasonlítása esetén az úgynevezett „F” próbát alkalmazzuk. Mindkét próba független, normális eloszlású alapsokaságokból származó minták jellemzőinek összehasonlítására alkalmas.
Az általunk meghatározott „t” értéket összehasonlítjuk a „Student” táblázatban az adott szabadságfokhoz és határvalószínűséghez tartozó „t” értékkel. Ha a számított „t” érték nagyobb mint a táblázatban lévő „t” érték a nullhipotézist elvetjük, a két átlag közötti eltérés szignifikáns, azaz nem a véletlennek köszönhető.
A „t” értéknél figyelembe veendő szabadságfok meghatározásához azonban meg kell határoznunk az „F” próbát. S12 F = 2 S12 〉S22 S2 Szabadságfok (Szf): az egymástól független minták száma (elemek száma).
A nullhipotézis szerint a két sokaság szórása egyenlő azaz S1=S2. Az „F” próbával ellenőrizhetjük, hogy hipotézisünk igaz-e, azaz a szórásban mutatkozó eltérés csak a véletlennek tulajdonítható-e.
Az általunk számított „F” értéket összehasonlítjuk a táblázatban meghatározott „F” értékkel (a
táblázatban
függőleges,
a
a
nevező
számlálóét
szabadságfokát a
vízszintes
a
sorban
megkeresve olvassuk le az „F” értéket). Ha az általunk számított „F” érték nagyobb a nullhipotézist elvetjük illetve a vizsgált két sokaság szórása szignifikánsan eltér egymástól.
Ha az „F” próba alapján a két szórás azonos, akkor a két mintasokaság szórása is azonos, így a kikeresendő „t” érték szf = 2(n-1), Ha a két minta sokaság szórása különböző, akkor a „t” érték szf = n-1.
Szignifikáns differencia:
SZDp% = t p% ⋅ Sd
Az a legnagyobb különbség amelyet az adott P valószínűségi szinten még hibának, azaz a véletlennek tulajdoníthatunk. Ha a középértékek közötti különbség nagyobb, mint a szignifikáns differenciával kifejezett hiba mértéke, akkor a nullhipotézist elvetjük.
Statisztikai hipotézis vizsgálatok Egy motorkerékpár gyártó cég a gumiabroncsok
tartósságát új adalékanyaggal kívánja növelni. Az új gumiabroncs tesztelésére 15 gépjárműre elől a régi, hátul az új abroncsot szerelték fel és 500 km megtétele után mérték a kopást.
Me.: mm Motorkerékpár sorszám
Abroncs kopás Régi xr
Új xú
x r2
xú 2
1.
0,25
0,10
0,063
0,010
2.
0,50
0,11
0,250
0,012
3.
0,24
0,20
0,058
0,040
4.
0,33
0,14
0,109
0,020
5.
0,25
0,11
0,063
0,012
6.
0,30
0,15
0,090
0,023
7.
0,34
0,12
0,116
0,014
8.
0,60
0,16
0,360
0,026
9.
0,42
0,20
0,176
0,040
10.
0,48
0,19
0,230
0,036
11.
0,51
0,11
0,260
0,012
12.
0,64
0,19
0,410
0,036
13.
0,34
0,13
0,116
0,017
14.
0,34
0,18
0,116
0,032
15.
0,29
0,15
0,084
0,023
Összesen
5,83
2,24
2,501
0,353
Abroncskopás átlagok:
xr
x ∑ =
xú
x ∑ =
n
n
5,83 = = 0,39mm 15
2,24 = = 0,15mm 15
Kopáskülönbség:
x r − xú = 0,39 − 0,15 = 0,24mm
A régi abroncsok kopásának szórásnégyzete:
Sr = 2
2 x ∑ −
(∑ x )
n −1
n
2
5,832 2,501 − 15 = 0,015 = 14
Az új abroncsok kopásának szórásnégyzete:
Sú
2
2 x ∑ −
(∑ x )
n −1
n
2
2,24 2 0,353 − 15 = 0,001 = 14
A differencia véletlen hibája:
Sr + Sú 0,015 + 0,001 = = 0,033 Sd = 15 n 2
2
A számított t-érték:
x r − xú 0,39 − 0,15 = = 7,27 t= 0,033 Sd
A kritikus t-érték meghatározásához el kell végezni az F próbát:
Sr 0,015 F = 2= = 15 0,001 Sú 2
Fp 5% = 2,5
a számláló és a nevező Szf=14
15 > 2,5 tehát a két minta szórása eltérő, a kritikus térték meghatározásánál a szabadságfok: n-1 A kritikus t-érték:
t p 5% = 2,145
Szf=14
7,27 > 2,145 azaz t > tp5% tehát a két minta középértéke közötti különbség nem a véletlennek köszönhető A szignifikáns differencia értéke 95%-os valószínűségi szinten:
SZDp 5% = t p 5% ⋅ Sd = 2,145 ⋅ 0,033 = 0,07mm Mivel a két minta középértéke közötti különbség nagyobb, mint a SZDp5% azaz 0,24 > 0,07 így megállapítható, hogy a különbség az eltérő adalékanyag hatásának köszönhető.