Statisztikai hipotézisvizsgálatok
1. Milyen problémáknál használatos? A gyakorlatban nagyon gyakran szükségünk lehet arra, hogy mintákból származó információk alapján hozzunk sokaságra vonatkozó döntéseket. Például egy töltőgép megfelelően van-e beállítva; a cigarettában levő kátrány alatta marad-e az előírt értékeknek. Ezekben az esetekben azt vizsgáltuk, hogy az adott minta származhat-e egy adott paraméterű sokaságból, illetve, hogy a minta egyik paramétere azonos-e egy elméleti értékkel. A sokaság adott tulajdonságát nem mérhetjük le közvetlenül, hanem csak a sokaságból vett minta alapján becsülhetjük. A becslés azonban véletlen hibákkal terhelt, ezért számszerű eltérés a mintából számított érték (pl. átlag) és az adott érték között nem szükségszerűen jelenti azt, hogy a sokaságra jellemző érték is eltér az adott értéktől. Más esetekben két sokaság valamely paraméterét hasonlítjuk össze: két populáció jövedelmi viszonyai azonosnak tekinthető-e; tovább élnek-e a nők, mint a férfiak. Amikor döntést akarunk hozni, feltételezéseket fogalmazunk meg, melyek lehetnek igazak vagy hamisak, ezeket hívjuk statisztikai hipotéziseknek. Döntésünket a minta alapján kalkulált érték segítségével tudjuk meghozni. Mivel a mintavételt a véletlen befolyásolja, ezek a számolt statisztikai mutatók valószínűségi változók lesznek. A statisztikai próbának nevezzük azt az eljárást, aminek a segítségével eldönthetjük, hogy az adott hipotézis elfogadható-e vagy sem. A módszer alkalmazása során összehasonlítunk két számot: a számított próbastatisztika értékét és egy táblázatbeli (kritikus) értéket. A nullhipotézis a feltételezésünk matematikai megfogalmazása. Alakja egyenlőség, két érték azonosságát állítja. (Nevét onnan kapta, hogy e két érték különbsége nulla.) Például: a sokaság várható értéke (µ) megegyezik egy előre rögzített értékkel (m0). H0 : µ = m0 . Ezzel szemben álló másik állítás az alternatív hipotézis. Az alternatív hipotézis lehet kétoldali alternatív hipotézis vagy egyoldali alternatív hipotézis. Az előző példánál maradva: Kétoldali alternatív hipotézis: H1 : µ ≠ m0. Egyoldali alternatív hipotézis: H1 : µ < m0 (baloldali) H1 : µ > m0 (jobboldali). Megbízhatósági szint (konfidencia szint) (1-α) a nullhipotézis elfogadására vonatkozó döntés helyességének valószínűségét fejezi ki, amennyiben a nullhipotézis igaz. A szignifikancia szint (α) a hibás döntés valószínűsége ugyancsak igaz nullhipotézis esetén. Empirikus szignifikancia szint (P érték) annak a valószínűsége, hogy a próbastatisztika a mintából kiszámított értéket veszi fel. Az empirikus szignifikanciával a statisztikai szoftverek alkalmazásánál találkozhatunk. Minél kisebb a P érték, annál nagyobb a valószínűsége hogy a H0 hipotézis hamis. A próbastatisztika értéke a nullhipotézis érvényességétől, a kritikus érték nagysága a megbízhatósági szinttől függ. Mivel a minta a véletlentől függ, ezért soha nem lehetünk biztosak abban, hogy a hipotézis igaz vagy sem. A statisztikai döntés során kétféle hibát követhetünk el. Első fajú hiba (α) esetén a nullhipotézist elutasítjuk, pedig igaz. Az első fajú hiba elkövetésének valószínűsége a szignifikancia szinttel megegyezik. A hiba nagysága a szignifikancia szint csökkentésével csökkenthető. Másodfajú hiba (β) esetén a nullhipotézist elfogadjuk, pedig nem igaz. A hiba nagysága csökken, ha növeljük a szignifikancia szintet. Ha növeljük a kritikus értéket, akkor az esetek többségében csökkentjük α-t, és egyúttal növeljük β-t. Ha
csökkentjük a kritikus értéket, akkor β_ csökken, de α nő. Az α-t általában 5%-nak szokás megadni. Ezen hibák együttes csökkentése csak a minta elemszám növelésével érhető el. H0 hipotézis Elfogadás Elvetés
Igaz Helyes következtetés Első fajú hiba (α)
Hamis Másodfajú hiba (β) Helyes következtetés
Elfogadási tartomány: az az intervallum ahová ha a próbastatisztika értéke kerül, a nullhipotézist elfogadjuk. Kritikus tartomány: az az intervallum ahová ha a próbastatisztika értéke kerül, a nullhipotézist elvetjük. Kritikus érték: az a szám, amivel a próbastatisztika értékét összehasonlíthatjuk, és dönthetünk, hogy az elfogadási vagy a kritikus tartományba esik. Kritikus és elfogadási tartomány egyoldali alternatív hipotézis esetén:
kritikus tartomány α/2
elfogadási tartomány
kritikus tartomány α/2
1-α
Kritikus és elfogadási tartomány baloldali alternatív hipotézis esetén:
kritikus tartomány α
elfogadási tartomány 1-α
Kritikus és elfogadási tartomány jobboldali alternatív hipotézis esetén:
elfogadási tartomány 1-α
A statisztikai próba algoritmusa:
kritikus tartomány α
• • • • • • •
A kérdés megfogalmazása, a próbastatisztika kiválasztása. A nullhipotézis és az alternatív hipotézis felállítása. A szignifikancia szint (α) megválasztása. A próbastatisztika értékének kiszámítása. A (táblázatbeli) kritikus érték meghatározása. A döntés meghozatala a nullhipotézis elfogadásáról vagy elvetéséről. A következtetések levonása.
Paraméteres statisztikai próbák Ha az eloszlás jellege ismert, és a nullhipotézisünk az eloszlás valamely paraméterére vonatkozik, paraméteres próbáról, ellenkező esetben nemparaméteres próbáról beszélünk. A paraméteres próbák alkalmazása nominális és ordinális változókon nem ajánlott. Középértékekre vonatkozó próbák (z-próba; t-próba) Egy mintás próbák: A nullhipotézis a következő lehet: származhatott-e a minta egy adott középértékű sokaságból? z-próba (vagy u próba): Akkor használjuk, ha a sokaság normális eloszlású, az alapsokaság szórása ismert vagy tetszőleges eloszlású sokaság, de a minta elemszám kellően nagy. A próbastatisztika kiszámítása: x−µ z= , ahol
σ
n x a minta átlaga, µ a sokaság átlaga, σ a sokaság szórása, n a minta elemszáma. Elfogadási tartomány: z emp < z krit t-próba: normális eloszlású sokaság esetén használható, amikor a szórás nem ismert valamint a minta elemszám kicsi (n < 30). x−µ , a szabadsági fok száma: n-1, ahol t= s n x a minta átlaga, µ a sokasági átlag, s a sokaság becsült szórása, n a minta elemszáma. Elfogadási tartomány: t emp < t krit Példa: Egy kísérletben egy új gyógyszer testtömegre gyakorolt hatását szeretnék leellenőrizni. Egereken tesztelik az új vegyületet. A laboratóriumi populációban generációról generációra az
egerek adott idős korukra 20 grammosak voltak, tömegük szórása 2,5 g volt. Feltételezhetjük, hogy az egerek tömege normális eloszlású µ = 20 g átlaggal és σ = 2,5 g szórással. A vizsgálathoz kiválasztanak egy véletlen mintát 10 egeret, és megnézik, hogy mekkora lesz az adott korban a tömegük. Azt tapasztalják, hogy a 10 egér átlagosan 21 grammosok lettek. Véletlennek vagy a vegyületnek köszönhető-e a változás? Felmerül a kérdés, hogy a mintavételezési hibát figyelembe véve a 10 egér tömegének legalább mekkorának kell lennie ahhoz, hogy az új vegyületet hatásosnak lehessen nyilvánítani. Megoldás: Nullhipotézis: a vegyület nem okozott változást. Alternatív hipotézis: a vegyület hatással van a testtömegre. Vagyis: H0 : µ = 20; H1 : µ ≠ 20. Ez egy kétoldali alternatív hipotézis. A hipotézis elfogadásáról vagy elvetéséről egy ismert eloszlású ún. próbastatisztika segítségével döntünk. x − µ 21 − 20 z emp = = = 1,26 2,5 σ 10 n A döntési szabályunk az, hogy H0-t elfogadjuk, ha a zemp kisebb, mint a 2,5%-hoz tartozó kritikus érték (azaz 1,96), elutasítjuk, ha zemp meghaladja ezt az értéket. Ez 5%-os szignifikancia szintet jelent, hiszen kétoldali alternatív hipotézisünk van, hiszen 2,5% esélyt adunk annak, hogy helytelenül döntsünk a pozitív effektusról, és 2,5%-ot annak, hogy helytelenül döntsünk a negatív effektusról. Esetünkben zemp < zkrit, tehát elfogadhatjuk a nullhipotézist, miszerint a vegyület nem okozott változást.
Megjegyzés: Mi van akkor, ha nem ismerjük a szórást? Nyilván becslést kell adnunk rá. Ha nagy mintából becsüljük, akkor feltételezhetjük, hogy a becslés elegendően pontos, és alkalmazhatjuk az eddig leírtakat. Ha a populáció eloszlása normális, akkor kis minta esetén a t-eloszlás használatával korrigálhatjuk a módszert. Ennek az lesz a hatása, hogy a kritikus értékek távolabb fognak esni a H0-ban feltételezett µ0 átlagértéktől. Például, ha az egértömegek esetén nem ismerjük a szórást, csak becsültük a 10 elemű mintából, és az 2,5-nek adódott, akkor egyoldali próba esetén a kritikus érték: x − µ 21 − 20 t emp = = = 1,26 s 2,5 n 10 A tkrit. értéket a t-táblázat alapján határozzuk meg. A szabadsági fok n - 1 = 9, a szignifikancia szint 0,05. A kritikus értéket a táblázat α/2 = 0,025 részénél kell keresni a kétoldali alternatív hipotézis miatt. Így tkrit. =2,26. Kétmintás próbák: Előző példánkban azt vizsgáltuk, hogy egy új vegyület hatására változnak-e az egértömegek az előző generációk adatai alapján megállapított, elméleti értékhez képest. Nagyon gyakran azonban nem áll rendelkezésünkre ilyen elméleti érték. Ilyen esetekben célszerű egy másik (kontroll) csoporthoz viszonyítanunk az eredményeinket. Szinte mindig ez az eljárás gyógyszer-hatás vizsgálatnál. Gyakran előfordul az is, hogy egyszerűen csak két csoportot (populációt) szeretnénk összehasonlítani. Például, szeretnénk megtudni, hogy vajon a dohányosok rövidebb ideig élnek-e, mint a nem dohányosok, a Holstein-Frízek tejtermelése nagyobb-e Németországban, mint nálunk … A két összehasonlítandó csoportnak nem tudjuk a populáció átlagait, csak a belőlük kiválasztott
minták átlagait tudjuk összehasonlítani, és azt vizsgáljuk, hogy a kettő szignifikánsan különbözik-e. A nullhipotézis a következő lehet: két minta középértéke azonosnak tekinthető-e? H0 : x1 = x2 z-próba: Akkor használjuk, ha mind a két sokaság normális eloszlású, az alapsokaságok szórásai ismertek vagy a minták elemszámai kellően nagyok. x1 − x 2 z=
σ 12
+
σ 22
n1 n2 t-próba: Normális eloszlású sokaságok esetén, amikor a szórások nem ismertek, de közel azonosak. x1 − x 2 t= , a szabadsági fok száma: n1+n2-2 1 1 Sp + n1 n2 Sp =
(n1 − 1)s12 + (n2 − 1)s22 n1 + n2 − 2
Példa: Két halastóból származó halak zsírtartalmát szeretnénk összehasonlítani. Az egyik tóból 22 elemű mintánk van, a minta átlaga 27%, szórása 4%. A másik esetben 25 elemű minta alapján az átlagos zsírtartalom 24%, szórása 3%. A számok alapján úgy tűnik, hogy az első tó esetén nagyobb a zsírtartalom. Kérdés, hogy ez a különbség szignifikáns-e, vagy csak a mintavételi hiba okozta a különbséget? Megoldás: Nullhipotézis: nincs különbség a két zsírtartalom között H0 : µ1 = µ2. Alternatív hipotézis: van különbség a két zsír-tartalom között H1 : µ1 ≠ µ2. Ha a mintáink elég nagyok, akkor a mintaátlagok normális eloszlásúak lesznek. (Nem túl nagy minták esetén, az egymintás esethez hasonlóan, itt is a t-eloszlást kell használni a normális eloszlás helyett.) Mintaátlag x1
Várható értéke µ1
x2
µ2
Szórása σ1 n1 σ2 n2
Ha a minták függetlenek, akkor a mintaátlagok különbsége is normális eloszlású. Ha a σ 12 σ 22 . Példánkban x1 szórásukat ismerjük, akkor x1 - x 2 várható értéke µ1-µ2, szórása + n1 n2 x 2 eloszlása N(0, (1.04)2).
z emp =
x1 − x 2
σ 12 n1
+
σ 22
=
n2
0,27 − 0,24 0,03 = = 2,886 0,0016 0,0009 0,000108 + 22 25
zkrit = 1,96 a t eloszlás táblázatának ∞ szabadsági fok sora és α/2 = 0,025 oszlopából, mivel kétoldali alternatív hipotézisünk van. (Ez 5%-os szignifikancia szintet jelent. Esetünkben zemp > zkrit, tehát elutasítjuk a nullhipotézist, az eltérés nem a véletlennek köszönhető. Példa: Egy vizsgálatban arra kerestek választ, hogy vajon a városi vagy a falvakban lakó kismamák maradnak-e tovább otthon gyermekeikkel. Egy nagyvárosban véletlenszerűen 20 kismamát kérdeztek meg, a környéken levő kisebb településeken pedig 40-et. A városiak átlagosan 26 hónapig, 3 hónap szórással, a falvakban pedig átlagosan 30 hónapig 4 hónap szórással. Szignifikáns-e a különbség a tapasztalt értékek között? Megoldás: Nullhipotézis: H0: µfalusi = µvárosi; H1 : µfalusi > µvárosi . x1 − x 2 A megoldáshoz a t-próbát alkalmazhatjuk: t = 1 1 Sp + n1 n2 Sp =
(n1 − 1)s12 + (n2 − 1)s22 n1 + n2 − 2 Sp =
, ahol
és a szabadsági fok száma: n1+n2-2.
(n1 − 1)s12 + (n2 − 1)s22 n1 + n2 − 2
=
39 ⋅16 + 19 ⋅ 9 795 = = 3,702 40 + 20 − 2 58
x1 − x 2 30 − 26 = 3,945 = 1 1 1 1 + Sp + 3,702 40 20 n1 n2 A szabadsági fok száma 58, és a 95%-os megbízhatósági szinthez tkrit = 1,672 érték tartozik. Mivel temp > tkrit, tehát elutasítjuk a nullhipotézist, a kisebb településeken tovább maradtak otthon a kismamák. t emp =
Páros t-próba Tegyük fel, hogy egy mintán vizsgáljuk valamilyen kezelésnek a hatását. Ilyen esetekben nem a mintaátlagokat hasonlítjuk össze, hanem a kezelés előtti és utáni érték különbségéről állapítjuk meg, hogy szignifikánsan különbözik-e nullától. Példa. Egy lázcsillapító gyógyszer hatásosságát vizsgáljuk. A betegek hőmérsékletét kétszer, a lázcsillapító bevétele előtt illetve után mérjük meg. A mért értékeket és a változást a következő táblázat tartalmazza. Lázcsillapítás előtt után 39,2 38,6 38,7 37,2 37,9 36,8 38,8 37,9
Különbség 0,6 1,5 1,1 0,9
39,4 38,2 38,6 38,8 39,0 38,5
38,2 38,0 36,9 37,8 37,9 37,6
1,2 0,2 1,7 1,0 1,1 0,9
Megoldás: A hipotéziseket formálisan felírva: H0 : µd = 0, H1 : µd ≠ 0. A különbségek átlaga: d = 1,02 , szórása sd = 0,42. Vagyis a nullhipotézis szerint a gyógyszer hatástalan. Ettől kezdve mindent úgy kell csinálnunk, mint az egymintás próba esetén. Ezek szerint az x d mintaátlag eloszlása normális, várható értéke 0. A szabadsági fok esetünkben n-1 = 9, az ehhez és a 95%-os valószínűséghez tartozó t érték 2,26. Ha igaz a nullhipotézis, akkor temp < tkrit. x − µ 1,02 − 0 = = 7,68 t emp = 0,42 s 10 n Ez nem teljesül, ezért elutasítjuk a nullhipotézist. Tehát azt mondhatjuk, hogy a lázcsillapító gyógyszer hatásos. Szórásokra, varianciákra vonatkozó próbák (F-próba.) A t-próba tárgyalásánál már volt arról szó, hogy a próbát másképp kell elvégezni, ha a két sokaság szórása (szórásnégyzete) megegyezik, és másképp akkor, ha nem. Felmerül a kérdés, hogy hogyan lehet eldönteni, hogy a szórásnégyzetek megegyeznek-e. Legyen σ21 az első, σ22 a második populáció varianciája (szórásnégyzete). Ekkor a null- és az alternatív hipotézisek a következők lesznek: H0 : σ21 = σ22 , H1 : σ21 ≠ σ22. Ha H0 igaz, akkor a két populáció szórásnégyzetének hányadosa 1. Két minta alapján s2 becsüljük ezt a hányadost. A becslést F-statisztikának nevezzük, ahol F = 12 , és s21 az első, s2 2 s 2 a második minta korrigált tapasztalati szórásnégyzete, ahol s1 > s2. Ha ez az F érték elég közel van 1-hez, akkor azt mondhatjuk, hogy az eltérést csupán a véletlen mintavételből származó hiba okozta, így elfogadhatjuk a H0-t, egyébként pedig elutasítjuk. Minél nagyobbak a mintáink, annál jobban megközelíti a minták szórásnégyzete a sokaság szórásnégyzetét. Ilyen esetekben az 1-től csak kis eltérést engedünk meg. Ha a mintáink viszonylag kicsik, akkor pedig még nagyobb eltérés esetén is elfogadjuk a nullhipotézist. Az is előfordulhat, hogy az egyik minta kicsi, a másik pedig nagy. Ebből is kitűnik, hogy mind a két minta elemszámától függ, hogy az 1 körüli mekkora intervallumban fogadjuk el a H0 hipotézist. Az F-statisztika eloszlása különböző minta elemszámok esetén más és más lesz. Hasonlóan a t-statisztikához, itt is a szabadsági fok mutatja meg, hogy melyik F-eloszlást kell választanunk. A két minta szabadsági foka (n1 - 1, n2 - 1), ahol n1 az első minta, n2 pedig a második minta elemszáma. A táblázatokat általában 5%-os szignifikancia szintre közlik a különböző statisztika könyvek. Példa:
A jövedelmek differenciálódásával kapcsolatos felmérés alapján azt találták hogy egy adott régióban az 1000 egyéni vállalkozó adóbevallása alapján a jövedelmek szórása 15 400 Ft volt. A következő évben ugyanitt, egy 25 elemű véletlen minta alapján már 19 100 Ft volt. Igazolható-e statisztikailag a jövedelmek differenciálódásáról szóló elmélet? Megoldás: H0 : σ21 = σ22 , vagyis a szórások (szórásnégyzetek) megegyeznek. H1 : σ21 ≠ σ22, különbözőek a szórásnégyzetek. s12 19100 2 = 1,538 , a számláló szabadsági foka 24, a nevezőé pedig 999. Fkrit = 1,53. Femp = 2 = s2 15400 2 Mivel Femp > Fkrit így a nullhipotézist elvethetjük, a jövedelmek valóban differenciálódtak. Megállapításunkat 95%-os megbízhatósági szinten tettük. Felhasznált irodalom Baráth Cs. – Ittzés A. – Ugrósdy Gy.: Biometria. Mezőgazda Kiadó 1996 Kiss A. – Manczel J. – Pintér L. –Varga K.: Statisztikai módszerek alkalmazása a mezőgazdaságban. Mezőgazdasági Kiadó 1983 Kovács István: Statisztika. Szent István Egyetem Gazdálkodási és Mezőgazdasági Főiskolai Kar jegyzete. Gyöngyös 2000 Kriszt – Varga – Kenyeres: Általános statisztika II. Nemzeti tankönyvkiadó 1997. Fodor János: Biomatematika http://www.univet.hu/users/jfodor/index_h.html Meszéna György – Ziermann Margit: Valószínűségelmélet és matematikai statisztika Közgazdasági és Jogi Könyvkiadó 1981 Murray R. Spiegel: Statisztika. Elmélet és gyakorlat. Panem – McGraw – Hill 1995 Szűcs István: Alkalmazott statisztika. Agroinform Kiadó 2002