´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
Statisztika ´ ´ Hipotezisvizsg alat ´ ´ Szekely Balazs
2010. december 2.
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
˝ as ´ vazlat ´ Eload 1
´ Intervallumbecslesek ´Altalanosan ´ ´ Pelda
2
´ ´ ak ´ Parameteres prob ´ pelda ´ Kiindulasi ´ ´ ek ´ tesztelese, ´ ´ as ´ ismert Varhat o´ ert ha a szor ´ ´ ek ´ tesztelese, ´ ´ as ´ ismeretlen Varhat o´ ert ha a szor
3
´ ´ Hipotezisek fajtai ´ ketoldali ´ ´ Egy- es ellenhipotezis ´ es ´ ketmint ´ ´ prob ´ ak ´ Egymintas as
4
´ ´ ak ´ Nemparameteres prob ´ ´ Khi negyzet eloszlas ´ vizsgalat ´ Illeszkedes ´ vizsgalat ´ Homogenitas ´ vizsgalat ´ Fuggetlens ¨ eg
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ anosan ´ ´ Altal Pelda
´ Intervallumbecslesek
´ ek ´ helyett egy intervallumot adunk a parameter ´ Egy ert ´ ere. ´ becsles ´ a hipotezisvizsg ´ ´ alapja. Az intervallumbecsles alat
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ anosan ´ ´ Altal Pelda
´ Intervallumbecslesek ´ csalad. ´ Adott egy X = (X1 , X2 , . . . , Xn ) Adott Pθ , θ ∈ Θ eloszlas ´ ol. ´ Adott a parameter ´ fuggetlen ¨ minta a Pθ eloszlasb egy ´ fuggv ¨ enye ψ(θ). Defin´ıcio´ ´ ´ intervallum legalabb ´ A (T1 (X ), T2 (X )) statisztika parral definialt ´ 1 − ε szintu˝ konfidencia intervvalum a ψ(θ) parameterre, ha Pθ (T1 (X ) < ψ(θ) < T2 (X )) ≥ 1 − ε
∀θ ∈ Θ,
´ ahol ε > 0 kicsi szam. 1 − ε neve konfidenciaszint. ´ Ha a Pθ -k folytonos eloszasok, akkor lehet pontosan 1 − ε ´ beszelni: ´ szintu˝ konfidenciaintervallumrol Pθ (T1 (X ) < ψ(θ) < T2 (X )) = 1 − ε
∀θ ∈ Θ,
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ anosan ´ ´ Altal Pelda
´ Konfidenciaintervallum jelentese ´ a parameterre ´ ´ Legyen most ψ(θ) = θ, tehat konstrualunk egy 95% szintu˝ konfidenciaintervallumot: Pθ (T1 (X ) < θ < T2 (X )) = 0, 95
∀θ ∈ Θ,
´ Vegyunk ¨ nagyon sok, mondjuk M darab, n elemu˝ mintat. ´ ıtsuk Mindegyikhez kesz´ ¨ el a (T1 (x ), T2 (x)) intervallumot. Ez M darab itervallum. ´ Fontos teny ´ 95%-os konfidenciaszint jelentese: az adatsorok 95%-ban (0, 95 · M esetben) θ ∈ (T1 (x), T2 (x )) viszont az adatsorok 5%-ban θ ∈ / (T1 (x ), T2 (x)) .
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ anosan ´ ´ Altal Pelda
Konfidenciaintervallum ´ Pelda
´ ol: ´ 281, 308, 300, Adott egy 30 elemu˝ minta N (m, 20) eloszlasb 285, 294, 272, 302, 301, 306, 297, 279, 286, 302, 316, 286, 296, 293, 291, 297, 301, 311, 293, 286, 286, 297, 305, 278, 300, 301, 300. ´ ´ ekre ´ Szerkesszunk ¨ az ismeretlen varhat o´ ert 95% szintu˝ konfidenciaintervallumot.
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ anosan ´ ´ Altal Pelda
Konfidenciaintervallum ´ eloszlas ´ varhat ´ ´ ek ´ ere ´ ismert szor ´ as ´ eseten ´ A normalis o´ ert
Legyen X1 , . . . , Xn ∼ N (m, σ0 ) fuggetlen ¨ minta. σ0 ismert, m ismeretlen. ´ ´ ekre ´ ´ 1 − ε szintu˝ Az ismeretlen varhat o´ ert szeretnenk konfidenciaintervallumot szerkeszteni. ´ a varhat ´ ´ eknek, ´ Tudjuk, hogy X n torz´ıtatlan, konzisztens becslese o´ ert ´ eloszlas ´ szimmetrikus a varhat ´ ´ ekre, ´ m-nek. Mivel a normalis o´ ert ´ az intervallumot ezert X n − rε , X n + rε alakban keressuk. ¨ Az 1 − ε szint azt jelenti, hogy
´ Pm (X n − rε < m < X n + rε ) = 1 − ε. Alak´ıtsjuk az esemenyt: Pm (X − r < m < X + r ) = P (−r < X − m < r ) = n ε n ε m ε n ε √ √ √ rε X n −m ε Pm −r n < n < σ0 σ0 σ0 n = √ √ )−nm X1 +···+Xn −mn X n −m √ n n = (X1 +···+X ∼ N (0, 1) σ0 n = nσ nσ0 0 √ √ √ ε =Φ σrε0 n − Φ −r n = 2Φ σrε0 n − 1 = 1 − ε σ0 √ u σ0 √ ´ az , tehat Φ σrε0 n = 1 − 2ε . ´Igy uε/2 := Φ−1 1 − 2ε . rε = ε/2 n uε/2 σ0 uε/2 σ0 1 − ε szintu˝ konfidencia itervallum: X n − √n , X n + √n
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ anosan ´ ´ Altal Pelda
Konfidenciaintervallum ´ Pelda
´ ol: ´ 281, 308, 300, Adott egy 30 elemu˝ minta N (m, 20) eloszlasb 285, 294, 272, 302, 301, 306, 297, 279, 286, 302, 316, 286, 296, 293, 291, 297, 301, 311, 293, 286, 286, 297, 305, 278, 300, 301, 300. ´ ´ ekre ´ Szerkesszunk ¨ az ismeretlen o´ ert 95% szint varhat u˝ u σ0 uε/2 σ0 √ √ X + konfidenciaintervallumot. X n − ε/2 , n n n n = 30, ε = 0, 05, σ0 = 20 X = 295, σ0 −1 ´ rε = √ Φ 1 − 2ε = √2030 Φ−1 (0, 975) ≈ 7, 16 Tehat: n (x 30 − r0,05 , x 30 + r0,05 ) = (295 − 7, 16, 295 + 7, 16) = (287, 84, 302, 16). ´ A konfidenciaintervallum jelentese: a 30 hosszu´ adatsorok ´ ´ 95%-aban az igazi parameter beleesik a ´ konfidenciaintervallumba, 5%-aban pedig nem.
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
˝ as ´ vazlat ´ Eload 1
´ Intervallumbecslesek ´Altalanosan ´ ´ Pelda
2
´ ´ ak ´ Parameteres prob ´ pelda ´ Kiindulasi ´ ´ ek ´ tesztelese, ´ ´ as ´ ismert Varhat o´ ert ha a szor ´ ´ ek ´ tesztelese, ´ ´ as ´ ismeretlen Varhat o´ ert ha a szor
3
´ ´ Hipotezisek fajtai ´ ketoldali ´ ´ Egy- es ellenhipotezis ´ es ´ ketmint ´ ´ prob ´ ak ´ Egymintas as
4
´ ´ ak ´ Nemparameteres prob ´ ´ Khi negyzet eloszlas ´ vizsgalat ´ Illeszkedes ´ vizsgalat ´ Homogenitas ´ vizsgalat ´ Fuggetlens ¨ eg
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
´ ´ ´ asa ´ Feladat kituz ˝ ese, hipotezisek konstrual ´ pelda ´ Kiindulasi
´ ıtja, hogy uj, ´ ´ Egy fejleszto˝ azt all´ ´ energiatakarekos, akkumulatoros ´ ´ ´ ´ ´ funy´ ˝ ırot konstrualt, amelyek 5 oraig (300 perc) kepesek futni. Ennek ˝ es ´ ere ´ 30 tesztet vegezt ´ ´ idok ˝ hosszus ´ ara ´ ellenorz unk ¨ a futasi ´ ag (percben): 281, 308, 300, 285, 294, 272, 302, 301, 306, 297, 279, 286, 302, 316, 286, 296, 293, 291, 297, 301, 311, 293, 286, 286, 297, 305, 278, 300, 301, 300. ´ ´ idok ˝ normalis ´ eloszlas ´ uak Azt feltetelezz uk, ¨ hogy a futasi ´ valamilyen, ´ ´ ekkel. ´ ´ kedve´ ert ´ tegyuk ismeretlen varhat o´ ert Az egyszerus ˝ eg ¨ fel, ´ as ´ ismert, σ0 = 20 perc. hogy a szor ´ ıtasa: ´ ´ eloszlas ´ varhat ´ ´ eke ´ 300. A fejleszto˝ all´ a normalis o´ ert ´ ´ tesztelni, hogy az igazi varhat ´ ´ ek, ´ m Azt a hipotezist szeretnenk o´ ert ˝ 300-zal egyenlo: H0 : m = m0 , ahol m0 := 300. ´ ´ neven ´ Ha H0 nem igaz, akkor az alternat´ıv hipotezis (vagy mas ´ ellenhipotezis) igaz: H1 : m 6= m0 ´ H1 lefedik az osszes ¨ ´ lehetseges esetet. H0 es
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
¨ esek, ´ ¨ esek ´ ´ ´ Dont dont ertelmez ese ´ pelda, ´ ´ Kiindulasi konkretan
´ kell donten ¨ A 30 elemes minta alapjan unk, ¨ hogy H0 igaz, vagy H1 . ¨ esn ´ el ´ a cel: ´ Ha H0 -t elutas´ıtjuk, akkor annak jo´ oka A dont legyen. ¨ ´ eppen, ´ Kovetkez esk annak van bizony´ıto´ ereje, ha H0 -t ´ H1 -et fogadjuk el. elutas´ıtjuk, es
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
´ pelda ´ Kiindulasi
Legyen X1 , X2 , . . . , Xn egy fuggetlen ¨ minta N (m, σ0 ) ´ ol, ´ ahol σ0 ismert, es ´ m ismeretlen parameter. ´ eloszlasb ´ ´ eke ´ erdekel. ´ Minket az m parameter igazi ert ´ asa. ´ Legyen x1 , x2 , . . . , xn a minta megvalosul ¨ es: ´ X = (X1 , X2 , . . . , Xn ), x = (x1 , x2 , . . . , xn ). Jelol ´ ´ eket, ´ ´ veszunk Kivalasztunk egy m0 ert es ¨ egy n elemu˝ minta ´ as ´ at, ´ x-et az N (m, σ0 ) eloszlasb ´ ol. ´ megvalosul
´ eldonteni ¨ ´ as ´ alapjan, ´ hogy az Azt szeretnenk az x megvalosul ˝ a minta general ´ odott ´ ´ igazi parameter, m amelyikbol ´ ´ ekkel. ´ megegyezik-e m0 -al az altalunk adott ert
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
¨ esek, ´ ¨ esek ´ ´ ´ Dont dont ertelmez ese ´ pelda, ´ ´ Kiindulasi konkretan
´ kell donten ¨ A 30 elemes minta alapjan unk, ¨ hogy H0 igaz, vagy H1 . ¨ esn ´ el ´ a cel: ´ Ha H0 -t elutas´ıtjuk, akkor annak jo´ oka A dont legyen. ¨ ´ eppen, ´ Kovetkez esk annak van bizony´ıto´ ereje, ha H0 -t ´ H1 -et fogadjuk el. elutas´ıtjuk, es
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
¨ es ´ Dont ´ ´ konzisztens becsles ´ et ´ ´ es: ´ Vegyuk Modszer: 1. lep ¨ egy torz´ıtatlan, es ´ ´ ´ az m parameternek. Az x mintaatlag egy ilyen becsles. ´ ¨ e´ egy 95% szintu˝ ´ es: ´ Konstrualjunk 2. lep ekor konfidenciaintervallumot: (x − u95% , x + u95% ). Ha m0 ∈ (x − u95% , x + u95% ), akkor elfogadjuk H0 -t 95%-os szinten. ¨ unk? Ha m0 ∈ / (x − u95% , x + u95% ), akkor mit donts ¨ Tudjuk, hogy a ´ 95%-ban az igazi konfidenciaintervallum olyan, hogy az x mintak ´ 5%-ban, pedig nem. Ezert ´ ket ´ opcionk ´ van ´ parameter beleesik, es ´ ´ ere: ´ m0 ∈ / . . . ertelmez es 1
´ 5%-ban azert ´ az igazi parameter ´ Az x mintak nem esik bele a ´ ˝ hogy m0 az igazi parameter, ´ konf. intervallumba ⇒ elkepzelhet o, ´ de veletlen ul ¨ nem esett bele.
2
´ ¨ ´ eppen ´ m0 nem az igazi parameter, kovetkez esk H0 nem igaz.
´ ınutlen, ˝ ezert ´ a Mivel 1. igen valosz´ ˝ csak az esetek 5%-ban fordul elo, ¨ ´ ´ 2. pontot vesszuk ¨ kovetkeztet esnek. Tehat: Ha m0 ∈ / (x − u95% , x + u95% ), akkor elvetjuk ¨ H0 -t 95%-os szinten.
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
¨ esek ´ ´ ´ ¨ esi ´ hibak ´ Dont ertelmez ese, dont ¨ esi ´ eljar ´ as ´ alapjan, ´ ha H0 -t elutas´ıtjuk, akkor annak jo´ Ezen dont oka van. ¨ ´ eppen, ´ Kovetkez esk annak van bizony´ıto´ ereje, ha H0 -t elutas´ıtjuk, azaz H1 -et fogadjuk el. ´Igy ha valamit bizony´ıtani szeretnenk, ´ ´ ıtast ´ akkor azt az all´ H1 -be kell tenni. ´ anak ´ ´ H0 elfogadas nincs bizony´ıto´ ereje. Lehet, hogy csak azert ´ adat. fogadtuk el H0 -t, mert nincs eleg ´ hibaz ´ as ´ lehet: Ket 1
2
˝ u´ hiba, ennek H0 teljesul, ¨ de elvetjuk, ¨ ez az elsofaj ´ ınus ´ valosz´ ˝ ege ε = 1−(szignifikancia szint). 95%-os ´ 5%. szignifikancia szint eseten ´ H0 nem teljesul, ¨ de elfogadjuk, ez a masodfaj u´ hiba.
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
´ ´ ´ asa ´ Feladat kituz ˝ ese, hipotezisek konstrual ´ pelda ´ ´ Kiindulasi megoldasa
´ ıtja, hogy uj, ´ ´ Egy fejleszto˝ azt all´ ´ energiatakarekos, akkumulatoros ´ ´ ´ ´ ´ funy´ ˝ ırot konstrualt, amelyek 5 oraig (300 perc) kepesek futni. Ennek ˝ es ´ ere ´ 30 tesztet vegezt ´ ´ idok ˝ hosszus ´ ara ´ ellenorz unk ¨ a futasi ´ ag (percben): 281, 308, 300, 285, 294, 272, 302, 301, 306, 297, 279, 286, 302, 316, 286, 296, 293, 291, 297, 301, 311, 293, 286, 286, 297, 305, 278, 300, 301, 300. ´ ´ idok ˝ normalis ´ eloszlas ´ uak Azt feltetelezz uk, ¨ hogy a futasi ´ valamilyen, ´ ´ ekkel. ´ ´ kedve´ ert ´ tegyuk ismeretlen varhat o´ ert Az egyszerus ˝ eg ¨ fel, ´ as ´ ismert, σ0 = 20 perc. hogy a szor ´ ıtasa: ´ ´ eloszlas ´ varhat ´ ´ eke ´ 300. A fejleszto˝ all´ a normalis o´ ert ´ ´ tesztelni, hogy az igazi varhat ´ ´ ek, ´ m Azt a hipotezist szeretnenk o´ ert ˝ 300-zal egyenlo: H0 : m = m0 , ahol m0 := 300. ´ ´ neven ´ Ha H0 nem igaz, akkor az alternat´ıv hipotezis (vagy mas ´ ellenhipotezis) igaz: H1 : m 6= m0 ´ H1 lefedik az osszes ¨ ´ lehetseges esetet. H0 es
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
´ ´ A pelda megoldasa ´ Hipotezisek H0 : m = m0 , ahol m0 := 300. H1 : m 6= m0 ´ Konfidenciaintervallum szerkesztese. Tegyuk ¨ fel, hogy H0 ´ N (m0 , σ0 ). A teljesul, ¨ ekkor X1 , . . . , Xn eloszlasa konfidenciaszint 1 − ε. n = 30, σ0 = 20, 1 − ε = 0, 95 ⇒ ε = 0, 05. ´ ´ tudjuk, hogy a normalis ´ eloszlasra ´ Korabbr ol szerkesztett konfidenciaintervallum sugara 20 ε σ0 = √ Φ−1 (0, 975) ≈ 7, 16. r := √ Φ−1 1 − 2 n 30 ´ A megadott adatok atlaga 295. ´ a konfidenciaintervallum: (x 30 − r , x 30 + r ) Tehat = (295 − 7, 16, 295 + 7, 16) = (287, 84, 302, 16). Ennek eleme m0 = 300, ´ıgy H0 -t nem tudjuk elutas´ıtani, azaz el kell fogadni a ´ ıtas ´ at. ´ fejleszto˝ all´
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
´ ´ Formalizalva, teszt statisztikaval ´ ol, ´ ahol Legyen X1 , X2 , . . . , Xn egy fuggetlen ¨ minta N (m, σ0 ) eloszlasb ´ ´ ´ σ0 ismert, es m ismeretlen parameter. m0 adott parameter. ´ A hipotezisek: H0 : m = m0 H1 : m 6= m0 Ha H0 teljesul, ¨ azaz X1 , X2 , . . . , Xn egy fuggetlen ¨ minta N (m0 , σ0 ) ´ ol. ´ Ekkor eloszlasb H0 -t elfogadjuk 1 − ε szinten ⇔ σ σ0 −1 ε 0 m0 ∈ X n − √n Φ−1 1 − 2ε , X n + √ Φ 1 − 2 n √ X n −m0 ε ε −1 −1 1− 2 ⇔ −Φ 1 − 2 < n σ0 < Φ √ X n −m0 n σ0 neve: teszt statisztika. √ X n −m0 ´ ´ eke ´ 0-hoz kozeli. ¨ Ha H0 teljesul, ¨ akkor X n ≈ m0 , tehat n σ0 ert ´ Ha H0 nem teljesul, ¨ azaz m 6= m0 , akkor X n ≈ m 6= m0 tehat, √ X n −m0 ´ eke ´ ∞-ehz, vagy −∞-hez tart, ha n no. ˝ n σ0 ert √ ´Igy egy fix n-re akkor utas´ıtjuk el H0 -t, ha n X n −m0 a teszt statisztika σ0 ´ eke ´ tul ´ ekben. ´ ´ pont Φ−1 1 − 2ε . ert ´ nagy abszolut ´ ert A hatar
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
´ ´ ek ´ tesztelese, ´ ´ as ´ ismeretlen Varhat o´ ert ha a szor ´ ol, ´ ahol Legyen X1 , X2 , . . . , Xn egy fuggetlen ¨ minta N (m, σ) eloszlasb ´ m ismeretlen parameterek. ´ σ es ´ ´ eke ´ erdekel. ´ ´ tesztelni, Minket az m parameter igazi ert Azt szeretnenk ´ ekkel. ´ ´ A hipotezisek: hogy m az megegyezik-e egy adott m0 ert H0 : m = m0 H1 : m 6= m0 √ X n −m0 ´ as ´ ´ as ´ eseten ´ n σ0 a teszt statisztika. Most a szor Ismert szor ´ ast, ´q vegyuk ismeretlen. Becsulj ¨ uk ¨ a szor ¨ egy torz´ıtatlan, konzisztens Pn 1 2 ´ et ´ a szor ´ asnak: ´ becsles sn∗ = n−1 i=1 (Xi − X n ) . √ X n −m0 ´ Ez lesz a teszt statisztika. Tekintsuk ¨ a n s∗ statisztikat. n √ 0 ´ eke ´ 0-hoz kozeli. ¨ ´ n X ns−m ert Ha H0 teljesul, ¨ akkor X n ≈ m0 , tehat ∗ n
´ Ha H nem teljesul, ¨ azaz m 6= m0 , akkor X n ≈ m 6= m0 , tehat √ X n0−m0 ´ eke ´ vegtelenhez ´ ˝ tart, ha n no. n s∗ ert n √ 0 ´Igy egy fix n-re akkor utas´ıtjuk el H0 -t, ha n X n −m a teszt statisztika sn∗ ´erteke ´ tul ´ ´ ´ nagy abszolut ´ ertekben. ´ hatara, ´ ´ ek? ´ Mi az elutas´ıtas a kritikus ert
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
´ ´ ek ´ tesztelese, ´ ´ as ´ ismeretlen Varhat o´ ert ha a szor ´ t eloszlasok
√ 0 ´ Ez lesz a teszt statisztika. statisztikat. Tekintsuk ¨ a n X ns−m ∗ n ´ hatara, ´ ´ ek? ´ Mi az elutas´ıtas a kritikus ert ´ ıtas ´ All´ ´ u´ (m0 !), akkor Ha X1 , . . . , Xn fuggetlen, ¨ azonos, N (m0 , σ) eloszlas √ X n − m0 ´ anak ´ n eloszlas neve: sn∗ ´ n − 1 szabadsagi ´ fokkal. t eloszlas ´ szimmetrikus. ´ uggv ´ ere, ´ Minden t eloszl Az eloszlasf ¨ eny √ as X n −m0 ´ ´ ´ Tn : x 7→ P n s∗ < x =: Tn (x ) fuggv ¨ enyre tablazat van. n ´ ek, ´ κ kiszamol ´ ´ 1 − ε szignifikancia szintre a kritikus ert asa: √ X n −m0 ´ a b.o. P(−κ < n s∗ < κ) = 1 − ε. Tehat n ´ szimmetrikus, = Tn−1 (κ) − Tn−1 (−κ) =, mivel a t eloszlas ´ = Tn−1 (κ) − (1 − Tn−1 (κ)) = 2Tn−1 (κ) − 1 = 1 − ε. Atrendezve: −1 ´ (1 − ε/2). ABRA! Tn−1 (κ) = 1 − ε/2. κ = Tn−1 √ 0 ´Igy H0 -t elfogadjuk 1 − ε szinten ⇔ −κ < n X n −m <κ s∗ n
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
´ azat ´ ´ ´ ınus ´ ere ´ Tabl t eloszlasok farok valosz´ ˝ eg
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
´ Pelda ´ belso˝ gyur ´ ´ er ´ oj ˝ et ´ merj ´ uk ´ a 6 darab csapagy ˝ uj ˝ enek atm ¨ az A es ´ om ˝ uszeren. ¨ ´ esi ´ eredmenyeket ´ B mer ˝ A kovetkez o˝ mer kapjuk: ´ csapagy A muszer ˝ B muszer ˝
1. 6,0 6,2
2. 10,1 9,9
3. 8,0 8,0
4. 13,0 12,9
5. 12,0 11,7
6. 9,2 9,0
´ eloszlasb ´ ol ´ szarmaz ´ ´ ´ (Az adatokat normalis onak feltetelezz uk.) ¨ ´ muszeren ´ ert ´ ek ´ 95%-os szinten Teszteljuk, ¨ mutat-e a ket ˝ mert ´ elter ´ est. ´ szignifikans ¨ ´ A kul ¨ onbs egek: -0,2; 0,2; 0; 0,1; 0,3; 0,2. ´ ´ ´ az elter ´ est ´ A feladat szerint az szignifikans, ha elternek. Tehat kell a H1 -be rakni. ´ tegyuk ¨ ´ ´ ol ´ vett Tehat ¨ fel, hogy a kul ¨ onbs egek N (m, σ) eloszlasb ´ ahol σ ismeretlen. ´Igy a hipotezisek: ´ fuggetlen ¨ mintak, H0 : m = 0 H1 : m 6= 0
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
´ Pelda (x1 ; . . . ; x6 ) = (-0,2; 0,2; 0; 0,1; 0,3; 0,2). √ X6 − 0 (m0 = 0) A teszt statisztika t5 = 6 s6∗ ´ t5 = 1, 369. Ezt kell x 6 = 0, 1, s6∗ = 0, 1789. Tehat ¨ osszehasonl´ ıtani a 95%-os szignifikancia szinthez tartozo´ κ ´ ekkel: ´ kritikus ert H0 -t elfogadjuk ⇔ |t5 | < κ. ´ ε = 0, 05. 95% szignifikancia szint eseten ´ ´ ek ´ κ = T5−1 (1 − ε/2) = T5−1 (0, 975). Korabbi dia: a kritikus ert ´Igy az 5 szabadsagfok ´ ´ 0,025 valosz´ ´ ınus ´ u˝ farkat ´ u´ t eloszlas ˝ eg ´ azatb ´ ´ T5−1 (0, 975) = 2, 571. keressuk. ¨ A tabl ol ´ nem tudjuk elutas´ıtani Mivel t5 = 1, 369 < 2, 571 = κ, ezert ´ a B gepek ´ H0 -t, azaz nem tudjuk bizony´ıtani, hogy az A es ¨ oz ¨ o˝ pontossaggal ´ ¨ enek. ´ kul ¨ onb muk ˝ odn
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
´ azat ´ ´ ´ ınus ´ ere ´ Tabl t eloszlasok farok valosz´ ˝ eg
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Kiindulas σ ismert σ ismeretlen
´ Pelda (x1 ; . . . ; x6 ) = (-0,2; 0,2; 0; 0,1; 0,3; 0,2). √ X6 − 0 (m0 = 0) A teszt statisztika t5 = 6 s6∗ ´ t5 = 1, 369. Ezt kell x 6 = 0, 1, s6∗ = 0, 1789. Tehat ¨ osszehasonl´ ıtani a 95%-os szignifikancia szinthez tartozo´ κ ´ ekkel: ´ kritikus ert H0 -t elfogadjuk ⇔ |t5 | < κ. ´ ε = 0, 05. 95% szignifikancia szint eseten ´ ´ ek ´ T5−1 (1 − ε/2) = T5−1 (0, 975). Korabbi dia: a kritikus ert ´Igy az 5 szabadsagfok ´ ´ 0,025 valosz´ ´ ınus ´ u˝ farkat ´ u´ t eloszlas ˝ eg keressuk. ¨ ´ azatb ´ ´ T5−1 (0, 975) = 2, 571. A tabl ol ´ nem tudjuk elutas´ıtani Mivel t5 = 1, 369 < 2, 571 = κ, ezert ´ a B gepek ´ H0 -t, azaz nem tudjuk bizony´ıtani, hogy az A es ¨ oz ¨ o˝ pontossaggal ´ ¨ enek. ´ kul ¨ onb muk ˝ odn
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
˝ as ´ vazlat ´ Eload 1
´ Intervallumbecslesek ´Altalanosan ´ ´ Pelda
2
´ ´ ak ´ Parameteres prob ´ pelda ´ Kiindulasi ´ ´ ek ´ tesztelese, ´ ´ as ´ ismert Varhat o´ ert ha a szor ´ ´ ek ´ tesztelese, ´ ´ as ´ ismeretlen Varhat o´ ert ha a szor
3
´ ´ Hipotezisek fajtai ´ ketoldali ´ ´ Egy- es ellenhipotezis ´ es ´ ketmint ´ ´ prob ´ ak ´ Egymintas as
4
´ ´ ak ´ Nemparameteres prob ´ ´ Khi negyzet eloszlas ´ vizsgalat ´ Illeszkedes ´ vizsgalat ´ Homogenitas ´ vizsgalat ´ Fuggetlens ¨ eg
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ ketoldali ´ ´ Egyoldali es ellenhipotezis ´ belso˝ gyur ´ ´ er ´ oj ˝ et ´ merj ´ uk ´ 1. pelda. 6 darab csapagy ˝ uj ˝ enek atm ¨ ´ a B mer ´ om ˝ uszeren. ¨ ´ esi ´ eredmenyeket ´ az A es ˝ A kovetkez o˝ mer kapjuk: ´ 1. 2. 3. 4. 5. 6. csapagy A muszer ˝ 6,0 10,1 8,0 13,0 12,0 9,2 B muszer ˝ 6,2 9,9 8,0 12,9 11,7 9,0 ´ eloszlasb ´ ol ´ szarmaz ´ ´ ´ (Az adatokat normalis onak feltetelezz uk.) ¨ ´ muszeren ´ ert ´ ek ´ 95%-os szinten Teszteljuk, ¨ mutat-e a ket ˝ mert ´ elter ´ est. ´ szignifikans ´ ´ minta 5 auto´ fogyasztasi ´ adatait ´ 2. pelda. Az alabbi ket ˝ a masodik ´ tartalmazza. Az elso˝ sorban a szerviz elotti, sorban ´ ert ´ ekek ´ ´ ´ a szerviz utani talalhat ok. ˝ szerviz elott 7,9 8,1 8,8 7,2 6,0 ´ szerviz utan 7,5 7,5 8,1 7,2 5,7 ¨ unk Donts ¨ 95%-os szignifikancia szinten, hogy a szerviz ¨ ´ csokkentette-e a fogyasztast.
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ ´ Ketoldali ellenhipotezis ´ belso˝ gyur ´ ´ er ´ oj ˝ et ´ merj ´ uk ´ 1. pelda. 6 darab csapagy ˝ uj ˝ enek atm ¨ ´ a B mer ´ om ˝ uszeren. ¨ ´ esi ´ eredmenyeket ´ az A es ˝ A kovetkez o˝ mer kapjuk: ´ 1. 2. 3. 4. 5. 6. csapagy A muszer ˝ 6,0 10,1 8,0 13,0 12,0 9,2 B muszer ˝ 6,2 9,9 8,0 12,9 11,7 9,0 ´ eloszlasb ´ ol ´ szarmaz ´ ´ ´ (Az adatokat normalis onak feltetelezz uk.) ¨ ´ muszeren ´ ert ´ ek ´ 95%-os szinten Teszteljuk, ¨ mutat-e a ket ˝ mert ´ elter ´ est. ´ szignifikans ´ esek ´ ¨ ´ er ´ ol ˝ feltetelezz ´ ´ u, Mer kul ¨ onbs eg uk, ¨ hogy N (m, σ) eloszlas ´ ´ σ ismeretlenek. A hipotezisek: ´ ahol m es H0 : m = 0 −κ κ H1 : m 6= 0. ´ kritikus ¨ es: ´ H0 -t elfogadjuk ⇔ |t5 | < κ, kritikus elfogadas Dont azaz H1 -t elfogadjuk ⇔ κ < t5 vagy t5 < −κ.
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ Egyoldali ellenhipotezis ´ ´ minta 5 auto´ fogyasztasi ´ adatait ´ 2. pelda. Az alabbi ket ˝ a masodik ´ tartalmazza. Az elso˝ sorban a szerviz elotti, sorban ´ ert ´ ekek ´ ´ ´ a szerviz utani talalhat ok. ˝ szerviz elott ´ szerviz utan
7,9 7,5
8,1 7,5
8,8 8,1
7,2 7,2
6,0 5,7
¨ unk Donts ¨ 95%-os szignifikancia szinten, hogy a szerviz ¨ ´ csokkentette-e a fogyasztast. ´ esek ´ ¨ ´ er ´ ol ˝ (utan–el ´ ˝ Mer kul ¨ onbs eg ott), -0,4 -0,6 -0,7 0 -0,3 ´ ´ u, ´ σ feltetelezz uk, ¨ hogy N (m, σ) eloszlas ´ ahol m es ´ ismeretlenek. A hipotezisek: H0 : m ≥ 0 ´ ´ csokkent. ¨′ H1 : m < 0. ←Szignifikans: a fogyasztas −κ
−κ′
¨ es: ´ H0 -t elfogadjuk ⇔ Dont < t4 , kritikus azaz H1 -t elfogadjuk ⇔ t4 < −κ.
´ elfogadas
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ Egyoldali ellenhipotezis ´ ´ A 2. pelda megoldasa
´ as ´ ismeretlen, t-prob ´ at ´ kell alkalmazni. A Mivel a szor ´ ´ eke ´ probastatisztika ert √ x 5 √ −0, 4 = −3, 27. t4 = 5 ∗ = 5 s5 0, 075 ´ ´ 95%-os szignifikancia ert ´ ekhez ´ A 4 szabdsagfok u´ t eloszlas (= ´ ınus ´ ´ eke ´ ε = 0, 05 farok valosz´ ˝ eghez) tartozo´ kritikus ert κ′ = 2, 132. dh ´ Tehat t4 = −3, 27 < −2, 132 = −κ′ . ´Igy elutas´ıtjuk H0 -t, azaz a ´ szerviz jav´ıtott a fogyasztason. ´ a szerviz Figyeljuk ¨ meg, hogy 97,5%-os szinten is szignifikans ´ ´ nem. hatasa, viszont 99%-os szinten mar
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ Egyoldali ellenhipotezis ´ ´ A 2. pelda megoldasa
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ Egyoldali ellenhipotezis ´ ´ A 2. pelda megoldasa
´ as ´ ismeretlen, t-prob ´ at ´ kell alkalmazni. A Mivel a szor ´ ´ eke ´ probastatisztika ert √ x 5 √ −0, 4 = −3, 27. t4 = 5 ∗ = 5 s5 0, 075 ´ ´ 95%-os szignifikancia ert ´ ekhez ´ A 4 szabadsagfok u´ t eloszlas ´ ınus ´ ´ eke ´ (= ε = 0, 05 farok valosz´ ˝ eghez) tartozo´ kritikus ert κ′ = 2, 132. −κ′ kritikus
´ elfogadas
´ Tehat t4 = −3, 27 < −2, 132 = −κ. ´Igy elutas´ıtjuk H0 -t, azaz a ´ szerviz jav´ıtott a fogyasztason. ´ a szerviz Figyeljuk ¨ meg, hogy 97,5%-os szinten is szignifikans ´ ´ nem. hatasa, viszont 99%-os szinten mar
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ Egyoldali ellenhipotezis ´ ´ A 2. pelda megoldasa, 97,5%, 99% szignifikancia szintek
t4 = −3, 27
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ es ´ ketmint ´ ´ prob ´ ak ´ Egymintas as ´ ´ minta 5 auto´ fogyasztasi ´ adatait ´ A pelda. Az alabbi ket ˝ ˝ ´ tartalmazza. Az elso sorban a szerviz elotti, a masodik sorban ´ ert ´ ekek ´ ´ ´ a szerv´ız utani talalhat ok. ˝ szerviz elott ´ szerviz utan
7,9 7,5
8,1 7,5
8,8 8,1
7,2 7,2
6,0 5,7
¨ unk Donts ¨ 95%-os szignifikancia szinten, hogy a szerviz ¨ ´ csokkentette-e a fogyasztast. ´ ´ minta ket ´ kul ¨ oz ¨ o˝ gyaregys ´ ´ ´ B pelda. Az alabbi ket ¨ onb egben ´ ´ ´ ´ tapasztalt selejt-aranyra vonatkozik (ezrelekben). All´ıthato-e ´ ´ jobban 95%-os szignifikancia szinten, hogy az “A” gyaregys eg dolgozott? A B
11,9 12,1
12,1 12,0
12,8 12,9
12,2 12,2
12,5 12,7
11,9 12,6
12,5 12,6
11,8 12,8
12,4 12,0
12,9 13,1
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ prob ´ ak ´ Egymintas
´ ´ minta 5 auto´ fogyasztasi ´ adatait ´ A pelda. Az alabbi ket ˝ a masodik ´ tartalmazza. Az elso˝ sorban a szerviz elotti, sorban ´ ert ´ ekek ´ ´ ´ a szerv´ız utani talalhat ok. ˝ szerviz elott ´ szerviz utan
7,9 7,5
8,1 7,5
8,8 8,1
7,2 7,2
6,0 5,7
¨ unk Donts ¨ 95%-os szignifikancia szinten, hogy a szerviz ¨ ´ csokkentette-e a fogyasztast. ´ hiszen egy mintank ´ ¨ ´ Egymintas, van a kul ¨ onbs egekre, ´ ol. ´ -0,4 -0,6 -0,7 0 -0,3 N (m, σ) eloszlasb
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ ´ prob ´ ak ´ Ketmint as ´ ´ minta ket ´ kul ¨ oz ¨ o˝ gyaregys ´ ´ ´ B pelda. Az alabbi ket ¨ onb egben ´ ´ ´ ´ tapasztalt selejt-aranyra vonatkozik (ezrelekben). All´ıthato-e ´ ´ jobban 95%-os szignifikancia szinten, hogy az “A” gyaregys eg dolgozott? A B
11,9 12,1
12,1 12,0
12,8 12,9
12,2 12,2
12,5 12,7
11,9 12,6
12,5 12,6
11,8 12,8
12,4 12,0
´ ol. ´ Az elso˝ minta: X1 , X2 , . . . , Xn1 az N (m1 , σ1 ) eloszlasb ´ ´ ol. ´ A masodik minta: Y1 , Y2 , . . . , Yn2 az N (m2 , σ2 ) eloszlasb ´ m1 , m2 , σ1 , σ2 ismeretlen parameterek. Tegyuk ¨ fel, hogy ´ Xi -k fuggetlenek ˝ ¨ Yj -ktol. σ1 = σ2 es ´ ´ ´ ´ A hipotezisek ketoldali ellenhipotezis eseten: H 0 : m1 = m2 H1 : m1 6= m2 ´ ´ ´ (ez kell a B-ben): A hipotezisek egyoldali ellenhipotezis eseten H 0 : m1 ≥ m2 H 1 : m1 < m2 (A-ban kevesebb a selejt)
12,9 13,1
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ ´ prob ´ ak ´ Ketmint as
´ minta fuggetlen ´ a szor ´ asuk ´ Feltettuk, ¨ hogy a ket ¨ es ugyanaz. A teszt statisztika s X n1 − Y n2 n1 n2 (n1 + n2 − 2) tn1 +n2 −2 = q n1 + n2 (n − 1)s∗2 + (n − 1)s∗2 1
X
2
Y
´ ıtas ´ All´ ´ Yj -k ugyanabbol ´ az N (m, σ) Ha H0 teljesul, ¨ azaz Xi -k es ´ ol ´ valok ´ (m = m1 = m2 ), akkor eloszlasb ´ u´ n1 + n2 + 2 szabadsagi ´ fokkal. tn1 +n2 −2 t eloszlas
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ ´ prob ´ ak, ´ egy- es ´ ketoldali ´ ´ Ketmint as ellenhipotezissel tn1 +n2 −2 = q
X n1 − Y n2 (n1 −
1)sX∗2
+ (n2 −
1)sY∗2
r
n1 n2 (n1 + n2 − 2) n1 + n2
´ ´ ´ Ha H0 teljesul Ketoldali ellenhipotezis eseten: ¨ (m1 = m2 ), akkor ´ tn1 +n2 −2 ert ´ eke ´ 0-hoz kozeli. ¨ X n1 ≈ Y n2 , tehat ´ Ha H0 nem teljesul, ¨ azaz m1 6= m2 , akkor X n1 ≇ Y n2 tehat, ´ eke ´ vegtelenhez ´ ˝ tart, ha n no. tn1 +n2 −2 ert ´Igy egy fix n-re akkor utas´ıtjuk el H0 -t, ha tn +n −2 a teszt 1 2 ´ eke ´ tul ´ ekben. ´ statisztika ert ´ nagy abszolut ´ ert ´ H0 -t elfogadjuk ⇔ |tn1 +n2 −2 | < κ Tehat: ´ ´ Ha H0 teljesul Egyoldali ellenhipotezis eseten: ¨ (m1 ≥ m2 ), ′ ´ tn1 +n2 −2 ert ´ eke ´ > −κ . akkor X n1 ' Y n2 , tehat ´ Ha H0 nem teljesul, ¨ azaz m1 < m2 , akkor X n1 ≨ Y n2 tehat, ´ eke ´ −∞-hez tart, ha n no. ˝ tn1 +n2 −2 ert ´Igy egy fix n-re akkor utas´ıtjuk el H0 -t, ha tn +n −2 a teszt 1 2 ´ eke ´ tul statisztika ert ´ kicsi, azaz < −κ′ . ´ H0 -t elfogadjuk ⇔ −κ′ < tn1 +n2 −2 Tehat
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ ´ proba ´ ´ Ketmint as egyoldali ellenhipotezissel ´ ´ A B pelda megoldasa
´ ´ minta ket ´ kul ¨ oz ¨ o˝ gyaregys ´ ´ ´ B pelda. Az alabbi ket ¨ onb egben tapasztalt ´ ´ ´ ´ selejt-aranyra vonatkozik (ezrelekben). All´ıthato-e 95%-os ´ ´ jobban dolgozott? szignifikancia szinten, hogy az “A” gyaregys eg A B
11,9 12,1 12,8 12,2 12,5 11,9 12,5 11,8 12,4 12,9 12,1 12,0 12,9 12,2 12,7 12,6 12,6 12,8 12,0 13,1 ´ ol. ´ Az elso˝ minta: X1 , X2 , . . . , X10 az N (m1 , σ1 ) eloszlasb ´ ´ ol. ´ A masodik minta: Y1 , Y2 , . . . , Y10 az N (m2 , σ2 ) eloszlasb ´ A hipotezisek: H0 : m1 ≥ m2 H1 : m1 < m2 (A-ban kevesebb a selejt) ´ ´ t proba ´ kell. Felteheto-e, ˝ ´ asok ´ ˝ Ketmint as hogy a szor egyezoek? ´ ´ anak. ´ ´ at ´ vegz ´ unk, ¨ ki, Ugyanis ez feltetele a t-prob Erre F -prob ¨ az jon ´ hogy a szor ´q ´ elfogadhato, asok megegyeznek. √ X n1 −Y n2 n1 n2 (n1 +n2 −2) −Y 10 t18 = √ 90 = −1, 13 = √X 10∗2 ∗2 ∗2 ∗2 n +n (n1 −1)sX +(n2 −1)sY
1
2
9(sX +sY )
´ ek ´ 95%-os szignifikancia szinthez(= 0,05 elsofaj ˝ u´ A kritikus ert ´ ınus ´ ´ hibavalosz´ ˝ eghez) 18 szabadsagfokhoz κ′ = 1, 734. Mivel ´ H0 -t nem tudjuk elvetni. −κ′ = −1, 734 < t18 = −1, 13, ezert
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ Egyoldali ellenhipotezis ´ ´ A 2. pelda megoldasa, 97,5%, 99% szignifikancia szintek
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ketoldali ´ ´ ´ es ´ ketmint ´ ´ prob ´ ak ´ Egy- es ellenhipotezis Egymintas as
´ ´ prob ´ ak ´ egyoldali ellenhipotezissel ´ Ketmint as ´ ´ A B pelda megoldasa
´ ´ minta ket ´ kul ¨ oz ¨ o˝ gyaregys ´ ´ ´ B pelda. Az alabbi ket ¨ onb egben tapasztalt ´ ´ ´ ´ selejt-aranyra vonatkozik (ezrelekben). All´ıthato-e 95%-os ´ ´ jobban dolgozott? szignifikancia szinten, hogy az “A” gyaregys eg A B
11,9 12,1 12,8 12,2 12,5 11,9 12,5 11,8 12,4 12,9 12,1 12,0 12,9 12,2 12,7 12,6 12,6 12,8 12,0 13,1 ´ ol. ´ Az elso˝ minta: X1 , X2 , . . . , X10 az N (m1 , σ1 ) eloszlasb ´ ´ ol. ´ A masodik minta: Y1 , Y2 , . . . , Y10 az N (m2 , σ2 ) eloszlasb ´ A hipotezisek: H0 : m1 ≥ m2 H1 : m1 < m2 (A-ban kevesebb a selejt) ´ ´ t proba ´ kell. Felteheto-e, ˝ ´ asok ´ ˝ Ketmint as hogy a szor egyezoek? ´ ´ anak. ´ ´ at ´ vegz ´ unk, ¨ ki, Ugyanis ez feltetele a t-prob Erre F -prob ¨ az jon ´ hogy a szor ´q ´ elfogadhato, asok megegyeznek. √ X n1 −Y n2 n1 n2 (n1 +n2 −2) −Y 10 t18 = √ 90 = −1, 13 = √X 10∗2 ∗2 ∗2 ∗2 n +n (n1 −1)sX +(n2 −1)sY
1
2
9(sX +sY )
´ ek ´ 95%-os szignifikancia szinthez(= 0,05 elsofaj ˝ u´ A kritikus ert ´ ınus ´ ´ hibavalosz´ ˝ eghez) 18 szabadsagfokhoz κ′ = 1, 734. Mivel ´ H0 -t nem tudjuk elvetni. −κ′ = −1, 734 < t18 = −1, 13, ezert
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
˝ as ´ vazlat ´ Eload 1
´ Intervallumbecslesek ´Altalanosan ´ ´ Pelda
2
´ ´ ak ´ Parameteres prob ´ pelda ´ Kiindulasi ´ ´ ek ´ tesztelese, ´ ´ as ´ ismert Varhat o´ ert ha a szor ´ ´ ek ´ tesztelese, ´ ´ as ´ ismeretlen Varhat o´ ert ha a szor
3
´ ´ Hipotezisek fajtai ´ ketoldali ´ ´ Egy- es ellenhipotezis ´ es ´ ketmint ´ ´ prob ´ ak ´ Egymintas as
4
´ ´ ak ´ Nemparameteres prob ´ ´ Khi negyzet eloszlas ´ vizsgalat ´ Illeszkedes ´ vizsgalat ´ Homogenitas ´ vizsgalat ´ Fuggetlens ¨ eg
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ ´ ak ´ Nemparameteres prob 3 fajta feladatot oldunk meg: ´ vizsgalat: ´ ´ veszunk Illeszkedes egy X1 , . . . , Xn mintat ¨ egy ´ ol, ´ amely nem ismert szamunkra. ´ eloszlasb Igaz-e, hogy a ´ ´ ol ´ general ´ odott? ´ minta egy altalunk adott eloszlasb ´ 2,3 parameterrel.) ´ (Mondjuk Exponencialis ´ vizsgalat: ´ ´ mintank ´ van egy-egy Homogenitas ket ´ ol: ´ X1 , . . . , Xn es ´ Y1 , . . . , Ym . Igaz-e, hogy a ket ´ eloszlasb ´ eloszlas megegyezik? ´ vizsgalat: ´ ´ ´ minta Fuggetlens ¨ eg adott egy ketdimenzi os ´ ´ veges ´ ´ ek ´ u˝ (X1 , Y1 ), . . . , (Xn , Yn ) egy ketdimenzi os ert ´ ınus ´ valtoz ´ ´ ol. ´ Igaz-e, hogy a marginalisok, ´ valosz´ ˝ egi ob X ´ Y fuggetlenek? es ¨
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ ´ Khi negyzet eloszlas ´ ´ eloszlas ´ p1 , p2 . . . , pr az {1, 2, . . . , r } Adott egy veges diszkret ´ ekeken. ´ ert ˝ az eloszlasb ´ ol. ´ Adott egy X1 , X2 , . . . fuggetlen ¨ minta ebbol ¨ ˝ Mindennek az alapja a kovetkez o: ´ Tetel (n)
´ Legyen Ni = #{j : 1 ≤ j ≤ n, Xj = i} = “hanyszor fordult elo˝ Pr (n) ´ ek ´ az elso˝ n k´ıserletben”. ´ az i ert (Ugye i=1 Ni = n.) Ekkor 2 (n) r Ni − npi X −→ χ2r −1 npi i=1
´ ´ ´ u´ “khi-negyzet” eloszlas. amint n → ∞. χ2k k szabadsagfok
´ aval, ´ ´ megegyezik X12 + X22 + · · · + Xr2−1 eloszlas χ2r −1 eloszlasa ´ ahol X1 , X2 , . . . , Xr −1 fuggetlen ¨ standard normalis, N (0, 1), ´ uak. eloszlas ´
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ tabl ´ azat ´ Khi negyzet eloszlas,
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ ´ Khi negyzet eloszlas (n)
(n)
(n)
N i ∼ Binom(n; pi ),´ıgy ENi = np, Var(Ni ) = npi (1 − pi ). (n) (n) (n) N1 , N2 , . . . , Nr ∼ Polinomialis(n; p1 , p2 . . . , pr ) ´ bizony´ıtasa ´ r = 2-re: A tetel ´ ´ p2 = 1 − p . Legyen r = 2, azaz az eloszlasunk p1 = p es
Ekkor
“ ”2 (n) N1 −np np
+
“ ”2 (n) N2 −n(1−p) n(1−p)
¨ ´ osszeget vizsgaljuk. Hozzunk (n)
(n) = n − N1 : ”2 “ ”2 “ (n) (n) (1−p) N1 −np +p −N1 +np)
¨ os ¨ nevezore, ˝ ´ hasznaljuk, ´ koz es hogy N2 ”2 “ ”2 “ (n) (n) (1−p) N1 −np +p n−N1 −n(1−p) np(1−p)
=
“ ”2 (n) N1 −np np(1−p)
=
(n) N1 −np
√
np(1−p)
=
np(1−p)
2
´ szerint (= centralis-hat ´ ´ ´ A de Moivre-Laplace tetel areloszl as (n)
N ´ spec. esete): √ 1 tetel
−np
np(1−p)
−→ X ,
n → ∞,
´ a negyzet ´ ´ X 2 = χ22−1 . ahol X ∼ N (0, 1). Ezert eloszlasa
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ ´ Illeszkedesvizsg alat ´ Pelda
˝ u´ hibavalosz´ ´ ınus ´ mellet donts ¨ unk ´ a ε = 0, 05 elsofaj ˝ eg ¨ arrol ´ ˝ hogy az alabbi ´ ´ ´ hipotezisr ol, megfigyeles-sorozat szabalyos ´ ´ kockaval dobva adodott. ´ ekek ´ ert ´ gyakorisagok
1 24
2 21
3 19
1 ´ ınus ´ H0 : minden oldal valosz´ ˝ ege 6 ´ ınus ´ H1 : nem minden oldal valosz´ ˝ ege
1 6
4 12
5 13
6 11
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ ´ Illeszkedesvizsg alat ´ ´ erben ´ Adott egy r ≥ 2 pozit´ıv egesz. A hatt adott egy ´ amit mi nem ismerunk. π = (π1 , π2 , . . . , πr ) eloszlas, ¨ Nevezzuk ¨ ´ ´ ezt igazi eloszlasnak. Ekkor veszunk ¨ egy fuggetlen ¨ mintat ˝ az eloszlasb ´ ol: ´ X1 , X2 , . . . , Xn . ebbol ´ ´ Azt szeretnenk Megadunk egy p = (p1 , p2 , . . . , pr ) eloszlast. ´ megegyezik-e az altalunk ´ tesztelni, hogy az igazi eloszlas ´ adottal. ´Igy a hipotezisek: H0 : π = p H1 : π 6= p 2 P i) ´ a teszt statisztika χ2r −1 := ri=1 (Ni −np ´ Teszteles: . Miert? npi ´ a szaml ´ al ´ ok ´ Ha H0 teljesul, ¨ akkor Ni ≈ npi minden i-re. Ezert ¨ ¨ 0-hoz kozeliek, ´ıgy χ2r −1 0-hoz kozeli. Ha H0 nem teljesul, ¨ akkor valamelyik i-re Ni ≈ nπi 6= npi , ´ıgy (Ni −npi )2 ´ χ2r −1 tart ∞-hez, ha n → ∞ tart ∞-hez, tehat npi ´ fix n-re: H0 -t elfogadjuk ⇔ χ2r −1 < κ. Tehat
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ ´ Illeszkedesvizsg alat ´ fix n-re: H0 -t elfogadjuk ⇔ χ2r −1 < κ. Tehat Pontosabban: 1 − ε szinten elfogadjuk H0 -t, ha κ-ra teljesul: ¨ P χ2r −1 < κ = 1 − ε. 2 P i) ´ van χ2r −1 = ri=1 (Ni −np ´ ara, ´ Ehhez szuks ¨ eg eloszlas ha H0 npi ´ ol ´ vett fuggetlen teljesul, ¨ azaz X1 , . . . , Xn a p1 , . . . , pr eloszlasb ¨ minta. ´ szerint, ha H0 teljesul, A fenti tetel ¨ azaz π = p, azaz X1 , . . . , Xn ´ ol ´ vett fuggetlen a p1 , . . . , pr eloszlasb ¨ minta, Pr (Ni −npi )2 ´ u. akkor i=1 npi ´ aszimptotikusan χ2r −1 eloszlas ´Igy ahogy CHT-t alkalmazo´ kozel´ ¨ ıtesekn ´ ´ fix n-re is el, Pr (Ni −npi )2 2 ´ unak. ´ ´ χr −1 eloszlas ´ valvaltoz ot tekintsuk ¨ a i=1 npi
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ vizsgalat, ´ ´ ´ Illeszkedes a pelda megoldasa ˝ u´ hibavalosz´ ´ ınus ´ mellet donts ¨ unk ´ a ε = 0, 05 elsofaj ˝ eg ¨ arrol ´ ˝ hogy az alabbi ´ ´ ´ hipotezisr ol, megfigyeles-sorozat szabalyos ´ ´ kockaval dobva adodott. ´ ekek ´ ert ´ gyakorisagok
1 24
2 21
3 19
4 12
5 13
6 11
1 1 1 ´ ınus ´ H0 : minden oldal valosz´ ˝ ege 6 ⇔ (π1 , . . . , π6 ) = ( 6 , . . . , 6 ) H1 : H0 nem teljesul ¨ ⇔ (π1 , . . . , π6 ) 6= ( 61 , . . . , 61 ) ´ eke ´ A teszt statisztika P6 ert 2 2 2 +282 +222 +342 (Ni −npi )2 2 2 = 44 +26 +14 600 = 8, 72. χ5 = χ6−1 = i=1 npi 2 ´ ´ ´ 0, 95 szignifikancia Az 5 szabadsagfok u´ χ eloszlashoz es ´ ek ´ κ = 11, 07. szinthez tartozo´ kritikus ert ´ nem tudjuk elutas´ıtani H0 -t, ´ıgy a minta Mivel χ25 < κ ezert ´ ´ ol ´ szarmaz ´ ´ tekintheto˝ szabalyos kockab onak.
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ tabl ´ azat ´ Khi negyzet eloszlas,
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ vizsgalat, ´ ´ ´ Illeszkedes a pelda megoldasa ˝ u´ hibavalosz´ ´ ınus ´ mellet donts ¨ unk ´ a ε = 0, 05 elsofaj ˝ eg ¨ arrol ´ ˝ hogy az alabbi ´ ´ ´ hipotezisr ol, megfigyeles-sorozat szabalyos ´ ´ kockaval dobva adodott. ´ ekek ´ ert ´ gyakorisagok
1 24
2 21
3 19
4 12
5 13
6 11
1 1 1 ´ ınus ´ H0 : minden oldal valosz´ ˝ ege 6 ⇔ (π1 , . . . , π6 ) = ( 6 , . . . , 6 ) H1 : H0 nem teljesul ¨ ⇔ (π1 , . . . , π6 ) 6= ( 61 , . . . , 61 ) ´ eke ´ A teszt statisztika P6 ert 2 2 2 +282 +222 +342 (Ni −npi )2 2 2 = 44 +26 +14 600 = 8, 72. χ5 = χ6−1 = i=1 npi 2 ´ ´ ´ 0, 95 szignifikancia Az 5 szabadsagfok u´ χ eloszlashoz es ´ ek ´ κ = 11, 07. szinthez tartozo´ kritikus ert ´ nem tudjuk elutas´ıtani H0 -t, ´ıgy a minta Mivel χ25 < κ ezert ´ ´ ol ´ szarmaz ´ ´ tekintheto˝ szabalyos kockab onak.
χ2
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ vizsgalat, ´ ´ ´ Illeszkedes masik pelda ´ nelk ´ ul Megoldas ¨
´ ¨ Amikor az embereket megkerdezik, hogy mekkora a tomeg uk, ¨ ´ agosn ´ ´ kisebb ert ´ ekeket. ´ gyakran mondanak a valos al ´ eldonteni ¨ ´ ´ hogy igazi Szeretnenk az alabbi adathalmazrol, ´ esb ´ ol ˝ szarmazik, ´ ´ ´ eb ´ ol ˝ mer vagy az emberek megkerdez es ´ Azt a tenyt ´ ´ ´ es ´ eseten ´ az nyertek. fogjuk hasznalni, hogy mer ´ ´ anak ´ utolso´ szamjegyek eloszlas egyenletesnek kell lennie a ¨ unk {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} halmazon. Donts ¨ 0, 95 szinten ´ a hipotezisr ´ ˝ hogy mer ´ esb ´ ol ˝ szarmaznak ´ arrol ol, az adatok. ´ utoslo´ szamjegy ´ esek ´ ´ mer szama
0 35
1 4
2 4
3 3
4 4
5 24
6 2
7 4
8 8
9 2
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ vizsgalat, ´ ´ Homogenitas pelda
´ dobokock ´ ´ ´ ´ Ket aval dobva az alabbi gyakorisagokat figyeltuk ¨ meg: ´ ekek ´ ert I. kocka II. kocka
1 27 18
2 24 12
3 26 15
4 23 21
5 18 14
6 32 20
˝ u´ hibavalosz´ ´ ınus ´ mellet donts ¨ unk ´ hogy α = 0, 05 elsofaj ˝ eg ¨ arrol, ˝ a ket ´ eloszlas ´ azonosnak. tekintheto-e ´ eloszlas ´ azonos H0 : a ket ´ eloszlas ´ kul ¨ oz ¨ o˝ H1 : a ket ¨ onb
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ vizsgalat ´ Homogenitas ´ hatt ´ er ´ eloszlas ´ az {1, 2, . . . , r } halmazon: Adott ket ´ q = (q1 , q2 , . . . , qr ). Ezek nem ismertek. p = (p1 , p2 , . . . , pr ) es ´ ol ´ veszunk ´ X1 , X2 , . . . , Xn A p eloszlasb ¨ egy mintat: ´ ol ´ veszunk ´ Y1 , Y2 , . . . , Ym A q eloszlasb ¨ egy mintat: H0 : q = p H1 : q 6= p
´ ˝ az i ert ´ ekek ´ Legyen Ni = #{j : 1 ≤ j ≤ n, Xj = i} = n k´ıserletb ol ´ ´ szama az elso˝ mintaban. ´ ˝ az i ert ´ ekek ´ Legyen Mi = #{j : 1 ≤ j ≤ n, Yj = i} = n k´ıserletb ol ´ ´ szama az elso˝ mintaban. 2 Ni Mi r − X n m ´ A teszt statisztika T = nm . (H0 melletti eloszlasa Ni + Mi i=1 ismert.) N np mp M ´ ´ mj ≈ m j = pj , tehat Ha H0 teljesul, ¨ akkor minden j-re nj ≈ n j = pj es ´ al ´ ok ´ 0-hoz kozeliek, ¨ ´ szumma 0-hoz kozeli. ¨ a szaml ´ıgy az egesz ¨ ∞-hez tart. Ha H1 teljesul, ¨ akkor valamely j-re az egyik tort ´Igy fix n-re akkor fogadjuk el H1 -t, ha T eleg ´ nagy, κ < T .
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ vizsgalat ´ Homogenitas ´ ıtas ´ All´ ´ Y1 , Y2 , . . . , Ym ket ´ fuggetlen Ha X1 , X2 , . . . , Xn es ¨ minta ´ az eloszlasb ´ ol ´ az {1, 2, . . . , r } ert ´ ekeken, ´ ugyanabbol akkor 2 M N i i r X n − m −→ χ2r −1 , ha n → ∞. nm N i + Mi i=1
Pr
“
Ni n
M
− mi
”2
´ ugy ´ Fix n eseten ´ vesszuk, ¨ hogy nm i=1 Ni +Mi eloszlasa 2 ≈ χr −1 . ´ a dont ¨ es: ´ Tehat H0 -t 1 − ε szignifikancia szinten elfogadjuk ⇔ ” “ M 2 Ni − mi Pr n nm i=1 Ni +Mi < κ, ahol P(χ2r −1 < κ) = 1 − ε.
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ vizsgalat, ´ ´ ´ Homogenitas pelda megoldasa ´ dobokock ´ ´ ´ ´ Ket aval dobva az alabbi gyakorisagokat figyeltuk ¨ meg: ´ ekek ´ ert I. kocka II. kocka
1 27 18
2 24 12
3 26 15
4 23 21
5 18 14
6 32 20
˝ u´ hibavalosz´ ´ ınus ´ mellet donts ¨ unk ´ hogy α = 0, 05 elsofaj ˝ eg ¨ arrol, ˝ a ket ´ eloszlas ´ azonosnak. tekintheto-e ´ eloszlas ´ azonos H0 : a ket ´ eloszlas ´ kul ¨ oz ¨ o˝ H1 : a ket ¨ onb χ25
Pr
“N
i n
M
− mi
”2
= nm i=1 Ni +Mi = 2, 2 ´ 5 szabadsagi ´ fokhoz tartozo´ 0,95 szignifikancia szinthez es ´ ek ´ κ = 11, 07 kritikus ert ´ elfogadjuk, hogy a Mivel χ25 < κ, H0 -t nem tudjuk elvetni, tehat ´ dobokocka ´ ˝ ket azonosnak tekintheto.
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ tabl ´ azat ´ Khi negyzet eloszlas,
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ vizsgalat, ´ ´ ´ Homogenitas pelda megoldasa ´ dobokock ´ ´ ´ ´ Ket aval dobva az alabbi gyakorisagokat figyeltuk ¨ meg: ´ ekek ´ ert I. kocka II. kocka
1 27 18
2 24 12
3 26 15
4 23 21
5 18 14
6 32 20
˝ u´ hibavalosz´ ´ ınus ´ mellet donts ¨ unk ´ hogy α = 0, 05 elsofaj ˝ eg ¨ arrol, ˝ a ket ´ eloszlas ´ azonosnak. tekintheto-e ´ eloszlas ´ azonos H0 : a ket ´ eloszlas ´ kul ¨ oz ¨ o˝ H1 : a ket ¨ onb χ25
Pr
“N
i n
M
− mi
”2
= nm i=1 Ni +Mi = 2, 2 ´ 5 szabadsagi ´ fokhoz tartozo´ 0,95 szignifikancia szinthez es ´ ek ´ κ = 11, 07 kritikus ert ´ elfogadjuk, hogy a Mivel χ25 < κ, H0 -t nem tudjuk elvetni, tehat ´ dobokocka ´ ˝ ket azonosnak tekintheto.
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ vizsgalat, ´ ´ Fuggetlens ¨ eg Pelda ´ ´ ´ azat ´ ´ ¨ oz ¨ o˝ intenzitassal ´ Az alabbi harom tabl harom – a TV-ben kul ¨ onb ´ ´ fogyasztas ´ ara ´ vonatkozo´ adatokat tartalmaz a reklamozott – fogkrem ´ es ´ idejenek ´ ´ eben: ´ TV-nez fuggv ¨ eny ´ fajtaja→ ´ Fogkrem ´ es ´ hetente↓ TV nez ´ < 5 ora ´ 5–15 ora ´ > 15 ora
A ´ reklam ´ 1 ora 80 70 90
B ´ 5 perc reklam 60 70 65
C ´ 0 perc reklam 60 60 45
¨ ´ a kedvelt fogkrem ´ mark ´ aja ´ es ´ a TV nez ´ es ´ Van-e osszef ugg ¨ es ˝ ¨ ott? ¨ idotartama koz ´ ´ all ´ az adott kategori ´ ab ´ ol. ´ A cellakban az eladott mennyiseg ´ idotartama ˝ ´ a TV nez ´ es ´ fuggetlenek H0 : a reklam es ¨ ¨ ott ¨ uk ¨ ´ H1 : van koz ¨ osszef ugg ¨ es
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ vizsgalat ´ Fuggetlens ¨ eg ´ ´ veges ´ ´ ek ´ u˝ valvaltoz ´ ´ (X , Y ). Adott egy ketdimenzi os ert o, ´ ekei ´ ´ ekei ´ X ert {1, 2, . . . , r }, Y ert {1, 2, . . . , s}. ´ ´ Ehhez veszunk Tesztelni szeretnenk, hogy X fuggetlen-e ¨ Y -tol. ¨ egy n ´ (X1 , Y1 ), (X2 , Y2 ) . . . , (Xn , Yn ). elemu˝ mintat: P 1 2 ··· j ··· s sor 1 N11 N12 N1j N1s N1• 2 N21 N22 N2j N2s N2• .. . i Ni1 Ni2 Nij Nis Ni• .. . r P Nr 1 Nr 2 Nrj Nrs Nr • oszlop N•1 N•2 N•j N•s Pr Ps i=1 j=1 Nij = n. 2 N Nij r X s − Nni• n•j X n A teszt statisztika: χ2(r −1)(s−1) = n N N i=1 j=1
i•
n
•j
n
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ vizsgalat ´ Fuggetlens ¨ eg
A teszt statisztika: χ2(r −1)(s−1) = n
r X s X i=1 j=1
Nij n
−
Ni• N•j n n
Ni• N•j n n
2
´ Y fuggetlenek, Ha H0 teljesul, ¨ azaz X es ¨ akkor ´ a´ tudjuk, hogy P(X = i, Y = j) = P(X = i)P(Y = j). Tovabb Nij Ni• ´ ekkor n → P(X = i, Y = j), n → P(X = i), es N•j n
´ a szummaban ´ ¨ → P(Y = j). Tehat felsorolt tortek 0-hoz 2 ´ ¨ tartanak. Igy H0 -t elfogadjuk, ha χ(r −1)(s−1) 0-hoz kozeli. N
N
Ni• •j ij ´ Ha H1 teljesul, ¨ akkor valamilyen (i, j) parra n − n n → c 6= 0, ´ıgy n-es szorzo´ miatt χ2(r −1)(s−1) → ∞, ha n → ∞. ´ kicsi, azaz ha Fix n-re, H0 -t elfogadjuk, ha χ2(r −1)(s−1) eleg 2 ´ χ(r −1)(s−1) < κ, valamilyen kappara.
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ vizsgalat ´ Fuggetlens ¨ eg
χ2(r −1)(s−1) = n
r X s X i=1 j=1
Nij n
−
Ni• N•j n n
Ni• N•j n n
2
´ , ha n tart vegtelenhez,
´ u´ (r − 1)(s − 1) szabadsagfokkal. ´ akkor χ2 eloszlas ´ ´ ismert. (aszimptotikusan...) Azaz ha H0 teljesul, ¨ a hatareloszl as ¨ es: ´ Dont H0 -t elfogadjuk 1 − ε szinten ⇔ χ2(r −1)(s−1) < κ, ahol κ az ´ ´ ε valosz´ ´ ınus ´ (r − 1)(s − 1) szabadsagfok u´ χ2 eloszlas ˝ eghez 2 ´ tartozo´ farok eloszlasa, azaz P(χ(r −1)(s−1) > κ) = ε
(ez ugye azt jelenti, hogy P(χ2(r −1)(s−1) < κ) = 1 − ε)
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ vizsgalat, ´ ´ ´ Fuggetlens ¨ eg a pelda megoldasa ´ ´ ´ azat ´ ´ ¨ oz ¨ o˝ intenzitassal ´ Az alabbi harom tabl harom – a TV-ben kul ¨ onb ´ ´ fogyasztas ´ ara ´ vonatkozo´ adatokat tartalmaz a reklamozott – fogkrem ´ es ´ idejenek ´ ´ eben: ´ TV-nez fuggv ¨ eny ´ fajtaja→ ´ Fogkrem ´ es ´ hetente↓ TV nez ´ < 5 ora ´ 5–15 ora ´ > 15 ora
A ´ reklam ´ 1 ora 80 70 90
B ´ 5 perc reklam 60 70 65
C ´ 0 perc reklam 60 60 45
¨ ´ a kedvelt fogkrem ´ mark ´ aja ´ es ´ a TV nez ´ es ´ Van-e osszef ugg ¨ es ˝ ¨ ott? ¨ ¨ unk idotartama koz Donts ¨ 0,95%-os szinten. r =s=3 «2 „ N Nij N − ni• n•j P P n r s =6 χ24 = n i=1 j=1 Ni• N•j n
n
´ ´ ınus ´ ´ ek ´ a χ2 A 4 szabadsagfok u´ 0,05 farokvalosz´ ˝ eghez tartozo´ ert ´ eloszlasban κ = 9.488. Mivel χ24 < κ, elfogadjuk H0 -t.
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ tabl ´ azat ´ Khi negyzet eloszlas,
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ ´ ´ Intervallum Parameteres Hipotezisek Nemparameteres
χ2
´ ´ ´ Illeszkedes Homogenitas Fuggetlens ¨ eg
´ vizsgalat, ´ ´ ´ Fuggetlens ¨ eg a pelda megoldasa ´ ´ ´ azat ´ ´ ¨ oz ¨ o˝ intenzitassal ´ Az alabbi harom tabl harom – a TV-ben kul ¨ onb ´ ´ fogyasztas ´ ara ´ vonatkozo´ adatokat tartalmaz a reklamozott – fogkrem ´ es ´ idejenek ´ ´ eben: ´ TV-nez fuggv ¨ eny ´ fajtaja→ ´ Fogkrem ´ es ´ hetente↓ TV nez ´ < 5 ora ´ 5–15 ora ´ > 15 ora
A ´ reklam ´ 1 ora 80 70 90
B ´ 5 perc reklam 60 70 65
C ´ 0 perc reklam 60 60 45
¨ ´ a kedvelt fogkrem ´ mark ´ aja ´ es ´ a TV nez ´ es ´ Van-e osszef ugg ¨ es ˝ ¨ ott? ¨ ¨ unk idotartama koz Donts ¨ 0,95%-os szinten. r =s=3 «2 „ N Nij N − ni• n•j P P n r s =6 χ24 = n i=1 j=1 Ni• N•j n
n
´ ´ ınus ´ ´ ek ´ a χ2 A 4 szabadsagfok u´ 0,05 farokvalosz´ ˝ eghez tartozo´ ert ´ eloszlasban κ = 9.488. Mivel χ24 < κ, elfogadjuk H0 -t.