7. el adás Becslések és minta elemszámok
7-1. fejezet Áttekintés
7-1 Áttekintés 7-2 A populáció arány becslése 7-3 A populáció átlag becslése: 7-4 A populáció átlag becslése:
σ
σ
ismert nem ismert
7-5 A populáció varianciájának becslése
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
1. oldal
Áttenkintés ı
Ebben a fejezetben elkezdjük a következtet (induktív) statisztika tárgyalását. A következtet statisztika két legfontosabb alkalmazása, amikor a minta adatokat arra használjuk hogy (1) megbecsüljük a populáció valamelyik paraméterének értékét, illetve hogy (2) teszteljünk valamilyen a populációra vonatkozó állítást (hipotézist). Módszereket mutatunk be a populáció legfontosabb paramétereinek becslésére: arány, átlag és variancia. Meghatározzuk azokat a minta elemszámokat, amelyek szükségesek ezen paraméterek becsléséhez. ı
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
3. oldal
Ebben a fejezetben bemutatjuk, hogy a populáció arányt hogyan becsülhetjük a minta arányból, és hogyan adhatjuk meg a konfidencia intervallumot. Bemutatjuk azt is, hogy a becsléshez mekkora minta elemszám szükséges.
Vattay Gábor ELTE KRFT
Vattay Gábor ELTE KRFT
2. oldal
7-2. fejezet A populáció arány becslése
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
4. oldal
A populáció arány becslésének feltételei
Kulcsfogalmak
Elemi Statisztika Fizikusoknak
Elemi Statisztika Fizikusoknak
5. oldal
1. A minta egy egyszer véletlen minta. ő
2. A binomiális eloszlás feltételei fennállnak. 3. Van legalább 5 sikeres és 5 sikertelen eset (a binomiálisnál bevezetett értelemben).
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
6. oldal
Jelölések
p= pˆ = nx (kimondva ‘p-kalap’)
Definíció
populáció arány Egy pontbecslés egy számérték (vagy pont), amivel a populáció paraméter értékét becsüljük.
minta arány az x sikernek egy n elem mintában ő
qˆ = 1 - ˆp = minta arány a sikertelen eseteknek egy n elem mintában 7. oldal Vattay Gábor ELTE KRFT ő
Elemi Statisztika Fizikusoknak
Definíció
ˆ
A minta arány p a legjobb pontbecslése a populáció aránynak p.
Elemi Statisztika Fizikusoknak
8. oldal
Vattay Gábor ELTE KRFT
Példa: Energia átadás kézzel (Emily Rosa, 9 éves, „A close look at the therapeutic touch”, Journal of the American Medical Association, Vol. 279, No. 13) 21 terapeuta, 280 kísérlet, 123 siker. Általában egy terapeuta milyen arányban találja el a helyes kezet? Mivel a minta arány a legjobb pontbecslés a populáció arányra, ezért a legjobb pontbecslésünk p=123/280=0.44 .
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
9. oldal
Elemi Statisztika Fizikusoknak
Definíció
10. oldal
Vattay Gábor ELTE KRFT
Definíció A konfidencia szintje az az 1- α valószín ség (gyakran százalékban megadva), ami megadja, azon esetek arányát, ahányszor a konfidencia intervallum valójában tartalmazza a populáció paraméter értékét, ha a becslést sokszor megismételjük. (A konfidencia szintet a megbízhatóság fokának vagy szintjének is nevezik.) ő
A konfidencia intervallum (vagy intervallumbecslés) egy tartománya (vagy intervalluma) az értékeknek, amivel a populáció paraméterének értékét becsüljük. (KI-vel rövidítjük néha.)
A leggyakoribb értékek 90%, 95% és 99%. (α = 10%), (α = 5%), (α = 1%) Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
11. oldal
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
12. oldal
Kritikus érték Példa: Adjuk meg az el z példánál azt a 95%-os konfidencia intervallumot, amibe a populáció arány beleesik. ı
ı
1. Tudjuk, hogy bizonyos feltételek mellett (központi határeloszlás tétel) az arány minta eloszlását normális eloszlással lehet közelíteni, mint ahogy azt a következ 7-2. ábrán látjuk. ı
2. A minta aránynak kicsi az esélye arra, hogy a 7-2. ábrán a piros részbe essen.
“ 95%-ban biztosak vagyunk abban, hogy a 0.381 t l 0.497-ig intervallum tartalmazza a p igazi értékét.” ı
3. Annak a valószín sége, hogy bármelyik farok részbe esik a minta arány, összesen α. ő
Ez azt jelenti, hogy ha sok különböz 280 elem mintát választanánk, és megkonstruálnánk hozzájuk a konfidencia intervallumokat, akkor 95%-uk tartalmazná a p igazi értékét. ı
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
ő
13. oldal
Elemi Statisztika Fizikusoknak
Kritikus érték
14. oldal
Vattay Gábor ELTE KRFT
Kritikus érték
zα/
2
4. Annak a valószín sége, hogy a minta arány a zöld, bels részére esik 1-α a 7-2. ábrán. ő
ı
5. Azt a z értéket, ami elválasztja a jobb farok részt zα /2-val jelöljük és kritikus értéknek nevezzük, mivel azon a határon van, ami elválasztja a valószín és a nemvalószín értékeket. ő
ő
7-2. ábra Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
15. oldal
A zα/2 meghatározása a 95%-os konfidencia szinthez
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
A zα/2 meghatározása a 95%-os konfidencia szinthez - folyt
α = 5%
α = 0.05
α/ 2 = 2.5% = .025
+ zα/2 α/ = − 1.96
zα/2
-zα/2
16. oldal
Kritikus értékek Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
17. oldal
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
18. oldal
Definíció
Néhány fontosabb kritikus érték Konfidencia szint
Kritikus érték z
α
α
/2
Amikor egy egyszer véletlen mintából becsüljük a populáció arányt (p-t), a hiba, amit E-vel jelölünk, a maximális eltérés ( 1 – α valószín séggel) a megfigyelt p arány és az igazi populációs arány (p) között. A hibát (E-t) a becslés maximális hibájának is nevezik. Értékét a kritikus érték és az arány szórásának szorzataként kapjuk a következ 7-1. képlet szerint. ő
ő
90%
0.1
1.645
95%
0.05
1.96
ˆ
ı
99%
0.01
Elemi Statisztika Fizikusoknak
2.575
Vattay Gábor ELTE KRFT
19. oldal
A p becslésének hibája
Vattay Gábor ELTE KRFT
A populáció arány konfidencia intervalluma
p ˆ qˆ n
ahol
E =z
α/2
Elemi Statisztika Fizikusoknak
20. oldal
pˆ – E < p < pˆ + E ,
7-1. képlet
E = zα / 2
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
21. oldal
Elemi Statisztika Fizikusoknak
p ˆ qˆ n
Vattay Gábor ELTE KRFT
22. oldal
A populáció arány konfidencia intervalluma
A p-re vonatkozó konfidencia intervallum megkonstruálása
ˆ – E < p < pˆ + E p
1. Ellen rizd, hogy a szükséges feltevések teljesülnek-e. (A minta egyszer véletlen mintavételezés , a binomiális feltételei fennállnak, a normális eloszlás használható a minta arányra, mivel np ≥ 5 és nq ≥ 5 is fennáll.)
ı
ˆ + E p
ő
ő
2. A normális eloszlás táblázata segítségével határozzuk meg a zα/2 kritikus értéket.
ˆ + E) (pˆ – E, p Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
3. Számítsd ki a hibát E = 23. oldal
Elemi Statisztika Fizikusoknak
pq ˆˆ n
Vattay Gábor ELTE KRFT
24. oldal
4.
A p-re vonatkozó konfidencia intervallum megkonstruálásafolyt Felhasználva a hiba E értékét és a minta arányt ˆ p, határozd meg ˆ p – E és p ˆ + E értékeit. Helyettesítsd be ket az általános konfidencia intervallum képletbe: ı
Példa: ugyanaz a) Keresd meg az E hibát 95%-os konfidencia szintnél.
ˆ
Ellen rizzük a feltételeket. np = 123 ≥ 5, és nq = 157 ≥ 5.
ˆ
ı
p ˆ – E < p < pˆ + E
ˆ
E = 1.96 E = 0.058 Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
25. oldal
Példa: ugyanaz
(0.44)(0.56) 280
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
26. oldal
Példa: ugyanaz c) Ennek alapján mit mondhatunk a módszer hatásosságáról?
b) Határozzuk meg a 95%-os konfidencia intervallumot a populáció arányra p. Behelyettesítve az el z értékeket: 0.439 – 0.058 < p < 0.439 + 0.058, 0.381 < p < 0.497 ı
Elemi Statisztika Fizikusoknak
ˆ
Aztán kiszámítjuk. Azt találtuk, hogy p = 0.44, q = 1 – 0.44 = 0.56, zα/2 = 1.96, és n = 280.
A kísérlet alapján 95%-os biztonsággal mondhatjuk, hogy a 38.1% és a 49.7% közti intervallum tartalmazza azt az arányt, ami esetén az energiaátvitelt a terapeuták érzékelik. Ez rosszabb, mint amit a véletlen próbálgatással (50%) kapnánk.
ı
Vattay Gábor ELTE KRFT
27. oldal
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
28. oldal
A minta elemszám meghatározása
Minta elemszám
Tegyük fel, hogy adatokat gy jtünk annak érdekében, hogy a populáció valamilyen tulajdonságát meghatározzuk. Kérdés, hogy hány mintát kell ehhez összegy jteni? ő
E=
zα / 2
p ˆ qˆ n
(oldjuk meg n-re)
ő
n= Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
29. oldal
Elemi Statisztika Fizikusoknak
( Zα / 2)2 p ˆ ˆq E2 Vattay Gábor ELTE KRFT
30. oldal
Az p arány meghatározásához szükséges mintaszám
ˆ
ı
Ha van el zetes becslés p-re :
n=
( zα / 2 )2 pˆ qˆ
a)
7-2. képlet
E2
ˆˆ
Ha nincs el zetes becslés p-re:
n = ( zα / E2 2
)2 0.25
Elemi Statisztika Fizikusoknak
Korábbi eredmény felhasználása: 2004 decemberében, a háztartások 17%-ban volt Internet hozzáférés.
n = [za/2 ]2 p q E2
ˆ
ı
Example: Meg akarjuk határozni, hogy hány háztartásnak van Internet hozzáférése Magyarországon. Hány háztartást kell megkérdezni, ha 95%-os biztonsággal 4%-nál kisebb hibával akarjuk ezt meghatározni?
7-3. képlet
Vattay Gábor ELTE KRFT
31. oldal
= [1.96]2 (0.17)(0.83) 0.042 = 338 háztartás Elemi Statisztika Fizikusoknak
Pontbecslés készítése a konfidencia intervallumból
ˆ
ˆ
határ ) + (alsó határ )
ı
2
Hiba:
E = (fels ı
határ) — (alsó határ)
2
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
ı
Vattay Gábor ELTE KRFT
32. oldal
Összefoglalás Ebben a fejezetben megvitattuk: Pontbecslést. Konfidencia intervallumot. Konfidencia szintet. Kritikus érték. Hiba. Minta elemszám meghatározása.
A p pontbecslése:
p = (fels
Ha 95%-os biztonsággal igaz lesz, hogy a 338 háztartás megkérdezésével keletkez arány a valódi aránytól nem tér el jobban mint 4%.
33. oldal
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
34. oldal
Kulcsfogalmak 7-3. fejezet Populáció átlag becslés: σ ismert
Ebben a fejezetben a populáció átlag pontbecslésére és konfidencia intervallumának meghatározása adunk módszert. Ebben a fejezetben feltesszük, hogy a populáció szórása ismert. (Ez a feltétel nem valószer !) ő
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
35. oldal
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
36. oldal
Feltevések
A populáció átlag pontbecslése
ő
1. A minta egyszer véletlen mintavételezéssel lett kiválasztva. (Minden ugyanolyan hosszúságú minta kiválasztásának egyenl az esélye.) ı
A minta átlag x a populáció átlag µ legjobb pontbecslése.
2. A populáció σ szórása ismert. 3. Egyik vagy mindkét alábbi feltétel igaz: A populáció normális eloszlású vagy n > 30.
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
37. oldal
Minta átlag
Elemi Statisztika Fizikusoknak
ı
38. oldal
Példa: Egy vizsgálatban megvizsgálták 106 feln tt testh mérsékletét. A minta átlag 36.77 fok a szórás 0.34 fok volt. Keresd meg a populáció átlag µ legjobb pontbecslését! ı
1. Minden populáció esetén a minta átlag x torzítatlan becslése a populáció átlagnak µ, ami azt jelenti, hogy a µ populáció átlag körül csoportosul a minta átlagok eloszlása különböz minták esetén.
Vattay Gábor ELTE KRFT
ı
Mivel a minta átlag x a legjobb pontbecslése a populáció átlagnak µ, ezért a legjobb pontbecslés 36.77o C.
2. Sok populáció esetén a minta átlag x konzisztensebb (kisebb a változékonysága) mint más minta statisztikáknak.
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
39. oldal
Elemi Statisztika Fizikusoknak
Definíció
Vattay Gábor ELTE KRFT
40. oldal
Képlet Hiba
A hiba a minta átlag x és a populáció átlag µ valószín eltéréseinek maximuma és E-vel jelöljük. ő
E = zα/2 •
σ
7-4. képlet
n
Az átlag hibája (ismert -t feltételezve) σ
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
41. oldal
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
42. oldal
Definíció
A µ populáció átlag konfidencia intervalluma (ismert σ szórás esetén)
Az x – E és x + E értékeket konfidencia intervallum határoknak hívjuk.
x –E <µ< x +E vagy
x +E vagy
(x – E, x + E) Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
43. oldal
A µ konfidencia intervallumának megkonstruálása (ismert σ) ı
1. Ellen rizd, hogy a feltételek teljesülnek-e. 2. A normális eloszlás táblázatából határozd meg a zα/2 kritikus értéket. 3. Számítsd ki a hibát E =
zα/2 • σ/ n
.
4. Keresd meg az x – E és x + E értékeket. Helyettesítsd be az általános képletbe:
Elemi Statisztika Fizikusoknak
Példa: ugyanaz. Keressük meg a hibát E és a 95%-os konfidencia intervallumot a µ-re. n = 106 x = 36.77o s = 0.34o
α = 0.05 α /2 = 0.025 z α/ 2 = 1.96
x–E<µ<x+E Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
45. oldal
A µ populációs átlag meghatározásához szükséges minta elemszám
n=
(zα/2) • σ
2 7-5. képlet
E
z α
/2 = a konfidencia szinthez tartozó kritikus z érték
E = megkívánt hiba
E = z α/ 2 • σ = 1.96 • 0.34 n 106
x –E <
= 0.064
< x +E
< µ < o 36.77 – 0.064 < µ < 36.70o
Elemi Statisztika Fizikusoknak
36.83o 36.77o + 0.064
46. oldal
Vattay Gábor ELTE KRFT
Példa: Tegyük fel, hogy meg akarjuk határozni a fizika professzorok átlagos IQ értékét. Hány fizika professzort kell véletlenül kiválasztani a vizsgálatban ahhoz, hogy ha 95%-os biztonsággal és 2 IQ pont pontossággal akarjuk az értéket meghatározni? Tegyük fel, hogy σ = 15, ugyanúgy, mint az általános populációban.
α = 0.05 α /2 = 0.025
Ahol
44. oldal
Vattay Gábor ELTE KRFT
z α/ 2 = 1.96 E = 2 σ = 15
n =
1.96 • 15 2= 216.09 = 217 2
Egy 217 véletlen egyszer mintavételezett fizika professzor IQ tesztjéb l 95%-os biztonsággal 2 IQ pont hibával meg tudjuk határozni az igazi populáció átlagot, µ-t. ő
ı
σ
= a populáció szórása
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
47. oldal
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
48. oldal
Összefoglalás Ebben a fejezetben megbeszéltük a: Hibát. Ismert esetén a konfidencia intervallumot. A meghatározásához szükséges minta elemszámot.
7-4. fejezet A populáció átlag becslése: σ nem ismert
σ
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
49. oldal
Kulcsfogalmak
Elemi Statisztika Fizikusoknak
Feltevések
Ebben a fejezetben módszert adunk a konfidencia intervallum becslésére abban az esetben ha a populáció szórása nem ismert. Ha nem ismert, akkor a Student t eloszlást kell használnunk, bizonyos feltételek teljesülése esetén.
Vattay Gábor ELTE KRFT
σ
50. oldal
ismeretlen esetben
ő
1) A minta véletlen egyszer .
σ
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
51. oldal
2) A minta vagy normális populációból származik, vagy n > 30.
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
52. oldal
Kritikus t értékek táblázata
A Student t eloszlás Ha a populáció eloszlása lényegében normális, akkor a következ mennyiség eloszlását ı
t =
x-µ
s n
a Student t eloszlás adja meg n elemszámú minták esetén. Gyakran t eloszlásnak hívják és kritikus értékeit tα/2 jelöli. Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
53. oldal
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
54. oldal
Definíció
Az E hiba ( nem ismert) σ
A szabadsági fokok számát egy minta adataira vonatkozóan azon adatok száma adja, amelyek szabadon változhatnak, miközben az adatok összességének valamilyen feltételnek eleget kell tenniük (ilyen pl. az hogy átlaguk legyen egy megadott érték).
szabadsági fokok száma = n – 1 ebben a fejezetben.
7-6. képlet
E = tα/
s 2
n
ahol tα/2 n – 1 szabadsági fokkal rendelkezik
s a minta szórása
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
55. oldal
Konfidencia intervallum -re ( nem ismert) σ
Elemi Statisztika Fizikusoknak
56. oldal
Vattay Gábor ELTE KRFT
A µ konfidencia intervallumának megkonstruálása ( ismeretlen) σ
1. Ellen rizzük, hogy a feltételek teljesülnek. ı
x–E <µ<x +E
2. Az n - 1 szabadsági fokhoz keressük ki a Student eloszlás táblázatából a kritikus tα/2 értéket a kívánt konfidencia szinthez.
E = tα/2 s n
ahol
n .
3. Számítsd ki a hibát E = tα/2 • s /
4. Keresd meg az x - E és x + E értékeket. Helyettesítsük be a konfidencia intervallum általános képletébe:
x –E <µ< x +E Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
57. oldal
ı
Példa: A testh mérséklet példában határozzuk meg a µ 95%-os konfidencia intervallumát.
Elemi Statisztika Fizikusoknak
58. oldal
Vattay Gábor ELTE KRFT
A Student t eloszlás tulajdonságai 1. A Student t eloszlás más-más különböz minta elemszámokra. ı
2. A Student t eloszlás szimmetrikus és harang szer görbe, de sokkal nagyobb variabilitása van, mint a normális eloszlásnak kis minta számok esetén. ő
n = 106 x = 36.77o s = 0.34o
α = 0.05 α /2 = 0.025 t α/ 2 = 1.984
Elemi Statisztika Fizikusoknak
E = t α/ 2 • s = 1.984 • 0.34 = 0.065 n 106
x–E <µ< x +E 36.70o <
µ < 36.83o
Vattay Gábor ELTE KRFT
3. A Student t eloszlás átlaga t = 0 (ugyanúgy, mint a standard normális eloszlás esetén az átlag z = 0). 4. A Student t eloszlás szórása változik a minta elemszámmal és nagyobb mint 1 ( ellentétben a standard normális eloszlással, ahol σ = 1). 5. A minta elemszám növelésével n egyre nagyobb lesz, és a Student t eloszlás egyre közelebb kerül a normál eloszláshoz.
59. oldal
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
60. oldal
Student t eloszlás n = 3 és n = 12
Összefoglalás Ebben a fejezetben tárgyaltuk: A Student t eloszlást. A szabadsági fokok számát. A hibát. A konfidencia intervallumát ismeretlen esetén.
σ
7-5. ábra Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
61. oldal
Elemi Statisztika Fizikusoknak
62. oldal
Vattay Gábor ELTE KRFT
Kulcsfogalmak
7-5. fejezet A populáció variancia becslése
Ebben a fejezetben módszereket mutatunk be a (1) konfidencia intervallum meghatározására a populáció szórására és varianciájára (2) a szükséges minta elemszám meghatározására. Bevezetjük a χ -négyzet (khí négyzet, chisquare) eloszlást, ami a konfidencia intervallum meghatározásához kell ill. esetén. σ
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
63. oldal
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
2
σ
64. oldal
Khí-négyzet eloszlás
Feltételek
χ = 2
ő
1. A minta legyen egyszer véletlen. 2. A populációnak normális eloszlásúnak kell lennie (nem elég, hogy a minta nagy legyen).
(n – 1) s2
σ2
7-7. képlet
ahol n = minta elemszám s 2 = minta variancia
σ 2 = populáció variancia
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
65. oldal
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
66. oldal
Khi-négyzet táblázat
A khi-négyzet statisztika tulajdonságai 1. A khi-négyzet eloszlás nem szimmetrikus, ellentétben a normál és a Student eloszlásssal. A szabadsági fokok számának növekedésével egyre szimmetrikusabb lesz.
7-8. ábra Khi-négyzet eloszlás
Elemi Statisztika Fizikusoknak
7-9. ábra Khi-négyzet eloszlás df = 10 és df = 20 Vattay Gábor ELTE KRFT
67. oldal
A khi-négyzet statisztika tulajdonságai- folyt 2. A khi-négyzet eloszlás értékei nem lehetnek negatív számok. 3. A khi-négyzet eloszlás különbözik minden szabadsági fokra, amely df = n – 1 ebben a fejezetben. A szabadsági fokok növelésével megközelíti a normális eloszlást.
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
69. oldal
A khi-négyzet statisztika kritikus értékei
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
68. oldal
Példa: Határozzuk meg χ2 kritikus értékeit, amelyekhez mindkét farokban 0.025 terület tartozik. Legyen a minta elemszáma 10, és a szabadsági fokok száma 10 – 1=9. α = 0.05 α/2 = 0.025 1 − α/2 = 0.975
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
70. oldal
A variancia becslései A minta variancia s 2 a legjobb pontbecslése a populáció varianciájának σ . 2
7-10. ábra
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
71. oldal
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
72. oldal
Konfidencia intervallum (vagy intervallum becslés) a populáció varianciára σ 2
A σ vagy σ 2 –re vonatkozó konfidencia intervallum konstruálása ı
(n – 1)s 2 2
χ
Jobb-farok kritikus érték
< σ 2<
R
1. Ellen rizzük, hogy a feltételek fennállnak-e.
(n – 1)s 2
χ
2 L
Bal-farok kritikus érték
Konfidencia intervallum a σ -ra
(n – 1)s 2
χ Elemi Statisztika Fizikusoknak
2 R
< σ <
2. n – 1 szabadsági fok esetén a táblázatból keressük meg a kritikus értékeket χ2R és χ2L,amely a kívánt konfidencia szinthez tartozik. 3. Az alábbi képlettel határozzuk meg a konfidencia intervallumot:
(n – 1)s 2
(n – 1)s 2
χ
Vattay Gábor ELTE KRFT
χ
2 L
73. oldal
2
R
< σ 2<
(n – 1)s 2
χ
2 L
4. σ konfidencia intervalluma ugyanez, csak gyököt kell vonni. 74. oldal Elemi Statisztika Fizikusoknak Vattay Gábor ELTE KRFT
A minta elemszám meghatározása
Példa: ı
A testh mérsékletes példában keressük meg a 95%os konfidencia intervallumot σ-ra. n = 106 x = 36.77o s = 0.34o
α = 0.05 α /2 = 0.025 1 – α /2 = 0.975
χ 2R = 129.561, χ 2L = 74.222 (106 – 1)(0.34)2 < σ2 < (106 – 1)(0.34)2 129.561 74.222 0.093 < σ2 < 0.16 0.30 < σ < 0.40
95%-ban bizonyosak vagyunk, hogy a 0.30°C és 0.40°C intervallum tartalmazza a σ igazi értékét. 95%-os biztonsággal állíthatjuk, hogy az egészséges emberek testh mérsékletének szórása 0.30°C és 0.40°C között van. ı
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
75. oldal
Elemi Statisztika Fizikusoknak
76. oldal
Összefoglalás
Példa: Szeretnénk σ értékét meghatározni a testh mérsékletekre. 95% biztonsággal szeretnénk tudni, legfeljebb 10% hibával a σ igazi értékét. Mekkorának kell lennie a mintának. Tegyük fel, hogy a populáció normális eloszlású. ı
A 7-2. táblázat szerint, 95% konfidenciával 10% hiba 191-es mintához tartozik.
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
Vattay Gábor ELTE KRFT
77. oldal
Ebben a fejezetben megvitattuk: A khi-négyzet eloszlást. A táblázatát. A szórás és a variancia konfidencia intervallumait. A minta elemszám meghatározását.
Elemi Statisztika Fizikusoknak
Vattay Gábor ELTE KRFT
78. oldal