Statisztika gyakorló feladatok 1. Konfidencia intervallum becslés F.1. Az egyetemisták alkoholfogyasztási szokásainak vizsgálatára 1995. tavaszán egy minta alapján kérdıíves felmérést végeztek. A vizsgált egyetemek: SOTE, ELTE Jog, KözGáz. A minta kiválasztása a hallgatói létszámmal arányosan történt. A kérdıíves felmérés egyik kérdése úgy szólt, mennyi alkoholt fogyasztanak a megkérdezettek egy hétvégi bulin. A válaszokat az alkoholtartalom alapján üveg sörre számították át. Egyetem
Megkérdezettek száma
SOTE Közgáz ELTE Jog összesen
81 61 24 166
Átlagosan A fogyasztott alkohol elfogyasztott alkohol, szórása (tapasztalati, üveg sör korrigált) 2,57 1,58 2,61 1,61 3,41 2,66
Tegyük fel, hogy a három egyetem közös bulit rendez, amire várhatóan 5000 hallgató fog elmenni (arányuk a mintabeli aránnyal megegyezik). Becsülje meg 95%-os biztonsággal, hány üveg sört (illetve annak megfelelı alkoholt) kell a bulira biztosítani!
2. Korreláció- és regressziószámítás F.1. Az alábbi táblázat egy finom fémszál különbözı terhelések mellett mért átlagos megnyúlás értékeit tartalmazza: x (kg) y (m)
12 0,7516
14 0,7628
16 0,7728
18 0,7836
20 0,7956
22 0,8065
a) Számoljuk ki a korrelációs együtthatót! b) Legkisebb négyzetek módszerével határozzuk meg a közelítı egyenes egyenletét! c) Az Excel segítségével illesszünk trendvonalat a pontokra és ellenırizzük az elızı pontban kapott eredményeket!
3. Statisztikai hipotézisvizsgálat (próbák) Hipotézis = feltevés Statisztikai hipotézis: A megfigyelt valószínőségi változó eloszlásának paramétereire, vagy az eloszlás típusára tett feltevés.
Próbák fajtái: • Paraméteres o Paraméterekre vonatkozó hipotézisvizsgálat . A minta valamely számszerő paraméterével kapcsolatban fogalmazzuk meg a hipotézist. • Nemparaméteres o A minta eloszlásának típusát vizsgáljuk (illeszkedés- vagy homogenitásvizsgálat). Paraméteres próbák: • • • • •
Egymintás/kétmintás U próba (ismert szórást feltételez!) Egymintás/kétmintás t próba Fischer próba (F próba) Grubbs próba Abbe próba
Nemparaméteres próbák: • •
χ2 próba Wilcoxon próba
F.1. Amerikában egy teljes körő, több éves felmérés kimutatta, hogy az egyetemi hallgatók hetente átlagosan 7,5 órát töltenek szórakozással. Az egyik amerikai egyetemen kételkedik a felmérésben és ellenırizni kívánják ezt az eredményt. 100 hallgatót kérdeznek meg, és azt kapják, hogy a hallgatóik átlagosan 6,6 órát töltenek szórakozással. A szórás adott a teljes körő felmérésbıl: 3,5 óra. Kérdés: 95%-os szignifikancia szinten elfogadható-e, hogy az adott egyetem hallgatóira igaz a több éves felmérés eredménye? F.2. A Fogyasztóvédelmi Felügyelıség két fajta cigaretta kátránytartalmát vizsgálta meg. A vizsgálat eredményeit tartalmazza a következı táblázat: Sorszám 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
„A” fajta 14,94 17,42 15,19 16,53 16,22 15,08 13,82 15,94 14,99 16,61 16,51
„B” fajta 14,33 16,33 17,10 16,93 16,78 16,24 16,88 16,76 15,94 15,82 -
Kérdés: 95%-os szignifikancia szinten eltér-e egymástól a két cigaretta kátránytartalma?
F.3. Egy kísérlet során különbözı laboratóriumok által kibocsátott pasztırtej összes mikrobaszámát mérték ki. Az alábbi táblázatban a különbözı laboratóriumok által kimért átlagos mikrobaszám 10-es alapú logaritmusa látható (forrás: Dr. Reichart Olivér, Kísérlettervezés és értékelés a mikrobiológiai gyakorlatban). lgN
1. 4,51
2. 4,66
3. 4,58
4. 4,72
5. 4,41
6. 4,65
7. 4,38
8. 4,57
Vizsgáljuk meg, hogy a mintában szereplı legnagyobb, illetve legkisebb érték 95%-os szignifikancia szinten hozzá tartozik-e a mintához? F.4. Egy gyár csapágygolyókat gyárt két gépsoron. Egy-egy 10 elemő mintát veszünk az egyes gépsorokról, majd megmérjük a csapágygolyók átmérıit. Ezeket az alábbi táblázat tartalmazza: 1. gépsor 2. gépsor
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 19,70 18,52 19,77 20,12 20,31 21,44 19,65 20,62 20,80 20,94 19,00 20,21 20,24 18,99 19,26 21,08 19,87 20,39 20,09 19,36
95%-os szignifikancia szinten feltehetı-e a szórások egyezése? F.5. Egy felmérés során azt vizsgálták, hogy a rózsák szálankénti ára miként változik Budán, illetve Pesten. A következı táblázatban láthatjuk az eredményeket: Ár (HUF/db) -55 56-65 66-75 76-85 86-95 96-105 106-
Budai oldal (db) 3 22 18 15 6 6 2
Pesti oldal (db) 5 6 18 21 18 10 6
Elmondható-e 95%-os szignifikancia szinten, hogy a rózsaárak budai és pesti eloszlása azonos?
Melléklet: Az egyes próbák aktuális értékének kiszámításához szükséges képletek: 1. egymintás U próba x − a0
U akt =
σ
; U akt ≤ U krit
n 2. kétmintás U próba x1 − x2
U akt =
σ 12 n1
+
σ 22
; U akt ≤ U krit
n2
3. egymintás t próba t akt =
x − a0 ; s* n
t akt ≤ t krit
4. kétmintás t próba x1 − x2
takt =
s1*2 s2*2 + n1 n2
;
takt ≤ t krit
5. F próba Fakt =
s1*2 ; s1*2 ≥ s2*2 ; Fakt ≤ Fkrit *2 s2
6. Grubbs próba
vakt ,min =
ξ − ξ min s
*
;
vakt ,max =
vakt ≤ vkrit
ξ − ξ max s*
7. Abbe próba q2 ; rakt > rkrit s *2 1 n−1 (ξi+1 − ξi )2 q2 = ∑ 2(n − 1) i=1 rakt =