ÁVF GM szak 2010 ősz
KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése
2010 ősz Utoljára módosítva: 2010-09-07
Általános Vállalkozási Főiskola
ÁVF Oktató: Lipécz György
1
A becslés alapfeladata Pl. Hányan láttak egy TV műsort? Jellemzően kétféle választ lehet adni: • Pontbecslés Pl. „A minta alapján a sokasági nézettségi arány 32 %”. Vesznek egy mintát, azaz, megkérdeznek pl. 1300 embert, és ebből következtetnek, hogy a teljes sokaság hányadrésze látta a műsort.
• Intervallumbecslés: „A nézettségi arány 95% valószínűséggel 29 és 35 % közé esik.” Általános Vállalkozási Főiskola
2
Mintavétel A mintavétel módja lehet: véletlen és nem véletlen
1. A véletlen kiválasztás. Ismerjük a sokaság elemeinek mintába kerülési valószínűségét. A véletlen minta fontos jellemzője: a reprezentativitás. – Egyszerű véletlen mintavétel • Visszatevéssel • Visszatevés nélkül – Rétegzett minta – Csoportos és többlépcsős minta Általános Vállalkozási Főiskola
3
Mintavétel (folyt) 2. A nem-véletlen mintavétel
• Szisztematikus mintavétel (PL. a kijáratnál minden 10-ik vevő megkérdezése) • Kvóta szerinti minta • Koncentrált minta (Fogy.K. Top 200) • Önkényes minta
Általános Vállalkozási Főiskola
4
A mintaátlag eloszlása Alapkérdések: Tekinthető-e, ill. mikor tekinthető a mintaátlag eloszlása normális eloszlásúnak? A mintaátlag várható értéke és a sokasági átlag közötti összefüggés A mintaátlag szórása és a sokasági szórás közötti összefüggés
Általános Vállalkozási Főiskola
5
A mintaátlag mint valószínűségi változó • A mintaátlag valószínűségi változó (mintáról mintára változik), amelynek van – eloszlása, – várható értéke, – szórása.
• A mintaátlag normális eloszlású, – Ha a sokaság normális eloszlású – Vagy: ha a minta elég nagy. (n > 30; pl. 100 elem)
• Ha – a sokaság eloszlása nem ismert – és a minta kicsi (30 elem alatti), akkor a mintaátlag eloszlása sem ismert. (Ekkor további megfontolásokra van szükség.) Általános Vállalkozási Főiskola
6
A mintaátlag eloszlásának paraméterei Ha a minta véletlen (a sokaság eloszlásától függetlenül, akár visszatevéses a mintavétel akár nem) akkor, • A mintaátlag várható értéke a sokasági átlag: • A mintaátlagok szórása, (standard hiba) – Visszatevéses mintánál:
– Visszatevés nélküli mintánál: x
n 1 N n
x
E( x )
X
n x
n
N n N 1
Ahol n / N a kiválasztási arány
Általános Vállalkozási Főiskola
7
Testmagasság A minta és mintaátlag normális eloszlása 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 140
145
150
155
160
165
170
175
180
185
Általános Vállalkozási Főiskola
190
195
200
205
210
8
PÉLDA sokaság és a minta közötti összefüggésre Vegyünk egy 5 elemű sokaságot. A sokaság elemei legyenek: (2, 3, 4, 5, 6). N =5 •
Írjuk össze az összes lehetséges 2 elemű mintát! n = 2 (minden húzás után visszatesszük a kihúzott elemet.)
•
Ellenőrizzük, hogy a) A mintaátlagok várható értéke (átlaga) megyegyezik a sokasági átlaggal! b) A mintaátlag varianciája a sokasági variancia n-ed része!
•
Végezzük el visszatevés nélküli mintára is! Hogyan módosul ekkor a mintátlag varianciája? Általános Vállalkozási Főiskola
9
Megoldás 1. (Visszatevéses minta esetén)
• A sokasági átlag: • A sokasági szórásnégyzet ill. szórás: A minta átlaga
2
2
2
2 2 2
3 4 5
2,5 3 3,5
• A mintaátlagok átlaga:
• A mintaátlagok szórásnégyzete:
• Következtetés:
Általános Vállalkozási Főiskola
10
Megoldás 2. (Visszatevés nélküli minta esetén)
• A sokasági átlag: 4 • A sokasági szórásnégyzet: 2 ill. szórás: A minta átlaga
2
3
2,5
2 2 2
4 5 6
3 3,5 4
3 3 3
4 5 6
3,5 4 4,5
2
• A mintaátlagok átlaga: 4
• A mintaátlagok szórásnégyzete =
• Következtetés:
Általános Vállalkozási Főiskola
11
A mintaátlagok eloszlása (%) 25 20
Relatív gyakoriság (%)
20 16
16
15 12 10
5
12
8
8
4
4
0 1
1,5
2
2,5
3
3,5
4
4,5
5
Mintaátlagok
Általános Vállalkozási Főiskola
12
A becslő-fv és a jó becslés kritériumai A becslő fv fogalma: A sokasági paraméter becslésére szolgáló, a mintaelemek értékétől függő függvény. pl. a mintaátlag egy becslőfv, mert értéke a mintaelemek értékétől függ, és ezzel becsüljük a sokasági átlagot. A jó becslés kritériumai • Torzítatlanság • Hatásosság • Konzisztencia Általános Vállalkozási Főiskola
13
Torzítatlan becslések • A mintaátlag a sokasági átlag torzítatlan becslése
X
E(x )
• mintabeli arány a sokasági aránynak torzítatlan becslése
E ( p)
P
E(g) G
Vagy:
• A minta szórása a sokasági szórás torzított becslése. A minta korrigált szórása már torzítatlan 2
ˆ
s
( xi
x)
n 1
E (s) Általános Vállalkozási Főiskola
14
A jó becslés kritériumai (folyt) • Hatásosság: a becslőfüggvény szórása. Minél kisebb a szórása, annál hatásosabb • Konzisztencia (az a tulajdonság, hogy egyre nagyobb mintát véve egyre pontosabb becslést kapunk)
Általános Vállalkozási Főiskola
15
BECSLÉS A sokasági várható érték intervallum-becslése
• A sokasági várható értéket a mintaközéppel becsüljük. Ez így egy torzítatlan pontbecslés, - amely nem fog pontosan egybeesni a sokaság tényleges várható értékével. • Meg tudunk azonban adni egy intervallumot, amelybe a sokasági várható érték egy előre adott (pl. 95%-os) valószínűséggel beleesik.
Általános Vállalkozási Főiskola
16
A sokasági átlag intervallumbecslése 95 %-os megbízhatósági szint mellett Ismerjük a mintaátlag eloszlását, és szórását. Tudjuk, hogy M (x) X Kérdés: mekkora az az intervallum, amelybe a véletlen minta átlaga, ill. annak standardje 95 % valószínűséggel esik?
1,96
x
X
1,96
x
Átrendezve:
x 1,96
Rövidebb formában:
x
X
X
x 1,96
x 1,96 x
Tehát 95 % a valószínűsége annak, hogy a sokasági a mintaátlag 1,96 szórásnyi környezetében található. Általános Vállalkozási Főiskola
x
X 17
Az intervallumbecslés általános gondolatmenete Annak a valószínűsége, hogy
P
z
x
X
z
1
x
Átrendezve Tömörebben:
x X
zp
x
X
x
zp
x
x
Általános Vállalkozási Főiskola
zp
X
x
x
zp
n
18
Kifejezések Az (1- ) valószínűség a megbízhatósági szint, vagy konfidencia-szint Az (1- ) valószínűséghez tartozó intervallum a megbízhatósági intervallum vagy konfidenciaintervallum A
zp
x
szorzat a maximális hiba vagy hibahatár.
zp
x
Általános Vállalkozási Főiskola
19
PÉLDA - Átlagbecslési alapfeladat
A főiskolások sokaságából 100 fős, azonos eloszlású véletlen mintát vettünk. A mintaátlag 178 cm-nek adódott. A sokaságról tudjuk, hogy normál eloszlású, 15 cm-es szórással, nem ismerjük viszont a sokasági átlagot. a) Adjon becslést a sokasági átlagra 95%-os megbízhatósági szinten! b) Hogyan változna az eredmény, ha a megbízhatósági szint csak 90%-os lenne?
Általános Vállalkozási Főiskola
20
További figyelembeveendő problémák
• Ha nem független a mintavétel. • Ha nem ismerjük a sokasági szórást,
Általános Vállalkozási Főiskola
21
A nem független mintavétel esete A standard hiba
x
X
x zp
x
kisebb lesz,
n 1 N n n 1 N n
ahol az n /N a kiválasztási arány. Általános Vállalkozási Főiskola
22
Példa Becslés – nem független mintavétellel Egy 200 fős cég dolgozóiból egyszerű véletlen mintavétellel kiválasztottunk 100 főt, hogy megbecsülhessük a dolgozók átlagbérét. A mintaátlag 82 eFt. A sokaságról tudjuk, hogy normál eloszlású 15 eFt szórással a) b)
Becsülje meg a cég dolgozóinak átlagbérét, ha a megbízhatósági szint 95%! Hogyan változna az eredmény, ha a vizsgált cég dolgozóinak száma 20 000 fő lenne, de az egyéb adatok változatlanok maradnának? Általános Vállalkozási Főiskola
23
Ha a sokasági szórás nem ismert Ha nem ismerjük a sokasági szórást, • akkor a mintából becsüljük. A korrigált mintaszórással számolunk:
ˆ
s
( xi
x )2
n 1
• és (n -1) szabadságfokú t-eloszlással
Általános Vállalkozási Főiskola
24
A Student (t) eloszlás használata Mikor? Ha az alapsokaság szórása, nem ismert. • kis minta (n<30) esetén kötelező, • nagy minta (n>30; az n=100 már nagy minta!) esetén a standard normális eloszlás z- je is használható Miért? mert a mintátlag standardje nem a standard normál eloszlást követi, hanem a nagyobb szórású t-eloszlást. A mintából becsült szórás használata esetén a becslés bizonytalanabb. Általános Vállalkozási Főiskola
25
A Student (t) eloszlás ábrája különböző mintanagyságok mellett
Általános Vállalkozási Főiskola
26
PÉLDA (Becslés, – a sokasági szórás nem ismert)
Egy 5 ezer fős egyetemen 9 fős egyszerű véletlen minta alapján szeretnénk becslést adni a matematika vizsgára fordított tanulási időre. A normáleloszlás feltételezhető. A mintaátlag 16 óra. A minta korrigált szórása 4 óra. a) Adjunk becslést az egyetemi készülési átlagra 95%-os megbízhatósági szint mellett! b) Hogyan változna az eredmény, ha 100 fős mintára vonatkozna a fenti átlag és korrigált szórás?
Általános Vállalkozási Főiskola
27
Értékösszeg-becslés esetén
Megszorozzuk N-nel • a mintából becsült átlagot • és a
maximális hibát (hibahatárt)
Egyébként minden ugyanúgy megy, mint az átlag-becslésnél.
Általános Vállalkozási Főiskola
28
PÉLDA (Értékösszeg becslése) Egy főiskola 5 000 hallgatójának éves színházjegy-vásárlásait vizsgálták mintavételes felméréssel. A sokaság normál eloszlása feltételezhető. A 100 fős mintában az éves összes vásárlási érték 97 000 Ft volt. Az átlagtól való eltérés a mintában átlagosan 680 ft. • Mennyi a mintaátlag standard hibája? • Becsülje meg 95%-os valószínűséggel, hogy mennyi az egy hallgatóra jutó színházjegy vásárlás értéke a vizsgált főiskolán! • Mennyi a főiskolások által szinházjegyre költött teljes összeg maximális értéke? (A megbízhatósági szint továbbra is 95%) Általános Vállalkozási Főiskola
29
Az átlagbecslés lépései (Áttekintés) 1. A becslőfv az x 2. A becslőfv eloszlása: normális vagy Student t? – Ismert-e a sokasági szórás? – Ha nem: a minta nagy vagy kicsi?
3. A standard hiba kiszámítása • Ha a minta visszatevés nélküli, 0,05 alatt van-e az (n/N) arány? • Független-e (visszatevéses-e) a minta?
4. A konf. intervallum kiszámítása
x z ˆx
x t ˆx
Adott konfidenciaszinthez tartozó z vagy t meghatározása (táblázatból v. szám.géppel)
5. Az eredmény értelmezése Általános Vállalkozási Főiskola
30
Minta-nagyság meghatározása EV mintánál • Visszatevéses eset:
• Visszatevés nélküli eset:
2
z
n
z
n 2
2
2
z
2
2
N Általános Vállalkozási Főiskola
31
PÉLDA (Folyt) Értékösszeg becslése, mintanagyság meghatározása
Egy főiskola 5 000 hallgatójának éves színházjegy-vásárlásait vizsgálták mintavételes felméréssel. A sokaság normál eloszlása feltételezhető. A 100 fős mintában az éves összes vásárlási érték 97 000 Ft volt. Az átlagtól való eltérés a mintában átlagosan 680 Ft.
KÉRDÉS: Ha az - átlagra vonatkozó – becslés hibahatárát 80 forint alá szeretnénk szorítani, mekkora mintára lenne szükségünk?
Általános Vállalkozási Főiskola
32
Köszönöm a figyelmüket!
Általános Vállalkozási Főiskola
33