Statisztika 2.
Dr Gősi Zsuzsanna Egyetemi adjunktus
Gyakorisági sorok Mennyiségi ismérv jellemző – rangsor készítünk. (pl. napi jegyeladások száma) A gyakorisági sor képzése igazából tömörítést jelent Nagyszámú ismérvértékek esetén érdemes osztályközöket kialakítani (képlete: k=1+(3,3lgn) Használhatunk un. kumulált gyakorisági sorokat is 2009. 10. 14.
2
Gyakorisági sorok Gyakorisági sor: bérek 50 000 Ft-os osztályközökkel (Bruttó bér – 50000-ig, 50000-100000, 100000-150000), vagy munkanélküliek száma életkor szerint 5 évenkénti bontásban… Általános alapelv, hogy az osztályközök legyenek azonos hosszúságúak… 2009. 10. 14.
3
Középértékek Számított középértékek (átlagok) Számtani átlag Harmonikus átlag Mértani átlag Négyzetes átlag
2009. 10. 14.
Helyzeti középértékek Módusz Medián
4
Középértékek Az azonos fajta adatok tömegének számszerű jellemzője. Követelmények vele szemben Közepes helyet foglal el Számszerű értékek halmazának legyenek tipikus értékei Jól kezelhető matematikai formulával meghatározható legyen Jól értelmezhető legyen Ne legyen érzékeny a kiugró értékekre 2009. 10. 14.
5
Módusz Az ismérvértékek tipikus, leginkább jellemző értékét jelöli. /Diszkrét értékekkel rendelkező mennyiségi ismérv módusza a sokaságban leggyakrabban előforduló ismérvérték./ Magyarországon a lakott lakások száma 3688 ezer volt, ebből egy szobás 588 ezer, két szobás 1607 ezer, háromszobás 1493 ezer. Mi a módusz értéke? 2009. 10. 14.
6
Módusz Osztályközös gyakorisági sor esetében a módusz közelítő meghatározása az un. modális osztályköz.
M
o
x mo , a
k1 xh k1 k 2
Xmo,a – modális osztályköz alsó határa k1 – a modális osztályköz és a megelőző osztályköz gyakoriságának különbsége k2 – a modális osztályköz és az azt követő osztályköz gyakoriságának különbsége 2009. 7 h10. – a14. modális osztályköz hossza
A versenyzők életkorának megoszlása Életkor (év) -20
Versenyzők száma (fő) 6
Kummulált gyakoriság 6
21-25
7
13
26-30
18
31
31-35
11
42
35-
8
50
Összesen
50
2009. 10. 14.
8
Medián A medián szó a legszorosabb értelemben közepes érték, a mennyiségi ismérvnek azon értéke, amelynél ugyanannyi kisebb, mint amennyi nagyobb érték fordul elő.
2009. 10. 14.
9
Medián meghatározása A számértékeket rangsorba kell rendezni Páratlan egyed szám esetén (n+1)/2 lesz a medián Páros esetén az n/2 és n/2+1 egyszerű számtani átlaga
2009. 10. 14.
10
Határozd meg a mediánt Felsőoktatásban eltöltött idő 1 év – 8 fő 2év – 4 fő 3 év- 1 fő 4 év- 2 fő 5 év – 3 fő
2009. 10. 14.
11
Medián értéke a gyakorisági sorban s f me' 1 Me xme ,a xh f me X me,a – a mediánt magába foglaló osztályköz alsó határa S – n/2 a medián sorszáma f’me-1 – a mediánt megelőző osztályköz kumulált gyakorisága fme – a mediánt tartalmazó osztályköz gyakorisága h a mediánt tartalmazó osztályköz hoszza 2009. 10. 14.
12
Számtani átlag A számtani átlag az a szám, amelyet az átlagolandó értékek helyébe téve azok összege azonos marad. n
_
x 2009. 10. 14.
x i 1
i
n 13
Súlyozott számtani átlag /figyelembe vesszük az elemek gyakoriságát/ n
_
x
2009. 10. 14.
f x i
i 1
i
n
14
Munkatábla (egy hónapban eladott jegyek száma – db) Naponta eladott jegyek száma (db) -30 31-40 41-50 51-60 61-70 71 2009. 10. 14. Összesen
Napok száma 2 5 7 8 5 3 30
15
Harmonikus átlag Az a szám, amelyet az átlagolandó értékek helyébe téve, azok reciprokainak összege változatlan marad. Akkor alkalmazzuk, ha az értékek reciprokainak összege értelmezhető.
2009. 10. 14.
16
Harmonikus átlag képlete xh
n n
i 1
2009. 10. 14.
1
x
i
17
Súlyozott harmonikus átlag k
x
h
f i 1
k
f i 1
2009. 10. 14.
i
1 i
x
i
18
A dollár MNB által rögzített középárfolyama, (állandó összegű forintot feltételezve) január
212.76
július
222.69
február
207.29
augusztus
213.99
március
212.14
szeptember 216.86
április
218.39
október
215.48
május
210.75
november
206.02
június
205.54
december
193.31
2009. 10. 14.
19
Példa Egy személyszállítással foglalkozó vállalkozó két mikrobusza egy adott napon 40 illetve 60 liter benzint fogyasztott. A kocsik üzemanyagigénye 100 km-ként 20 illetve 15 liter. Mennyi az átlagfogyasztás? (Pt 23/33)
2009. 10. 14.
20
Mértani átlag Az a szám, amelyet az átlagolandó számértékek helyébe téve azok szorzata változatlan marad.
2009. 10. 14.
_ n xg
n
x i 1
i
21
Mintapélda Egy kézilabdacsapat nézőszáma 2002-ről, 2003-ra 2%-kal, 2003-ról 2004-re 3,9%kal, 2004-ről 2005-re 8,5%-kal nőtt. Határozd meg az éves átlagos nézőszám növekedés mértékét.(Tk 62.old)
2009. 10. 14.
22
Négyzetes átlag Más néven kvadratikus átlag. Az a szám, amelyet az átlagolandó számértékek helyébe téve azok négyzetösszege változatlan marad. /A szórás kiszámításánál kap majd szerepet/
2009. 10. 14.
_
xq
n 2 xi i 1
n 23
Kvantilisek Ha a rangsorba rendezett sokaságot 2,3,4… k egyenlőre osztjuk, az osztópontnak megfelelő ismérvértékeket kavantiliseknek hívjuk. (néhány fontosabb kvantilis érték 2- Medián, 3-Tercilis, 10Decililis)
2009. 10. 14.
24
Az egy fõre jutó személyes nettó jövedelmek alapján képzett népességtizedek részesedése az összes személyes jövedelembõl, 1972-1997, % 1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Év Tized 1972
4,0
5,9
7,0
8,0
8,9
9,8
10,8
11,9
13,8
19,9
1977
4,5
6,3
7,3
8,1
8,9
9,8
10,8
12,0
13,7
18,6
1982
4,9
6,4
7,3
8,1
8,8
9,6
10,7
11,9
13,7
18,6
1987
4,5
6,0
6,9
7,7
8,5
9,4
10,5
11,8
13,8
20,9
1995
3,3
5,0
6,2
7,2
8,2
9,1
10,2
11,7
14,1
25,0
1997
2,9
4,7
5,9
7,0
7,9
8,9
10,0
11,6
14,4
26,7
2009. 10. 14.
25
Szóródás Szóródásnak nevezzük statisztikában az adatatok (általában a mennyiségi ismérv értékek) eltérését egymástól, vagy egy meghatározott, a sokaság egészét jellemző értéktől.
2009. 10. 14.
26
Leggyakrabban használt szóródási mérőszámok Szóródás terjedelme (T) Interkvartilis terjedelme (TQ) Átlagos eltérés δ Szórás σ és a variancia szórásnégyzet σ2 Relatív szórás V
2009. 10. 14.
27
Szórás terjedelme A szóródás terjedelme az előforduló legnagyobb és legkisebb érték különbsége. T = xmax – xmin Jellemzője: jól értelmezhető, de a kiugró értékek nagyban befolyásolják /kiugró eredmény pl. a világcsúcs is/ 2009. 10. 14.
28
Interkvartilis terjedelem Az interkvartilis terjedelem azt az intervallumot jelöli, ahol az összes érték középső 50%-a helyezkedik el.
2009. 10. 14.
29
Átlagos eltérés Az átlagos eltérés épít arra a gondolatmenetre, hogy a számértékeknek egy középértékektől való eltéréseiből következtetni tudunk a szóródás nagyságára. Ezeket az eltéréseket „sűrűsíthetjük” egy középérték segítségével. 2009. 10. 14.
30
Számítása Az átlagos eltérés számításánál az eltérések abszolút értékeiből számított átlagnak van értelme. n
δ
2009. 10. 14.
x i1
i
_
x
n
31
Szórás Az egyes értékek számtani átlagtól való eltéréseinek négyzetes átlagát szórásnak nevezzük.
1 xi x n i 1 n
2009. 10. 14.
_
2
32
Relatív szórás Nem mértékegységben adja meg az eltérést, hanem százalékban. Számítása: szóródási mérőszámot egy középértékhez viszonyítjuk (számtani átlag) 2009. 10. 14.
V
_
x
33
Szórás felhasználásának lehetősége Sportolók esetében a teljesítmény ingadozása Minimumküszöbök – szintidők meghatározása /Sportolók teljesítményének kockázata/
2009. 10. 14.
34
Eloszlás típusok Empirikus eloszlás
Egymóduszú eloszlás
Szimetrikus
2009. 10. 14.
Asszimetrikus
Többmóduszú eloszlás
U alakú eloszlás
M alakú eloszlás 35
Egymóduszú eloszlások A szimetrikus gyakorisági sorok jellemzője, hogy grafikus ábrájuk a módusz értékénél felvehető tengelyre szimetrikus. Az ilyen eloszlásnál a módusz, a medián, és a számtani átlag megegyezik egymással. (Ilyen pl. a testmagasság) Aszimmetrikus eloszlások esetén a módusz a két szélső érték közül az egyikhez esik közelebb Bal oldali asszimetria Mo > Me > x Jobb oldali asszimetira Mo <Me < x 2009. 10. 14.
36
Asszimetria mérése A mérőszámok tulajdonsága a következő kell, hogy legyen Értékük nulla legyen, ha az eloszlás szimetrikus Jobb oldali asszimetria esetén pozítív, míg ellenkező esetben negatív értéket vegyenek fel.
2009. 10. 14.
37
„A” mutatószám A mutatószám azon a tényen alapul, hogy szimetrikus eloszlásoknál a számtani átlag és a módusz értéke megegyezik. Jobb oldali asszimetria esetén pozitív míg baloldali asszimetria esetén negatív értéket vesz fel. _ A 2009. 10. 14.
x
Mo
38
„F” mutatószám Logikája azt feltételezi, hogy szmetrikus eloszlású gyakorisági sorok esetén a madián az alső és felső kvartilis egyenlő távolságra helyezkedik el.
Q3 Me Me Q1 F Q3 Me Me Q1 2009. 10. 14.
39