Statisztika
1. előadás
Témakörök Statisztikai alapfogalmak Statisztikai sorok Mennyiségi sorok csoportosítása Statisztikai táblák
Statisztika fogalma Gyakorlati tevékenység Adatok összessége Módszertan A statisztika, mint gyakorlati tevékenység a tömegesen előforduló jelenségek egyedeire vonatkozó információk gyűjtése, feldolgozása és elemzése, illetve ennek alapján a vizsgált jelenség egészének tömör, számszerű jellemzése.
Statisztikai tevékenység ágai Statisztikai tevékenység ágazatai: Népességstatisztika: az emberi népességre vonatkozó adatok gyűjtése, feldolgozása, elemzése;
Gazdaságstatisztika: gazdasági élet egészének legfőbb, számszerű mozzanatai (makro jellegű);
Ágazati statisztikák: egyes népgazdasági ágak adatai (mikro jellegű);
Vállalati, üzemi statisztika; Társadalomstatisztika: társadalmi élet nem gazdasági területeivel foglalkozik.
A statisztikai munka fázisai Tervezés: a statisztikai munka céljának definiálása. Adatgyűjtés: Kikérdezés (személyes interjú, telefon, posta) Megfigyelés Kísérlet
Feldolgozás: adatok ellenőrzése, helyesbítése. Elemzés: matematikai és logikai műveletek.
Statisztikai alapfogalmak Sokaság: a statisztikai megfigyelés tárgyát képező egyedek összessége. Sokaság típusai: Diszkrét sokaság: elkülönülő egységekből áll Folytonos sokaság: egységeit csak önkényesen lehet elkülöníteni egymástól
Álló (stock) sokaság: a sokaságot időpontra vonatkozóan értelmezhetjük
Mozgó (flow) sokaság: a sokaságot időtartamra vonatkozóan értelmezhetjük
Véges számosságú sokaság Végtelen számosságú sokaság
Statisztikai alapfogalmak Statisztikai ismérv: A statisztikai ismérv a statisztikai sokaság egységeit jellemző tulajdonság. Az ismérv lehetséges kimenetelei az ismrévváltozatok. Típusai: Időbeli: időpont vagy időtartam megnevezéséből áll Időbeli Területi: földrajzi megjelölés, pl: ország, megye, város, község Minőségi: pl. nem, foglalkozás, hajszín Mennyiségi (számmal): pl. életkor, testmagasság, lábméret Fajtái: diszkrét folytonos Közös
Megkülönböztető
Példa: sokaság definiálása 2009. október 22-án a ME posztgraduális képzésben részt vevő hallgatói Statisztika előadáson az A/1 épületben Ismérv
Közös
Megkülönböztető
Posztgraduális képzés, magyar, egyetemista
Szak, munkahelyi beosztás, nem, hajszín,
Mennyiségi
van 1 diplomája
testmagasság, életkor felvett kreditek száma,
Időbeli
2009. 10. 02.
születési idő, érettségi időpontja
Területi
Miskolc, A/1
születési hely, lakhely
Minőségi
Statisztikai sokaság Sokaság: A Magyarországra érkező nyugat-európai turisták 2010. nyarán. Ismérv típusa Közös Megkülönböztető Minőségi Mennyiségi Időbeli Területi
Statisztikai adat Statisztikai adat: A statisztikai adat valamely statisztikai sokaság tagjainak a száma vagy a sokaság valamilyen másféle számszerű jellemzője. Típusai: Abszolút adatok Leszármaztatott adatok
Mutatószámok: Azok az adatok, amelyekkel valamilyen rendszeresen megismétlődő társadalmi, gazdasági jelenséget statisztikailag jellemezni szoktunk.
Mérési skálák A mérés a számok meghatározott szabályok szerinti hozzárendelése jelenségekhez (dolgokhoz, eseményekhez, tárgyakhoz), illetve ezek bizonyos tulajdonságaihoz. Mérési skálák típusai: névleges skála, sorrendi skála, intervallum skála, arány skála.
Nominális skála Jellemzői: A számok, megjelölések kötetlen hozzárendelését jelenti. A számok, jelölések csak a sokaság egyedeinek azonosítására szolgálnak. A legegyszerűbb és legkevésbé informatív mérési fokozat. Semmi értelme sincs a kódszámok hányadosának vagy különbségének, sőt még azok nagyságrendjének sem. Az egységekhez tartozó számértékeknek nincs mértékegysége. Például: Az évfolyam hallgatóinak születési hely, nem, hajszín, stb. alapján történő csoportosítása. Két emberről csak annyit mondhatunk, hogy egyforma vagy nem.
Ordinális skála Jellemzői: Az egységek a tulajdonságok szerint rangsorba állíthatók. (Nemcsak azt mutatja, hogy két ember azonos vagy különböző, hanem pl.: nagyobb, konzervatívabb, vallásosabb, stb.) A skálaértékek bármilyen számértékek lehetnek számértékek nem hordoznak információt Nincs értelme a skálaértékkel végzett műveleteknek.
Például: (Egy társaságban a résztvevőket megkérjük, iskolai végzettség szerint álljanak csoportokba. A csoportokat elrendezhetjük: általános, közép és felsőfokú végzettségűekből állókra. Fontos, hogy a csoportok távolságának nincs jelentősége, állhatnak 5, 10, vagy 50 méterre egymástól)
Intervallumskála Jellemzői: A mennyivel több / nagyobb kérdésre is válasz tudunk adni. A skálaértékek különbségei valós információt nyújtanak a sokaság egységeiről. Skálaértékek különbségei is tényként kezelhető információt nyújtanak . A skáláknak már van mértékegysége is. A skála kezdőpontja – a 0 pont –önkényes. Például: A rangsorba rendezett tulajdonságokat egyenlő közök választják el. (Pl.: IQ tesztek: 100-110, 110-120: egyenlő távolságok. (Két ember összehasonlításánál mondhatjuk, hogy különböznek egymástól (nominális), egyik nagyobb a másiknál (ordinális) és meg tudjuk mondani, hogy mennyivel (intervallum).
Arányskála Jellemzői: A legtöbb információt nyújtó skála. A kezdőpont egyértelműen adott és rögzített, s így a skálaértékek egymáshoz való aránya is meghatározható. (életkor, jövedelem, stb.)
Statisztikai csoportosítás A csoportosítás a sokaság felosztása a sokaság egységeit jellemző megkülönböztető ismérv szerint. Bármely osztályozástól elvárható: teljesek legyenek átfedésmentesek homogén osztályokat eredményezzen. Azt a tulajdonságot, amely szerint a sokaságot csoportosítjuk, csoportképző ismérvnek nevezzük. A csoportosítás típusai az ismérvek fajtái szerint: Időbeli csoportosítás: a statisztikai adatokat időszakok vagy időpontok szerint rendezzük. Területi csoportosítás: a statisztikai adatokat területi (földrajz) tulajdonság szerint rendezzük. Minőségi csoportosítás: a statisztikai adatokat minőségi megjelölés szerint rendezzük. Mennyiségi csoportosítás: a statisztikai adatokat a számszerűen kifejezhető tulajdonságaik szerint rendezzük.
Statisztikai csoportosítás Csoportosítás típusai: Időbeli Területi Minőségi mennyiségi Osztály
Egységek száma
C1
f1
C2
f2
…
…
…
…
Ck
fk
Összesen
N
Statisztikai sorok Statisztikai adatoknak meghatározott összefüggésben, valamilyen meghatározott ismérv szerinti felsorolása. A sort létrehozó összefüggés származhat: Egy sokaság osztályozásából, Egy sokaság térbeli/időbeli összehasonlításából, Egyazon jelenséghez tartozó többféle sokaság felsorakoztatásából
Statisztikai sorok Típusai: Csoportosító sor: Egy fősokaság és a megfelelő részsokaságok nagyságát adja meg. Tartozéka az összegző adat. Azonos fajta és azonos mértékegységű adatokat tartalmaz. Összehasonlító sor: A felsorolás célja kifejezetten az időbeli vagy a térbeli összehasonlítás. Ez is azonos fajta és mértékegységű adatokat tartalmaz, de azok általában nem adhatók össze. Leíró sor: Általában különbözőfajta, különböző mértékegységű adatokat tartalmaz, amelyek mindegyike egy meghatározott jelenségre, társadalmi vagy gazdasági egységre vonatkozik, azt több különböző szempontból jellemzi.
Leíró sor (példa) Magyarország népességére és gazdaságára vonatkozó adatok (2004) Megnevezés
A mutató értéke
Terület (km2)
93.030
Népesség (ezer fő)
10.098
Munkanélküliségi ráta (%)
6,1
Összehasonlító sorok
Idősorok Az idősorok a jelenségek, folyamatok időbeli alakulását mutatják, és lehetővé teszik statisztikai adatok időbeli összehasonlítását. Típusai: Tartam idősor: valamilyen időtartam alatt történt folyamat alakulását mutatja, a mozgó sokaságokra vonatkozó adatokat kapcsolja egymáshoz. Az adatai általában összegezhetőek. Állapot idősor: a különböző időpontokra vonatkozólag végrehajtott időponti felvételek eredményeit sorolja fel, állósokaságokra vonatkozó adatokat kapcsol egymáshoz, adatai nem adhatóak össze.
Idősorok
(példa állapot idősorra)
Magyarország népessége a népszámlálások eszmei időpontjában, fő Év Népesség száma 1970
10.322
1980
10.709
1990
10.709
2001
10.214
Idősorok
(példa összehasonlító tartam
idősorra) A házasságkötések számának alakulása Magyarországon
Év 2000 2001 2002 2003 2004 2005 Forrás: Ksh
A házasságkötések száma (db) 48.110 43.583 46.008 45.398 43.791 44.234
Idősorok
(példa csoportosító tartam idősorra)
Egy kiskereskedelmi bolt forgalmának negyedéves adatai 2005-ben
Negyedév I. II. III. IV. Év összesen
Forgalom (eFt) 3.880 4.020 3.975 4.665 16.540
Területi összehasonlító sorok A GDP volumenének évi átlagos növekedési üteme 2001-2005 (%) Ország Évi átlagos növekedési ütem Csehország 3,5 Horvátország
4,7
Magyarország
4,2
Szlovénia
3,4
Forrás: Ksh
Területi csoportosító sorok A felsőoktatási intézmények száma a magyarországi régiókban (db), 2006/2007 Régió Intézmények száma Észak- Magyarország
5
Közép-Dunántúl
8
….
…
Összesen
71
Forrás: Ksh
Csoportosító sorok
Minőségi csoportosító sorok Magyarországon a vendéglátóhelyek száma, db (2005) Üzlettípus
Vendéglátóhelyek száma
Étterem, cukrászda
36648
Munkahelyi vendéglátóhely
5819
Bár, borozó
13827
Összesen
56294
Forrás: Ksh
Minőségi összehasonlító sorok Magyarországon a férfiak és a nők születéskor várható átlagos élettartama (2005)
Nem Férfi Nő Forrás: Ksh
Születéskor várható átlagos élettartam (év) 68,6 76,9
Mennyiségi sorok A dolgozók kereset szerinti megoszlása Kereset (eFt)
Dolgozók száma (fő)
-100
9
100,1-140
12
140,1-180
2
180,1-220
1
220,1-
1
Összesen
25
Mennyiségi sorok Jellemzői: A statisztikai adatok elemzésének egyik leggyakoribb esete. A statisztikai sokaság mennyiségi ismérv szerinti csoportosításának eredménye. A csoportosítást számszerűen meghatározott ismérv alapján végezzük. A mennyiségi sor mindig két számsort tartalmaz, amelyikből az egyik mindig a mennyiségi ismérv változatait fejezi ki.
Példa mennyiségi sorokra Egy vállalkozás 20 dolgozójának havi nettó átlagkeresetének rangsora (eFt):
60
60
60
80
80
80
100
100
100
100
120
120
120
120
120
130
130
130
140
140
Gyakorisági sor A gyakoriság azt mutatja, hogy a mennyiségi ismérv szerint képzett egy-egy osztályba (osztályközbe) a sokaságnak hány egysége tartozik.
A gyakorisági sorok általános sémája Ismérvérték Xi X1 X2 . .
Gyakoriság fi f1 f2 . .
Xi . .
fi . .
Xk Összesen
fk N
Gyakorisági sor (példa alapján) A vállalat dolgozóinak havi nettó kereset szerinti megoszlása Nettó átlagkereset (eFt) xi
Létszám (fő) fi
60
3
80
3
100
4
120
5
130
3
140
2
Összesen
20
Relatív gyakorisági sor A relatív gyakoriságok azt mutatják, hogy a mennyiségi ismérv szerint képzett egy-egy osztályba (osztályközbe) a sokaságnak hányad része (hány százaléka) tartozik. Képlete: fi
gi =
N
(i = 1, ...., k)
Az eloszlás, illetve a megoszlás, azt mutatja meg, hogy az ismérvértékek hogyan oszlanak meg az egyes osztályok között. A gyakorisági sorok általános sémája: Ismérvérték Xi X1 X2 . . Xi . . Xk Összesen
Relatív gyakoriság gi (%) g1 g2 . . gi . . gk 100
Relatív gyakorisági sor (példa alapján) A vállalat dolgozóinak havi nettó kereset szerinti megoszlása Nettó átlagkereset (eFt) xi
Létszám (fő) fi
Relatív gyakoriság gi (%)
60
3
80
3
15
100
4
20
120
5
25
130
3
15
140
2
10
Összesen
20
100
g1 =
3 = 15 20
Értékösszeg sor Az értékösszegsor a mennyiségi ismérv alapján kialakított osztályokhoz (osztályközökhöz) az azokba tartozó egységek ismérvértékeinek összegét rendeli. Képlete: si=fi * x Az értékösszegsor általános sémája Ismérvérték Xi X1 X2 . . Xi . . Xk Összesen
Étékkösszeg si s1 s2 . . si . . sk s
Értékösszeg sor (példa alapján) A vállalat dolgozóinak havi nettó kereset szerinti megoszlása Nettó átlagkereset (eFt) xi
Létszám (fő) fi
Értékösszeg eFt
60
3
80
3
240
100
4
400
120
5
600
130
3
390
140
2
280
Összesen
20
2090
s 1 = 3 ⋅ 60 = 180
Relatív értékösszeg sor Relatív értékösszegen egy olyan megoszlási viszonyszámot értünk, amely az egyes osztályok (osztályközök) értékösszegét (Si) a teljes értékösszeghez (S) viszonyítja. Képlete:
z i=
si
=
k
∑s
si s
i
i =1
Az értékösszegsor általános sémája Ismérvérték Xi X1 X2 . . Xi . . Xk Összesen
Relatív értékösszeg (%) Zi z1 z2 . . zi . . zk 100
Relatív értékösszeg sor (példa alapján) A vállalat dolgozóinak havi nettó kereset szerinti megoszlása Nettó átlagkereset (eFt) xi
Értékösszeg Ft
Relatív értékösszeg %
60
180
80
240
11,5
100
400
19,1
120
600
28,7
130
390
18,7
140
280
13,4
Összesen
2090
100,0
z1 =
180 2090
= 8,6
Kumulált gyakorisági és relatív gyakorisági sorok A kumulált gyakoriságok (jele: fi’ ), illetve kumulált relatív gyakoriságok (jele: gi’ ) adatai azt mutatják, hogy az adott értéknek megfelelő és annál kisebb ismérvértékek hányszor (fi’ ), illetve milyen arányban (gi’ ) fordulnak elő. A kumulált gyakorisági, illetve kumulált relatív gyakorisági sort úgy képezzük, hogy a gyakoriságokat (fi), illetve relatív gyakoriságokat (gi) rendre halmozva összeadjuk.
Kumulált gyakorisági és relatív gyakorisági sorok (példa alapján) A vállalat dolgozóinak havi nettó kereset szerinti megoszlása Létszám (fő) Nettó fi átlagkereset (eFt) xi
fi ’
Relatív gyakoriság gi (%)
g i’
60
3
3
15
15
80
3
6
15
30
100
4
10
20
50
120
5
15
25
75
130
3
18
15
90
140
2
20
10
100
Összesen
20
-
100
-
Kumulált értékösszeg és relatív értékösszeg sorok (példa alapján) A vállalat dolgozóinak havi nettó kereset szerinti megoszlása Értékösszeg eFt
si’ Ft
Relatív értékösszeg %
zi’ %
180
180
8,6
8,6
240
420
11,5
20,1
400
820
19,1
39,2
600
1420
28,7
67,9
390
1810
18,7
86,6
280
2090
13,4
100,0
2090
-
100,0
-
Statisztikai táblák A statisztikai sorok összefüggő rendszere. Formai követelmények: Cím A tábla fej- és oldalrovata egyértelműen írja le az ismérvváltozatokat Forrás Adatok magyarázata
Statisztikai táblák Táblák csoportosítása: Rendeltetés szerint: Feldolgozói Közlési Munkatábla
Csoportosítás szerepe szempontjából: Egyszerű Csoportosító Kombinációs
Egyszerű tábla Magyarország népességére és gazdaságára vonatkozó adatok (2004) Megnevezés
A mutató értéke
Terület (km2)
93.030
Népesség (ezer fő)
10.098
Munkanélküliségi ráta (%) Forrás: Ksh
6,1
Csoportosító tábla A felsőoktatási intézmények száma a magyarországi régiókban (db), 2006/2007 Régió
Intézmények száma
Közép-Magyarország
39
Közép-Dunántúl
8
Nyugat-Dunántúl
4
Dél-Dunántúl
3
Észak- Magyarország
5
Észak-Alföld
6
Dél- Alföld
6
Összesen
71
Forrás: Ksh
Kombinációs tábla A Stat Kft. dolgozóinak megoszlása nemek szerint, fő Dolgozók neme Végzettség Összesen Férfi Nő Vezető
3
2
5
Beosztott
4
12
16
Összesen
7
14
21
Köszönöm a figyelmet!