Budapesti Műszaki és Gazdaságtudományi Egyetem Gazdaság- és Társadalomtudományi Kar
Dr. Kövesi János – Erdei János – Nagy Jenő Bence – Dr. Tóth Zsuzsanna Eszter
Gazdaságstatisztika Oktatási segédanyag a Gazdaságstatisztika című tárgyhoz a Gazdálkodási és menedzsment (BA), Műszaki menedzser (BSc), Nemzetközi gazdálkodás (BA), valamint az Alkalmazott közgazdaságtan (BA) alapszakok részére
Budapest 2011
Tartalomjegyzék I. BEVEZETŐ ....................................................................................................................................................... 5 I.1 A SZÁMOK SZEREPE A GYAKORLATI ÉLETBEN ................................................................................................ 6 I.2 A MÉRÉS, A MÉRÉSI SKÁLÁK .......................................................................................................................... 7 I.2.a Névleges (nominális) skála .................................................................................................................... 8 I.2.b Sorrendi (ordinális skála) ..................................................................................................................... 8 I.2.c Intervallumskála .................................................................................................................................... 9 I.2.d Arányskála (abszolút skála) .................................................................................................................. 9 II. A GAZDASÁGSTATISZTIKA TERÜLETE ............................................................................................. 10 II.1 A GAZDASÁGSTATISZTIKA ÉS A GAZDASÁG SZINTJEI .................................................................................. 11 II.2 A GAZDASÁGI ALANYOK............................................................................................................................. 12 II.3 GAZDASÁGI ÜGYLETEK, GAZDASÁGI FOLYAMATOK ................................................................................... 14 II.4 A GAZDASÁGSTATISZTIKA MÓDSZEREI ....................................................................................................... 17 II.4.a A gazdaságstatisztika alapműveletei .................................................................................................. 17 II.5 STATISZTIKAI OSZTÁLYOZÓ RENDSZEREK .................................................................................................. 18 II.6 HIVATALOS STATISZTIKAI SZOLGÁLAT ....................................................................................................... 20 II.7 NEMZETGAZDASÁGI MÉRLEGRENDSZER ..................................................................................................... 23 III. MINTAVÉTEL ............................................................................................................................................. 26 III.1 A MATEMATIKAI STATISZTIKA TÁRGYA .................................................................................................... 27 III.2 MINTAVÉTELI HIBA ................................................................................................................................... 28 III.3 MINTAVÉTELI ELJÁRÁSOK ......................................................................................................................... 29 III.3.a Egyszerű véletlen mintavétel............................................................................................................. 29 III.3.b Rétegzett mintavétel .......................................................................................................................... 30 III.3.c Csoportos mintavétel ........................................................................................................................ 31 III.3.d Többlépcsős mintavétel..................................................................................................................... 32 III.3.e Nemvéletlen mintavételi eljárások .................................................................................................... 32 IV. LEÍRÓ STATISZTIKA ............................................................................................................................... 34 IV.1 A LEÍRÓ STATISZTIKA HELYE, SZEREPE A STATISZTIKA VILÁGÁBAN ......................................................... 35 IV.2 A STATISZTIKAI LEÍRÁS CÉLJA, MÓDSZEREI............................................................................................... 35 IV.3 AZ ADATOK ÁBRÁZOLÁSA......................................................................................................................... 36 IV.4 TAPASZTALATI ELOSZLÁSOK..................................................................................................................... 39 IV.5 TAPASZTALATI ELOSZLÁSOK KÖZÉPÉRTÉK MUTATÓI ................................................................................ 44 IV.5.a Medián (Me) ..................................................................................................................................... 44 IV.5.b Módusz (Mo) ..................................................................................................................................... 46
()
IV.5.c Számtani átlag x ........................................................................................................................... 47 IV.5.d Egyéb átlagfajták .............................................................................................................................. 48 IV.5.e Választás a középértékek között ........................................................................................................ 49 IV.5.f Kvantilisek ......................................................................................................................................... 50 IV.6 AZ INGADOZÁS MÉRŐSZÁMAI ................................................................................................................... 52 IV.6.a Terjedelem (R) .................................................................................................................................. 52 IV.6.b Átlagos abszolút különbség (G) ........................................................................................................ 53 IV.6.c Átlagos abszolút eltérés (∆) .............................................................................................................. 53 IV.6.d Tapasztalati szórás (s), korrigált tapasztalati szórás (s*) ................................................................. 54 IV.6.e Relatív szórás (v) ............................................................................................................................... 55 IV.7 AZ ELOSZLÁS ALAKJÁT JELLEMZŐ EGYÉB MUTATÓSZÁMOK ..................................................................... 55 IV.7.a Aszimmetria mutató .......................................................................................................................... 56 IV.7.b Csúcsossági mutató........................................................................................................................... 57 IV.8 ESETTANULMÁNY – LEÍRÓ STATISZTIKAI ELEMZÉS ................................................................................... 58 V. RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA, STANDARDIZÁLÁS, INDEXSZÁMÍTÁS ..... 65 V.1 RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA .............................................................................................. 66 V.2 RÉSZ- ÉS ÖSSZETETT VISZONYSZÁMOK....................................................................................................... 67 V.3 AZ ISMÉRVEK KÖZÖTTI KAPCSOLAT FOGALMA ÉS FAJTÁI ........................................................................... 71 V.4 STANDARDIZÁLÁS ...................................................................................................................................... 73 V.4.a Különbségfelbontás ............................................................................................................................ 75
2
V.4.b Hányadosfelbontás ............................................................................................................................. 78 V.5 INDEXSZÁMÍTÁS ......................................................................................................................................... 81 V.5.a Elemzés dinamikus viszonyszámokkal ................................................................................................ 81 V.6 INDEXSZÁMÍTÁS ALAPJAI: AGGREGÁLT SOKASÁG ...................................................................................... 82 V.6.a Két időszakra vonatkozó indexszámítás ............................................................................................. 83 V.6.b A legfontosabb volumen- és árindex formulák ................................................................................... 85 V.6.c Az indexek átlagformái ....................................................................................................................... 87 V.6.d Néhány fontos indexösszefüggés ........................................................................................................ 88 V.6.e Aggregátumok különbsége.................................................................................................................. 89 V.7 FONTOSABB ÁRINDEXEK ............................................................................................................................ 92 V.7.a Termelői árindexek............................................................................................................................. 92 V.7.b A fogyasztói árindex ........................................................................................................................... 96 V.7.c A hazai fogyasztói árindex.................................................................................................................. 96 V.7.d Tőzsdeindex ........................................................................................................................................ 99 V.7.e Reálbér ............................................................................................................................................. 100 V.7.f Reáljövedelem ................................................................................................................................... 101 V.7.g Bruttó hazai termék .......................................................................................................................... 101 V.8 TERÜLETI INDEXEK .................................................................................................................................. 105 VI. VALÓSZÍNŰSÉGI VÁLTOZÓ, ELMÉLETI ELOSZLÁSOK ............................................................. 108 VI.1 VALÓSZÍNŰSÉGSZÁMÍTÁS ALAPOK ......................................................................................................... 109 VI.1.a A valószínűség fogalma................................................................................................................... 110 VI.1.b Műveletek eseményekkel ................................................................................................................. 111 VI.1.c A valószínűségszámítás axiómarendszere ....................................................................................... 114 VI.1.d Valószínűség meghatározásának módszerei ................................................................................... 115 VI.2 VALÓSZÍNŰSÉGI VÁLTOZÓ JELLEMZŐI .................................................................................................... 117 VI.3 DISZKRÉT ELMÉLETI ELOSZLÁSOK .......................................................................................................... 121 VI.3.a Diszkrét egyenletes eloszlás ............................................................................................................ 121 VI.3.b Binomiális eloszlás ......................................................................................................................... 121 VI.3.c Hipergeometrikus eloszlás .............................................................................................................. 122 VI.3.d Poisson-eloszlás .............................................................................................................................. 123 VI.4 FOLYTONOS ELMÉLETI ELOSZLÁSOK ....................................................................................................... 124 VI.4.a Folytonos egyenletes eloszlás ......................................................................................................... 124 VI.4.b Exponenciális eloszlás .................................................................................................................... 125 VI.4.c Normális (Gauss-) eloszlás ............................................................................................................. 125 VI.5 KÖZPONTI HATÁRELOSZLÁS TÉTELE ....................................................................................................... 128 VII. BECSLÉS ................................................................................................................................................... 130 VII.1 A BECSLÉS TULAJDONSÁGAI .................................................................................................................. 131 VII.1.a Torzítatlan becslés ......................................................................................................................... 131 VII.1.b Konzisztens becslés ........................................................................................................................ 132 VII.1.c Hatásos becslés .............................................................................................................................. 134 VII.1.d Elégséges becslés........................................................................................................................... 134 VII.2 A PONTBECSLÉS MÓDSZEREI .................................................................................................................. 135 VII.2.a Exponenciális eloszlás paraméterének grafikus becslése .............................................................. 136 VII.2.b Normális eloszlás paramétereinek grafikus becslése .................................................................... 136 VII.3 INTERVALLUMBECSLÉS.......................................................................................................................... 137 VII.3.a Konfidenciaintervallum a normális eloszlás várható értékére ...................................................... 138 VII.3.b Konfidenciaintervallum a normális eloszlás várható értékére, ha az elméleti szórás ismeretlen.. 140 VII.3.c Sokasági arány becslése ................................................................................................................ 141 VII.3.d Sokasági variancia becslése, ......................................................................................................... 142 VIII. HIPOTÉZISVIZSGÁLATOK: NEMPARAMÉTERES PRÓBÁK.................................................... 145 VIII.1 A HIPOTÉZISVIZSGÁLAT ÁLTALÁNOS MENETE ...................................................................................... 146 VIII.2 ILLESZKEDÉSVIZSGÁLAT χ2-PRÓBÁVAL ............................................................................................... 150 VIII.3 χ2-PRÓBA ALKALMAZÁSA HOMOGENITÁSVIZSGÁLATRA ...................................................................... 152 VIII.4 χ2-PRÓBA ALKALMAZÁSA FÜGGETLENSÉGVIZSGÁLATRA ..................................................................... 154 VIII.4.a Minőségi ismérvek asszociációja ................................................................................................. 157 IX. HIPOTÉZISVIZSGÁLATOK: PARAMÉTERES PRÓBÁK ................................................................ 158
3
IX.1 EGYMINTÁS PRÓBÁK ............................................................................................................................... 159 IX.1.a Várható értékre irányuló próbák .................................................................................................... 159 IX.1.b Szórásnégyzetre vonatkozó próba ................................................................................................... 161 IX.2 KÉT- ÉS TÖBBMINTÁS PRÓBÁK ................................................................................................................ 162 IX.2.a Két független minta várható értékének összehasonlítása ................................................................ 163 IX.2.b Páros minták várható értékének összehasonlítása .......................................................................... 166 IX.2.c Két szórásnégyzet (szórás) összehasonlítása .................................................................................. 168 IX.2.d Több szórás összehasonlítására vonatkozó próbák ........................................................................ 169 IX.2.e Varianciaanalízis ............................................................................................................................ 171 X. KORRELÁCIÓ- ÉS REGRESZIÓELEMZÉS, IDŐSORELEMZÉS .................................................... 174 X.1 DETERMINISZTIKUS ÉS SZTOCHASZTIKUS KAPCSOLATOK ......................................................................... 175 X.2 A KAPCSOLAT SZEMLÉLTETÉSE ................................................................................................................ 175 X.3 IDŐSOROK ELEMZÉSE, ............................................................................................................................... 176 X.4 IDŐSOROK ÖSSZETEVŐINEK VIZSGÁLATA ................................................................................................. 178 X.4.a Trend becslése mozgóátlagok segítségével ...................................................................................... 179 X.4.b Szezonalitás vizsgálata ..................................................................................................................... 181 X.4.c Auto- és keresztkorreláció idősorok elemzésénél ............................................................................. 183 X.5 AZ ELŐJEL–KORRELÁCIÓS EGYÜTTHATÓ .................................................................................................. 183 X.6 A LINEÁRIS REGRESSZIÓ ÉS A KORRELÁCIÓ .............................................................................................. 185 X.6.a Az elméleti korrelációs együttható ................................................................................................... 190 X.7 AZ R(X,Y) ÉS A REGRESSZIÓS EGYENES ÖSSZEFÜGGÉSE ............................................................................ 192 X.7.a A regressziós becslés pontossága ..................................................................................................... 193 XI. TÁRGYMUTATÓ ...................................................................................................................................... 197 XII. FELHASZNÁLT IRODALOM ............................................................................................................... 199
4
I. Bevezető
5
I.1 A számok szerepe a gyakorlati életben A modern társadalmat és folyamatait (termelés, szolgáltatás, államigazgatás, pihenésszórakozás stb.) számok nélkül nem lehetne megszervezni. Irányító-, ház-, emelet- és ajtó számokkal jelöljük lakásunkat, személyi- és személyi igazolványszámokkal, telefonszámokkal, bankkártya és PIN kódokkal rendelkezünk, a repülőjáratokat, busz és villamos vonalakat, a személygépkocsikat, a labdarúgókat, az alapanyagokat a raktárban, a dokumentációs rajzokat mind számokkal különböztetjük meg egymástól, számokkal jellemezzük a tenisz- és sakk világranglistán található sportolókat, a Forma 1 jelenlegi állását stb. Pontszámok kísérnek valamennyiünket az óvodában végzett iskolaérettségi teszttől kezdve tanulási, értékelési folyamataink kritikus lépéseinél, – miközben tudásunkat, képességeinket osztályzatokkal, vagy éppen az intelligenciahányadossal kísérjük megmérni. De számokkal mérjük egy cég teljesítményét (1.200.000 fm; 250.000 pár; 15.000 db., 6800 ügyfél stb.) és eredményét is (2,5 milliárd Forint árbevétel; 35 ezer Dollár nyereség). Számok jellemzik termékeinket a vállalati cikkjegyzékben, egyes műszaki jellemzőket is számokkal ”fogjuk meg” (80 Watt, 0,5 kilogramm, stb.). Az észlelt földrengés erejét is rögtön számokban szokás kifejezni (6,8 a Richter skálán), de még egy labdarugó csapat továbbjutási esélyét is százalékok segítségével szokás kifejezni („80 százalék, hogy továbbjut”). Anélkül, hogy példáinkat tovább sorolnánk, belátható, hogy a különböző problémák „jellemzésére” használt számok jelentésében lényeges eltéréseket érezhetünk (pl. 1-es vagy 5-ös osztályzat egy tantárgyból, vagy 1 és 5 kg alma közötti különbség egyértelműen látható). A számok önmagukban tehát nem értékelhetők anélkül, hogy a mögöttük lévő „tartalmat” ne ismernénk! A „szám” tehát – modell, amelynek segítségével egzaktan megkíséreljük leírni, jellemezni a vizsgált jelenséget, eseményt, folyamatot, fogalmat, személyt stb. A számot az esetek döntő többségében méréssel vagy megszámolással nyerjük, és éppen a mérés „erőssége” fogja megkülönböztetni egymástól a méréssel nyert számok – az adatok – erősségét. A szám a matematikus, a statisztikus eszköze, az adat – a mögötte lévő tartalommal és méréssel együtt – az alkalmazóé. Az alkalmazó szakember számára az adat az információ hordozója, amely azzal az előnnyel rendelkezik, hogy szám lévén a matematika (determinált vagy sztochasztikus) egzakt apparátusa segítségével „kezelhetővé” válik. A szám, az apparátus és a probléma, a valóság azonban egymástól nem választható el – mert ez komoly félreértelmezések forrása lehet! Egyes problémák kezelésére, megoldására ugyanis például egyes számok, műveletek, módszerek nem alkalmazhatók. Az alkalmazott statisztika oldaláról közelítő felfogásban tehát fontosabb a probléma, a valóság, a szám mögött levő tartalom. Ezt sohase tévesszük szem elől. Mindig ennek átgondolása után válasszuk meg a megfelelő statisztikai modellt és módszereket, és különösen a szakmai értelmezés kapcsán vizsgáljuk meg körültekintően a modell (az adat, a szám) és a valóság, a probléma viszonyát.
6
I.2 A mérés, a mérési skálák1 A számszerű információ hordozója az adat. Az adat egy méréssel vagy megszámlálással nyert szám. Ezzel egy olyan „területre” értünk, amely az alkalmazott statisztikának igen fontos kérdése, a klasszikus statisztikának kevésbé: Mit értünk „mérés” alatt, milyen mérési skálákat ismerünk, hogy lehet mérési skálát „készíteni”, egyik skáláról a másikra kerülni, két különböző mérési „erősségű” adattal egyidejűleg dolgozni stb.? Hagyományos értelmezés szerint a mérés összehasonlítást jelent valamilyen skálával vagy etalonnal. Ez azt jelenti, hogy egy fizikai vagy kémiai mennyiséget a választott mértékegységben kifejezett számértékével jellemzünk. A mérés mai átfogóbb értelmezésében a hangsúly a mérőeszköz használati módjáról eltolódik a mérőeszköz (skála) létrehozásának logikai folyamatára. Ezt a szemléleti változást tükrözi Stevens 1951-es definíciója is: „A mérés számok hozzárendelése objektumokhoz, azok tulajdonságaihoz, eseményekhez, szabályoknak valamilyen halmaza szerint.” Ennek a gondolatnak az általánosabb értelmezése Schnell szerint: „A mérés a mért jellemzők közötti viszony kifejezése szimbólumok közötti viszonnyal. Ennek megfelelően a mérés a mért jellemzőket szimbólumokra, a jellemzők halmazán értelmezett viszonyt a szimbólumok halmazára értelmezett viszonyra képezi le.” A skála a mérési eredmények értelmezéséhez szükséges információkat rögzíti. Egy mérési skála létrehozásához az alábbi információkat kell megadni: • a mért jellemzők lehetséges kimenetelének definiálása, • a mért jellemzők halmazán értelmezett relációk definiálása, • a szimbólumok halmazának definiálása, • a szimbólumok halmazán értelmezett relációk definiálása, • a mért jellemzők és a szimbólumok közötti leképzés definiálása, • a mért jellemzők halmazán értelmezett relációk és • a szimbólumok halmazán értelmezett relációk közötti leképzés definiálása. A mérés során alkalmazott számsoroktól elvárt tulajdonságok alapján négy különböző skálatípust különböztetünk meg: névleges (nominális), sorrendi/rangsor (ordinális), intervallum- és arányskálát. A mérési skálákat, a mérés szintjét a hozzárendelési szabályok határozzák meg. Mindegyik skálát invarianciájának mértékével lehet jellemezni, vagyis azokkal a transzformációkkal, amelyek a skála struktúráját változatlanul hagyják. Mielőtt az egyes skálákat részletesebben ismertetnénk, a számokból alkotható formális rendszerek néhány lényeges vonását kell megvizsgálnunk. A számok különféle relációk és műveletek szerint alkothatnak formális rendszert. A rendszert alkotó relációk és műveletek közül az egyenlőség, a sorrendiség és az additívitás minősül lényegesnek a mérési skálák meghatározása szempontjából. Az egyenlőséget, a sorrendiséget és az additivitást a következő axiómák szerint írhatjuk le: l. vagy A=B vagy A≠B 2. ha A=B, akkor B=A 3. ha A=B és B=C, akkor A=C 4. ha A>B, akkor BB és B>C, akkor A>C 6. ha A=P és B>0, akkor A+B>P 7. A+B=B+A 1