Témakörök
Statisztika I.
GZM, EE, TV szakok (LEVELEZŐ tagozat)
2011-2012-es tanév I. félév
Oktató: Dr. Csáfor Hajnalka tanszékvezető főiskolai docens Regionális és Környezetgazdaságtan Tsz. E-mail:
[email protected]
Kötelező és ajánlott irodalmak Kötelező irodalom:
Dr. Illyésné dr. Molnár Emese: Statisztikai feladatgyűjtemény I. Perfekt Kiadó 2009. Továbbá a zárthelyi dolgozatok anyagát képezik a konzultációkon elhangzottak.
Ajánlott irodalom:
Statisztikai alapfogalmak Statisztikai elemzések viszonyszámokkal Statisztikai adatok és információk grafikus megjelenítése Mennyiségi ismérv szerinti elemzés (számított és helyzeti középértékek, szóródás mutatói, alakmutatók) Sztochasztikus kapcsolatok vizsgálata (asszociáció és vegyes kapcsolat) Indexszámítás (érték-, ár- és volumenindexek, területi indexek és indexsorok)
(Részletesen a tantárgyi programban, ami a GTI honlapján érhető el.)
Számonkérés és értékelés
A konzultációkon való részvétel (több mint) ajánlott.
A félév végén egy 100 pontos dolgozat megírására kerül sor. Aki ezzel nem szerez gyakorlati jegyet, annak további egy alkalommal lehetősége van egy ún. pótzárthelyi dolgozat megírására.
A féléves teljesítményértékelés a következőképpen történik: 88-100 pont 75-87 pont 62-74 pont 50-63 pont 50 pont alatt
Korpás Attiláné dr.: Általános statisztika I. Nemzeti Tankönyvkiadó 2005. Hunyadi László – Vita László: Statisztika I. BA tankönyv AULA Kiadó Bp. 2009. Molnár Máténé dr. – Tóth Mártonné dr.: Általános statisztika példatár I. Nemzeti Tankönyvkiadó 2005.
5 (jeles) 4 (jó) 3 (közepes) 2 (elégséges) 1 (elégtelen)
ZH: december 9. , 9.00-10.30 Pót ZH: december 16. , 9.00-10.30
Statisztikai alapfogalmak
Statisztikai alapfogalmak
Statisztika fogalma, tárgya és szerepe Statisztikai sokaság és ismérv Mérési szintek Statisztikai adat és mutatószám Statisztikai sorok Statisztikai táblák Adatfelvétel, adatszerzési módok Kérdőívszerkesztés A statisztikai adatok pontossága
1
Statisztika fogalma Tömegesen előforduló jelenségek egyedeire vonatkozó (elméleti és gyakorlati) tevékenység:
adatgyűjtés – gyakorlati tevékenység adatfeldolgozás tudományos módszertan adatok elemzése
Statisztika fogalma A statisztika tárgyát képező tömeges jelenségek között találunk a hétköznapi életben előforduló és a társadalmigazdasági jelenségeket is, ami alapján megkülönböztetünk: Általános statisztikát és Szakstatisztikákat (gazdaság-, népesség-, ágazati-, társadalomstatisztika, stb.
a vizsgált jelenség számszerű, tömör jellemzése. Pl. népszámlálás, földtulajdon-összeírás (gyak.), vizsgálati módszerek kiválasztása (elm.)
A jelenségeket le lehet írni egyszerűbb eszközökkel és bonyolultabb matematikai-statisztikai módszerekkel. Ennek megfelelően megkülönböztetünk: Leíró statisztikát és Statisztikai következtetést
Statisztika fogalma
Statisztikai sokaság és ismérv
Egyidős az állammal… Mo-on a XVIII.sz. az „első összeírás” XIX.sz. a statisztika komoly fejlődésnek indul: kialakul az intézményrendszer, központi adatszolgáltatás (Fényes Elek, Kőrösi József) Központi Statisztikai Hivatal (KSH, 1867) 1993-as XLVI-os törvény a statisztikáról 223/2009/EK rendelet az európai statisztikáról Regionális adatszolgáltatás prioritása
Statisztikai sokaság: A megfigyelés tárgyát képező egyedek összessége. (élőlény, tárgy, intézmény, stb.)
Egyedek, egységek: a sokaság legkisebb részei
Sokaság fajtái:
(NUTS-1. ország, NUTS-2: régió, NUTS-3: megye)
Statisztikai sokaság és ismérv
Statisztikai ismérvek: Olyan vizsgálati szempontok, amelyek alapján a sokaság egységei jellemezhetők és egymást nem fedő részekre bontható. Egy adott ismérv szerinti lehetséges tulajdonságokat (előfordulási lehetségeit) az ismérv változatainak nevezzük.
diszkrét – folytonos (elkülönült egységek – önkényes elkülönítés) álló – mozgó (időpont – időtartam) véges – végtelen (véges sok elem – végtelen sok elem)
Statisztikai sokaság és ismérv
Ismérvek fajtái: 1) Időbeli ismérvek 2) Területi ismérvek 3) Mennyiségi ismérvek 4) Minőségi ismérvek
Tárgyi ismérvek
- Alternatív ismérvek (és több változattal rendelkezők) - Közös ismérvek - Megkülönböztető ismérvek
2
Mérési szintek
Mérési szintek
Csak a mennyiségi ismérvek adatai számadatok, de bizonyos szabályok mellett minden ismérv lehetséges változatai számértékké alakíthatók.
4 féle mérési szintet (skálát) különböztetünk meg:
Névleges/nominális mérési szint Sorrendi/ordinális mérési szint Különbségi/intervallum mérési szint Arányskálán történő mérés
Mérés: számok meghatározott szabályok szerinti hozzárendelése jelenségekhez (dolgok, tárgyak, események), illetve azok bizonyos tulajdonságaihoz.
Mérési szintek
Mérési szintek
Névleges/nominális mérési szint: Számok közvetlen hozzárendelését jelenti az egységekhez. Ezek ún. kódszámok, amelyek csak a sokaság egyedeinek azonosítását szolgálják. (azonosság és különbözőség) Közük semmilyen reláció nem áll fenn, és velük számtani művelet nem végezhető.
Pl: hallgatók osztályzatai, áruk minőség szerinti osztályozása, katonai rendfokozat, stb.
Pl: rendszám, irányítószám, megyék száma
Mérési szintek
Különbségi/intervallum mérési szint: Kezdőpontja önkényesen választott. A skálaértékek sorrendje és különbségei is információt hordoznak a sokaság egyes egyedeiről. A skálán az értékek aránya és összege nem értelmezhető.
Sorrendi/ordinális mérési szint: A sokaság egyedeihez – bizonyos közös tulajdonság alapján – rendelt skálaérték sorrendisége írja le azok viszonyát. Az egységhez rendelt számérték sorrendje pontosan tükrözi az adott egység valamilyen szempontból vett sorrendjét. A számértékek magukban nem hordoznak információt (különbségeik nem értelmezhetők), csak azoknak a rendje.
Mérési szintek
Arányskálán történő mérés: A legtöbb információt nyújtó mérés. A kezdőpont egyértelműen rögzített, ennek köszönhetően két skálaérték egymáshoz viszonyított aránya is meghatározhatóvá válik. Adatain minden matematikai művelet végezhető. Az értékek különbségei bizonyos esetekben csak arányskálával egyetemben értelmezhetők: 800 Æ 1.000 (200 emelkedés) 10.000 Æ 10.200
Pl: a +10 és a +20 C fokok közötti különbség ugyanannyi, mint a -5 és a +5 C fokok közötti különbség.
Pl: életkor, termelési érték, jövedelem nagysága (amelyeket mind 0 értékről kiindulva mérik)
3
Feladat/1. Sokaság
Feladat/2. Ismérv
Ismérvváltozat
Ismérvfajta/ Mérési skála
Születési idő
1976
Időbeli/ intervallum
Lakóhely
Budapest
Területi/ nominális
Nem
Nő
Életkor
29
Minőségi/ nominális Mennyiségi/ arány
Egy konkrét egység
A magyar Kiss Réka népesség 2007. január elsején
Feladat/3.
Adottak az alábbi sokaságok: Magyarország népessége 2006. jan.1-jén 10 076 581 fő. A budapesti férfiak sörfogyasztása a 2006-os VB idején. BCE oktatói 2006. szept. 4-én. Jótékonysági koncertek 2006-ban a Zeneakadémián. Feladat: Állapítsa meg a sokaságok típusát és egységeit!
Statisztikai adat és mutatószám
Döntse el az alábbi ismérvekről, hogy mennyiségi vagy minőségi ismérvek-e!
Nem (férfi, nő)
Életkor
Magasság
Testsúly
Családi állapot
Iskolai végzettség
Statisztikai adat: Az egyedekről szerezhető információ. (szám, vagy számszerű jellemző) fogalmi jegy időbeli azonosító térbeli azonosító számérték mértékegység
Foglalkozás
Bruttó havi fizetés
Statisztikai mutatószám: Valamilyen statisztikai módszerrel a rendelkezésre álló adatokból számított származtatott statisztikai mérőszám.
(mérés vagy számlálás)
Például:
(Havi) Átlagbér Magyarországon 2008-ban bruttó
Statisztikai sorok A sokaság egy ismérv szerinti tömör jellemzése. Sorkészítés célja szerint: Csoportosító sor Összehasonlító sor Leíró sor
Nem valódi statisztikai sor (különböző fajtájú adatokból)
Ismérvfajtáknak megfelelően: Időbeli (tartam-állapot), területi, minőségi, mennyiségi + leíró sorok Sorok készítése:
ismérvváltozatok
Statisztikai sorok
Valódi statisztikai sorok (azonos fajtájú adatokból)
számszerű értékek
194.000 Ft/fő/hó
Csoportosító statisztikai sor: A sokaság belső összefüggéseit fejezi ki, csoportosítás céljából készül, adatai összegezhetők. (időbeli, területi, minőségi, mennyiségi)
Ismérvváltozatok
Egységek száma
C1 C2 . . Ci . Ck
f1 f2 . . fi . fk
Összesen:
N
4
Statisztikai sorok
Összehasonlító statisztikai sor: Összehasonlító adatok statisztikai sorba rendezve, összehasonlítási céllal, adataik nem összegezhetők. (idősor, területi)
Statisztikai sorok
Ismérvváltozat
Számérték/ mértékegység
C1 C2 . . Ci . Ck
adat adat . . adat . adat
Statisztika sorok kellékei:
Statisztikai táblák Statisztikai sorok összefüggő rendszere.
Egyszerű tábla (összehasonlító és/vagy leíró sorok) Nincs csoportosító sora, egy adata, egy statisztikai sor tagja.
Csoportosító tábla (csoportosító és/vagy összehasonlító vagy leíró sorok) Egyirányú csoportosítást tartalmaz, egy adata egy statisztikai sor tagja.
Statisztikai táblák
Egyszerű statisztikai tábla Egy városban az orvosellátottság alakulása:
Kombinációs tábla (csoportosító sorok) Csak csoportosító sorokat tartalmaz, egy adata egyidejűleg több statisztikai sor tagja.
Statisztikai táblák
Cím (sokaság pontos megnevezése, a közös ismérvek felsorolása) Tulajdonságok, ismérvváltozatok felsorolása Ismérvváltozatoknak megfelelő gyakoriságok felsorolása Összesen rovat (csak a csoportosító sor estében) A forrás megnevezése
Év
Orvosok száma (fő)
Lakosok száma (fő)
Egy orvosra jutó lakosok száma
1990
240
80 000
333,3
1999
360
100 000
277,8
Statisztikai táblák
Csoportosító statisztikai tábla
Kombinációs statisztikai tábla Egy felsőfokú intézmény nappali tagozatos hallgatónak jegyei statisztikából 1991/1992 II. félév:
Búzatermelés adatai 1991-ben:
Osztályzat
Körzet
Termés (ezer tonna)
Termésátlag (t/ha)
Dunántúl
2000
5,2
Alföld
3000
5,31
Észak
705
4,71
Összesen
5705
…
A
B
C
Összesen
kar hallgatóinak megoszlása 5
19
23
19
61
4
32
49
40
121
3
24
36
56
116
2
20
36
82
138
1
1
2
18
21
Összesen
96
146
215
457
5
Statisztikai táblák
Statisztikai táblák
A statisztikai táblák részei:
Dimenziószám: Azt mutatja, hogy a tábla egy statisztika adata egyidejűleg hány statisztikai sor tagja.
Oszlop (a táblázat egy oszlopa) Sor (a táblázat egy sora) Rovat (sor és oszlop találkozása) Fejrovat (a táblázat első sora, mely szövegesen tartalmazza az egyik ismérv változatait) Oszloprovat (a táblázat első oszlopa, mely szövegesen tartalmazza a másik szerinti ismérvváltozatokat) Összegrovat (a sorok és oszlopok összességét tartalmazza)
Táblakészítés szabályai:
Kérdőívszerkesztés
Adatszerzési módok
Teljeskörű felvétel
Részleges felvétel
Reprezentatív megfigyelések
Monográfia
Egyéb részleges adatfelvétel
Véletlenen alapuló
Cím (azonosítókkal!, idő, hely, stb.) Oldalrovatok (fejrovat és oszloprovat) megnevezése Egy rovat sem üres (--, --, ●(●); … , 0,0) Megjegyzés (ha valamely rovatában lévő adat eltérő mértékegységű) Forrásmegjelölés (!)
Nem véletlen
Alapos szakmai hozzáértés Tömör, egyértelmű, könnyen megválaszolható kérdések Főleg feleletválasztós (karikázós, x-elős és kevés kifejtendő választ igénylő) Ne legyen túl hosszú Ajánlott az anonim adatfelvétel Kompromisszum: csak a legfontosabb dolgokat kérdezzük Véglegesítés előtt: próbalekérdezés Ha nyereményhez kötjük, növelhető a válaszadási arány
(kontrolált)
Feladatok (stat. alapfogalmak)
Adatok pontossága
Perfekt Statisztika I. példatár: 57/4, 58/7, 59/9, 60/11, 60/13, 61/14, 61/15, 61/16, 63/20, 63/21, 64/23, 64/26 Mért adat
Abszolút hibakorlát
Relatív hibakorlát
Szignifikáns számjegyek: a pontosnak tekinthető számjegyek Például Mo. népessége (90-ben): 10.277 ezer ± 500 fő
: a legutolsó kiírt szignifikáns számjegy helyértéke
További gyakorló feladatok az általános statisztika I. (zöld) példatárból: 11/2, 12/3 (sokaság fajtája) 12/4, 13/5, 13/6,13/7, 14/8, 14/9, 14/10, 15/11 (sokaság és ismérvfajták) 15/13 (százalék és százalékpont)
6
Viszonyszámok Statisztikai elemzések viszonyszámokkal
Viszonyszámok
Viszonyszám fogalma Viszonyszámok fajtái Megoszlási és koordinációs viszonyszámok Dinamikus viszonyszámok Viszonyszámok közötti összefüggések Intenzitási viszonyszámok
Viszonyszámok fajtái
Viszonyszám: két, egymással kapcsolatban álló statisztikai adat hányadosa (V)
Csoportosító sorokból:
Összehasonlító sorokból:
, ahol A: a viszonyítás tárgya (viszonyítandó adat)
B: a viszonyítás alapja
Megoszlási viszonyszámok (Vm) Koordinációs viszonyszámok (Vk)
Dinamikus viszonyszámok (Vd: Vdl és Vdb) Feladat- és teljesítménymutató (Vf és Vt) Területi összehasonlító (Vö)
Leíró sorokból:
Intenzitási viszonyszámok (Vi)
Azonos adatokból (% v. együtthatós) – Különböző fajta adatokból (int.)
Viszonyszámok fajtái
Megoszlási viszonyszám: rész és egész egymáshoz viszonyított arányát fejezi ki Koordinációs viszonyszám: a sokaság két részadatát viszonyítja Dinamikus viszonyszám: idősor adataiból számított hányados
Viszonyszámok fajtái
Megoszlási viszonyszám:
Pl. 26 fiú és 32 lány jár a csoportba, összesen 58 hallgató (100%).
45 % a fiúk aránya
Intenzitási viszonyszám: különböző fajta, különböző mértékegységű- de egymással kapcsolatban lévősokaság adataiból számított viszonyszám
Összesen: 100% 55% a lányok arány
7
Viszonyszámok fajtái
Koordinációs viszonyszám:
Viszonyszámok fajtái
Koordinációs viszonyszámokból az eredeti adatok ismerete nélkül is számíthatók megoszlási viszonyszámok. A férfiak aránya:
Pl. mozilátogató nők: 1942 fő, mozilátogató férfiak: 1876 1000 mozilátogató ffi-ra 1035 mozilátogató nő jut A nők aránya: 1000 mozilátogató nőre 966 mozilátogató ffi jut
Dinamikus viszonyszámok
Dinamikus viszonyszámok Viszonyszámok közötti összefüggések:
Bázisviszonyszám:
Láncviszonyszám:
1. Az első (azaz nulladik) időszakra nem tudunk láncviszonyszámot számolni 2. Az állandó bázisul választott időszakban a bázisviszonyszám értéke 1, azaz 100% 3. Az állandó és a bázisul választott időszak után következő időszakban a bázis és a láncviszonyszám megegyezik 4. Láncból bázis: adott időszak bázisviszonyszáma kiszámolható az adott időszak és az azt megelőző időszakok láncviszonyszámainak szorzataként:
5. Bázisból lánc: adott időszak láncviszonyszáma kiszámítható az adott időszak és az azt megelőző időszak bázisviszonyszámának hányadosaként:
Megoldás
Feladat/1. Az alábbi táblázatban 2000-2005 közötti idegenforgalommal kapcsolatos adatok láthatók:
Év
Magyarországra érkező külföldiek
Külföldre utazó magyarok
ezer fő
ezer fő
2000
31 141
11 065
2001
30 679
11 167
2002
31 739
12 966
2003
31 412
14 283
2004
36 635
17 558
2005
38 555
18 622
Elemezze bázis- és láncviszonyszámokkal a Magyarországra érkező külföldiek és a külföldre utazó magyarok számának alakulását! Mutassa meg a viszonyszámok közötti összefüggéseket!
8
Megoldás
Viszonyszámok közötti összefüggések Magyarországra érkező külföldiek esetén:
Pl.:
Külföldre utazó magyarok esetén: Pl.:
Viszonyszámok fajtái Pl. bázisévben (tavaly) 100 autót szereltem össze, erre az évre 120-at terveztem, de csak 110 lett belőle
Viszonyszámok fajtái
Feladatmutató viszonyszám:
Teljesítménymutató viszonyszám:
Pl. Heves megye és BAZ megye népességének összehasonlítása:
Intenzitási viszonyszám Vi = A/B, megmutatja, hogy a vizsgált jelenség milyen intenzitással fordul elő valamely más jelenség környezetében.
Sűrűségmutatók:
Ellátottságot kifejező mutatók:
Színvonalmutatók:
Intenzitási viszonyszám
Pl: orvossal való ellátottság
Arányszámok: Pl: 100 főre jutó születések száma, halálozási arányszám
Egyenes intenzitási viszonyszám: A mutató színvonalának alakulása egybeesik az int. viszonyszám növekedésével. Pl: orvosok száma / lakosok száma (ezer fő)
Pl: népsűrűség, 1 négyzetkilométerre jutó lakosszám
Pl: 1 főre jutó átlagkereset, 1 dolgozóra jutó termelési érték, 1 főre jutó GDP
Területi összehasonlító viszonyszám:
Fordított intenzitási viszonyszám: Amikor a jelenség színvonala javul, akkor a fordított int. viszonyszám értéke csökken. Pl: lakosok száma (e fő) / orvosok száma
9
Intenzitási viszonyszám
Népességstatisztikai definíciók
Nyers intenzitási viszonyszám: (a teljes sokasághoz viszonyítunk) Pl: tejhozam / tehenek száma dolgozók / hallgatók
Tisztított intenzitási viszonyszám: (csak a jelenséggel szorosan kapcsolatban álló részhez viszonyítunk) Pl: tejhozam / tejelő tehenek száma oktatók / hallgatók
Definíciók
Lakónépesség: az adott területen lakóhellyel rendelkező, és másutt tartózkodási hellyel nem rendelkező személyek, valamint az ugyanezen területen tartózkodási hellyel rendelkező személyek együttes száma.
Definíciók
Természetes szaporodás (fogyás): az élveszületések és a halálozások különbözete.
Tényleges szaporodás (fogyás): a természetes szaporodás (fogyás) és a vándorlási (belföldi és nemzetközi) különbözet (+,–) összege. Gyermeknépesség eltartottsági rátája: a gyermeknépesség (0–14 éves) a 15–64 éves népesség százalékában. Idős népesség eltartottsági rátája: az idős népesség (65–X éves) a 15–64 éves népesség százalékában. Eltartott népesség rátája: a gyermeknépesség (0–14 éves) és az idős népesség (65–X éves) a 15–64 éves népesség százalékában.
Definíciók
Definíciók
Öregedési index: az idős népesség (65– X éves) a gyermeknépesség (0–14 éves) százalékában. Házasságkötés: a hivatalosan eljáró anyakönyvvezető előtt – két tanú jelenlétében – kötött házasság. Válás: a jogerőre emelkedett bírói ítélettel felbontott vagy érvénytelenített házasság. Jogerőre az a házasságot felbontó vagy érvénytelenítő ítélet emelkedett, amely ellen további jogorvoslatnak helye nincs.
Élveszületés: (az ENSZ ajánlása szerint) olyan magzat világrajövetele, aki az életnek valamilyen jelét (mint légzés vagy szívműködés, illetőleg köldökzsinórpulzáció) adja, tekintet nélkül arra, hogy mennyi ideig volt az anya méhében és mennyi ideig élt. Teljes termékenységi arányszám: azt fejezi ki, hogy az adott év kor szerinti születési gyakorisága mellett egy nő élete folyamán hány gyermeknek adna életet.
10
Definíciók
Definíciók
Halálozás: az élet minden jelének végleges elmúlása az élveszületés megtörténte után bármikor, azaz az életműködésnek a születés utáni megszűnése, a feléledés képessége nélkül.
Halálok: mindazon betegség, kóros állapot vagy sérülés, amely vagy eredményezte, vagy hozzájárult a halálhoz (halálozáshoz), valamint olyan baleset vagy erőszak körülménye, amely halálos sérülést okozott.
Várható átlagos élettartam: azt fejezi ki, hogy a különböző életkorúak az adott év halandósági viszonyai mellett még hány évi élettartamra számíthatnak. Csecsemőhalálozás: az élveszületést követően az egyéves kor betöltése előtt bekövetkezett halálozás. A halvaszülött és a születésének évfordulóján meghalt gyermek nem csecsemőhalott. Csecsemőhalálozási arányszám: ezer élveszülöttre jutó egy éven aluli meghalt.
Feladatok (viszonyszámok) Perfekt Statisztika I. példatár: 72/39, 73/41, 73/43, 76/48 66/28, 67/30, 68/32, 69/33, 75/47, 78/52, 78/53 , 79/54, 80/56
Grafikus ábrázolás
További gyakorló feladatok az általános statisztika I. (zöld) példatárból: 16/15, 17/18, 18/20, 19/23 43/81, 43/82, 41/77, 41/78, 42/79, 42/80 (viszonyszámok és összefüggéseik)
Grafikus ábrázolás
Grafikus ábrázolás
Az adatok megjelenítésének, szemléltetésének fontos eszköze. Információ megjelenítése képi formában. (megérteni és készíteni is fontos)
Alapelvei: Áttekinthetőség (csak azt mutassa, amire szolgál) Célorientáltság és homogenitás Egyszerűség Rekonstruálhatóság Optikailag semleges méretezés Cím, egyértelmű jelmagyarázatok, mértékegységek, forrásra való hivatkozás szüks.
Bizonyos elemzési eszközökhöz bizonyos ábrázolási módok tartoznak. Általában szoftverekkel (speciális rajzoló szoftverekkel) készülnek. A grafikus ábrák fajtái: 1. Koordináta-rendszeren alapuló ábrák 2. Nem koordináta-rendszeren alapuló ábrák
11
Grafikus ábrázolás Koordináta-rendszeren alapuló ábrák: Pontdiagram Bot-ábra Vonaldiagram Oszlopdiagram (hisztogram) Szalagdiagram Sugárdiagram
Grafikus ábrázolás
Bot ábra: gyakorisági soroknál, ha kevés és diszkrét a mennyiségi ismérv
Grafikus ábrázolás
Oszlopdiagram: összehasonlítás az oszlopok magasságával. (összehasonlítás)
Grafikus ábrázolás
Pontdiagram: két egymással összefüggésben lévő mennyiségi ismérv értékeinek ábrázolása koordinátarendszerben. (idő és menny. sorok)
Grafikus ábrázolás
Vonaldiagram: idősorok adatainak koordinátarendszerben való ábrázolása. Gyakorisági soroknál poligonnak nevezzük.
Grafikus ábrázolás Osztott oszlopdiagram: a csoportosító sorok ábrázolásának eszköze, az összehasonlítandó oszlopon belül a megoszlás területarányos ábrázolása.
12
Grafikus ábrázolás
Grafikus ábrázolás
Hisztogram: Mennyiségi sor esetén az oszlopok között nincs hézag
Grafikus ábrázolás
Szalagdiagram: Az oszlopdiagram az X és Y tengelyeinek felcserélésével kapjuk.
Grafikus ábrázolás
Korfa: A szalagdiagram speciális alkalmazása a korfa, amely egy összetett szalagdiagram.
Sugárdiagram: poláris koordináta rendszeren alapul, önmagában visszatérő ciklikus folyamatok esetében célszerű alkalmazni, vagy ha szerkezeti változásokat szeretnénk kiemelni. A magyar népesség korösszetételének változása
Grafikus ábrázolás
Grafikus ábrázolás
Néhány nem koordináta-rendszeren alapuló ábra: Kördiagram Kartogram Kartodiagram Ponttérkép Piktogram (figurális ábrázolás) Leveles ág Box & whiskers ábra (kvartilis eloszlás)
Kördiagram: megoszlás ábrázolása körcikkek segítségével. Mind szerkezetet, mind pedig abszolút nagyságot tud jellemezni (megoszlások, összehasonlítás)
13
Grafikus ábrázolás
Kartogram: területi sorok ábrázolása térképen, az egyes régiók eltérő színeivel érzékelteti a köztük lévő különbséget.
Grafikus ábrázolás
Ponttérkép: a területi sorok szemléltetésére használható, a pontok sűrűsége az adott területhez tartozó adat nagyságára utal.
Grafikus ábrázolás
Grafikus ábrázolás
Kartodiagram: területi sorok esetén alkalmazható, az egyes földrajzi egységek adatait a térképen elhelyezett diagrammal ábrázolja.
Grafikus ábrázolás
Piktogram: figurális ábrázolás, mely a jelenséget megtestesítő különböző nagyságú figurák alapján fejezi ki a nagyságrendi relációt.
Grafikus ábrázolás
Leveles ág: mennyiségi soroknál megadja a teljes csoportosítatlan sokaságot. Rangsorban való közléssel kiemeli az eloszlás alakját
Box & whiskers ábra: a kvartilis eloszlás (az adatok nevezetes osztópontjainak, jelen esetben negyedelő pontjainak a helyzetét) szemlélteti.
14
LEÍRÓ statisztika
Mennyiségi ismérv szerinti elemzés
A leíró statisztika: olyan módszerek és mutatószámok, amelyek segítségével akár egy nagyobb sokaságot, akár egy mintát viszonylag könnyen és jól lehet valamilyen mennyiségi ismérv szerint tömören, egy mutatószámmal jellemezni. A sokaság (vagy minta) tömör jellemzése alapvetően 3 szempont szerint történhet: 1. Középértékek: a sokaság/minta jellemző értékének és értékeinek meghatározása 2. Szóródás: adatok különbözőségének vizsgálata 3. Alakmutatók: a gyakorisági görbe alakjának a vizsgálata
Gyakorisági sorok
Gyakorisági sorok
A mennyiségi ismérv szerint csoportosító sorokat gyakorisági soroknak nevezzük. A gyakorisági sorok fajtái: Rangsor: ha kevés számú diszkrét mennyiségi ismérv szerint csoportosítjuk a sokaságot. (amikor az összes ismérvváltozat felsorolható a gyakoriságokkal.) Osztályközös gyakorisági sor: folytonos, illetve sok változattal rendelkező diszkrét ismérv szerinti csoportosításkor, a csoportokat osztályközökkel (intervallumokkal) adjuk meg.
Példa rangsorra: Egy 20 fős szemináriumi csoport érdemjegyei statisztikából Érdemjegy (x)
Hallgatók száma/fő (f)
5
3
x: átlagolandó érték
4
8
f: gyakoriság
3
6
2
2
1
1
Összesen
20
Gyakorisági sorok
Gyakorisági sorok
Példa osztályközös gyakorisági sorra:
Példa osztályközös gyakorisági sorra:
Egy Heves megyei település lakásállományának vizsgálata a lakások értéke szerint millió Ft-ban (1998-ban): Lakások értéke (millió Ft) (x)
Lakások száma (db) (f)
3,0 – 4, 5
12
4,5 – 6,0
20
6,0 – 7,5
30
7,5 – 10,0
27
10, 0 – 13,0
11
Összesen
100
Egy Heves megyei település lakásállományának vizsgálata a lakások értéke szerint millió Ft-ban (1998-ban): Osztályközepek (x)!
Lakások értéke (millió Ft) (x)
Lakások száma (db) (f)
3,75
3,0 – 4, 5
12
5,25
4,5 – 6,0
20
6,75
6,0 – 7,5
30
8,75
7,5 – 10,0
27
11,50
10, 0 – 13,0
11
Összesen
100
15
Gyakorisági sorok
1) Középértékek
Oszt. közép
Lakásár (m Ft)
(x)!
(x)
száma (db)
3,75
3,0 – 4,5
12
12
120
10,0
10,0
100,0
45,00
45,00
945,25
5,25
4,5 – 6,0
20
32
108
16,5
26,5
90,0
105,00
150,00
900,25
Lakások
f’
f”
g
g’
g”
(f%)
s (fx)
s’
s’’
z
z’
z”
(s%)
(f)
6,75
6,0 – 7,5
30
62
88
25,0
51,5
73,5
202,50
352,5
795,25
8,75
7,5 – 10,0
27
89
58
22,5
74,0
48,5
236,25
588,75
592,75
11,50
10,0 – 13,0
31
120
31
26,0
100,0
26,0
356,50
945,25
356,50
Összesen
120
-
-
100,0
-
-
945,25
-
-
100.0
100.0 100.0
Számított középértékek (átlagok) számtani átlag harmonikus átlag mértani átlag négyzetes átlag
Helyzeti középértékek: módusz medián kvantilisek
Átlagok
Középértékekkel szembeni követelmények
Súlyozatlan Súlyozott Számtani 1. közepes helyet foglaljon el az értékek között 2. tipikus érték legyen: álljon közel az előforduló értékek zöméhez 3. legyen pontosan definiálva 4. könnyen értelmezhető legyen 5. számítása egyszerűen elvégezhető legyen
Ugyanazon pozitív értékekből számított átlagok nagyságrendje
Harmonikus Mértani Négyzetes
Példa/1: (egyszerű/súlyozatlan átlagok – az értékek csak egyszer fordulnak elő (egyedi értékek) vagy ugyanannyiszor) Az átlagolandó értékek: 3, 4, 5, 8 – az értékek egyszer fordulnak elő (vagy: 3, 3, 4 ,4, 5, 5, 8, 8 – az értékek többször, de ugyanannyiszor fordulnak elő)
és
Feladat érzékeny a kiugróan alacsony értékekre
a) b) c)
és
érzékeny a kiugróan magas értékekre
d) e)
Számítsa ki a számtani, a harmonikus, a mértani és a négyzetes átlagot! Hasonlítsa össze a kapott eredményeket! Állapítsa meg ugyanazon pozitív számokból számolt átlagok sorrendjét! Amennyiben az átlagolandó értékek között szerepelne még egy kiugróan alacsony érték (pl. 1), akkor mely átlagok reagálnának rá érzékenyen? Mely átlagok értékét befolyásolja jobban, ha az átlagolandó értékek között még egy kiugróan magas érték (pl. 32) is található?
16
Példa/2: (súlyozott átlagok – az értékek többször fordulnak elő és nem ugyanannyiszor)
Megoldás Számtani átlag:
Mértani átlag:
Harmonikus átlag:
Négyzetes átlag:
Az átlagolandó értékek és a hozzájuk tartozó súlyok: ( ) adatok: 3, 4, 5, 8 ( ) gyakoriság: 4, 4, 1, 1 Feladat: a) Számítsa ki a számtani, a harmonikus, a mértani és a négyzetes átlagot!
A számtani átlag néhány tulajdonsága
Megoldás
1. Számtani átlag
Mértani átlag:
Harmonikus átlag:
Négyzetes átlag:
2.
Æ az átlagtól vett eltérések (előjeles hibák) összege nulla négyzetes minimum tulajdonság: minimum , ha A=
3. az átlagolandó értékek additív transzformációjával (ha minden átlagolandó értékhez hozzáadunk egy konstans értéket) az átlag is a transzformációnak megfelelően nő vagy csökken az átlagolandó értékek multiplikatív transzformációjával (ha minden átlagolandó értéket megszorzunk egy konstans elemmel) az átlag is a transzformációnak megfelelően változik
4.
Számtani átlag előnyei
Számtani átlag hátrányai
Számítása egyszerű, tömör, világos Minden adathalmazból kiszámítható, és csak egy van belőle Ugyanazon típusú számszerű jellemzők összehasonlítását teszi lehetővé sokaság vagy minta esetén Kiszámításához nem szükséges az egyedi értékek számszerű ismerete, elegendő azok összegét tudni.
Kiugróan magas, vagy kiugróan alacsony egyedi értékek (outlier-ek) esetén az átlag „torz” lehet, és nem jellemzi jól a sokaságot , ugyanis az adatok többségétől eltér Osztályközös gyakori sornál nem tudunk pontos átlagot számolni, az így kiszámított (osztályközepek felhasználásával) érték csak becslés/közelítés. Nyitott osztályközök esetén (amikor az osztályköz hosszúságát akkorának tekintjük, mint az alsó vagy a felső szomszédos osztályköz) az általunk meghatározott alsó vagy felső határnál kisebb vagy nagyobb értékeket figyelmen kívül hagyjuk.
17
Medián az az ismérvérték, amelyiknél az összes előforduló ismérvérték fele kisebb, fele nagyobb. (rangsorba rendezett adatok közül a középső elem) a) meghatározása egyedi adatokból a rangsorból az -edik érték (páros tagszám esetén, amikor a sorszám két érték közé esik, akkor az érintett 2 érték számtani átlaga)
Medián előnyei
b) becslése osztályközös gyakorisági sorból:
osztópont: , ahol : a medián osztályközének a gyakorisága,
Egyértelműen meghatározható, minden adathalmaznak létezik mediánja, és csak egy van belőle. A medián rangsorba rendezett minőségi ismérvekből is megállapítható A medián értéke független a szélső értékektől. Kiugróan magas vagy alacsony értékek esetén (amelyekre nem érzékeny) jobban jellemzi a sokaságot mint a számtani átlag.
: a medián osztályközét megelőző osztályköz kumulált gyakorisága
Módusz
Medián hátrányai
Rangsor (diszkrét ismérv) esetén: a leggyakrabban előforduló érték folytonos ismérv esetén: a gyakorisági görbe maximumához tartozó érték A módusz
Csak rangsorba rendezett értékekből állapítható meg Ha egy minta alapján akarunk következtetni a teljes sokaságra, akkor a számtani átlag matematikai-statisztikai szempontból alkalmasabb mutatószám.
Módusz becslése osztályközös gyakorisági sorból , ahol
: a móduszt tartalmazó osztályköz alsó határa
: a móduszt tartalmazó osztályköz hossza
Nem egyenlő osztályközök esetén a módusz becslése f* átszámított gyakoriságok alapján történik.
a kiugró, extrém értékekre érzéketlen nem mindig létezik (például, ha minden érték egyforma valószínűséggel fordul elő) Ha több különböző érték azonos gyakorisággal fordul elő, akkor több módusz is lehet.
Módusz előnyei és hátrányai Előnyök: Mennyiségi jellemzők esetén is használható Hasonlóan a mediánhoz, nem érzékeny a szélső, kiugró értékekre Hátrányok: Sok esetben nem alkalmas a sokaság jellemzésére, mert nem minden esetben létezik, és van hogy több is van belőle.
18
Példa/3 (egyedi értékek)
Megoldás Számtani átlag:
Egy bp.-i lakóparkban télen megkérdezték a 3 szobás lakások tulajdonosait, hogy mennyi volt az előző havi rezsiköltségük. Az alábbi adatokat kapták ezer Ft-ban: 75, 64, 69, 80, 76, 77, 86, 79, 65, 72, 73, 75, 75, 70 Feladat: Jellemezzük a 3 szobás lakástulajdonosok előző havi rezsiköltségét az adott esetben felhasználható középértékekkel! (átlag, módusz, medián)
Példa/4 (egyenlő osztályközök)
A lakástulajdonosok előző havi átlagos rezsiköltsége 74 ezer Ft.
Rangsor készítése: 64, 65, 69, 70, 72, 73, 75, 75, 75, 76, 77, 79, 80, 86 Medián:
Me=75 ezer Ft ÆA lakástulajdonosok felének 75 ezer Ft-nál kevesebb, a lakástulajdonosok másik felének pedig 75 ezer Ft-nál nagyobb volt az előző havi rezsiköltsége.
Módusz: Mo=75 ezer Ft
A legtöbb lakástulajdonos előző havi rezsije 75 ezer Ft.
Megoldás
Egy benzinkútnál a napi eladott mennyiség szerint a személygépkocsik megoszlása a következő volt:
Értékesített benzin mennyisége (liter)
Gépkocsik száma
Osztályközép
Kumulált gyakoriság
Értékesített benzin mennyisége (liter)
Gépkocsik száma
10 – 19
10
15
10
10 – 19
10
20 – 29
28
25
38
20 – 29
28
30 – 39
42
35
80
30 – 39
42
40 – 49
15
45
95
40 – 49
15
50 –59
5
55
100
50 – 59
5
Összesen
100
---
---
Összesen
100
Feladat: Számítsa ki és értelmezze az átlagot! Becsülje meg a mediánt és a móduszt, és írja le jelentésüket!
A gépkocsik átlagosan 32,7 litert tankoltak a benzinkútnál az adott napon.
Példa/5 (nem egyenlő osztályközök)
Megoldás Medián: sme=
32,7 liter
1999-ben az átlagkeresetek alakulása egy vállalatnál Keresetek (ezer Ft)
Létszám
40 – 50
12
50 – 60
20
60 – 80
34
A gépkocsik fele 32,86 liter benzinnél kevesebbet tankolt, a gépkocsik másik fele pedig ennél többet az adott napon.
80 – 100
32
100 – 150
14
150 – 200
3
Módusz: 3. osztályközben van
Összesen
115
és
a 3. osztályközben van 32,86 liter
33,41 liter
A legtöbb kocsi 33,41 liter benzin körüli mennyiséget tankolt az adott napon.
Feladat: Számítsa ki és értelmezze az átlagot! Becsülje meg a mediánt, a móduszt és a kvartiliseket és írja le jelentésüket!
19
Csak a MÓDUSZHOZ!
Megoldás Létszám (f)
Osztályközép (x)
Kumulált gyakoriság (f’)
f* (új oszt.köz= 20e Ft)
40 – 50
12
45
12
24
50 – 60 (Q1),(Mo)
20
55
32
40
60 – 80 (Me)
34
70
66
34
80 – 100 (Q3)
32
90
98
32
100 – 150
14
125
112
5,6
150 – 200
3
175
115
1,2
115
---
---
---
Keresetek (ezer Ft) (x)
Összesen
Megoldás Medián: sme=
(A Me a 3. osztályközben van.) 75 ezer Ft
A dolgozók fele 75 ezer Ft-nál kevesebbet keresett, a másik fele pedig ennél többet az adott évben.
Alsó kvartilis:
(A Q1 a 2. osztályközben van.) 58,375 ezer Ft
A vállalatnál a dolgozók átlagosan 75,1 ezer Ft-ot keresnek.
2) Szóródás
Megoldás Felső kvartilis: sq3=
A dolgozók negyede 58,4 ezer Ft-nál kevesebbet keresett, a másik fele pedig ennél többet az adott évben.
(A Q3 a 4. osztályközben van.)
Az értékek különbözőségét, változékonyságát nevezzük szóródásnak. Az értékek különbözősége egyrészt az értékek egymástól való különbözőségén, másrészt valamely középértéktől való eltérésében fejezhető ki.
A dolgozók negyede 92,65 ezer Ft-nál többet keresett, a három negyede pedig ennél kevesebbet az adott évben.
Módusz: (f* kell!)
(A Mo a 2. osztályközben van.)
A dolgozók legtöbbje 57,27 ezer Ft-ot keresett az adott évben.
Szóródási mérőszámok A legfontosabb szóródási mérőszámok: 1. Terjedelem, R (vagy IQR) 2. Átlagos eltérés, δ 3. Szórás, б (vagy s) 4. Relatív szórás, V 5. (Átlagos különbség, G)
Szóródási mérőszámok 1) Terjedelem: annak az intervallumnak a hossza, amelyen belül az ismérvértékek elhelyezkednek.
Interkvartilis terjedelem: annak az intervallumnak a hosszát fejez ki, amelyben az ismérvértékek középső 50%-át találjuk.
20
Szóródási mérőszámok 2) Átlagos eltérés: az átlagtól vett eltérések számtani átlaga. Azt mutatja, hogy az ismérvértékek átlagosan mennyivel térnek el a számtani átlagtól. Mértékegysége megegyezik az alapadatok mértékegységével.
Szóródási mérőszámok 3) Szórás: az átlagtól vett eltérések négyzetes átlaga Azt mutatja, hogy az ismérvértékek átlagosan mennyivel térnek el a számtani átlagtól. Mértékegysége megegyezik az alapadatok mértékegységével.
A szórás négyzetét varianciának hívjuk.
A szórás néhány tulajdonsága
A szórás akkor és csak akkor nulla, ha minden ismérvérték egyenlő. Az xi ismérvértékek additív transzformációja után a szórás nem változik. Az xi ismérvértékek multiplikatív transzformációja után a szórás a transzformációnak megfelelően változik.
Szóródási mérőszámok 4) Relatív szórás különböző alapadatok vagy ismérvértékek szóródásának összehasonlítására szolgál. Mértékegység nélküli szám, általában százalékos formában adják meg.
Empirikus eloszlások típusai
Szóródási mérőszámok 5) Átlagos különbség, G (Gini-féle mutató) az ismérvértékek egymástól mért abszolút eltéréseinek a számtani átlaga. (Leginkább a koncentráció vizsgálatánál alkalmazható.)
Egy móduszú eloszlás
Több módoszú eloszlás
Aszimmetrikus
Szimmetrikus
Mérsékelten
Bal oldali
Jobb oldali
Erősen
J alakú
Fordított J alakú
21
Szimmetrikus eloszlás
Aszimmetrikus eloszlások
Aszimmetrikus eloszlások
3) Alakmutatók arra szolgálnak, hogy tömör számszerű formában jellemezzék, hogy milyen tekintetben és milyen mértékben tér el az adott eloszlás a normális eloszlás gyakorisági görbéjéből. Mértékegység nélküli mutatók.
Aszimmetria mutatók A-mutató
F- mutató
Pearson-féle mutatószám:
(kvartiliseken alapul)
A abszolút értékének nincs korlátja, de ritkán vesz fel 1-nél nagyobb értéket.
Ha
-1≤ F ≤1
+, bal oldali aszimmetria - , jobb oldali aszimmetria 0 , szimmetrikus az eloszlás
22
Koncentráció
Koncentráció
Gazdasági életben: erőforrások tömörülése, összpontosulása
Statisztikailag: ismérv
egy sokaság mennyiségi szerinti vizsgálata
Koncentráció:
az értékösszeg jelentős része a sokaság kevés egységére összpontosul
Lorenz-görbe Egységoldalú négyzetben elhelyezett ábra, amely a kumulált relatív értékösszegeket értékeket a kumulált relatív gyakoriságok értékeinek függvényében ábrázolja.
A koncentráció a relatív gyakoriságok ( ) és a relatív értékösszegek ( ) összehasonlításával elemezhető. Ha az egyes osztályközökhöz tartozó és értékek azonosak, az a koncentráció hiányaként értelmezhető, eltérésük viszont a koncentrációt jelzi.
Lorenz-görbe
Koncentráció hiánya esetén a görbe egybeesik az átlóval. Minél távolabb esik a görbe az átlótól, annál nagyobb fokú a koncentráció.
Felhasználása: relatív koncentráció szemléltetése interpoláció több ismérv koncentrációjának egybevetése adott ismérv koncentrációjának időbeli vagy térbeli egybevetése
Koncentrációs együttható A Lorenz-görbe és az átló által bezárt területet koncentrációs területnek nevezzük. Ha koncentrációs területet a háromszög területéhez viszonyítjuk, akkor e hányados alapján következtetni tudunk a koncentráció mértékére. A koncentrációs terület arányát a koncentrációs együtthatóval mérjük. (ahol G: az átlagos különbség (Gini-féle mérőszám))
Koncentráció
Abszolút koncentráció: az értékösszeg kevés egységére összpontosul (pl.: energiaiparban, gépkocsigyártásban)
Relatív koncentráció: az értékösszeg relatív értelemben kevés egységnél összpontosul (pl.: személyi jövedelemben)
K értéke [0,1] intervallumban mozoghat, koncentráció hiány esetén K=0, és a K minél közelebb van 1-hez, annál erősebb a koncentráció.
23
Koncentráció ÉRTÉKÖSSZEG (s)
Idősorok elemzése átlagokkal SOKASÁG (n)
tőke, vagyon, termelés, forgalom, eredmény
gazdasági szervezetek
export, import
országok, termékek, gazdasági szervezetek
mezőgazdasági földterület, gazdasági szervezetek, eszközállomány, tulajdonosok állatállomány lakossági jövedelem, vagyon
Tapasztalati idősor:
időtényező:
megfigyelt érték:
lakosság, háztartások
Idősorok elemzése átlagokkal
Idősorok elemzése átlagokkal
Idősorelemzés egyszerű eszközei: dinamikus viszonyszámok (bázis-, és láncviszonyszámok): idősor adataiból számított hányadosok grafikus ábrázolás
Időegységre számított átlagok
Stock típusú idősor esetén: (számtani átlag)
átlagok
(tartam-idősor)
Idősorok elemzése átlagokkal Változások átlaga
Átlagos relatív változás
(állapot-idősor)
Feladatok (mennyiségi ismérv szerinti elemzés) Perfekt Statisztika I. példatár: 128/1, 128/2, 130/5, 131/8, 134/12, 134/13, 137/17, 138/19, 138/20, 139/23, 141/25, 145/32, 148/36,149/38 További gyakorló feladatok az általános statisztika I. (zöld) példatár:
Átlagos abszolút változás
Flow típusú idősor esetén: (kronologikus átlag)
24/38, 24/39 (egyedi értékekből – súlyozatlan) 25/42 (rangsorból – súlyozott) 26/45, 27/46, 29/51 (osztályközös gyakorisági sorok – egyenlő osztályköz esetén) 26/44, 27/47, 28/48, 28/49, 29/50, 29/52, 32/56 (nem egyenlő osztályközök) 35/65 (koncentráció)
24
Ismérvek közötti kapcsolatok
Sztochasztikus kapcsolatok (1)
Statisztikai ismérvek:
Minőségi ismérvek Mennyiségi ismérvek Időbeli ismérvek Területi ismérvek
Eddig a sokaságokat egy ismérv szerint elemeztük, most a sokaságokat egyszerre két – egymással valamilyen kapcsolatban álló – megkülönböztető ismérv szerinti csoportosításban, azaz kombinációs táblába rendezve vizsgáljuk. A vizsgálat célja pedig az, hogy van-e és ha van, akkor milyen erősségű/jellegű a kapcsolat a vizsgált két ismérv között.
Ismérvek közötti kapcsolatok a két ismérv (x és y) független egymástól, ha x ismérv szerinti hovatartozás nem ad semmiféle többletinformációt az y szerinti hovatartozásról. (ezekkel nem kell foglalkoznunk) a két ismérv között sztochasztikus összefüggés van, ha az egyik ismérvváltozathoz való tartozásból tendenciaszerűen, valószínűségi jelleggel következtethetünk a másik ismérv szerinti hovatartozásra. Æ Statisztika a két ismérv függvényszerű kapcsolatban áll egymással, ha a vizsgált egységek x szerinti hovatartozásának ismeretében teljesen egyértelműen megmondható azok y szerinti hovatartozása is. (ezt a matematika vizsgálja)
Ismérvek közötti kapcsolatok A két ismérv jellege szerint a következő sztochasztikus kapcsolatokat különböztethetjük meg: asszociációs kapcsolat: az egymással kapcsolatban álló ismérvek minőségi vagy területi ismérvek (pl.: nem (férfi,nő) – dohányzás) vegyes kapcsolat: az egyik vizsgált ismérv területi vagy minőségi ismérv, a másik mennyiségi (pl.: iskolai végzettség -1 főre jutó bruttó havi jövedelem) korrelációs kapcsolat: mindkét vizsgált ismérv mennyiségi ismérv (pl.: 1 főre jutó bruttó havi jövedelem-1 főre jutó élelmiszerfogyasztás) Æ egyszerre több ismérv között vizsgálható a sztochasztikus kapcsolat (II. félév anyaga) rangkorreláció: mindkét ismérv ordinális mérési szintű, vagyis sorrendi skálán mérhető.
Sztochasztikus kapcsolatok Különböző okozati jellege lehet az egyes ismérveknek: x ismérv: ok (magyarázó változó) y ismérv: okozat (eredményváltozó) (pl. jövedelemnagyság és húsfogyasztás) Vannak olyan esetek, amikor az ismérvek kölcsönösen hatnak egymásra, vagyis az okokozati viszony nem egyértelmű, az okság kölcsönös. (pl. ár és kereslet)
Ismérvek közötti kapcsolatok Az asszociáció és a vegyes kapcsolat esetén egyszerre csak két ismérv közötti kapcsolatot vizsgálhatjuk. Arra keressük a választ, hogy a két ismérv között: van-e kapcsolat? ha van kapcsolat, akkor az milyen erős? A korrelációs kapcsolat (mennyiségi ismérvek kapcsolatának a vizsgálata) több elemzési lehetőséget biztosít, hiszen itt azt is meg tudjuk vizsgálni, hogy az egyik ismérv milyen számszerű hatással van a másik (vagy több) ismérv alakulására.
25
Kontingencia tábla
Kontingencia tábla
X/Y
együttes gyakoriságok, tényleges gyakoriság a kontingencia tábla i sorában és j oszlopában peremgyakoriságok, az összesen rovat gyakoriságai Az x ismérvváltozattal rendelkező elemek száma peremgyakoriságok, az összesen rovat gyakoriságai az y ismérvváltozattal rendelkező elemek száma
n=
Asszociációs kapcsolat szorosságának mérése
a sokaság elemeinek a száma
Asszociációs kapcsolat szorosságának mérése
1) Alternatív ismérvek esetén: A Yule-mutató tulajdonságai:
2 x 2 kontingencia tábla:
X/Y x1 x2 Összesen
y1 f11 f21 f.1
y2 f12 f22 f.2
Összesen f1. f2. n
Teljes függetlenség, a kapcsolat teljes hiánya
Sztochasztikus kapcsolat
A két ismérv függetlensége esetén Függvényszerű kapcsolat Yule –együttható (Y):
Asszociációs kapcsolat szorosságának mérése
Asszociációs kapcsolat szorosságának mérése
2) Általánosan alkalmazható mutatószám (alternatív és két ismérvváltozatnál több változattal rendelkező ismérvek esetén egyaránt): (ahol s az egyik ismérv változatainak, míg t a másik ismérv változatainak a számát jelenti): Csuprov-mutató (T):
A Csuprov-mutató tulajdonságai: ha s=t esetén a Cramer-mutatót (C) használjuk:
,ahol
,ahol
Esetén Y és T mutatók is alkalmazhatók, a T mutató alakja ebben az esetben:
függetlenség esetén feltételezett gyakoriság a kontingencia tábla i sorában és j oszlopában
26
Feladatok (asszociáció) Perfekt Statisztika I. példatár: 240/2, 241/3, 248/1, 248/2, 249/3, 250/5, 250/6 , 252/10, 254/13 255/14, 255/15, 257/17, 257/18, (ezeknél csak a
Sztochasztikus kapcsolatok (2)
kapcsolat szorosságát jelző mutatókat kell kiszámolni)
További gyakorló feladatok az általános statisztika (zöld) példatárból: 60/127, 60/128, 60/130, 60/132
Vegyes kapcsolat Vegyes kapcsolat: az egyik vizsgált ismérv területi vagy minőségi ismérv (azaz nem mennyiségi ismérv), a másik mennyiségi ismérv (pl.: iskolai végzettség - 1 főre jutó bruttó havi jövedelem) A vegyes kapcsolat elemzése során azt vizsgáljuk, hogy a mennyiségi ismérv szóródását mennyiben befolyásolja a minőségi vagy a területi ismérv szerinti csoportosítás.
Heterogén sokaságok összetett, minőségileg különböző részekből állnak. Heterogén sokaság átlaga a részsokaságokra számított átlagok súlyozott átlaga. Jelölések: : j-edik csoport átlaga : j-edik csoport tagszáma : a csoportok száma : súlyarány : a teljes sokaságra számított átlag
Heterogén sokaságok Jelölések: = a sokaság tagszáma = a csoportok száma = a j-edik sokaság tagszáma = a j-edik csoport átlaga = a sokaság átlaga (főátlag) = a j-edik sokaság i-edik eleme
Csoportok
Elemszám
Csoportátlag
Csoportonkénti szórás
…
…
…
…
…
…
…
…
Összesen
27
Például: Egy vidéki nagyváros ingatlanügynökségén értékesítésre váró ingatlanok: Eladási ár (m Ft) 6,1 – 8,0
Panellakások száma
Nem panelből készült lakások száma
Összes lakás (db)
8
2
10
8,1 – 10,0
15
5
20
10,0 – 15,0
34
12
46
15,0 – 20,0
24
14
38
20,1 – 25,0
7
19
26
25,1 – 30,0
2
8
10
90
60
150
Összesen
Jelölések
A könnyebb áttekinthetőség kedvéért a számításokat táblázatba foglalhatjuk: Építőanyag
Ingatlanok száma
Csoportátlag (eladási ár m Ft)
Csoportonkénti szórás
Panel
90
13,872
4,72
Nem panel
60
18,358
5,93
Összesen
150
15,670
5,68
= teljes eltérés ( = belső eltérés ( = külső eltérés (
) ) )
= teljes szórásnégyzet = belső szórásnégyzet = külső szórásnégyzet
Szórásnégyzetek kiszámítása S: teljes eltérésnégyzetösszeg
Összefüggések
Teljes eltérés
Belső eltérés
Teljes szórásnégyzet
Belső szórásnégyzet
Külső eltérés
SB: belső eltérésnégyzetösszeg SK:
külső eltérésnégyzetösszeg
Teljes eltérés négyzet összeg
Belső eltérés négyzet összeg
Külső szórásnégyzet
Külső eltérés négyzet összeg
28
Feladat:
Megoldás
Egy főiskolán 4 szakon folyik bachelor képzés. Az alábbi táblázatban a hallgatók napi tanulásra fordított idejére vonatkozó adatok találhatók: Szak
Napi tanulásra fordított idő (óra)
Hallgatók %-os megoszlása
átlaga
szórása
Emberi erőforrás
1,5
1,2
24
Gazdálkodás menedzsment
2,25
0,8
26
Nemzetközi gazdálkodás
1,75
1,5
20
Pénzügy-számvitel
2,75
1,3
30
Számítsa ki a
mérőszámokat és értelmezze azokat!
A vegyes kapcsolat mutatószámai
A vegyes kapcsolat mutatóinak értelmezése
Szórásnégyzet-hányados: megmutatja, hogy a minőségi vagy területi ismérv szerinti csoportosítás hány %-ban befolyásolja a mennyiségi ismérv szóródását. Sztochasztikus kapcsolat
Szóráshányados: a szórásnégyzet-hányados négyzetgyöke, amely megmutatja, hogy milyen szoros a kapcsolat a nem mennyiségi (csoportosító) és a mennyiségi ismérv között.
Teljes függetlenség, a kapcsolat teljes hiánya
Függvényszerű, determinisztikus kapcsolat
Feladatok (vegyes kapcsolat) Perfekt Statisztika I. példatár: 264/1, 267/2, 273/1, 273/2, 274/3, 274/5, 275/6, 275/7, 279/14, 280/15, 280/16, 281/18 (a 18-as feladat b) részének a megoldása hátul
Indexszámítás
nem jó!)
További gyakorló feladatok az általános statisztika (zöld) példatárból: 63/137, 65/140, 66/141, 66/143, 67/144
29
Egyedi indexek (egy jószágcsoportra – egyfajta
Indexszámítás
termékre – vonatkozó indexek, tkp. viszonyszámok) ahol: p1: tárgyidőszak egységára p0: bázisidőszak egységára
Az indexszámok valamilyen szempontból összetartozó, de különnemű (különböző mértékegységű), közvetlenül nem összesíthető javak összességére vonatkozóan a mennyiségek (q), az árak (p) és az értékadatok (v) időbeli vagy térbeli összehasonlítására szolgálnak. Termékek azonos körére vonatkozó két időben (vagy térben Æ területi indexek) különböző aggregátum hányadosai.
Egyedi árindex:
Egyedi volumenindex:
ahol: q1: tárgyidőszaki mennyiség q0: bázisidőszak mennyiség
Egy jószág(csoport) értékét a mennyisége és az egységára határozza meg:
Egyedi értékindex:
ahol: v1: tárgyidőszaki termékérték v0: bázisidőszaki termékérték
Az érték változásának additív felbontása Az indexszámításban négyféle aggregátumot* használunk fel: 1. 2.
valós aggregátum
3.
fiktív aggregátum
fiktív aggregátum valós aggregátum
Együttes indexek aggregát formái (heterogén jószágcsoportra – többféle termékre – vonatkozó indexek) Értékindex:
Árindex: (a mennyiségek q adatok állandók)
Volumenindex: (az árak, p adatok állandók)
*Aggregálás: egy heterogén jószágcsoport értékben való összegzése. A tárgyidőszaki aggregát értéket (aggregátumot) folyóáras értékadatnak nevezzük.
Értékindex-számítás Az értékindex a termékek bizonyos körére nézve az érték változását mutatja meg. (pl. árbevétel változás)
Az értékindex átlagformái: ahol a súlyok a valós aggregátumok/értékadatok és az egyedi értékindexek az átlagolandó értékek:
Árindex-számítás Az árindex az árszínvonal változásának mértékét mutatja a vizsgált termékek összességére vonatkozóan. Súlyozott, alapformulájú árindexek: Laspeyres árindex (bázisidőszaki súlyozású) : Paashe árindex (tárgyidőszaki súlyozású) : Fisher árindex:
30
Az árindex átlagformái (árindexszámítás egyedi árindexekből) ahol a súlyok az értékadatok, az átlagolandó értékek az egyedi árindexek:
Volumenindex-számítás A volumenindex a termékek bizonyos körére vonatkozóan a mennyiségek változását méri. Súlyozott alapformájú volumenindex: Laspeyres volumenindex (bázisidőszaki súlyozású) : Paashe volumenindex (tárgyidőszaki súlyozású) : Fisher volumenindex:
A volumenindex átlagformái (volumenindexszámítás egyedi volumenindexekből) ahol a súlyok az értékadatok, az átlagolandó értékek az egyedi volumenindexek:
Feladat Egy bolt három termékének forgalmára vonatkozó adatok láthatók az alábbi táblázatban:
Termék
Értékesítés mennyisége
Egységár (Ft)
2004
2005
2004
2005
I. vaj
db
4500
5400
220
235
II. kenyér
kg
2875
3335
90
90
l
2125
1870
140
175
III. tej
Feladat:
Mértékegység
Egyedi indexek
Számítsa ki az egyedi volumen-, ár-, és értékindexeket! Hogyan változott a bolt összbevétele? Hogyan változott az értékesített termékek árszínvonala? Számítsa ki az együttes volumenváltozást!
31
Aggregátumok
Értékindex a megfelelő aggregátumok hányadosaként
az egyedi értékindexek súlyozott számtani átlagaként:
az egyedi értékindexek súlyozott harmonikus átlagaként:
Laspeyres-féle árindex
Paashe-féle árindex
Fisher-féle árindex
Volumenindexek
A Laspeyres-és a Paashe index súlyozatlan mértani átlaga
32
Az érték-, volumen- és árindex közötti összefüggés
Különbségfelbontás
Összefüggések:
Feladatok (indexszámítás)
Indexszámok gyakorlati alkalmazása
Perfekt Statisztika I. példatár: 207/1, 217/1, 218/3, 219/5, 219/6, 220/7, 220/8, 221/10, 222/12, 223/14, 224/17
Cserearány-mutatók: a gazdálkodó szervezetek által eladott termékek árindexét viszonyítjuk a vásárolt termékek árindexéhez.
További gyakorló feladatok az általános statisztika (zöld) példatárból: 88/201, 88/202, 89/203, 89/204, 89/205, 90/207, 91/210, 91/211, 92/213
Cserearány-index (terms of trade): az adott ország által exportált és az általa importált termékek árindexeinek a hányadosa. Egységnyi exportért, hányszor többet, vagy kevesebbet tudunk importálni a tárgyidőszakban a bázisidőszakhoz képest.
Indexszámok gyakorlati alkalmazása Árolló: azt mutatja meg, hogy valamilyen bevételt biztosító termékek bázisidőszakival azonos volumenéért a tárgyidőszakban mennyivel nagyobb vagy kisebb volumenű másféle termék kapható cserébe. Agrárolló: a mezőgazdasági termelőiár-indexet osztjuk a mezőgazdasági ráfordítások árindexével.
A fogyasztói árindex (CPI)
A fogyasztói árszínvonal változását méri.
Azt mutatja meg, hogy a lakosság által fogyasztási célra vásárolt termékek és szolgáltatások árai átlagosan hogyan változtak az egyik időszakról a másikra.
Az infláció mérőeszközeként is használják, de ez nem jelent fogalmi azonosítást.
33
A hazai fogyasztói árindex-számítás fő jellemzői (Consumer Price Index – CPI)
a teljes lakosságra vonatkozik a vásárolt fogyasztás (fogyasztói kosár) árváltozását tükrözi mintavételes módszerrel készül kínálati árakra épül (reprezentáns árak) havonta készül Laspeyres-típusú (bázisidőszaki súlyozású) a globális árindex mellett különböző termékcsoportokra és lakossági rétegekre is készül index a közzététel meghatározott szabályozás szerint történik
A fogyasztói árindex-számítás harmonizációja az EU országokban A harmonizálás célja: Az egyes országok fogyasztói árindexeinek összehasonlítása A térségekre, országcsoportokra számított globális indexhez olyan alapadatok biztosítása, melyek egységesen kezelhetők Az egyes országok fogyasztói árindexszámításának módszertani javítása A CPI gyakorlatias és alacsony költségigényű meghatározása
HICP:Harmonizált Fogyasztói Árindex
Indexsorok
Értékindexsorok:
Volumenindexsorok:
Az indexszámítás adatforrásai
Bázis
Állandó súlyozású
Változó súlyozású (B,T) Lánc
Állandó súlyozású
Változó súlyozású (B,T)
Bázis Lánc
Két alappillér: 1. 900 reprezentánsra vonatkozó ármegfigyelés 2. az indexszámításhoz tartozó súlyok meghatározása A 160 árucsoporthoz, az ún. alapsorokhoz tartozó súlyarányok a fogyasztás szerkezetét képviselik.
Indexsorok Kettőnél több időszakra vonatkozó indexek sorozata Indexsorok fajtái: a)
b)
c)
Tartalma szerint - értékindexsor - árindexsor - volumenindexsor Viszonyítás rendje szerint - bázisindexsor - láncindexsor Súlyozás módja szerint - állandó súlyozású indexsor - változó súlyozású indexsor (B,T)
Indexsorok Értékindexsorok:
Bázis-értékindexsor (0. év a bázis)
Lánc-értékindexsor
Árindexsorok:
Bázis
Állandó súlyozású
Változó súlyozású (B,T) Lánc
Állandó súlyozású
Változó súlyozású (B,T)
(100%)
Ez a k ép most nem jeleníthető meg.
34
Indexsorok Bázis volumenindexsorok:
Indexsorok Lánc volumenindexsorok:
Állandó súlyozású bázis-volumenindexsor: (bázis: a 0. időszak mennyisége, állandó súly: a 0. időszak ára)
Állandó súlyozású lánc-volumenindexsor: (állandó súly: a 0. időszak ára)
Változó súlyozású bázis-volumenindexsor (bázis: 0. év) - (B)
Változó súlyozású lánc-volumenindexsor - (B)
Változó súlyozású bázis-volumenindexsor (bázis: 0. év) - (T)
Változó súlyozású lánc-volumenindexsor - (T)
Indexsorok Bázis árindexsorok:
Indexsorok Lánc árindexindexsorok:
Állandó súlyozású bázis-árindexsor: (bázis: a 0. időszak mennyisége, állandó súly: a 0. időszak ára)
Állandó súlyozású lánc-árindexsor: (állandó súly: a 0. időszak ára)
Változó súlyozású bázis-árindexsor (bázis: 0. év) - (B)
Változó súlyozású lánc-árindexsor - (B)
Változó súlyozású bázis-árindexsor (bázis: 0. év) - (T)
Változó súlyozású lánc-árindexsor - (T)
Területi indexek
Forgalom-, vagy termelésadatok térbeli összehasonlításának eredményeként jönnek létre
Az eddig alkalmazott 0 (bázisidőszak) és 1 (tárgyidőszak) jelölések A-ra és B-re módosulnak (A és B a két terület jelölik)
Az értékindexet területi összehasonlítás esetén nem értelmezzük!
Az összehasonlításnak nincs egyértelmű sorrendje: felcserélhető a viszonyítandó és a viszonyítás alapjául szolgáló terület: A/B és B/A relációjú (területi) ár- és volumenindexeket is számolhatunk
Eltérő valutájú országok esetén az árindex számlálója és a nevezője nem azonos mértékegységű, ezért nem %-os értékként értelmezzük Æ A/B relációjú index esetén jelentése: B ország 1 valutaegysége A ország hány valutaegységével egyenértékű. B/A relációjú index esetén A ország egy valutaegysége B ország hány valutaegységével egyenértékű.
A területi összehasonlításnál (eltérő valuták) a különböző súlyozású indexek közötti eltérés jóval nagyobb lehet, mint az időbeli összehasonlításnál, ezért a Fisher-formula használata kötelező.
Területi volumenindex Legfontosabb alkalmazási területe a nemzetközi összehasonlítás Területi volumenindex azt fejezi ki, hogy az összehasonlítandó területen a termelés (értékesítés) mennyisége hányszorosa az összehasonlítás alapjául szolgáló terület termelésének (értékesítésének).
35
Feladatok (területi indexek,
Területi árindex Azonos valutájú országok esetén a területi árindex árszínvonal összehasonlítást jelent. Eltérő valutájú országok esetén a területi árindex a vásárlóerő paritást fejezi ki. Vásárlóerő paritás (PPP): azt mutatja meg, hogy egy adott ország egységnyi valutája a másik ország hány egységnyi valutájával egyenértékű a vizsgált termékek körében. A ország egységnyi valutája B ország ennyi egységnyi valutájával egyenértékű.
B ország egységnyi valutája A ország ennyi egységnyi valutájával egyenértékű.
indexsorok) Perfekt Statisztika I. példatár: 212/2, 217/2 (területi indexek) 230/28, 230/29 (indexsorok) További gyakorló feladatok az általános statisztika (zöld) példatárból: 101/239, 102/240 (területi indexek) 97/230, 98/231, 98/232, 99/234 (indexsorok)
Köszönöm a figyelmet!
36