Statisztika
Statisztikai alapfogalmak
Sportszervező BSc képzés NBG GI866G4 2010-2011-es tanév II. félév
Oktató: Dr. Csáfor Hajnalka főiskolai docens Vállalkozás-gazdaságtan Tsz. E-mail:
[email protected]
Statisztikai alapfogalmak
Statisztika fogalma Sokaság és ismérv Statisztikai adat és mutatószám Statisztikai sorok Statisztikai táblák Mérési szintek Adatfelvétel, adatszerzési módok Kérdőívszerkesztés Adatok pontossága
Statisztika fogalma
Egyidős az állammal… Mo-on a XVIII.sz. az „első összeírás” XIX.sz. a statisztika komoly fejlődésnek indul: kialakul az intézményrendszer intézményrendszer, központi adatszolgáltatás (Fényes Elek, Kőrösi József) Központi Statisztikai Hivatal (KSH, 1867) 1993-as XLVI-os törvény a statisztikáról 223/2009/EK rendelet az európai statisztikáról Regionális adatszolgáltatás prioritása (NUTS-1. ország, NUTS-2: régió, NUTS-3: megye)
Statisztika fogalma Tömegesen előforduló jelenségek egyedeire vonatkozó (elméleti és gyakorlati) tevékenység:
adatgyűjtés adatfeldolgozás adatok elemzése
a vizsgált jelenség számszerű, tömör jellemzése. Pl. népszámlálás, földtulajdon-összeírás (gyak.), vizsgálati módszerek kiválasztása (elm.)
Statisztikai sokaság és ismérv
Statisztikai sokaság: A megfigyelés tárgyát képező egyedek összessége. (élőlény, tárgy, intézmény, stb.)
Sokaság fajtái: diszkrét – folytonos (elkülönült egységek – önkényes elkülönítés)
álló – mozgó
(időpont – időtartam)
1
Statisztikai sokaság és ismérv
Statisztikai ismérvek: Olyan vizsgálati szempontok, amelyek alapján l já a sokaság k á egységei é i jjellemezhetők ll h ők és egymást nem fedő részekre bontható. Egy adott ismérv szerinti lehetséges tulajdonságokat az ismérv változatainak nevezzük.
Feladat/1. Sokaság
Ismérvek fajtái: 1) Időbeli ismérvek 2) Területi ismérvek 3) Mennyiségi ismérvek 4) Minőségi ismérvek
Tárgyi ismérvek
- Alternatív ismérvek - Közös ismérvek - Megkülönböztető ismérvek
Feladat/2. Ismérv
Ismérvváltozat
Ismérvfajta/ Mérési skála
Születési idő
1976
Időbeli/ intervallum
Lakóhely
Budapest
Területi/ nominális
Nem
Nő
Életkor
29
Minőségi/ nominális Mennyiségi/ arány
Egy konkrét egység
A magyar Kiss Réka népesség 2007. január elsején
Statisztikai sokaság és ismérv
Adottak az alábbi sokaságok: Magyarország népessége 2006. jan.1-jén 10 076 581 fő. A budapesti férfiak sörfogyasztása a 2006-os VB idején. BCE oktatói 2006. 2006 szept. szept 4 4-én. én Jótékonysági koncertek 2006-ban a Zeneakadémián. Feladat: Állapítsa meg a sokaságok típusát és egységeit! Az egyes sokaságokra vonatkozóan soroljon fel közös és megkülönböztető ismérveket, majd nevezze meg ezek típusát is!
Feladat/3.
Statisztikai adat és mutatószám
Döntse el az alábbi ismérvekről, hogy mennyiségi vagy minőségi ismérvek-e!
Nem (férfi, nő)
Életkor Él k
Magasság
Testsúly
Családi állapot
Iskolai
végzettség
Foglalkozás
Bruttó
havi fizetés
Statisztikai adat: Az egyedekről szerezhető információ. fogalmi jegy időbeli azonosító térbeli azonosító számérték mértékegység. (mérés vagy számlálás)
Statisztikai mutatószám: Valamilyen statisztikai módszerrel a rendelkezésre álló adatokból számított származtatott statisztikai mérőszám. Például:
(Havi) Átlagbér Magyarországon 2008-ban bruttó 194.000
Ft/fő/hó
2
Statisztikai sorok A sokaság egy ismérv szerinti tömör jellemzése. Sorkészítés célja szerint: Csoportosító sor Összehasonlító sor Leíró sor
Statisztikai sorok
Valódi statisztikai sorok Nem valódi statisztikai sor
Ismérvfajtáknak megfelelően: Időbeli (tartam-állapot), területi, minőségi, mennyiségi + leíró sorok Sorok készítése:
ismérvváltozatok
Összehasonlító statisztikai sor: Összehasonlító adatok d t k statisztikai t ti tik i sorba rendezve, összehasonlítási céllal, adataik nem összegezhetők. (idősor, területi)
Ismérvváltozat C1 C2 . . Ci . Ck
Számérték/
1990 1999
C1 C2 . . Ci . Ck
f1 f2 . . fi . fk
Összesen:
N
Egyszerű tábla (összehasonlító és/vagy leíró sorok) Nincs csoportosító sora, egy adata, egy statisztikai sor tagja.
Csoportosító tábla (csoportosító és/vagy összehasonlító vagy leíró sorok) Egyirányú csoportosítást tartalmaz, egy adata egy statisztikai sor tagja.
Kombinációs tábla (csoportosító sorok) Csak csoportosító sorokat tartalmaz, egy adata egyidejűleg több statisztikai sor tagja.
mértékegység adat adat . . adat . adat
Statisztikai táblák
Egy gy városban az orvosellátottság g alakulása: Orvosok száma (fő)
Egységek száma
Statisztikai sorok összefüggő rendszere.
Egyszerű statisztikai tábla
Év
Ismérvváltozatok
Statisztikai táblák
Statisztikai táblák
(időbeli, területi, minőségi, mennyiségi)
számszerű értékek
Statisztikai sorok
Csoportosító statisztikai sor: A sokaság belső összefüggéseit fejezi ki, csoportosítás céljából készül, adatai összegezhetők.
Csoportosító statisztikai tábla Búzatermelés adatai 1991-ben:
Lakosok száma (fő)
Egy orvosra jutó lakosok száma
Körzet
Termés (ezer tonna)
Termésátlag (t/ha)
240
80 000
333,3
Dunántúl
2000
5,2
360
100 000
277,8
Alföld
3000
5,31
Észak
705
4,71
Összesen
5705
…
3
Statisztikai táblák
Statisztikai táblák
Kombinációs statisztikai tábla Egy felsőfokú intézmény nappali tagozatos hallgatónak jegyei statisztikából 1991/1992 II. félév:
Osztályzat
A
B
C
Összesen
kar hallgatóinak megoszlása 5
19
23
19
61
4
32
49
40
121
3
24
36
56
116
2
20
36
82
138
1
1
2
18
21
Összesen
96
146
215
457
Dimenziószám: Azt mutatja, hogy a tábla egy statisztika adata egyidejűleg hány statisztikai sor tagja. Táblakészítés szabályai: Cím (azonosítókkal!, idő, hely, stb) Oldalrovatok, fejrovat Egy rovat sem üres (--, ●(●). 0,0) Forrásmegjelölés
Mérési szintek
Mérési szintek
Csak a mennyiségi ismérvek adatai számadatok, de bizonyos szabályok mellett minden ismérv lehetséges változatai számértékké alakíthatók alakíthatók.
4 féle mérési szintet (skálát) különböztetünk meg:
Névleges/nominális Né l / i áli mérési é é i szint i Sorrendi/ordinális mérési szint Különbségi/intervallum mérési szint Arányskálán történő mérés
Mérés: számok meghatározott szabályok szerinti hozzárendelése jelenségekhez (dolgok, tárgyak, események), illetve azok bizonyos tulajdonságaihoz.
Mérési szintek
Mérési szintek
Névleges/nominális mérési szint: Számok közvetlen hozzárendelését jelenti az egységekhez. Ezek ún. kódszámok, amelyek csak a sokaság egyedeinek azonosítását szolgálják. Közük semmilyen reláció nem áll fenn, és velük számtani művelet nem végezhető. Pl: rendszám, irányítószám, megyék száma
Sorrendi/ordinális mérési szint: A sokaság egyedeihez – bizonyos közös tulajdonság alapján – rendelt skálaérték sorrendisége írja le azok viszonyát. Az egységhez rendelt számérték sorrendje pontosan tükrözi az adott egység valamilyen szempontból vett sorrendjét. A számértékek magukban nem hordoznak információt (különbségeik nem értelmezhetők), csak azoknak a rendje. Pl: hallgatók osztályzatai, áruk minőség szerinti osztályozása
4
Mérési szintek
Mérési szintek
Különbségi/intervallum mérési szint: A skálaértékek különbségei is információt g egyes gy egyedeiről. gy hordoznak a sokaság A skálán az értékek aránya és összege nem értelmezhető.
Pl: a +10 és a +20 C fokok közötti különbség ugyanannyi, mint a -5 és a +5 C fokok közötti különbség.
Pl: életkor, termelési érték, jövedelem nagysága (amelyeket mind 0 értékről kiindulva mérik)
Kérdőívszerkesztés
Adatszerzési módok
Teljeskörű felvétel
Részleges felvétel
Monográfia
Egyéb részleges adatfelvétel
Reprezentatív megfigyelések
Véletlenen alapuló
Arányskálán történő mérés: A legtöbb információt nyújtó mérés. A kezdőpont egyértelműen rögzített, ennek köszönhetően két skálaérték egymáshoz viszonyított aránya is meghatározhatóvá válik. Az értékek különbsége önmagában semmit sem mond, csak arányskálán értelmezhetők.
Nem véletlen
Alapos szakmai hozzáértés Tömör, egyértelmű, könnyen megválaszolható kérdések Főleg feleletválasztós (karikázós, x-elős és kevés kifejtendő j választ igénylő) g y ) Ne legyen túl hosszú Ajánlott az anonim adatfelvétel Kompromisszum: csak a legfontosabb dolgokat kérdezzük Véglegesítés előtt: próbalekérdezés Ha nyereményhez kötjük, növelhető a válaszadási arány
(kontrolált)
Adatok pontossága
ˆ A Mért adat d
± aˆ
αˆ
=
aˆ ˆ A
Abszolút b l hibakorlát hib k l Relatív l hibakorlát hib k l
Szignifikáns számjegyek: a pontosnak tekinthető számjegyek aˆ ≤
10 k , ahol 2
Statisztikai elemzések viszonyszámokkal á
Például Mo. népessége (90-ben): 10.277 ezer ± 500 fő
10 k : a legutolsó kiírt szignifikáns számjegy helyértéke
5
Viszonyszámok
Viszonyszám fogalma Viszonyszámok fajtái Megoszlási és koordinációs viszonyszámok Dinamikus viszonyszámok Viszonyszámok közötti összefüggések Intenzitási viszonyszámok Viszonyszámok grafikus ábrázolása
Viszonyszámok Viszonyszám: két, egymással kapcsolatban álló statisztikai adat hányadosa
V=
A , ahol A: a viszonyítás tárgya B (viszonyítandó adat) B: a viszonyítás alapja
Azonos adatokból (%) – Különböző fajta adatokból (int.)
Viszonyszámok fajtái
Csoportosító sorokból:
Összehasonlító sorokból:
Megoszlási viszonyszámok (Vm) Koordinációs viszonyszámok (Vk)
Intenzitási viszonyszámok (Vi)
Viszonyszámok fajtái
Megoszlási viszonyszám: Vm =
Dinamikus viszonyszámok (Vd: Vdl és Vdb) Feladat- és teljesítménymutató (Vf és Vt) Területi összehasonlító (Vö)
Leíró sorokból:
Viszonyszámok fajtái
A (a sokaság egy részadata) B (a sokaság egészére vonatkozó adat)
Koordinációs viszonyszám: A (viszonyított részadat) Vk = B (a viszonyítás alapjául szolg. részadat)
Megoszlási viszonyszám: rész és egész egymáshoz viszonyított arányát fejezi ki Koordinációs viszonyszám: a sokaság két részadatát viszonyítja Dinamikus viszonyszám: idősor adataiból számított hányados A (a tárgyidőszak adata) V= B (a bázis időszak adata) Intenzitási viszonyszám: különböző fajta, különböző mértékegységű- de egymással kapcsolatban lévősokaság adataiból számított viszonyszám
Dinamikus viszonyszámok yt yb yi
Láncviszonyszám: Vdl / l = y i −1
Bázisviszonyszám: Vdb / b =
Összefüggések: bi = li bi −1
k
l 2 ⋅ l3 ... ⋅ l k = bk → ∏ li = bi i =2
6
Megoldás
Feladat/1. Az alábbi táblázatban 2000-2005 közötti idegenforgalommal kapcsolatos adatok láthatók:
Év
Magyarországra érkező külföldiek
Külföldre utazó magyarok
ezer fő
ezer fő
2000
31 141
11 065
2001
30 679
11 167
2002
31 739
12 966
2003
31 412
14 283
2004
36 635
17 558
2005
38 555
18 622
Elemezze bázis- és lá láncviszonyszámokkal i á kk l a Magyarországra érkező külföldiek és a külföldre utazó magyarok számának alakulását!
Megoldás
Viszonyszámok fajtái
Feladatmutató viszonyszám:
Vf =
Teljesítménymutató viszonyszám:
Vt =
Viszonyszámok fajtái
Területi összehasonlító viszonyszám: Vö =
Viszonyítandó terület adata Viszonyítás alapjául szolg. terület adata
Tárgyid. tervezett adata Bá i id adata Bázisid. d
Tárgyid. tényleges adata Tárgyid. tervezett teljesítménye
Intenzitási viszonyszám Vi = A/B
Fajlagos mérőszámok
Sűrűséget ellátottságot kifejező Sűrűséget,
Átlagos értéket kifejező
Arányszámok
Gazdálkodás hatékonyságát jelző mutatók
Pl: 100 km-re jutó üzemanyag Pl: orvossal való ellátottság, népsűrűség Pl: 1 főre jutó átlagkereset Pl: 100 főre jutó születések száma Pl: 1 dolgozóra jutó termelési érték, 1 főre jutó GDP
7
Intenzitási viszonyszám
Egyenes intenzitási viszonyszám:
Intenzitási viszonyszám
A mutató színvonalának alakulása egybeesik az int. y növekedésével. viszonyszám Pl: orvosok száma / lakosok száma (ezer fő)
Fordított intenzitási viszonyszám:
Pl: tejhozam / tehenek száma dolgozók / hallgatók
Amikor a jelenség színvonala javul, akkor a fordított int. viszonyszám értéke csökken. Pl: lakosok száma (e fő) / orvosok száma
Definíciók
Lakónépesség: az adott területen lakóhellyel rendelkező, és másutt tartózkodási hellyel nem rendelkező személyek valamint az ugyanezen személyek, területen tartózkodási hellyel rendelkező személyek együttes száma. Természetes szaporodás (fogyás): az élveszületések és a halálozások különbözete.
Nyers intenzitási viszonyszám:
Tisztított intenzitási viszonyszám: Pl: tejhozam / tejelő tehenek száma oktatók / hallgatók
Definíciók
Tényleges szaporodás (fogyás): a természetes szaporodás (fogyás) és a vándorlási (belföldi és nemzetközi) különbözet (+,–) összege. Gyermeknépesség eltartottsági rátája: a gyermeknépesség (0–14 éves) a 15–64 éves népesség százalékában. Idős népesség eltartottsági rátája: az idős népesség (65–X éves) a 15–64 éves népesség százalékában. Eltartott népesség rátája: a gyermeknépesség (0–14 éves) és az idős népesség (65–X éves) a 15–64 éves népesség százalékában.
Definíciók
Definíciók
Öregedési index: az idős népesség (65– X éves) a gyermeknépesség (0–14 éves) százalékában. Házasságkötés: a hivatalosan eljáró anyakönyvvezető előtt – két tanú jelenlétében – kötött házasság. Válás: a jogerőre emelkedett bírói ítélettel felbontott vagy érvénytelenített házasság. Jogerőre az a házasságot felbontó vagy érvénytelenítő ítélet emelkedett, amely ellen további jogorvoslatnak helye nincs.
Élveszületés: (az ENSZ ajánlása szerint) olyan magzat világrajövetele, aki az életnek valamilyen jelét (mint légzés vagy szívműködés illetőleg köldökzsinórszívműködés, köldökzsinór pulzáció) adja, tekintet nélkül arra, hogy mennyi ideig volt az anya méhében és mennyi ideig élt. Teljes termékenységi arányszám: azt fejezi ki, hogy az adott év kor szerinti születési gyakorisága mellett egy nő élete folyamán hány gyermeknek adna életet.
8
Definíciók
Definíciók
Halálozás: az élet minden jelének végleges elmúlása az élveszületés megtörténte után bármikor, azaz az életműködésnek a születés utáni megszűnése, a feléledés képessége nélkül. Csecsemőhalálozás: az élveszületést követően az egyéves kor betöltése előtt bekövetkezett halálozás. A halvaszülött és a születésének évfordulóján meghalt gyermek nem csecsemőhalott.
Várható átlagos élettartam: azt fejezi ki, hogy a különböző életkorúak az adott év halandósági viszonyai mellett még hány évi élettartamra számíthatnak.
Csecsemőhalálozási arányszám: ezer élveszülöttre jutó egy éven aluli meghalt.
Halálok: mindazon betegség, kóros állapot vagy sérülés, amely vagy eredményezte, vagy hozzájárult a halálhoz (halálozáshoz), valamint olyan baleset vagy erőszak körülménye, amely halálos sérülést okozott.
Grafikus ábrázolás
Grafikus ábrázolás
Grafikus ábrázolás
Kördiagram: megoszlás ábrázolása körcikkek segítségével. (megoszlások, összehasonlítás)
Az adatok megjelenítésének, szemléltetésének fontos eszköze. Információ megjelenítése képi formában. ((megérteni g és készíteni is fontos)) Alapvetően arányokat érzékeltet. Cím, egyértelmű jelmagyarázatok, mértékegységek, forrásra való hivatkozás szüks. Bizonyos elemzési eszközökhöz bizonyos ábrázolási módok tartoznak. Általában szoftverekkel (speciális rajzoló szoftverekkel) készülnek.
Grafikus ábrázolás
Oszlopdiagram: összehasonlítás az oszlopok magasságával. (összehasonlítás)
9
Grafikus ábrázolás
Osztott oszlopdiagram: a csoportosító sorok ábrázolásának eszköze, az összehasonlítandó oszlopon belül a megoszlás területarányos ábrázolása.
Grafikus ábrázolás
Pontdiagram: két egymással összefüggésben lévő mennyiségi ismérv értékeinek ábrázolása koordinátarendszerben.
Grafikus ábrázolás
Kartodiagram: területi sorok esetén alkalmazható, lk l h tó az egyes földrajzi egységek adatait a térképen elhelyezett diagrammal ábrázolja.
Grafikus ábrázolás
Vonaldiagram: idősorok adatainak koordinátarendszerben való ábrázolása.
Grafikus ábrázolás
Kartogram: területi sorok ábrázolása térképen, az egyes régiók eltérő színeivel érzékelteti a köztük lévő különbséget.
Grafikus ábrázolás
Ponttérkép: a területi sorok szemléltetésére h használható, álh tó a pontok sűrűsége az adott területhez tartozó adat nagyságára utal.
10
Grafikus ábrázolás
Piktogram: figurális ábrázolás, mely a jelenséget megtestesítő különböző nagyságú figurák alapján fejezi ki a nagyságrendi relációt.
Mennyiségi ismérv szerinti elemzés
Középértékekkel szembeni követelmények x min < K < x max
Számított
és helyzeti középértékek S Szóródás, ó ódás, sszóródási ó ódás mérőszámok é ős á o
1. közepes helyet foglaljon el az értékek között 2.
tipikus érték értékek zöméhez
legyen:
álljon
közel
az
előforduló
3. legyen pontosan definiálva 4. könnyen értelmezhető legyen 5. számítása egyszerűen elvégezhető legyen
Középértékek
Átlagok Súlyozatlan Súlyozott Számtani
Számított középértékek (átlagok) számtani átlag harmonikus átlag mértani átlag négyzetes átlag
Helyzeti középértékek: módusz medián
Harmonikus Mértani Négyzetes
x= x=
∑x
i
x=
n n
x =
1
∑x
i
x = n ∏ xi x=
∑x n
i
i
n
∑ ∑
fi fi xi
x = n ∏ xi
2 i
∑fx
x=
∑fx ∑f i
fi 2
i
i
11
Ugyanazon pozitív értékekből számított átlagok nagyságrendje
1. feladat Az átlagolandó értékek: 3, 4, 5, 8.
x min ≤ x h ≤ x g ≤ x ≤ x q ≤ x max x
és h
x
xg
és
érzékeny a kiugróan alacsony értékekre
xq
érzékeny a kiugróan magas értékekre
Megoldás
2. feladat
3+ 4+5+8 =5 4
Harmonikus átlag:
xh =
4 1 1 1 1 + + + 3 4 5 8
x g = 4 3 ⋅ 4 ⋅ 5 ⋅ 8 = 4.681 Négyzetes átlag:
= 4.404
Számtani átlag
4 ⋅ 3 + 4 ⋅ 4 + 1⋅ 5 + 1⋅ 8 = 4.1 10
Feladat: a) Számítsa ki a számtani, a harmonikus, a mértani és a négyzetes átlagot! b) Hasonlítsa össze a kapott eredményeket az előző feladat a) részében kapott eredményekkel!
32 + 42 + 52 + 82 114 xq = = = 28,5 = 5.339 4 4
Megoldás
x=
Az átlagolandó értékek és a hozzájuk tartozó súlyok: ( xi ) adatok: 3, 4, 5, 8 ( f i ) gyakoriság: 4, 4, 1, 1
Mértani átlag:
Számtani átlag:
x=
Feladat a)) Számítsa S á í ki a számtani, á i ah harmonikus, ik a mértani é ié és a négyzetes átlagot! b) Hasonlítsa össze a kapott eredményeket! c) Állapítsa meg ugyanazon pozitív számokból számolt átlagok sorrendjét!
Medián Mértani átlag:
x g = 10 34 ⋅ 4 4 ⋅ 51 ⋅ 81 = 3.907
az az ismérvérték, amelyiknél az összes előforduló ismérvérték fele kisebb, fele nagyobb. a) egyedi adatokból a rangsorból g az n + 1 -edik érték 2
b) osztályközös gyakorisági sorból: Harmonikus átlag:
Négyzetes átlag:
2 2 2 2 10 10 xh = = = 3.762 x = 4 ⋅ 3 + 4 ⋅ 4 + 1⋅ 5 + 1⋅ 8 = 4.347 4 4 1 1 2.658 q 10 + + + 3 4 5 8
osztópont:
n 2
Me = x me 0
f me
n − f me' −1 2 + ⋅ hme , ahol f me
: a medián osztályköznek a gyakorisága,
12
Módusz becslése osztályközös gyakorisági sorból
Módusz
diszkrét ismérv esetén: a leggyakrabban előforduló érték
folytonos ismérv esetén: a gyakorisági görbe maximumához tartozó érték
Mo = xmo0 +
k1 ⋅ hmo k1 + k 2
, ahol
x mo 0: a móduszt tartalmazó osztályköz alsó határa k1 = f mo − f mo −1
k 2 = f mo − f mo +1 hmo : a móduszt tartalmazó osztályköz hossza Nem egyenlő osztályközök esetén a módusz becslése f* átszámított gyakoriságok alapján történik.
3. feladat
Megjegyzések A módusz a kiugró, extrém értékekre érzéketlen nem mindig létezik (például, ha minden érték egyforma valószínűséggel fordul elő)
Egy bp.-i lakóparkban télen megkérdezték a 3 szobás lakások tulajdonosait, hogy mennyi volt az előző havi rezsiköltségük. Az alábbi adatokat kapták ezer Ft.-ban: 75, 64, 69, 80, 76, 77, 86, 79, 65, 72, 73, 75, 75, 70
Feladat: Jellemezzük a 3 szobás lakástulajdonosok előző havi rezsiköltségét az adott esetben felhasználható középértékekkel!
Megoldás
4. feladat Egy benzinkútnál a napi eladott mennyiség szerint a személygépkocsik megoszlása a következő volt:
Számtani átlag: X=
75 + ... + 70 = 74 14
Értékesített benzin mennyisége (liter)
A lakástulajdonosok előző havi átlagos rezsiköltsége 74 ezer Ft. n + 1 15 = = 7,5 Medián: 2
2
Rangsor készítése: 64, 65, 69, 70, 72, 73, 75, 75, 75, 76, 77, 79, 80, 86 Me=75 ezer Ft ÆA lakástulajdonosok felének 75 ezer Ft-nál kevesebb, a lakástulajdonosok másik felének pedig 75 ezer Ft-nál nagyobb volt az előző havi rezsiköltsége.
Gépkocsik száma
10 – 19
10
20 – 29
28
30 – 39
42
40 – 49
15
50 – 59
5
Összesen
100
Feladat: Számítsa ki és értelmezze az átlagot! Becsülje meg a mediánt és a móduszt, és írja le jelentésüket!
13
Megoldás
Megoldás
Értékesített benzin mennyisége (liter)
Gépkocsik száma
Osztályközép
Kumulált gyakoriság
10 – 19
10
15
10
20 – 29
28
25
38
30 – 39
42
35
80
40 – 49
15
45
95
50 –59
5
55
100
Összesen
100
---
---
∑f x x= ∑f
i i i
10 ⋅ 15 + 28 ⋅ 25 + ... + 5 ⋅ 55 = = 100
32,7 liter
A gépkocsik átlagosan 32,7 litert tankoltak a benzinkútnál az adott napon.
Szóródás
Medián: sme= n = 100 = 50 2
2
' és f ≥ 50 → Me a 3. osztályközben van
n − f ' me−1 50 − 38 ⋅ 10 = 32,86 , liter Me = xme,0 + 2 hme = 30 + 42 f me
A gépkocsik fele 32,86 liter benzinnél kevesebbet tankolt, a gépkocsik másik fele pedig ennél többet az adott napon. Módusz: 3. osztályközben van k (42− 28) Mo= xmo,0 + 1 ⋅ hmo = 30+ ⋅10= 33,41 liter k1 + k2 (42− 28) + (42−15) A legtöbb kocsi 33,41 liter benzin körüli mennyiséget tanko az adott napon.
Szóródási mérőszámok
Az értékek különbözőségét, változékonyságát nevezzük szóródásnak.
1) Terjedelem: annak az intervallumnak a hossza, amelyen belül az ismérvértékek elhelyezkednek. y
T = x max − x min
Szóródási mérőszámok
A szórás néhány tulajdonságai
2) Szórás: az átlagtól vett eltérések négyzetes átlaga Azt mutatja, hogy az ismérvértékek átlagosan mennyivel térnek el a számtani átlagtól. Mértékegysége megegyezik az alapadatok mértékegységével.
σ=
∑ (x
i
− x) 2
n
σ=
∑ f (x − x) i
i
2
A szórás akkor és csak akkor nulla, ha minden ismérvérték egyenlő. Az xi ismérvértékek additív transzformációja után tá a szórás ó á nem változik. ált ik Az xi ismérvértékek multiplikatív transzformációja után a szórás a transzformációnak megfelelően változik.
n
A szórás négyzetét varianciának hívjuk.
σ 2 = x q2 − x 2
14
Szóródási mérőszámok 3) Relatív szórás különböző alapadatok vagy ismérvértékek szóródásának összehasonlítására szolgál. Mértékegység nélküli szám, általában százalékos formában adják meg.
V =
σ x
0 ≤ V ≤ n −1
A relatív szórás az xi ismérvértékek additív transzformációja esetén változik, multiplikatív transzformációja esetén nem változik
15