Statisztika Dr Gősi Zsuzsanna Egyetemi adjunktus Sportmenedzsment Tanszék
Kötelező irodalom - Számonkérés Pintér József – Ács Pongrác Bevezetés a sportstatisztikába Dialóg Campus Kiadó 2007 Honlap: www.dialog-kiado.hu Írásbeli vizsga – vizsgaidőszakban Elégséges 51%-tól
2009. 10. 14.
2
Mi is az a statisztika
Tömegesen előforduló jelenségek mérése leírása és elemzése előrejelzése és szimulálása
Módszertan ahhoz, hogy jobb döntéseket hozzunk
2009. 10. 14.
3
Statisztika részei I Leíró statisztika Adatgyűjtés Adatok ábrázolása Adatok csoportosítása, osztályozása Adatokkal végzett egyszerűbb aritmetikai műveletek Az eredmények megjelenítése /pl. a Nike félmaratonon 2007-ben az egyéni célba érkezők száma 4116, ebből a nők aránya 28,3%/
2009. 10. 14.
4
Statisztika részei II Következtetéses statisztika: jelenségekre, folyamatokra vonatkozóan olyan megállapításokat tehetünk, amelyek nem csak közvetlen megfigyelésen alapulnak – matematikai képletek, valószínűségszámítás (A sportcsarnokban lévő világítótestek várható élettartama 3000 óra)
2009. 10. 14.
5
Statisztika részei III
Statisztikai döntéselmélet – több cselekvési lehetőség közül az optimálisnak vélt kiválasztásához ad számszerű információkat. /Beruházási döntések előkészítése, profil váltás előkészítése/
2009. 10. 14.
6
Statisztika alapfogalmak
Sokaság: statisztikai megfigyelés tárgyát képző egyedek összességét.(sportolók, iskolai tornatermek….) Álló sokaság – állapotot fejez ki (igazolt kézilabdázok száma) Mozgó sokaság – folyamatok fejez ki, időtartamra (2007-ben Mo-ra érkező turisták száma)
2009. 10. 14.
7
Sokaság megfigyelése Teljes körű megfigyelés (népszámlálás) Részleges megfigyelés Reprezentatív felvétel – jó következtetéseket lehet levonni az egészre Monográfia – egy előzetes ismérv alapján szűkítjük a sokaságot
2009. 10. 14.
8
Statisztikai ismérv A statisztikai sokaság egyedeire vonatkozó tulajdonságokat, jellemzőket. A különbözőségeket kifejező tulajdonságok, jellemzők az ismérvek, lehetséges kimeneteli változatai a ismérvváltozók.
2009. 10. 14.
9
Statisztikai ismérv Alternatív ismérv – két ismérvváltozat van (férfi-nő, kapus-mezőnyjátékos) Általános ismérvek lehetnek
Időbeli – születési dátum Területi – megye, város Minőségi – első osztályú, másodosztályú Mennyiségi – jövedelem, kapura lövések száma
2009. 10. 14.
10
Ismérv kapcsolatok Függetlenség – egyik ismérv hovatartozásáról nem következtethetünk egy másik ismérv konkrét változatra Függvényszerű kapcsolat: egyik ismérv konkrétan meghatározza a másik ismérvet pl. munkaviszony kezdete(időbeli ismerév), meghatározza a munkában töltött időt (mennyiségi ismérv) Sztochasztikus kapcsolat – valószínűség jelleg (a gól szám növekedése emeli a nézők 2009. 10. 14. létszámát) 11
Sztochasztikus kapcsolatok Asszociációs – minőségi ismérvek kapcsolata Vegyes típusú – egyik oldalon minőségi ismérv, mint ok a másik oldalon mennyiségi ismérv mint okozat szerepel Korrelációs kapcsolat – mennyiségi ismérvek közötti kapcsolat
2009. 10. 14.
12
Példa (Milyen ismérv változatok szerepelnek a táblázatban? ) Csapat neve Cornexi
Sportág Kézilabda
Helyezés Pontszám 4 15
Játékoskeret (fő) 17
Domino
Vízilabda
1
24
18
1
30
27
PVSK
Kosárlabda 1
18
20
Komló
Kézilabda
13
16
Alba Volán Jégkorong
2009. 10. 14.
6
13
Statisztikai adat Olyan tapasztalati, empirikus szám, amely mérés vagy számlálás útján keletkezik. Adott számhoz tartozik sokaság, hely és idő megjelölés, valamint mértékegység. / 111 951 vagy .. Hazánkban 2005-ben 111 951 db kerékpárt gyártottak/
2009. 10. 14.
14
Adatok fajtái Abszolút adat pl: a labdarugó csapatok játékos kerete 387 fő Származtatott adat: abszolút adatokkal végzet műveletek – viszonyszámok, átlagok pl. a játékos keret az elmúlt évhez viszonyítva 1,57%-kal bővült
2009. 10. 14.
15
Adatokkal szemben támasztott követelmények Pontosság Gazdaságosság Gyorsaság / az adatok néha csak korlátozottan pontosak pl. a Bajnokok Ligája elődöntőt 130 millió ember látta/
2009. 10. 14.
16
Mérési skálák Nominális skála Ordinális skála Intervallum skála Arányskála
2009. 10. 14.
17
Nominális skála Szimbólumok, számok csak az azonosítást szolgálják Jellemzően minőségi ismérv szerinti megfigyeléseknél alkalmazzuk PL. nemek, hajszín, állampolgárság
2009. 10. 14.
18
Ordinális skála Sorrendiségre vonatkozó relációk alapján rangsorba rendez. A sorrendi skálán nem biztos hogy az egyes elemek egymástól egyforma távolságra helyezkednek el. Pl. osztályzatok, minősítések, ranglisták
2009. 10. 14.
19
Intervallumskála Tiszta kvantitatív mértékeket használ. Sorrend mellett a skála bármely két pontja közötti távolság is értelmezhető. (de nem rendelkezik igazi zéro ponttal) Pl. a hőmérséklet, tengerszint feletti magasság
2009. 10. 14.
20
Arányskála – hányados skála Igazi kvantitatív skála, vagy hányados skála A skálának zéro pontja van A nulla az adott tulajdonság abszolút hiányát jelzi Pl. hosszúság, súly, költség
2009. 10. 14.
21
Statisztikai adatok csoportosítása, osztályozás
Csoportképző ismérvek kialakítása. Olyan ismérvek meghatározás, hogy adatok egyértelműen besorolhatók legyenek valamelyik csoportba (valamennyi egyed csak egy csoportba kerülhet) Rendszeresen használt ismérvváltozatokat nomenklatúrának nevezzük. Pl: FEOR, sportágak jegyzéke 2009. 10. 14.
22
Statisztikai sor – statisztikai tábla A statisztikai adatok valamilyen ismérv szerinti felsorolását statisztikai sornak nevezzük. (időbeli, minőségi, mennyiségi és területi statisztikai sorok) A különböző fajta de egymással összefüggő adatokat tartalmazó sorokat leíró sornak nevezzük.
2009. 10. 14.
23
Idősor Év -helyszín
Magyar sportolók száma
1896 Athén
7
1900 Párizs
17
1904 St, Louis
4
2009. 10. 14.
24
Minőségi sor Játékban betöltött szerep Kapus
Játékosok száma (fő)
Átlövő
4
Szélső
5
Beálló
6
Irányító
3
Összesen
21
2009. 10. 14.
3
25
Mennyiségi sor Gólok száma
Góllövők száma
1
68
2
28
3
11
2009. 10. 14.
26
Területi sor Megye
Sportegészségügyi rendelők száma
Budapest
16
Baranya
6
Bács-Kiskun
10
2009. 10. 14.
27
Leíró sor Szakosztályi létesítmények száma
1db
Igénybe vett szállítóeszközök
8 db
Havi tagdíjbefizetések átlagos nagysága
3750 Ft/fő
2009. 10. 14.
28
Statisztikai tábla A statisztikai sorok összefüggő rendszere A táblának fontos elemei a cím, a forrás, a magyarázó szöveg A statisztikai tábla legalább két statisztikai sorból áll (két, három, több dimenziós tábla)
2009. 10. 14.
29
A 2005/2006-os női kosárlabda bajnokság csapatai A csapatok székhely szerint Szekszárd
Maximális nézőszám
Játékosok száma
1200
15
Diósgyőr
2500
14
Nagykanizsa
1200
11
2009. 10. 14.
30
Táblák fajtái Egyszerű: amelyben csak összehasonlító vagy leíró sorok szerepelnek. (pl. leíró sor két időpontra vonatkozóan) Csoportosító: egy ismérv szerint végzünk benne csoportosítást.(pl. területi megoszlás és utána mennyiségi sorok..) Kombinációs tábla – a minőségi statisztikai sorok csoportosító jellegűek …
2009. 10. 14.
31
Összehasonlítás Gyakran alkalmazott, elemi módszer Statisztika adatok egymáshoz rendelése elemzési céllal Pl. átlagos havi jövedelem Magyarországon, átlagos havi jövedelem Ausztriában
2009. 10. 14.
32
Viszonyszámok Viszonyszám – két egymással kapcsolatban álló statisztikai adat hányadosa A viszonyszám általános definíciója V = A/B V: a viszonyszám A: viszonyított adat B: viszonyítási alap
2009. 10. 14.
33
Viszonyszámok típusai
Dinamikus viszonyszámok két időszak vagy időpont adatainak hányadosai A viszonyítás alapját képző időpontot szokták bázisidőszaknak, míg a viszonyítás tárgyát tárgy időszaknak nevezni. Kettőnél több időszak esetén beszélhetünk: Bázisviszonyszámról: a viszonyítási alap állandó Láncviszonyszám: a viszonyítási alap mindig előző időszak 2009.az 10. 14. 34
Képletek
Bázis viszonyszám képlete
yi bi y0
Lánc viszonyszám képlete
yi li yi 1
ahol i= 1,2,3,..n
2009. 10. 14.
35
Összefüggések Bázisviszonyszámok hányadosa alapján megkaphatjuk a láncviszonyszámot Láncviszonyszámok szorzata a bázisviszonyszám
2009. 10. 14.
36
Sportolók vizsgálata 20002004 Év
2009. 10. 14.
2000
Megvizsgált sportolók száma 250 422
2001
252 721
2002
260 969
2003
266 926
2004
270 098 37
Megoszlási viszonyszám
Azt mutatja meg, hogy egy csoport az egész sokaságon belül mekkora részt képvisel
pj
nj
m
n j 1
j
nj – a j-edik csoport elemszám j – 1,2,….m a csoportok száma 2009. 10. 14.
38
A népesség megoszlása gazdasági aktivitás szerint
100% 90% 80%
47,8
38,2
32,1
29,5
28,5
26,4
20,6
25,6
32,5
33,3
0
1,2 4,7
4,1
34,2
36,3
1996
2000
70% 60% 50%
4,4 0
13,5 0
40% 30%
47,8
48,3
47,3
20%
43,6
10% 0% 1960
1970
Aktív kereső 2009. 10. 14.
1980 Munkanélküli
1990
Inaktív kereső
Eltartott 39
Az év során legalább egy könyvet olvasó 15-84 éves férfiak és nők aránya azerint, hogy sportolnak-e, vagy sem, 2000 90 78
80 63
70
százalék
60 50
42
40
34
30 20 10 0
sportol
nemsportol
Férfi 2009. 10. 14.
Nő 40
Számolj megoszlási viszonyszámot az alábbi adatokból – lakott lakások száma 1990.01.01
Budapest
776 ezer db
Többi város
1 540 ezer db
Községek
1 372 ezer db
2009. 10. 14.
41