Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz
TÁMOP-4.1.2.A/1-11/1-2011-0091 „INFORMÁCIÓ - TUDÁS – ÉRVÉNYESÜLÉS”
Tizedik rész Az adatelemzés alapjai
TÁMOP-4.1.2.A/1-11/1-2011-0091 „INFORMÁCIÓ - TUDÁS – ÉRVÉNYESÜLÉS”
Tartalomjegyzék • • • • • • •
Bevezetés Leíró statisztikák I Leíró statisztikák II Hisztogram Kereszttábla elemzés I Kereszttábla elemzés II Felhasznált irodalom
TÁMOP-4.1.2.A/1-11/1-2011-0091 „INFORMÁCIÓ - TUDÁS – ÉRVÉNYESÜLÉS”
Bevezetés • A 8-es egységben, a következtetési statisztika alapjaival foglalkoztunk. Ebben az egységben a leíró statisztikákat fogjuk megvizsgálni részletesebben.
• A leíró statisztikák esetében, is külön kell választanunk az alacsony és a magas mérési szinten értelmezhető statisztikákat. Az egység első részében a magas mérési szintre koncentrálunk. • Mivel a magas mérési szintű változók esetében az adatok százalékos megoszlása magában kevés információval szolgál, ezért olyan mutatókat próbálunk alkalmazni, amelyek magukban is informatívak a változóra nézve. Ha egy sokaságot jellemezni szeretnénk, akkor általában egy statisztika magában kevés információt nyújt, ezért érdemes ezen statisztikákat együttesen alkalmazni. •
Megkülönböztetünk centrális, és szóródási statisztikákat.
TÁMOP-4.1.2.A/1-11/1-2011-0091 „INFORMÁCIÓ - TUDÁS – ÉRVÉNYESÜLÉS”
Leíró statisztikák I Statisztika
Jelentése
Átlag
Az értékek összege osztva az elemszámmal.. A minta átlaga (X átlag), a teljes sokaság várható értékének torzítatlan becslése
Medián
A változó középső értéke rendezett mintában. Az adott érték két egyenlő részre vágja a sokaságot
Módusz
A változó leggyakoribb értéke. Értelmezhető alacsony mérési szinten is. Magas mérési szinten a sűrűségfüggvény maximuma
Összeg (szumma)
A változó összes értékének összege
Minimum
A változó legkisebb értéke
Maximum
A változó legnagyobb értéke
Terjedelem
A maximum és a minimum érték különbsége
Szórás
Átlagtól való átlagos eltérés. A szigma az elméleti szórást jelenti, az s pedig az empirikus szórást
Variancia
Szórás négyzete
Percentilis
Az n%-os (vagy n-edik) percentilis azt jelenti, hogy az adatok n%-a kisebb, mint ez az érték. A medián az 50 százalékos percentilis
Centrális mutatók
Szóródás mutatók
TÁMOP-4.1.2.A/1-11/1-2011-0091 „INFORMÁCIÓ - TUDÁS – ÉRVÉNYESÜLÉS”
Leíró statisztikák II • Magas mérési szintű változók esetében, nemcsak a leíró statisztikák informatívak, hanem a változók grafikus megjelenítése is. Magas mérési szint esetén a változók eloszlása, adhat további képet számunkra az adatok szerkezetéről. A változó eloszlása azt mutatja meg, hogy a változó egyes értékei a minta hány százalékára jellemzők. • A statisztikai következtetés elméletben a normális eloszlásnak különleges szerepe van, ezért ezzel foglalkozunk a továbbiakban.
• A normális megoszlású változók esetében a sokaság többsége az átlag körül helyezkedik el, és minél távolabb kerülünk az átlagtól annál kevesebb az egyes esetek előfordulási valószínűsége (például az IQ). • A normál eloszlás szimmetrikus eloszlás, tehát az átlag kettévágja a sokaságot (így az átlag megegyezik a mediánnal), és az átlag két oldala gyakorlatilag tükrözhető egymásra. Normál eloszlás esetében a minta 68 százaléka az átlag +- 1 szórásnyira helyezkedik el, és az esetek 95 százaléka pedig az átlag +- 2 szórásán belül. A standard normális eloszlás a korábbi tulajdonságok mellett még azzal is rendelkezik, hogy az átlaga 0, a szórása pedig 1.
TÁMOP-4.1.2.A/1-11/1-2011-0091 „INFORMÁCIÓ - TUDÁS – ÉRVÉNYESÜLÉS”
Hisztogram
TÁMOP-4.1.2.A/1-11/1-2011-0091 „INFORMÁCIÓ - TUDÁS – ÉRVÉNYESÜLÉS”
Kereszttábla elemzés I • Az alacsony mérési szintű változók esetében alapvetően a százalékos megoszlásokra koncentrálunk az elemzés során • •
Százalék: Az adott kategória aránya a teljes esetszámhoz képest Érvényes százalék: Az adott kategória aránya a kérdésre érvényesen válaszolók körében
• Kereszttábla elemzés • A 8-as egységben, már részletesen foglalkoztunk a kereszttábla elemzés kapcsán a függetlenség kérdésével. Ebben az egységben az elemzés leíró részére koncentrálunk. A kereszttábla elemzésben négy alap vizsgálati megközelítést mutatunk be: • • • •
esetszám: a cellában megfigyelt esetek száma sorszázalék: cella elemszám osztva a sor marginálissal oszlopszázalék: cella elemszám osztva az oszlop marginálissal teljes százalék: cella elemszám osztva az összes eset számával
A mutatókat a 8-as egységben már felhasznált példánkon illusztráljuk:
TÁMOP-4.1.2.A/1-11/1-2011-0091 „INFORMÁCIÓ - TUDÁS – ÉRVÉNYESÜLÉS”
Kereszttábla elemzés II Esetszám
Sorszázalék
Kisfiú
Kislány
Összesen
Kisfiú Kislány Összesen
Kap virgácsot
40
20
60
Kap virgácsot
67%
33%
60
Nem kap virgácsot
20
20
40
Nem kap virgácsot
50%
50%
40
Összesen
60
40
100
Összesen
60
40
100
Oszlop százalék
Teljes százalék
Kisfiú
Kislány
Összesen
Kap virgácsot
67%
50%
60
Kap virgácsot
40%
20%
60
Nem kap virgácsot
33%
50%
40
Nem kap virgácsot
20%
20%
40
60
40
100
Összesen
60
40
100
Összesen
Kisfiú Kislány Összesen
sorszázalék: A virgácsot kapók 67 százaléka kisfiú oszlopszázalék: A kisfiúk 33 százaléka nem kapott virgácsot teljes százalék: Az összes megkérdezett 40 százaléka, aki virgácsot kapott és kisfiú
TÁMOP-4.1.2.A/1-11/1-2011-0091 „INFORMÁCIÓ - TUDÁS – ÉRVÉNYESÜLÉS”
Felhasznált irodalom: • Obádovics Gyula: Valószínűségszámítás és matematikai statisztika, Budapest Scolar, 2009 • Rudas Tamás: Hogyan olvassunk közvélemény-kutatásokat? Új Mandátum Könyvkiadó Budapest, 1998. • Rudas Tamás: Közvélemény-kutatás. Corvina Budapest, 2006.
TÁMOP-4.1.2.A/1-11/1-2011-0091 „INFORMÁCIÓ - TUDÁS – ÉRVÉNYESÜLÉS”