A KUTATÁSMÓDSZERTAN MATEMATIKAI ALAPJAI MA
T.P.Lenke
2013.10.25.
2
Szignifikáns különbség Annak bizonyítása, hogy a vizsgálat során megfigyelt különbség egy általunk meghatározott valószínűségi szinten is kimutatható-e. Amennyiben ez a különbség igazolhatóan nem a véletlen műve, lényeges szignifikáns különbségnek nevezzük.
2013.10.25.
2
3
2013.10.25.
Egymintás T-próba Az egymintás t-próbát akkor kell alkalmazni, ha a mérési eredmények ugyanazon személyek különböző felméréséből származnak, vagyis önkontrolos felmérések során.
z t n s '
Ahol:„
z
- számtani középértékét
„s” - különbségértékek szórása 2013.10.25.
3
2013.10.25.
4
Egymintás T-próba_2 A vizsgálat során a számított t-értéket össze kell hasonlítani a t táblázat értékével: Ha t’ > t táblázat a különbség nem a véletlen műve, Ha t’ < t táblázat a különbség a véletlen műve
2013.10.25.
4
2013.10.25.
5
T-próba értelmezése A szoftverek többsége tartalmazza a t értékét, azonban nem a tkritikus értéket adja, hanem a mintából számolt t értéktől jobbra eső, t-eloszlás alatti területet, melyet pnek nevezünk. „p” - elnevezései lehetnek: Prob-value, Signif of t, Sig.Level, stb. „p”- annak valószínűsége, hogy egy másik kiszámolt t legalább olyan messze van 0-tól, mint a most megfigyelt t, ha H0 igaz.
2013.10.25.
5
2013.10.25.
6
Döntés a „p” alapján Döntés a „p” és az „α” összehasonlítása alapján: • Ha p < α, akkor H0-t elvetjük és azt mondjuk,
hogy a különbség szignifikáns (1- α)x100%-os szinten
• Ha p > α, akkor H0-t elfogadjuk
2013.10.25.
6
7
2013.10.25.
Döntés a „p” alapján_2 „p” < 0,01 nagyon erős a Ho elleni bizonyíték 0,01 ≤ „p” < 0,05 mérsékelt a Ho elleni bizonyíték 0,05 ≤ „p” < 0,10 szuggesztív a Ho elleni
bizonyíték
0,10 ≤ „p”
2013.10.25.
kicsi, vagy nem reális a Ho elleni bizonyíték
7
2013.10.25.
8
A kétmintás t-próba A kétmintás t-próbát akkor alkalmazzuk, ha arra keresünk választ, hogy a két egymástól függetlenül vett minta származhat-e azonos átlagú populációból. A kétmintás t-próba azonban csak akkor végezhető el, ha a két csoport variancia értékei között nincs „nagy” különbség, melyre az Fpróba vizsgálat ad választ a variancianégyzetek hányadosának elemzésével.
Ha Fszámolt
2013.10.25.
8
9
2013.10.25.
A kétmintás t-próba A kétmintás t-próba számolás menetének számszerűsítése a következő összefüggés alapján történik:
t
xy n
m
2 ( x x ) ( y y ) i 2
i 1
i 1
nm2
nm nm
A szignifikanciavizsgálat szabadságfoka szf = n+m-2.
A kapott eredmény alapján értékelhetjük a vizsgált minták által elért teljesítményt 2013.10.25.
9
10
2013.10.25.
A kétmintás t-próba_2 A kétmintás t-próba azonban csak akkor végezhető el, ha a két csoport variancia értékei között nincs „nagy” különbség
Erre az F-próba vizsgálat ad választ a variancianégyzetek hányadosának elemzésével.
2013.10.25.
10
11
2013.10.25.
Az F-próba Az F-próba a variancia négyzetek hányadosa.
Képlete: 2 1 2 2
s F s
A fenti képlettel kontrollcsoportos vizsgálat során egy n1 és n2 elemű minta esetében alkalmazható a hipotézis igazolására, melynek szórásértékei s1 és s2 ahol, s1 > s2. 2013.10.25.
11
12
2013.10.25.
Az F-próba_2 A számított F értéket a táblázat értékeivel összevetve, a következő lehetőségekkel kell számolnunk: • Ha Fszámolt>Ftáblázat, akkor a vizsgálatban résztvevő minták
varianciája lényegesen különbözik egymástól, a kétmintás tpróba elvégzésére nincs lehetőség. Ebben az esetben más módszert kell keresni, pl. a Welch-próbát. (hasonló mint a kétmintás tpróba, de nem követeli meg a varianciák egyenlőségét)
• Ha Fszámolt
varianciája nem különbözik egymástól lényegesen és a vizsgálatot a kétmintás t-próbával kell folytatni.
2013.10.25.
12
2013.10.25.
13
Az eredmény általánosíthatósága a populációra A feltételezett összefüggés általánosításához az
szükséges, hogy a korrelációs együttható abszolút értéke nagyobb legyen, mint a 95%-os valószínűségi szinthez (adott szabadságfokon) tartozó érték. Abban az estben, ha 99% vagy 99,9%-os értéken
végezzük az összevetést, a elemzett kapcsolat még nagyobb valószínűséggel általánosítható.
2013.10.25.
14
Variaanciaalízis A kétmintás t-próba általánosításának tekinthető. Variancia-analízisnek nevezzük azt a statisztikai eljárást, mely több egydimenziós minta ugyanazon változója közötti különbség szignifikancia szintjének összehasonlítását teszi lehetővé.
14
15
2013.10.25.
Többváltozós populációk statisztikai elemzései A fejezet a többváltozós populációk statisztikai elemzési módszerével ismerteti meg három alfejezetben az olvasót, az alábbiakban felsoroltak alapján:
faktoranalízis diszkiminancia analízis főkomponens analízis klaszteranalízis 15
2013.10.25.
16
Jellemző esetek Két változó között minél szorosabb az összefüggés, annál inkább megközelíti a korrelációs együttható értéke az 1-t. Ha a minta két változója azonos irányban változik, abban az esetben pozitív, ha ellentétes irányban, akkor negatív a korrelációs összefüggés. Lineáris függvénykapcsolatban lévő (nem sztochasztikus) változók esetében a korrelációs együttható értéke 1.
17
2013.10.25.
Jellemző esetek_2 Minél lazább az összefüggés két változó között, annál közelebb van a korrelációs együttható értéke a 0-hoz. Független változók esetében a korrelációs együttható értéke = 0 A két változó látszólag egymástól függetlenül változik, ebben az esetben korrelálatlanságról beszélünk korrelációs együttható az egyszerű, közel lineáris stochasztikus kapcsolat esetében használható statisztika
• A
bonyolultabb függvénygörbe mentén elhelyezkedő értékek kapcsolatának leírására nem alkalmas.
• Egy
18
2013.10.25.
Különbözőségvizsgálat Jelentős-e a különbség Adatfajták, minták száma
Intervallum skála
Ordinális skála
Nominális skála
Egy
Egymintás tpróba
Wilcoxon-próba
Kereszttábla elemzés ϰ2 - próba
Kettő
Kétmintás t – próba F próba
Mann-Whitney próba
Kereszttábla elemzés ϰ2 - próba
több
Variaanalízis (ANOVA)
Kruskal-Wallispróba
Kereszttábla elemzés ϰ2 - próba
2013.10.25.
19
KHI NÉGYZET PRÓBA • Alkalmazásának feltétele, hogy ismert legyen a minta
elemeinek gyakorisága. A paraméteres és a nem paraméteres mintákban is a vizsgálat elvégezhető, melynek eloszlása lehet normál és nem normál. A khi-négyzet (2) eljárás feltétele a nagy elemszám. • A khi-négyzet eljárás alkalmas több adatsor közötti
összefüggés elemzésére. Ezt a statisztikát annak ellenőrzésére és bizonyítására alkalmazzuk, hogy a hipotézis megfogalmazása alapján bizonyítsuk, hogy a sor és oszlopváltozók függetlenek. • Nem jól használható, ha bármelyik cellában a peremeloszlások
alapján várható érték (expected value) kisebb 1-nél, vagy a cellák több mint 20%-ban ez az érték kisebb mint 5.
2013.10.25.
20
Mann-Whitney, Wilcoxon előjeles rangpróba • Mann-Whitney próba a független minták
összehasonlítását szolgáló eljárás. A két mintát együtt rangsorolva, a két rangszámösszeg közel azonos értéke a nullhipotézis beigazolását jelenti. • Wilcoxon előjeles rangpróba: két, összetartozó minta
vizsgálata során alkalmazott előjelpróbája, ha a nullhipotézis a két minta eloszlásának megegyezését feltételezi. az egyszerű eljárást a gyors tájékozódásra használják a vizsgálat során. Az eljárás a két minta negatív és pozitív különbségeinek eloszlását vizsgálja. A nullhipotézis igazolása esetén a különbség eloszlás szimetrikus.
2013.10.25.
21
Kruskal-Wallis próba • Kruskal-Wallis próba az eljárás 3, vagy több
mintaelemzésére alkalmas módszer. A vizsgálat feltételei: a mintavétel véletlen volta, a minták függetlensége és legalább ordinális változók megléte. • Rangtranszformációs eljárásnak is nevezik, mivel a
minták egyesítését követően a rangszámok meghatározását kell elvégezni, majd azokat az eredeti csoportok alapján csoportosítani. A transzformált értékek átlag rangjából vonható le a hipotézisre vonatkozó következtetés.
2013.10.25.
22
SPSS Statistical Package for Social Scienses Statisztikai programcsomag a szociológiai tudományok számára 1968-ban Norman H. Nie, C.Handlai Hull és Dale H. Bent alkották meg az SPSS alapjait, 70-es években továbbfejlesztették a Chicagói Egyetemen.
1992-ben megjelent a Windows alatt futó változata, ez averzió vált elterjedtebbé a felhasználók körében.
1997 – 2003 vállalati alkalmazások elterjedése 2004 Predectiv elemzések ideje 2007 Java alkalmazások 2009 SPSS PASW
2013.10.25.
23
Az adatbázis
Az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek, a sorok, vagy rekordok illetve elemek, a válaszadóknak felelnek meg.
2013.10.25.
Az adatbázis definiálása
24
2013.10.25.
25
Adat
Az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek, a sorok, vagy rekordok illetve elemek, a válaszadóknak felelnek meg.
26
2013.10.25.
Az adat jellemzői_1
VARIABLE NAME
a kijelölt oszlopba feltüntetett változók megnevezését határozzuk meg.
TYPE
a változó típusát jelöljük meg
LABELS
a változó címkéjét definiáljuk
MISSING VALUES
az adathiány kódja, ahol a hiányzó adatokat kódolhatjuk
COLUMN FORMAT
a cella formázása
2013.10.25.
Adat típusa
27
2013.10.25.
A File menű
28
2013.10.25.
Define Labels – a változók definiálása
A változók neveit – Value - cimkékkel látjuk el Value label – a változók magyarázatai
29
2013.10.25.
30
Define Missing Values- az adathiány ellenőrzése Ha a feldolgozás során nem kell számolni adathiánnyal, akkor a legfelső, No missing values pontot jelöljük meg. Abban az esetben, ha hibás értékekkel is számolni kell, az alábbi 3 beállítási lehetőségünk van:
2013.10.25.
Define Missing Values- Hiba
31
2013.10.25.
Hibás értékek – adathiány ellenőrzése adattisztítás
32
2013.10.25.
33
Hibás értékek – adathiány ellenőrzése_2 File Display Data Info
2013.10.25.
Keretrendszer kialakítása
34
2013.10.25.
Oszlop formázás
A lehulló ablak az oszlop szélességének és a beleírt szöveg igazítására ad lehetőséget.
35
2013.10.25.
SPSS adatfelvitel
36
2013.10.25.
Sor és oszlop beszúrás
37
2013.10.25.
38
Az adatbázis
• az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek, • a sorok, vagy rekordok illetve elemek, a válaszadóknak felelnek meg.
2013.10.25.
Adatfelvitel
39
2013.10.25.
40
A kérdőív kitöltöttsége Az online teszt kitöltöttség kimutatása az alábbiak szerint történik (Analyze/Descriptiv Statistics/Frequenties
41
2013.10.25.
1. Az adatok előkészítése - folyamat 1. Változók Mérési szintek
2. adatrögzítés kódolás 3. adattisztítás
42
2013.10.25.
1. Az adatok előkészítése 1. Változók
Mérési szintek
A mérhetővé tétel a jelenségek összehasonlításának, rangsorolásának igénye miatt fontos! Számokkal kifejezett jelenségeket mérünk, ebből következtetünk A vizsgált dolgok különböző tartalmúak – különböző szabályok szerint adunk hozzá számokat – máshogy mérjük - 4 féle hozzárendelési szabály, mérési szint: 1. 2. 3. 4.
Nominális Ordinális Intervallum arányskála
2013.10.25.
Mérési szintek
43
44
2013.10.25.
Adatrögzítés • Papír alapú adatok kódolása és rögzítése
számítógépen • Elektronikus adatok esetében egyszerűbb – adatkonvertálás kor
nem
Isk.végz.
jövedelem …
1. Mintaelem (kérdőív)
24
Nő
8 ált.
42.000
2. Mintaelem (kérdőív)
20
ffi
Gimn.
80.000
Ilyen formában nem mérhető!
…
kódolás szükséges a mérési szinteknek megfelelően!
2013.10.25.
kategória
Kategória, sorrend
Kategória , sorrend, különbsé g
Kategória, sorrend, különbség , arány
45 Nem, foglalkozás, településnév, vallás, nemzetiség…
Településtípus
hőmérséklet
súly, magasság
46
2013.10.25.
Kódolás • Kódutasítás és kódtáblázat Kérdőív:
Kódutasítás:
Mi az Ön neme? Férfi nő
Mi az Ön neme? {NEM} 1. Férfi 2. nő 3. 99 nincs válasz
Kérdőív: Van-e az Önök háztartásában: Mikrosütő Mosógép Számítógép …
Kódutasítás: Van-e az Önök háztartásában: {HMIK} Mikrosütő 0-nincs válasz {HMOS} Mosógép 1-van {HSZGEP} Számítógép 2-nincs …
2013.10.25.
47
kódolás • Nyitott kérdések kódolása
szöveges válasz is beírható (Excel, SPSS szöveges változói) – kategóriarendszer felállítása (- ne legyen túl sok kategória - minden válasz beleférjen valamely kategóriába)
2013.10.25.
Adatfájl előkészítése • Az összes változó definiálása (címkézés) • Az attribútumok megadása (kódutasításnak
megfelelően) • Változó neve legyen egyértelmű (más számára is használható)
48
2013.10.25.
49
Adattábla részlete az SPSS adatbázisában
50
2013.10.25.
3. Adattisztítás 1. Kérdőívek ellenőrzése kérdezőbiztos: át kell néznie kitöltés és leadás előtt – elég szúrópróbaszerűen önkitöltős: ha lehet, mindet ellenőrizzük lehetséges hibák: a. Hiányzó válaszok Oka: - szűrő kérdés miatt nincs adat (ez nem hiba!) - kérdezőbiztos nem tette fel a kérdést vagy nem rögzítette a választ Esetenként pótolható az adathiány
b. Logikai ellentmondások c. Nyitott kérdéseknél: Olvashatóság kérdése
d. Hiányzó kérdőívlapok Leszakadt, szétesett… - pótlás vagy adathiány
51
2013.10.25.
3. Adattisztítás 2.
Digitális adatfile tisztítása Az adatrögzítő hibáinak kiküszöbölése elütések kiszűrése: egy gyakoriság (frequencies) lekérdezése után kijövő ellentmondások Pl.: neme: 22 (valószínűleg elütés: 2-helyett 22) de: 125 000-es kódnál lehet elcsúszás az adatfile-ban! korrekt: hiányzó értéknek jelölni (missing), így nem torzítja a statisztikát
52
2013.10.25.
Adattisztítás gyakoriság lekérdezésével
anya iskol ai végzettsége Frequency Valid
kev es ebb, mint 8 általános 8 általános szakmunkásképző szakk özépisk ola, gimnázium technikum f őiskola, egy etem Tot al
Percent
Valid Percent
Cumulat iv e Percent
1
2, 1
2, 1
2, 1
5 11
10, 4 22, 9
10, 4 22, 9
12, 5 35, 4
14
29, 2
29, 2
64, 6
5 12 48
10, 4 25, 0 100,0
10, 4 25, 0 100,0
75, 0 100,0
2013.10.25.
53
Kitöltöttség
A kérdőívet 381-en töltötték ki, amelyből 20 kitöltése félbeszakadt. Szükség van az adatok tisztítására, adatlapok kizárására. A teljes állomány az értékeléskor 361 fő adatait tartalmazza, melynek alapján a statisztikai elemzés megvalósult.
2013.10.25.
54
ANOVA A varianciaanalízis több, egyező szórású, normál eloszlású csoport átlagának összevetésére alkalmas statisztikai módszer, Elnevezése: ANalysis Of VAriance = ANOVA-ként ismerjük. A populáció középértékeit a varianciák segítségével viszonyítjuk egymáshoz, melynek során: ingadozás okára keressük a választ. választ keresünk, hogy a szórásbeli eltérések mögött a véletlen vagy egy másik magyarázó tényező hatása bújik-e meg.
Ilyen tényezőnek tekinthető adott populáción belüli csoportok átlagai közti eltérést. A varianciaszámítása során a teljes variancia számlálója, azaz a teljes eltérésnégyzetösszeg független elemek összegeként állítható elő, a nevező, azaz a szabadsági fok az adott komponensek szabadsági fokainak összegeként képezhető.
Kérdések, melyre választ várunk
Van-e differencia / változás a tapasztalt eredmények között? Eltérésre, változásra keres magyarázatot. Van-e hatása a kísérleti manipulációnak- a kontrollhoz viszonyítva – a célváltozóra? Egzaktabbul az átlagra gyakorolt hatást elemzi.
2013.10.25.
ANOVA (Analisis Of Variance) • A mérést ANOVA elemzéssel
végezhetjük, melynek során a független változó az életkor és a függő változó az informatikai eszközök alkalmazása. A variaanalízis rámutatott a varianciák megegyezésének kérdésére. Analyze/Compare Means/OneWay ANOVA menüre kattintunk
55
2013.10.25.
Behúzzuk a függő vátozót (Dependent List) és a Factort
56
2013.10.25.
57
A Post Hocra kattintva a lehúlló ablakba kipipáljuk a SCHEFFE-t. Majd a Continue nyomjuk meg.
2013.10.25.
58
Az Options radiógomra kattintva a lehulló ablakba kipipáljuk a Descriptive és a Homogenity of variance test rádiógombokat.
2013.10.25.
59
Eredmény A kapott válaszok (853 fő) alapján z eredmények kiértékelése:
Az informatikai eszközöket leggyakrabban a 25-30 éve korosztály alkalmazza.
2013.10.25.
60
• Az alábbi táblázat alapján megállapítható, hogy a szóráshomogenitás
feltétele teljesül, melynek bizonyítéka, hogy a Levene statisztika nem szignifikáns (0,228). • A Levene teszt nullhipotézise azt mondja ki, hogy a szórások nem egyenlők, melynek következménye hogy a nullhipotézist elvetjük és a szóráshomogenitás teljesül.
• A továbbiakban tekintsük át, hogy a csoportok közötti és a csoporton belüli
négyzetösszegek vizsgálatával mit kapunk.
2013.10.25.
61
ANOVA táblázat • A táblázat alapján megállapítható, hogy a csoportok
közötti (Between Groups) és a csoporton belüli (Within Groups) eltérésnégyzetek arány F=1,088/1,163=0,935). Az F próbához tartozó szignifikanciaszint 0,443, vagyis nagyobb, mint 0,05. A kategóriaátlagok nem különböznek egymástól szignifikánsan, az informatikai eszközök használata közel azonos mértékben hat a különböző korosztályú hallgatókra. • Az alábbi görbe az átlagok vizuális képét szemlélteti. A legerősebb válaszreakció a 25-30 és a 41-50 éves korosztályra jellemző.
2013.10.25.
A kérdésben a minta hallgatói értékelte az első oszlopban található szempontokat 0 és 5 közötti pontszámmal. Összesen 9 IKT támogatást értékeltek.
62
2013.10.25.
63
2. Egyszerűbb elemzések 2.1. gyakoriság ha sok a válaszlehetőség (pl. életkor), célszerű a kategóriákat képezni. (ne túl sokat!) nézhetünk egyszerű gyakoriságot (frequency; előfordulási elemszám), százalékot (percent), a hiányzó értékektől letisztított százalékot (valid percent)
2013.10.25.
64
Képezzünk kategóriákat !
65
2013.10.25.
2. Egyszerűbb elemzések 2.2. mérőszámok 2.2.1. a középérték mérőszámai numerikus változóknál lehet számolni
a. átlag (a változó összes értéke/adatok száma) pl. 1 főre jutó jövedelem átlaga
b. medián (az adatokat növekvő/csökkenő sorrendbe állítjuk, a minta közepén megjelenő érték; a minta adatainak fele felette, fele alatta lesz) a szélső értékek befolyásolhatják az átlagot! – medián jövedelem: fölötte u.annyian helyezkednek el, mint alatta
c. módusz (a leggyakrabban előforduló érték) az a kategória, amelybe a vizsgált populációból a legtöbben tartoznak
Számolásuk SPSS-ben: analyze/frequencies
66
2013.10.25.
Hányan laknak egy háztartásban? Válaszok 1-7-ig terjedtek Mennyi lehet az átlagos létszám? Négy?
Az egyes értékek gyakorisága nem azonos!
egyedül 112
Öten
127
Ketten
293
Hatan
28
Hárman 370
Heten
7
négyen
Össz.
1438
501
Mi lehet az átlag? Számítás: (1X112+2X293+3X370+4X501+5X127+6X28+7X7)/1438=3,24
Mi lehet a medián (középérték)? A minta közepét megjelenítő érték – a mintában szereplőadatok fele (az első 719 válaszadó) a medián alatt, fele (719) a medián felett található. E változónál ez az érték: 3 Mi lehet a módusz (leggyakrabban előforduló érték)? A válaszadók közül legtöbben 4-en laknak egy háztartásban.
67
2013.10.25.
Átlag, medián és módusz értékei egy másik konkrét felmérésben Statistics hav i gazdálkodási összeg N Valid 48 Missing 0 Mean 49235,35 Median 40000,00 Mode 20000
68
2013.10.25.
2. Egyszerűbb elemzések 2.2.2. szórás ne maradjunk meg a középérték elemzésénél, nézzük meg a szóródást is! Pl.: jövedelmi viszonyok megítélése: - a sokaság nagy része az átlag közelében van, - vagy sokan messze az átlag alatt és/vagy felett helyezkednek el? Mérésére leggyakrabban használt statisztika a standard deviáció (SPSSben: Std. Deviation) Pl.:megkérdezettek jövedelmének átlaga: 97660 Ft Lehetne ez úgy is, hogy mindenki ilyen jövedelmű, de úgy is, ha egyik fele 1 Ft-ot mond, a másik fele 195319 Ft-ot. Így a két esetben más a szórás! 0 és 97692,37 a két esetben az érték
Minél inkább közelít a nullához a szórás, annál jellemzőbbek az átlag körüli értékek.
69
2013.10.25.
2. Egyszerűbb elemzések 2.3. változók közötti kapcsolat
Független (magyarázó) tényező: az a változó, amely okként jelenik meg Függő változó: az okozatként szereplő változó Pl: életkor és jövedelem a közszférában: életkor a független, jövedelem a függő változó Kapcsolat lehet: - determinisztikus - sztochasztikus (valószínűségi) - változók függetlensége
2013.10.25.
70
2. Egyszerűbb elemzések 2.3.1. kereszttábla-elemzés (crosstabulation) két változó összevetése egy táblázatban abszolút számok mellett: százalék sorok és oszlopok szerint is Kizárható-e, hogy a talált összefüggés nem csak a mi mintánkra jellemző?
statisztikai hipotézisvizsgálat (khi-négyzet próbaPearson) – szignifikanciaszint meghatározása: mekkora a valószínűsége annak, hogy az összefüggést mintavételi hiba okozta? (határérték szokásjog alapján 0,05, ez alatt az eredmény szignifikáns) Háromdimenziós kereszttáblák esetén legyen elegendő elemszám!
71
2013.10.25.
Kereszttábla példa Nem * i skolaválasztás el őtti tapasz tal at C rosstabul ati on
Nem
f érf i
nő
Tot al
Count % wit hin Nem % wit hin is kolav álaszt ás előt ti t apas zt alat % of Total Count % wit hin Nem % wit hin is kolav álaszt ás előt ti t apas zt alat % of Total Count % wit hin Nem % wit hin is kolav álaszt ás előt ti t apas zt alat % of Total
iskolav álasztás előt ti tapasztalat nem v olt v olt 10 0 100,0% ,0%
Tot al 10 100,0%
23, 3%
,0%
20, 8%
20, 8% 33 86, 8%
,0% 5 13, 2%
20, 8% 38 100,0%
76, 7%
100,0%
79, 2%
68, 8% 43 89, 6%
10, 4% 5 10, 4%
79, 2% 48 100,0%
100,0%
100,0%
100,0%
89, 6%
10, 4%
100,0%
Nincs elegendő elemszám, következtetés levonása elhamarkodott lenne!
2013.10.25.
Összefoglalva:
72
2013.10.25.
73
3. A „puha” adatok elemzése Adatgyűjtés szakaszában célszerű hozzálátni az adatok tisztításához, előkészítéséhez, elemzéséhez – változtatás lehetősége! 3.1. az interjú leírása és átírása ha lehet, a kutató maga írja le!
3 formája: 1. vázlat az interjú szövegéből 2. interjú szó szerinti szövege 3. további információk közlése (idő,
megjegyzések, gesztusok, utalások más interjúkra…)
2013.10.25.
74
1. Vázlat az interjú szövegéből
2013.10.25.
2. Interjú szó szerint
3. Részletes leírás
75
2013.10.25.
76
3. A „puha” adatok elemzése 3.2. adatok rendezése Összegyűlt kutatási nyersanyagok rendszerezése • adatok formátuma Legyen egységes! (kazetta, feljegyzések… legyen gépen rögzítve, filenév egyértelmű…) • adatok csoportosítása minden adatot fel kell címkézni! (interjú: kódszám vagy monogram; helyszín, más szempont szerint csoportosítani) • adattisztítás a későbbi elemezhetőség állapotába juttassuk az adatokat! Más is tudja esetleg elemezni • biztonsági intézkedések Mentés készítése, más helyen tárolás!!!
77
2013.10.25.
3. A „puha” adatok elemzése 3.3. kódolás 1. a témára vonatkozó utalások kiszűrése 2. adott szövegrészek kigyűjtése 3. azok csoportosítása 4. táblázat elkészítése a csoportok és válaszaik szerint Interjúk alapján tipológia készíthető!
78
2013.10.25.
3. A „puha” adatok elemzése 3.4. esettanulmány Célravezetőbb, ha több interjút készítünk
Egymás mellé helyezve ezek szöveghálót alkotnak A háló elemei között kapcsolatok állnak fenn
szövegrészek megfigyelések információháló
Jelenség elemzése
Esettanulmány példája: Fellegi Borbála – Ligeti György (2003): Hátrányos helyzetűek a közoktatásban; Kutatási beszámoló Kurt Lewin Alapítvány (elérhető: http://www.kla.hu/referenciak/kutatas/ )
2013.10.25.
79
80
2013.10.25.
Az eredmények ábrázolása
Egyéni eredmény
Histogram
REL 9
6
12
6
15 18
5
24
5
Missing
4
Frequency
Frequency
4
3
3
2
2
1
1 Mean = 12,9 Std. Dev. = 5,515 N = 20
0 0
5
10
15
REL
20
25
30
Mean = 12,9 Std. Dev. = 5,515 N = 20
0 0
5
10
15
20
25
30
REL
Cél: az eredmények áttekinthetőbbé és szemléletesebbé tétele
81
2013.10.25.
Gyakorisági poligon (görbe)
A gyakorisági sor osztályközepek alapján szerkesztett vonaldiagramja
82
2013.10.25.
Hisztogram_1 A hisztogram a rendezett minta intervallumaiba eső elemek számát ábrázolja. a hasábok szélessége – a változó tartománya A hasábok magassága – gyakoriság
Az oszlopok száma, ha: Túl sok – túlrészletezett
Túl kevés elnagyolt
2013.10.25.
83
Hisztogram_2
Szimmetrikus, normál
Szimmetrikus, csúcsos
2013.10.25.
84
Hisztogram_3
bimodális
85
2013.10.25.
Hisztogram_4
Balra ferdülő hisztogram
86
2013.10.25.
Hisztogram_5
Jobbra ferdülő hisztogram
2013.10.25.
87
Boxplot grafikon
A boxplot: mennyiségi ismérv szerinti eloszlást a kvartiliseken keresztül érzékelteti. A xmin és xmax értéket összekötő szakaszra épül az alsó és a felső kvartilisek által közbezárt doboz. A középső vonal a medián.
A boxplot rámutat: •mennyire sűrűsödnek a megfigyelések a középső 50%-os intervellumban •Mennyire ferde az eloszlás
88
2013.10.25.
A középértékek elhelyezkedése a különböző gyakorisági eloszlásokban Az eloszlás szimmetriájának mérésére szolgál az un. ferdeség vagy eltoltság – skewness, értékei: egy mérőszám, mely arra ad választ, hogy a szóródás a centrumtól jobbra vagy balra lapul-e, ill. sűrűségfüggvényt jelez.
A ferdeség - Skewness o Ha (-), balra ferdül a kiugrás o (+), jobbra o (0), szimetrikus
Lapultság - Kurtois o csúcsos, leptokurtic o lapos, platykurtic
0 0
89
2013.10.25.
Középértékek elhelyezkedése a különböző eloszlási gyakoriságokban_1
Szimmetrikus eloszlás Skewness = 0
90
2013.10.25.
Középértékek elhelyezkedése a különböző eloszlási gyakoriságokban_2
Szimmetrikus – kétpúpú eloszlás
Bimodális eloszlás (két módusza van)
91
2013.10.25.
Középértékek elhelyezkedése a különböző eloszlási gyakoriságokban_3
Balra ferde (negatív irányban eltolt eloszlás)
Skewness = (-)
92
2013.10.25.
Középértékek elhelyezkedése a különböző eloszlási gyakoriságokban_4
Jobbra ferde – pozitív irányban eltolt eloszlás
Skewness = (+)
93
2013.10.25.
Különböző csúcsossági értéket - kurtois mutató normális eloszlások
Mezokurtikus eloszlás Skewness = 0
2013.10.25.
94
Csúcsossági értékek
A csúcsossági értékek arra mutatnak, hogy az eloszlás közepe mennyire emelkedik ki. Platikurtikus – lapos : 0 Leptokurtikus eloszlás – csúcsos: > 0
2013.10.25.
95
Különböző szórású normális eloszlások (szórások átlaga = 0)
Csúcsosság: az értékek milyen mértékben tömörülnek az átlag körül
Grafikai ábrázolás 96
kördiagram
2013.10.25.
Hisztogram 97
2013.10.25.
Halmozott oszlopdiagram 98
2013.10.25.
Tő és levél (Steam and leaf plot) 99
2013.10.25.
Boksz-Plot ábra 100
2013.10.25.
Pókháló, sugár 101
2013.10.25.
2013.10.25.
102
Klaszteranalízis A klaszteranalízis a megfigyelések (vagy a változók) osztályozásának dimenziócsökkentő módszere. • A diszkriminancia analízissel szemben itt nincsenek előre megadott
osztályok, a feladatunk éppen ezeknek a létrehozása. • A klasztertendencia vizsgálat célja annak eldöntése, hogy az adatok mutatnak-e hajlamosságot a természetes csoportosulásra. Ha az adataink hasonlóságot mérő mátrix elemei ordinális skálán mért értékek, akkor a véletlen gráfelmélet nyújt matematikai eszközt a csoportosulási tendenciák megállapítására.
A klaszterezés az objektumok osztályba sorolását jelenti, vagyis az objektumok halmazának (X) részhalmazokra való felbontását.
103
2013.10.25.
Irodalom 1. 2.
3.
4. 5.
Varga Lajos (2002): Kvantitatív módszerek a pedagógiai kutatásban. BMF BGK kari jegyzet. Varga Lajos (szerk., 2006): Kutatás-módszertan I. Bevezetés a pedagógiai induktív kutatás módszereibe és útmutató a szakdolgozat elkészítéséhez. BME, Bp. Schmercz István - Varga Lajos (2008): Kutatás-módszertan II. Bevezetés a pedagógiai deduktív és szociálpszichológiai kutatás módszereibe. BME, Bp. Falus Iván - Ollé János (2000): Statisztikai módszerek pedagógusok számára. Okker K., Bp. Falus Iván - Ollé János (2008): Az empirikus kutatások gyakorlata. Nemzeti Tankönyvkiadó, Budapest
2013.10.25.
104
Irodalom 1.
2. 3. 4. 5. 6. 7. 8.
9. 10. 11. 12.
6. Ágoston–Nagy–Orosz: Méréses módszerek a pedagógiában. Tankönyvkiadó. Bp., 1974 Antal Péter: Térbeli gondolkodás és elektronikus tananyagfejlesztés. EKF Antal Péter, T. Parázsó Lenke: Az on-line tananyagok szerepe a készségek, képességek elsajátításában EKF Bálya Dávid: Az informatika kihívása a teszt-technológiában, BME TIO 1997 Báthory Zoltán: Tanulók, iskolák – különbségek. Budapest, Tankönyvkiadó, 1992, pp.146–148. Báthory, Zoltán: Feladatlapok szerkesztése, adatok értékelése. OOK Budapest 1976 Báthory, Zoltán:Tanítás és tanulás. Tk.Bp.1984 Csapó, Benő (szerk): Az iskolai tudás. Osiris Kiadó Bp. 1998. Elek Elemérné dr és T. Parázsó Lenke: Az tanári mesterség információ- és kommunikációtechnikai alapelemei; online tankönyv 11. fejezet 2005. Falus Iván – Kimmel Magdolna: A portfólió. Gondolat Kiadói Kör, ELTE BTK Neveléstudományi Intézet, Budapest, 2003. http://www.om.hu/main.php?folderID=1048 Komenczi Bertalan: Orbis sensualium pictus. In: Iskolakultúra, 1997. 1. sz. Melléklet p.M3-M15. p.10.
2013.10.25.
105
Irodalom 13. Lovett, M. C (1992) Learning by problem solving versus by examples: The benefits of generating and receiving
information. In.: Proceeding of the Fourteenth Annual Conference of the Cognitive Science Society Hillsdale. New Jersey: Erlbaum, pp.956–961. 14. M. Nádasi Mária: Projektoktatás. Gondolat Kiadói Kör, Budapest, 2003. (Oktatás-módszertani kiskönyvtár.) Nagy Tamás: Mérésmetodikai alapok. On-line: http://zeus.szif.hu/ejegyzet/ejegyzet/meresmet/ 13. Psychological Foundations of Design for CBI. In: http://www.artsei-ccwin.concordia.ca/educationTetec660/mod 4b. html 1999. 10. 06. 14. Pedagógiai Lexikon. http://www.pedagogia-online.hu/modules.php?name=PedLex&p=record&rid=8338 15. Dr Setényi j János : A minőség kora. . Bevezetés az iskolai minőségbiztositásba. Raabe, Bp 1999 ISBN 9639194271 16. Vári Péter: Médiumkiválasztás. Veszprém, OOK, 1983, pp.3-16. 17. www.tanszertar.hu 18. Falus Iván (szerk., 2002): Bevezetés a pedagógiai kutatás módszereibe. Műszaki K., Bp. 19. Fercsik János (1982): Pedagometria. OOK, Veszprém 20. Horváth György (2004): A kérdőíves módszer. Műszaki K. Bp. 21. Babbie, Earl (2003; 6. átd. kiad.): A társadalomtudományi kutatás gyakorlata. Balassi K., Bp. 2003 22. Lengyelné Molnár Tünde, Tóvári Judit: Kutatásmódszertan . –Eger: Líceum kiadó, 2001.