PEDAGÓGIAI KUTATÁS KVANTITATÍV MÓDSZEREI T. Parázsó Lenke
Kutatás fogalma A kutatás alatt értendő valamilyen tudatosult igény, probléma megoldására irányuló megoldási folyamat, melynek során a jelenséget komplex módon előre átgondolt hipotézis alapján kell tanulmányozni.
Kutatási stratégiák •
Deduktív (analitikus) kutatási stratégia: a
•
Induktív (empirikus) kutatási stratégia: a
forrásokat, dokumentumokat és eddigi tapasztalatokat elemezve fogalmazza meg az elveket , törvényszerűségeket. következtetéseket a tapasztalati mérésekre és azok elemzésére alapozva kell levonni. 2
Kutatási terv
3
Mérés A mérés - megadott szabályok szerinti
hozzárendelést jelent adott dolgokhoz, tulajdonságokhoz. A megadott szabályok alapján kell a mérési skálákat definiálni. A statisztikai mérések során a váltózókat a valós számok jellemzőihez viszonyítva osztályozzuk
A mérési skálák típusai: ◦ ◦ ◦ ◦
Nominális skála Ordinális skála Intervallumskála Arányskála
4
A minta és populáció
Populáció (alapsokaság): azon személyek összessége, akikre a kutatás eredményeit vonatkoztatni szándékozunk.
Reprezentatív
populáció:
körülhatárolt, a reprezentatív megfelelő nagyságú minta.
egységeket
pontosan képviselő,
A minta nagyságát meghatározó tényezők: az eredmények megbízhatósága, a vizsgált
tényezők erőssége, populáció sajátossága – homogén, heterogén, - elemzett változók száma (növeli), kutatási módszerek (gazdasági szempontok).
5
A változó Az egyed vagy a rendszer mérhető tulajdonságai, jellemzői. A változók logikai kapcsolatban álló attribútumokból (kategóriák, értékek) épülnek fel. Megkülönböztetünk függő és független változókat. ◦ A függő változót minden esetben a független változó határozza meg, ok és okozat kapcsolat áll fenn közöttük.
6
A változók típusai_1
Nominális skála: olyan szimbólumok, számok, melyek csak az azonosítást szolgálják. A valós számok egy tulajdonsága sem jellemzi, vagyis még sorba sem rendezhetőek (pl. nemek, beosztás, lakóhely, vallás…) ◦ Szabály a számozások során, hogy nem kaphatnak azonos számot különböző objektumok, de különböző számot azonos objektumok sem. ◦ A statisztikai eljárás során számítható: Az objektum darabszáma Az osztályokban lévő dolgok száma (gyakoriságok) Rangsorban való állítás (médián, kvantilisek, rangkorrelációs együttható). Pl. a tanulók teljesítményéhez pontszám rendelhető.
7
A változók típusai_2
Ordinális skála: olyan szimbólumok, számok, amelyek alkalmassá teszik a vizsgált egyedek közötti sorrendiség felállítását, mely lehet az egynemű adatok rendezésének alapja is. A változó értékeinek különbsége nem értelmezhető. (pl. iskolai végzettség, attitűd skála értéke, a termékek minősítés értékei, osztályzatok…) 8
A változók típusai_3
Intervallumskála: az objektum kvantitatív mérése során a mérhető adatokat vizsgálva az egyedeket jellemző un. méréssel kapott adaitaikat kapjunk. Az intervallum nagyságát a két adat közötti eltérés adja, definiált mértékegységgel rendelkezik, tehát különbségük értelmezhető (születési dátum, életkor…). ◦ Jellemzői: Bármelyik két skálaérték különbsége független a skála nullpontjától. A skálaérték különbségek hányadosa független a mértékegységtől. A hányadosuk objektív összehasonlításra alkalmas, mivel nem tartalmazzák a mértékegység választás és nullpontválasztás önkényét.
9
A változók típusai_4 Arányskála: az egyedek ismérveit numerikusan
kifejező számérték. A változó értékei sorba rendezhetőek, különbségük és arányuk is értelmezhető (pl. testmagasság, súly…) A felsorolt skálatípusok növekvő mennyiségű információt hordoznak az alábbi sorrendben: Nominális
ordinális
intervallum
arány
Megjegyzés: A
különböző skálatípusok feldolgozása más statisztikai módszerrel történik. A magasabb szintű skálatípusok adatai alacsonyabb szintűbe konvertálható, de adatveszteséggel
10
Változó típusok Típus
Változó
Attribútumok
Mennyiségi
Településnagyság (fő)
18...1385...1725243 (egyedi)
Mennyiségi (összevont)
Településnagyság (kategória)
1-0-500 között 2-501-5000 között
Minőségi
Település jogállása
1-község 2-város 3-megyei jogú város
Eloszlás
Régió
1- NyD 2-KD 3-KM
Attitűd
Mennyire ért egyet az alábbi állítással...?
1-teljes mértékben 2-bizonyos mértékben 3-inkább nem 4-egyáltalán nem
Eldöntendő
Van-e autója?
1-van 2-nincs 11
Skálák Mérési szint
Jellemzők
Példák
Nominális
• Teljesség • Kölcsönös kizárás
• Nem • Területi elhelyezkedés (megye, régió)
Ordinális
• Teljesség • Kölcsönös kizárás •Rangsorolhatóság
• Attitűdkérdések (elégedettség, önbesorolás)
Arányskála
•Teljesség • Kölcsönös kizárás •Rangsorolhatóság • Azonos távolságok az attribútumok között • Létező nullpont (intervallumskálánál nem)
• Jövedelem • Fogyasztás (érték és mennyiség)
12
Kutatási hipotézisek 1. A kísérlet, felmérés, vagyis a kutatómunka megkezdése előtt a kutató kialakít egy feltételezést arról, hogy mit vár el a kutatástól. Nélküle a kutatás ösztönös, próbálkozás jellegűvé válhat. A hipotézisben a vizsgálat eredményével kapcsolatos következtetések elfogadhatóságát illetve tarthatatlanságát fogalmazzuk meg. Hipotézis - a kutatási problémára adott feltételezett válasz, azaz a kutató feltételezéseit kifejező kijelentés, a problémában szereplő változókra, azok kapcsolatára vonatkozóan. (A jól megfogalmazott hipotézisek a kutatás vezérfonalát alkotják). 13
Hipotézisek csoportosítása a megfogalmazásuk alapján
Null-hipotézis: - azt feltételezzük, hogy nincs összefüggés a változók között. (pl. a
családi, szakmai kapcsolatok nem hatnak a frissdiplomás elhelyezkedésére).
Alternatív irány nélküli hipotézis: az összefüggést feltételezzük, de annak irányát nem adjuk meg. Alternatív irányt is kifejező hipotézis: megjelöljük a változók feltételezett kapcsolatának irányát. (pl. a családi, szakmai kapcsolatok döntő módon befolyásolják a frissdiplomás elhelyezkedését). 14
A hipotézissel szembeni követelmények Rendelkezzen magyarázó erővel, legyen világos, egyértelmű. A változók kapcsolatát pontosan írja le. A hipotézis legyen igazolható vagy elvethető. Igényeljen megvalósítható módszereket eljárásokat. Támaszkodjon a már meglévő ismeretekre. Adjon választ a kiinduló problémára 15
A kutatás tudományosságának feltételei, etikai kérdései 1. a.
A kutatás résztvevőivel szembe: • A résztvevők minimális kockázata. • résztvevő személyeket érintő előnyök haladják meg a hátrányokat. • A résztvevő személyek biztonságának óvása (anonimitás, személyiség óvása, rejtett kamera kérdése…). • Előzetesen egyeztetett egyetértés alapján történhet a felmérés. • A résztvevő személyekkel való jó kapcsolat kialakítása és a felmérés idejének optimalizálása. 16
A kutatás tudományosságának feltételei, etikai kérdései 2.
A tudóstársadalommal szembe:
b) • • • • •
Szellemi termékek eltulajdonítása pl. idézet hivatkozás nélkül. Kutatási adatok torzítása szándékosan vagy nem megfelelő szakmai ismeret miatt. Hipotézisek utólagos megfogalmazása. Káros adatok elhallgatása. (az egyén negatív befolyásolása). A felmérési adatok tudatos félremagyarázása előre megfontolt céllal.
17
Kutatási stratégiák 1.) Deduktív (analitikus) kutatási stratégia 2.) Induktív (empirizmus) kutatási stratégia
18
Kutatási stratégiák _deduktív 1.) Deduktív (analitikus) kutatási stratégia: A tudományos eredményekre támaszkodva oldjuk meg a problémát. Ezáltal a következtetéseinket az általános elv, törvényszerűség stb. alapján fogalmazzuk meg.
A következtetések forrása:
a)
Forráskutatás b) Dokumentumelemzés c) Tartalomelemzés
19
19
Kutatási stratégiák_induktív a. Induktív: az empirizmusból kiindulva fogalmazzuk meg a tapasztalatokat. ◦ Típusai: Leíró kutatási stratégia ( meglévő helyzet leírása – milyen tanulási nehézséget tapasztalunk…) Feltáró kutatási stratégia ( különböző változók egymáshoz való viszonyának elemzése, az eltérő típusú információhordozók hogyan hatnak az a pályaorientációra…) Kísérleti kutatási stratégia: a független változókat a kísérlet céljának megfelelően tudatosan változtatják.uk.
20
20
Vizsgálati módszerek A vizsgálat többféle kutatási módszert jelent, melyek közös vonása, hogy valakiknek a megkérdezésével kíván ismereteket szerezni.
Fajtái: ◦ A kérdőív (összegyűjthető információk rendszere, a kérdőív készítésének folyamata, adatok feldolgozása) ◦ Az interjú (fajtái, alkalmazott kérdéstípusok. Az interjú előkészítése, lebonyolítása) ◦ Attitűdvizsgálat ( szerepe, attitűdök feltárásának módszerei, érdeklődésvizsgálat) ◦ Szociometria (közvetlen megfigyelés, szociometriai kérdőívek, szociometriai tesztek)
21
21
Kérdőív Az összegyűjthető információk rendszere, a kérdőív készítésének folyamata, adatok feldolgozása. 1.
A kutatás különböző szakaszaiban használható, de fő területe az adatgyűjtés
2.
Használható önállóan vagy más kutatási módszerrel együtt
3.
Segítségével nagy számú populációt vizsgálhatunk
4.
A kitöltés önkéntes , tehát előfordul, hogy nem mindenki fogja visszaküldeni, vagy nem válaszolnak minden kérdésre (50 %).
22
22
Kérdéstípusok Nyílt kérdések ◦ Projektív kérdések 2. Zárt kérdések ◦ Anekdotikus kérdések 3. Félig zárt kérdések 4. Skálába sorolt válaszokat tartalmazó kérdések 1.
23
23
Tudás tesztelése A tesztek az oktatás különböző szakaszaiban jelennek meg.
Teszt: egy sajátos dolgozat, amely célszerűen válogatott feladatokat tartalmaz. A feladatokat gyorsan, egyszerűen, megbízhatóan lehet értékelni. Jellemzői: 1. 2. 3.
Nagy létszám Térben és időben távol eső teljesítmény mérése Oktatási eljárások hatékonyság vizsgálata
24
Tesztek osztályozása -1
Teljesítménytesztek, írásos és szóbeli
Objektív és szubjektív tesztek
tesztek
◦ Objektív, javítókulcsot vagy válaszmodelleket ad. ◦ Szubjektív, tág lehetőséget ad az érdeklődőnek (pl. személyiségvizsgáló teszt)
Standardizált: a teszt anyaga és a kérdések nehézsége is szigorúan ellenőrzött.
◦ Az eredmények értékelését az elővizsgálatok során kialakított normákhoz viszonyítottak (reprezentatív populáció).
Nem standardizált : a teszteket a kutató állítja össze anélkül, hogy statisztikai kontrollt végezne el (csak tág értelemben).
25
25
Tesztek osztályozása_2
Egyéni és kollektív tesztek ◦ Egyéni: egyszerre csak egy ember vehet részt a vizsgálaton (a vezető általában a választandó viselkedését is feljegyzi). ◦ Kollektív: időtakarékosabb és azonos feltételeket ad a kitöltőnek.
Normatív és kritérium alapú tesztek: ◦ Normatív teszt: megmutatja az egyén teljesítményét egy előzetesen megadott külső cél elérésében. ◦ Kritérium teszt: elhelyezi az egyén teljesítményét mások teljesítményéhez képest.
Tesztek tárgya szerinti osztályozás ◦ Intelligencia szerinti teszt ◦ Ismeretteszt ◦ személyiségteszt
26
26
A teszt jóságmutatói Objektivitás:
a teszt tárgyilagos, nem szubjektív. Független attól ki végzi a teszttel a mérést. Validitás:
érvényesség, a teszttel valóban azt mérjük, amire készítettük Reliabilitás:
megbízhatóság. Mérése a reliabilitás mutatókkal.
27
A kutatás eredményeinek összefoglalása tanulmányban
A kutatás célja és rövid áttekintése A szakirodalom áttekintése Ne plagizáljunk!
Ha nyomtatásban megjelent műre hivatkozunk: •A szövegben valamely hivatkozási módszer használata (Harvard vagy számozásos) •Bibliográfiában a részletesen az adatok
28
28
A tanulmány felépítése A kutatás terve és végrehajtása ◦ Ha pl. kérdőíves felvételt alkalmaztunk, szerepeltessük a következőket: A vizsgált populáció A mintavételi módszer A minta nagysága Az adatgyűjtés módszere A válaszolási arány Az adatfeldolgozás és az adatelemzés módszerei ◦ Bármely kutatási módszert is hasonló részletességgel kell leírni.
29
29
A tanulmány felépítése Elemzés és értelmezés ◦ ◦ ◦ ◦ ◦ ◦ ◦
Legyen logikus és áttekinthető Utalás az adott elemzés értelmére céljaira. Az adatok ismertetése. Tekintsük át a legfontosabb eredményeket.. Mutassunk rá ezek jelentőségére Az eredmények értelmezése. Kitekintés, gondolatok a jövő feladataira, kutatási irányaira.
30
30
Az adatelemzés leírása oA
szövegesen elemezni kell az összefüggéseket, adatokkal alátámasztva. (részletes adatok a függelékben) o o o
Biztosítani kell, hogy a tanulmányt elemző kutatók az eredményeket kontrollálhassák. A vizsgálat, kísérlet során alkalmazott módszer ismertetése, mely a megismételhetőség biztosítéka. A táblázatok elhelyezése (szövegben vagy függelékben) Általános szabály: 1. Megmondjuk mi célból mutatjuk be a táblázatot 2. Közöljük a táblázatot 3. Bemutatjuk és értelmezzük
oAz
olvasó tisztelete, ne vezessük félre „kozmetikázott” magyarázattal! minden befolyásolt körülmény bemutatása kutató rámutat a levont következtetések hiányosságaira és bizonytalanságaira oFontos a
stílus, de a legfontosabb a logika, tisztaság és őszinteség. 31
31
Függelék A függelék, olyan adatokat tartalmaz, melyek: o Konkrét információkkal támasztják alá a szövegben leírtakat. o Adatokat közlő, vagy az összegyűjtött adatok elemzését összefoglaló, nyomtatásban meg nem jelent dokumentumok.
Bibliográfia Hivatkozások jegyzéke:
(közvetlen kapcsolat a szövegben idézett gondolat és a mű bibliográfiai adatai között)
o„név-év” (Harvard) módszer esetén a hivatkozás jegyzék a dolgozat végén, és a bibliográfia tételei szerzői betűrendben o Számozásos módszer esetén a hivatkozások jegyzéke a lábjegyzetbe vagy a végjegyzetbe kerül, a tételek növekvő számsorrendben.
32
32
Bibliográfia_2 Felhasznált irodalom bibliográfiája (nincs közvetlen kapcsolat) lehet: o Felhasznált irodalom jegyzéke: • Olvasott művek adatai o Irodalomjegyzék vagy bibliográfia • Vagy a téma teljes szakirodalmát mutatja be • Vagy csak az olvasott művekről tájékoztat o Ajánlott irodalom • Azon irodalmak adatai, melyek a téma bővebb tanulmányozásához szükségesek.
33
33
A statisztikai módszerek típusai A kutatásokban alkalmazott tipikus módszerek: 1.
Leíró statisztika:
Ez a módszer a numerikus (számszerű) információk összegyűjtését, az információk összegzését, jellemzését szolgáló módszereket szolgálja.
Területei: –
Adatgyűjtés
– Adatok ábrázolása – Adatok csoportosítása, osztályozása – Az adatokkal végett egyszerűbb aritmetikai műveletek – Eredmények megjelenítése
34
34
A statisztikai módszerek típusai_2 2. A következtetéses statisztika: a jelenségekre, folyamatokra levont következtetések nem csak a közvetlen vizsgálatokon alapulnak. Ezeket a következtetéseket a matematikai statisztika és a valószínűség számítás alapján kapjuk. A következtetéseket a reprezentatív mintán végzett vizsgálatok alapján a populációra vonjuk le.
35
35
Elemzés
36
Statisztikai adatok A statisztikai adat, mérés vagy számlálás útján keletkező tapasztalati, vagy empirikus szám.
Típusai:
Alapadatok: közvetlenül számlálás vagy mérés
eredményeként kapjuk.
Leszármaztatott adatok: számolás eredményeként
kapjuk (viszonyszámok, átlagok, mutatószámok)
Viszonyszámok: két tényező elemeinek egymáshoz viszonyított aránya (fő és részsokaságok; részsokaságok) Átlagok Mutatószámok: statisztikai adatkategóriák, melyekkel rendszeresen ismétlődő jelenségeket jellemezhetünk; pl. demográfiai mutatók. 37
37
A kérdések két nagy csoportja
Becslések ◦ A populáció (sokaság) tulajdonságai iránt érdeklődünk ◦ Mintavétel után a mintából megbecsüljük a populáció tulajdonságait (eloszlás, elhelyezkedés, szórás) ◦ Meghatározzuk becslésünk megbízhatóságát.
Hipotézis vizsgálatok ◦ ◦ ◦ ◦ ◦
2012.03.02.
Mintát hasonlítunk egy elméleti értékhez Mintákat hasonlítunk egymáshoz Hipotéziseket állítunk fel (H0, H1, azaz 2 vagy több hipotézis) Meghatározzuk, mekkora kockázattal vállalunk hibás döntést Döntünk, hogy melyik hipotézist támasztják alá az adatok. 38
38
Becslések Átlag,
medián… (elhelyezkedés, ) Szórás, átlag hibája, terjedelem… (szóródás, ) Konfidencia intervallum: A konfidencia intervallum értelmezése: Ismételt mintavétel esetén az esetek átlagosan (1– )·100 százalékában igaz az, hogy az így számított intervallum lefedi a keresett sokasági jellemzőt.
◦ Példa: az átlag és annak 95% konfidencia intervalluma a. eset: ha ismert a populáció szórása b. eset: a szórást is becsüljük 2012.03.02.
39
39
Hipotézis vizsgálat (statisztikai) Módszer arra, hogy meghatározzuk, hogy adatok mennyiben konzisztensek egy adott, vizsgált statisztikai hipotézissel
◦ Szakmai vita tárgya a statisztikát kutatók körében, hogyan érdemes vizsgálni a véletlen szerepét, hatását ◦ Több iskola van: klasszikus hipotézis vizsgálatok Bayesianus vizsgálatok, feltételes valószínűségeken alapulnak.
2012.03.02.
40
40
A módszer választáshoz útmutatás
Függ: ◦ ◦ ◦ ◦
A kutatási kérdéstől Kísérleti elrendezéstől A mérés skálájától (nominális, intervallum stb.) Az elemszámtól
Van-e különbség? ◦ 1 csoport ◦ 2 csoport ◦ 3, vagy több csoport
Van-e összefüggés? Mennyi a független változók száma.
2012.03.02.
41
41
Kiinduló feltételezések
A változó mérhető ◦ nominális skálán ◦ ordinális skálán ◦ Intevallum skálán
◦ numerikus skálákon
A null hipotézis vonatkozhat ◦ az eloszlások azonosságára
◦ a mediánok azonosságára ◦ a szóródás azonosságára
A minták száma ◦ Lehet 1, 2, >2
2012.03.02.
42
42
Döntési szabályok Döntési hiba valószínűsége α, és általában α=0,05
1. Az alternatív hipotézis mellett döntve, „elvetjük a nullhipotézist”, a különbség szignifikáns (1- α)x100%-os szinten 2. Ha a nullhipotézis mellett döntünk, vagyis nem tudjuk elvetni a nullhipotézist, a különbség nem szignifikáns (1- α)x100%-os szinten.
2012.03.02.
43
43
Megállapítás Annak bizonyítása, hogy a vizsgálat során megfigyelt különbség egy általunk meghatározott valószínűségi szinten is kimutatható-e.
Amennyiben ez a különbség igazolhatóan nem a véletlen műve, lényeges szignifikáns különbségnek nevezzük. 2012.03.02.
44
44
Statisztikai hibák_1 Első fajta hiba - α : ha szignifikáns különbséget állapítunk meg, de valójában nincs különbség. Az első fajta hiba valószínűsége annak esélye, hogy a tapasztalt különbséget a véletlen okozta, ezért a szignifikancia-szinttel egyenlő az α értéke.
2012.03.02.
45
45
Statisztikai hibák_2 Második fajta hiba - β : ha szignifikáns különbséget nem állapítunk meg, de valójában van különbség. Értéke függ a szignifikancia-szittől, az elemszámtól, a populáció szórásától, stb. a megközelítő értékének kiszámításához a minták átlagai alapján becsült különbséget alkalmazzák
A
meghatározása nehezebb oka, hogy sok (esetleg végtelen sok) alternatív hipotézis létezhet Ha az alternatív hipotézis igaz, akkor annak a null hipotézistől való “távolságától” függ a teszt ereje, és a nagysága.
2012.03.02.
46
46
A hipotézisvizsgálat kimenetele Döntés
H0 igaz
H1 igaz
H0-t elvetjük, és H1-et elfogadjuk
Elsőfajú hiba ( )
Helyes döntés
Nem vetjük el H0-t, (azaz elfogadjuk H0-t) és nem fogadjuk el H1-et
2012.03.02.
Helyes döntés
Másodfajú hiba ( )
47
47
Valószínűségi változók Az adatok eloszlásáról statisztika kiszámításával kapunk pontos képet:
Számtani közép vagy átlag Médián Módusz Variancia Szórás ( a variancia négyzetgyöke)
(Ezt nem csupán a grafikon alapján szemlélhetjük, hanem ellenőrizhető az egymintás Kolmogorov-Smirnov teszt vagy a Shapiro-Wilk (n≤50) teszt alapján) 48
Középérték számítások Számtani átlag Az átlag egy adott diszkrét adatsor jellemző adata, mely az adathalmaz közepén helyezkedik el. Minta átlaga: a számhalmaz átlaga, más szóval - számtani közepe –, az a szám, amelytől az adatok eltéréseinek összege zérus. Az n elemű minta - x1, x2, … xn – átlaga: n
x
x1
x2 ... xn n
xn n 1
n 49
Középérték számítások_2 Módusz: Az adatsorok osztályokba való sorolása esetén a legnagyobb gyakoriságú osztály közepét értjük alatta. Alkalmazása: az ordinális és a nominális változókból álló minta esetén is lehetséges. Jellemzői: ◦
◦
leíró, jósló szerepe van, mivel a tipikus értékre (tipikus eredmény, vélemény) mutat rá. alkalmas az eloszlás gyors jellemzésére is, abban az esetben, ha a mintának egy módusza van
50
Középérték számítások_3 Médián Médián: a nagyság szerint rendezett, vagyis rangsorba állított számhalmaz középső értéke. páratlan számsorok esetén, vagy a két középső érték számtani adatokra nem értelmezhető, de az ordinális adatok esetén igen átlaga, páros számsorok esetén (a nominális ) A vizsgált mintát két azonos részre bontja, rámutat a minta közepére. A szimmetrikus görbék esetén az átlag és a módusz egybeesnek, míg a balra illetve jobbra ferdülő görbék esetén a médián, az átlag és a módusz között veszi fel az értéket. Alkalmazása a nominális skála kivételével minden esetben lehetséges. A vizsgált minta középmezőnyének jellemzésére alkalmas. 51
Középérték számítások_4 átlag
médián
módusz
skála Nominális
nem
nem
igen
ordinális
nem
igen
igen
intervallum
nem
igen
igen
arányskála
igen
igen
igen
52
Gyakorisági sorok Az adatok értéktartományát intervallumokra osztva, az adatokat be kell sorolni. Ügyelni kell arra, hogy az intervallumok alsó és felső határa ne fedje egymást. Az intervallum: a minta legnagyobb és legkisebb eleme által határolt tartománya. A gyakorisági eloszlást az adott csoportok és a hozzájuk rendelhető gyakoriságok alkotják
53
Gyakorisági sorok_2 Az eljárás menete: 1. Első lépésként az értéktartományt egyenlő intervallumú csoportokra kell osztani. 2. A csoportok száma a minta nagyságától függően min10 és max.20 legyen (az adatok maximális és minimális értékeinek intervalluma határozza meg). Ha túl nagy intervallum számot választunk, pontatlan értékmeghatározást okozhat. 3. A csoport intervallumok általában, a minta függvényében 2, 3, 5, 10..
54
Gyakorisági sorok_3 Gyakoriság A gyakoriság egy olyan mutató, amely jellemzi, hogy egy-egy csoportba hány adat tartozik. A gyakorisági eloszlás egy olyan statisztikai mutató, mely arra mutat, hogy a minta elemei hogyan oszlanak meg a különböző csoportok között. A mintára vonatkozóeredményt abszolút gyakorisági elosztásnak nevezzük.
Jele: fa 55
Gyakorisági sorok_4 Relatív gyakoriság A relatív gyakoriság a csoport abszolút gyakoriság értékének a minta elemszámához százalékosan viszonyított értéke.
f%
f a 100 n
A relatív gyakoriság alapján válik lehetővé, hogy különböző, akár eltérő elemszámú mintát vessünk össze. 56
Gyakorisági poligon Intervallum vagy arányváltozók esetén használjuk. Az osztályközepek függvényében kapott pontokat vonalakkal összekötve kapjuk a gyakorisági poligont. Jellemzői: Szimmetrikus: ezen belül megkülönböztetünk o lapított (platykurtic) – az eloszlás értékei viszonylag gyakoriak o csúcsos (leptokurtic) - az eloszlás közepe túlzottan kiemelkedik
Aszimetrikus (skewed), amely esetében lehet az adatok eloszlása jobb vagy bal irányba eltolódott. 57
Kumulatív gyakorisági eloszlás A kumulatív gyakoriság egy olyan statisztikai mutató, mely arra mutat, hogy a mintából mennyi azon elemek száma, amely egy előre meghatározott szintet ér el.
Jele: cf Alkalmazására arra keressünk választ, hogy. egy adott mintában mennyi azon tanulók száma, akik egy adott teljesítményt elértek, és mennyi azon tanulók száma akik ezt a határt túlteljesítették. 58
Szóródás mértékei Terjedelem Egy számhalmaz terjedelme alatt értjük a legnagyobb és a legkisebb szám közötti különbséget.
Jele: Ri ◦
Felmerül a kérdés: mi értelme van e paraméter meghatározásának? Abban az esetben, ha a szélső értékek fontosak a mérés szempontjából. 59
Szóródás mértékei_4 Átlagos eltérés A minta számtani átlagától (közepétől) való távolsága n
x AE
xi
j 1
n 60
Változók közötti kapcsolat kereszttáblák Kereszttábla – két nominális vagy ordinális változó együttes eloszlásának ábrázolása egy közös táblán.
Kérdések: Van-e kapcsolat? Milyen erős? Milyen irányú
Pl. Anyagi helyzet és mentális problémák kapcsolata.
61
Kereszttáblák- Chi-négyzet A kereszttáblákat két változó összefüggésének vizsgálatához használjuk.
Alkalmazása során azt a hipotézist ellenőrizzük, hogy a sor és oszlopváltozók függetlenek-e.
Nem jól használható, ha bármelyik cellában a peremeloszlások alapján várható érték (expected value) kisebb 1-nél, vagy a cellák több mint 20%-ban ez az érték kisebb mint 5.
2012.03.02.
62
62
Kovarancia Két adathalmaz adatpárjai közötti eltérések szorzatának átlagát számolja megadja
két egymástól különböző változó együttmozgását.
n
számú x, y értékpár esetében a minta kovarianciája az alábbi képlettel határozható meg: n i
( xi
x ) ( yi
y)
n
63
63
Korrelációs együttható A korrelációszámítást többdimenziós minták vizsgálatakor, a minta elemeihez rendelt adatok közötti összefüggés feltárását szolgálja. A korrelációs együttes szignifikancia vizsgálata megmutatja, hogy egy adott, többdimenziós minta esetén a változók között talált összefüggés mekkora valószínűséggel valódi és nem a véletlen műve.
rxy rtáblázat
a két minta korrelációs összefüggése az oszlopnak megfelelő valószínűséggel nem a véletlen műve, vagyis általánosítható
rxy rtáblázat
a korrelációs összefüggés mértékét nem lehet általánosítani, vagyis a mintában észlelt kapcsolat a véletlen műve
64
64
A korrelációs együttható jellemzői
◦ Független változók esetében a korrelációs együttható értéke 0, ◦ A függvénykapcsolatban lévő (nem sztochasztikus) változók esetében a korrelációs együttható értéke 1.
65
Korrelációs együttható Korrelációs együttható értéke és a változók közötti kapcsolat ◦ 0,9 – 1
rendkívül szoros
◦ 0,75 – 0,9 szoros
◦ 0,5 – 0,75 érzékelhető ◦ 0,25 – 0,5 laza
◦ 0,0 – 0,25 nincs kapcsolat
66
Megállapítás Annak bizonyítása, hogy a vizsgálat során megfigyelt különbség egy általunk meghatározott valószínűségi szinten is kimutatható-e. Amennyiben ez a különbség igazolhatóan nem a véletlen műve, lényeges szignifikáns különbségnek nevezzük.
2012.03.02.
67
67
Egymintás T-próba Az egymintás t-próbát akkor kell alkalmazni, ha a mérési eredmények ugyanazon személyek különböző felméréséből származnak, vagyis önkontrolos felmérések során.
t
'
z s
n
Ahol:„
z
- számtani középértékét
„s” - különbségértékek szórása 2012.03.02.
68
68
Egymintás T-próba_2 A vizsgálat során a számított t-értéket össze kell hasonlítani a t táblázat értékével: Ha
t’ > t táblázat a különbség nem a véletlen műve, Ha t’ < t táblázat a különbség a véletlen műve 2012.03.02.
69
69
T-próba értelmezése A szoftverek többsége tartalmazza a t értékét, azonban nem a tkritikus értéket adja, hanem a mintából számolt t értéktől jobbra eső, t-eloszlás alatti területet, melyet p-nek nevezünk.
„p” -
elnevezései lehetnek: Prob-value, Signif of t, Sig.Level, stb. annak valószínűsége, hogy egy másik kiszámolt t legalább olyan messze van 0-tól, mint a most megfigyelt t, ha H0 igaz.
„p”-
2012.03.02.
70
70
Döntés a „p” alapján Döntés a „p” és az „α” összehasonlítása alapján: •
Ha p < α, akkor H0-t elvetjük és azt mondjuk, hogy a különbség szignifikáns (1- α)x100%-os szinten
•
Ha p > α, akkor H0-t elfogadjuk
2012.03.02.
71
71
Döntés a „p” alapján_2 „p” < 0,01 nagyon erős a Ho elleni bizonyíték
0,01 ≤ „p” < 0,05 mérsékelt a Ho elleni bizonyíték
0,05 ≤ „p” < 0,10 szuggesztív a Ho elleni bizonyíték
0,10 ≤ „p” 2012.03.02.
kicsi, vagy nem reális a Ho elleni bizonyíték
72
72
A kétmintás t-próba A kétmintás t-próbát akkor alkalmazzuk, ha arra keresünk választ, hogy a két egymástól függetlenül vett minta származhat-e azonos átlagú populációból. A kétmintás t-próba azonban csak akkor végezhető el, ha a két csoport variancia értékei között nincs „nagy” különbség, melyre az Fpróba vizsgálat ad választ a variancianégyzetek hányadosának elemzésével. Ha Fszámolt
73
73
A kétmintás t-próba A kétmintás t-próba számolás menetének számszerűsítése a következő összefüggés alapján történik:
t
x n
y m
( x xi ) 2 i 1
(y i 1
n m 2
y)2
n m n m
A szignifikanciavizsgálat szabadságfoka szf = n+m-2. A kapott eredmény alapján értékelhetjük a vizsgált minták által elért teljesítményt 2012.03.02.
74
74
A kétmintás t-próba_2 A kétmintás t-próba azonban csak akkor végezhető el, ha a két csoport variancia értékei között nincs „nagy” különbség Erre az F-próba vizsgálat ad választ a variancianégyzetek hányadosának elemzésével.
2012.03.02.
75
75
Az F-próba Az F-próba a variancia négyzetek hányadosa. Képlete:
F
s12 2 s2
A fenti képlettel kontrollcsoportos vizsgálat során egy n1 és n2 elemű minta esetében alkalmazható a hipotézis igazolására, melynek szórásértékei s1 és s2 ahol, s1 > s2.
2012.03.02.
76
76
Az F-próba_2 A számított F értéket a táblázat értékeivel összevetve, a következő lehetőségekkel kell számolnunk:
Ha Fszámolt>Ftáblázat, akkor a vizsgálatban résztvevő minták varianciája lényegesen különbözik egymástól, a kétmintás tpróba elvégzésére nincs lehetőség. Ebben az esetben más módszert kell keresni, pl. a Welch-próbát. (hasonló mint a kétmintás t-próba, de nem követeli meg a varianciák egyenlőségét)
Ha Fszámolt
2012.03.02.
77
77
Az eredmény általánosíthatósága a populációra
A feltételezett összefüggés általánosításához az szükséges, hogy a korrelációs együttható abszolút értéke nagyobb legyen, mint a 95%-os valószínűségi szinthez (adott szabadságfokon) tartozó érték.
Abban az estben, ha 99% vagy 99,9%-os értéken végezzük az összevetést, a elemzett kapcsolat még nagyobb valószínűséggel általánosítható.
78
Jellemző esetek Két változó között minél szorosabb az összefüggés, annál inkább megközelíti a korrelációs együttható értéke az 1-t. Ha a minta két változója azonos irányban változik, abban az esetben pozitív, ha ellentétes irányban, akkor negatív a korrelációs összefüggés. Lineáris függvénykapcsolatban lévő (nem sztochasztikus) változók esetében a korrelációs együttható értéke 1.
79
Jellemző esetek_2 Minél lazább az összefüggés két változó között, annál közelebb van a korrelációs együttható értéke a 0-hoz. Független változók esetében a korrelációs együttható értéke = 0 A két változó látszólag egymástól függetlenül változik, ebben az esetben korrelálatlanságról beszélünk A korrelációs együttható az egyszerű, közel lineáris stochasztikus kapcsolat esetében használható statisztika Egy bonyolultabb függvénygörbe mentén elhelyezkedő értékek kapcsolatának leírására nem alkalmas.
80
Varianciaalízis A kétmintás t-próba általánosításának tekinthető. Variancia-analízisnek nevezzük azt a statisztikai eljárást, mely több egydimenziós minta ugyanazon változója közötti különbség szignifikancia szintjének összehasonlítását teszi lehetővé.
81
81
Többváltozós populációk statisztikai elemzései A fejezet a többváltozós populációk statisztikai elemzési módszerével ismerteti meg három alfejezetben az olvasót, az alábbiakban felsoroltak alapján:
faktoranalízis diszkiminancia analízis főkomponens analízis klaszteranalízis
82
82
Különbözőségvizsgálat Jelentős-e a különbség Adatfajták, minták száma
Intervallum skála
Ordinális skála
Nominális skála
Egy
Egymintás t-próba Wilcoxon-próba
Kereszttábla elemzés ϰ2 - próba
Kettő
Kétmintás t – próba F próba
Mann-Whitney próba
Kereszttábla elemzés ϰ2 - próba
több
Variaanalízis (ANOVA)
Kruskal-Wallispróba
Kereszttábla elemzés ϰ2 - próba
83
Az eredmények ábrázolása
Egyéni eredmény
Histogram
REL 9
6
12
6
15 18
5
24
5
Missing
4
Frequency
Frequency
4
3
3
2
2
1
1 Mean = 12,9 Std. Dev. = 5,515 N = 20
0 0
5
10
15
REL
20
25
30
Mean = 12,9 Std. Dev. = 5,515 N = 20
0 0
5
10
15
20
25
30
REL
Cél: az eredmények áttekinthetőbbé és szemléletesebbé tétele 84
Gyakorisági poligon (görbe)
A gyakorisági sor osztályközepek alapján szerkesztett vonaldiagramja 85
Hisztogram_1 A hisztogram a rendezett minta intervallumaiba eső elemek számát ábrázolja. a hasábok szélessége – a változó tartománya A hasábok magassága – gyakoriság
Az oszlopok száma, ha: Túl sok – túlrészletezett Túl kevés elnagyolt 86
Hisztogram_2
Szimmetrikus, normál
Szimmetrikus, csúcsos
87
Hisztogram_3
bimodális
88
Hisztogram_4
Balra ferdülő hisztogram 89
Hisztogram_5
Jobbra ferdülő hisztogram 90
Boxplot grafikon
A boxplot: mennyiségi ismérv szerinti eloszlást a kvartiliseken keresztül érzékelteti. A xmin és xmax értéket összekötő szakaszra épül az alsó és a felső kvartilisek által közbezárt doboz. A középső vonal a medián. A boxplot rámutat: •mennyire sűrűsödnek a megfigyelések a középső 50%-os intervellumban •Mennyire ferde az eloszlás 91
A középértékek elhelyezkedése a különböző gyakorisági eloszlásokban Az eloszlás szimmetriájának mérésére szolgál az un. ferdeség vagy eltoltság – skewness, értékei: egy mérőszám, mely arra ad választ, hogy a szóródás a centrumtól jobbra vagy balra lapul-e, ill. sűrűségfüggvényt jelez.
A ferdeség - Skewness o Ha (-), balra ferdül a kiugrás o (+), jobbra o (0), szimetrikus
0
Lapultság - Kurtois o csúcsos, leptokurtic o lapos, platykurtic
0 92
Középértékek elhelyezkedése a különböző eloszlási gyakoriságokban_1
Szimmetrikus eloszlás Skewness = 0 93
Középértékek elhelyezkedése a különböző eloszlási gyakoriságokban_2
Szimmetrikus – kétpúpú eloszlás Bimodális eloszlás (két módusza van) 94
Középértékek elhelyezkedése a különböző eloszlási gyakoriságokban_3
Balra ferde (negatív irányban eltolt eloszlás)
Skewness = (-) 95
Középértékek elhelyezkedése a különböző eloszlási gyakoriságokban_4
Jobbra ferde – pozitív irányban eltolt eloszlás
Skewness = (+) 96
Különböző csúcsossági értéket - kurtois - mutató normális eloszlások
Mezokurtikus eloszlás Skewness = 0 97
Csúcsossági értékek
A csúcsossági értékek arra mutatnak, hogy az eloszlás közepe mennyire emelkedik ki. Platikurtikus – lapos : 0 Leptokurtikus eloszlás – csúcsos: > 0
98
Különböző szórású normális eloszlások (szórások átlaga = 0)
Csúcsosság: az értékek milyen mértékben tömörülnek az átlag körül 99
Klaszteranalízis A klaszteranalízis a megfigyelések (vagy a változók) osztályozásának dimenziócsökkentő módszere. ◦ A diszkriminancia analízissel szemben itt nincsenek előre megadott osztályok, a feladatunk éppen ezeknek a létrehozása. ◦ A klasztertendencia vizsgálat célja annak eldöntése, hogy az adatok mutatnak-e hajlamosságot a természetes csoportosulásra. Ha az adataink hasonlóságot mérő mátrix elemei ordinális skálán mért értékek, akkor a véletlen gráfelmélet nyújt matematikai eszközt a csoportosulási tendenciák megállapítására.
A klaszterezés az objektumok osztályba sorolását jelenti, vagyis az objektumok halmazának (X) részhalmazokra való felbontását.
100
Irodalom 1.
Varga Lajos (2002): Kvantitatív módszerek a pedagógiai kutatásban. BMF BGK kari jegyzet.
2.
Varga Lajos (szerk., 2006): Kutatás-módszertan I. Bevezetés a pedagógiai induktív kutatás módszereibe és útmutató a szakdolgozat elkészítéséhez. BME, Bp.
3.
Schmercz István - Varga Lajos (2008): Kutatás-módszertan II. Bevezetés a pedagógiai deduktív és szociálpszichológiai kutatás módszereibe. BME, Bp.
4.
Falus Iván - Ollé János (2000): Statisztikai módszerek pedagógusok számára. Okker K., Bp.
5.
Falus Iván - Ollé János (2008): Az empirikus kutatások gyakorlata. Nemzeti Tankönyvkiadó, Budapest
6.
Falus Iván (szerk., 2002): Bevezetés a pedagógiai kutatás módszereibe. Műszaki K., Bp.
7.
Fercsik János (1982): Pedagometria. OOK, Veszprém
8.
Horváth György (2004): A kérdőíves módszer. Műszaki K. Bp.
9.
Babbie, Earl (2003; 6. átd. kiad.): A társadalomtudományi kutatás gyakorlata. Balassi K., Bp. 2003
10.
Lengyelné Molnár Tünde, Tóvári Judit: Kutatásmódszertan . –Eger: Líceum kiadó, 2001.
101