1. ALAPFOGALMAK
Deduktív stratégia: Az általános elvekből, törvényszerűségekből, vagy egyéb tudományos megállapításból indul ki a kutató.
Induktív stratégia: A konkrét tapasztalatokból kiindulva az adatok elemzésével jut el a kutató az általános következtetésig.
Az eredmények ábrázolása Cél: az eredmények áttekinthetőbbé és szemléletesebbé tétele. Gyakorisági poligon: az x tengelyen az adott csoport középértékét, az y tengelyen a csoportokhoz tartozó középértékeket kell feltüntetni. Hisztogram: a vízszintes tengelyen a valóságos csoporthatárok, a függőleges tengelyen a az adott csoportok gyakorisága
Histogram
Egyéni eredmény
REL
9
6
12
6
15
5
5
4
4
Frequency
Frequency
18 24
3
2
Missing
3
2
1
1 Mean = 12,9 Std. Dev. = 5,515 N = 20
0 0
5
10
15
20
25
Mean = 12,9 Std. Dev. = 5,515 N = 20
0
30
0
REL
5
10
15
20
25
30
REL
Histogramok A második kép anormál eloszlással összevetve
Charts-t. ablakban választható: Bar Chart(s) Pie charts Histogram(s) Gyakorisági poligon
minden változó értéket külön-külön vesz figyelembe Kördiagram Hisztogramot készít
Intervallum vagy arányváltozók esetén használjuk. Az osztályközepek függvényében kapott pontokat vonalakkal összekötve kapjuk a gyakorisági poligont.
Jellemzői: o Szimmetrikus: ezen belül megkülönböztetünk o lapított (platykurtic) – az eloszlás értékei viszonylag gyakoriak o csúcsos (leptokurtic) - az eloszlás közepe túlzottan kiemelkedik 1
o Aszimetrikus (skewed), amely esetében lehet az adatok eloszlása jobb vagy bal irányba eltolódott.
Az eloszlás jellemzői: Ferdeség – egy mérőszám, mely arra ad választ, hogy a szóródás a centrumtól jobbra vagy balra lapul-e. A ferdeség - Skewness
Ha (-), balra ferdül a kiugrás (+), jobbra (0), szimetrikus
Lapultság - Kurtois
0 csúcsos, leptokurtic 0 lapos, platykurtic
Szórás: Szórás alatt értjük az adatok mintaátlagától vett négyzetes átlagát (középértéke). A nevező nem más, mint a szabadságfok, mely a független elemek számát mutatja meg. A szórásnégyzet A minta szórásnégyzete rámutat erre a tényezőre, hogy a minta adatai hogyan helyezkednek el a középérték körül. Mivel az eltérések pozitív és negatív irányban is lehetséges, ezért a különbségek négyzetre emelése optimalizálja az eredményt. Képletben kifejezve: s
xi
2
x
2
n
A mérések során azonban nem csak a minta, de végső eredményként az adott populáció szórásnégyzetére kell megbecsülni. Mivel a populáció középértéke pontosan nem meghatározható, a mintavétel miatt ( a minta számtani középértéke eltérést mutat a populáció számtani középértékétől). A populáció becsült szórásnégyzetét (varianciáját) nagyobb pontossággal becsülhető, ha a nevező értékét eggyel csökkentjük. A populáció szórásnégyzete (varianciája): s
xi
2
x
2
n 1
A populáció szórása a pozitív előjelű négyzetgyök értékével egyenlő.
s
xi n 1
x
2
s2
Az adatok sztochasztikus kapcsolatát a minőségi és mennyiségi ismérvek alapján (un. vegyes kapcsolatok szorosságát) az átlag és a szóródás számítások felhasználásával 2
határozhatjuk meg. A kapcsolat vizsgálatának feltétele, hogy ugyanazt a sokaságot legalább egy minőségi és egy mennyiségi ismérv szerint csoportosítsuk. A szórás típusai a heterogén mintában: Teljes szórás, ami a sokaság elemeinek a főátlagtól való eltérése. Külső szórás, ami a részátlagoknak a főátlagtól való eltérése Belső szórás, amely a sokaság elemeinek a részátlagtól való eltérése s2
sB2
sK2
Rangkorreláció A kapcsolat szorosságát a képlettel definiált ún. Spearman-féle rangkorrelációs együtthatóval mérjük. n
6 RS
1
(X
Y )2
i 1
n3
n
Korreláció Kutatásaink során gyakori feladat, hogy egy-egy elem tulajdonságait, jellemzőit több adattal leírva, azok kapcsolatát, köztük lévő összefüggéseket kell elemezni. (pl a tanulók társadalmi helyzete, a különböző területen elért eredményessége, tanulási körülménye közötti kapcsolatot szeretnénk feltárni. A korrelációszámítást többdimenziós minták vizsgálatakor, a minta elemeihez rendelt adatok közötti összefüggés feltárását szolgálja. A korrelációs együttható két fontos tulajdonsága: o független változók esetében a korrelációs együttható értéke 0, o míg függvénykapcsolatban lévő (nem sztochasztikus) változók esetében a korrelációs együttható értéke 1. Jellemző esetek: o Két változó között minél szorosabb az összefüggés, annál inkább megközelíti a korrelációs együttható értéke az 1-t. Ha a minta két változója azonos irányban változik, abban az esetben pozitív, ha ellentétes irányban, akkor negatív a korrelációs összefüggés. o Minél lazább az összefüggés két változó között, annál közelebb van a korrelációs együttható értéke a 0-hoz. o A két változó látszólag egymástó függetlenül változik, ebben az esetben korrelálatlanságról beszélünk A korrelációs együttható Az együttható értéke tehát -1 és +1 között változik, ahol az előjel a változás irányára mutat, míg az abszolút érték a korreláció erősségét jelenti. Képlete: Korrelációs együttható értéke 0,9 - 1 0,75 – 0,9
Változók közötti kapcsolat Rendkívül szoros szoros 3
0,5 – 0,75 0,25 – 0,5 0,0 – 0,25
érzékelhető laza Nincs kapcsolat
A korrelációs együttható szignifikanciája A korrelációs együttes szignifikancia vizsgálata megmutatja, hogy egy adott, többdimenziós minta esetén a változók között talált összefüggés mekkora valószínűséggel valódi és nem a véletlen műve. A mintához tartozó elemek szabadságfoka: szf=n-2 A feltételezett összefüggés általánosításához az szükséges, hogy a korrelációs együttható abszolút értéke nagyobb legyen, mint a 95%-os valószínűségi szinthez (adott szabadságfokon) tartozó érték. Abban az estben, ha 99% vagy 99,9%-os értéken végezzük az összevetést, a felfedett kapcsolat még nagyobb valószínűséggel általánosítható.
Esetek:
rxy rtáblázat a rxy rtáblázat
két minta korrelációs összefüggése az oszlopnak megfelelő valószínűséggel nem a véletlen műve, vagyis általánosítható a korrelációs összefüggés mértékét nem áltatlánosítható, vagyis a mintában észlelt kapcsolat a véletlen műve
A kovariancia A mennyiségi ismérvek közötti kapcsolat tényét és irányát az ún. kovariancia segítségével is kifejezhetjük. n
( xi C xy
x )( y i
y)
i 1
n Ez az ismérvértékek együtt-mozgását kifejező fontos mérőszám kétváltozós elsőrendű centrális momentumnak tekinthető
A lineáris korrelációs együttható Amennyiben a két ismérv között lineáris kapcsolat áll fenn, (pontjai megközelítőleg egy képzeletbeli egyenesre esnek), akkor a képlettel definiált ún. lineáris korrelációs együttható segítségével számszerűsíthetjük a kapcsolat erősségét és irányát. r
C xy x
y
A lineáris korrelációs együttható abszolút értéke 1-nél nem nagyobb. A 0-hoz közeli értéke a kapcsolat lazaságára vagy éppen hiányára utal. Az r negatív értékéből a két mennyiségi ismérv ellentétes irányú változására, míg pozitív értékéből azonos irányú együtt-mozgására következtethetünk. 4
Hipotézis vizsgálat A kutatások célja, a vizsgált minta által reprezentált vizsgálati eredmények populációra való általánosíthatóságának bizonyítása. A hipotézis egy adott minta alapján választ keres arra, hogy a minta becsült várható értéke – μ - egy megadott szignifikancia szinten azonosnak tekinthető-e az előre feltételezett értékkel. Jele: H. Nullhipotézis (jele: Ho) A hipotézis statisztikai vizsgálata során megfogalmazzuk azt a kiindulási feltételezést, hogy a két minta által reprezentált alapsokaság paraméterei között nincs eltérés, azaz a vizsgált minták ugyanazt a populációt reprezentálják. Ha a próbamutató empirikus értéke ≥ a kritikus értéknél, akkor elvetjük a nullhipotézist. A két minta eredménye szignifikánsan különbözik egymástól. Ha a próbamutató empirikus értéke < a kritikus értéknél, akkor nincs elég indok a nullhipotézis elvetésére. A vizsgált esetek között nem mutatható ki eltérés, azonban ez nem jelenti, hogy a két módszer egyenértékű. Nagyobb minták esetén nem zárható ki, hogy szignifikáns eltérést fogunk tapasztalni a módszerek között. Alternatív hipotézis (H1), mely a különbség meglét feltételezi, vagyis azt, hogy a populáció átlaga különbözik egy adott értéktől. Azt a valószínűséget, amely esetén H0-t elvetjük p-vel jelöljük és szignifikanciaszintnek nevezzük.
Értékei p<0,05, p<0,01 és p<0,001. Ehhez a szignifikancia szintekhez tartozó próbastatisztika A korreláció szignifikanciája: választ ad arra, hogy mennyire bízhatunk egy mintából számolt korrelációs együtthatóban? A két minta szignifikanciája függ: o a két minta számtani középértékének különbségétől, o a minták szórásától, o A minták elemeinek számától.
5
Feladatok I. Adattípusok, adatábrázolások, változók jellemzése (Gyakoriságok, hisztogram vagy oszlopdiagram készítése) A minta egy adott változó jellemzőinek meghatározása: Descriptive Statistics Summarize Frequenties
Descriptive Statistics Summarize Descriptive
A minta egy adott változóinak csoportjáról a jellemzők meghatározása: Descriptive Statistics Summarize Explore
Descriptive Statistics Compare Means/Means
A minta adatainak szeparálása analízis céljából: Data Split File
A Skewness (ferdeség), az eloszlás ferdeségére utal. Ha az értéke = 0 szimmetrikus az eloszlás Minél nagyobb pozitív szám, annál jobban ferde az eloszlás jobbra Minél kisebb negatív szám, annál inkább ferde balra A ferdeség az átlag és a médián viszonyára is utal. A Kurtosis (lapultság): a normálisokhoz képest csúcsosabb eloszlások esetén ez a lapultság pozitív laposabb eloszlások esetén negatív normális eloszlás esetén = 0 A Statistics ablak magyarázata: Despcrivtíve (leíró statisztika) jelentése Plot ablak mutatja mi van kijelölt állapotban Factor list: valamely karegorikus változó kijelölése bevitele szerint történik a kijelölt vizsgálat
6
1. Feladat: A mérés során az alábbi adatokat kaptuk: 68, 69, 70, 70, 70, 71, 71, 71, 72, 72, 72, 73, 73, 74, 75 A adatok sorban fiú, lány, fiú… Adjunk válasz az alábbi kérdésekre: Elemszám Átlag Standart deviáció Standard error Medián Minimum Maximum Az eloszlás mennyire szimmetrikus és miért? Megoldás: Analize Descriptíve Statistics Frequenties Variables ablakba kerül a „nem” Display Frequenties tables – kipipálva /Statistics beállítása: sum kipipálva és = Mean, std.Dev, Medan, Minimum, Maximum Charts és Format (organise output by variables) Eredmény:
Eredmény a nemek szerinti megoszlásban Képezzünk csoportot a fenti mintából és számítsuk ki a szóródásokat nemenként
Valid fiu lány Total
Frequenc y 8 7 15
Percent 53,3 46,7 100,0
Valid Percent 53,3 46,7 100,0
Cumulative Percent 53,3 100,0
Grafikusan:
7
Histogram
12
10
Frequency
8
6
4
2 Mean = 1,47 Std. Dev. = 0,516 N = 15
0 0,5
1
1,5
2
2,5
nem
Eloszlás görbe a adatok szerinti megoszlásban: N
Valid Missing Std. Error of Mean - átlagos szórási hiba Std. Deviation - szórás Variance - szórásnégyzet Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum
15 0 ,486 1,882 3,543 ,142 ,580 -,219 1,121 7 68 75 1071
Eloszlásgörbe: Histogram
Frequency
3
2
1
Mean = 71,4 Std. Dev. = 1,882 N = 15
0 66
68
70
72
74
76
adat
8
Feladat Végezzük el az előző feladatot nemenkénti összehasonlításban A kiértékelés menetét a változók csoportja szerint kell megvalósítani. Az eljárás menete: Data Split file „Repeat analisis for each group” – nyíllal át kell vinni a „nem” nevű változót a „Groups Based on” ablakba /Sort file by grouping variables OK A fenti parancssor hatására lefutó műveletsor nemenként külön-külön végzi el a leíró statisztikai számítást a program, a fentiekben leírt műveletsor megismételve.
Eredmény: Fiú: Valid Missing Std. Error of Mean Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum
8 0 ,754 2,134 4,554 ,171 ,752 ,339 1,481 7 68 75 571
Histogram nem: fiu 2,0
1,5
Frequency
N
1,0
0,5
Mean = 71,38 Std. Dev. = 2,134 N=8
0,0 68
69
70
71
72
73
74
75
adat
A fiúk gyakorisági görbéje: A görbe ferdesége (Skewness), jobbra hajló közel szimetrikus (0,171) Lapultsága (Kurtois), > 0 tehát csúcsos (0,339)
A lányok gyakorisági görbéje: A görbe ferdesége (Skewness), jobbra hajló közel szimetrikus (0,169) Lapultsága (Kurtois), > 0 tehát csúcsos (-0,638), laposabb, mint a lányoké.
9
Lány: Valid Missing Std. Error of Mean Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum
7 0 ,649 1,718 2,952 ,169 ,794 -,638 1,587 5 69 74 500
Histogram nem: lány 2,0
1,5
Frequency
N
1,0
0,5
Mean = 71,43 Std. Dev. = 1,718 N=7
0,0 68
69
70
71
72
73
74
75
adat
Az eredeti állapot visszaállítása: Data Split File Analyse all Cases OK
10
Hipotézisvizsgálat Feladat
2003 testmagasság 170 Fiúk 175 165 185 148 190 188 178 179 185 169 186 176 182 Lányok 156 158 175 166 181 175 170 168 148 155 168
2004 súly 59 55 65 62 51 70 80 40 42 71 75 77 63 54 45 43 61 55 63 59 57 67 50 53 166
testmagasság 188 186 178 199 167 199 195 188 189 197 187 193 186 199 166 160 176 168 180 176 171 169 155 160 170
súly 65 64 73 77 65 81 85 50 53 82 81 82 72 62 48 59 63 66 77 72 65 63 50 61 59
Számoljunk mintabeli jellemzőket a testsúly adatokból. A súly jellemzése 2004 –ben: Analyze Descriptíve Statistics Frequenties Variables ablakba kerül a „súly” Display Frequenties tables – kipipálva /Statistics beállítása: kipipálva és = Mean, std.Dev, Medan, Minimum, Maximum
11
Hipotézisek: Ho: a hallgatók testsúlyának átlaga 70 kg Halt: a hallgatók testsúlya eltér a 70 kg – tól. Eredmény: 2004-ben a hallgatók súlya N Valid 25 Missing 5 Mean - Átlag 67,00 Std. Error of Mean - átlagos 2,172 szórási hiba Median - Medián 65,00 Mode - módusz 65 Std. Deviation – szórás 10,859 Elemszám: 30 Abban az esetben, ha a testsúlyok normális eloszlású populációból származnak, adjunk 95%os és 99%-os konfidencia intervallumot a populáció átlagára. A konfidencia intervallumok kiszámítása az „Egymintás T próba” segítségével történik: Analyze Compare Means One sample T Test Test variable = súly_j Test value = 0 Option/Confidence interval 95%
95%-os konfidencia intervallum:
2004-ben hallgatók súlya
N
Mean
Std. Deviation
Std. Error Mean
25
67,00
10,859
2,172
a
Test Value = 0
t
df
Sig. tailed)
Mean (2- Differenc e
95% Confidence Interval of the Difference Lower
Upper 12
2004-ben hallgatók súlya
a 30,850
24
,000
67,000
62,52
71,48
99%-os konfidencia intervallum:
2004-ben hallgatók súlya
N
Mean
Std. Deviation
25
67,00
10,859
Std. Error Mean 2,172
a
Test Value = 0
2004-ben hallgatók súlya
t
df
Sig. tailed)
30,850
24
,000
Mean (2- Differenc e
99% Confidence Interval of the Difference Lower
Upper
60,93
73,07
a 67,000
A válaszok a kérdésekre: A konfidencia intervallum: Statisztikai jellegű mérési, észlelési eredmények közelítő megbízhatóságának, valószínűségének alsó határa. A testsúly értéke mint 95 és 99%-on is eltér a 70 kg-tól, a sárga felületek mutatják a kapott értékeket: 95 és 99%-os Confidence Interval of the Difference:- Lower (alsó) és Upper (felső)
Harmadik lépésként a Test value értéket 70-re állítva nézzük meg az eredményeket: 2004-ben hallgatók súlya
a 30,850
24
,000
67,000
62,52
71,48
95%-os konfidencia intervallum:
2004-ben hallgatók súlya
N
Mean
Std. Deviation
25
67,00
10,859
Std. Error Mean 2,172
a
Test Value = 70 13
2004-ben hallgatók súlya
t
df
Sig. tailed)
-1,381
24
,180
Mean (2- Differenc e
95% Confidence Interval of the Difference Lower
Upper
-7,48
1,48
a -3,000
99%-os konfidencia intervallum:
2004-ben hallgatók súlya
N
Mean
Std. Deviation
25
67,00
10,859
Std. Error Mean 2,172
a
Test Value = 70
2004-ben hallgatók súlya
t
df
Sig. tailed)
-1,381
24
,180
Mean (2- Differenc e
99% Confidence Interval of the Difference Lower
Upper
-9,07
3,07
a -3,000
Mivel mindkét esetben a a p értéke nagyobb mint 0,05 ezért 95%-ban a nullhipotézist kell elfogadnunk, míg az alternatív hipotézis 86,19%-ban teljesül.
3. Paired –Sample T Test Hasonlítsuk össze a testsúlyváltozást. Van-e szignifikáns különbség a két testsúlyátlag között?
Nullhipotézis: nincs különbség Alternatív hipotézis: van különbség. Analyze Compare Means Paired -Sample T Test Paired variables a 2003 és 2004-es testsúlyok Option/Confidence interval 95% Hasonlítsuk össze a testsúlyok átlagait a nemek szerint: van-e szignifikáns különbség a fiúk és a lányok testsúlyainak átlagai között? 14
Paired Samples Test Paired Differences
Mean Pair 1
2003-ban a hallgatók súlya - 2004-ben a hallgatók súlya
-8,080
Std. Deviation
Std. Error Mean
6,096
1,219
95% Confidence Interval of the Difference Lower Upper -10,596
-5,564
t -6,627
df
Sig. (2-tailed) 24
,000
t = -6,627 df = 24 p = 0,000 Mivel p <0,001 ezáltal értéke kisebb, mint 0,05, nagyon erős a Ho elleni bizonyíték, ezért az alternatív hipotézist fogadjuk el, azaz a két súly különbsége eltér a 0-tól.
15
4. Kétmintás T próba Feladat: Hasonlítsuk össze a testsúlyok adatait nemek szerint. Van-e szignifikáns különbség a fiúk és a lányok testsúlyainak átlagai között? Nullhipotézis: a fiúk és a lányok testmagassága azonos. Alternatív hipotézis: a fiúk és a lányok testmagassága eltérő. A próba feltétele: a két csoport varianciái egyenlőek. A varianciák azonosságának ellenőrzése: F-test F próba menete: Analyze Compare Means Independent-Sample T Test Test variables a 2003 és 2004-es testmagasságok Option/Confidence interval 95% Independent Samples Test Levene's Test for Equality of Variances
F 2004-ben a hallgatók testmagassága
Equal variances assumed Equal variances not assumed
Sig. ,097
,758
t-test for Equality of Means
t
df
Sig. (2-tailed)
Mean Difference
95% Confidence Interval of the Difference Lower Upper
Std. Error Difference
6,217
23
,000
21,084
3,391
14,069
28,100
6,340
22,795
,000
21,084
3,326
14,201
27,968
A táblázatból kapott értékek: F = 0,097 P = 0,758 nagyobb, mint 0,05 tehát a varianciák azonosnak tekinthetők. A T próba menete: Analyze Compare Means Independent-Sample T Test Test variables a 2003 és 2004-es testmagasságok Group variables (1 2) Option/Confidence interval 95%
2004-ben hallgatók testmagassága
a hallgatók neme a fiú lány
N 14
Mean 189,36
Std. Deviation 8,958
Std. Error Mean 2,394
11
168,27
7,656
2,308 16
Independent Samples Test Levene's Test for Equality of Variances
F 2004-ben a hallgatók testmagassága
Equal variances assumed Equal variances not assumed
A fiúk átlaga= 189,36 A lányok átlaga = 168,27 t = 6,217 szabadság foka = 23 p = 0,000
Sig. ,097
,758
t-test for Equality of Means
t
df
Sig. (2-tailed)
Mean Difference
Std. Error Difference
95% Confidence Interval of the Difference Lower Upper
6,217
23
,000
21,084
3,391
14,069
28,100
6,340
22,795
,000
21,084
3,326
14,201
27,968
szórása = 8,958 szórása = 7,656
elemszáma = 14 elemszáma = 11
Magyarázat: Mivel számításaink alapján a varianciák azonosnak tekinthetőek, ezért a t-próba eredményét az Equal sorban találjuk. Ennek alapján a nullhipotézisünk, hogy a fiúk és a lányok testmagassága azonosnak tekinthető elvetjük és az alternatív hipotézist fogadjuk el.
17
Varianciaanalízis A varianciaanalízist más szóval szórásanalízisnek nevezzük. Kettőnél többcsoportos kísérlet vizsgálatánál alkalmazzuk, több minta szórás négyzetének összehasonlításán alapuló statisztikai eljárás. Feladat annak eldöntése, hogy van-e szignifikáns eltérés a mintaátlagok között, miközben feltételeztük, hogy azonos varianciából vettük a mintákat. Ezekben az esetekben kettőnél több egydimenziós minta elemeinek tulajdonságát mérő változók állnak rendelkezésre. Az elemzés során a váltózók közötti különbözőség statisztikai kimutatása, a szignifikanciaszint vizsgálatával, a kétmintás t-próba számításával történik. Ennek során minden minta minden mintával való összehasonlításához, az összes változó közötti kapcsolatot felméréséhez, sokszor kell a műveletet elvégezni. Variancia-analízisnek nevezzük azt a statisztikai eljárást, mely több egydimenziós minta ugyanazon változója közötti különbség szignifikancia szintjének összehasonlítását teszi lehetővé
Kidolgozott feladat, melyet egytényezős variaanalízissel elemezhető: A hallgatók tanulási szokásainak eredményesség mérését 5 csoportban kívánjuk összehasonlítani, feltételezve, hogy a minták egy populáció tagjai. No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
A csoport 89 69 86 86 86 88 74 101 101 104 81 99 95 92 94 69 75 75 92 75
B csoport 70 83 83 85 47 100 79 88 78 73 88 68 67 83 97 100 89 86 90 95
C csoport 107 80 98 101 102 109 109 103 92 95 92 108 95 109 81 107 116 100 105 84
D csoport 99 102 114 93 119 117 119 98 94 93 110 114 88 93 92 105 94
E csoport 103 90 103 113 77 69 100 102 83 91 107 95 85 82 89 102 82 79 95 97 18
A variaanalízis SPSS szoftverrel történő meghatározása egyszerűen végrehajtható, ehhez azonban az adatokat az alábbi táblázat elve szerint kell átrendezni: teljesítmény pont1 … pont1 … pont1 … Pont1 … pont1 ….
csoport 1 1 2 2 3 3 4 4 5 5
A vizsgálat menete: Analyze Compare Means One-Way ANOVA Depend list = teljesítmény (pontszám) Factor = vizsgált csoportok Options/Statistics Descriptive Post Hoc/LSD, sign level: 0,05 OK Eredmény, mely rámutat a külső és a belső variancia értékekre, az egyes minták szabadság fokaira, F-értékeire és a szignifikancia szintjeire. ANOVA
Between Groups
Sum of Squares 5481,119
df 4
Mean Square 1370,280 126,650
Within Groups
11651,768
92
Total
17132,887
96
F 10,819
Sig. ,000
Döntés: p = 0,000 A belső és a külső variancia értékének hányadosa eredményezi az F értékét, mely jelen esetben 10,819 a szignifikancia szint p=0,000, amely azt jelenti, hogy a varianciák különbsége 100%-os valószínűséggel nem a véletlennek köszönhetőek.
19
Faktoranalízis Az elemzések során gyakran kettőnél több változót kell figyelembe venni az adott probléma megoldása során. Több változónak nagy elemszámú mintán történő mérése során óriási adathalmazt egy egységként kezelni bonyolult feladat. A kapcsolatok feltárásánál több, egymástól is függő változó kapcsolat lehetőségét elemezve kell a feladatot megoldani, melynek elemzése és az eredmények értelmezése a faktoranalízis segítségével történhet.
Példa a faktoranalízissel megoldható problémára: Abban az esetben, ha összefüggést keresünk az iskolai szakismeret és annak alkalmazási lehetőségi között 97 hallgató kérdőíves felméréssel. Az áttekinthetetlen mennyiségű váltózók indokolják a háttérben meglévő meghatározó tényezők alapján a vizsgálat folyamatának egyszerűbbé tétele a faktoranalízissel valósítható meg. szaktárgy
szakma
előadás
iskola
szakkör
2
2
1
2
0
2
2
1
2
2
1
2
1
2
0
2
2
1
2
0
0
2
0
2
1
2
1
1
2
1
2
0
1
2
1
2
2
2
2
2
2
2
1
2
1
2
2
1
2
1
1
2
0
2
0
2
2
1
2
2
Első lépésként állítsuk elő a korrelációs mátrixot, mely jellemzi a változócsoportokat. A változók közötti korreláció kiszámítása. Analyze Correlate Bivariate Variables = vizsgált csoportok =szakma…) Correlation Coeffitient (kipipáljuk) Test of Significant = Two-tailed OK Az eredmény: 20
szaktárgy
szakma szakma
Pearson Correlation Sig. (2-tailed) N
szaktárgy
Pearson Correlation Sig. (2-tailed) N
1
előadás
iskola
szakkör
-,225
,723(**)
.(a)
,293
,483
,008
.
,355
12
12
12
12
12
-,225
1
-,071
.(a)
-,046
,826
.
,887
,483 12
12
12
12
12
,723(**)
-,071
1
.(a)
,427
,008
,826
.
,167
12
12
12
12
12
.(a)
.(a)
.(a)
.(a)
.(a)
.
.
.
12
12
12
12
12
,293
-,046
,427
.(a)
1
,355
,887
,167
.
12 12 12 ** Correlation is significant at the 0.01 level (2-tailed). a Cannot be computed because at least one of the variables is constant.
12
iskola
Pearson Correlation Sig. (2-tailed) N
előadás
Pearson Correlation Sig. (2-tailed) N
szakkör
Pearson Correlation Sig. (2-tailed) N
.
12
A korrelációs táblázat rámutat arra, hogy 5x5-ös korrelációs mátrixra van szükség, mely a faktoranalízissel valósítható meg. Lépései: Analyze Data Reduction Factor Variables = teljesítmény (pontszám) Factor = vizsgált csoportok Variables OK Ezt követően kattintsunk a Descriptives gombra, a megjelenő párbeszéd ablakból vegyünk ki minden pipát.
1. ábra A Descriptíve párbeszédablak beállítása
A Continue gombra kattintva visszatérünk az előző párbeszéd panelra és az OK gombra kattintva, kapjuk a statisztikai eredményeket táblázatba foglalva. 21
A kapott értékek alapján a komunalitás közepes, mivel nincs közel az 1-hez
22
A kapott eredmények érvényességét az Analyze főmenü Data Reduction parancsához tartozó Factor almenü Extraction parancsgomb kiválasztásával kapjuk:
2. ábra Az eredmények érvényesség vizsgálata
Továbbiakban a Descriptive KMO ablak pipálásával történik:
23
3. ábra KMO beállítás
Az eredményt, mellyel az 5x5 ös mátrix 2x2-es mátrixá alakítottuk, eredményeit az alábbi táblázat mutatja be:
24
Lexikon Cum. Percent df freguency Konfidencia intervallum
kurtois Leptokurtic Lower and Upper Interval of the Difference mad Mean Median Missing cases Mode Percentiles platykurtic Range range Sign. (2-tailed) Skewness Std Deviation Std Error Mean Std. Deviation Sum t Valid Valid cases Variance Variance
kumulált százalékos gyakoriság az eloszlás szabadságfoka gyakoriság Statisztikai jellegű mérési, észlelési eredmények közelítő megbízhatóságának, valószínűségének alsó határa. Lapultság csúcsos az alsó és a felső szignifikancia intervallum értékei Median absolute deviation átlag középső elem átlaga hiányzó adat Módusz (legnagyobb gyakoriságú érték) lapított a legnagyob és a legkisebb adat különbsége tartomány biztonsági szint, p=0,000, vagyis a kapott eredmények 100%-is szignifikánsak ferdeségaszimetrikus szórás átlagos szórási hiba St. Szórás azaz variancia pozitív négyzetgyöke adatok összege a számított t értéke Érvényes adat Tényleges adatok száma változó szórásnégyzet
25
Lexikon azonos körülmények között mindig ugyanúgy játszódik le az esemény; Determinisztikus a feltételek ismeretében a jelenség további jellemzői egyértelműen meghatározottak(pl. szabadesés, stb) Adat egy szimbólum, mely a hozzárendelt értékek bármelyikét felveheti Alternatív hipotézis a különbség meglét feltételezi, vagyis azt, hogy a populáció átlaga (H1), különbözik egy adott értéktől. Ha a próbamutató empirikus értéke ≥ a kritikus értéknél, akkor elvetjük a nullhipotézist. A két minta eredménye szignifikánsan különbözik egymástól. Ha a próbamutató empirikus értéke < a kritikus értéknél, akkor nincs elég indok a nullhipotézis elvetésére. A vizsgált esetek között nem mutatható ki eltérés, azonban ez nem jelenti, hogy a két módszer egyenértékű. Nagyobb minták esetén nem zárható ki, hogy szignifikáns eltérést fogunk tapasztalni a módszerek között Arányskála Diszkrétnek változó Értéktartomány Érvényesség– validitás Folytonos változó Független változó Függő változó Gyakoriság Gyakorisági eloszlás
Intervallumskála
Itemek
Kísérlet Korreláció szignifikanciája Kutatás
Az egyedek ismérveit numerikusan kifejező számérték. A változó értékei sorba rendezhetőek, különbségük és arányuk is értelmezhető (pl. testmagasság, súly…) értéke véges, van egy legkisebb egysége A minta legnagyobb és legkisebb eleme által határolt intervallum. annek a kritériumnak való megfelelés, hogy a kutatás a valóban a vizsgálat tárgyára irányul-e. értéke végtelen, bármilyen kis skálán mérhető A függő változótvárakozásaink szerint megmagyarázó változó. két változó együttes hatásának eredményeképp módosul. A két változó ok-okozati összefüggésben áll. egy olyan mutató, amely jellemzi, hogy egy-egy csoportba hány adat tartozik. Egy olyan statisztikai mutató, mely arra mutat, hogy a minta elemei hogyan oszlanak meg a különböző csoportok között. A mintára vonatkozóeredményt abszolút gyakorisági elosztásnak nevezzük. Az objektum kvantitatív mérése során a mérhető adatokat vizsgálva az egyedeket jellemző un. Méréssel kapott adatokat kapjunk.Az intervallum nagyságát a két adat közötti eltérés adja, definiált mértékegységgel rendelkezik, tehát különbségük értelmezhető (születési dátum, életkor…) A tesztek legkisebb önállóan értékelhető egységét jellemző adat. Populáció vagy más néven sokaságnak nevezzük azt a vizsgált csoportot, amely a vizsgált egyedek összességét foglalja magába. A populáció egyedei a statisztikai elem meghatározott hipotézisből kiindulva új, rejtett összefüggések, törvényszerűségek feltárására alkalmas módszer. választ ad arra, hogy mennyire bízhatunk egy mintából számolt korrelációs együtthatóban valamilyen tudatosult igény, probléma megoldására irányuló 26
Kutatások célja Lapított görbe
megoldási folyamat, melynek során a jelenséget komplex módon előre átgondolt hipotézis alapján tanulmányozzuk a vizsgált minta által reprezentált vizsgálati eredmények populációra való általánosíthatóságának bizonyítása. a szélső eloszlás adatok gyakoriak
Médián
A nagyság szerint rendezett, vagyis rangsorba állított számhalmaz középső értéke, páratlan szám A minta a populáció részhalmaza, amelyen a kísérletet végezzük sorok esetén, vagy a két középső érték számtani átlaga, - páros számsorok esetén (a nominális adatokra nem értelmezhető, de az ordinális adatok esetén igen)
Megbízhatóságreliab ility:
Ennek a kritériumnak való megfelelés azt jelenti, hogy a kutatás annak megismétlése, ismételt alkalmazása során is az eredetivel egyező illetve kevéssé eltérő eredményt szolgáltat. Mérése a varianciák összehasonlításával történik a populáció részhalmaza, amelyen a kísérletet végezzük. A számhalmaz átlaga, más szóval - számtani közepe –, az a szám, amelytől az adatok eltéréseinek összege zérus egy számhalmaz módusza a legnagyobb gyakorisággal rendelkező érték. A módusz nem feltétlenül létezik, és ha igen nem biztos, hogy egyetlen érték képviseli. Olyan szimbólumok, számok, melyek csak az azonosítást szolgálják. A valós számok egy tulajdonsága sem jellemzi, vagyis még sorba sem rendezhetőek (pl. nemek, , beosztás, lakóhely, vallás…)
Minta Minta átlaga Módusz Nominális skála
Objektivitás Ordinális skála
Populáció Relatív gyakoriság Szignifikanciaszint Szignifikáns eltérés Szórás Sztochasztikus
Ennek a kritériumnak való megfelelés azt jelenti, hogy mennyire tárgyilagos, vagyis független a mérés során kapott eredmény az adott módszert alkalmazó, a felmérést végző személytől Olyan szimbólumok, számok, amelyek alkalmassá teszik a vizsgált egyedek közötti sorrendiség felállítását, mely lehet az egynemű adatok rendezésének alapja is. A változó értékeinek különbsége nem értelmezhető. (pl. iskolai végzettség, attitűd skála értéke, a termékek minősítés értékei, osztályzatok…) azon egyének (dolgok) összessége, akikről (amikről)információt szeretnénk kapni A csoport abszolút gyakoriság értékének a minta elemszámához százalékosan viszonyított értéke. Az a valószínűség, amely esetén H0-t elvetjük p-vel jelöljük és nevezzük. Értékei p<0,05, p<0,01 és p<0,001. Ehhez a szignifikancia szintekhez tartozó próbastatisztika értékek az un. kritikus értékek. Ha a próbastatisztika értéke nagyobb/egyenlő egy adott szignifikancia szinthez (pl. p<0,05) tartozó kritikus értéknél, akkor H0-t elvetjük és azt mondjuk, hogy az p<0,05-ös szinten az adatok mintaátlagától vett négyzetes átlagát. más szóval véletlen a jelenségek kimenetele, azonos körülmények között is nem egyértelműek (pl. pénzfeldobás, lottó stb.) 27
28