Research Centre for Organisation Studies
Fasen in het onderzoeksproces Gegevensbestand
Controleren gegevens Bewerken gegevens
Analyseren gegevens
Interpreteren resultaten
Nieuwe vragen?
ja
Onderzoeksverslag K ATH O LI EK E U N I VERSI TEI T
1
9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Bestand opmaken Variabelen definiëren: kies “variable view” (links onderaan scherm):
K ATH O LI EK E U N I VERSI TEI T
2
9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Bestand opmaken Data invoeren: kies “Data view”:
K ATH O LI EK E U N I VERSI TEI T
3
9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Soorten variabelen Nominale variabelen: kengetallen toekennen; een ‘one-to-one relationship’ vb: de eigenschap ‘geslacht’
Ordinale variabelen: ranggetallen toekennen; een orderelatie vb: onderwijsniveau
Interval variabelen intervallen vergelijken vaste afstanden tussen opeenvolgende meetwaarden geen natuurlijk nulpunt temperatuur (Celsius & Fahrenheit)
Ratio variabelen vaste afstanden tussen opeenvolgende meetwaarden wel een natuurlijk nulpunt K ATH O LI EK E U N I VERSI TEI T
4
vb.: leeftijd (jaren) 9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Bestand opmaken Nieuwe variabele invoegen data insert variable
Nieuwe waarneming invoegen data insert case
Opzoeken van een waarneming data Go to case
Opzoeken van een variabele Utilities variables K ATH O LI EK E U N I VERSI TEI T
5
9 november 2006
Go to © Johan Maes
Research Centre for Organisation Studies
Bestand controleren Enkele beschrijvende statistieken Analyze Descriptive statistics
Frequencies geeft frequenties, percentielen, gemiddelde, mediaan,.. geeft ‘plots’ mogelijk om foutieve waarden op te sporen Descriptives Explore mogelijk om extreme waarden op te sporen
K ATH O LI EK E U N I VERSI TEI T
6
9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Variabelen berekenen en indelen in klassen (1) Transform menu berekenen van variabelen: compute
K ATH O LI EK E U N I VERSI TEI T
7
9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Variabelen berekenen en indelen in klassen (2) Voor indelen in klassen: recode Voor herdefiniëren van variabelen Transform Recode into same variable into different variables
Voorbeeld: leeftijdscategorieën opmaken K ATH O LI EK E U N I VERSI TEI T
8
9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Selecteren van waarnemingen Data Split file
voorbeeld: analyses voor mannen en vrouwen
Data select cases
voorbeeld: analyse voor mensen die de laatste drie jaar niet gepromoveerd zijn K ATH O LI EK E U N I VERSI TEI T
9
9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Kruistabellen (1) Crosstabs inzicht in verband tussen twee variabelen nominale of ordinale variabelen continue variabelen voorafgaand in klassen indelen (hercoderen) eenvoudig (iedereen begrijpt ze) en krachtig (veel info zonder noodzaak van
geavanceerde statistiek)
Werkwijze Analyze ➥ Descriptive Statistics ➥ Crosstabs Onafhankelijke variabele als rijvariabele, afhankelijke als kolomvariabele
K ATH O LI EK E U N I VERSI TEI T
10
(laat toe getallen onder elkaar te vergelijken) Cells: meer info opnemen in tabel (b.v. kolompercentage) Statistics: b.v. berekenen van Chi-kwadraattoets Format: uitzicht tabel veranderen Layer: voor elke waarde van een variabele afzonderlijke kruistabel 9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Kruistabellen (2) Crosstabs: Cell display Expected: verwachte of theoretische frequentie die voor chi-
kwadraattoets wordt gebruikt Row - Column - Total Residuals: unstandardized residual geeft waargenomen frequentie minus verwachte frequentie
Chi-kwadraattoets Nagaan of twee nominale variabelen onafhankelijk zijn Nulhypothese: er is geen verband tussen variabelen Geeft weinig info over richting of sterkte van verband K ATH O LI EK E U N I VERSI TEI T
11
9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Kruistabellen (3): Kengetallen Correlations Pearson: Lineair verband dat bij interval en ratio
geschaalde variabelen wordt gebruikt Spearman: correlatiecoëfficiënt voor ordinale variabelen
Overige Contingency coëfficiënt, Phi and Cramer’s V: mate van
verband tussen twee nominale variabelen Gamma: mate van verband tussen twee ordinale variabelen Kendall’s Tau-b: alleen voor vierkante tabellen Eta: afhankelijke variabele interval, onafhankelijke nominaal of ordinaal K ATH O LI EK E U N I VERSI TEI T
12
9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Beschrijven van groepen: Means (1) Termen onafhankelijke variabele: variabele die de groepsindeling
bepaalt (nominale of ordinale variabele) afhankelijke variabele: variabele waarvoor kengetallen worden opgevraagd (ratio of interval variabele)
Bewerking Analyze ➥ Compare means ➥ Means Dependent list, independent list Output Standaard (entire population) means, standaarddeviatie, aantal obs. Via options: ook andere kengetallen
Multiple layers K ATH O LI EK E U N I VERSI TEI T
13
Om subgroepen verder op te splitsen 9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Beschrijven van groepen: Means (2) One sample t-test informatie over representativiteit van een steekproef vaststellen of het steekproefgemiddelde overeenkomt met een
andere waarde (een norm, een nationaal gemiddelde, …) nulhypothese: steekproefgemiddelde is gelijk aan ander gemiddelde
T-test nagaan of de gemiddelden van twee groepen gelijk zijn, en dit
K ATH O LI EK E U N I VERSI TEI T
14
bij onafhankelijke groepen (Analyze ➥ Compare means ➥ Independent samples t-test) nulhypothese: gemiddelden zijn gelijk bij afhankelijke groepen (b.v. echtparen - vergelijken scores van man en vrouw; longitudinaal onderzoek): paired samples ttest2006 9 november © Johan Maes
Research Centre for Organisation Studies
Beschrijven van groepen: Means (3) T-test output Levene’s test voor gelijkheid van varianties nulhypothese stelt dat variantie in beide groepen gelijk is; bij zeer lage p-
waarde wordt deze hypothese verworpen
2-tail sig geeft overschrijdingskans weer (two tailed
significance) nulhypothese stelt dat gemiddelden niet verschillen; bij lage
overschrijdingskans wordt nulhypothese verworpen K ATH O LI EK E U N I VERSI TEI T
15
9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Variantie-analyse (1) Gemiddelden van verschillende groepen worden vergeleken verschil met t-toets: > 2 groepen verschil met regressie: er wordt geen veronderstelling gemaakt over
het functioneel verband H0: de gemiddelden van de verschillende groepen zijn gelijk H1: de gemiddelden van de verschillende groepen zijn ongelijk Analyze - Compare Means - One Way Anova Voorbeeld
K ATH O LI EK E U N I VERSI TEI T
16
We gaan na of mensen die aan meer personen leiding geven gemiddeld verschillen in leeftijd van mensen die aan minder personen leiding geven H0: de gemiddelde leeftijd verschilt niet per ‘leidingsgroep’ H1: de gemiddelde leeftijden per leidingsgroep zijn ongelijk afhankelijke variabele: leeftijd factor: leiding
9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Variantie-analyse (2) Post Hoc LSD: vergelijkt gemiddelde van elke groep met elke andere groep m.b.v. een ttoets (kans dat significante verschillen gevonden worden neemt toe met aantal vergelijkingen)
Bonferroni corrigeert voor nadeel van LSD (strenger)
K ATH O LI EK E U N I VERSI TEI T
17
9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Regressie-analyse Lineair verband schatten tussen een afhankelijke variabele en één of meer onafhankelijke variabelen:
Y=β0+β1X+e interval of ratio variabelen een uitzondering hierop is als gebruik gemaakt wordt van dummy variabelen (waarde 0 en 1) Analyze Regression Linear
voorbeeld: K ATH O LI EK E U N I VERSI TEI T
18
invloed van anciënniteit en voltijds/deeltijds contract op binding 9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Oefeningen Vergelijk de gemiddelde leeftijd Ga na of de anciënniteit in de van mannen en vrouwen functie verschilt tussen mensen die al dan niet bedrijfsopleiding maak 4 anciënniteitscategorieën hebben gekregen (anciënniteit in het bedrijf) aan: doe een regressie-analyse met 0-5 jaar als afhankelijke variabele 5-15 jaar jobanciënniteit en als 15-25 jaar onafhankelijke anciënniteit in > 25 jaar bedrijf, voltijds/deeltijds contract maak dummyvariabelen aan voor en functieniveau de verschillende functieniveaus bereken de gemiddelde anciënniteit in de job voor mensen die geen leiding geven K ATH O LI EK E U N I VERSI TEI T
19
9 november 2006
© Johan Maes
Research Centre for Organisation Studies
Hulp en praktische achtergrondinfo … Hand-out introductiesessie Help functie SPSS Huizingh, E. (2002). Inleiding SPSS 11.0 voor Windows en data
entry. Academic Service: Schoonhoven (beschikbaar in RBIB) Howitt, D. & Cramer, D. (2004). Statistiek met SPSS 11.0 voor Windows. Pearson Education. ((te) eenvoudig; nuttig als inleiding op loglineaire analyse en factoranalyse) (beschikbaar in bib ETEW) Kerr, A., Hall, H. & Kozub, S. (2003). Doing statistics with SPSS. Sage: London. (beschikbaar in bib ETEW) SPSS thuis of op kot: studentenversie (beperkt tot 100 var./2500 cases!!): beschikbaar bij LUDIT (35
K ATH O LI EK E U N I VERSI TEI T
20
euro) Full version: 300 euro http://ludit.kuleuven.be/software/campuslicenties/cspss.html 9 november 2006
© Johan Maes