SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7:
Oefenen I Hieronder volgen de SPSS uitvoer en de antwoorden van de opgaven van Stap 7: Oefenen I. Daarnaast wordt bij elke opgave de SPSS procedure en de syntax (de SPSS ‘commando taal’) weergegeven aan de hand waarvan je kunt nagaan welke SPSS procedures gebruikt zijn. Bij sommige opgaven is niet direct relevante uitvoer weggelaten
7.1
************************************************************************ Voorzie de variabelen sex, hearaid en agegrp1 van de juiste value labels. ************************************************************************ • SPSS Procedure: Ga naar de Variable View en definieer de value labels in de kolom Values •
SPSS Syntax
ADD VALUE LABEL sex
1 2 / hearaid 1 2 / agegrp1 1 2 3 .
"male" "female" "yes, has a hearing aid" "has no hearing aid" "55-64 years" "65-74 years" "75+ years"
EXECUTE.
7.2
************************************************************************ Onderzoek de variabele age middels de procedure Explore voor mannen en vrouwen afzonderlijk. Wat is de gemiddelde leeftijd van de mannen? Wat is de variantie van de leeftijd van de vrouwen? ************************************************************************ • SPSS Procedure:
<Explore> Dependent list: age; Factor List: sex [OK] •
SPSS Syntax met uitvoer:
EXAMINE VARIABLES=age BY sex /PLOT BOXPLOT STEMLEAF /COMPARE GROUP /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.
Uitwerkingen
Stap 7. Oefenen I
1
Explore sex Descriptives age
sex male
Statistic Mean
73.51
95% Confidence Interval for Mean
female
Lower Bound Upper Bound
5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Mean 95% Confidence Interval for Mean
Lower Bound Upper Bound
Std. Error 1.255
70.99 76.03 73.60 74.00 77.172 8.785 57 92 35 15 -.116 -1.032 73.36 71.02
.340 .668 1.166
75.70
5% Trimmed Mean Median Variance
67.949
Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis
8.243 56 87 31 13 -.433 -.854
73.49 75.00
.337 .662
age Stem-and-Leaf Plots age Stem-and-Leaf Plot for sex= male Frequency 2,00 9,00 5,00 10,00 6,00 11,00 5,00 1,00 Stem width: Each leaf:
Stem & 5 6 6 7 7 8 8 9
. . . . . . . .
Leaf 77 022334444 55557 0011223344 778889 00000011234 55555 2
10 1 case(s)
age Stem-and-Leaf Plot for sex= female
Uitwerkingen
Stap 7. Oefenen I
2
Frequency
Stem &
2,00 8,00 6,00 7,00 15,00 9,00 3,00 Stem width: Each leaf:
5 6 6 7 7 8 8
. . . . . . .
Leaf 69 00011224 557999 1123344 555577778888999 001122333 667
10 1 case(s)
• Antwoorden: De gemiddelde leeftijd van de mannen is 73.51 De variantie van de leeftijd van de vrouwen is 67.949 7.3
************************************************************************ Definieer 998 als missende waarde voor de variabele hearaid. ************************************************************************ • SPSS Procedure: Ga naar de Variable View en definieer de missende waarde in de kolom Missing •
SPSS Syntax:
MISSING VALUES hearaid (998). EXECUTE.
Uitwerkingen
Stap 7. Oefenen I
3
7.4
************************************************************************ Gebruik de procedure Frequencies om te onderzoeken hoeveel procent van de proefpersonen een hoorapparaat heeft (wel hoorapparaat: hearaid=1, geen hoorapparaat: hearaid=2). Wat is het verschil tussen de percentages in de kolom ‘Percent’ en de kolom ‘Valid Percent’? ************************************************************************ • SPSS Procedure: Variable(s): hearaid [OK] •
SPSS Syntax met uitvoer:
FREQUENCIES VARIABLES=hearaid /ORDER= ANALYSIS .
Frequencies hearaid
Valid
Missing Total
yes, has hearing aid has no hearing aid Total 998
Frequency 2 96 98 1 99
Percent
2.0
Valid Percent 2.0
97.0 99.0 1.0 100.0
98.0 100.0
Cumulative Percent 2.0 100.0
• Antwoorden: 2% van de proefpersonen heeft een hoorapparaat Het verschil tussen de percentages in de kolom ‘Percent’ en de kolom ‘Valid Percent’: ‘Percent’ is het percentage berekend t.o.v. alle proefpersonen (hier (2/100)*100%), ‘Valid Percent’ is het percentage berekend t.o.v. alle proefpersonen zonder ontbrekende waarden voor de betreffende variabele, personen met user-missing values en system missing values worden dus niet meegenomen in de berekening (hier (2/99)*100%). 7.5.1
************************************************************************ Maak een kruistabel van hearaid en agegrp1. Zorg dat er alleen aantallen in deze kruistabel afgedrukt worden, dus geen percentages. ************************************************************************ • SPSS Procedure: Row(s): hearaid Column(s): agegrp1
Uitwerkingen
Stap 7. Oefenen I
4
•
SPSS Syntax met uitvoer:
CROSSTABS /TABLES=hearaid BY agegrp1 /FORMAT= AVALUE TABLES /CELLS= COUNT /COUNT ROUND CELL .
Crosstabs hearaid * agegrp1 Crosstabulation Count
hearaid
1 yes, has a hearing aid 2 has no hearing aid
Total
1 55-64 years 1 24 25
agegrp1 2 65-74 years 0 25 25
3 75+ years 1 47 48
Total 2 96 98
Beantwoord onderstaande vragen: a. Hoeveel personen in de oudste leeftijdsgroep hebben een hoorapparaat? 1 b. Hoeveel personen zitten er in de oudste leeftijdsgroep? 48 c. Bereken nu hoeveel procent van de oudste leeftijdsgroep een hoorapparaat heeft? (1/48) *100% = 2.1% d. Bereken ook hoeveel procent van de personen zonder hoorapparaat tot de jongste leeftijdsgroep behoort? (24/96) * 100% = 25% e. Probeer uit de tabel af te leiden of er een relatie is tussen het hebben van een hoorapparaat en de leeftijdscategorie. Er lijkt geen relatie te zijn, maar opgemerkt moet worden dat er in de hele groep maar 2 mensen met een hoorapparaat zijn (waarvan 1 in de jongste en 1 in de oudste leeftijdsgroep)
7.5.2
************************************************************************ Vraag dezelfde kruistabel aan maar nu met alle rij, kolom en totaal percentages. Ga na waar de antwoorden van c. en d. terug te vinden zijn in de tabel. ************************************************************************ • SPSS Procedure: Row(s): hearaid Column(s): agegrp1 [Cells]: Vink alles aan onder ‘Percentages’ (Row, Column, Total) •
SPSS Syntax met uitvoer:
CROSSTABS /TABLES=hearaid BY agegrp1 /FORMAT= AVALUE TABLES /CELLS= COUNT ROW COLUMN TOTAL /COUNT ROUND CELL .
Uitwerkingen
Stap 7. Oefenen I
5
Crosstabs hearaid * agegrp1 Crosstabulation
hearaid
yes, has hearing aid
has no hearing aid
Total
7.6
55-64 years 1
agegrp1 65-74 years 0
75+ years
1
2
% within hearaid % within agegrp1
50.0%
.0%
50.0%
100.0%
4.0%
.0%
2.1%
2.0%
% of Total Count % within hearaid
1.0% 24
.0% 25
1.0% 47
2.0% 96
Count
Total
25.0%
26.0%
49.0%
100.0%
% within agegrp1 % of Total Count
96.0% 24.5%
100.0% 25.5%
97.9% 48.0%
98.0% 98.0%
25
25
48
98
% within hearaid % within agegrp1 % of Total
25.5% 100.0% 25.5%
25.5% 100.0% 25.5%
49.0% 100.0% 49.0%
100.0% 100.0% 100.0%
************************************************************************ Maak middels de procedure Frequencies eerst een bar chart en daarna een histogram van de variabelen age en agegrp1 zonder dat er in de uitvoer frequentietabellen verschijnen. Beslis voor beide variabelen apart welke grafiek de data het beste weergeeft, en waarom? ************************************************************************ • SPSS Procedures: Variable(s) : age agegrp1 Uitvinken 'Display frequency tables' [Charts] Aanvinken 'Bar charts' [Continue] [OK] Variable(s) : age agegrp1 Uitvinken 'Display frequency tables' [Charts] Aanvinken 'Histogram' [Continue] [OK] •
SPSS Syntax met uitvoer:
FREQUENCIES VARIABLES=age agegrp1 /BARCHART FREQ /ORDER= ANALYSIS .
Uitwerkingen
/FORMAT=NOTABLE
Stap 7. Oefenen I
6
Frequencies Bar Chart age
8
Frequency
6
4
2
0 56 57 59 60 61 62 63 64 65 67 69 70 71 72 73 74 75 77 78 79 80 81 82 83 84 85 86 87 92
age
agegrp1
50
Frequency
40
30
20
10
0 55-64 years
65-74 years
75+ years
agegrp1
FREQUENCIES VARIABLES=age agegrp1 /HISTOGRAM /ORDER= ANALYSIS .
Uitwerkingen
/FORMAT=NOTABLE
Stap 7. Oefenen I
7
Frequencies Histogram age
15
Frequency
10
5
Mean =73,43 Std. Dev. =8,472 N =99 0 50
60
70
80
90
100
age
agegrp1
50
Frequency
40
30
20
10 Mean =2,23 Std. Dev. =0,831 N =99 0 0,5
1
1,5
2
2,5
3
3,5
agegrp1
• Antwoord: De bar chart (staafdiagram) geeft de variabele agegrp1 het beste weer omdat deze variabele slechts uit een beperkt aantal categorieën bestaat (=categorische variabele). Elke staaf in zo’n bar chart vertegenwoordigd daarbij één categorie. Een bar chart voor de variabele age is daarentegen al snel onoverzichtelijk, er verschijnen namelijk evenveel staven als er leeftijden zijn. Voor zo’n continu variabele is een histogram het meest geschikt. Hierbij wordt de variabele (age) eerst in een aantal klassen verdeeld en wordt de frequentie per klasse op de y-as gepresenteerd. De vorm van het histogram is afhankelijk van het gekozen aantal klassen en de klassenbreedte.
Uitwerkingen
Stap 7. Oefenen I
8