Docentendag Arnhem, 19 maart 2013
Statistiek is zo saai nog niet! Een integratie van theorie en praktijk
Manfred te Grotenhuis
Statistiek is zo saai nog niet: de boeken
2
Basiscursus SPSS Hoe is het ontstaan? Reactie op ‘combi-boeken’: uitleg van het programma SPSS + uitleg statistiek Nadeel van dergelijke boeken: het is vaak vlees noch vis. Gevolg: je weet als student van beide te weinig en je hebt er weinig aan als naslagwerk. Doelstelling boek: voldoende vaardigheden aanleren om de meest gangbare handelingen in SPSS te kunnen uitvoeren Uitleg statistiek: marginaal en geen doel. 3
Statistiek als hulpmiddel Hoe is het ontstaan? Reactie op ‘dikke pillen’: veel bijzaken naast hoofdzaken. Veel gebruik van kaders, tabellen, kleuren, figuren. Nadeel van dergelijke boeken: men ziet door de bomen het bos niet. Gevolg: vooral studenten die statistiek lastig vinden raken het spoor bijster Doelstelling boek: voldoende kennis van de toepassing van statistiek in gangbaar onderzoek Formules en achterliggende wiskunde: marginaal en geen doel. 4
Voorbeeld: Andy Field, Discovering Statistics Using SPSS (856 pagina’s)
5
SPSS met Syntax Hoe is het ontstaan? Reactie op SPSS handboek over programmeren met syntax: 2000 pagina’s. Zeer uitgebreid en volledig. Nadeel van het omvangrijke handboek: voor een leek zo goed als ondoorgrondelijk. Gevolg: SPSS met syntax wordt te weinig gebruikt (vooral in wetenschappelijk onderzoek zorgelijk)
Doelstelling boek: voldoende kennis van gangbare programmering in SPSS 6
Basiscursus SPSS: didactiek
Doelstelling boek: voldoende vaardigheden aanleren om de meest gangbare handelingen in SPSS te kunnen uitvoeren Uitleg statistiek: marginaal en geen doel. Hoe is dat gedaan? Afbakening van thema’s (alleen meest gangbare) Werken met duidelijke structuur: tekst, computerhandelingen (in kaders), uitkomsten (foto’s van scherm) Opdrachten aan het eind van elk hoofdstuk 7
Basiscursus SPSS: thema’s 1. Uitleg SPSS onder Windows (bespreking van de ‘vensters’) 2. Beheren van databestanden (openen, aanmaken, invoer van gegevens)
3. Bewerken van variabelen (hercoderen, berekenen van nieuwe variabelen, selectie, opsplitsen) 4. Beschrijvende statistiek (grafieken, frequentieverdeling, kruistabellen)
5. Toetsende statistiek (proportie, gemiddelde(n), regressie-analyse, variantie-analyse) 8
Basiscursus SPSS: structuur
9
Basiscursus SPSS: opdrachten
10
Docentendag Arnhem, 19 maart 2013
Tijd voor vragen, opmerkingen, SPSS
Manfred te Grotenhuis
Statistiek als hulpmiddel Doelstelling boek: begrijpen en toepassen van de gangbare statistische procedures in de sociale wetenschappen.
Hoe is dat gedaan? Beginnen met inhoudelijk interessant thema Statistiek uitleggen met figuren in plaats van formules
Opdrachten en colleges via webpagina’s
12
Statistiek als hulpmiddel: interessante thema’s Beginnen met inhoudelijk interessant thema. Voorbeeld: de leeftijdsopbouw in Nederland in 1899. Het Centraal Bureau voor de Statistiek (CBS) heeft gegevens uit de volkstellingen gedigitaliseerd. Uit hun database kunnen eenvoudig de circa 5,5 miljoen Nederlanders worden gehaald en daarvan weten we de leeftijd.
Is voor veel studenten interessant, velen kennen fenomeen volkstelling niet en zijn verbaasd dat die informatie zo maar beschikbaar is. Op de volgende dia’s een uitgewerkt voorbeeld dat uiteindelijk leidt tot een van de kernbegrippen in de statistiek. 13
Statistiek als hulpmiddel: plaatjes in plaats van formules
gemiddelde leeftijd (μ) = 27,1 jaar standaardafwijking (σ) = 20,6 jaar
140000 120000
aantal
100000 80000 60000 40000 20000 0 0
10
20
30
40
50
60
70
80
90 100
leeftijd
Afbeelding: Leeftijdsverdeling (0 – 101 jaar) in Nederland in het jaar 1899 (bron: CBS, http://statline.cbs.nl/statweb, thema: volkstelling) 14
Statistisch toetsen: op basis van toeval (random) een steekproef 140000
geblinddoekt pijltjes gooien…
120000
aantal
100000 80000 60000 40000 20000 0 0
10
20
30
40
50
60
70
80
90 100
leeftijd
Vraag: als elke pijl een respondent is, hoe ziet dan ongeveer de verdeling van leeftijd in de steekproef eruit?
15
Statistisch toetsen: de verdeling in steekproef lijkt op die in populatie!
Antwoord: nou ongeveer een driehoek: veel jongeren en naarmate de leeftijd hoger wordt steeds minder respondenten
aantal
X = 28,9
0
leeftijd
100
Vraag: als we nu heel veel steekproeven uitvoeren, en we berekenen de gemiddelde leeftijd binnen elke steekproef, hoe ziet dan de verdeling van al die gemiddelden eruit? 16
Statistisch toetsen: de steekproevenverdeling Antwoord: een normaalverdeling
6000
E( x ) ≈ 27,1 (= gemiddelde in populatie!)
4000
σ( x )≈ 0,65 (afhankelijk van omvang steekproef, hier: 1000 respondenten en standaardafwijking in populatie (20,7). Berekening: 20,7 / wortel uit 1000)
2000
0
25
26 27 28 29 30 gemiddelde leeftijd in 100.000 steekproeven 17
Nogmaals de steekproevenverdeling: 90% interval E( x ) ≈ 27,1
6000
σ( x )≈ 0,65 Punt dat 1,65 standaardfouten van gemiddelde ligt. 4000
26,0
28,2 Berekening: 27,1 + 1,65 * 0,65 = 28,2 27,1 - 1,65 * 0,65 = 26,0
Daar tussen ligt 90% van alle steekproeven!
2000
0
25
26 27 28 29 30 gemiddelde leeftijd in 100.000 steekproeven 18
Enkelzijdige hypothesetoetsing met behulp van p en α Onderzoekshypothese: tussen 1899 en 1930 is levensverwachting gestegen Nulhypothese: levensverwachting is tussen 1899 en 1930 gelijk gebleven
E( x ) ≈ 27,1 ,
σ( x )≈ 0,65
28,2 (27,1 + 1,65 * 0,65)
Onderzoekshypothese wordt bevestigd, want de p-waarde is kleiner dan α: tussen 1899 en 1930 is naar alle waarschijnlijkheid de levensverwachting gestegen, de nulhypothese wordt verworpen 19
Hypothesetoetsing: gericht en ongericht Gerichte hypothesen zijn ter herkennen aan: naarmate X groter dan Y ook groter:
als p enkelzijdig ≤ α H0 , Ha (gericht) Ongerichte hypothesen zijn ter herkennen aan: naarmate X verandert dan verandert Y ook (geen richting)
als p dubbelzijdig ≤ α H0 , Ha (ongericht)
20
Statistiek als hulpmiddel: opdrachten & colleges Op webpagina’s opdrachten, gegevens + colleges: http://www.ru.nl/mt/statistiek/home/ http://www.youtube.com/user/Manfred585
21
Docentendag Arnhem, 19 maart 2013
Statistiek is zo saai nog niet! Een integratie van theorie en praktijk
Dank voor uw belangstelling
Manfred te Grotenhuis