Statistiek
Statistiek cursuscode 200300427 2010-2011, blok 4, april-juni Nieuws | Praktisch | Inhoud | Onderwijsvorm en toetsing | Draaiboek | Wat nu? | Verder
Nieuws 1. De cijfers van de reparatietoets zijn bekend. En daarmee de definitieve eindcijfers. 2. Hier zijn dan de eindcijfers. 76% heeft een voldoende behaald, gefeliciteerd! 10 studenten kunnen hertentamen doen op vrijdag 19 augustus van 13-15 uur in Drift 23 zaal 1.03. 3. De cijfers voor het derde werkstuk zijn bekend. 4. De eindcijfers volgen zodra het derde werkstuk is nagekeken. Er zal een hertentamen worden gegeven over de hele stof op vrijdag 19 augustus 2011, van 13-15 uur. Plaats nog nader bekend te maken. Alleen studenten die aan alle onderdelen hebben meegedaan, en waarvan het eindcijfer hoger of gelijk is aan 4 mogen aan het hertentamen meedoen. Het hertentamencijfer vervangt de cijfers voor de beide deeltentamens. 5. Dit zijn de vragen en antwoorden van het tweede deeltentamen. Dit zijn jullie cijfers, 68% heeft een voldoende. 6. De cijfers voor het tweede werkstuk zijn bekend. Ook dit is goed gemaakt. 7. Op vrijdag 24 juni is er nog een vragenuur van 13.15 - 15.00 in de gewone collegezaal. 8. De cijfers voor het eerste werkstuk zijn bekend. Het is goed gemaakt. 9. We lopen iets uit. Let op de gewijzigde huiswerk-opgaven en leesstof voor 1 en 8 juni. 10. De cijfers voor het eerste deeltentamen zijn bekend. 65% heeft een voldoende. Hier zijn de vragen en antwoorden. 11. De cursus Statistiek wordt door Hugo Quené en Gerrit Bloothooft gegeven. Hugo zal de colleges verzorgen. ▲
Praktische informatie Page 1
Statistiek
Docenten Hugo Quené e-mail: h punt quene at uu nl, adres: Trans 10, kamer 2.12, spreekuur: volgens afspraak Gerrit Bloothooft e-mail: g punt bloothooft at uu nl, adres: Trans 10, kamer 2.13, spreekuur: volgens afspraak
Boeken We maken gebruik van twee boeken en een web-handleiding: Peck, Roxy & Devore, Jay (2011). Statistics: The Exploration and Analysis of Data (7th international student edition). Cengage Learning Inc. ISBN-10 0-84006859-X (koop de paperback! die is veel goedkoper). Dit boek is o.a. verkrijgbaar bij Selexyz, in de Minrebroedersstraat. De 7e druk is net uit; je mag ook nog met de 6e druk werken; we zorgen voor een leeswijzer tussen de drukken. Het boek is niet goedkoop maar het is wel een sieraad voor je boekenkast, een standaardwerk om levenslang te raadplegen. Doen! LET OP: de informatie op deze site (bladzijden etc) is zowel op de 6e als de 7e druk van Peck en Devore beschikbaar NB: Een handige hulp bij de bestudering van dit boek is de book companion 6e druk van de uitgever. Voor de 6e druk is die veel uitgebreider dan de book companion 7e druk. Alleen op de companion site voor de 6e druk kun je veel datasets downloaden die in het boek gebruikt worden (hoef je die niet over te typen!) > Datasets in het linkermenu > kies SPSS en download (als Zipfile, daarna uitpakken). De datasets zijn per opgave beschikbaar met bestandsnaam: .SAV of 0.SAV. In het boek zijn de opgaven waarvoor datasets beschikbaar zijn gemarkeerd met een blauwe stip. Page 2
Statistiek
Bijzonder nuttig zijn ook de instructievideos met uitleg over opgaven > Solution Videos in het linker menu > kies opgave en bekijk direct. In het boek zijn de opgaven waarvoor datasets beschikbaar zijn gemarkeerd met een rode driehoek. Vocht, Alphons de (2008) Basishandboek SPSS 16 voor Windows. Dit boek is o.a. verkrijgbaar bij Boekhandel Erven J. Bijleveld, op de hoek van het Janskerkhof en de Korte Jansstraat. Het boek wordt aanbevolen als ondersteuning bij de practica SPSS. Er zijn inmiddels al boeken voor hogere versies van SPSS beschikbaar, maar wij volgen versie 16 die op het CIM geinstalleerd is. Bij de practica gebruiken we een handleiding. Deze handleiding wordt alleen via deze website aangeboden, en niet op papier.
Rooster Elke week begint met een (werk)college voor iedereen op woensdag (helaas erg laat van 17-19 uur). Op vrijdag worden de deelnemers verdeeld over 3 practicumgroepen. Op het werkcollege van vrijdag is iedereen samen. Plaats wordt nog bekend gemaakt. De practica op vrijdagochtend zullen worden begeleid door een student-assistent (SA, Marij van Ewijk). cursusjaar 2020-11, blok 4 woensdag 17:15-19:00 CIM KNG 80, zaal 0.06 vrijdag 09:00-10:45 CIM KNG 80, zaal 1.08 & 1.14 vrijdag 11:00-12:45 CIM KNG 80, zaal 1.08 vrijdag 13.15-15:00 CIM KNG 80, zaal 0.06 vrijdag 15:15-17.00 CIM KNG 80, zaal 0.07 & 0.13
(werk)college (HQ) practicum 1 (HQ+GB) practicum 2 (SA) (werk)college (HQ) practicum 3 (SA+GB) ▲
Inhoud Deze cursus heeft tot doel om je de elementaire principes bij te brengen van beschrijvende en toetsende statistiek, en van de rol die deze methoden spelen in het wetenschappelijk onderzoek. Je leert technieken om gegevens te beschrijven, samen te vatten en te presenteren, bv in tabellen, grafieken en statistische kengetallen. Ook de daarvoor vereiste achtergrond komt aan bod: kans en kansrekening, steekproeftheorie, en schatting. In het wetenschappelijk onderzoek worden gegevens meestal niet alleen beschreven, maar ook gebruikt om een hypothese te toetsen. We gaan in op de algemene principes van zulke toetsing, en je leert de meest gangbare statistische toetsen toe te passen en te interpreteren. Een experiment is een speciale onderzoeksomgeving waarin de relevante variabelen systematisch kunnen variëren; we besteden daarom aandacht aan het ontwerp van een experiment. In de practica leer je omgaan met SPSS, een computerprogramma voor statistische analyse. Je gebruikt dit pakket om gegevens van jezelf (of van anderen) te beschrijven Page 3
Statistiek
en te gebruiken voor toetsing.
Onderwijsvorm en toetsing Deze cursus bestaat uit verschillende componenten. Ten eerste zijn er (werk)colleges, op woensdag en vrijdag. Voorafgaand aan een college moet je leesstof bestudeerd hebben. Na afloop moet je de bijbehorende individuele huiswerkopdrachten maken. Je antwoorden en oplossingen van het huiswerk moet je in uitgeschreven vorm meenemen naar het volgende college, waar we e.e.a. zullen bespreken. Ten tweede zijn er practica op vrijdag. De invulling is vooral statistiek "doen" met SPSS; daarnaast kunnen jullie samen werken aan opdrachten, of het resultaat ervan bespreken. Voor ieder college (tweemaal per week) moet je rekenen op 2u leeswerk vooraf, 2 contacturen, en 4u huiswerk nadien: 16 uur per week. Voor ieder practicum (eenmaal per week) moet je rekenen op 2u zelfstudie, plus 2 contacturen: 4 uur per week. Je wordt dus geacht 20 uur per week aan deze cursus te besteden. Verslagen en andere teksten moeten elektronisch worden ingeleverd via Ephorus (plagiaat-detectie), uitsluitend in PDF (zie Hugo's pagina over open-source document formaat). Vraag je docent om opheldering als de opdrachten niet duidelijk zijn! Tijdens de cursus moet je drie werkstukken inleveren, waarmee je in totaal maximaal 4 punten kunt verdienen (1+1,5+1,5). Halverwege de cursus wordt een tussentoets gegeven, die goed is voor maximaal 2 punten. De cursus wordt afgesloten met een tentamen waarmee je maximaal 4 punten kunt verdienen. Het eindcijfer bestaat uit de som van de behaalde punten. ▲
Draaiboek woensdag 27 april: werkcollege 1 INLEIDING / STEEKPROEVEN
>slides (inleiding) Variabelen; meetniveau. Empirische cyclus. De rol van statistiek in wetenschappelijk onderzoek. Hypothesen; H1 en H0. Eenheden van analyse. Page 4
Statistiek
Lezen: Chapter 1.
>slides (steekproeven) Eenheden van analyse. Steekproef; sampling. Validiteit. Beschrijvende en toetsende statistiek. Veldwerk, corpusanalyse, experiment. Lezen: Chapter 2.
Vooraf: Neem een kijkje bij de verschillende webstekken die hieronder genoemd staan. Bezoek in ieder geval de Research Methods Knowledge Base. Geef je oordeel over de volgende uitspraken. Is er iets mee mis? Zo ja, wat dan? Leg je antwoord vast op schrift. Two thirds of the people have less than average intelligence. (K.A. Menninger) The TV weathercaster announced that there was a 50 percent chance of rain for Saturday and a 50 percent chance for Sunday, and concluded that there was therefore a 100 percent chance of rain that weekend. (J.A. Paulos, Innumeracy, p.4; lees verder) ...from Lake Wobegon, where all the women are strong, the men are good-looking, and all the children are above average. (Garrison Keillor, The Prairie Home Companion radio show) De statistiek-scepticus Henk Vonhoff zei: "Statistieken hebben voor sommigen dezelfde functie als lantaarnpalen voor dronkaards: ze bieden enige ondersteuning maar leiden nimmer tot verlichting" Verwijzingen: Kennisbasis Statistiek. Klik door "naar de Kennisbasis Statistiek". Beknopte systematische behandeling van veel onderwerpen die ook in deze cursus aan de orde komen. Research Methods Knowledge Base by William M. Page 5
Statistiek
Trochim, Cornell University, Ithaca, NY (The Web Center for Social Research Methods) Statistics Every Writer Should Know by Robert Niles, journalist bij de Los Angeles Times. Wees gerust: bijna alle genoemde onderwerpen komen in onze cursus aan bod. Rice Virtual Lab in Statistics by David Lane, Rice University, Houston, TX. Deze webstek bevat ook HyperStat Online, een inleiding in de statistiek. StatPages.Net by John C. Pezzullo, Georgetown University, Washington DC. Misschien wat overdonderend zo in het begin, maar de berg van handige verwijzingen en programma's kan je later goed van pas komen. 's Mans webstek bevat nog veel meer bergen met handige verwijzingen naar van alles en nog wat. Lekker: statistiek koekjes
vrijdag 29 april: practicum 1
KENNISMAKING
MET SPSS Kennismaking met SPSS 16. Gegevens invoeren en bewaren. Neem je solis login-gegevens mee naar het practicum, zodat je kunt inloggen in de computer-leerzalen bij Letteren. Lezen: Handleiding1-3, Hoofdstukken 1, 2, en 3. Basishandboek SPSS: bestudeer de hoofdstukken 1, 2, 3, 4, 5, 7, 23 — liefst achter een computer met SPSS! Taak: uitvoeren van de opdrachten uit Handleiding1-3 Benodigde bestanden: vb01.dat, vb02.dat Maak een directory /statistiek voor deze cursus op je persoonlijke schijf (computerleerzalen CIM); bewaar deze bestanden in die directory (in de meeste browsers: rechts klikken op hyperlink, kies dan Save target as... om het bestand op te slaan). Liever R dan SPSS? Voor deze cursus is het niet verplicht om gebruik te maken van SPSS. Een interessant open-source alternatief is het pakket R, beschikbaar via http://www.r-project.org/. R is een Page 6
Statistiek
stuk krachtiger dan SPSS, en is dan ook lastiger om mee te leren werken. Je kunt meer leren over R in Hugo's tutorial daarover.
vrijdag 29 april: werkcollege 2 PRESENTATIE VAN INFORMATIE
>slides (presentatie van informatie) Datareductie. Presentatie. Histogrammen, tabellen, grafieken. Gemiddelde en spreiding. Lezen: Chapters 3 en 4. Huiswerk vooraf: LET OP: we gebruiken zowel de 6e als de 7e druk. De opgaven voor de 7e druk staan in rood als 7: met opgave nummer, en voor de 6e druk in zwart met opgavenummer. Opgaven met gele achtergrond komen niet in beide drukken voor en hoeven niet te worden gemaakt (we zoeken naar vervangende opgaven). Peck & Devore, Chapter 1, opgaven (7:1.1 t/m 1.5, 1.7, 1.8, 1.9 )(6:1.1 t/m 1.6, 1.8, 1.9). Maak je uitwerkingen op papier zodat je tijdens het volgend werkcollege de antwoorden paraat hebt. Maak ook gebruik van de "review exercises" achterin het hoofdstuk. Nadat (!) je de opgaven gemaakt hebt, kun je zelf kijken naar oplossingen (achterin het boek en op de book companion website). Peck & Devore, activity Chapter 1: (7:1.4)(6:1.3); opgaven Chapter 2: (7:2.11,6:2.7) (7:2.17,6:2.14) (7:2.18,6:2.15 (video)) (7:2.33,6:2.32) (7:2.49,6:2.41) (7:2.81,6:2.65) (7:2.82,6:2.66) 21, 31. Maak je uitwerkingen op papier zodat we ze op college snel kunnen bespreken. Aanvulling: Voor de liefhebbers is er achtergrond-informatie beschikbaar over variantie, o.a. over het verschil tussen populatie-variantie en steekproef-variantie, en over het Page 7
Statistiek
verschil in berekening (N danwel N-1 in de noemer).
Grote of kleine standaarddeviatie? (Zie ook P&D opgave 7:4.31, 6:4.28) Is de gevonden standaarddeviatie groot of klein? Zit er veel of weinig variantie in de data? Deze vragen zijn niet a priori te beantwoorden; het antwoord hangt af van wat de "gebruikelijke" standaarddeviatie is voor de geobserveerde variabele. Een veel gebruikte maat is de "coefficient of variation" Cv. Dat is een relatieve maat van een steekproef: de standaarddeviatie gedeeld door het gemiddelde. Hieronder zie je die Cv uitgerekend voor enkele gegevens uit een eerdere vragenlijst (voor een steekproef van N=42 studenten). Het gemiddelde en de standaarddeviatie zijn uitgedrukt in dezelfde eenheden als de gemeten variabele (resp. jaar, schoenmaat, cm). De Cv is onafhankelijk van die eenheden, en kan dus vergeleken worden tussen variabelen. Studiejaar Schoenmaat Lengte (cm) 39.93 173.12 gemiddelde 1.97 1.246 3.15 8.37 s.d. 0.63 0.08 0.05 Cv 2 4 10 IQR
Hieruit zou je kunnen afleiden dat de studenten in deze steekproef relatief meer van elkaar verschillen in studiejaar, dan in schoenmaat of in lichaamslengte. Aan bovenstaande gegevens zie je trouwens al dat de variabele Studiejaar niet normaal verdeeld is (vergelijk maar met de Empirical Rule, 7:p.191 6:p.169). De spreiding kan je in zo'n geval vaak beter uitdrukken met de interquartile range. Bereken eens, met behulp van de tabellen in het boek, wat de IQR is van de standaard-normaalverdeling. Is die IQR groter of kleiner dan de standaarddeviatie? ▲
woensdag 4 mei: werkcollege 3 KANSREKENING Page 8
Statistiek
>slides (kansrekening) Kans, kansrekening; gezamenlijke en onafhankelijke kansen. Binomiaal-verdeling. Lezen: Chapter 6. (het woord Binomiaal verdeling komt in dit hoofdstuk niet voor, maar merk op dat example 6.6 er wel in resulteert, en example 6.11 ook - in beide drukken). Huiswerk vooraf: (wordt mogelijk deels doorgeschoven naar volgende week woensdag) Peck & Devore, opgaven Ch.3: 16, (7:3.30,6:3.29), 30; opgaven Ch.4: (7:4.12, 6:4.9), (7:4.14,6:4.12), (7:4.15,6:4.14), (7:4.24,6:4.15), (7:4.31,6:4.28), (7:4.38,6:4.36), (7:4.39,6:4.37(video)), (7:4.60,6:4.55), (7:4.61,6:4.56), (7:4.62,6:4.57). Maak je uitwerkingen op papier. Verwijzingen: Snuffel ook eens rond bij de Wizard of Odds, en lees daar bijvoorbeeld over de Gamblers' Fallacy Aanvullingen binomiaal verdeling: 1. Over de binomiaal-verdeling kan je meer lezen in het boek van Peck & Devore, Appendix A, 7:p730 ff,6:p.694 ff. 2. Hieronder volgt de uitwerking van de binomiaalverdeling, voor 7 trekkingen met teruglegging, elk met p=0.38 (de kans op een klinker in scrabble), in formule-vorm (zie p.696), en uitgeschreven in een tabel:| P(k klinkers uit 7 trekkingen; k=1,..,7) = (p+q)7 = 1 × p7 + 7 × p6q+ 21 × p5q2 + 35 × p4q3 + 35 × p3q4 + 21 × p2q5 + 7 × pq6 + 1 × q7 . De binomiaal-coëfficienten 1, 7, 21, 35, enz. tref je ook aan in de zgn. Driehoek van Pascal die dit in 1654 heeft bedacht. De binomiaal-coëfficienten geven het aantal verschillende mogelijkheden om k successen (klinkers) uit 7 trekkingen te behalen. Dat is gelijk aan Page 9
Statistiek
7! waarbij 7! = 1.2.3.4.5.6.7 (spreek uit: zeven faculteit) k! (7-k)! aantal mogelijke uitkomsten klinkers 7 VVVVVVV VVVVVVC, VVVVVCV, VVVVCVV, 6 VVVCVVV, VVCVVVV, VCVVVVVV, CVVVVVV VVVVVCC, VVVVCCV, VVVCCVV, VVCCVVV, VCCVVVV, CCVVVVVV, VVVVCVC, VVVCVCV, VVCVCVV, VCVCVVV, CVCVVVV, 5 VVVCVVC, VVCVVCV, VCVVCVV, CVVCVVV, VVCVVVC, VCVVVCV, CVVVCVV, VCVVVVC, CVVVVCV, CVVVVVC VVVVCCC, VVVCCCV, VVCCCVV, VCCCVVV, CCCVVVV, VVVCCVC, VVCCVCV, VCCVCVV, CCVCVVV, VVCCVVC, VCCVVCV, CCVVCVV, VCCVVVC, CCVVVCV, CCVVVVC, VVVCVCC, VVCVCCV, VCVCCVV, 4 CVCCVVV, VVCVVCC, VCVVCCV, CVVCCVV, VCVVVCC, CVVVCCV, CVVVVCC, VVCVCVC, VCVCVCV, CVCVCVV, VCVCVVC, CVCVVCV, CVCVVVC, VCVVCVC, CVVCVCV, CVVCVVC, CVVVCVC CCCCVVV, CCCVVVC, CCVVVCC, CVVVCCC, VVVCCCC, CCCVVCV, CCVVCVC, CVVCVCC, VVCVCCC, CCVVCCV, CVVCCVC, VVCCVCC, CVVCCCV, VVCCCVC, VVCCCCV, CCCVCVV, CCVCVVC, CVCVVCC, 3 VCVVCCC, CCVCCVV, CVCCVVC, VCCVVCC, CVCCCVV, VCCCVVC, VCCCCVV, CCVCVCV, CVCVCVC, VCVCVCC, CVCVCCV, VCVCCVC, VCVCCCV, CVCCVCV, VCCVCVC, VCCVCCV, VCCCVCV CCCCCVV, CCCCVVC, CCCVVCC, CCVVCCC, CVVCCCC, VVCCCCCC, CCCCVCV, CCCVCVC, CCVCVCC, CVCVCCC, VCVCCCC, 2 CCCVCCV, CCVCCVC, CVCCVCC, VCCVCCC, CCVCCCV, CVCCCVC, VCCCVCC, CVCCCCV, VCCCCVC, VCCCCCV
kans 1 × (.387 ) =.001 7 × (.386 ) =.013 (.62)
21 × (.385) =.064 (.622 )
35 × (.384) =.174 (.623 )
35 × (.383) =.284 (.624 )
21 × (.382) =.279 (.625 )
Page 10
Statistiek CCCCCCV, CCCCCVC, CCCCVCC, CCCVCCC, CCVCCCCC, CVCCCCC, VCCCCCC CCCCCCC
1 0
7 × (.38) (.626 )
=.151
1 × (.627 ) =.035
Op vrijdag 6 mei is er geen onderwijs
woensdag 11 mei: werkcollege 4
DE
CENTRALE LIMIETSTELLING
>slides (centrale limiet theorie)
Er zal meer gezegd worden over de binomiaal verdeling. Centrale Limiet Theorema. Normale (Gauss verdeling. Standard error of the mean. Bekijk: Binomial Demonstration Demonstratie 1 Centrale Limiet theorema Demonstratie 2 Centrale Limiet theorema Lezen: Chapters 7 [7.4 is geen tentamenstof] en 8. Huiswerk vooraf: Peck & Devore, opgaven Chapter 6: (7:6.9,6:6.9), (7:6.19,6:6.19), (7:6.25,6:6.25), (7.6.33 Maak je uitwerkingen op papier. Peck & Devore, opgaven uit Appendix A (binomiaal verdeling): (7:A.1, 6:A.1), (7:A.9,6:A.9) Maak je uitwerkingen op papier.
Page 11
Statistiek
vrijdag 13 mei: practicum 2
BESCHRIJVENDE
STATISTIEK Huiswerk vooraf: Basishandboek SPSS: bestudeer de hoofdstukken 26, 21 — liefst achter een computer met SPSS! Handleiding4: Zorg dat je de stof uit de voorgaande hoofdstukken onder de knie hebt. Taak: uitvoeren van de opdrachten uit Handleiding4 Werkstuk 1: Dit werkstuk telt als een deeltoets voor je eindcijfer. Dit werkstuk telt als een deeltoets voor je eindcijfer. Maak opgave (7:4.72, 6:4.68) uit het boek van Peck & Devore (7:p209,6:p187). Zorg dat je uitwerking resulteert in een vloeiend betoog. Maak een verhaal met een inleiding (uitleg van het probleem) , midden (gegevens en analyses) en staart (conclusies), met inleiding en conclusies. Alles in eigen woorden, niets direct copiëren uit de opgave. Naast de behandeling van de vragen in de opgave: bespreek ook de spreiding in de gegevens, en maak een boxplot. Kortom, karakteriseer de gegevens zo goed mogelijk. Zorg dat grafieken en tabellen een natuurlijke rol vervullen in je verhaal. Uit SPSS mogen in werkstukken overigens alleen grafieken worden overgenomen (gecopieerde tabeluitvoer van SPSS zie je vrijwel nooit in publicaties). Eventuele tabellen maak je zelf. De data voor deze opgave kun je ook online vinden. Je uitwerking moet je inleveren als een PDF document van maximaal 5 pagina's (minder mag ook!). Volg ook Hugo's aanwijzingen voor taalgebruik, stijl en opmaak. Je moet dit document inleveren via Ephorus, een webstek voor plagiaat-detectie. Dat moet via dit formulier. Vul als inlevercode in Statistiek1011 (met hoofdletter). Je werkstuk wordt dan eerst gecontroleerd op plagiaat, en daarna doorgestuurd naar de docent. Deadline is dinsdag 24 mei 23:59u! Neem bij vragen contact op met de docent. Page 12
Statistiek
vrijdag 13 mei: werkcollege 5
BETROUWBAARHEID
>slides (schattingen, betrouwbaarheidsinterval) Schatting. Betrouwbaarheidsinterval voor populatieproportie Lezen: Chapter 9.
Lees ook als achtergrond de extra uitleg over variantie van populatie en van steekproef (bij college 3 Huiswerk vooraf:
Peck & Devore, opgaven Chapter 7 : (7:7.17(p365),6:7.18 (p328)) , (7:6.18,6:7.19), ( (7:7.31,6:7.27), 32; Peck & Devore, opgaven Chapter 8: (7:8.1 (p389),6:8.1 (p347)), (7:8.2,6:8.2), (7:8.7,6:8.7)(vide (p399),6:8.16(p358)), (7:8.17,6:8.17). Maak je uitwerkingen op papier.
woensdag 18 mei: tussentoets Over de stof van Chapter 1 t/m 8
Het wordt een open-boek-toets, waarbij je gebruik mag maken van: a. b. c. d. e.
het boek van Peck & Devore, Statistics etc, het boek van De Vocht, Basishandboek SPSS 16 etc, je aantekeningen, een (grafische) rekenmachine, de practicum-handleiding.
Hier is de cumulatieve distributie van jullie schatting van je tentamencijfer. En dit is het tentamen met de antwoorden. Page 13
Statistiek
En de behaalde cijfers.
vrijdag 20 mei: practicum 3
DOBBELEN EN SIMULEREN
Huiswerk vooraf: Basishandboek SPSS: bestudeer hoofdstuk 15.1 en 17.1 — liefst achter een computer met SPSS! Handleiding5: Lees dit hoofdstuk 5 over dobbelen alvast door. Taak: uitvoeren van de opdrachten uit Handleiding5
practicum 4
DE NORMALE VERDELING
Huiswerk vooraf: Basishandboek SPSS: bestudeer hoofdstuk 30.8: Onderzoeken of variabele normaal is verdeeld Handleiding6. De normale verdeling Taak: uitvoeren van de opdrachten uit Handleiding6
vrijdag 20 mei: werkcollege 7
HYPOTHESE
TOETSING
>slides (testen van hypothesen) Page 14
Statistiek
Principes van hypothese-toetsing. Type-I en Type-II fouten. Significantie en power. Lezen: Chapter 10 [7:p499-501, 6:p460-462 zijn geen tentamenstof] Huiswerk vooraf: Peck & Devore, opgaven Chapter 9: (7:9.1 (p417),6:9.1 (p375))(video), (7:9.8,6:9.9), ( (7:9.12,6:9.13), (7:9.20,6:9.16), (7:9.26,6:9.22), (7:9.36(p442),6:9.32(p400)), (7:9.37,6:9.33), 67, (7:9.71,6:9.71). Activities (7:9.3,6:9.3),(7:9.4,6:9.4). Maak je uitwerkingen op papier. Kijk ook eens naar ongebruikelijk onderzoek, bij http://www.improbable.com ! Verwijzingen:
Influence of Computer-Aided Detection on Performance of Screening Mammography of Medicine, 356, 1399-1409 (5 April 2007); "sensitivity" slaat op P(hit)=P(yes|positive) en "spec op P(correct_rejection) = P(no|negative). Study Suspects Thousands of False Convictions, New York Times, 19 April 2004 (dit artikel is n beschikbaar) Not Guilty: Evidence Exonerates 328, but Many Still Falsely Imprisoned H. Quené (2010). How to design and analyze language acquisition studies. In: E. Blom & S. Un Experimental Methods in Language Acquisition Research (pp.269-284). Amsterdam: Benjamins 90-272-1997-8.
▲
dinsdag 24 mei : deadline werkstuk 1
woensdag 25 mei: werkcollege 8 REGRESSIE EN CORRELATIE
>slides (regressie en correlatie) Page 15
Statistiek
Presentatie en analyse van bivariate data. Correlatie. Lezen: Chapter 5
[5.4 en 5.5 zijn geen tentamenstof]
Hier is een plaatje van gegevensverzamelingen met correlatiecoefficiënten tussen 0.3 en 0.9 en tussen -0.3 en -0.9 Huiswerk vooraf: Peck & Devore, opgaven Chapter 10: (7:10.2(p461) ,6:10.2 (p421)), (7:10.11,6:10.11), (7:10.12(p466) ,6:10.12(p426)), (7:10.17,6:10.17), 45 (p. 451), 46 Maak je uitwerkingen op papier. Onderstaande tabel vat de terminologie samen die bijvoorbeeld in opgave 10.12 wordt gebruikt.
Let goed op hoe "positive" ten opzichte van H0 en Ha wordt geïnterpreteerd! Dwz wel kanker = "positive" H0 : geen kanker Ha : wel kanker
H0 accepteren
H0 is waar werkelijkheid
H0 is onwaar (Ha is waar)
beslissing over hypothese H0 verwerpen (Ha accepteren)
correct (negative)
H0 onterecht verworpen (false positive) (type-I fout, α) H0 onterecht geaccepteerd correct (positive) (false negative) (type-II fout, β)
Huiswerk vooraf: Peck & Devore, opgaven Chapter 10 (hypothesen testen): (7:10.45,6:10.50), 60, (7:10.60(p501),6:10.66 (p.462)), (7:10.64,6:10.70), 89 (p.471), (7:10.82,6:10.93) Voer ook Activity 10.2 (7:p506, 6:p467) uit. Hier is het uitgebreide antwoord van opgave 10.60 (7E), bestudeer dat goed! Page 16
Statistiek
vrijdag 27 mei: practicum 5
REGRESSIE EN
CORRELATIE Huiswerk vooraf: Handleiding7. Correlatie en regressie Taak: uitvoeren van de opdrachten uit Handleiding7 Benodigde bestanden: television.sps (syntax), television.dat (data). Werkstuk 2: Dit werkstuk telt als een deeltoets voor je eindcijfer. Neem aan dat je werkt als onderzoeker bij een grote school, waar van alle leerlingen het IQ wordt bepaald. Na vele jaren weet je dat het gemiddelde gemeten IQ 98 punten is voor deze leerlingen. Vandaag komt er een ouder van een ADHD-kind op je spreekuur. Zij beweert dat het IQ van ADHD-kinderen eigenlijk hoger is dan gemiddeld, en eist daarom een meer uitdagend programma voor ADHD-ers. Om haar bewering te toetsen selecteer je geheel willekeurig negentien ADHD-leerlingen. De IQ-scores van deze ADHD-ers zijn: 78, 92, 95, 96, 96, 97, 99, 100, 101, 102, 102, 103, 104, 104, 107, 108, 110,112,130. Ga er vanuit dat de ouder gelijk heeft wanneer de IQ=98 buiten het 95% betrouwbaarheidsinterval van het gemiddelde van de IQ-scores van de ADHD kinderen ligt. Controleer dat. Het schoolbestuur snapt echter niets van statistiek, maar moet wel een gemotiveerde beslissing kunnen nemen over de eis van de ouder. Schrijf daarom een compleet verslag, waarin je ook moet uitleggen welke redeneringen ten grondslag liggen aan de analyse van de onderzoeksresultaten, en aan je conclusie. Ontleend aan: S.E. Maxwell & H.D. Delaney (2004). Designing Experiments and Analyzing Data: A Model Comparison Perspective. Mahwah, NJ: Lawrence Erlbaum. ISBN 0-8058-3718-3. Numerical example, Table 3.1, p.78.
Uiteraard moet je uitwerking resulteren in een vloeiend betoog waarin eventuele grafieken en tabellen (tabellen niet Page 17
Statistiek
copieren uit SPSS!) een natuurlijke rol vervullen. Maak dus weer een verhaal met een kop en midden en staart, met inleiding en conclusies. Je uitwerking moet je inleveren als een PDF document (dus geen Word) van maximaal 2 pagina's. Volg ook weer Hugo's aanwijzingen voor taalgebruik, stijl en opmaak.
Je moet dit document inleveren via Ephorus, een webstek voor plagiaat-detectie. Dat moet via dit formulier. Vul als inlevercode in Statistiek1011 (met hoofdletter). Je werkstuk wordt dan eerst gecontroleerd op plagiaat, en daarna doorgestuurd naar de docent. Deadline is dinsdag 7 juni 23:59u! Neem bij vragen contact op met de docent
vrijdag 27 mei: werkcollege 9 Correlatie en regressie wordt verder behandeld. Huiswerk vooraf: Peck & Devore, opgaven Chapter 5 (correlatie en regressie): 6 (p198), (7:5.13,6:5.16), 31 (p210), (7:5.26,6:5.32). Met SPSS: (7:5.38(p251),6:5.44(p226)), 7:5.73(p293)
▲
woensdag 1 juni: werkcollege 10
Page 18
Statistiek
GOODNESS OF FIT
>slides (Chi2) Chi2 goodness-of-fit test. Test voor associatie (homogeniteit) en onafhankelijkheid. Lezen: Chapter 12.
DE VERGELIJKING VAN TWEE GEMIDDELDEN
>slides (t-toets) Vergelijking van 2 gemiddelden of proporties. De t-toets. Lezen: Chapter 11.
Huiswerk vooraf, nog van 27 mei: Peck & Devore, opgaven Chapter 5 (correlatie en regressie): Met SPSS: (7:5.38(p251),6:5.44(p226)), 7:5.73(p293)
Op vrijdag 3 juni is er geen onderwijs
dinsdag 7 juni: deadline werkstuk 2 Page 19
Statistiek
woensdag 8 juni: werkcollege 11 RECAPITULATIE
Huiswerk vooraf: Peck & Devore, opgaven Chapter 12 (Chi2): 14 (p545), (7:12.38(p608),6:12.37(p567)), (7:12.44,6:12.45), (7:12.45,6:12.46) Peck & Devore, opgaven Chapter 11 (t-toets): 17 (p493), 21, 36 (p506), 63 (p525), (7:11.77(p571) ,6:11.82(p529)), 85.
vrijdag 10 juni: practicum 6
TOETSENDE
STATISTIEK Huiswerk vooraf: Handleiding8: Toetsende statistiek: sectie 8.1 X2-toets; sectie 8.3 de t-toets. LET OP! De vragen in secties 8.3, 8.4 en 8.5 in dit hoofdstuk vormen het derde werkstuk! Taak: uitvoeren van de opdrachten uit Handleiding8.1-8.3 Benodigde bestanden: enq2008.sav met resultaten van enquete uit het eerste werkcollege van 2008, en het bijbehorende codebook. De gegevens zijn voor de afhankelijke variabele jaar behoorlijk rechtsscheef, maar je mag ze voor deze gelegenheid toch voor de verschillende groepen als normaal verdeeld - met voldoende gelijke variantie -beschouwen. Werkstuk 3: Dit werkstuk telt als een deeltoets voor je eindcijfer. Maak alle opdrachten en beantwoord alle vragen in secties 8.3, 8.4 en 8.5 van de Handleiding (dus die van vandaag en van volgende week!). Zorg dat je uitwerkingen weer resulteren in een samenhangend, vloeiend betoog waarin eventuele grafieken en tabellen een natuurlijke rol vervullen. Maak dus een verhaal met een kop en midden en staart, met Page 20
Statistiek
inleiding en conclusies. Je verslag mag maximaal 5 pagina's lang zijn! Je werkstuk moet weer bestaan uit een document in PDF! Je moet je document weer inleveren via Ephorus, een webstek voor plagiaat-detectie, via dit formulier. Vul als inlevercode in Statistiek1011 (met hoofdletter). Je werkstuk wordt dan eerst gecontroleerd op plagiaat, en daarna doorgestuurd naar de docent. Deadline is vrijdag 24 juni 23:59u. Neem bij vragen contact op met de docent
vrijdag 10 juni: werkcollege 12
VARIANTIE
ANALYSE 1
>slides (one-way ANOVA) Vergelijking van meer dan 2 gemiddelden. One-way analysis of variance. Post-hoc vergelijkingen. Lezen: Chapter 15 (sections 15.1 en 15.2).
▲
woensdag 16 juni: werkcollege 12 VARIANTIE ANALYSE 2
>slides (two-way ANOVA) Page 21
Statistiek
Two-way analysis of variance. Interactie. Lezen: Peck & Devore, Ch.15, sections 15.3 t/m 15.5, te vinden via de book companion (6e druk) of book companion (7e druk) website. [geen tentamenstof] Huiswerk vooraf: Peck & Devore, opgaven Chapter 15 (one-way ANOVA): (7:15.2(p714),6:15.2(p674)), 8, 16, 18, 19, (7:15.21(p725),6:15.28(p687)).
vrijdag 17 juni: practicum 7
VARIANTIE
ANALYSE Huiswerk vooraf: Handleiding8: Toetsende statistiek, secties 8.4 en 8.5 over variantieanalyse. LET OP! De vragen in secties 8.3, 8.4 en 8.5 in dit hoofdstuk vormen het derde werkstuk! Uiterlijk vrijdag 24 juni inleveren. Taak: uitvoeren van de opdrachten uit Handleiding8.4 en 8.5 Benodigde bestanden: 1) enq2008.sav met resultaten van enquete uit het eerste werkcollege van 2008, en het bijbehorende codebook. De gegevens zijn voor de afhankelijke variabele jaar behoorlijk rechtsscheef, maar je mag ze voor deze gelegenheid toch voor de verschillende groepen als normaal verdeeld - met voldoende gelijke variantie -beschouwen. 2) iq.txt met IQ waarden voor 1000 personen in verschillende groepen psychische aandoeningen (inclusief controlegroep), naar geslacht.
vrijdag 17 juni: werkcollege 13
FINALE
Page 22
Statistiek
>slides (finale) De wetenschappelijke methode. Ethische aspecten van onderzoek. Omgang met proefpersonen en informanten. Fraude en plagiaat. Lezen: Nederlandse Gedragscode Wetenschapsbeoefening: Principes van goed wetenschappelijk onderwijs en onderzoek (2004, PDF), door VSNU. Huiswerk vooraf: Peck & Devore, opgaven Chapter 15: 6:15.47, 6:15.55 (via de book companion (6e druk) of book companion (7e druk)) Kies één van de genoemde dilemma's uit, en inventariseer zoveel mogelijk valide argumenten 'pro' en 'contra'. We gebruiken dit werkcollege ook als vragen-uurtje, ter voorbereiding op het tentamen. Je kunt vragen stellen over alle colleges en practica, of over het boek en andere leesstof. Stel je vragen over alle voorafgaande stof zo duidelijk mogelijk op schrift. Verwijzingen: Wat is citeren, parafraseren, plagiaat? (uitleg van UB Universiteit Utrecht, ontleend aan lesmodule Hoe verwerk ik literatuur in mijn verslag? van de UB Vrije Universiteit Amsterdam). On Being A Scientist: Responsible Conduct In Research, van de National Academy of Sciences, National Academy of Engineering, and Institute of Medicine (U.S.A.). Barbertje Moet Hangen: Wetenschap, bedrog en zelfbedrog, artikel uit het tijdschrift Skepter van de Stichting Skepsis. Online Ethics Center for Engineering and Science at Case Western Reserve University. "Our mission is to provide engineers, scientists, and science and engineering students with resources for understanding and addressing ethically significant problems that arise in their work, and to serve those who are promoting learning and advancing the understanding of responsible research and practice in science and engineering" Professionele standaards en gedragsregels: Nederlandse Vereniging voor Psychotherapie, Page 23
Statistiek
Codes of Conduct-Practice-Ethics from around the world (bv. van American Psychological Association, en Cowboy Code), van Virginia Polytechnic Institute and State University. Index van verwijzingen over Research Ethics, van het Open Directory Project. Scandal Rocks Scientific Community, artikel over schandaal rond Schön bij Bell Labs, van Deutsche Welle. Altmann: Hauser apparently fabricated data
▲
woensdag 22 juni: geen college vrijdag 24 juni: vragenuur 13.15-15.00, KNG80 0.06 vrijdag 24 juni: geen practicum vrijdag 24 juni: deadline werkstuk 3! ▲
woensdag 29 juni: tentamen, 17-19 uur, Educatorium, zaal Gamma Het wordt een open-boek-tentamen, waarbij je gebruik mag maken van: a. het boek van Peck & Devore, Statistics etc, b. het boek van De Vocht, Basishandboek SPSS 16 etc, Page 24
Statistiek
c. je aantekeningen, d. een (grafische) rekenmachine, e. de practicum-handleiding. Maak ter voorbereiding deze oude tentamen2003-04, tentamen2004-05, tentamen2005-06, tentamen2008-09, tentamen2009-10 en — nadat je dat voltooid hebt — kun je de antwoorden2003-04, antwoorden2004-05, antwoorden2008-09 en antwoorden2009-10 bekijken. Vergeet ook niet om de online cursus-evaluatie in te vullen.
▲
Verder lezen Er zijn letterlijk honderden inleidende boeken over statistiek te vinden. Een goede selectie vindt je bij HyperStat Online (gelieerd aan de webstek van het Rice Virtual Lab in Statistics; zie hieronder). Andere suggesties zijn de volgende: Pallant, J. (2007) SPSS Survival Manual(3rd ed.). z.p.: Open University Press. [Dit boek is populair onder master-studenten Taalwetenschap/Linguistics, en terecht!]. Maxwell, S.E. & Delaney, H.D. (2004) Designing Experiments and Analyzing Data: A model comparison perspective(2nd ed.). Mahwah, NJ: Lawrence Erlbaum Associates. ISBN 0-8058-3718-3. [Heel goed, maar geen makkelijk boek]. Velders, J. (2003) Eerste Hulp Bij Statistiek. [Een handig boekje, van studenten voor studenten, over het gebruik van de grafische rekenmachine bij het oplossen van statistische vraagstukken. Geen officiële publicatie; meer informatie en bestellen via http://www.hulpbijstatistiek.nl/]. Rosnow, R.L. & Rosenthal, R. (2002) Beginning Behavioral Research: A Conceptual Primer. Upper Saddle River, NJ: Prentice Hall. ISBN 0-13-091517-3. [Vooral methodologisch, prettige introductie voor wie zelf wetenschappelijk onderzoek gaat doen]. Levin, I.P. (1998) Relating Statistics and Experimental Design: An introduction. Thousand Oaks, CA: Sage. Sage University Papers Series on Quantitative Applications in the Social Sciences; 07125. ISBN 0-7619-1472-2. [Dit leesbare boekje vereist wel enige statistische voorkennis; geschikt voor wie meer wil weten]. Huff, D. & Geis, I. (1993) How to Lie with Statistics. New York: W.W. Norton. ISBN 0393310728. [Dit boek is geen how-to handleiding voor liegende en frauderende onderzoekers, maar een gids voor het opsporen van denkfouten en misleiding in de presentatie van onderzoeksresultaten].
Verder grazen Research Methods Knowledge Base by William M. Trochim, Cornell University, Ithaca, NY (The Web Center for Social Research Methods) Web Interface for Statistics Education, Claremont Graduate University, Claremont, CA; contains
Page 25
Statistiek many tutorials, applets, and other goodies. Stats for sport scientists, by Will G. Hopkins, Auckland University of Technology, Auckland, New Zealand; ook zeer begrijpelijk voor studenten in de Letteren! Statistics Every Writer Should Know, by Robert Niles, Los Angeles Times. Rice Virtual Lab in Statistics, by David Lane, Rice University, Houston, TX; also contains HyperStat Online, a helpful tutorial. StatPages.Net, by John C. Pezzullo, Georgetown University, Washington, DC. VassarStats, by Richard Lowry, Vassar College, Poughkeepsie, NY. Fallacy Page (taxonomy of bad reasoning), by Bruce Thompson, Cuyamaca College, El Cajon, CA. glossary of statistical keywords, by D. Howell, University of Vermont
Je kunt ook een kijkje nemen op Hugo's beknopte Statistics tutorial (PDF, november 2007). HQ
2002-2008 GB 2008-2010 HQ/GB 2010-2011
Page 26