ONBETWIST
ONderwijs verBETeren met WISkunde Toetsen
Redactieraad statistiek, statistiek taxonomie en itemconstructie procedures
Bert Esmeijer, Dirk Tempelaar, Emile van Berkum, Adriaan Kalwij,Jan Renaud, & Maarten Boerlijst
Deliverable 3.3
ONBETWIST
Deliverable 3.3
ONBETWIST
ONderwijs verBETeren met WISkunde Toetsen
Inleiding Op de ONBETWIST startbijeenkomst is een redactieraad statistiek geformeerd, welke de onderwerpen statistiek en kansrekening onder zijn hoede neemt. De redactieraad is samengesteld uit (in volgorde van opbouw van statistische onderwerpen): • • • • •
Bert Esmeijer, OU, VWO statistiek Dirk Tempelaar, UM, beschrijvende statistiek (tevens contactpersoon projectaansturing) Emile van Berkum,TUE, kansrekening Adriaan Kalwij, & Jan Renaud, UU, hypothesetoetsing Maarten Boerlijst, UvA, Regressie & Variantieanalyse
Er is een globale taakverdeling gemaakt over de vijf af te dekken hoofdgebieden, die ieder aan een eerst verantwoordelijk redactielid zijn toegewezen. Er zijn afspraken gemaakt om voor het begin van het nieuwe academische jaar, voor elk van de deelonderwerpen een voldoende aantal items klaar te hebben, dat daaruit een representatieve toets kan worden samengesteld. Items zullen steeds tweetalig zijn (Engels en Nederlands), en computer-scoorbaar (in het algemeen meerkeuze).
Statistiek onderwerpstaxonomie Vertrekkend vanuit de MathTax taxonomie die in het NKBW project is gebruikt, is een eerste versie van een statistiek en kansrekening taxonomie opgesteld. Deze is een uitbreiding van het negende hoofdstuk van de MathTax. Alle bestaande onderwerpen uit de MathTax zijn gehandhaafd: deze staan hieronder zonder steraanduiding (*) weergegeven. Handhaving betekent niet dat voor al die bestaande onderwerpen ook items ontwikkeld gaan worden: sommige MathTax onderwerpen, zoals bijvoorbeeld 9.3.8: Overlevingsanalyse, lijken buiten de gevraagde toepassingen in de onderwijsprojecten te gaan vallen. In een latere fase zullen dergelijke lege onderwerpcategorieën verwijderd worden. Nieuw toegevoegde, of ten opzichte van de oorspronkelijke MathTax uitgebreide, onderwerpcategorieën zullen in principe wel allemaal afgedekt worden. Duidelijk moet zijn dat de taxonomie een dynamische status zal hebben, en dat dit enkel de eerste versie kan zijn: in het proces van item-constructie zullen mogelijk nieuwe categorieën aangemaakt moeten worden, categorieën gesplitst worden wanneer ze te dicht bevolkt raken, of categorieën samengevoegd moeten worden die juist te dun bevolkt blijven.
ONBETWIST
Deliverable 3.3
ONBETWIST
9 9.1 9.1.1* 9.1.1.1* 9.1.1.2* 9.1.2*
ONderwijs verBETeren met WISkunde Toetsen
9.1.2.1* 9.1.2.2*
Kansrekening en statistiek Dataverwerking Experimenten: factoren, factorniveaus, respons, experimentele eenheden, behandeling Experimentele en controle-groep, blind en dubbel-blind experiment, placebo, blocking Blocking, matching, confounding Steekproeven en surveys; enkelvoudige toevalssteekproef, clustersteekproef, gestratificeerde steekproef, multi-stage steekproef, systematische steekproef Bias/vertekening: respons bias, non-respons bias Representativiteit, vrijwillige respons, gelegenheidssteekproef, onderdekking
.1.3* 9.2 9.2.1 9.2.1.0* 9.2.1.1* 9.2.1.2* 9.2.1.3*
Data en metingen; Categoriale en kwantitatieve data Beschrijven en representeren van data Beschrijvende statistiek Frequentieverdeling Meten van centrum: gemiddelde, modus, mediaan Meten van spreiding: variantie, standaardeviatie, bereik, interkwartielafstand Vorm frequentieverdeling: scheefheid, kurtosis, unimodaal, bimodaal
9.2.2 9.2.2.1 9.2.2.1.1* 9.2.2.1.2* 9.2.2.1.3* 9.2.2.2 9.2.2.2.1* 9.2.2.3* 9.2.2.4*
Datarepresentatie Grafieken en plaatjes Grafieken en plaatjes voor categoriale data: staafdiagram, taartdiagram Grafieken en plaatjes voor kwantitatieve data: histogram, box-plot Grafieken en plaatjes voor data met tijdsdimensie: lijngrafiek Tabellen Kruistabel Spreidingsdiagram Datatransformaties, logaritmische transformatie
9.3 9.3.1
Inductieve statistiek en technieken Verdelingen van steekproeven
9.3.2 9.3.2.1.1* 9.3.2.1.2* 9.3.2.2.1* 9.3.2.2.2*
Regressie en correlatie Associatie Correlatie, correlatiecoëfficiënt, Spearman Rho, Kendall Tau Respons- of afhankelijke variabele; Predictor- of onafhankelijke variabele Enkelvoudige regressie, regressiehelling, regressieconstante, kleinste-kwadratenmethode, residu Residuanalyse, outlier, invloedrijke punten, hefboomeffect, lurking variabelen Regressie-inferentie: t-toets regressiecoëfficiënt, betrouwbaarheidsinterval regressiecoëfficiënt, predictie-interval gemiddelde, predictie-interval individuele waarde
9.3.2.2.3* 9.3.2.2.4*
ONBETWIST
Deliverable 3.3
ONBETWIST
ONderwijs verBETeren met WISkunde Toetsen
9.3.2.2.5*
Multipele regressie: t-toets regressiecoëfficiënt, F-toets regressiemodel, ANOVA-tabel, partiële regressie, verklaarde variatie, R , aangepaste R
9.3.3 9.3.3.1* 9.3.3.2* 9.3.3.3*
Betrouwbaarheidsintervallen Betrouwbaarheidsinterval voor enkele proportie: z-interval, foutmarge, kritieke waarde Betrouwbaarheidsinterval voor verschil in proporties: z-interval Betrouwbaarheidsinterval voor enkel gemiddelde: t-interval, foutmarge, kritieke waarde, tverdeling, vrijheidsgraden Betrouwbaarheidsinterval voor verschil gemiddelden onafhankelijke steekproeven: tinterval Betrouwbaarheidsinterval voor verschil gemiddelden gepaarde steekproeven: t-interval
9.3.3.4* 9.3.3.5* 9.3.4 9.3.4.1* 9.3.4.2*
Toetsingstheorie Nulhypothese, alternatieve hypothese, eenzijdig alternatief, tweezijdig alternatief Type I fout, alfa, betrouwbaarheidsniveau, Type II fout, beta, significantieniveau, onderscheidingsvermogen, effectomvang 9.3.4.3* 1-proportie z-toets 9.3.4.4* 2-proporties z-toets, pooling 9.3.4.5* 1-gemiddelde t-toets 9.3.4.6* 2-gemiddelden t-toets, gepoolde t-toets, niet-gepoolde t-toets 9.3.4.6* 2-gemiddelden gepaarde t-toets 9.3.4.8* tekentoets 9.3.4.9* Rang-som toets 9.3.4.10* Chi-kwadraat toets 9.3.4.10.1* Chi-kwadraat toets voor aanpassing 9.3.4.10.2* Chi-kwadraat toets voor homogeniteit 9.3.4.10.3* Chi-kwadraat toets voor onafhankelijkheid 9.3.5 9.3.6 9.3.7 9.3.7.1* 9.3.7.1.1* 9.3.7.1.2* 9.3.8 9.3.9
Kwaliteitscontroles Non-parametrische technieken Multivariate technieken Variantie-analyse Enkelvoudige variantie-analyse: een-weg ANOVA, F-toets, behandelingsvariantie, foutvariantie Meervoudige variantie-analyse: twee-weg ANOVA, F-toets, additiviteit, interactie Overlevingsanalyse Bayesiaanse statistiek
9.4 9.4.1 9.4.1.1 9.4.1.2
Kansrekening Grondslagen van de kansrekening Kansruimten en gebeurtenissen Algemene regels: somregel, productregel, totale-kans regel
ONBETWIST
Deliverable 3.3
ONBETWIST
ONderwijs verBETeren met WISkunde Toetsen
9.4.1.2*a 9.4.1.2*b 9.4.1.3 9.4.1.4
Voorwaardelijke (conditionele) kansen Onafhankelijkheid. Theorema van Bayes Combinaties en permutaties Toevalsgetallen
9.4.2 9.4.2.1 9.4.2.1.*a 9.4.2.1.*b 9.4.2.1.1 9.4.2.1.2 9.4.2.1.3 9.4.2.1.3*a 9.4.2.1.4 9.4.2.1.5 9.4.2.2 9.4.2.2.*a 9.4.2.2.*b 9.4.2.2.1*a 9.4.2.2.1 9.4.2.2.2 9.4.2.2.*3 9.4.2.3 9.4.2.3*a
Verdelingen Discrete verdelingen Kansverdeling, Kansmassa, Cumulatieve kansverdeling Gemiddelde en variantie Homogene (Uniforme) verdeling Binomiale verdeling Geometrische verdeling Negatief Binomiale verdeling Hypergeometrische verdeling Poisson verdeling Continue verdelingen Kansverdeling, Kansdichtheidsfunctie, Cumulatieve kansverdeling Gemiddelde en variantie Homogene (Uniforme) verdeling Exponentiële, Erlang, Gamma verdelingen Normale verdeling Weibull, Lognormale, Beta verdelingen Verwachtingswaarde Variantie en standaardafwijking
9.4.3 9.4.3.1 9.4.3.2 9.4.3.3*
Limietstellingen Centrale limietstelling Wet van de grote aantallen Standaardfout
9.4.4 9.4.4.1 9.4.4.2 9.4.4.2a* 9.4.4.3 9.4.4.4* 9.4.4.5* 9.4.4.6*
Multivariate verdelingen Simultane verdeling Marginale verdeling Voorwaardelijke (conditionele) verdeling Verwachtingswaarde Covariantie en correlatie Onafhankelijkheid. Meer dan twee kansvariabelen Lineaire functies van kansvariabelen (ihb normale variabelen)
9.4.5 9.4.5.1 9.4.5.2 9.4.5.3
Stochastische processen Brownse beweging Markov ketens Wachtrijtheorie
ONBETWIST
Deliverable 3.3
ONBETWIST
9.4.6 9.4.7
ONderwijs verBETeren met WISkunde Toetsen
Waarschijnlijkheidsmaten Simulatie
Itemclassificatie Deze taxonomie is leidend in het item-constructieproces: in principe moet ieder benoemd deelonderwerp voldoende afgedekt worden. Tevens zal de taxonomie één van de classificatie criteria zijn; alle items zullen op de volgende dimensies worden geclassificeerd: • Onderwerpstaxonomie • Vaardigheidsniveau volgens het A: Reproductie, B: Verbindingen, en C: Reflectie criterium ontleend aan de PISA studies, en eerder gebruikt in het NKBW project • Moeilijkheidsgraad volgens een 4-punts schaal, in overeenstemming met NKBW • Onderdeel uitmakend van VWO leerstof: ja/nee. Dit laatste criterium is specifiek voor het statistiek domein, omdat de VWO-A leerstof onderdeel vormt van het programma van de meeste universitaire opleidingen.
Bronnen Bronnen zullen divers zijn: oude examens, leerboeken, vergelijkbare (internationale) projecten voor toetsing en toetsgestuurd leren. Tevens ligt het in de bedoeling ‘schaduwitems’ (equivalente, gehercontextualiseerde items) te maken van bekende, nationale toetsen als AP Statistics uit de USA.
ONBETWIST
Deliverable 3.3