1.
Gegeven zijn de itemsores van 8 personen op een test van 3 items
Persoon 1 2 3 4 5 6 7 8
item 2 0 1 0 1 0 1 0 1
1 1 1 1 0 1 1 0 1
3 0 0 0 1 1 1 0 0
Er geldt: (a) de p-waarden van item 1 en item 2 zijn hetzelfde (b) de variantie van item 2 is groter dan de variantie van item 3* (c) persoon 1 maakt het makkelijkste item fout (d) het antwoordpatroon van persoon 4 voldoet aan het Guttman model
2.
Gegeven is de variantie/covariantiematrix voor 4 items
1 2 3 4
1 .25 .06 .06 .06
2 .06 .24 .06 .06
3 .06 .06 .25 .06
4 .06 .06 .06 .21
Er geldt: de variantie van de totaal score X= X1+X2 is kleiner dan de variantie van de totaalsore X=X2+X3 (a) (b) de alfacoëfficiënt voor deze vier items is gelijk aan .65 (c) het item met de hoogste item variantie is item 4 (d) de p-waarde van item 1 is p =.50*
3.
Onderstaande tabel geeft de scores van vier respondenten op een test waarvoor geldt dat S(X) = 10 en rxx’ =.91 Respondent 1 2 3 4
Score 50 60 70 80
Van welke respondenten kan men de betrouwbare scores onderscheiden als men uitgaat van een 95% betrouwbaarheidsinterval? (a) 1 en 2; 1 en 3; 1 en 4; 2 en 3; 2 en 4; 3 en 4, (b) 1 en 3; 1 en 4; 4 en 2* (c) 1 en 4 (d) bij geen van de respondenten
4.
Persoonscores in het model van dubbele monotonie worden gemeten op een (a) ordinale schaal* (b) intervalschaal (c) ratioschaal (d) verschilschaal
5.
Bij welk type tests treft men meestal dichotoom gescoorde items aan? (a) tests voor gedragswijze (b) projectietests (c) prestatietests* (d) persoonlijkheidstests
6.
Voor het Rasch model geldt (a) de item-responsfuncties snijden elkaar niet* (b) de item-responsfuncties hebben een verschillende steilheid (c) de item-test correlaties zijn gelijk aan 1 (d) de item-rest correlaties zijn gelijk aan 1
Figuur A 1 0,9 0,8 0,7
P(Succes)
0,6 0,5 0,4 0,3 0,2 0,1 0 -3
-2
-1
0
1
2
3
Theta
7.
In bovenstaan figuur ziet u twee item-responsfuncties. Beide functies kunnen worden beschreven (voldoen aan) (a) het Mokken model van monotone homogeniteit (b) het Mokken model van dubbele monotonie (c) het 2-parameter logistisch model van Birnbaum (d) geen van de drie bovengenoemde modellen*
8.
In de klassieke testtheorie geldt dat (a) r(E,T) = 0* (b) r(E,X) = 0 (c) r(E,T) > 0 (d) r(E,X) < 0
9.
Volgens Drenth en Sijtsma (2006) is de harde ondergrens die aan de betrouwbaarheid van een test moet worden gesteld (a) groter dan .7 (b) groter dan .8 (c) groter dan .9 (d) niet te geven*
10.
Test G en test H zijn rekenvaardigheidstests. Een onderzoeker gaat na of test G en test H parallelle tests zijn. De onderzoeker vindt de volgende resultaten
Gemiddelde score Variantie van de scores Correlatie met test F
Test G 35.3 12.4 0.3
Test H 35.3 12.4 0.2
De onderzoeker moet concluderen dat (a) test G en test H parallelle tests zijn want beide tests meten rekenvaardigheid (b) test G en Test H parallelle tests zijn want gemiddelde en variantie zijn gelijk (c) test G en Test H geen parallelle tests zijn want de correlatie met F verschilt* (d) op basis van dit onderzoek er geen uitspraak over parallellie gedaan kan worden
11.
Welk van de onderstaande beweringen is niet waar? De alfacoëfficiënt is (a) een ondergrens voor de betrouwbaarheid (b) kleiner dan of gelijk aan lambda2 (c) gelijk aan de gemiddelde splitsingsbetrouwbaarheid over alle mogelijke splitsingen (d) een maat voor interne consistentie*
12.
Onder kruisvalidering wordt verstaan: (a) het controleren van een voorspellingsmodel in een nieuwe steekproef* (b) het controleren van een voorspellingsmodel in een andere populatie (c) het valideren van een psychologische test tegen andere psychologische testen (d) het valideren van een psychologische test door middel van inhoudelijk onderzoek
13. Een maat voor het discriminerend vermogen van een item is: (a) de p-waarde (b) de item-rest correlatie* (c) de γ-parameter (d) de δ-parameter
14. De persoon-responsfunctie wordt vooral gebruikt bij onderzoek naar (a) item-responstheorie voor polytome items (b) afwijkende patronen van itemscores* (c) adaptieve tests (d) vraagonzuiverheid
15.
De uitspraak “In hoeverre zijn de items van de CITO-toets Rekenen-Wiskunde representatief voor hetgeen moet worden aangeleerd op dit gebied op de basisschool?” heeft betrekking op: (a) indruksvaliditeit (b) inhoudsvaliditeit* (c) constructvaliditeit (d) divergente validiteit
16. Een test bestaat uit twee Rasch items met moeilijkheidsparameters 0 en 1. Wat is de kans dat iemand met een θ-waarde van 1 beide items goed beantwoord? (a) .30 (b) .37* (c) .42 (d) .55 17.
Beschouw de volgende beschrijving van een testpsycholoog (echte situatie!) “Vanuit het Ambulatorium onderzoek ik een meisje van ruim 9 jaar, leerling van een ZML-school. Ouders hebben haar aangemeld omdat zij van mening zij dat hun dochter in het speciale klasje (MG-groep) te weinig leert. Een van de criteria om naar een regulier groep te gaan, is het hebben van een IQ boven de 35. Het meisje heb ik nu psychologisch onderzocht met de non-verbale Wisc (WNV). Wanneer ik deze binnen haar eigen leeftijdscategorie scoor, komt er een IQ <55 uit. De test differentieert niet onder de 55” “De test differentieert niet onder de 55”. Dit komt omdat: (a) er te weinig moeilijke items zijn (b) er te weinig spreiding is in de γ-parameters (c) de betrouwbaarheid te laag is (d) er te weinig makkelijke items zijn*
18.
Bij selectie van kandidaten voor een functie is er een trend om psychologische tests thuis te laten afnemen (via internet) in plaats van bij een selectiebureau. Dit draagt niet bij aan de (a) standaardisatie* (b) interbeoordelaarsbetrouwbaarheid (c) efficiëntie (d) synthetische validiteit
19. Een onderzoeker concludeert dat het 2-parameter model van Birnbaum geen goede beschrijving geeft van haar data. Welk item-responsmodel geeft dan ook geen goede beschrijving van de data? (a) het Rasch model * (b) het Mokken model van monotone homogeniteit (c) het 3-parameter logistisch model (d) de opties (a), (b), en (c) zijn onjuist
20.
De ruwe scores op Rekentest I correleren 0.60 met de ruwe scores op Rekentest II. Om interpretatie te vereenvoudigen worden de ruwe scores op beide rekentests getransformeerd tot z-scores. De correlatie tussen de z-scores op Rekentest I en Rekentest II is nu: (a) kleiner dan 0.60 (b) gelijk aan 0.60* (c) groter dan 0.60 (d) niet in het algemeen te zeggen
21.
Drenth en Sijtsma (2006) noemen een aantal voordelen van adaptief testen ten opzichte van testen met behulp van een standaard test. Welk van de onderstaande alternatieven hoort daar niet bij? (a) de testtijd is relatief kort (b) een afwijkend item score patroon wordt snel herkend* (c) per respondent wordt een nauwkeurige meting verricht (d) snelle terugkoppeling van resultaten
22. Bereken de ontbrekende cumulatieve proporties in het volgende voorbeeld: X F P CP 3 3 .3 ? 4 1 .1 ? 5 1 .1 ? 6 5 .5 1.0 (a) (b) (c) (d)
.6, .6, .4 .5, .8, 1.0 .3, .3, .2 .3, .4, .5 *
23. Van een test, bestaande uit 40 vragen met elk 4 antwoordmogelijkheden, maakt iemand 32 vragen goed en 8 fout. Als de assumpties voor toevalscorrectie waar zijn, wat is dan het reële kennispercentage van deze persoon ? (a) 0.700 (b) 0.733 * (c) 0.750 (d) 0.800
24. Toepassing van correctie voor raden: a. heeft geen effect op de betrouwbaarheid van de test * b. heeft een negatief effect op de betrouwbaarheid van de test c. heeft een positief effect op de betrouwbaarheid van de test d. kan zowel een positief als een negatief effect op de betrouwbaarheid van de test hebben
25. Een linksscheef verdeelde variabele wordt dusdanig lineair getransformeerd dat het gemiddelde van 10 naar 50 toegaat. De verdeling is dus naar rechts opgeschoven op de meetschaal (hoger gemiddelde). Dit zorgt ervoor dat.. a. De verdeling na de lineaire transformatie minder linksscheef verdeeld is b. De verdeling na de lineaire transformatie even linksscheef verdeeld is * c. De verdeling na de lineaire transformatie meer linksscheef verdeeld is d. Hierover valt zonder meer gegevens geen uitspraak te doen
26. I. Bij een heterogene test bepalen we de ondergrens van de betrouwbaarheid met behulp van een gestratificeerde alfa. II. Bij een heterogene test zullen alle items sterk met elkaar correleren. a. Stelling I is juist * b. Stelling II is juist c. Stelling I en II zijn beiden juist d. Stelling I en II zijn beiden onjuist
27. I. Bij een sterke curvelineaire relatie tussen test en criterium zal de correlatie zwak zijn. II. Bij valideringsonderzoek is het altijd van belang dat de correlatie sterk positief is. a. Stelling I is juist * b. Stelling II is juist c. Stelling I en II zijn beiden juist d. Stelling I en II zijn beiden onjuist
28. Bij welke modellen wordt er geen relatie gelegd tussen itemscores en de latente trek? a. bij de mokken modellen b. bij de parametrische modellen c. bij het Gutmann model d. bij het model volgens de klassieke testtheorie *
29. Als je het aantal ten onrechte afgewezen en het aantal ten onrechte toegelaten personen zo klein mogelijk wilt houden, moet je er voor zorgen dat
a. b. c. d.
de selectieratio omhoog gaat de toevalskans zo klein mogelijk is de puntenwolk een rechtlijnig verband geeft de correlatie tussen predictor en criterium hoog is *
30. Het begrip concurrent validity heeft betrekking op de relatie tussen testprestaties en (a) op een eerder tijdstip verkregen criteriumprestaties (b) op een later tijdstip verkregen criteriumprestaties (c) op hetzelfde tijdstip verkregen criteriumprestaties* (d) criteriumprestaties ongeacht het tijdstip waarop de criteriumprestaties verkregen zijn
31. De KR20 (Kuder-Richardson) is (a) een maat voor de interbeoordelaarsbetrouwbaarheid (b) de alfacoëfficiënt voor binaire items* (c) de betrouwbaarheid van een test bij een lengte van 20 items (d) een bovengrens voor de betrouwbaarheid