go RAPPORT 17. De constructie van een meerkeuzetoets voor het meten van schrijfvaardigheid
SVO nr. 6201
Erik van Schooten
Juni 1988
Stichting Centrum voor Onderwijsonderzoek van de Universiteit van Amsterdam Grote Bickersstraat 72 1013 KS Amsterdam
Deze uitgave werd mogelijk gemaakt door de steun van de Stichting Kohnstamm Fonds voor Onderwijsresearch.
CIP-GEGEVENS Schooten, Erik van De constructie van een meerkeuzetoets voor het meten van schrijfvaardigheid/Erik van Schooten - Amsterdam: Stichting Centrum voor Onderwijsonderzoek van de Universiteit van Amsterdam: Stichting Kohnstamm Fonds voor onderwijsresearch [distri - (SCO rapport; 178) SVO nr. 6201.
ISBN 90-6813-202-4 SISO 475.24 UDC 371.26:372.45 Trefw.: Schrijfvaardigheid; multiple choice.
Alle rechten voorbehouden. Niets uit deze uitgave mag worden verveelvoudigd, opgeslagen in een geautomatiseerde gegevensbestand, of openbaar gemaakt, in enige vorm of op enige wijze, hetzij electronisch, mechanisch, door fotokopieën, opnamen, of op enige andere manier, zonder voorafgaande schriftelijke toestemming van de uitgever.
All rights reserved. No part of this publication may be reproduced, stored in a retrieval system, or transmitted, in any form or by any means, electronic, mechanical, photocopying, recording, or otherwise, without the prior written permission of the publisher.
Prijs: f. 20,-- excl. porto Te bestellen bij: Stichting Kohnstamm Fonds voor Onderwijsresearch. mevr. W. Sargentini Grote Bickersstraat 72 1013 KS Amsterdam tel. 020-264547 ISBN 90-6813-202-4 Copyright: Stichting Kohnstamm Fonds voor Onderwijsresearch
0. VOORWOORD Dit rapport bevat het verslag van een deelonderzoek van het S VOproject 6573 'Constructie en validering van gestructureerde schrijfvaardigheidstoetsen'. In dit deelonderzoek (SVO nr. 6201) is een meerkeuzetoets voor het meten van schrijfvaardigheid geconstrueerd. Deze toets zal in het vervolg van project 6573 gebruikt worden. Achter in het rapport is de toets in zijn geheel opgenomen. De uitvoerder van het onderzoek werd betaald als Adspirand Onderzoeker door de Stichting voor Onderzoek van het Onderwijs. Het project is uitgevoerd aan de Stichting Centrum voor Onderwijsonderzoek aan de Universiteit van Amsterdam. Bij deze wil ik de leerlingen en de leraren bedanken die bereid waren hun medewerking aan het onderzoek te verlenen, evenals Jette van der Sande, die naast typewerk ook de helft van de toetsafnames voor haar rekening nam. Daarnaast heb ik veel steun ondervonden van Gert Rijlaarsdam en Kees de Glopper, die eerdere versies van dit rapport uitgebreid van commentaar hebben voorzien.
Amsterdam, 1988 Erik van Schooten
INHOUDSOPGAVE: 0. 1. 1.1. 1.2. 1.3.
PAGINA
Voorwoord Inleiding Achtergrond van het onderzoek Cova Doel van dit deelonderzoek van Cova Opzet van het rapport
2. 2.2. 2.3. 2.4. 2.4.1. 2.4.2. 2.4.2.1. 2.4.2.2.
Literatuurstudie Soorten validiteit Het verzamelen van literatuur Resultaten van de literatuurstudie De inhoudsvaliditeit De criteriumvaliditeit Schrijfopdrachten als criterium Lerarenoordelen en cijfers van schrijfcursussen als criteria 2.4.2.3. Conclusie over de criteriumvaliditeit 2.4.3. De constructvaliditeit van meerkeuzetoetsen om schrijfvaardigheid te meten 2.5. Conclusies 3. Instrumentatie
1 1 6 8 9 9 13 13 14 15 15 30 31 32 39 41
4. 4.1. 4.2.
Steekproeftrekking en afname Steekproeftrekking Afname
55 55 58
5. 5.1. 5.2. 5.3.
Resultaten van de data-analyses Opzet van het hoofdstuk Betrouwbaarheidsanalyses Toetsing van het model op grond waarvan het meetinstrument is geconstrueerd Rasch-schalingen Twee parallelle subtests
59 59 59
5.4. 5.5.
74 87 98
6. Conclusies en aanbevelingen voor nader onderzoek
105
Literatuur
109
Bijlage 1: Overzicht geraadpleegde studies
116
Bijlage 2: Beschrijving vragen uit studies in Bijlage 1
136
Bijlage 3: De toets
140
Bijlage 4: Itemverdeling over de subtests, de goede antwoorden en de bevraagde probleemtypen per vraag
229
1. INLEIDING In dit rapport wordt de constructie en beproeving beschreven van een meerkeuzetoets voor het meten van schrijfvaardigheid. De constructie van deze toets is van belang voor een onderzoek waarin verschillende methoden om schrijfvaardigheid te meten met elkaar vergeleken worden. Het onderzoek is getiteld: Constructie en validering van gestructureerde schrijfvaardigheidstoetsen. In de rest van dit verslag wordt het onderzoek aangeduid als "Cova". 1.1. ACHTERGROND VAN HET ONDERZOEK COVA Vanaf het begin van deze eeuw is er een discussie gaande over welke methode de beste is om schrijfvaardigheid te meten. De problemen bij het meten van schrijfvaardigheid worden veroorzaakt doordat de hoeveelheid foutenvariantie bij schrijfvaardigheidsmetingen vaak erg groot is. Er worden in de literatuur verschillende bronnen van foutenvariantie onderscheiden, te weten: de schrijvervariabele, de taak-variabele, de beoordelaars-variabele en de beoordeelaars-onenigheid. (Braddock e.a. 1963:6; McColly 1970: 149; French 1962; Wesdorp 1978). Hieronder wordt kort uitgelegd wat er met deze variabelen bedoeld wordt. De schrijver-variabele Deze meetfout wordt veroorzaakt, doordat een proefpersoon niet altijd even goed in vorm is. Kincaid (geciteerd in Cooper, 1984: 4) vond dat vooral schrijfprestaties van betere schrijvers variëren van dag tot dag. Dit betekent dat deze foutenvariantie gecorreleerd kan zijn met de ware score. De taak-variabele Deze "foutenvariantie" wordt veroorzaakt, doordat niet alle schrijfopdrachten gelijk zijn en de prestaties van schrijvers verschillen per schrijfopdracht. Braddock e.a. (1963) noemen als verschillende zaken die de prestaties van schrijvers over taken doen verschillen: het onderwerp van de schrijfopdracht; de communicatieve stijl van het te schrijven stuk (informatief, commentariërend, persuasief, imperatief of diverterend), de toegestane schrijftijd en de situatie waaronder de toets wordt afgenomen. Zo zeggen Braddock e.a. (1963: 17) "... the topic a person writes on affects the caliber of his writing." en zij noemen vele studies die dit aantonen. French (McColly 1970: 152) verklaart dit als volgt: "The composition test is almost like a one item test. Some students may happen to enjoy the topic assigned, while others may find it 1
difficult and unstimulating; this results in error". Dit zou betekenen dat men meer opstellen per student moet laten schrijven om tot een valide meting van de schrijfvaardigheid te komen. Carlson & Camp (1985) vonden echter evenveel verschil tussen de scores op twee verschillende opstellen van één student over hetzelfde onderwerp als tussen twee opstellen met verschillende onderwerpen. Andere foutenvariantie-bronnen dan de specifieke keuze van een onderwerp, zouden dus van meer invloed kunnen zijn. Naast het onderwerp bepaalt de in de opdracht gevraagde communicatieve stijl de kwaliteit van het geschreven stuk. In onderzoek van Quellmalz & Capell (1979), Capell & Quellmalz (1980) en Quellmalz e.a. (1982) wordt aangetoond dat schrijfopdrachten in verschillende communicatieve stijlen verschillende prestaties van de proefpersonen laten zien. Zij concluderen dat schrijfopdrachten in verschillende communicatieve stijlen verschillende vaardigheden meten en dat deze vaardigheden gescheiden gemeten moeten worden. (Zie ook Prater & Padia (1983); Veal & Tillman (1971).) Het stellen van een beperkte tijdsduur waarbinnen de opdracht voltooid moet worden, levert ook error. Naast schrijfvaardigheid wordt dan tevens gemeten hoe snel iemand op ideeën kan komen, hoe goed iemand presteert onder druk, of iemand in één keer goed begint (want opnieuw beginnen of reviseren is bij een opdracht van 20 á 30 minuten vrijwel ondoenlijk), enz. Coffman (1971: 284) stelt dat je bij schrijfopdrachten waarbij een tijdlimiet gesteld wordt, zelfs de schrijfsnelheid meet. Bij foutenvariantie veroorzaakt door de situatie waaronder de toets wordt afgenomen tenslotte, moet gedacht worden aan alle factoren die van invloed kunnen zijn op de prestaties van proefpersonen en veroorzaakt worden door de specifieke afnamesituatie. Men kan hierbij denken aan testangst, wiebelende tafeltjes, lawaai, lichtgebrek, enz.
De beoordelaars-variabele Deze "foutenvariantie" wordt veroorzaakt, doordat beoordelaars bij het beoordelen van schrijfopdrachten over het algemeen maar matig met zichzelf overeenstemmen. Een opstel dat bij een eerste beoordeling een hoog cijfer kreeg, kan bij een volgende beoordeling van dezelfde beoordelaar een gemiddeld cijfer krijgen. Dit kan liggen aan vermoeidheid van de beoordelaar, aan onvermogen om de kwaliteit van schrijfprodukten exact te beoordelen, aan de volgorde waarin de opstellen worden aangeboden, enz. Zo vonden Coffman & Kurfman (1968: 105) dat de opstellen die het eerst beoordeeld werden, hogere cijfers kregen dan de laatstbeoordeelde opstellen. Zij stellen daarbij dat deze error vaak niet ontdekt wordt, doordat de correlaties tussen beoordelaars gelijk blijven als de volgorde van 2
de te beoordelen schrijfprodukten en het effect daarvan voor alle beoordelaars gelijk zijn.
Beoordelaars-onenigheid Deze bron van error betreft het gebrek aan overeenstemming tussen verschillende beoordelaars. Coffman (1966:26) berekende, uitgaande van data uit een onderzoek van Godshalk, Swineford & Coffman (1966) dat een score gebaseerd op één opstel beoordeeld door vijf beoordelaars een inter-beoordelaarsbetrouwbaarheid zou hebben van .70. In het projekt Cova wordt nagegaan of men de beoordelaars- en taak-variabiliteit en de beoordelaars-onenigheid bij de meting van schrijfvaardigheid zou kunnen beperken door het gebruiken van gestructureerde opdrachten. Om de taak-variabiliteit te kunnen reduceren is gekeken naar welke processen een rol spelen bij het schrijven. Hayes & Flower (1980) ontwikkelden op grond van hardop-denk protocollen een model van het schrijfproces. Zij onderscheiden de processen; doelbepalen, informatie genereren, informatie ordenen, formuleren en reviseren. Het is mogelijk om de schrijfopdracht aan een schrijver zodanig votin te geven, dat één of meer van deze processen minder aan bod hoeven te komen en zo kan men de aan deze processen inherente taakvariabiliteit aan banden leggen. Naarmate de opdracht gestructureerder wordt, spelen steeds minder van de bovengenoemde schrijfprocessen een rol. Een overzicht van opdrachten en de processen waar zij een beroep op doen, staat in tabel 1.1. Uit deze tabel blijkt dat er op meer processen een beroep gedaan wordt, naarmate de opdracht meer open wordt. De gesloten opdracht (meerkeuzetoets) vergt van de proefpersoon uitsluitend revisie. De correctie-opdracht, waarbij de proefpersoon daadwerkelijk een aangeboden tekst reviseert en fragmenten herformuleert, is iets minder beperkt. Bij de gestructureerde opdracht moet de proefpersoon daadwerkelijk schrijven, maar het schrijfdoel en de benodigde informatie worden hem gegeven. De bepaalde opdracht beslist, doordat onderwerp en publiek gegeven worden, over het doel van de schrijver, maar laat hem verder vrij. Tenslotte is de open opdracht de minst beperkte. Bij deze opdracht komen alle schrijfprocessen aan bod.
3
Tabel 1.1. Opdrachtvormen en de processen waar zij een beroep op doen. Opdrachtvorm Proces
gesloten opdracht
correc- gestruc- bepaalde open tie-op- tureerde opdracht opdracht dracht opdracht
doelbepalen informatie genereren informatie organiseren formuleren reviseren (+ = er wordt beroep gedaan op het betreffende proces; - = er wordt geen beroep gedaan op het betreffende proces) Het spreekt voor zich dat als men het gehele schrijfproces wil meten, de open opdracht potentieel de grootste validiteit heeft. Een probleem is echter dat ongewenste taakvariabiliteit met de vrijheid van de opdracht toeneemt, zodat er meer opdrachten per proefpersoon nodig zijn om tot een enigszins betrouwbare score te komen. Bovendien levert de open opdracht ook voor beoordelaars problemen op. De oorzaken van ongewenste beoordelaarsvariabiliteit en beoordelaars-onenigheid worden hieronder behandeld. De Groot (1961) noemt een vijftal effecten die verantwoordelijk kunnen zijn voor ongewenste beoordelaarsvariabiliteit en -onenigheid. Deze effecten zijn: het signifisch effect, veroorzaakt doordat beoordelaars verschillende ideeën hebben over wat goed en wat minder goed is; het halo-effect, veroorzaakt door ongewenste uitstraling van het oordeel over één variabele naar het oordeel over een andere variabele; het sequentie-effect, veroorzaakt door de volgorde waarin de schrijfprodukten worden beoordeeld, waardoor zeer goede of slechte schrijfprodukten als ongewenst referentiepunt 4
gaan functioneren en tot te hoge of te lage scores voor opvolgende produkten kunnen leiden; het normverschuivingseffect, veroorzaakt door de neiging van beoordelaars om zich aan het te beoordelen materiaal aan te passen (qua gemiddelde en spreiding) of door een persoonlijke neiging van de beoordelaar om streng of soepel te oordelen; en het contaminatie-effect, veroorzaakt door de neiging van beoordelaars die belang hebben bij een bepaalde uitslag, om de beoordelingen aan de door hen gewenste uitslag aan te passen. Het is mogelijk om de opdracht aan de beoordelaar zodanig te formuleren, dat aan één of meer van de bovengenoemde effecten het hoofd wordt geboden. In tabel 1.2. staat een overzicht van beoordelingsmethoden en de mate waarin deze methoden gevoelig zijn voor negatieve beoordelingseffecten. Tabel 1.2. De bestrijding van verstorende effecten door verschillende beoordelingsmethoden. Effecten beoordelings- signifisch halo- sequentie- not inver-contaminamethode schui- tievingsholistische (globale) beoordeling analytische beoordeling schaalbeoor- beoordeling
+
+
+
+
scoringsvoor- schriften
+
+
+
+
+
precodering (b.v. meerkeuzetoets) (- = effect wordt niet tegengegaan + = effect wordt tegengegaan) Tabel 1.2. laat zien dat er meer ongewenste effecten worden bestreden naarmate men de beoordelaar meer aan banden legt. Bij de 5
holistische beoordeling kunnen alle ongewenste effecten optreden. Bij de analytische beoordeling krijgt de beoordelaar een analytisch schema als leidraad waarin de verschillende te beoordelen kenmerken van de schrijfprodukten worden gedefinieerd. Door de explicitering van de te beoordelen aspecten kan het signifisch effect tegengegaan worden. Bij de beoordeling met behulp van een beoordelingsschaal wordt, per te beoordelen kenmerk, een reeks van in kwaliteit opklimmende voorbeeldopstellen gepresenteerd. Deze schaal dient als referentiekader voor de beoordelaar. Op deze manier worden dus zowel het signifisch als het halo-, sequentie- en normverschuivingseffect tegengegaan. Beoordeling van schrijfprodukten met behulp van scoringsvoorschriften en "beoordeling" van geprecodeerde instrumenten zijn methoden waarbij alle effecten tegengegaan worden, doordat de beoordelaar vrijwel "buitenspel" staat. Als we tabel 1.1. en 1.2. combineren zien we welke meetmethoden het minste last van beoordelaars- en taakvariabiliteit en beoordelaarsonenigheid hebben. In tabel 1.3. neemt de potentiële validiteit van de metingen van kolom 1 naar kolom 5 toe, omdat er steeds meer processen van het schrijven bij de opdrachten een rol kunnen spelen. De potentiële betrouwbaarheid neemt van kolom 1 naar kolom 5 af, omdat de mogelijke beoordelaars- en taakvariabiliteit en beoordelaarsonenigheid toeneemt. De potentiële betrouwbaarheid neemt ook af van rij 5 naar rij 1; dit omdat er van rij 5 tot 1 steeds meer effecten op kunnen treden die de beoordelaarsvariabiliteit en -onenigheid vergroten. 1.2. DOEL VAN DIT DEELONDERZOEK VAN COVA Het doel van het projekt Cova is, om uit te zoeken welke meetmethode gezien de validiteit, de betrouwbaarheid en de kosten van de verschillende methoden, de beste is. Hiertoe zullen verschillende soorten toetsen van de 25 mogelijke soorten die in tabel 1.3. onderscheiden worden, geconstrueerd en afgenomen worden. De validiteit van de verschillende toetsen zal geëvalueerd worden door de toetsen te correleren met de tot nog toe als meest valide geachte toetsingsprocedure: de open opdracht, beoordeeld door een jury aan de hand van opstelschalen. Het deelonderzoek dat hier gerapporteerd wordt, heeft betrekking op het construeren van een zo valide mogelijke meerkeuzetoets voor het meten van schrijfvaardigheid (de cel linksonder in tabel 1.3.). Voor het Cova-onderzoek is verder van belang dat de meerkeuzetoets in twee parallelle subtests te splitsen is. Zoals uit 6
Tabel 1.3. Mogelijke combinaties van typen opdrachten en beoordelingsmethoden. Op de diagonaal worden mogelijke toetsen als voorbeeld omschreven. Opdrachten beoorde- lingswijze
gesloten correctie 1
gestruc- tureerde 3
2
bepaalde open 4
globaal 1
open opdracht met globale beoordeling bepaalde opdracht met analytische beoordeling
analytisch 2
gestructureerde opdracht met schaalbeoordeling
schaal 3
scorings- voor- schrift 4 preco- dering 5
5
correctietoets met scoringsvoorschr. meerkeuze toets
7
paragraaf 1.1. blijkt, kan verwacht worden dat de betrouwbaarheid van de meting met een meerkeuzetoets minder problemen op zal leveren dan de validiteit. Bij de constructie van de toets zal dus vooral naar een optimale validiteit gestreefd moeten warden. 1.3. OPZET VAN HET RAPPORT In hoofdstuk twee wordt een literatuuronderzoek naar de uit onderzoek gebleken validiteit van objectieve schrijfvaardigheidstoetsen beschreven. In hoofdstuk drie wordt het classificatieschema op grond waarvan de toets is gemaakt, beschreven, evenals de constructie van de vragen. Hoofdstuk vier betreft de steekproeftrekking en de afname van de toetsen. In hoofdstuk vijf worden de verschillende technieken waarmee de data geanalyseerd zijn en de resultaten van de data-analyse beschreven. Hoofdstuk zes, tenslotte, bevat de conclusie van dit onderzoek en suggesties voor eventuele verdere analyse van de data.
8
2. LITERATUURSTUDIE 2.1. DOEL VAN DE LITERATUURSTUDIE In dit hoofdstuk wordt verslag gedaan van een literatuurstudie. De vraag die met deze literatuurstudie beantwoord moet worden, luidt: Welke aanwijzingen zijn er voor de validiteit van objectieve schrijfvaardigheidstoetsen? In paragraaf 2.2. wordt het begrip "validiteit" uitgelegd en een overzicht gegeven van de verschillende aanwijzingen die men voor de validiteit van een meetinstrument kan verzamelen. In paragraaf 2.3. wordt uiteengezet hoe de literatuur is verzameld, in paragraaf 2.4. worden de resultaten van de literatuurstudie gepresenteerd en in paragraaf 2.5. staan de conclusies.
2.2. SOORTEN VALIDITEIT Er kunnen op verschillende manieren gegevens verzameld worden om de validiteit van een meetinstrument te evalueren. Op welke manieren men naar aanwijzingen moet zoeken voor de validiteit van een meetinstrument, hangt af van het doel waarvoor men het meetinstrument wil gebruiken. Een gangbare indeling voor het verschillende feitenmateriaal dat men ter ondersteuning van de validiteit van een meetinstrument kan verzamelen, is de indeling in: aanwijzingen met betrekking tot de inhoud van een toets; aanwijzingen met betrekking tot een criterium, en aanwijzingen met betrekking tot de theorie op grond waarvan het meerinstrument is geconstrueerd. (Standards, 1985). Hoewel men eigenlijk niet over verschillende sóórten validiteit kan spreken, worden de drie bovengenoemde categorieën bewijzen ook wel aangeduid als de "inhoudsvaliditeit", de "criteriumvaliditeit" en de "constructvaliditeit" van een meetinstrument (Meerling, 1981; Allen & Yen, 1979; Cook & Campbell, 1979). Om omslachtige formuleringen te vermijden zullen deze laatste drie termen verder in dit rapport gehanteerd worden. De inhoudsvaliditeit wordt bepaald door een individueel, subjectief oordeel over de inhoud van een toets. Er zijn twee soorten inhoudsvaliditeit; face-validiteit en logische validiteit. Face-validiteit is de mate waarin een meetinstrument op het eerste gezicht lijkt te meten wat het behoort te meten. Deze validiteit beperkt zich dus tot de intuïtie van de beoordelaar van 9
een meetinstrument. Logische validiteit is de mate waarin een toets het te meten domein bestrijkt. Een schrijfvaardigheidstoets die alleen spelvaardigheid meet, is bij voorbeeld maar matig logisch valide, daar schrijfvaardigheid meer behelst dan alleen spelvaardigheid. De criteriumvaliditeit van een toets is de mate waarin de scores op de toets correleren met een relevant criterium. De scores op een schrijfvaardigheidstoets kunnen bij voorbeeld gerelateerd worden aan lerarenoordelen over de schrijfvaardigheid van de proefpersonen. Als de schrijfvaardigheidstoets (criterium-)valide is en het criterium deugt, zal de correlatie tussen de twee groepen scores substantieel moeten zijn. De constructvaliditeit van een meetinstrument is de mate waarin het instrument het theoretische begrip meet dat het instrument beoogt te meten. Het bepalen van de construct-validiteit van een toets is een continu proces. Op grond van de uitkomsten van dergelijk onderzoek kan het meetinstrument worden aangepast of de theorie worden bijgesteld, waarna opnieuw onderzoek naar de constructvaliditeit van het instrument gedaan kan worden. Onderzoek naar de constructvaliditeit van een toets wordt gedaan door op grond van de theorie over het te meten begrip voorspellingen te doen over hoe de testscores zich ten opzichte van andere variabelen zouden moeten verhouden in bepaalde situaties. Deze voorspellingen worden vervolgens getoetst. Als de voorspellingen uitkomen, kunnen de gegevens als ondersteuning van de constructvaliditeit van de betreffende toets opgevat worden. Komen de voorspellingen niet uit, dan zijn er verschillende verklaringen mogelijk: het experiment is verkeerd uitgevoerd, of de theorie op grond waarvan de voorspellingen zijn gedaan deugt niet, of de toets meet het te meten begrip niet. Alle toetsbare voorspellingen kunnen gebruikt worden om de constructvaliditeit te ondersteunen. Hieronder vallen ook de voorspellingen die horen bij de hierboven behandelde criteriumvaliditeit. Eén methode om de constructvaliditeit van een meetinstrument te onderzoeken is het voorspellen van groepsverschillen als deze uit de theorie volgen. Men noemt dit ook wel 'known-group' validiteit. Men kan bij voorbeeld voorspellen dat twaalfjarigen gemiddeld lager zullen scoren op een schrijfvaardigheidstoets, dan achttienjarigen. Een tweede methode om de constructvaliditeit te evalueren is het op grond van theorie voorspellen en vervolgens toetsen van verandering. Men kan bij voorbeeld veronderstellen dat de schrijfvaardigheid toeneemt, naarmate proefpersonen meer schrijfcursussen hebben gevolgd. Een derde methode om de constructvaliditeit van een toets te 10
evalueren is het proberen te achterhalen welke processen een rol spelen bij het beantwoorden van de toetsvragen. Men kan bij voorbeeld proefpersonen vragen hoe zij bepaalde toetsvragen proberen op te lossen of proefpersonen hardop laten denken tijdens het oplossen van de vragen. Zo zou kunnen blijken dat bepaalde vragen van een toets die rekenvaardigheid moet meten, door sommige proefpersonen niet opgelost kunnen worden, omdat er te moeilijke woorden in de opgaven staan. De toets meet dan voor deze proefpersonen naast rekenvaardigheid ook de kennis van moeilijke woorden en is voor deze proefpersonen dus niet valide. Een vierde methode om de constructvaliditeit van een meetinstrument te verifiëren is het onderzoeken van de interne structuur van de metingen van het construct. Deze interne structuur kan op verschillende manieren onderzocht worden. Men kan door middel van factor-analyse proberen te achterhalen welke oplossingsprocessen een rol spelen bij het beantwoorden van de toetsvragen. In het bovenstaande voorbeeld van een rekentoets die tevens woordkennis meet, zouden bij een factoranalyse twee factoren gevonden kunnen worden. Eén factor waarop de vragen laden die geen moeilijke woorden bevatten, en één factor met ladingen van vragen die wel moeilijke woorden bevatten. Ook kan door middel van factor-analyse nagegaan worden of men (statistisch gezien) één vaardigheid meet met een toets. Als een factor-analyse van de matrix van tetrachorische correlatiecoëfficiënten tussen alle vragen één ,factor oplevert, zijn de vragen statistisch gezien unidimensioneel. Een andere manier om met behulp van factor-analyse de interne structuur van een toets te evalueren, is het toetsen van het factoriële model op grond waarvan de toets is gemaakt. Soms wordt een te meten begrip bepaald door verschillende aspecten. Indien men met behulp van een model ( bij voorbeeld een facet-design ) de verschillende aspecten van het begrip heeft gecategoriseerd en de onderlinge samenhang van de verschillende aspecten heeft vastgelegd in een model, kan een vragenlijst worden samengesteld waarin alle aspecten van het begrip als gedefinieerd in het model zijn vertegenwoordigd. Vervolgens kan men met behulp van toetsende factor-analyse bepalen in hoeverre de gevonden data passen in het vooraf, op grond van de theorie, ontwikkelde model. Nadelen van deze methode zijn dat de matrix positief definiet moet zijn om hem te kunnen factor-analyseren en dat wanneer er niet één maar meer factoren gevonden worden, onzeker is of de toets één of meer vaardigheden meet. 11
Een speciale vorm van deze laatste soort van constructvalidatie is de zogenaamde multi-trait, multi-method analyse (Campbell & Fiske, 1959). Deze methode wordt gebruikt om na te gaan hoe groot de effecten van de gehanteerde meetmethode zijn. Men meet hiertoe twee of meer verschillende begrippen ("traits" of "trekken"), alle op twee of meer verschillende manieren (methods). Men kan bij voorbeeld de begrippen 'spelvaardigheid' en 'woordkennis' beide meten met rneerkeuze- en met open vragen. Als de beide begrippen. valide (en betrouwbaar) gemeten worden, moeten de correlaties tussen twee toetsen die met twee verschillende methoden hetzelfde begrip meten, hoger zijn dan tussen twee toetsen die verschillende begrippen meten, zelfs als deze verschillende begrippen op dezelfde manier (hier met open of gesloten vragen) gemeten zijn. In het bovenstaande voorbeeld moeten spelvaardigheid gemeten met meerkeuzevragen en spelvaardigheid gemeten met open vragen meer samenhangen dan spelvaardigheid gemeten met meerkeuzevragen en woordkennis gemeten met meerkeuzevragen. In de praktijk blijken toetsen die gelijke methoden hanteren soms meer samen te hangen dan toetsen die gelijke begrippen moeten meten. Men spreekt dan van 'method-bias'. Tot slot kan nog een manier om de interne structuur van een toets te evalueren naar voren worden gebracht. Als een toets bedoeld is om één vaardigheid te meten (unidimensioneel moet zijn) kan met behulp van latente-trek modellen geverifieerd worden of alle vragen statistisch gezien unidimensioneel zijn (een Guttmanschaal vormen). Tevens kan met deze analysetechniek bepaald worden welke vragen niet aan de unidimensionaliteit voldoen. Door inhoudelijke analyses van niet schaalbaar gebleken vragen kan nagegaan worden waardoor het niet passen van de betreffende vragen wordt veroorzaakt (Hambleton & Swaminathan, 1985). Een vijfde methode ter evaluering van de constructvaliditeit is het op grond van theorie voorspellen van een patroon van correlaties tussen het te meten construct en andere constructen. Men onderscheidt bij dit soort onderzoek convergente en divergente validiteit. De convergente validiteit wordt ondersteund als de te evalueren toets blijkt samen te hangen met bepaalde variabelen en deze samenhang op grond van de theorie omtrent het te meten begrip voorspeld werd. Zo kan men voorspellen dat een meting van schrijfvaardigheid zal correleren met metingen van andere taalvaardigheden. De divergente validiteit van een toets wordt ondersteund door aan te tonen dat de toets niet samenhangt met theoretisch niet verwante variabelen. Zo kan men voorspellen dat schrijfvaardigheid niet samenhangt met rekenvaardigheid. 12
2.3. HET VERZAMELEN VAN DE LITERATUUR Er is op twee manieren gezocht naar literatuur over de validiteit van objectieve schrijfvaardigheidstoetsen. Ten eerste is er met behulp van de computer gezocht in het ERIC-bestand (Educational Resources Information Center) dat bij de S.C.O is ondergebracht. Ten tweede is door middel van de zogenaamde 'sneeuwbalmethode' via overzichtsartikelen gezocht naar relevante literatuurverwijzingen. Daarnaast zijn de jaargangen 1980 tot en met 1986 van de tijdschriften 'Journal of Educational Measurement', 'Research in the Teaching of English' en 'Tijdschrift voor Taalbeheersing' op relevante publikaties bekeken. In het ERIC-bestand is gezocht naar publikaties die zijn gepubliceerd in de periode van 1966 tot 1987. Het zoekprofiel bestond uit twee delen. Deel één bevatte de trefwoorden 'writing assessment', 'writing evaluation' en 'writing composition'. Het tweede deel bevatte de trefwoorden 'objectieve test', 'objectively scored test', 'multiple choice', 'standardized test', 'objective measurement', 'objective assessment', 'indirect measurement', 'indirect test', 'indirect assessment', 'measurement techniques' en 'test format'. Er is eerst gekeken naar bronnen die een trefwoord uit deel één en een trefwoord uit deel twee bevatten. Dit zoekprofiel leverde 177 bronnen. Vervolgens is gekeken naar alle bronnen die op deze manier werden geselecteerd en die tevens het woord 'validity' als trefwoord kenden. Deze combinatie leverde 45 bronnen op. De in het ERIC-bestand gevonden publicaties zijn op grond van de door 'ERIC' geleverde uittreksels geselecteerd. Ruim 40% van de in de search gevonden publicaties leek relevant voor de onderzoeksvraag. Alleen die publicaties zijn bekeken die ofwel op micro-fiche te verkrijgen waren uit het ERIC-bestand, ofwel in tijdschriften stonden die in de S.C.O.-bibliotheek te vinden waren. Het aantal gebruikte publicaties betreft ongeveer 30% van de 177 in de search gevonden publicaties. De uiteindelijk gebruikte publikaties staan vermeld in de literatuurlijst. 2.4. RESULTATEN VAN DE LITERATUURSTUDIE De resultaten van de literatuurstudie worden beschreven per soort validiteit, in dezelfde volgorde als is aangehouden in paragraaf 2.2. We kijken dus eerst naar de inhoudsvaliditeit van de meerkeuzetoetsen om schrijfvaardigheid te meten.
13
2.4.1. DE INHOUDSVALIDITEIT De inhoudsvaliditeit is onder te verdelen in face-validiteit en logische validiteit. Vele auteurs spreken zich negatief uit over de face-validiteit van meerkeuzetoetsen om schrijfvaardigheid te meten. Het belangrijkste bezwaar dat uit de literatuur naar voren komt, is dat bij dit soort toetsen de proefpersonen niet schrijven. Verschillende auteurs menen dat er daardoor alleen receptieve en geen produktieve vaardigheden met meerkeuzevragen gemeten kunnen worden (Eley, 1955; Braddock e.a., 1963; McColly, 1970; Bonset, 1974; Wesdorp, 1974; Cooper & Odell, 1977; Bamberg, 1982; Arrasmith, Sheehan & Applebaum, 1984). Hiermee wordt bedoeld dat alleen de vaardigheid in het herkennen van fouten en het corrigeren van gegeven tekst gemeten wordt, en niet de vaardigheid in het produceren van tekst. Een ander punt dat naar voren wordt gebracht is dat meerkeuzetoetsen zich alleen lenen voor vragen waarbij het gaat om een duidelijke tweedeling in goede en foute antwoorden. Vaardigheden als het produceren van een goede stijl of het goed structureren van een tekst, waarbij niet zozeer van 'goed' of 'fout' maar eerder van 'goed' en 'minder goed' sprake is, zouden niet in meerkeuzevorm gesteld kunnen worden (Matalene, 1982; Stiggins, 1982). Met betrekking tot de logische validiteit (de mate waarin het te meten domein bestreken wordt) is er ook kritiek op meerkeuzetoetsen om schrijfvaardigheid te meten. Vele auteurs menen dat deze toetsen teveel de nadruk leggen op het zinsniveau en te weinig de complexere vaardigheden meten die voor het schrijven van belang zijn. Met andere woorden, dat deze toetsen teveel nadruk leggen op spelling en grammatica en te weinig op organisatie, creativiteit, het verzinnen van de inhoud, stijl, publiekgerichtheid, enz. (Braddock e.a., 1963; Bonset & Griffioen, 1972; Breland, 1977b; Stiggins, 1981; Veal & Hudson, 1981; Breland & Jones, 1982; Bamberg, 1982; Matalene, 1982; Carison & Camp, 1985; Benton & Kiewra, 1986). Cooper (1984: 9) stelt echter dat schrijven, en vooral schools schrijven, juist veel 'editorial proofing' en 'revision' vereist en dat meerkeuzetoetsen daarom juist wel valide zijn. Ook menen enkele auteurs (Noyes, 1963; Diederich, 1974) dat de vaardigheden gemeten met meerkeuzetoetsen en directe schrijfvaardigheidsmetingen, hoewel niet identiek, toch zo verwant zijn dat schrijfvaardigheid wel met meerkeuzetoetsen gemeten kan worden. Concluderend kan gesteld worden dat de inhoudsvaliditeit van meerkeuzetoetsen om schrijfvaardigheid te meten overwegend negatief beoordeeld wordt in de literatuur.
14
2.4.2. DE CRITERIUMVALIDITEIT In het in de literatuur gevonden onderzoek naar de criteriumvaliditeit van meerkeuzetoetsen om schrijfvaardigheid te meten worden drie verschillende criteria gebruikt, te weten: scores van proefpersonen op één of meer schrijfopdrachten, lerarenoordelen over de schrijfvaardigheid van de proefpersonen en cijfers voor schrijfcursussen. Studies die het eerstgenoemde criterium hanteren zullen worden behandeld in paragraaf 2.4.2.1. In paragraaf 2.4.2.2 worden studies behandeld die een van de twee andere criteria gebruiken. 2.4.2.1. SCHRIJFOPDRACHTEN ALS CRITERIUM De waarde van onderzoek naar de criteriumvaliditeit van meerkeuzetoetsen om schrijfvaardigheid te meten, hangt af van de deugdelijkheid van het gebruikte criterium. Deze hangt af van de betrouwbaarheid en validiteit van het instrument waarmee het criterium bepaald is. De betrouwbaarheid en de validiteit van opstelbeoordelingen met behulp van beoordelaars, hangen af van de volgende factoren: - het aantal schrijfopdrachten per leerling, - het aantal communicatieve stijlen waarin deze opdrachten geschreven moeten worden, en - het aantal gebruikte beoordelaars per schrijfopdracht. Coffman (1966: 154) berekende op grond van de uitkomsten van het onderzoek van Godshalk, Swineford & Coffman (1966) met behulp van de Spearman-Brown formule dat, om een validiteitscoëfficiënt en score-betrouwbaarheid van ongeveer .80 elk te krijgen, er vier opdrachten per proefpersoon, elk beoordeeld door drie beoordelaars nodig zijn. Eénzelfde resultaat kan bereikt worden met drie schrijfopdrachten en vijf beoordelaars, of met vijf schrijfopdrachten en twee beoordelaars. Voor één opdracht beoordeeld door één beoordelaar berekende Coffman een validiteitscoëfficiënt van .46. Als we stellen dat een deugdelijk criterium minstens een validiteitscoëfficiënt van .70 moet hebben, blijkt uit de berekeningen van Coffman dat er dan minstens drie opdrachten, elk beoordeeld door twee beoordelaars nodig zijn, of twee opdrachten elk beoordeeld door drie beoordelaars. Bij de behandeling van de criteriumvaliditeit van meerkeuzetoetsen om schrijfvaardigheid te meten zal vooral gekeken worden naar studies waarbij het criterium aldus of beter geoperationaliseerd is. 15
De studies die criteria hanteren die aan bovenstaande normen voldoen, zijn in tabel 2.1. met een ster aangegeven. Deze studies zijn die van Godshalk, Swineford & Coffman (1966) (vijf opdrachten, vier stijlen, vijf beoordelaars), Wesdorp (1974) (vijf opdrachten, vier stijlen, vijf beoordelaars), Clemson (1978) (vier opdrachten, vier stijlen, twee beoordelaars), Huntley, Schmeiser & Stiggins (1979) (drie opdrachten, een onbekend aantal stijlen, twee beoordelaars), Moss, Cole & Khampalikit (1982) (twee opdrachten, twee stijlen, vier beoordelaars) en Weiss & Jackson (1983) (vier opdrachten, vier stijlen en twee beoordelaars). In tabel 2.1. staat een overzicht van de resultaten van de voor dit onderzoek bekeken studies op het gebied van de criteriumvaliditeit van meerkeuzetoetsen om schrijfvaardigheid te meten. Een uitgebreider versie van tabel 2.1. is te vinden in bijlage 1. In de tabel worden per studie de leeftijd van de proefpersonen, de steekproefgrootte en de correlatie tussen de meerkeuzetoets en het criterium gegeven. Achter de gevonden correlatie tussen de meerkeuzetoets en het criterium staat de voor attenuatie gecorrigeerde correlatie, mits deze uit de in de studies gepresenteerde gegevens te berekenen viel. Er zijn een aantal vragen van belang met betrekking tot de criteriumvaliditeit van de meerkeuzetoetsen. Ten eerste moet gekeken worden naar de samenhang tussen de totale meerkeuzetoetsen en de criteria. Als de meerkeuzetoetsen valide zijn, moet deze samenhang redelijk tot goed zijn. Een correlatie van 0 tot .20 is als zeer laag te beschouwen (maximaal 4% verklaarde variantie), een correlatie van .20 tot .40 als laag (maximaal 16% verklaarde variantie), een correlatie van .40 tot .60 is matig (maximaal 36% verklaarde variantie), een correlatie van .60 tot .80 is redelijk (maximaal 64% verklaarde variantie) en een correlatie groter dan .80 is hoog te noemen (minstens 64% verklaarde variantje). De (voor attenuatie) gecorrigeerde correlaties tussen de meerkeuzetoetsen en de criteria zullen dus minstens .60 moeten zijn om redelijk genoemd te kunnen worden. Afhankelijk van waar men de meerkeuzetoetsen voor wil gebruiken, kunnen verschillende minimale waarden voor de validiteitscoëfficiënt gesteld worden. Als men de toetsen wil gebruiken om individuele leerlingen te selecteren (examens) moet de validiteitscoëfficiënt hoger zijn, dan wanneer men verbanden tussen variabelen wil aantonen. De gemiddelde (ongecorrigeerde) correlatie tussen de meerkeuzetoetsen en de criteria van de in de tabel met een ster aangegeven studies is .62 en de mediaan .69. (De studie van Weiss & Jackson blijft hier buiten beschouwing, omdat in deze studie de correlatie tussen de totale meerkeuzetoets en het criterium niet gegeven wordt.) Vooral de correlaties gevonden in de studie van Moss, Cole 16
& Khampalikit zijn laag. Als we deze studie niet meerekenen is de gemiddelde ongecorrigeerde correlatie .70. Van de overige studies is de gemiddelde ongecorrigeerde correlatie .57. Waarschijnlijk is dat deze correlatie lager is vanwege de geringere validiteit van de voor deze studies gebruikte criteria. De hoogste voor attenuatie gecorrigeerde correlaties zijn .86 (Clemson, 1978), .97, .86, .89, .90 (Breland & Gaynor, 1979), .90, .99 (Hogan & Mishler, 1980), .86 (Hudson & Veal, 1981) en .90 (Koffler, 1984). De proporties verklaarde variantie bedragen bij deze studies ongeveer .80. De correcties voor attenuatie zijn meestal gebaseerd op de inter-beoordelaarsbetrouwbaarheid van de schrijfopdrachten en Cronbachs alpha (of KR-20) voor de meerkeuzetoetsen. Alpha is een ondergrens van de ware betrouwbaarheid en daardoor worden de gecorrigeerde correlaties te hoog. De inter-beoordelaarsbetrouwbaarheid is echter een overschatting van de ware betrouwbaarheid, waardoor de gecorrigeerde correlaties weer te laag uitvallen. In hoeverre deze onder- en overschatting van de verschillende betrouwbaarheidscoëfficiënten elkaar bij de correcties opheffen, is onbekend. Uit het voorgaande kan geconcludeerd worden dat de criteriumvaliditeit van de meerkeuzetoetsen van het voor deze studie bekeken onderzoek redelijk tot goed is. Ten tweede is de vraag relevant of de criteriumvaliditeit van de meerkeuzetoetsen afhankelijk is van de leeftijd van de proefpersonen. Het is mogelijk dat de vaardigheden die met de meerkeuzetoetsen gemeten kunnen worden, alleen goed differentiëren tussen proefpersonen die in een bepaalde leeftijdscategorie thuishoren. Stel, bij voorbeeld, dat de meerkeuzetoetsen alleen spelvaardigheid zouden meten. In dat geval is het denkbaar dat de meerkeuzetoetsen hoog correleren met een andere schrijfvaardigheidsmaat als de proefpersonen jong zijn en nog niet 'perfect' kunnen spellen en laag of niet meer correleren met een andere schrijfvaardigheidsmaat als de proefpersonen ouder zijn en vrijwel perfect kunnen spellen. Ook is het mogelijk dat bij de jongere proefpersonen het verschil in schrijfvaardigheid vooral door verschillen in spelvaardigheid bepaald worden, terwijl bij oudere proefpersonen de verschillen in schrijfvaardigheid meer door andere vaardigheden (organiseren van tekst o.i.d.) bepaald worden. Er zal dus in de tabel gekeken moeten worden of er systematische verschillen in criteriumvaliditeit te constateren zijn die samengaan met verschillende leeftijden van de proefpersonen.
17
Tabel 2.1. Overzicht van de resultaten van studies naar de criteriumvaliditeit van meerkeuzetoetsen voor de meting van schrijfvaardigheid. De studies met de beste criteria zijn met een ster aangegeven. Onderzoeker
Leeftijd
N
*Godskalk e.a. (1966)
16-17
646
.71-.77
*Wesdorp (1974)
12
213 213
.68 .67
.78 .77
*Clemson (1978)
13
567 567
.72 .70
.86
*Huntley, Schmeiser & S tiggins (1979)
18
50 50 50 50 50 50
.67 .51 .53 .69 .58 .66
*Breland & Gaynor (1979)
18
819 926 517 697 278 234 261 288 294
.63 .56 .58 .72 .72 .76 .72 .74 .69 .12 .39 .47
*Moss, Cole & Khampalikit (1982)
9 12 15
83 40 94
*Weiss & Jackson (1983)
18
224 224 224
Rxy
.53-.63 .56-.66 .44-.54
N = aantal proefpersonen Rxy = de correlatie met het criterium Rxy' = de voor attenuatie gecorrigeerde correlatie 18
Rxy'
.97 .86 .89 .90
.20 .67 .75
Onderzoeker
Leeftijd
N
Rxy
Rxy'
Spooner Smith (1978)
16-17
103
.65
.76
Hartnett (1978)
18
7
.61
Crocker e.a. (1979)
9
112
.55
Quellmalz & Capell (1979)
16-17
40
.23-.52
Hogan & Mishler (1980)
8 13 8 13
140 150 65 65
.69 .66 .76 .83
.79 .78 .90 .99
Hudson & Veal (1981)
15
258 233 257 276
.70 .42 .40 .57
.86 .55 .60 .76
Halpin e.a. (1981)
19-20
172
.49
.55
Bamberg (1982)
18
?
Culpepper & Ramsdell (1982)
18
202
.56
Gorrell (1983)
18
103
.65
Koffler (1984)
14
7326
.37-.71
Benton & Kiewra (1986)
18-21
105
.47
19
.20-.30 .61
.59-.90
In de in de tabel vermelde studies lopen de leeftijden van de proefpersonen van acht tot éénentwintig jaar. Als we naar de tabel kijken zien we geen aanwijzingen dat de correlaties hoger of lager zijn bij bepaalde leeftijdsgroepen. Alleen Moss, Cole & Khampalikit (1982) vonden lagere correlaties bij jongere proefpersonen en zij veronderstellen dat de hoogte van de correlaties tussen meerkeuzetoetsen om schrijfvaardigheid te meten en schrijfopdrachten mede bepaald worden door de leeftijd van de proefpersonen. Zij vonden voor negenjarigen een correlatie van .12, voor twaalfjarigen een correlatie van .39 en voor vijftienjarigen .47. Daar staat tegenover dat Crocker, Ondrasik & Lamme (1979) voor negenjarigen een correlatie van .55 vonden en Hogan & Mishler (1980) voor achtjarigen een correlatie van .69 en één van .76 en voor dertienjarigen een correlatie van .66 en één van .83. Wesdorp (1974) vond voor twaalfjarigen een correlatie van .68 en één van .67, Clemson (1978) vond voor dertienjarigen .72 en .70 en Koffler (1984) voor veertienjarigen een correlatie van .68 en één van .71. Alle hier gemelde correlaties zijn ongecorrigeerd. De correlatie tussen de leeftijd van de proefpersonen en de gevonden gecorrigeerde correlatie tussen meerkeuzetoets en criterium is .11. Alleen die studies zijn bij het berekenen van deze correlatie betrokken, waarvan een gecorrigeerde correlatie was te bepalen. Deze correlatie is zeer laag, de proportie verklaarde variantie is .01. Dat Moss, Cole & Khampalikit (1982) lagere correlaties vonden voor jongere proefpersonen kan misschien verklaard worden door het gebruikte criterium. Zij lieten als een van de twee schrijfopdrachten een verslag van een les over natuurwetenschap schrijven. Voor negen- en twaalfjarigen lijkt dit wat hoog gegrepen en het is denkbaar dat een dergelijke opdracht naast schrijfvaardigheid ook kennis van natuurwetenschap meet. Daarnaast is in dezelfde studie het patroon van de correlaties tussen de meerkeuzetoets en een somscore van alle categorieën van een analytische beoordeling van de schrijfopdrachten niet gekoppeld aan leeftijd. De correlaties tussen de somscores van de analytische beoordelingen van de schrijfopdrachten en de gemaakte meerkeuzetoetsen zijn voor negen-, twaalf- en vijftienjarigen respectievelijk .42, .27 en .60 (gecorrigeerd .68, .60 en 76). De conclusie van het bovenstaande is dat de criteriumvaliditeit van meerkeuzetoetsen om schrijfvaardigheid te meten niet afhankelijke lijkt te zijn van de leeftijd van de proefpersonen. Ten derde is de vraag van belang of de manier waarop de directe schrijfopdrachten zijn beoordeeld, de correlatie met het criterium beïnvloedt. Schrijfopdrachten kunnen holistisch of analytisch beoordeeld worden en het is mogelijk dat een gesommeerde analytische 20
score over het algemeen een hogere of lagere correlatie met een meerkeuzetoets vertoont dan een holistische score. De manier waarop de schrijfopdrachten worden beoordeeld, lijkt wel invloed te hebben op de hoogte van de gevonden criteriumvaliditeit. Zo vonden Veal & Hudson (1981) dat de meerkeuzetoets 'Iowa Test of Basic Skins' (I.T.B.S.) .83 correleerde met een score die was opgebouwd uit een sommering van alle analytische oordelen over de schrijfopdracht, terwijl het holistische oordeel over de schrijfopdracht .70 met de I.T.B.S. correleerde. Ook Moss, Cole & Khampalikit (1982) vonden dat de meerkeuzetoets hoger correleerde met de somscore van de analytische oordelen over een schrijfopdracht dan met de holistische score. Voor negenjarigen respectievelijk .42 en .12 (gecorrigeerd .68 en .20), voor twaalfjarigen respectievelijk .27 en .39 (gecorrigeerd .60 en .67) en voor vijftienjarigen respectievelijk .60 en .47 (gecorrigeerd .76 en .75). Bij deze studie werd het verschil in correlaties dus alleen voor negenjarigen gevonden. Een mogelijke verklaring van de verschillen in gevonden correlaties is dat de betrouwbaarheden van de gesommeerde analytische oordelen hoger zijn dan die van de holistische beoordelingen. Deze gegevens kunnen ook betekenen dat er bij de holistische beoordeling iets anders gemeten wordt, dan bij de analytische beoordeling en de meerkeuzetoetsen. Dit kan zitten in zaken als creativiteit of originaliteit, maar ook in onbelangrijke kenmerken van de schrijfprodukten zoals het handschrift. In ieder geval lijken gesommeerde analytische oordelen over schrijfopdrachten hoger met meerkeuzetoetsen te correleren dan holistische oordelen over schrijfopdrachten. De vierde vraag die interessant is, is de vraag welke meerkeuzesubtests het hoogst met de criteria correleren en dus de beste criteriumvaliditeit bezitten. Op grond van de criteriumvaliditeit van de verschillende subtests kan bepaald worden welke subtests er in de voor dit onderzoek te construeren meerkeuzetoets moeten komen. Ook nu weer geldt, hoe beter het criterium, hoe waardevoller de informatie. De studies van beang zullen hieronder worden besproken. Een overzicht van wat voor subtests er in de verschillende studies gebruikt zijn, is te vinden in tabel 2.2. Uit de tabel blijkt dat de subtests 'grammatica', 'woordkeus en idioom', 'spelling', 'interpunctie' en 'hoofdlettergebruik ' het meest frequent voorkomen in de meerkeuzetoetsen. Ook de subtests 'volgorde zinnen bepalen', 'hoofdgedachte van de tekst aangeven', 'stijl' en 'logica en evaluatie' komen in verscheidene meerkeuzetoetsen voor. In tabel 2.3. worden de correlaties tussen subtests en criteria 21
Tabel 2.2 De verdeling van de subtests over de meerkeuzetoetsen. subtests: 1. volgorde zinnen bepalen 2. één zin in alinea plaatsen 3. de beste vervolgzin kiezen 4. de beste zin kiezen als illustratie van een generalisatie 5. hoofdgedachte van de tekst aangeven 6. aangeven welk woord in een nieuw te formuleren zin voorkomt 7. grammatica 8. woordkeus / idioom 9. spelling 10.interpunctie 11.hoofdlettergebruik 12.aangeven waar een nieuwe alinea begint 13.woordkennis 14.stijl 15.1ogica en evaluatie 16.doel- en publiekgerichtheid 17.antoniemen 18.analogieën 19.studievaardigheden 20.luistervaardigheid
1 2 3 4 5 6 7 8 9 10 Totaal x
x
x x
4
x
1 x
1
x
x
x
2
x
x
3
x
1
x x
xxxxxxx 8 x x x x x 6
x x
x
x x x x x x x x x x x x x x
x 7 x 7 x 6
x
x
1
x x x
x
x
x x
2 3 3
x
1
x x
x
1 1 1
x
1
1 = Godshalk, Swineford & Coffman (1966) 2 = Spooner Smith (1978) 3 = Clemson (1978) 4 = Huntley, Schmeiser & Stiggins (1979) 5 = Crocker, Ondrasik & Lamme (1979) 6 = Hogan & Mishler (1980) 7 = Hudson & Veal (1981) 8 = Halpin (1981) 9 = Weiss Jackosn (1983) 10 = Koffler (1984)
gepresenteerd. Omdat de naamgeving van de subtests in de verschillende studies niet uniform is, wordt in bijlage 2 omschreven wat voor soort vragen een bepaalde subtest bevat, mits dit uit de literatuur viel op te maken. Godshalk, Swineford & Coffman (1966) onderscheidden zes subtests: paragraph organization, usage, sentence correction, prose groups, error recognition en construction shift. Duidelijk is dat de indeling zowel is gebaseerd op de vorm als op de inhoud van de vragen. Categorie twee en drie correleren het hoogst met het criterium (.71 en .71). De vragen uit deze categorieën betreffen grammatica, woordkeus, spelling en interpunctie. De eerste categorie, paragraph organization, correleerde het laagst met het criterium (.46). Spooner Smith (1978) hanteerde een meerkeuzetoets waarin zij zes categorieën vragen onderscheidde: focus, development, paragraphing, support, organization en error recognition. Ook deze indeling is zowel op de vorm als op de inhoud van de vragen gebaseerd. De categorieën twee, drie, vijf en zes correleerden het hoogst met het criterium, dat bestond uit de somscore van twee holistisch beoordeelde opstellen (gecorrigeerd respectievelijk .86, .59, .78 en .68). Clemson (1978) onderscheidde vijf categorieën vragen: spelling, capilization & punctuation, usage, en logic & evaluation. Een beschrijving van de verschillende categorieën vragen wordt niet gegeven en alle categorieën correleerden ongeveer even hoog met het criterium (± .50). Huntley, Schmeiser & Stiggins (1979) gebruikten voor hun onderzoek verschillende meerkeuzetoetsen. De ACT-English Usage Test, de ACT-rhetorical proficiency tests 1 en 2, de SAT-verbal en de SAT-Test of S tandard Written Engli sh (S AT-TS WE). DeACT-English Usage Test correleerde het hoogst met het criterium. Deze subtest van de ACT correleerde bijna even hoog met het criterium als de totale ACT-test (respectievelijk .67 en .69). Hieruit kunnen we opmaken dat de ACT-rhetorical proficiency 1 en 2, die zich vooral op doel- en publiekgerichtheid richten, weinig bijdroegen aan de criteriumvaliditeit van de totale ACT. De SAT-TS WE correleerde bijna even hoog met het criterium als de ACT-English Usage Test. Crocker, Ondrasik & Lamme (1979) hanteerden een meerkeuzetoets met vier categorieën vragen: word-knowledge, reading comprehension, language arts en spelling. De subtest 'reading comprehension' correleerde het hoogst met het criterium en was de enige significante voorspeller van het criterium (p= .05) in een regressie-analyse. Helaas worden de betrouwbaarheidscoëfficiënten van de verschillende subtests niet gegeven, zodat onduidelijk is of de significante voorspelling van deze subtest door een hogere 23
-
Tabel 2.3. De correlaties tussen subtests en criteria Studie
Subtest
.46
spelling - capitalization and punctuation - usag e - logic and evaluation
.55 .52
.76 .70
.47 .54
.61 .67
.56
.69
.62
.77
.53 .63
.69 .80
.62
.79
.24 .46 45 9. 35 .55 .53
.44 .86 .9
* Weiss &
jSgn (183 -
pooner mit 197k)
Crocker e.a. (1979)
Rxy'
paragraph organisation usage senrence correction prose groups error recognition consb-uction shift
WClogigialk e.a. (1966)
* Clemson (1978)
Rxy
leeftijd
N
16-17
646
13
567
18
224
16-17
103
9
112
.71 .71 .57 .59 .65
reading comprehension logical relations word-use usage and grmmar sente a nce structure
- focus - development organization - suppo rt . - paraging raph - errorrecognition -
word knowledge reading omprehension an gu age arts spelling
- f
.55
.78 .68
.45 .52 .30 .43
N = het aantal proefpersonen Rxy = de correlatie met het criterium Rxy' = de voor attenuatie gecorrigeerde correlatie 24
Tabel 2.3 Studie
Pirlrier& (1980)
(vervolg) Rxy
Subtest -
- - -
-
-
punctuation and capitalizanon listening comprehension usage grarnmar and syntax spelling . study skills punctuanon and capitalization usage grammar and syntax spelling _ study skills punctuation and capitalizanon listening comprehension usage grammar and syntax spelling _ study skills punctuanon and capitalization usage grammar and syntax spelling _ study skills
25
Rxy'
.55 .57 .64 .68 .61 .68 .68 .61 .54 .60 .61 .73 .62 .63 .64 .68 .79 .77 .81 .79 .71 .77
.13
leeftijd
N
8
140
150
Tabel 2.3 (vervolg) Rxy Rxy'
Studie
Subtest
Hudson & Veal (198 1)
.52 - spelling . - capitalizanon .60 .65 - punctuation .65 - usage - paragraph .48 organization lefter .54 - spelling.29 - capitalization .23 - punctuation .3 .42 - usa ge - senrence .16 structure paragraph .29 organization .24 essay letter .29 -.06 - spelling . capitalizanon -.20 nctuan on us9 .2 puage ..35 .37 - senrence structure -.09 paragraph organization _ spelling . .43 - capitalization .44 .45 - punctuation .51 - usage - sentence .53 structure .47 - paragaph organizanon essay .35 .5 letter
1 (-11 1gier. .a.
.40 - punctuation - capitalization .3255 - grammar .g - s pel ling .35 - st le e - parag raph organization
26
.45 . .g .47 .36
leef- N tijd 15 258
15
233
15
257
15
276
19-20 172
Tabel 2.3
(vervolg)
Studie
Subtest
Koffler (1984)
- - -
sentence structure usage rnctuation capitalization spelling
27
Rxy
Rxy'
leeftijd
N
.60 .63 .49 .37
.80 .84 .78 .59
14
7326
betrouwbaarheid veroorzaakt wordt. Hogan & Mishler (1980) namen twee keer de 'Language Instructional Tests' van de 'Metropolitan Achievement Test' af, beide keren bij zowel acht- als dertienjarigen. Bij de achtjarigen vertoonde het onderdeel 'studievaardigheden' gemiddeld over beide afnames de hoogste correlatie met het criterium. Bij de dertienjarigen correleerde het onderdeel 'interpunctie en hoofdletters' gemiddeld het hoogst met het criterium. Hudson & Veal (1981) namen vier verschillende meerkeuzetoetsen af met alle vier ongeveer dezelfde categorieën. Alle toetsen bevatten de categorieën 'spelling', 'capitalization', 'punctuation', 'usage' (idioom), en 'paragraph organization'. Drie toetsen bevatten ook nog de categorie 'sentence structure' en enkele vragen over hoe een brief eruit moet zien. Twee toetsen bevatten vragen over hoe een opstel opgebouwd moet worden. De categorieën 'usage' (idioom) en 'punctuation' correleerden gemiddeld het hoogst met het criterium. Halpin e.a. (1981) gebruikten voor hun studie een meerkeuzetoets met zes categorieën vragen: punctuation, capitalization, grammar, spelling, style en paragraph organization. Bij deze studie correleerde 'punctuation' het hoogst met het criterium. Weiss & Jackson (1983) gaven de correlaties tussen de subtests van de 'Descriptive Tests of Language Skills' en drie verschillende criteria. De subtests zijn: reading comprehension, logical relations, word-use, usage & grammar, en sentence structure. De drie criteria bestonden uit de somscore van twee beschrijvende en twee argumentatieve korte schrijfopdrachten, de somscore van twee argumentatieve opstellen en de score op één lang argumentatief opstel. De meerkeuzetoets werd voor een schrijfcursus afgenomen, evenals de opdrachten voor de eerste twee criteria. De opdracht van het laatste criterium werd na de schrijfcursus door de proefpersonen gemaakt. De correlaties met de eerste twee criteria zijn dus het interessantst. Als we naar deze correlaties kijken blijkt dat alle subtests ongeveer even hoog met de criteria correleerden. 'Logica! relations', 'usage & grammar' en 'sentence structure' correleerden iets hoger met de criteria dan 'reading comprehension' en 'word-use',(gemiddeld respectievelijk .57, .58, .60, .54 en .51). Koffler (1984) nam een meerkeuzetoets af met de categorieën 'sentence structure', 'usage', 'punctuation', 'capitalization' en 'spelling'. 'Sentence structure' en 'usage' correleerden het hoogst met het criterium (gecorrigeerd respectievelijk .80 en .84). De somscore van deze twee subtests correleerde zelfs hoger met het criterium dan de totale meerkeuzetoets (gecorrigeerd respectievelijk .90 en .71). Ook 'punctuation' correleerde hoog met het criterium (gecor28
rigeerd .78). Als we de resultaten van de hierboven veiw ielde negen studies vergelijken, valt op dat idioom (usage) en grammatica (grammar of sentence structure) de hoogste correlaties met de criteria vertoonden (Godshalk, Swineford & Coffman, 1966; Huntley, Schmeiser & Stiggins, 1979; Hudson & Veal, 1981; Weiss & Jackson, 1983; Korner, 1984). Daarnaast valt op dat ook interpunctie (punctuation) (Godshalk, Swineford & Coffman, 1966; Hogan Mishler, 1980; Halpin e.a., 1981; Hudson & Veal, 1981 en Koffler, 1984) en het opnieuw fomiuleren van zinnen (construction shift & sentence structure) (Godshalk, Swineford & Goffman, 1966 en Weiss & Jackson, 1983) hoog met de criteria correleerden. De 'organisatie-vragen' lijken een redelijke criteriumvaliditeit te hebben. Godshalk, Swineford & Coffman (1966) vonden een correlatie tussen de subtest 'paragraph organization' en het criterium van .46. Culpepper & Ramsdell (1982) en Clemson (1978) melden dat logica- en organisatie-vragen het hoogst met de criteria correleren, maar deze categorieën hadden in beide studies ook de hoogste betrouwbaarheidscoëfficiënt. Als we de correlaties van Clemsons studie corrigerevoor attenuatie, scoort 'spelling' hoger dan 'logic & organization' . Ook bij Weiss & Jackson correleerde de categorie 'logical relations' redelijk met het criterium. Spooner Smith (1978) vond eveneens redelijke correlaties tussen organisatiesubtests en het door haar gebruikte criterium (gecorrigeerd van .44 tot .86). Bij Huntley, Schmeiser & Stiggins (1979) correleerde de ACT-English Usage Test het hoogst met het criterium. Deze test legt de nadruk op vragen over de organisatie van een schrijfprodukt. Lage correlaties van subtests met criteria worden gemeld bij Hudson & Veal (1981), Crocker, Ondrasik & Lamme (1979) en Halpin e.a. (1981). Bij al deze studies bestond het criterium uit slechts één opstel. Het is mogelijk dat betere criteria hogere correlaties op zouden leveren. Bij Hudson & Veal werden vooral lage correlaties gevonden bij de subtests van de California Achievement Test en de Tests of Achievement and Proficiency. De betrouwbaarheden van de verschillende subtests van deze toetsen was echter laag. De al eerder behandelde vraag of de criteriumvaliditeit van meerkeuzetoetsen van de leeftijd van de proefpersonen afhankelijk is, kan ook gesteld worden voor de criteriumvaliditeit van de verschillende subtests. Systematische verschillen in correlaties * In het artikel van Culpepper & Ramsdell worden de betrouwbaarheden en de correlaties van de subtests van de meerkeuzetoets niet gegeven. 29
tussen subtests en criteria afhankelijk van de leeftijd van de proefpersonen, blijken echter niet uit de resultaten van de in Bijlage 1 (en tabel 2.1.) vermelde studies.
2.4.2.2. LERARENOORDELEN EN CIJFERS VAN SCHRIJFCURSUSSEN ALS CRITERIA In zes van de in de search gevonden studies worden lerarenoordelen over de schrijfvaardigheid van de proefpersonen (meestal leerlingen) en/of eindcijfers als criteria gebruikt. In tabel 2.4. warden de in deze studies gevonden validiteitscoëfficiënten en de leeftijden van de desbetreffende proefpersonen gegeven. TABEL2.4Lerarenoordelen en schoolcijfers als criteria. Studie
Criterium
Leeftijd
Rxy
Huddleston lerarenoordeel schrijf(1954) vaardigheid gemiddeld schoolcijfer voor Engels lerarenoordeel schrijfvaardigheid gemiddeld schoolcijfer Engels
18
.43
18
.34
18
.58
18
.60
Pearson (1955)
18
.65
Checketts & gemiddeld schoolcijfer Christensen voor Engels (1974)
18
.47
Culpepper &gemiddeld schoolcijfer Ramsdell voor Engels (1982)
18
.50
lerarenoordeel schrijfvaardigheid
Weiss & Jackson (1983 )
gemiddeld cijfer schrijfcursus High School
18
.35 .39
Koffler (1984)
lerarenoordeel schrijfvaardigheid
14
.83
30
Huddleston (1954) vond een correlatie van .43 tussen een meerkeuzetoets en een lerarenoordeel over de schrijfvaardigheid van de achttienjarige proefpersonen en een correlatie van .34 tussen de gemiddelde school-cijfers voor Engels en de meerkeuzetoets. In een tweede studie vond Huddleston (1954) een correlatie van .58 tussen een meerkeuzetoets en het lerarenoordeel over de schrijfvaardigheid en een correlatie van .60 tussen de meerkeuzetoets en het gemiddelde cijfer voor Engels. Pearson (1955) vond een correlatie van .65 tussen het lerarenoordeel over de schrijfvaardigheid en een meerkeuzetoets (SATVerbal). Checketts & Christensen (1974) vonden voor achttienjarigen een correlati; van .47 tussen een meerkeuzetoets (C.L.E.P.-objective section) en het gemiddelde schoolcijfer voor Engels. Culpepper en Ramsdell (1982) vonden een correlatie van .50 tussen een meerkeuzetoets en het gemiddelde cijfer voor Engels in het eerste college-jaar (achttienjarigen). Weiss & Jackson (1983) vonden voor achttienjarigen voor subtests van hun meerkeuzetoets en de gemiddelde cijfers voor schrijfcursussen op de High School, correlaties van .35 tot .39. De subtest 'reading comprehension' correleerde het hoogst met de gemiddelde cijfers voor schrijfcursussen. Koffler (1984) vond voor veertienjarigen een correlatie tussen een meerkeuzetoets en het lerarenoordeel over de schrijfvaardigheid van .83. Ook met het lerarenoordeel bleken de subtests 'usage' en 'sentence correction' het hoogst te correleren. De resultaten van studies waarbij lerarenoordelen over deschrijfvaardigheid van de proefpersonen of gemiddelde cijfers voor schrijfcursussen als criteria gebruikt zijn, komen dus redelijk overeen met de resultaten van studies met schrijfopdrachten als criterium. De gemiddelde correlatie van meerkeuzetoetsen enschrijf-opdrachten is voor de hier bekeken studies .62 en de gemiddelde correlatie van meerkeuzetoetsen en lerarenoordelen of schoolcijfers .53.
2.4.2.3. CONCLUSIE OVER DE CRITERIUM VALIDITEIT Op grond van de hier behandelde literatuur kan geconcludeerd worden, dat de criteriumvaliditeit van meerkeuzetoetsen om schrijfvaardigheid te meten redelijk tot goed kan zijn. De correlaties met * C.L.E.P. = College Level Examination Program's General Examination in English Composition. 31
de criteria zijn redelijk en lijken niet afhankelijk van de leeftijd van de proefpersonen en evenmin van de manier waarop de criteria zijn geoperationaliseerd. 2.4.3. DE CONSTRUCTVALIDITEIT VAN MEERKEUZETOETSEN OM SCHRIJFVAARDIGHEID TE METEN Zoals beschreven in paragraaf 2.2. kan men de constructvaliditeit van een toets evalueren door het toetsen van voorspellingen die uit de theorie omtrent het te meten construct volgen. Naast de voorspellingen die bij de criterium-validiteit behandeld zijn (namelijk dat de toets zal samenhangen met andere schrijfvaardigheidsmetingen) worden in paragraaf 2.2. nog zes andere soorten voorspellingen genoemd ter evaluering van de constructvaliditeit. Deze verschillende soorten voorspellingen zijn: voorspelling van groepsverschillen, voorspelling van verandering, voorspelling van door proefpersonen gehanteerde oplossingsprocessen bij het beantwoorden van de vragen, voorspelling van de interne structuur van de toets, voorspelling van schaalbaarheid op een ééndimensionele schaal (indien beoogd wordt een ééndimentioneel construct te meten) en voorspelling van een patroon van correlaties met andere variabelen. De studies naar de constructvaliditeit van meerkeuzetoetsen om schrijfvaardigheid te meten zullen hieronder per soort voorspelling worden besproken. Voorspellen van groepsverschillen In vier van de bekeken studies werden voorspellingen van groepsverschillen getoetst, namelijk bij Checketts & Christensen (1974), Matalene (1982), Gorrell (1983) en Koffler (1984). Checketts en Christensen beschikten voor hun studie over de eindcijfers van drie schrijfcursussen (freshman English) voor ongeveer achttienjarigen. De proefpersonen werden ingedeeld in twee groepen, afhankelijk van hun eindcijfer voor de schrijfcursus. De proefpersonen met voldoendes vormden groep één en de proefpersonen met onvoldoendes vormden groep twee. Daarnaast beschikten de onderzoekers over de cijfers van een groep achttienjarige studenten op een meerkeuzetoets (de C.L.E.P.). Ook deze groep studenten werd gesplitst in een groep die hoog scoorde en een groep die laag scoorde. Uit elk van de vier bovenbeschreven groepen werd een a-selecte steekproef van 25 personen getrokken. Alle proefpersonen maakten vervolgens een schrijfopdracht en een objectieve toets. Er werden geen significante verschillen gevonden in prestatie op zowel de objectieve toets als de schrijfopdracht, tussen de proefpersonen die 32
bij de selectie hoge cijfers voor de schrijfopdracht haalden en de proefpersonen die bij de selectie hoge cijfers voor de meerkeuzetoets haalden. Evenzo werden er geen significante verschillen in prestatie gevonden tussen de twee groepen die bij de selectie respectievelijk laag op de schrijfopdracht of laag op de meerkeuzetoets scoorden. Wel significante verschillen werden gevonden tussen groepen die bij de selectie hoge cijfers haalden voor de meerkeuzetoets of de schrijfopdracht enerzijds en groepen die bij de selectie lage cijfers haalden voor de schrijfopdracht of de meerkeuzetoets anderzijds. De resultaten van deze studie kunnen dus als een argument voor de known-group validiteit van de meerkeuzetoets beschouwd worden. Matalene (1982) construeerde een meerkeuzetoets voor achttienjarige college-studenten. Zij trok een a-selecte steekproef van 190 studenten en vond dat studenten die een 'voldoende' of 'goed' voor hun schrijfcursus haalden, in overgrote meerderheid tussen 120 en 135 scoorden op de meerkeuzetoets (de maximale score was 150). Leraren behaalden gemiddeld een score van 140 en kwamen nooit lager dan 120 uit. Studenten die een onvoldoende haalden voor de schrijfcursus, behaalden vaak lage scores voor de meerkeuzetoets. Een enkeling met een onvoldoende voor de schrijfcursus scoorde echter hoog op de meerkeuzetoets. Matalene verklaart dit met de veronderstelling dat de meerkeuzetoets vaardigheden meet die noodzakelijk doch niet voldoende zijn voor het schrijven van een goed stuk. Ook de resultaten van Matalene ondersteunen de knowngroup validiteit van de meerkeuzetoetsen. Gorrell (1983) vond dat van 96 studenten uit een schrijfcursus in het eerste collegejaar (freshman English) 53 een hoog cijfer voor een schrijfopdracht haalden. Slechts vier van deze studenten behaalden een lage score voor een meerkeuzetoets (ACT). Van de 46 studenten die aan het begin van de cursus een lage score voor de schrijfopdracht behaalden, haalden 21 studenten een hoge score voor de schrijfopdracht aan het eind van de cursus. Slechts één van deze 21 studenten had aan het begin van de cursus een lage score voor de meerkeuzetoets. Ook hier lijkt de known-group validiteit van de meerkeuzetoets redelijk te zijn. Koffler (1984) vroeg leraren een oordeel te geven over de schrijfvaardigheid van hun studenten. Op grond van deze oordelen deelde hij de populatie van ruim 7000 proefpersonen in in drie groepen; 'master', 'borderline' en 'nonmaster'. Alleen de groepen 'master' en 'non-master' zijn in de verdere analyse gebruikt. Als op grond van deze indeling een optimale grensscore op een schrijfopdracht gesteld werd, bleek 20,4% van de proefpersonen ten onrechte als 'master' of als 'non-master' geclassificeerd te worden. Een op dezelfde wijze bepaalde grensscore op een meerkeuzetoets leverde 33
een norm waarbij 18,1% van de proefpersonen verkeerd geclassificeerd werd. Een gecombineerde toets bestaande uit schrijfopdracht én de meerkeuzetoets leverde een nap„ waarbij 17,1% van de proefpersonen verkeerd geclassificeerd werd. De conclusie van Koffier is dan ook dat de meerkeuzetoets een beter onderscheidend vermogen heeft dan de schrijfopdracht. Ook deze resultaten ondersteunen de known-group validiteit van de meerkeuzetoetsen. Uit het bovenstaande volgt dat de known-group validiteit van meerkeuzetoetsen redelijk tot goed kan zijn. Voorspellen van verandering Onderzoek naar de constructvaliditeit van meerkeuzetoetsen om schrijfvaardigheid te meten door het voorspellen van verandering, is in de hier bekeken literatuur niet gevonden. Voorspellen van oplossingsprocessen In de hier bestudeerde literatuur is validiteitsonderzoek waarbij naar gehanteerde oplossingsprocessen gekeken wordt, niet gevonden. Voorspellen interne structuur Werts, Breland, Grandy & Rock (1980) namen voor hun onderzoek een meerkeuzetoets om schrijfvaardigheid te meten (TSWE) en een schrijfopdracht af. Een factor-analyse van alle data leverde één factor op. Beide toetsen betroffen dus min of meer gelijke vaardigheden. Ward (1982) onderzocht voor drie verschillende verbale vraagtypen of het uitmaakte of de vragen in open of meerkeuzevorm gesteld werden. De drie typen betroffen 'sentence completion' (het juiste woord op een open plaats in de zin zetten), 'antoniemen' (het aangeven van een tegengesteld begrip) en 'analogieën' (de twee woorden kiezen die dezelfde onderlinge relatie vertonen als een gegeven woordenpaar). Voor twee vraagtypen, 'sentence completion' en 'antoniemen' maakte de vraagvorm niet uit. Orthogonale factor-analyse leverde één factor die 57% van de variantie verklaarde. (Een tweede factor verklaarde slechts 7%.) Bij een oblique factor-analyse werden twee gecorreleerde factoren gevonden. Op de eerste factor laadden alle vragen, behalve de open vragen van de analogieën-toets, die op de tweede factor laadden. Volgens de auteurs zou deze tweede factor echter een zogenaamde snelheidsfactor kunnen zijn. Dit wil zeggen, een factor die gevoiiiid wordt doordat bepaalde vragen, naast de bedoelde vaardigheid, ook meten hoe goed iemand onder tijdsdruk presteert. De analogieën-toets werd niet door alle proefpersonen afgemaakt. Veertien procent van de proefpersonen voltooide minder dan driekwart van deze toets. 34
Ook de resultaten van Ward ondersteunen de construct-validiteit van meerkeuzetoetsen. Een speciale vorm van constructvalidering door middel van het voorspellen van de factoriële structuur van een toets, is de zogenaamde 'multi-trait, multi-method' -analyse (Campbell & Fiske, 1959). Ward (1982) verrichtte een dergelijke analyse op de data van het hierboven genoemde onderzoek. Hij onderscheidde drie trekken, behorende bij de drie verschillende soorten vragen; sentence completion, analogieën en antoniemen. Daarnaast onderscheidde hij vier meetmethoden; ten eerste open vragen waarbij de proefpersoon om één antwoord gevraagd werd, ten tweede open vragen waarbij de proefpersoon om meerdere goede antwoorden gevraagd werd, ten derde gesloten vragen waarbij één goed antwoord uit vijf alternatieven moest worden gekozen en ten vierde gesloten vragen waarbij het goede antwoord uit een alfabetisch gerangschikte lijst van 90 alternatieven gekozen moest worden. De 'multi-trait, multi-method' -analyse liet zien dat de verschillende antoniemen-toetsen gemiddeld meer samenhangen, ongeacht de gebruikte methode, dan toetsen die verschillende trekken meten, ook al hanteren ze dezelfde meetmethode. Hetzelfde gold voor de sentence-completion-toetsen. Alleen de analogieën-toetsen correleerden gemiddeld even hoog met elkaar als met de sentence-completion- en de antoniemen-toetsen. Effecten van de verschillende meetmethoden werden alleen gevonden voor de toetsen die het meerkeuze-formaat hanteerden waarbij één goed antwoord uit vijf alternatieven gekozen moest worden. Dit wil zeggen dat dit soort meerkeuzetoetsen onderling correlaties vertonen die toegeschreven moeten worden aan de gelijke meetmethode en niet aan de gemeten trekken (method-bias). De resultaten van deze studie pleiten dus tegen de constructvaliditeit van de meerkeuzetoetsen. Traub & Fisher (1977) voerden ook een 'multi-trait, multi-method' -analyse uit. Zij maten twee trekken op drie verschillende manieren. De twee trekken waren 'woordkennis' en 'wiskundig redeneren'. De drie meetmethoden waren open vragen, gewone meerkeuzevragen en meerkeuzevragen waarbij de proefpersonen werd gevraagd zoveel mogelijk onjuiste alternatieven aan te kruisen (Coombs-foi maat). Als resultaat van deze studie werd gevonden dat de wiskundetoetsen hetzelfde maten, ongeacht de vraagvorm. De woordkennistoetsen maten echter verschillende vaardigheden in de verschillende vraagvormen. De twee vormen van de meerkeuzetoets bleken niet significant van elkaar te verschillen, maar de open vorm enerzijds 35
en de twee soorten meerkeuzetoetsen anderzijds verschilden wel significant van elkaar. Vervolgens werd een model getoetst met vijf factoren, twee gecorreleerde factoren voor wiskundig redeneren en woordkennis en drie ongecorreleerde methode-factoren voor elk van de drie vraagvormen. Dit model bleek te passen. De twee 'trait'-factoren gedroegen zich zoals verwacht. Alle wiskundetoetsen laadden positief op de wiskundefactor en alle woordkennistoetsen laadden positief op de woordkennisfactor. Slechts één van de drie overige factoren gedroeg zich als een method-factor. Op deze factor laadden de toetsen met de open vraagvorm. De andere twee factoren waren niet als methode-factor te interpreteren. Ook de resultaten van deze studie pleiten tegen de constructvaliditeit van de meerkeuzetoetsen. Ook Quellmalz & Capell (1979), Capell & Quellmalz (1980) en Quellmalz, Capell & Chih-Ping (1982) deden 'multi-trait, multimethod' -onderzoek. In deze studie werd onderzocht of het schrijven in de vertellende en in de beschrijvende stijl (narrative & expository) op verschillende vaardigheden berust. Er werden zowel schrijfopdrachten als meerkeuzevragen gebruikt. De proefpersonen in dit onderzoek waren 16 á 17 jaar. De analyse laat zien dat er twee factoren zijn die horen bij de communicatieve stijl van de te schrijven of de bij de meerkeuzevragen aangeboden tekst. Beschrijvend en vertellend schrijven lijken hier dus een beroep te doen op verschillende vaardigheden. Daarnaast zijn er drie factoren die opgevat kunnen worden als focus-, organization- en support-factoren (de 'schrijfvaardigheden' die in het onderzoek gemeten werden). Zowel de scores op de schrijfopdrachten als op de drie meerkeuzetoetsen laadden zoals verwacht op deze factoren. Ook werden er methode-factoren gevonden voor de opstellen en de meerkeuzevragen. Deze laatste factoren verklaren echter niet veel variantie. Ook hier worden dus effecten van de meetmethode gevonden bij het vergelijken van schrijfopdrachten en meerkeuzetoetsen, al zijn deze effecten niet erg groot. Weiss & Jackson (1983) voerden ook een 'multi-trait, multi-method' -analyse uit. Zij namen hiertoe één schrijfopdracht af die werd beoordeeld op 'sentence structure' (gebruik complete zinnen, juiste toepassing van onder- en nevenschikkende voegwoorden en het op de juiste plaats in de zin zetten van bepalingen), 'usage' (fouten in het gebruik van voornaamwoorden en bepalingen, in de woordkeus en keuze van uitdrukkingen en in de werkwoorden) en 'logical relationships' (ideeën categoriseren, juiste connectieven kiezen, 36
analogieën maken en organisatieprincipes herkennen). Voor dezelfde drie categorieën werden meerkeuzetoetsen gemaakt. De resultaten van deze 'multi-trait, multi-method' -analyse laten zien dat de correlaties tussen metingen die dezelfde meetmethode hanteren, hoger zijn, dan tussen metingen die dezelfde trek moeten meten, maar verschillende meetmethoden hanteren. Net als bij de vorige studies vinden Weiss & Jackson dus methode-factoren bij het vergelijken van schrijfopdrachten en meerkeuzetoetsen. De resultaten van het hier behandelde 'multi-trait, multi-method' -onderzoek laten zien dat het uitmaakt of schrijfvaardigheid met schrijfopdrachten of met meerkeuzetoetsen gemeten wordt, al zijn de effecten van de meetmethode soms niet erg groot. Voorspellen van schaalbaarheid In de hier bestudeerde literatuur is validiteitsonderzoek waarbij de schaalbaarheid van vragen getoetst wordt, niet gevonden. Voorspellen van correlaties Ter ondersteuning van de convergente validiteit van meerkeuzetoetsen om schrijfvaardigheid te meten kan ten eerste gekeken worden naar de correlaties die al zijn vermeld bij het behandelen van de criteriumvaliditeit (zie paragraaf 2.4.2.). Daarnaast melden enkele studies correlaties tussen meerkeuzetoetsen voor het meten van schrijfvaardigheid en toetsen voor het meten van leesvaardigheid. Crocker, Ondrasik & Lamme (1979) melden een correlatie van .52, Hogan & Mishler (1980) een correlatie van .48 voor achtjarigen en een correlatie van .59 voor dertienjarigen, Weiss & Jackson (1983) een correlatie van .49 en Culpepper & Ramsdell (1982) een correlatie van .66. Hogan & Mishler geven ook nog correlaties tussen schrijfvaardigheid gemeten met een meerkeuzetoets en bepaalde andere variabelen. Zij rapporteren correlaties met studievaardigheden van .57 en .63 voor achtjarigen en .56 en .67 voor dertienjarigen, correlaties met luistervaardigheid van .49 voor acht- en .54 voor dertienjarigen, correlaties met een algemene taaltest van .61 voor acht- en .65 voor dertienjarigen, correlaties met vragen over exacte wetenschap van .17 voor acht- en .51 voor dertienjarigen, correlaties met vragen over sociale wetenschappen van .30 voor acht- en .50 voor dertienjarigen en correlaties met een wiskundetoets van .40 voor acht- en .50 voor dertienjarigen. Hoewel sommige correlaties wat hoger zijn dan misschien verwacht was (zie exacte en sociale wetenschappen en wiskunde) klopt het patroon van correlaties wel met de verwachtingen. Taaltoetsen correleren hoger met de meerkeuzetoetsen om schrijfvaardigheid te meten dan de toetsen over sociale en exacte wetenschappen en de 37
toets over wiskunde. Benton & Kiewra (1986) voorspellen dat organisatievaardigheden een onderdeel van schrijfvaardigheid zijn. Zij baseren deze verwachting op de theorie van Flower & Hayes (1980) over schrijfprocessen. Godshalk, Swineford & Coffman (1966) hadden één subtest in hun meerkeuzetoets opgenomen waarbij de proefpersonen door elkaar gezette zinnen van één alinea in de juiste volgorde moesten zetten. Volgens Benton & Kiewra moet deze 'organisatievaardigheid' niet alleen op alinea-niveau, maar ook op zins- en woordniveau gemeten worden in een meerkeuzetoets om schrijfvaardigheid te meten. Zij lieten 105 proefpersonen twee schrijfopdrachten maken, die elk werden beoordeeld door twee beoordelaars. Daarnaast namen zij een meerkeuzetoets af om schrijfvaardigheid te meten (de TSWE) én vier organisatie-tests; anagrammen oplossen, woorden herordenen, zinnen ordenen, en alinea's samenstellen uit zinnen. Alle vier de organisatietests hadden een betrouwbaarheid van .85 of hoger. De correlaties met de schrijfopdrachten waren voor de vier organisatietests respectievelijk .37, .46, .21 en .40. De somscore van de vier tests correleerde .49 met de somscore van de twee schrijfopdrachten. Samenvattend kan gesteld worden dat de construct-validiteit van meerkeuzetoetsen om schrijfvaardigheid te meten omstreden is. De known-group validiteit van de meerkeuzetoetsen lijkt goed. Koffler (1984) concludeerde zelfs dat de door hem gebruikte meerkeuzetoets een beter discriminerend vermogen had dan de door hem gebruikte schrijfopdracht. Interessant is de veronderstelling van Matalene (1982) dat de vaardigheden gemeten met een meerkeuzetoets vaardigheden zijn die beheerst moeten worden om goed te kunnen schrijven, maar dat beheersing van deze vaardigheden nog geen garantie is voor het goed kunnen schrijven. Als deze redenatie klopt, schort er nog wat aan de logische validiteit van de meerkeuzetoetsen. Uit onderzoek naar de construct-validiteit door middel van factor-analyse blijkt dat metingen met open vragen en metingen met meerkeuzetoetsen niet gelijkwaardig zijn, al lijken de verschillen niet erg groot. De convergente en divergente validiteit van de meerkeuzetoetsen zien er redelijk uit. Uit de studie van Hogan & Mishler blijkt dat het patroon van correlaties dat de meerkeuzetoets vertoont met andere variabelen is zoals verwacht kon worden. Opmerkelijk is de vrij hoge correlatie die in verschillende studies gevonden is tussen de schrijfvaardigheid (gemeten met meerkeuzetoetsen of open opdrachten) en leesvaardigheid. 38
2.5. CONCLUSIES Uit het bovenstaande kan geconcludeerd worden dat de validiteit van meerkeuzetoetsen om schrijfvaardigheid te meten over het algemeen matig tot redelijk is. De inhoudsvaliditeit van de toetsen wordt overwegend kritisch beoordeeld. De belangrijkste bezwaren zijn dat de meerkeuzetoetsen alleen receptieve en geen produktieve vaardigheden kunnen meten en dat de beheersing van aspecten als stijl, organisatie en creativiteit niet goed met meerkeuzevragen gemeten kan worden. Tegenover deze bezwaren kan gesteld worden dat sommige auteurs menen dat de vaardigheden gemeten met meerkeuzetoetsen en schrijfopdrachten weliswaar niet identiek, maar toch zo verwant zijn, dat meerkeuzetoetsen wel gebruikt kunnen worden om schrijfvaardigheid te meten. Ook meent één auteur dat de meerkeuzetoetsen vooral meten hoe goed iemand tekst kan reviseren en juist wel valide zijn omdat deze vaardigheid bij (schools) schrijven erg belangrijk is. De criteriumvaliditeit van de meerkeuzetoetsen lijkt redelijk. De studies waarbij de beste criteria gebruikt zijn vinden ongecorrigeerde correlaties die rond .70 liggen. De correlaties lijken niet mede afhankelijk te zijn van de leeftijd van de proefpersonen. De subtests die in de verschillende studies het hoogst met de criteria correleren zijn 'usage' (idioom), 'grammar' en 'sentence structure' (beide grammatica) en 'punctuation' (interpunctie). Bij enkele studies worden organisatie-vragen afgenomen. Deze correleren over het algemeen wat lager dan de hierboven genoemde categorieën, namelijk ongeveer .50. De organisatie-vragen bezitten dus een matige tot redelijke criteriumvaliditeit. De constructvaliditeit van meerkeuzetoetsen om schrijfvaardigheid te meten is omstreden. De 'known-group' validiteit van meerkeuzetoetsen, voor zover in de literatuur behandeld, lijkt goed. Het onderscheidingsvermogen van de meerkeuzetoets was bij Koffler zelfs groter dan het onderscheidingsvermogen van de door hem gebruikte schrijfopdracht. Het factoriële onderzoek naar de construct-validiteit van meerkeuzetoetsen om schrijfvaardigheid te meten laat zien dat de data verkregen met behulp van een meerkeuzetoets en een schrijfopdracht op één factor kunnen laden. Daartegenover staat dat er in veel onderzoek methode-factoren gevonden zijn die gekoppeld waren aan de open en de gesloten vraagvorm. De gevonden effecten van deze methode-factoren waren echter niet erg groot. De convergente en divergente validiteit van de meerkeuzetoetsen lijken, voor zover onderzocht, ook redelijk. Een verrassing zijn de 39
hoge correlaties die gevonden werden tussen beoordelingen van schrijfopdrachten en meerkeuzesubtests voor lees-, luister- en studievaardigheden. Uit het bovenstaande kan geconcludeerd worden dat, hoewel schrijfopdrachten en meerkeuzetoetsen om schrijfvaardigheid te meten in grote mate gelijke vaardigheden lijken te meten, er toch een verschil is tussen de vaardigheden gemeten met open opdrachten en de vaardigheden gemeten met meerkeuzetoetsen. De grootte van het effect van de meetmethode lijkt echter mee te vallen. Het bij de behandeling van de inhoudsvaliditeit aangehaalde bezwaar dat meerkeuzetoetsen en schrijfopdrachten niet dezelfde vaardigheden meten (herkennen versus produceren), wordt dus door de empirie ondersteund al lijkt het verschil tussen beide meetmethoden niet erg groot te zijn.
40
3. INSTRUMENTATIE In een publikatie van Mellenbergh (1971) worden zes voorwaarden genoemd waaraan goede meerkeuzevragen moeten voldoen. Deze voorwaarden zijn: De eis van relevantie Elke vraag moet de te toetsen vaardigheid betreffen. Eigenlijk gaat het hier dus om de (logische) validiteit. De eis van evenwichtigheid De aantallen vragen per subcategorie moeten bepaald worden op grond van het relatieve belang van de subcategorie. Ook hier gaat het dus om de (logische) validiteit. De eis van efficiëntie De instructie moet zo kort, eenvoudig en éénduidig mogelijk zijn. De eis van objectiviteit Slechts één antwoordalternatief mag goed zijn, de andere alternatieven moeten duidelijk fout zijn. Experts met betrekking tot het te toetsen gebied mogen het niet oneens zijn over het al dan niet fout zijn van alternatieven en er mogen geen strikvragen gesteld worden. De eis van specificiteit De vragen moeten alleen de bedoelde vaardigheid meten en niet testslimheid of iets dergelijks. Er moeten geen regelmatig wisselende posities voor het goede antwoord gekozen worden, het goede antwoord mag niet langer zijn dan de andere alternatieven, mag niet preciezer geformuleerd zijn, etc. De eis van bekende moeilijkheidsgraad De p-waarde van de vragen (= het percentage leerlingen dat een vraag goed maakt) moet een voldoende grote range bestrijken zodat de toets op alle vaardighedenniveaus voldoende kan discrimineren. De groep items met p-waarden in de range .40-.70 moet het grootst zijn. De eis van unidimensionaliteit Omdat het de bedoeling is dat de vragen van de meerkeuzetoets geschaald worden met behulp van het Rasch-model kan nog een zevende voorwaarde aan de bovenstaande worden toegevoegd. De vragen moeten statistisch gezien unidimensioneel zijn. Dit betekent dat de verschillende vragen onafhankelijk van elkaar moeten zijn. 41
Het antwoord op een vraag mag niet van belang zijn bij het vinden van het antwoord op een andere vraag. In het onderstaande wordt per eis aangegeven hoe gepoogd is aan de verschillende eisen voor deugdelijke instrumentatie te voldoen. De eis van relevantie Om aan de eis van relevantie te voldoen is de toets gemaakt op grond van een indeling van mogelijke schrijffouten. Als uitgangspunt voor deze indeling is de classificatie van Wesdorp (1974) gebruikt, aangevuld met de classificaties van Rijlaarsdam (1986) en Schoonen (1987). Een goede indeling moet aan verschillende voorwaarden voldoen. Er moet geprobeerd worden om alle relevante aspecten van schrijfvaardigheid te meten. Daarnaast moeten de verschillende categorieën van de foutenclassificatie elkaar wederzijds uitsluiten. Het mag niet zo zijn dat een fout bij twee verschillende categorieën tegelijk ingedeeld kan worden. Ook is het voor de construct-validiteit van de toets van belang om de foutenclassificatie zoveel mogelijk te baseren op de psychologische processen of vaardigheden die bij het schrijven een rol spelen, daar dit de interpreteerbaarheid van de resultaten ten goede komt. Van een puur taalkundige indeling (bij voorbeeld semantiek, morfologie, syntaxis, enz) is afgezien, omdat de taalkundige indeling niet is gebaseerd op theorie over vaardigheden. Een probleem is, dat er nog maar weinig onderzoek is gedaan om te achterhalen welke sub-vaardigheden de 'schrijfvaardigheid' bepalen. In dat licht is het onderhavige onderzoek exploratief van karakter en de onderstaande indeling is deels gebaseerd op niet geverifieerde intuïties van de onderzoeker. De hoofdcategorieën van de gehanteerde foutenclassificatie zijn: schrijftechnische conventies, grammatica, idioom, stijl, en inhoud & organisatie. Deze categorieën komen min of meer overeen met de drie 'noodzakelijke' vaardigheden voor het schrijven die Flower & Hayes (1980) onderscheiden op grond van hun analyse van hardopdenkprotocollen van schrijvers. Zij onderscheiden: beheersing van de schrijftechnische conventies, de retorische vaardigheid ('kom ik over zoals bedoeld') en de vaardigheid in het genereren en organiseren van de inhoud. De categorieën 'schrijftechnische conventies' en 'grammatica' vallen onder Flower en Hayes' categorie 'schrijftechnische conventies'. De categorieën 'idioom' en 'stijl' vallen onder 'retorische vaardigheid' en de categorie 'inhoud en organisatie' valt onder 'genereren en organiseren van de inhoud'. Hieronder volgt een nadere precisering van hoe de verschillende categorieën zijn onderverdeeld en welke taalfouten er onder de 42
verschillende categorieën vallen. Bij de categorie 'Schrijftechnische conventies' horen die vragen van de toets, waarbij de proefpersoon de aangeboden tekst beoordeelt op het al dan niet voldoen aan voorschriften voor de spelling, de interpunctie en de vormgeving. Binnen deze categorie worden dus drie subcategorieën onderscheiden; spelling, interpunctie en vormaspecten van de opbouw. Tot de categorie 'spelling' worden die fouten gerekend waarbij de schrijver of schrijfster een (fonologisch) juist klinkende vorm verkeerd codeert (omzet in letters). Fouten waarbij duidelijk is dat de (fonologische) vorm niet deugt, vallen onder de categorie 'grammatica'. Volgens dit principe is 'ik vint' (sic) een spelfout, maar 'hij loopte' (sic) een grammaticale fout. Bij spelfouten gaat het dus om een verkeerde codering van klank naar teken, bij een op fonologisch niveau al verkeerde vorm gaat het om grammaticale fouten. De redenering hierachter is dat als de fonologische vorm niet deugt, er meer aan de hand is dan een spelling- of codeerkwestie. In de praktijk is het soms moeilijk om het onderscheid tussen deze twee soorten fouten te maken, daar men aan een schrijffout niet altijd kan zien of er een coderingsfout of een fout in de fonologische vorm gemaakt is. Het probleem is dat men niet in het hoofd van de schrijver kan kijken. Bij meerkeuze-vragen kan men zich echter zoveel mogelijk beperken tot de duidelijke gevallen. De categorie 'spelling' is weer onderverdeeld in twee subcategorieën; woordbeeld-spelling en regelgestuurde spelling. Bij de eerstgenoemde categorie horen de fouten waarbij de spelling van woorden beoordeeld wordt, waarvan de spelwijze niet wordt bepaald door (spelling-)regels, doch door afspraken. Voorbeelden van dit soort fouten zijn: het weglaten van niet hoorbare letters (paralel, mischien), verwisselen van gelijkluidende grafemen (ei-ij, au-ou), verwisseling van stemloze en stemhebbende medeklinkers (avdak, besem), enz. Bij de tweede categorie spelfouten horen die fouten waarbij de fonologische vorm correct is, maar de codering van klank naar letters niet én waarbij deze codering bepaald wordt door (spelling-) regels. Voorbeelden hiervan zijn: onhoorbare verbuigingsfouten zoals (in sommige gevallen) de klinker- en medeklinkerverenkeling en -verdubbeling (loopen; ruitten), onhoorbare vervoegingsfouten (hij behoord; ik wordt), en fouten in samenstellingen en in de woordvorming (enigzins; kapperzaak; radioomroep). Het onderscheid tussen regelgestuurde en niet-regelgestuurde spelling is ook terug te vinden bij Assink (1981) die de termen 'foutieve associatie' (woordbeeld-spelling) en 'foutieve regeltoepassing' (regelgestuurde-spelling) hanteert. 43
Tot de categorie 'interpunctie' behoren de fouten die het correct gebruik van leestekens en hoofdletters betreffen, evenals het niet correct afbreken van woorden. Daar voor de interpunctie maar in een beperkt aantal gevallen dwingende regels gelden, moeten alleen die gevallen bevraagd worden, waarbij van een duidelijk 'goed' of 'fout' sprake is . De categorie 'vormaspecten opbouw' tenslotte, betreft vragen waarbij de vormgeving van geschreven tekst beoordeeld moet worden, zonder op de inhoud van de tekst te letten. Vragen naar hoe de aanhef of het slot van een brief er qua vorm uit moeten zien horen bij deze categorie. De categorie 'grammatica' bevat vragen naar fouten die de grammaticaliteit van zinnen en woorden betreffen. Zoals bij de categorie 'spelling' al is uitgelegd, horen alle fouten die de codering betreffen bij 'spelling' en fouten die 'hoorbaar' zijn behoren tot de categorie 'grammatica'. De categorie 'grammatica' is onderverdeeld in 'grammatica op zinsniveau'en'grammaticaopwoordniveau'.Totdeeerstecategorie
behoren de vragen waarbij de grammaticaliteit van zinnen beoordeeld moet worden op grond van de volgorde en samenhang der zinsdelen. Hierbij kan gedacht worden aan fouten door een gebrekkige zinsstructuur, woorden teveel of te weinig, incongruentie tussen onderwerp en persoonsvorm, verwijzingsfouten, enz. Tot de tweede categorie behoren de vragen waarbij de proefpersoon de grammaticaliteit van een woord(-vorm) beoordeelt, los van de andere woorden en zinsdelen in de tekst. Tot deze categorie behoren hoorbare vervoegingsfouten (loopte), hoorbare verbuigingsfouten (goedste) en hoorbare verkeerde samentrekkingen (tafelslaken, in- en uitverkocht). Tot de categorie 'idioom' behoren de vragen waarbij de proefpersoon niet-grammaticale fouten in de vereiste woordreeks of klankvorm moet herkennen die niet onder de categorie 'spelling' vallen. Het gaat bij dit soort fouten om het niet correct hanteren van vaste uitdrukkingsvormen. Onder deze categorie vallen fouten die betrekking hebben op verkeerd overgenomen uitdrukkingen ('Hij is van alle marktkramen thuis'), het toekennen van verkeerde betekenissen aan woorden en uitdrukkingen, contaminatie van verschillende zegswijzen ('Dat kost duur'), het hanteren van verkeerde voorzetsels bij voorzetselvoorwerpen ('Hij is bang van de wolf'), pleonasmen ('Hutspot met ui en wortel ...') enz. Tot de categorie 'stijl' behoren de vragen waarbij de adequaatheid van de woordkeus beoordeeld moet worden, los van de woordbeteke44
nis. Het gaat hier dus om een beoordeling van de manier waarop niet-semantische linguïstische keuzes gemaakt worden. Het gaat bij deze categorie dus niet om aperte taalfouten, maar om het verschil tussen mooi en minder mooi of toepasselijk en minder toepasselijk. Bij dit soort vragen moet de proefpersoon aangeven welke zegswijzen het mooist, minst omslachtig of meest doeltreffend zijn. Men kan bij de problemen die dit soort vragen aansnijden, denken aan storende herhalingen (... en toen ... en toen ...), een niet consequent volgehouden perspectief (ik, wij, men ...), een onterechte afwisseling van tijden (ott; ovt), enz. De eis van evenwichtigheid Om aan de eis van evenwichtigheid te voldoen is de grootte van de verschillende subtests afgestemd op de uit de literatuur gebleken criteriumvaliditeit van de subtests. Daarnaast zijn frequentietellingen van fouten in opstellen van zesdeklassers van de basisschool gebruikt om te bepalen in welke categorieën de meeste vragen moeten komen. Uit het in hoofdstuk twee behandelde validiteitsonderzoek komt naar voren dat de criteriumvaliditeit van de subtoetsen 'idioom', 'grammatica' en 'interpunctie', het grootst is. Daarnaast correleren 'spelling' en 'indeling en organisatie' redelijk met de criteria. Het aantal vragen per subcategorie in de te construeren toets zal het grootst zijn bij de categorieën die uit de literatuur als meest valide naar voren komen. De categorieën 'idioom', 'grammatica' en 'interpunctie' zullen dus meer vragen krijgen dan de categorieën 'inhoud en organisatie' en 'stijl'. Frequentietellingen van schrijffouten zijn te vinden bij Wesdorp (1974; 65), Bayens, Jansen & Schakenbos (1981; 88) en Schoonen (1987; 105). Wesdorp beschrijft een onderzoek naar de frequentie van schrijffouten van zesdeklassers van de basisschool. Er werden 433 opstellen van leerlingen uit Amsterdam en Hilversum geanalyseerd. De conclusies zijn dat fouten op het gebied van de schrijftechnische conventies zéér veel voorkomen (spelling en interpunctie). Daarnaast blijken grammaticale fouten veel voor te komen. De frequentst aangetroffen fouten op het gebied van grammatica betroffen weggelaten woorden, foute verwijzingen, verkeerde werkwoordstijden, incongruentie tussen onderwerp en persoonsvorm, verkeerde woordvolgorde en verkeerde samentrekking. Fouten op het gebied van 'passend en effectief taalgebruik' komen ook veel voor, maar deze categorie is in de indeling van Wesdorp moeilijk te scheiden van de categorie 'grammatica'. De categorie 'inhoud en organisatie' telde het minste fouten, maar dit werd mede veroorzaakt doordat de fouten in deze categorie de gehele tekst betreffen en dus niet vaak binnen één tekst voor kunnen komen. 45
Bayens, Jansen en Schakenbos (1981) deden onderzoek naar welke fouten het frequentst gemaakt werden door eerstejaars studenten van een Nieuwe Lerarenopleiding. Zij keken niet naar spelfouten. Fouten uit de categorie 'grammatica' kwamen het frequentst voor (onjuiste samentrekking bij nevenschikking, onjuiste telegramstijl, verkeerde verwijzing, weggelaten werkwoorden en incongruentie van onderwerp en persoonsvorm). Verder kwam de idiomatische fout 'het gebruiken van een verkeerd voorzetsel bij een werkwoord of zelfstandig naamwoord' veel voor. Schoonen (1987) ontwikkelde een gedetailleerde foutenclysificatie om een genuanceerde scoring van het PPON-materiaal uit te voeren. De categorieën 'structuur', 'samenhang' en 'stijl' werden beoordeeld met behulp van beoordelaars en er werden tellingen van fouten uitgevoerd voor de categorieën 'spelling', 'grammatica' en 'interpunctie'. Bij de beoordeling van het aspect 'structuur' valt op dat de teksten van de leerlingen visueel nauwelijks gestructureerd worden. Inleiding en slot worden bij voorbeeld aangebracht zonder ze visueel te onderscheiden. Bij 'samenhang' valt op dat de leerlingen veel opsommende voegwoorden gebruiken en in sommige taken komt vaak onduidelijke verwijzing voor. Als resultaat van de tellingen werd gevonden dat interpunctiefouten het vaakst voorkwamen. De categorie 'grammatica' bevatte daarna het grootste aantal fouten, gevolgd door de categorie 'spelling'. De interpunctiefouten betroffen vooral het niet of verkeerd aangeven van zinsgrenzen en het verkeerd gebruiken van komma's. De fouten in de categorie 'grammatica' betreffen in hoofdzaak het al dan niet verdubbelen van klinkers en medeklinkers (hoorbaar), hantering van een verkeerd lidwoord, verkeerde verbuiging van het bijvoeglijk naamwoord, verkeerde vorming van een verkleinwoord, incongruentie tussen onderwerp en persoonsvorm, hantering van een verkeerd persoonlijk, wederkerend of wederkerig voornaamwoord, verkeerde verwijzing, verkeerde samentrekking en het ontbreken of onterecht herhalen van een woord of woordgroep. In de categorie 'spelling' zijn de meestvoorkomende fouten fonetische spelling, ontbreken van de slot -n, verwisseling van (bijna) gelijk klinkende grafemen (ij/ei; t/d; g/ch; zjs; v/f), ontbreken van hoofdletters bij eigennamen, het verkeerd afbreken van woorden, vocaalverenkeling en consonantverdubbeling bij meervoudsvorming (onhoorbaar), zelfstandig gebruikte onbepaalde voornaamwoorden zonder -n (voor personen), verwisseling van persoon-
*
Voorstudie Periodieke Peiling van het Onderwijs 46
lijke en bezittelijke voornaamwoorden, ontbreken van een -t- ofd- in de twee of derde persoon enkelvoud (o.t.t.), verwisseling van -t- en -d- als laatste letter van het voltooid deelwoord, het ten onrechte toevoegen of weglaten van een -n- of een -s- in samenstellingen, het verkeerd gebruiken van het koppelteken en het ten onrechte vast of los schrijven van woorden. In Schoonen (1987) worden nog andere studies naar de frequenties van taalfouten aangehaald. Uitsluitend de Nederlandstalige studies zijn van belang, omdat de frequenties van fouten taalgebonden zijn. Alleen een door Schoonen aangehaalde studie van Dirksen (z.j.) is voor dit onderzoek te gebruiken. Dirksen analyseerde 448 opstellen van zesdeklassers uit het Basisonderwijs en uit het eerste en tweede jaar van het Voortgezet Onderwijs. Gerangschikt naar frequentie met het frequentste foutentype voorop vond hij de volgende top-acht van schrijffouten: verwijzingsfouten, fout gebruikte voegwoorden, foutieve samentrekkingen en heterogene nevenschikking, weggelaten woorden, verkeerde woordvolgorde, herhaling van een woordgroep, incongruentie van onderwerp en persoonsvorm en incongruentie van tijd. Het bovenstaande overzicht van foutenfrequenties geeft aan met welke aspecten van het schrijven de twaalf- tot achttienjarigen de meeste moeite hebben. Of alle probleemgevallen vertegenwoordigd zijn, is onzeker, omdat de leerlingen in schrijfopdrachten constructies die zij niet beheersen, kunnen vermijden. In de voor dit onderzoek geconstrueerde toets zijn alle bovenstaande foutensoorten opgenomen. De eis van efficiëntie De eis van efficiëntie komt in ons geval overeen met de eis van specificiteit. De instructie moet, voor de in het onderhavige onderzoek te maken toets, kort, eenvoudig en eenduidig zijn vanwege de efficiëntie, maar ook omdat anders de vaardigheid 'tekstbegrip' een te grote rol gaat spelen (specificiteit). Om slecht begrip van de instructie zo veel mogelijk te voorko men, zal de instructie voor de afname van de toetsen klassikaal behandeld worden. De eis van objectiviteit Om aan de eis van de objectiviteit te voldoen zijn alle vragen bekeken door aan de SCO werkende neerlandici. Alternatieven waarover onenigheid bestond, zijn uit de toets verwijderd. De eis van specificiteit Een belangrijk punt, dat de eis van specificiteit betreft, is dat bij de constructie van toetsvragen moeilijke woorden, zowel in de 47
vragen als in de begeleidende instructies, vermeden moeten worden (behalve in toetsvragen die woordkennis moeten meten natuurlijk). Als hier niet op gelet wordt, meten de vragen met moeilijke woorden erin, naast de vaardigheid die ze moeten meten, ook woordkennis. Daarnaast zal er op gelet worden dat de goede antwoordalternatieven wisselende posities innemen en dat de leerlingen ruim voldoende tijd voor het maken van de vragen krijgen zodat tijdsdruk geen rol kan spelen. Daar de eis van specificiteit deels vergelijkbaar is met de eis van unidimensionaliteit worden te verwachten problemen verder bij het behandelen van deze laatste categorie aan de orde gebracht.
De eis van bekende moeilijkheidsgraad Of de vragen de juiste moeilijkheidsgraad hebben, is vooraf moeilijk te bepalen. Door analyse van schrijfopdrachten gemaakt voor het PPON-onderzoek is geprobeerd zicht te krijgen op het schrijfvaardigheidsniveau van zesdeklassers. Daarnaast is met een eerste versie van de vragen een proefname gehouden bij tien leerlingen uit de zesde klas. Bij de proefname bleken de vragen, hoewel aan de moeilijke kant, wel te maken door de zesdeklassers. Er zijn op grond van deze eerste afname wat makkelijker vragen toegevoegd aan de toets en wat moeilijke vragen verwijderd. Ook zijn enkele instructies wat vereenvoudigd. De eis van unidimensionaliteit Een punt waarop gelet moet worden bij de constructie van de toetsvragen is dat ze onafhankelijk van elkaar zijn. Deze eis, die niet in Mellenbergh (1971) genoemd wordt, moet aan de vragen gesteld worden omdat geprobeerd zal worden de vragen van de verschillende categorieën te schalen met behulp van het Raschmodel. Eén van de aannames van het Rasch-model is, dat de te schalen vragen locaal stochastisch onafhankelijk van elkaar zijn. Dit betekent dat het antwoord op de ene vraag geen hulp mag bieden bij het beantwoorden van een andere vraag. Als er dus vragen bij stukjes tekst worden aangeboden, mag er (in het ideale geval) maar één vraag per tekstfragment gesteld worden. Over de vorm van de vragen kan, in verband met de eis van unidimensionaliteit, het volgende gemeld worden. Allereerst moest gekozen worden hoeveel antwoordalternatieven er per vraag aangeboden zouden worden. Hierbij zijn verschillende overwegingen van belang. Een nadeel van het gebruik van meerkeuzevragen is de raadkans die daarbij optreedt. Voor een schaling van resultaten is het van belang unidimensionele vragen te maken en dus de raadkans zo klein mogelijk te houden. Aan de andere kant is het van belang vanwege de interpreteerbaarheid, om vragen te maken die zoveel 48
mogelijk één vaardigheid meten. Er moet dus bij het verzinnen van antwoordalternatieven op gelet worden dat de verschillende alternatieven niet een beroep doen op verschillende vaardigheden. Het volgende item kan als voorbeeld dienen. Welk woord moet op de open plaats worden ingevuld? 'Hij is niet ....' A bevreest B bevreesd C befreest D befreesd Alternatief A en B betreffen de regelgestuurde spelling van het voltooid deelwoord. Alternatief C is om twee redenen niet correct. Ten eerste vanwege de regelgestuurde spelling van het voltooid deelwoord en ten tweede vanwege de verwisseling van de grafemen -f- en -v-. Dit laatste foutentype valt onder woordbeeld-spelling. Alternatief D is uitsluitend fout vanwege de woordbeeld-spelling. Een dergelijke vraag betreft twee verschillende foutentypen en dus misschien ook twee verschillende vaardigheden bij de oplossing ervan. De vragen voor de meerkeuzetoets zijn zo geconstrueerd dat vier of zelfs meer antwoordalternatieven geboden worden als daarmee niet van het bedoelde foutentype afgeweken werd. Als dit laatste met meer alternatieven onvermijdelijk was, is gekozen voor een vraagvorm waarbij de proefpersonen aan moesten geven of de aangeboden woorden of zinnen goed of fout waren. Indien werd gekozen voor de vorm waarbij aangegeven moest worden of de aangeboden tekst goed of fout was, zijn per probleemtype vier vragen gesteld. Dit om na te kunnen gaan of het moeilijker is om een foute vorm als fout te herkennen, dan een goede vorm als goed. Aanwijzingen hiervoor werden gevonden door Assink (1982). Een voorbeeld kan het bovenstaande verduidelijken. De volgende vier vragen gaan over het probleemtype au/ou. 1. 2. 3. 4.
kabouter rauw lauter flouw
goed/fout goed/fout goed/fout goed/fout
Beide mogelijkheden ('au' en 'ou') worden éénmaal goed en éénmaal fout aangeboden. (Zie bijlage 4. voor meer voorbeelden.) Hoewel de frequentie waarmee een woord in het dagelijks taalgebruik voorkomt 49
Tabel 3.1. De bevraalde probleemtypen in de meerkeuzetoets met bijbehorende vragen. (Zie itemvoorbeelden bijlage 3.) categorie vragen probleemtype woordbeeldspelling 1-61
verwisseling gelijkluidende grafemen
regelgestuurde spelling vervoegingen
62-69
verwisseling voltooid deelwoord (d/t) en o.t.t. prefixwerkwoorden
70-75
o.t.t. eindigend op 'd','t', of 'dt'
76-81
voltooid deelwoord eindigend op 't' of 'd'
82-85
verwisseling o.v.t. en bijvoeglijk gebruikt voltooid deelwoord
86-99
o.v.t., stam al dan niet eindigend op 'd' of 't'.
94-97
verwisseling bijvoeglijk gebruikte infinitief en voltooid deelwoord
100-107
meervoudsvorming
regelgestuurde spelling verbuigingen
108,110, 111,113
zelfstandig voornaamwoordelijk meervoud met of zonder 'n'
109,112,114, bezittelijk gebruikt persoonlijk 115 voornaamwoord met of zonder 'w' 116-123
genitief-s of apostrof en weglatingsapostrof
124-127
stoffelijk bijvoeglijk naamwoord al dan niet eindigend op '-en' 50
categorie
interpunctie en vormaspecten opbouw
inhoud en organisatie
vragen
probleemtype
128,130, 131,138
vorming verkleinwoorden
132-135
stemhebbende of -loze medeklinker als uitgang.
129, 136, 137,139
klinker of medeklinker enkel of dubbel
140-143
zelfstandig gebruikt bijvoeglijk naamwoord
144-147
samenstellingen al dan niet met dubbele medeklinker
148-151
los of vast schrijven van woorden
152-159
gebruik koppelteken
1-4
zinsgrenzen herkennen
5-10
afbreken van woorden
11-22
komma-gebruik
23-26
gebruik aanhalingstekens
27-30
gebruik trema's
31-34
gebruik h&fdletters
35-36
vormaspecten brief
1-6
bepalen volgorde binnen zin en tussen zinnen
7-9
passende zin in context plaatsen 51
Tabel 3.1. Vervolg categorie
vragen
probleemtype
10-18
zinnen rangschikken onder opsteltitels
19-26
opstelonderwerpen op geschiktheid beoordelen
27-30
niet passende zin uit tekst verwijderen
31-32
tekst in alinea's verdelen
1-7
kiezen juiste voegwoord
8-10 15-20
juiste uitdrukking kiezen, bepalen of vorm correct is
11-14
juiste voorzetsels bij voorzetselvoorwerpen kiezen
21-27
verbeteren contaminatie en verkeerde samentrekking
28-32
betekenis uitdrukkingen bepalen
1-12
passend woord in context kiezen
13-23
woordbetekenissen aangeven
24-27
betekenis van zinnen en uitdrukkingen aangeven
idioom en stijl deel C
1-7
stijlfouten in opstel verbeteren
grammatica
1-7
gebrekkige zinsstructuur herkennen
idioom en stijl deel A
idioom en stijl deel B
52
categorie
vragen
probleemtype
8-12
incongruentie onderwerp en persoonsvorm
13-20
vervoegingsfouten
21-24
verbuiging verkleinwoorden
25-28
meervoudsvorming
29-35,50
vergelijkende en overtreffende trap
80-85
vorming zelfstandige naamwoorden
72-79
verbuiging bijvoeglijke naamwoorden
36-38
plaatsing scheidbaar en onscheidbaar samengestelde werkwoorden
51-54
weglaten zinsdelen
39-41
verwijzing
55-60
voornaamwoorden kiezen
42, 43
voegwoorden en inversie bijzin
61-71
lidwoord kiezen
86-88
wederkerende en wederkerige voornaamwoorden gebruiken
44-47 48-49
onjuiste vermenging van tijden
persoonlijk vnw. bij vergelijkende en overtreffende trap 53
een (grote) rol speelt met betrekking tot de moeilijkheidsgraad van de vraag, kan op de boven getoonde manier toch voorzichtig nagegaan worden of het resultaat van Assinks studie, namelijk dat het herkennen van een foute vorm als fout moeilijker is dan het herkennen van een goede vorm als goed, weer gevonden kan worden. Ook kan door de vormen zowel goed als fout aan te bieden nagegaan worden of de items die 'fout' als juist antwoord moeten hebben, beter discrimineren dan de items die 'goed' als juist antwoord hebben. Aanwijzingen hiervoor werden gevonden door Ebel (1972) en Grosse & Wright (1985). De laatsten tonen tevens aan dat er meer 'goed/fout' items nodig zijn om een bepaald betrouwbaarheidsniveau te bereiken dan vijfkeuze-items. Dit wordt veroorzaakt door de grotere raadkans bij tweekeuze-items. Categorieën met tweekeuzevragen zullen waarschijnlijk dus meer vragen moeten bevatten om een bepaalde betrouwbaarheid te bereiken, dan categorieën met vragen die meer dan twee alternatieven hebben. Er zijn verschillende publikaties met itemvoorbeelden bekeken om op ideeën te komen voor de itemconstructie. (Wesdorp, 1970, 1971a, 1971b, 1972, 1973, 1978; STEP, 1956; ITED, 1952; Plantenga e.a., 1971; Warries, 1969). Voor de constructie van toetsvragen voor de categorie 'spelling' bleek de publicatie van Van der Meulen (1971) zeer nuttig. Mogelijke spelfouten worden hierin per probleemtype behandeld. De uiteindelijke toets bestaat uit vier toetsboekjes: grammatica, spelling en interpunctie, inhoud en organisatie, en idioom en stijl. Elk van deze boekjes is weer opgebouwd uit verschillende subtests. De boekjes staan in bijlage 3. Een overzicht van de bevraagde probleemtypen staat in tabel 3.1. In bijlage 4. staan de goede antwoorden en de bevraagde probleemtypen per vraag.
54
4. STEEKPROEFTREKKING EN AFNAME 4.1. STEEKPROEFTREKKING Om de betrouwbaarheid en de validiteit van de meerkeuzetoets te evalueren en slechte vragen te kunnen verwijderen is de toets afgenomen bij leerlingen uit 28 zesde en twee vijfde klassen van basisscholen in Haarlem, Amsterdam, Purmerend en Monnickendam. De keuze viel op deze leeftijdsgroep, omdat het Cova-onderzoek zich op deze leeftijdsgroep richt. Daar het niet de bedoeling is van het onderhavige onderzoek om de resultaten van de leerlingen naar een bepaalde populatie te generaliseren, was het niet nodig om de steekproef a-select te trekken. Het enige doel van het onderzoek is het construeren van een valide en betrouwbaar meetinstrument voor het meten van schrijfvaardigheid. De scholen uit de bovenvermelde vier plaatsen zijn wegens hun bereikbaarheid gekozen. Zoals beschreven in hoofdstuk drie waren de toetsvragen verdeeld over vier boekjes. Uit de proefafnames bleek dat zesdeklas leerlingen ongeveer drie kwartier nodig hebben om één boekje te maken. Daar er, wegens de voorgenomen Rasch-schaling der vragen genoeg tijd voor het beantwoorden van iedere vraag moet worden gegeven, is besloten om per boekje één uur uit te trekken. Omdat het wat veel gevraagd is van een leraar om een klas vier uur af te staan voor onderzoek, is besloten twee boekjes per klas af te nemen. Om ook de relaties tussen de verschillende subtoetsen te kunnen onderzoeken moest een roulatie-schema gekozen worden waarbij voldoende leerlingen elke mogelijke combinatie van subtoetsen zouden maken. Het gehanteerde roulatieschema staat Tabel 4.1. De verdeling van de toetsboekjes over de proefpersonen. Toetsboekjes groepen leerlingen
1
2
3
4
1 2 3 4 5 6
55
bekend als het onvolledig, gebalanceerd blokontwerp (Meerling, 1981, d1.1: 203) en wordt schematisch voorgesteld in tabel 4.1. Om de vragen met behulp van het Rasch-model te schalen zijn ongeveer 200 leerlingen per schaal (subtoets) nodig en om de relaties tussen verschillende schalen enigszins betrouwbaar te kunnen schatten moeten er ongeveer 70 leerlingen per mogelijke combinatie van subtoetsen zijn. Op grond van deze overwegingen is besloten te streven naar vijf klassen per groep. Met een gemiddelde klassegrootte van 20 leerlingen zou dit neerkomen op 300 leerlingen per schaal en ongeveer 100 leerlingen voor elke combinatie van subtoetsen. De trekking van scholen heeft plaatsgevonden met behulp van het telefoonboek. Voor de zomervakantie '86/'87 is naar 36 scholen gebeld om te vragen of men in principe bereid was na de zomervakantie de toetsen op de scholen af te laten nemen. Precies 30 scholen hebben aan het onderzoek meegedaan, zodat de beoogde vijf klassen per groep uit schema vier zijn gehaald. Van deze dertig scholen waren er zeventien uit Haarlem (zes katholiek en elf openbaar), elf uit Amsterdam (één katholiek, één bijzonder en negen openbaar), één uit Monnickendam (openbaar) en één uit Purmerend (openbaar). In tabel 4.2. staat een overzicht van het aantal leerlingen dat een bepaalde subtoets heeft gemaakt.
56
Tabel 4.2. Gegeven zijn de aantallen leerlingen per groep, school en subtoets en de aantallen leerlingen die combinaties van twee subtoetsen maakten. groep school
2
3
4
5
6
Totaal
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
subtoets totaal dat gramm. spell. + idioom + inh. + 2 toetsen inter. stijl orga. maakte
20 22 17 23 17 10 28 27 22 14 23 31 26 21 18
20 22 18 22 14
10 26 27 22 15
17 27 6 19 29 23 24 18 30 17
17 26 6 21 28
319 306
57
95
22 31 26 21 18
99
118
96
12 15 19 16 23
23 25 18 32 16 12 13 18 16 24
111
283
315
601
82
4.2. AFNAME De afnames van de subtoetsen zijn gehouden in september en oktober 1987. De twee afnames per klas vonden, op één uitzondering na, niet op dezelfde dag plaats en zijn verricht door de auteur van dit rapport en een secretariaatsmedewerkster van de S.C.O. De instructie voor het maken van de toetsen werd voor de afnames aan de leerlingen uitgedeeld (zie bijlage 3.) en klassikaal door de proefleider behandeld. Tot het klassikaal behandelen van de instructie is besloten om zoveel mogelijk te voorkomen dat leesvaardigheid en algemene intelligentie een rol zouden spelen bij het beantwoorden van de vragen. Als de leerlingen tijdens de afname de instructie van een vraag niet begrepen, konden zij de proefleider om uitleg vragen. Vragen naar de betekenis van moeilijke woorden in de opdracht zelf (en niet in de instructie) of vragen naar of een bepaald antwoord goed was, zijn niet beantwoord. Dit omdat anders de resultaten niet meer éénduidig interpreteerbaar zouden zijn. Vragen met te moeilijke woorden of vragen die anderszins niet deugen moesten via data-analyse opgespoord worden. Ingrijpen in de resultaten zou de item-selectie negatief hebben kunnen beïnvloeden. Om het afkijken te beperken, werd de leerlingen verteld dat de vragenlijsten anoniem ingevuld moesten worden en er werd door de proefleiders ingegrepen zodra er leerlingen samen leken te werken. De instructies bij de vragen bleken moeilijk voor de leerlingen. Na uitleg van de proefleider bleken de vragen echter goed door de leerlingen te maken. Een uur per toetsboekje was voor vrijwel alle leerlingen ruim voldoende. De afnames verliepen zonder uitzondering goed. Het enige probleem was dat er op sommige Amsterdamse scholen veel allochtone leerlingen zitten voor wie de toets te moeilijk was.
58
5. RESULTATEN VAN DE DATA-ANALYSES 5.1. OPZET VAN HET HOOFDSTUK Om de validiteit van het geconstrueerde meetinstrument te evalueren zijn verschillende analyses met de verkregen data verricht. In paragraaf 5.2. worden de resultaten van betrouwbaarheidsanalyses gepresenteerd. Vervolgens worden in paragraaf 5.3. de resultaten van modeltoetsingen gegeven. Hiermee kan nagegaan worden of de veronderstelde structuur in de foutenclassificatie, op grond waarvan het instrument geconstrueerd is, door de empirie bevestigd wordt. In paragraaf 5.4. worden de resultaten van een aantal Raschschalingen gegeven. Door middel van deze schalingen kan nagegaan worden of de vragen van een subtest statistisch gezien unidimensioneel zijn. Daarnaast krijgen subtests, als het Rasch-model past, een grotere meettechnische kwaliteit. In paragraaf 5.5. wordt aangegeven hoe de vragen verdeeld moeten worden om twee parallelle toetsen te construeren. 5.2. BETROUWBAARHEIDSANALYSES Een meetinstrument moet betrouwbaar meten om valide te kunnen zijn. De betrouwbaarheid van een meetinstrument kan met behulp van verschillende indices geëvalueerd worden. In deze studie is uitsluitend gekeken naar de homogeniteit van de vragen die hetzelfde beogen te meten. De homogeniteit is geverifieerd door het berekenen van Cronbachs alpha over iedere subtest van het meetinstrument. Tevens werden de item-rest correlaties van de vragen per subtest berekend. Na verwijdering van vragen met een negatieve item-rest correlatie is over de resterende vragen per subtest wederom de alpha berekend. De alpha's en de vragen waarover ze berekend zijn staan in tabel 5.1. De alpha's moeten opgevat worden als een ondergrens van de ware betrouwbaarheid. Dit komt omdat de alpha's gevoelig zijn voor de parallelliteit van de vragen waarover ze berekend worden. Als alle vragen parallel zijn kan alpha als de ware betrouwbaarheid opgevat worden. Als de vragen waarover alpha berekend wordt niet parallel zijn, wordt alpha onterecht lager. Om deze reden is naast alpha voor iedere subtest ook de 'split-half' betrouwbaarheid berekend over zo parallel mogelijke subtesthelften. Mits de beide testhelften min of meer parallel zijn, benadert deze coëfficiënt de ware betrouwbaarheid voor een verzameling niet-parallelle vragen dichter, 59
Tabel 5.1 De betrouwbaarheid van de verschillende subtests. Inhoud en Organisatie Subtests
items
a/20
splithalf
Volgorde tussen zinnen en binnen zinnen bepalen
1-6
.24
.51
.20
Eén zin kiezen die tussen twee andere hoort
7-9
.25
.69
Totaal volgorde binnen en tussen zinnen
1-9 3-9 3,5-9
.37 .40 .40
.57 .66 .45
.26 .43 .45
.47 .72 .73
.81
Zinnen indelen bij onderwerpen
10-18
.73
.86
.71
.86
.79
Onderwerpen beoor- 19-23 delen op geschiktheid 25,26 voor een opstel 20,22, 23,25
.57
.79
.58
.82
.48
.62
.89
.57
.87
Niet passende zin uit verhaal halen
27-30
.44
.80
.46
.81
.55
Alinea's aangeven
31,32
Totaal
1-32
.73
.63
.77
.68
.64
3,5,7,918,20, 22,23, 25,27-29
.77
.77
.77
.77
.74
a
Waarden op open plekken zijn niet berekend. 60
splithalf/20 .45
p .69 .94
Grammatica a/20
splithalf
.44 .47
.75
.44
.47
.86
51-54
.60
.88
Verwijzing I
39-41
.23
.67
Verwijzing II
55-60
.19
56,57, 58,60 Totaal verwijzing I + II
Subtests
items
Gebrekkige zinsstructuur
1-7 2-7
(0n)-scheidbaar samengestelde werkwoorden
36-38
Voegwoord en inversie bijzin
42-43
Zinsdelen weglaten
a
splithalf/20
.72
p
.77 .76 .79
.59
.88
.44
.29
.58
.28
.66
.33
.71
.58
39-41, 55-60
.34
.53
.40
.63
.46
Incongruentie bijvoeglijk naamwoord en zelfstandig naamwoord
61-71
.76
.85
.77
.87
.67
Incongruentie bijvoeglijk naamwoord en zelfstandig naamwoord
72-79
.72
.87
.73
.87
.72
Wederkerig/end voornaamwoord
86-88
.58
.90
61
.65
.64
Grammatica (vervolg) Subtests
items
ot
Incongruentie onderwerp en persoonsvorm
8-12
-.02
Incongruentie van tijd 44-47
.50
a/20
splithalf
splithalf/20
p .57
.83
.39
.76
.62
.02
.05
.63
Vervoegingsfouten
13-20
-.13
Verkleinwoorden
21-24
.26
.64
.46
.81
.75
Meervoudsvorming
25-28
.36
.74
.31
.69
.64
Vergrotende en overtreffende trap
29-35, 50
.00
.01
29,31, 32,35,50
.24
.56
29,32,50
.22
.65
Vorming zelfstandige naamwoorden
80-85
.68
.88
Totaal verbuigingsfouten
21-35, 50,8085
.60
22-29, 31,32, 35,50, 80-85
.69
.71
.71
.73
.65
22,2427,29, 32,25, 80-85
.69
.76
.68
.75
.64
1-88
.87
.60
.88
.71
.64
Grammatica totaal
62
.57 .31
.71
.69
.58
.89
.62
.89
.68 .64
Interpunctie Subtests
items
Zinsgrenzen herkennen
1-4
a
a/20
splithalf
.24
.61
.10
.36
.41
Afbreken van woorden 5-10
.15
.37
.15
.37
.65
Kommagebruik
11-22
.38
.51
.46
.59
.64
Gebruik van aanhalingstekens
23-26
.34
.72
.53
.85
.68
Gebruik trema's
27-30
.19
.54
.00
.00
.58
Hoofdlettergebruik
31-34
.33
.83
.41
.78
.61
Aanhef/slot brief
35-36
Interpunctie totaal
1-36
.60
.45
.59
.44
.60
1-3,6-7, 10,12, 15-18, 20-22, 24,2628,30-33
.66
.64
.70
.68
.58
2,7,10, .64 16,18, 20,24,2628,30, 31,33
.73
.56
.66
.58
63
splithalf/20
p
Idioom en stijl (deel A) splithalf/20
p
splithalf
.42 .45
.73
.50
.77
.75
28-32
.49
.79
.47
.82
.51
8-10, 15-20
.18
.33
.20
.38
.42
8,10,1620
.27
.51
.31
.60
.39
11-14
.22
.59
.21
.57
.59
11,12,13
.34
.77
.03
.08
.00
.00
.23
.17
.51
.10
.36
.21
items
Betekenis voegwoorden
1-7 1,3-7
Betekenis uitdrukkingen Vorm van uitdrukkingen
Vaste voorzetsels
a
oc/20
Subtests
Verkeerde samentrek- 21-27 kingen 21,23, 26,27
64
.75
Idioom en stijl (deel B)
Subtests
items
Het juiste woord invullen
1-12
.64
.75
1-3,510,12
.68
.81
13-23
.66
.78
13-16, 18-23
.68
.81
.71
.83
.74
24-27
.29
.67
.41
.78
.53
a/20
splithalf
Woordbetekenissen aangeven
Betekenis zinnen en uitdrukkingen
a
cc/20
splithalf
splithalf/20
p
.46 .69
.82
.52 .68
Idioom en stijl (deel C) Subtests
items
Opstel verbeteren
1-7
.31
.56
3,4,6,7
.39
.76
a
65
splithalf/20
p
.37 .37
.75
.42
Idioom en stijl (deel A en B) Subtests
items
Betekenisvragen
Deel A: .78 1-7,28-32 Deel B: 13-27
.72
Deel A: .80 1-7,28-32 Deel B: 13-16, 18-23, 25-27
.76
.82
.78
.69
Deel A: 1 ,3,4, 7,28-32 Deel B: 13-16, 18-23, 25-27
.80 -
.78
.80
.78
.66
Deel A: 8-20 Deel B: 1-12
.57
.51
.56
.50
.47
Deel A:
.66
.67
.64
.66
.48
Deel A: .70 8,9,11-13 Deel B: 1-3,510,12
.76
Stijlvragen
a
8-14,16
a/20
splithalf
splithalf/20
p .65
Deel B: 1-10,12
66
.55
Spelling-woordbeeld Subtests
items
Woordbeeld-spelling
1-61
a
a/20
splithalf
.66
.39
.65
.38
.69
1-5,7,9,- .72 10,12, 13,15,1620,22, 24,25, 28,29, 30,32,3436,3842,4447,5059,61
.53
.73
.54
.72
67
splithalf/20
p
Spelling-regelgestuurd vervoegingen Subtests
items
a
Voltooid deelwoord dit en o.t.t.
62-69
-.07
62-64,67
.007
O.t.t., t/dt/d
70-75
-.09
Voltooid deelwoord t/d
76-81
.34
O.v.t. en bijvoeglijk gebruikt voltooid deelwoord
82-85
-.17
O.v.t. dd/d/t/tt
86-93, 98,99
.49
86,87, 89,90, 92,93, 98,99
a/20
splithalf
splithalf/20
.54
-.08 .03
.06
.24
.00 .63
p
.37 .59
.44
.72
.62
.04
.17
.50
.66
.53
.69
.68
.56
.76
.65
.82
.67
.71
.91
.70
.92
.57
.33
.71
.35
.73
.73
86,89, 90,98,99 Bijvoeglijk gebruikt voltooid deelwoord
94-97
68
Spelling-regelgestuurd vervoegingen (vervolg) Subtests
items
Totaal spellingregelgestuurd vervoegingen
62-65, 67,69, 71-83, 86-99
a
a/20
splithalf
.66
.54
.68
.56
.60
62,63, 67,69, 72,7783,8690,92-99
.71
.66
.77
.73
.60
62,63, 67,69, 72,78, 81-83, 86-90, 94-99
.74
.74
.79
.79
.57
69
splithalf/20
p
Spelling-regelgestuurd verbuigingen Subtests
items
Meervoudsvorming
100-107
cz
c/.120
splithalf
.12
.25
-.04
100-101, 103,105107
.30
.59
.29
.58
.88
100,101, 103,106
.34
.72
.72
.79
.87
Zelfstandig voor108,110, naamwoordelijk meer- 111,113 voud met of zonder 'n'
.04
.17
.15
.47
.69
Bezittelijk gebruikt persoonlijk voornaamwoord
114,115
.05
.21
-.10
.65
Genitief 's' of apostrof en weglatingsapostrof
116-123
.04
.09
-.18
.72
116,117, 120,121, 123
.22
.53
.23
.60
.76
116,117, 120,123
.26
.64
.25
.63
.72
Stoffelijk bijvoeglijk naamwoord
124-127
.20
.56
.18
.52
.83
Verkleinwoorden
128,130, 131,138
.31
.69
.26
.64
.60
70
splithalf/20
p
.76
Spelling-regelgestuurd verbuigingen (vervolg) Subtests
a
items
a/20
splithalf
splithalf/20
p
Stemhebbende of -loze 132-135 medeklinker als uitgang
.47
.82
.55
.86
.89
Medeklinker enkel of 129,136, dubbel 137,139
.13
.43
.17
.51
.79
Zelfstandig gebruikt bijvoeglijk naamwoord
140-143
.00
Samenstellingen
144-147
.34
.72
.41
Los of vast schrijven 148-151 van woorden
.03
.13
-.11
.57
Verbindingsstreepje
.04
-.15
.75
Samentrekkingsstreep- 156-159 -.09 je
-.18
.58 .67
152-155
Totaal verbindings- en 152-159 samentrekkingsstreepje 153-155, 158
71
-.21
.11
.24
-.09
.38
.80
.46
.61
.78
.81
.71
.70
Spelling-regelgestuurd verbuigingen (vervolg) Subtests
items
Totaal verbuigingen en samenstellingen
100-159
Totaal spelling-regelgestuurd
a
cc/20
splithalf
.69
.43
.73
.47
.71
100-103, 105-109, 111-117, 119-136, 138-147, 149,151155,157, 158
.75
.54
.80
.61
.73
62-159
.77
.41
62,67, 69,7176,78, 79,8183,8690,93103,106, 109,111, 113,114116,120, 122,123, 125-136, 138-143, 145,147, 149,151, 154,155, 158
.84
.62
72
splithalf/20
p
.67 .84
.62
.68
dan de alpha. Het splitsen van de subtests in twee zo parallel mogelijke helften is geschied door paren zo parallel mogelijke vragen te selecteren 9p grond van overeenkomende item-rest correlaties en p-waarden . De correlatie tussen de twee testhelften is op te vatten als een schatter van de split-half betrouwbaarheid van elk van de twee helften. De split-half van de twee helften samen kan benaderd worden met behulp van de Spearman-Brown formule voor parallelle testverlenging (Allen & Yen, 1979). In tabel 5.1. worden naast de alpha's ook de split-half betrouwbaarheden en de gemiddelde p-waarden voor verschillende combinaties van items gegeven. Omdat zowel de alpha als de split-half betrouwbaarheid groter worden naarmate het aantal (onderling positief correlerende) items groter wordt, is van zowel de alpha als de split-half met de Spearman-Brown formule een gestandaardiseerde versie berekend, uitgaande van twintig vragen per subtest. Deze gestandaardiseerde coëfficiënten zijn onderling vergelijkbaar en geven informatie over de potentiële betrouwbaarheid van de vragen uit de verschillende subtests. Voor subtests met minder dan vier vragen is geen split-half berekend, omdat een testhelft dan uit één vraag zou bestaan. Een correlatie tussen twee vragen is onvoldoende representief om een uitspraak over de potentiële validiteit van een bepaald soort vragen te doen. Na selectie van vragen is de gemiddelde split-half .36. De gemiddelde split-half van de inhoud- en organisatiesubtests bedraagt .55, van de grammaticasubtests .47, van de interpunctiesubtests .28, van de idioom- en stijlsubtests .42 en van de spellingsubtests .37. Deze coëfficiënten zijn vrij laag, maar daar moet bij in aanmerking genomen worden dat sommige subtests slechts uit vier vragen bestaan. De gemiddelde split-half van de gestandaardiseerde versies van de subtests is .64. Veertien van de 54 subtests hebben een split-half betrouwbaarheid onder de .20. Na verwijdering van deze subtests, is de gemiddelde split-half .48. Een mogelijke verklaring voor de lage betrouwbaarheidscoëfficiënten van sommige subtests is dat de desbetreffende vragen te moeilijk voor de leerlingen waren. Bij moeilijke vragen speelt de raadkans een grotere rol dan bij makkelijke vragen. Hoe groter de rol van de raadkans is bij het beantwoorden van de vragen, hoe Deze splitsing werd uitgevoerd met behulp van een Basic-programma geschreven door dr M. Eiting 73
lager de betrouwbaarheid. De gemiddelde p-waarde van de items van de subtests met betrouwbaarheidscoëfficiënten kleiner dan .20 is .56. De gemiddelde p-waarde van de vragen van de overige subtests is .69. Indien uitsluitend raadgedrag aan de beantwoording van de vragen ten grondslag zou liggen, zou de p-waarde ± .50 bedragen voor tweekeuze-vragen en .25 voor vierkeuze-vragen. De correlatie (p.m.c.) tussen de gevonden split-half betrouwbaarheid voor 20 vragen per subtest en de gemiddelde p-waarde van vragen in een subtest is .61. Het is dus waarschijnlijk dat de alpha's en de split-half betrouwbaarheden hoger uit zouden vallen als er oudere (vaardiger) leerlingen als proefpersonen gekozen zouden zijn of als er gemakkelijker vragen aan de subtests toegevoegd zouden worden. 5.3. TOETSING VAN HET MODEL OP GROND WAARVAN HET MEETINSTRUMENT IS GECONSTRUEERD De constructie van het meetinstrument is, zoals beschreven in hoofdstuk 3., gebaseerd op een classificatie van mogelijke schrijffouten (of gebreken in schrijfvaardigheid). De classificatie kent de volgende categorieën: inhoud en organisatie, grammatica op woordniveau, grammatica op zinsniveau, interpunctie, idioom en stijl, regelgestuurde spelling en woordbeeld spelling. Elk van deze categorieën wordt vertegenwoordigd in het meetinstrument door één of meer subtests. Er zijn met behulp van het programma LISREL (kireskog & SÉ5rbom, 1986) verschillende toetsingen uitgevoerd om na te gaan of de in de classificatie gemaakte onderscheidingen door de empirie bevestigd worden. De toetsingen zijn uitgevoerd in verschillende stappen. Eerst is gekeken of alle subtests die bij één categorie horen op een éénfactor model te passen zijn. Dit leverde een aantal toetsingen per categorie op. Na deze modeltoetsingen per categorie (en na verwijdering van subtests die niet in het éénfactormodel pasten) is het totale model getoetst. Dit totale model is mede samengesteld op grond van de resultaten van de afzonderlijke toetsingen per categorie. De subtests die bij de afzonderlijke toetsingen gefixeerd waren, zijn bij de toetsingen van het totale model op dezelfde wijze gefixeerd. In de analyse zijn, op vier subtests na, alleen subtests meegenomen met een homogeniteit of split-half groter dan .20. Deze grens is zo laag gesteld omdat het wenselijk was minimaal vier subtests per factor te hebben, daar er anders restricties aan de te toetsen modellen opgelegd moesten worden. Eén interpunctiesubtest (nr. 1) met een split-half van .15 is meegenomen, omdat er anders 74
slechts drie interpunctie-subtests overbleven. Drie spellingssubtests (nr. 6,8 & 11) met split-half coëfficiënten van van (respectievelijk) .15, .18 en .17 zijn meegenomen, omdat het interessant leek om na te gaan of de subtests op de juiste factor zouden laden. Een nadeel van het opnemen van subtests met een lage betrouwbaarheid is dat de power van de modeltoetsingen daar geringer van wordt. In de onderstaande tabellen worden bij elke toetsing de factorladingen, hun standaardmeetfout en een Chi-kwadraat berekend met een bepaalde overschrijdingskans. Daarnaast worden de 'Root Mean Square Residual' en de 'goodness of fit-index' gegeven. Deze laatste twee maten zijn moeilijk te interpreteren. De eerste is een maat voor de gemiddelde grootte van de residuen. Hoe kleiner deze waarde is, hoe beter de passing van het model. Waarden kleiner dan .07 worden over het algemeen als klein gezien. De 'goodness of fitindex' is een maat voor de passing die kan variëren tussen 0 en 1. waarden groter dan .90 worden over het algemeen opgevat als wijzend op een redelijke passing. De resultaten van de toetsingen worden hieronder per toetsing behandeld. De eerste uitgevoerde modeltoetsing betreft de inhoud- en organisatie-subtests. De betrokken subtests met bijbehorende vraagnummers zijn: 1. 2. 3. 4.
volgorde tussen zinnen en binnen één zin bepalen (3-9) zinnen indelen bij onderwerpen (10-18) onderwerpen op geschiktheid beoordelen (19, 23, 25, 26) niet passende zin uit verhaaltje halen (27-30)
Het resultaat van de toetsing staat in tabel 5.2. Tabel 5.2. De toetsing van het éénfactormodel voor de "inhoud en organisatie"- subtests. Variabele Factor- St. meetfout RMR df X 2 gfi lading 1 2 3 4
.44 .69 .46 .53
.07 .08 .07 .07
.022
2
2,4 .996
P
.299
Uit de tabel blijkt dat het één-factormodel voor de vier 'inhoud 75
en organisatie'-subtests goed past. De factorladingen zijn redelijk, de residuen zijn klein (RMR), de 'goodness of fit-index' is groot en de overschrijdingskans (p) is niet significant. De tweede modeltoetsing betreft de categorie 'grammatica'. Eerst is nagegaan of alle grammatica subtests in een éénfactormodel gepast konden worden. Als dit model past, is de onderscheiding in grammatica op zinsniveau en grammatica op woordniveau niet relevant, daar alle tests dan min of meer hetzelfde blijken te meten. De betrokken subtests met bijbehorende vraagnummers zijn: 1 gebrekkige zinsstructuur herkennen (1-7) 2 zinsdelen weglaten (51-54) 3 totaal anafora (39-41, 55-60) 4 incongruentie lidwoord en zelfstandig naamwoord (61-71) 5 incongruentie van tijd (44-47) 6 vervoeging bijvoeglijk naamwoord (72-79) 7 meervoudsvorming (25-28) 8 vergrotende en overtreffende trap (29, 31, 32, 35, 50) 9 verkleinwoorden (21-24) 10 vorming zelfstandig naamwoord (80-85) Het resultaat van de modeltoetsing staat in tabel 5.3. Tabel 5.3. De toetsing van het éénfactormodel voor de grammatica-subtests. Variabele Factor- St. meetfout RMR df X2 gfi ladingen 1 2 3 4 5 6 7 8 9 10
.64 .50 .69 .61 .46 .57 .56 .49 .36 .59
p
.052 35 87,14 .942 . 'is
.06 .06 .06 .06 .06 .06 .06 .06 .06 .06
Uit de tabel blijkt dat het model matig tot redelijk past. De over76
schrijdingskans is significant, maar de 'goodness of fit-index' is groot en de RMR is klein. Omdat in het model twee verschillende subcategorieën binnen de categorie 'grammatica' onderscheiden zijn, is ook een tweefactormodel getoetst. Als dit model beter past dan het bovenstaande model, is dat een ondersteuning voor de onderscheiding in grammatica op zins- en grammatica op woordniveau. De resultaten van de toetsing van het tweefactormodel staan in tabel 5.4. De subtests één tot en met vijf betreffen grammatica op zinsniveau en de subtests zes tot en met tien grammatica op woordniveau. Tabel 5.4. De toetsing van het tweefactormodel voor de grammatica-subtests (zins- en woordniveau). Variabelen Factor- St. meetfout RMR df ladingen 1 2 1 2 3 4 5 6 7 8 9 10
.63 .51 .71 .62 .47 - .60 - .58 - .51 .35 - .61 -
.11 .12 .11 .11 .12 .12 .12 .12 .12 .12
.051
34
X 2 gfi
p
21,87 .909 .946
factoren: 1=zinsniveau 2=woordniveau Uit deze tabel blijkt dat het tweefactormodel voor grammatica veel beter past dan het éénfactormodel. De factorladingen, de RMR en de gfi blijven ongeveer gelijk, maar de overschrijdingskans wordt enorm veel groter. Daar het tweefactormodel geflest is in het éénfactormodel, kan gesteld worden dat de toevoeging van een tweede factor een significante verbetering van de passing oplevert. Het verschil in vrijheidsgraden is één en het verschil in Chi-kwadraat waarden is 65.27. De volgende modeltoetsing betreft de categorie 'interpunctie'. De betrokken subtests zijn: 77
1. 2. 3. 4.
afbreken van woorden (5-10) kommagebruik gebruik van aanhalingstekens (23-26) hoofdlettergebruik (31-34)
Het resultaat van de modeltoetsing staat in tabel 5.5. Tabel 5.5. De toetsing van het éénfactormodel voor de interpunctie- subtests. Variabelen Factor- St. meetfout RMR df X2 gfi p ladingen 1 2 3 4
.53 .30 .28 .49
.11 .09 .09 .10
.018
2
1.26 .998 .533
Het éénfactormodel voor de vier interpunctiesubtests blijkt te passen. De gfi en de overschrijdingskans zijn groot en de RMR is klein. De ladingen van de subtests twee en drie zijn aan de lage kant. De volgende modeltoetsing betreft de categorie 'idioom en stijl'. Binnen deze categorie zijn bij de modeltoetsing twee factoren onderscheiden. Een éénfactormodel is niet gepast, omdat de betrokken subtests verschillende vaardigheden beogen te meten. De eerste factor bevat alle subtests die naar de betekenis van woorden, zinnen en uitdrukkingen vragen en de tweede factor bevat de subtests waarbij gevraagd wordt of een bepaalde (idiomatische) vorm correct is (stijl). De betekenisfactor wordt gemeten door de subtests: 1. 2. 3. 4.
betekenis voegwoorden (1, 3-7) betekenis uitdrukkingen (28-32) betekenis zelfstandige naamwoorden (13-16, 18-23) betekenis zinnen en uitdrukkingen (24-27)
De resultaten van de toetsing staan in tabel 5.6.
78
Tabel 5.6. De toetsing van het éénfactormodel voor de betekenissubtests.
Variabelen Factor- St. meetfout RMR df X 2 gfi p ladingen 1 2 3 4
.58 .63 .66 .60
.010
.06 .06 .06 .06
2
.74
.999 .690
Het éénfactormodel voor de betekenissubtests blijkt goed te passen. De overschrijdingskans en de gfi zijn groot en de RMR is zéér klein. Voor de toetsing van het éénfactormodel voor de stijlsubtests zijn de volgende subtests gebruikt: 1. 2. 3. 4.
vomi van uitdrukkingen (A: 8, 10, 16-20) vaste voorzetsels (A: 11-14) juiste woord invullen (B: 1-12) opstel verbeteren (C: 1-7)
Het resultaat van de modeltoetsing staat in tabel 5.7. Tabel 5.7. De toetsing van het éénfactormodel voor de stijlsubtests. Variabelen Factor- St. meetfout RMR df X 2 gfi ladingen 1 2 3 4
-.02 .62 .63 .49
.07 .08 .08 .07
.02
2
1.75 .997 .417
Zoals blijkt uit de tabel past het éénfactormodel goed. De gfi en de overschrijdingskans zijn groot, de RMR is klein. Subtest één (vorm uitdrukkingen) blijkt echter niet op de factor te laden. Deze subtest meet dus niet de bedoelde vaardigheid. Om deze reden is het model nogmaals getoetst, maar nu alleen met subtests twee, 79
drie en vier. Omdat er nu een toetsing plaatsvindt met minder dan vier subtests, waardoor het model waarin de factorladingen vrij geschat worden niet geïdentificeerd is, moest er een restrictie opgelegd worden aan het te toetsen model. Daar de factorladingen van subtest twee en drie bij de eerste toetsing vrijwel gelijk waren (.62 en .63) zijn de factorladingen van deze twee subtests aan elkaar gelijk gesteld. Het resultaat van de toetsing staat in tabel 5.8. Tabel 5.8. De toetsing van het éénfactormodel voor de stijlsubtests, 2e maal. Variabelen Factor- St. meetfout RMR df X 2 gfi p ladingen 2 3 4
.63 .63 .49
.002 1
.05 .05 .07
.01
1.00 .923
Uit de tabel blijkt dat het éénfactormodel voor de drie stijlsubtests vrijwel perfect past. De volgende modeltoetsing betreft de categorie 'spelling'. Deze categorie bestaat uit twee subcategorieën, woordbeeldspelling en regelgestuurde spelling. De volgende dertien subtests zijn bij de toetsing betrokken: 1 woordbeeldspelling (1-61) regelgestuurde spelling (subtest 2-13) 2 voltooid deelwoord (76-81) 3 onvoltooid verleden tijd (86, 89, 90, 98, 99) 4 bijvoeglijk gebruikt voltooid deelwoord (94-97) 5 meervoudsvorming (100-106) 6 zelfstandig voornaamwoordelijk meervoud (108, 110, 111, 113) 7 genitief-s en apostrof (116, 117, 120, 123) 8 stoffelijk bijvoeglijk naamwoord (124-127) 9 verkleinwoorden (128, 130, 131, 138) 10 stemhebbende of -loze medeklinker als uitgang (132-135) 11 (mede-)klinker enkel of dubbel (129, 136, 137, 139) 12 samenstellingen (144-147) 12 verbindings- en samentrekkingsstreepje (153-155, 158)
80
Eerst is getoetst of alle dertien subtests te passen waren op een éénfactormodel. De resultaten van deze toetsing staan in tabel 5.9. Tabel 5.9. De toetsing van het éénfactormodel voor de spellingsubtests. Variabelen Factor- St. meetfout ladingen
RMR df
X 2 gfi
1 2 3 4 5 6 7 8 9 10 11 12 13
.052
126.63 .941 .000
.72 .35 .45 .50 .53 .30 .36 .58 .45 .54 ,31 .35 .48
.06 .06 .06 .06 .06 .06 .06 .06 .06 .06 .06 .06 .06
65
p
Uit de tabel blijkt dat dit model matig tot redelijk past. De factorladingen zijn redelijk, de RMR is klein en de 'goodness of fit index' is groot. Alleen de overschrijdingskans is significant. Vervolgens is het model getoetst waarin, zoals verondersteld in de foutenclassificatie, regelgestuurde en woordbeeldspelling twee aparte factoren vormen. Omdat er in de categorie woordbeeldspelling maar één subtest was, is de factorlading van deze test op de woordbeeldfactor gefixeerd op de wortel uit de split-half betrouwbaarheid van deze subtest . De resultaten van de toetsing staan in tabel 5.10.
* Het kwadraat van een factorlading van een subtest is op te vatten als een maat voor de betrouwbaarheid van die subtest. 81
Tabel 5.10. De toetsing van het tweefactormodel voor de spellingsubtests. Variabelen Factor- St. meetfout ladingen 1 2
RMR df
1 2 3 4 5 6 7 8 9 10 11 12 13
.052
.88 -
-
.35 .45 .49 .53 .30 .36 .58 .45 .54 .31 .35 .48
.00 .06 .06 .06 .06 .06 .06 .06 .06 .06 .06 .06 .06
Correlatie tussen factor 1 en 2: .812
66
X2 gfi
p
126,64 .941 .000
St. meetfout: .04
factoren: 1= woordbeeld- spelling 2= regelgestuurde spelling Uit de tabel blijkt dat het tweefactormodel ongeveer evengoed past als het éénfactormodel. Om na te gaan of er een beter passend model te vinden was, is nog een toetsing uitgevoerd, waarbij de tweede factor (regelgestuurde spelling) in twee factoren gesplitst is. De eerste van deze twee factoren krijgt ladingen van de vervoegingssubtests (werkwoordspelling), de andere factor de overige subtests (verbuigingen). Omdat er slechts twee spellingssubtests over vervoegingen beschikbaar waren, zijn de factorladingen van deze twee subtests aan elkaar gelijk gesteld. De resultaten van deze toetsing staan in tabel 5.11.
82
Tabel 5.11. De toetsing van het driefactormodel voor de spellingsubtests. Variabelen
St. meetfout RMR df Factorladingen 1 2 3
1 2 3 4 5 6 7 8 9 10 11 12 13
.88 - - -
- .46 .46 -
-
.49 .54 .31 .36 .60 .46 .55 .31 .35 .47
.053
.00 .12 .12 .12 .12 .12 .12 .12 .12 .12 .12 .12 .12
Correlaties tussen factoren: 1 + 2 : .77 1 + 3 : .80 2 + 3 : .80
64
X 2
gfi
P
32.92 .942 1.00
St. meetfout .23 .13 .22
factoren: 1= woordbeeld 2= regelgestuurd vervoegingen 3= regelgestuurd verbuigingen Uit de tabel blijkt dat het driefactormodel voor de spellingsubtests zéér goed past. De overschrijdingskans is zelfs 1.00. De verbetering van het derde model ten opzichte van het tweede en het eerste model is in beide gevallen significant (1 & 3: X 2 = 93.71, df = 1; 2 & 3: = 93.72, df = 2). De laatste toetsing die is uitgevoerd is de toetsing van het gehele model. Dit model is mede gebaseerd op de resultaten van de voorgaande toetsingen. Er worden negen factoren onderscheiden, te weten; een inhoud en organisatiefactor, twee grammaticafactoren (zins- en woordniveau), een interpunctiefactor, een betekenisfactor, een stijlfactor en drie spellingfactoren (woordbeeld, regelgestuurde vervoeging en regelgestuurde verbuigingen). 83
Omdat de correlatiematrix van alle subtests niet positief definiet bleek te zijn, is voor deze toetsing een andere schattingsmethode gebruikt dan bij de voorgaande toetsingen (U.L.S. i.p.v. M.L.) (Rireskog & &k bom, 1986). Hierdoor is het niet mogelijk een Chikwadraat of standaardmeetfouten te berekenen. Waarschijnlijk is, dat de matrix niet positief definiet is wegens het blokontwerp (zie hoofdstuk 4) volgens welk schema de vragenlijsten zijn afgenomen. Hierdoor hebben telkens andere groepen proefpersonen combinaties van subtests gemaakt. Bij de toetsingen per categorie leverde dit geen probleem op, omdat elke categorie slechts in één toetsboekje voorkwam. De resultaten van de toetsing staan in tabel 5.12. De waarden tussen haakjes zijn de factorladingen die gevonden zijn bij de toetsing per categorie. Deze zijn in de tabel gegeven, omdat uit de discrepanties tussen de factorladingen gevonden bij de toetsing van het totale model en de factorladingen gevonden bij toetsingen per factor afgeleid kan worden of de resultaten van de toetsende factoranalyses enigszins stabiel zijn. Deze controlemogelijkheid is in dit geval te meer van belang, omdat, wegens de gehanteerde schattingsmethode bij het toetsen van het totale model, geen Chi-kwadraat berekend kon worden. -
84
Tabel 5.12. De toetsing van het gehele model met negen factoren. Sub- factortalingen tests 2 3
4
5
6
7
8
9
inhoud en organisatie 53(.44) 2 .55(.69) 3 .45(.46) 4 .58(.53)
grammatica 2 3
4
5 6 7 8
9
10
.62(.65) .59(.51) .65(.71) .65(.62) .43(.47) .58(.60) .57(.58) .53(.51) .35(.35) .61(.61)
Interpunctie 1 2 3 4 betekenis 1 2 3 4 stijl 1 2 3 4 spelling 1 2 3 4 5 6 7 8 9 10 11 12 13
.41(.53) .29(.30) .37(.28) .52(.49) .64(.58) .65(.63) .63(.66) .54(.60)
.66(.63) .66(.63) .41(.49) .88(.88)
Ar(.e1.6) .46(.46) .56(.49)
.51(.54) 29(.31) .36(.36) .54(.60) .46(.46) .51(.55) .23(.31) .35(.35) .35(.47)
R: =.086 gfl..912
(Zie voor verklaring der factornummers tabel 5 .13 . )
Tabel 5.13. De correlaties tussen factoren. factoren 1 1 2 3 4 5 6 7 8 9
2
3
4
5
6
7
8
9
1.00 .75 1.00 .47 .93 1.00 .79 .67 .67 1.00 .98 .88 .80 .96 1.00 1.10 .88 .86 .77 1.04 1.00 .59 .65 .67 .78 .90 .69 1.00 .60 .014 -.09 .95 .79 .77 .77 1.00 .68 .92 .89 .84 .50 .52 .81 .82 1.00
factoren: 1= inhoud en organisatie 2= grammatica zinsniveau 3= grammatica woordniveau 4= interpunctie 5= betekenis 6= stijl 7= woordbeeld-spelling 8= regelgestuurde spelling vervoegingen 9= regelgestuurde spelling verbuigingen
86
Uit de tabel blijkt dat het model redelijk past. De 'goodness of fit index' is hoog en de RMR is niet erg groot. Daarnaast verschillen de factorladingen gevonden bij de toetsingen per factor niet erg van de ladingen gevonden bij de toetsing van het totale model. Als we naar de correlaties tussen de verschillende factoren van het model kijken (zie tabel 5.13.), zien we dat de stijlfactor en de betekenisfactor erg hoog samenhangen. Dit zou erop kunnen wijzen dat de testjes die op deze factoren laden, anders dan verwacht was, toch gelijke vaardigheden meten. Zoals verwacht kon worden hangen ook de twee grammaticafactoren onderling hoog samen, evenals de drie spellingsfactoren; maar deze correlaties zijn laag genoeg om de factoren als gescheiden factoren te blijven zien. Verder hangt de derde spellingsfactor (verbuigingen) hoog samen met de twee grammaticafactoren, terwijl de tweede spellingsfactor (vervoegingen) juist heel laag met de grammaticafactoren samenhangt. Dit zou veroorzaakt kunnen worden door de grote mate van aandacht in het onderwijs voor het correct vervoegen van werkwoorden. 5.4. RASCH-SCHALINGEN In de nu volgende paragraaf worden de resultaten van verschillende Rasch-schalingen gegeven. De vragen van de verschillende subtests zijn met behulp van het Rasch-model geschaald om verschillende redenen. Ten eerste kan door de vragen te schalen grofweg nagegaan worden of de vragen van één subtest min of meer één vaardigheid (of een cluster van onderling hoog samenhangende vaardigheden) meten. Daar er bij de constructie van de verschillende subtests gestreefd is naar unidimensionaliteit, kan deze schaling als een validiteitscontrole opgevat worden. Een andere reden om het Rasch-model te passen op de vragen is dat, als het model past, er een aantal meettechnische problemen opgelost kunnen worden met behulp van het model.Het model biedt, als het past, de mogelijkheid om verschillende tests op elkaar af te stemmen, om tests te optimaliseren voor een bepaalde populatie, en om de resultaten van verschillende groepen proefpersonen op verschillende combinaties van vragen onderling te vergelijken. Daarnaast kan de kwaliteit van de vragen geëvalueerd worden onafhankelijk van de getrokken steekproef en de proefpersonen kunnen vergeleken worden, onafhankelijk van de gebruikte vragen. Een derde reden waarom de schaling van de taalvaardigheidsvragen interessant is, is dat schalingstechnieken van groot nut kunnen zijn bij item-banking en er tot op heden weinig ervaring is opgedaan met schaling van taalvaardigheidsvragen. 87
Het Rasch-model kent een aantal stringente aannamen. Ten eerste gaat het model ervan uit dat de te schalen vragen unidimensioneel zijn. Dit betekent dat er slechts één vaardigheid (of cluster van onderling hoog samenhangende vaardigheden) voor het beantwoorden van de vragen van belang mag zijn. Bij de constructie van de toets (zie hoofdstuk 3) is per subtest naar unidimensionaliteit gestreefd. Bij meerkeuzevragen wordt de aanname van unidimensionaliteit echter geschonden, daar naast de te meten vaardigheid ook de raadkans een rol speelt bij het beantwoorden van de vragen. Daar komt bij dat de raadkans niet voor alle vragen even groot is, omdat er bij moeilijke vragen vaker geraden wordt. Daarnaast is de invloed van de raadkans op de scores het grootst voor de minst vaardige proefpersonen (aangenomen dat dezen het vaakst raden). Hoe erg het is dat deze aanname geschonden wordt, zal uit de schaalbaarheid van de vragen moeten blijken. Voor 'spelling' en 'grammatica' zijn meer schalen gepast, omdat uit de toetsende factoranalyses bleek dat de subtests van deze categorieën het best op een model met meer factoren passen. Een tweede aanname van het model is dat de te schalen vragen locaal stochastisch onafhankelijk zijn. Dit betekent dat het antwoord op de éne vraag niet mag helpen bij het vinden van het antwoord op een andere vraag. Bij de constructie van de vragen is er daarom bij voorbeeld op gelet dat er bij één stukje tekst slechts één vraag gesteld werd. Een derde aanname van het Rasch-model is dat er geen tijdslimiet gesteld wordt bij het beantwoorden van de vragen. Dit omdat anders de vraagparameters niet goed berekend kunnen worden. Bij tests met een tijdlimiet is namelijk niet duidelijk of de laatste vragen van de test die niet gemaakt zijn, zijn overgeslagen vanwege een gebrekkige vaardigheid, dan wel vanwege tijdgebrek. Bij de afnames van de toets is de afnametijd dan ook ruim genomen. Ten vierde veronderstelt het Rasch-model dat alle vragen met een ongeveer gelijke moeilijkheidsgraad een ongeveer gelijke itemrest correlatie hebben. In de praktijk is dit vaak niet het geval. Om deze reden is het riskant om vragen te selecteren op grond van de passing op een Rasch-schaal. Een vraag met een hele hoge itemrest correlatie in een verzameling vragen met een gemiddelde itemrest correlatie zou verwijderd kunnen worden. In de klassieke testtheorie zijn items met een hoge item-rest correlatie juist de beste items. De reden dat deze aanname in het Rasch-model gedaan is, is dat er door deze aanname veel minder proefpersonen nodig zijn om tot redelijk precieze schattingen van item- en persoonsparameters te komen (± 300 i.p.v. ± 1500). Om de passing van de data op het model te toetsen zijn er per 88
schaal de Anderson (A-ICCSL)- en de Martin-Lijf (ML-ICCSL)-toets uitgevoerd (Gustafsson, 1980). Daarnaast is er per vraag een passingsmaat berekend. De resultaten van de toetsing staan in tabel 5.14. De Anderson-toets toetst of de gevonden itemparameters onafhankelijk zijn van de steekproef op grond waarvan ze berekend worden. In deze studie is de populatie voor de Anderson toets voor elke schaal gesplitst in een populatie met proefpersonen die onder het gemiddelde scoren en een populatie van proefpersonen die boven het gemiddelde scoren. Er is gekozen voor deze tweedeling op grond van de totaalscore (i.p.v. bij voorbeeld op grond van sexe) omdat áls de raadkans een te grote rol speelt, dit vooral tot uiting zal komen in verschillende itemparameters voor de items, berekend met de scores van de lage scoorders en de parameters berekend met de scores van de hoge scoorders: de raadkans speelt bij de lage scores een grotere rol dan bij de hoge scores. Natuurlijk zou gevonden afhankelijkheid van itemparameters ook veroorzaakt kunnen worden door andere factoren dan de raadkans. Naast een Chi-kwadraat met een aantal vrijheidsgraden en een overschrijdingskans berekend op grond van verschillen in de itemparameters van alle items samen, geeft de Anderson toets ook een t-waarde per item. Waarden groter dan twee of kleiner dan min twee duiden op items die verschillende parameters krijgen als deze apart worden berekend voor de hogere en de lagere score-groep. In tabel 5.14. warden naast de Chi-kwadraat, het aantal vrijheidsgraden en de overschrijdingskans ook deze items gegeven. Voor de Martin-Liif-toets wordt met behulp van de verschillen tussen waargenomen en voorspelde frequenties van juiste antwoorden voor personen met verschillende ruwe scores getoetst hoe groot de discrepanties zijn per score-groep. De toets geeft een Chi-kwadraat voor alle scoregroepen samen. In tabel 5.14. worden de Chi-kwadraat, het aantal vrijheidsgraden en de overschrijdingskans van de Martin-Ut" toets gegeven. Tot slot is voor elk item een variatie op de bovenbeschreven Martin-Ld toets berekend. Per item worden daarbij voorspelde en gevonden frequenties per score-groep vergeleken. Als het model past, is het geobserveerde verschil binomiaal verdeeld. Er wordt per scoregroep een z-score berekend en een toetsgrootheid over een bepaalde combinatie van de z-scores als maat voor de passing van een vraag op de schaal. Deze toetsgrootheid is standaardnormaal verdeeld als het model past. Grote positieve waarden wijzen op vragen die te weinig met de te meten latente vaardigheid gemeen hebben en grote negatieve waarden op vragen die 'teveel' met de latente vaardigheid gemeen hebben (een te hoge item-rest correlatie vertonen in vergelijking met de andere items). In tabel 5.14. worden 89
de items met een toetsgrootheid groter dan 2 of kleiner dan -2 gegeven. Over de power van de verschillende toetsen kan het volgende gezegd worden. Uit een simulatiestudie van Gustafsson (1980) bleek dat voor een test van dertig items met een raadkans van .20 per item en een grote spreiding in de vaardigheid van de proefpersonen, 300 proefpersonen voldoende zijn. Het aantal succesvolle replicaties met de Anderson test bedroeg in dit geval 100 procent (a = .05) voor het ontdekken van items met een afwijkend discriminerend vermogen en 96 procent voor het vinden van items met een raadkans. Naarmate de spreiding in de vaardigheid van de proefpersonen groter wordt, wordt ook de power van de verschillende tests groter. In de hier beschreven studie lopen de e's van alle schalen van onder -3 tot boven +3. De spreiding in de vaardigheid van de voor dit onderzoek gebruikte proefpersonen is zéér groot. Er kan dus verwacht worden dat de power van de toetsingen redelijk is. In tabel 5.14. worden de resultaten van de schalingen gepresenteerd voor alle factoren van het in paragraaf 5.3 getoetste model. Daar door selectie van vragen geprobeerd is de fit van het model te verbeteren, worden per factor de schaalbaarheid van verschillende combinaties van vragen gegeven. Indien schalen niet goed pasten, zijn vragen die niet goed pasten op grond van de Andersontoets en vragen met waarden groter of kleiner dan respectievelijk twee en min twee op de binomiale toets verwijderd. In de tabel wordt, naast de resultaten van de bovenbeschreven toetsingen, ook gegeven om welke items het gaat, met hoeveel proefpersonen de schaling getoetst is, of er bepaalde proefpersonen zijn verwijderd bij de toetsing (Filter), wat de KR20 is van de geschaalde vragen en hoever de geschaalde vragen in moeilijkheidsgraad uiteen lopen. Als we naar de tabel kijken zien we dat de schalen matig tot redelijk passend te krijgen zijn door selectie van vragen. Uitzonderingen zijn de schaal 'stijl' en de schaal 'spelling-regelgestuurd verbuigingen'. Wel moeten er veel items verwijderd worden om schalen passend te krijgen, gemiddeld zo'n veertig procent van de originele verzamelingen. Dit aantal is zo groot, dat voor de selectie van subtests voor het uiteindelijke instrument beter uitgegaan kan worden van de toetsende factoranalyses. Onduidelijk is, waarom bepaalde vragen niet passen. Er zijn verschillende verklaringen mogelijk voor het niet passen van vragen op een schaal. Ten eerste kan de raadkans een te grote rol gespeeld hebben. Om dit na te gaan zou gekeken kunnen worden of moeilijke vragen vaker niet passen. Daarnaast kan gekeken warden of de Chi-kwadraatwaarden van de Martin-lef-toets voor de lage score-groepen groter zijn. 90
Tabel 5.14
Rasch-schalingen (N=aantal proefpersonen; Filter=verwijderde proefpersonen; p-waarde-percentage proefpersonen dat een vraag goed maakt; Var=Variantie; Binomiaal=items significant op binomiaaltoets; ML=Martin-I.Of-toets; Anderson=Anderson-toets; Steefproefafhankelijke vragen=items met significante [-waarden op Anderson-toets.
Schaal
items
N
Spelling woordbeeld deel 1
1-47
290 -
fl
1-47(47)
11
Spelling woordbeeld deel 2
(totaal)
Filter
KR20
Range p-waarden
Var
Binomiaal
ML
Anderson
63
.08-97
18.9
1,8,17,21,23 27,31,47
X 2 =1396 X 2 =157 df=1058 df=46 p= .000 p= .000
.58 238 geen allochtonen
.06-.99
16.1
1,8,17,23 42,47
X2=1123 X 2 =95 df=920 df=46 p=.000 p=.000
.53 2-7,10-16,18- 238 geen allochto20,22,24-30, nen 32,34-42,44, 45 (36)
.13-.99
10.1
14,27,42
X2=602 df=595 p=.410
Steekproefafhankelijke vragen 1,8-10,14,17,18 20,21,23,28,31,
33,43,46,47.
8,9,17,21,23,30 33,43,47
37-61 (25)
290 -
.46
.16-.98
6.8
38,46-48, 50,57,60
X 2 =332 X 2 =75 df=312 df=24 p=.209 p=.000
43,46-48,50 60
37-61(25)
.18 226 geen allochtonen, on-
.16-.99
4.2
46,47,48
X 2 =227 X 2 =47 df=240 df=24 p=.717 p=. 003
43,48,61
ste sco-
regroepen weg
Tabel 5.14 (vervolg)
Schaal
items (totaal)
N Filter
Spelling woordbeeld deel 2
37,39-42,44 238 geen allochto- 45,49,51-56 nen 58,59,61.(17)
.37
.39-.98
Spelling- woordbeeld 1 & 2
2-7,9-16,18-20 238 geen 22,24-30,32,34-37 allochtonen 39-42,44,45,49 51-56,58,59,61(46)
.62
.13-.99
.61
.23-.97
4.8
76-81,86, 89,90,98,99 ( 11)
.28 165 geen allochtoen en scoregroep 5 en lager eraf
.35-.99
2.4
76,78,81,90,
238 geen allocht.
.54
.25-.98
2.0
76-81,86,89, 289 - Spelling- regelgestuurd 90,98,99 (11) (vervoegingen)
98,99(6)
KR20
Range p-waarden Var
Binomiaal
ML
3.4
geen
X2=115 X2=20 df=128 df=16 p=.794
49
16.9
27,29
X2=-10I3 X 2 =.56 df=990 df=45 p=.12 p=.30
3,9,18
77,79,80 ,7980 , 86,89
X2=189 X 2 =81 df=80 df=10 p=.000 p=.000
9707,79,80,86,89,
X 2 =70 df=40 p=.002
X 2 =24
df=20 p=.22I
Anderson
Steekproefafhankelijke vragen
Tabel 5.14 (vervolg)
Schaal
items (totaal)
N
Filter
KR20
Spelling 94-97,100,101 298 regelgestuurd 103,106,108, (verbuigingen) 110,111,113, 116,117,120 123-139,144147,153-155, 158 (40) 11
11
Range p-waarden
Var
Binomiaal
ML
.73
.20-.98
20.8
95,103,110, 117,127,128, 135,137,139, 144,153,155
X 2 =1231 X 2 =164 df=897 df=39 p = .000 p = .000
103,110,111,117 128,135,137,144, 153,155.
Anderson
S teekproefafhankelijke vragen
idem (40)
238 geen allochtonen
.69
.21-.99
17.3
103,110,111, 117,127,135, 137,147
X 2 =836 X 2 =90 df=741 df=39 p=.009 p=.000
110,117,123,137, 144
94-97,100, 106,108,113, 116,120,123127,129-136 138,139,145147,154,158 (31)
238 geen allochtonen
.70
.21-.99
11.9
95,124,135
X 2 =547 X 2 =36 df=420 df=30 p=.000 p=.220
95,123
94,96,97,100, 238 geen 101,106,113, allochtonen 116,120,123126,129,130133,136,154.
.55
.55-.99
4.1
123,124
X2=207 df=171 p=.031
(20)
Tabel 5.14 (vervolg)
N
Filter
Schaal
items (totaal)
Grammatica zinsniveau
2-7,39-41,44- 293 47,51-71.(34)
2-7,39-41, 44-47,5171 (34)
Grammatica woordniveau
KR20
Anderson
Steekproefafhankelijke vragen
Range p-waarden
Var
Binomiaal
ML
.81
.19-.91
32.6
53,55,59,71
X 2 =929 X 2 =79 df=825 df=33 p=.006 p=.000
55,59,65,68,69, 70,71
224 geen .76 allochtonen & scoregroep 7 en lager verwijderd
.19-.95
24.5
3,40,55,59, 68,69,71
X 2 =765 X 2 =69.4 df=792 df=33 p=.748 p=.000
55,59,60,68
X2=409.4 X 2 =18 df=391 df=23 p=.251 p=.770
60
2-7,39-41,44- 225 geen allochtonen 47,51,52,56, 57,60-64,66, 67 (24)
.66
.25-.94
12.4
21-29,31,32 35,50,7282 (23)
293 -
.74
. .23-93
14.1
21,31,35,50 73,79
X 2 =455 X 2 =93 df=374 df=22 p=.002 p=.000
21,24,73,74,79
22,23,25-27, 29,32,72,74 77,78,80,81 (13)
225 geen allochtonen
.58
.43-.96
4.8
80
X 2 =141 X 2 =17 df=108 df=12 p=.017 p=.I69
22
Tabel 5.14 (vervolg)
S teekproefafhankelijke vragen
Var
Binomiaal
IVIL
.51
.29-.95
10.1
7,13,14,16 19,20,24-26
X 2 =525 X 2 =92 df=400 df=25 p=.000 p=.000
238 geen allochtonen
.44
.29-.95
5.7
8,19,31
X 2 =282 X 2 =16 df=221 df=17 1)=.003 p=.536
238 geen allochtonen
.34
.35-.95
2.7
-
X2 = 94
A:8,10-14,I6- 270 20 B:1-3,5-10,12 C:3,4,6,7 (25)
.64
.06-.89
13.5
A: 16,17,18, 19,20 B: 1,6,9
X 2 =522 X 2 =131 df=24 df---46 p=.017 p=.000
A:14,17,18,19,20 B: 1,5,6,9
A:8,10-14, B:2,3,5,7, 8,10,12
.57
.06-.94
7.0
B: 3 C:6
X2=262 X 2 =34 df=208 df=16 p=.006 p=.005
A:8 B:3
items (totaal)
N
Interpunctie
6-26, 31-34 (26)
290 -
5,6,8-12,15, 17-19,21-23, 26,31-33(18) 5,6,9,10-12, 17,21-23,31 32 (12) Stijl
Anderson
Range p-waarden
Schaal
C:3,4,6,7
(17)
Filter
KR20
230 geen allochtonen
df=77 p=.096
X 2 =11 df=11 p=.486
7,8,13-16,20, 24,25,33
11
C:3
Tabel 5.14 (vervolg)
items (totaal)
N
Stijl
A:8,10,11,13 B:7,10,12 C:3,4,6,7 (11)
230 geen allochtonen
Betekenis:
A:1,3-7,2832. B: 14,16,18, 22-27 (20)
560 -
et
Inhoud & Organisatie
Filter
Range p-waarden
Var
.49
.06-.94
3.5
.58
.37-.87
KR20
Schaal
9.3
Binomiaal
ML
C:6
X2=143 X 2=17 df=90 df=10 p=.000 p=.080
A:8 C:6
A:5,31
X 2 =446 X 2 =86 df=285 df=19 p=000 p-=.000
A:5 B:16,23,24
A:5 B:14,16,23,24
B:16,23,24, 27
Anderson
A: 1,3-7,28- 455 geen allochtonen 32 B: 14,16,18, 22-27 (20)
.46
.47-.88
7.3
A: 5,31 B: 14,16,23 24,27
X2=367 X 2 =77 df=266 df=19 p=.000 p=.000
A: 1,3,4,6,7 28-30,32 B: 18,22,25, 26 (13)
468 geen allochtonen
.44
.47-.88
4.5
A:7
X2=108 X 2 =14 df=120 df=12 p= .771 p=.304
3,5-9,11-23
305 -
.75
.37-.96
16.9
14,17,19,21 22,25,30
X 2 =650 X 2 =77 df=456 df=24 p =.000 p =.000
25-30 (25)
Steekproefafhankelijke vragen
6,14,16-19,21,26
Tabel 5. l4 (vervolg)
Schaal
items (totaal)
N
Inhoud & organisatie
idem (25)
.72 277 geen allochtonen & scoregroepen dm 6 eruit
Filter
KR20
Range p-waarden
Var
Binomiaal
ML
.36-.98
14,8
6,18,19,21 22,25,26,30
X2=502 X 2 =89 df=408 df=24 p =.001 p =.000
6,14,17-19, 21,22,23,26, 30
5.8
5
X2=149 X 2 =22 df=130 df=13 p=.120 p=.053
5
5,20,28
Anderson
3,5,7-9,11-13, 305 15,20,25,27-29 (14)
.64
.50-.96
3,5,7-9,1113,15,20,27 28,29(13)
278 geen allochtonen
.57
.52-.97
4.3
-
X2=141 df=108 p=.019
3,7-9,11-13, 15,20,25,2729 (13)
278 geen allochtonen
.61
.52-.97
4.7
-
X2=137 X 2 =14 df=108 df=12 p=.03 p=.27
3,5,7,8,9,11 12,13,15,20, 25,27,28,29 (14)
145 alleen jongens scores onder 7 weg.
.54
.47-.98
4.6
5,8
X2=90 df=78 p=. l74
X 2 =21 df=12 p=.050
X 2 =14 df=13 p=.411
Steekproefafhankelijke vragen
20
5
Ook zou gekeken kunnen worden of vier-keuze vragen beter passen dan vragen met twee antwoordmogelijkheden. Wegens tijdgebrek zijn deze analyses niet meer verricht in het onderhavige onderzoek. Een tweede mogelijke oorzaak van het niet passen van vragen is dat de vragen niet unidimensioneel zijn. Het taalgebruik kan te moeilijk zijn geweest, zowel in de instructie als in de niet passende vragen, antwoordalternatieven zouden betrekking op verscheidene vaardigheden kunnen hebben, enz. Ook hier is in dit onderzoek niet meer naar gekeken. Een derde mogelijke oorzaak is dat vragen zijn verwijderd op grond van te extreme item-rest correlaties. Het is mogelijk dat na verwijdering van items met een te lage item-rest correlatie, items met een te hoge item-rest correlatie die verwijderd zijn (binomiaal kleiner dan -2) alsnog op de schaal te passen zijn. Ook deze analyse is wegens tijdgebrek (nog) niet uitgevoerd.
5.5. TWEE PARALLELLE SUBTESTS Voor het onderzoek Cova is het nodig twee parallele meerkeuzetoetsen voor het meten van schrijfvaardigheid te maken. In tabel 5.15. staat de optimale splitsing in parallelle helften per subtest gegeven, met de alpha en split-half betrouwbaarheid van de betreffende subtests (ongesplitst). De twee parallelle toetsen zijn samen te stellen door de verschillende subtesthelften (A & B) ieder willekeurig bij één van de twee toetsen in te delen. Uit de toetsende factoranalyses blijkt welke subtests goed op één factor passen. Dit lijken de beste subtests voor de uiteindelijke instrumenten. Zoals al werd gesteld zijn de Rasch-schalingen minder geschikt om vragen mee te selecteren. Daarnaast moeten er nog analyses met betrekking tot de Rasch-schalingen verricht worden, voordat ze als basis voor de constructie van het meetinstrument kunnen dienen en de meettechnische voordelen van het model van toepassing zijn. Indien er niet twee parallelle versies nodig zijn, doch slechts één meerkeuzetoets, kunnen er ook nog vragen meegenomen worden die als resterende items in tabel 5.15. vermeld staan.
98
Tabel 5.15
Splitsing subtests in parallelle helften (na itemselectie op grond van de betrouwbaarheid van de subtests en de item-rest correlaties van de vragen).
Subtests en items
alpha
split- items in paralhalf lelle subtesthelften
resterende items
inhoud en organisatie 1. volgorde tussen en binnen zinnen bepalen (3-9)
.40
.45
A = 7,4,8 B = 3,5,9
6
2. zinnen bij onderwerpen indelen (1018)
.73
.71
A = 12,13,14,18 B = 11,15,16,17
10 (hoogste Rit)
A'= 13,11,14,18 B'= 10,12,16,17
15 (laagste Rit)
A = 20,21,26 B = 19,23,25
22 (hoogste Rit)
A'= 21,22,25 B'= 20,23,26
19 (laagste Rit)
3. onderwerpen op geschiktheid beoordelen voor het schrijven van een opstel (19-23, 25, 26)
.62
4, niet passende zin uit verhaaltje halen (27-30)
.44
.57
.46
A = 27,30 B = 28,29
Grammatica-zinsniveau 1. gebrekkige zinsstructuur herkennen (1-7)
.47
.44
A = 2,6,7 B = 3,4,5
2. zinsdelen weglaten (51-54)
.60
.59
A = 52,53 B = 51,54
1
Subtests en items
alpha
split- items in paralhalf lelle subtesthelften
resterende items
.34
.40
A = 40,41,55,56, 59 B = 63,64,66,69,
4. keuze lidwoord bij .76 zelfstandig naamwoord (61-71)
.77
A = 61,65,67,68, 62 70 B = 63,64,66,69, 71
5. incongruentie van tijd (44-47)
.50
.39
A = 45,46 B = 44, 47
6. verbuiging bijvoeglijk naamwoord (72-79)
.72
.73
A = 73,74,76,78 B = 72,75,77,79
7. meervoudsvorming (25-28)
.36
.31
A = 25,28 B = 26,27
8. vergrotende en overtreffende trap (29, 31, 32, 35, 50)
.24
.31
A = 32,35 B = 29,50
9. vorming verkleinwoorden (21-24)
.26
.46
A = 21,24 B = 22,23
3. verwijzing (39-41, 55-60)
Grammatica-woordniveau
100
31
Subtests en items:
alpha: split- items in paral- half lelle subtest- helften:
10. vorming zelfstan- .68 dige naamwoorden
.71
A=80,82,84
.50
A = Al,A6,A7 B = A3,A4,A5
resterende items:
B=81,83,85
idioom en stijl: betekenisfactor
1. betekenis voeg- woorden (deel A: 1, 3-7)
.45
.49 2. betekenis uitdruk- kingen (deel A: 28-32)
.47 A = A30,A32 B = A28,A31 A'= A30,A32 B'= A29,A31
3. woordbetekenissen aangeven (deel B: 13- 16, 18-23)
.68
.71 A = B14,B16,B 18, B22,B23 B = B13,B15,B19, B20,B21
4. betekeniszinnen en uitdrukkingen (deel B: 24-27)
.29
.41 A = B24,B27 B = B25,B26
idioom en stijl: vorm-
factor
1. voim uitdrukkingen .27 op juistheid beoor- delen (deel A: 8, 10, 16-20)
.31 A = A10,A16,A17 B = A8,A18,A19
A29 A28 (laagste Rit)
Subtests en items
2. vaste voorzetsels kiezen (deel A: 11-14)
alpha
.22
split- items in paral- half lelle subtest- helften .21
resterende items
A = Al2,A13 B = A11,A14
3. het juiste woord invullen (deel B: 13, 5-10, 12)
.68
.69
A = B2,B5,B6,B9, B10 B = B1,B3,B7,B8, B12
4. opstel verbeteren (deel C: 3, 4, 6, 7)
.39
.37
A = C4,C6 B = C3,C7
Spelling Spelling-woordbeeld 1. Woordbeeldspelling .72 (1-5, 7, 9, 10, 12, 13, 15-20, 22, 24, 25, 28, 29, 30, 32, 34-36, 3842, 44-47, 50-59, 61)
.73
A = 2-5,13,1517,19,20,22,24,25, 30,36,38,41,46,47, 51,53,57,61 B = 1,7,9,10,12, 18,28,29,32,34,35, 39,40,42,44,45,50, 52,54,55,56,58,59
Regelgestuurde spelling, vervoegingen
2. voltooid deelwoord t/d (76-81)
.34
3. o.v.t. met 'dd' of 'd', 'tt' of 't' (86, 89, 90, 98, 99)
.71
.44 A = 77,78,79 B = 76,80,81 .70
A = 89, 90 B = 86, 99
102
98
Subtests en items
alpha split- items in paral- half lelle subtest- helften
Regelgestuurde spelling, verbuigingen 4. bijvoeglijk gebruikt .33 voltooid deelwoord (94-97)
.35 A = 95,97 B = 94,96
5. meervoudsvorming .34 (100-106)
.43 A = 100,103 B = 101,106
.04 6. zelfstandig voor- naamwoordelijk meer- voud (108,110,111,113)
.15 A = 108,113 B = 110,111
7. genitief 's' of apostrof en wegla- tingsapostrof (116, 117, 120, 123)
.26
.25
A = 116,123 B= 117,120
A = 124,127 B = 125,126
8. stoffelijk bijvoeg- lijk naamwoord (124- 127)
.20
.18
9, verkleinwoorden (128, 130, 131, 138)
.31
.26 A = 130,138 B = 128,131
10. stemhebbende of stemloze medeklinker als uitgang (132-135)
.47
.55 A = 132,135 B = 133,134
11. (mede-)klinker enkel of dubbel (129, 136, 137, 139)
.13
.17 A = 136,139 B = 129,137
12. samenstellingen (144-147)
.34
.41
A = 145,146 B = 144,147
resterende items
Subtests en items
13. gebruik kop- pelteken (153-155, 158)
alpha split- items in paral- half lelle subtest- helften
.38
.46 A = 154,155 B = 153,158
resterende items
6. CONCLUSIES EN AANBEVELINGEN VOOR NADER ONDERZOEK Het doel van de onderhavige studie is het construeren van een meerkeuzetoets voor het meten van schrijfvaardigheid. Het instrument is bedoeld voor een onderzoek waarin verschillende methoden ter meting van schrijfvaardigheid onderling vergeleken worden (SVO project 6573, Constructie en validering van gestructureerde schrijfvaardigheidstoetsen). Door middel van literatuurstudie is gezocht naar aanwijzingen voor de validiteit van meerkeuzetoetsen om schrijfvaardigheid te meten. Uit de literatuurstudie bleek dat meerkeuzetoetsen en schrijfopdrachten in grote mate gelijke vaardigheden meten, maar dat er toch verschil is tussen de vaardigheden gemeten met meerkeuzetoetsen en de vaardigheden gemeten met open schrijfopdrachten. Op grond van bestaande classificatieschema's, van onderzoek naar de validiteit van meerkeuzetoetsen om schrijfvaardigheid te meten en op grond van analyses van schrijfprodukten van leerlingen, is een classificatieschema ontwikkeld van mogelijke schrijffouten of -problemen. Elk van de categorieën uit dit schema is geoperationaliseerd door middel van verschillende subtests. De categorieën uit de foutenclassificatie zijn: woordbeeldspelling, regelgestuurde spelling, interpunctie, grammatica, inhoud en organisatie, en idioom en stijl. Vervolgens is de toets afgenomen bij ongeveer 600 leerlingen uit de zesde klas van de basisschool. Door het gehanteerde afnameschema is iedere subtoets uit de toets door ongeveer 300 leerlingen gemaakt. Door middel van data-analyse de interne validiteit van de geconstrueerde toets geëvalueerd. Uit de analyses blijkt dat de betrouwbaarheid van de verschillende subtests over het algemeen redelijk is. Voor de totaalscores per hoofdcategorie (na itemselectie) loopt de range van split-half betrouwbaarheden van .54 tot .88 (voor respectievelijk 'woordbeeldspelling' en 'grammatica') en de range van alpha's van .66 tot .87 (respectievelijk voor 'interpunctie' en 'grammatica'). Toetsende factor-analyses laten zien dat de subtests die bedoeld zijn om één aspect te meten, in een éénfactor-model te passen zijn. De enige uitzondering is de subtest 'vorm-uitdrukkingen', die niet laadt op de factor waar de drie andere stijl-subtests op laden. Zoals in de classificatie werd verondersteld, zijn voor de gram105
matica-subtests twee factoren gevonden, waarvan één geïnterpreteerd kan worden als 'grammatica op woordniveau' en één als 'grammatica op zinsniveau'. Voor 'spelling' waren in de classificatie twee factoren verondersteld; 'regelgestuurde spelling' en 'woordbeeldspelling'. Bij de toetsende factoranalyses bleek echter de factor 'regelgestuurde spelling' gesplitst te moeten worden in 'regelgestuurde spelling, vervoegingen' en 'regelgestuurde spelling, verbuigingen'. Een mogelijke verklaring hiervoor is grote mate van aandacht in het onderwijs voor het correct leren vervoegen van werkwoorden. Een andere mogelijke verklaring is dat de vervoegingssubtests een andere vaardigheid meten dan de verbuigingssubtests. Het model waarin alle afzonderlijke factoren zijn opgenomen blijkt redelijk te passen, al kon er bij deze toetsing geen Chikwadraat berekend worden, daar de correlatiematrix van alle subtests niet positief definiet bleek te zijn. Als we kijken naar de intercorrelaties tussen de verschillende factoren uit het model, blijken de 'stijl-factor', de 'inhoud en organisatie-factor' en de 'betekenis-factor' onderling hoog te correleren. Blijkbaar meten de subtests van de betreffende factoren een cluster van onderling hoog samenhangende vaardigheden. Verdere analyses zullen moeten uitmaken of deze drie factoren tot één factor teruggebracht kunnen worden. Rasch-schalingen laten zien dat er door middel van itemselectie passende schalen te construeren zijn voor iedere factor uit het model. Voor het passend maken van de schalen moeten echter wel veel items verwijderd worden. Omdat het niet juist is om items op grond van de passing op een latente-trek model te selecteren (zie Gustafsson, 1980), is het beter om items te selecteren op grond van de betrouwbaarheidsanalyses en de toetsende factoranalyses. In paragraaf 5.4. staat beschreven welke items gekozen moeten worden om twee parallelle versies van de meerkeuzetoets samen te stellen. De conclusie van het onderzoek is, dat het meetinstrument een goede interne validiteit lijkt te hebben. De betrouwbaarheid van de verschillende subtests is redelijk en de toetsende factoranalyses ondersteunen de divergente validiteit van de in de foutenclassificatie onderscheiden categorieën. Of, en in welke mate, het meetinstrument ook extern valide is, zal moeten blijken uit het vervolg van het Cova-onderzoek, waarin de scores op de meerkeuzetoets gerelateerd zullen worden aan de scores op andere schrijfvaardigheidstoetsen. Om het hier geconstrueerde meetinstrument te verbeteren zouden de verschillende subtests uitgebreid kunnen worden door toevoeging van gemakkelijker items. Aan de gestandaardiseerde betrouwbaar106
heidsindices kan gezien worden hoe groot de potentiële betrouwbaarheid van een bepaald soort items is. Verder kan met behulp van replicaties en nieuwe toetsende factoranalyses nagegaan worden of de stijl-, de betekenis- en de inhoud en organisatie-factor samengevoegd moeten worden. Tot slot kan de psychometrische kwaliteit van het instrument vergroot worden als de schaling van de items met behulp van het Rasch-model verbeterd kan worden. Uitgezocht moet worden waarom bepaalde items niet passen (bias-onderzoek), of er proefpersonen zijn die een andere cognitieve strategie hanteren bij het oplossen van de items (door middel van analyse van persoonskarakteristieke curves) en of bij replicaties dezelfde resultaten gevonden worden. Daarnaast kan voor de 'goed/fout' items onderzocht worden of het discriminerend vermogen van de items die een niet correcte vorm aanbieden groter is, dan van de items die een correcte vorm aanbieden. Ook kan nagegaan worden of, zoals verondersteld in de literatuur, het herkennen van een foute vorm als 'fout' moeilijker is dan het herkennen van een correcte vorm als 'goed'. Het is mogelijk dat deze twee soorten items op aparte schalen beter passen, dan samen op één schaal.
107
108
LITERATUUR Allen, M.J & Yen, W.M. (1979). Introduction to measurement theory. Monterey California: Brooks/Cole Publishing Company. Arrasmith, D,G., Sheehan, D.S. & Applebaum, W.R. (1984). A comprehension of the selected-response strategy and the constructed-response strategy for assessment of a third-grade writing task. The journal of Educational Research, 22, no. 3, 172-177. Assink, E.M.H. (1981). Spellingsproblemen bij werkwoordsvormen. Een onderwijspsychologische analyse. Pedagogische Studiën, 58, 57-69. Assink, E.M.H. (1982). Het beste paard struikelt wel eens ... (Maar wáár?). Experimenten met ervaren spellers. Tijdschrift voor Taalbeheersing, 4, 42-57. amberg, B. (1982). Multiple-choice and holistic essay scores: What are they meaning? College Composition and Communication, no. 4, 404-406. Bayens, M., Jansen, F. & Schakenbos, H. (1981). Een foutenanalyse van schrijfprodukten. Taalbeheersing 1981. Lezingen op het VIOT-taalbeheersingscongres op 8, 9 en 10 september 1981 aan de Technische Hogeschool Twente. Enschede: Viot, 88-95. Benton, S.L. & Kiewra, K.A. (1986). Measuring the organizational aspects of writing ability. Journal of Educational Measurement, 23, nr. 4, 377-386. Bonset, H. & Griffioen, J. (1972). Met toets en band door het ganse land. Vernieuwing van opvoeding en onderwijs, 311, 140-151.
B onset, H. (1974). Objectieve schrijfvaardigheidstoetsen voor Basisen Voortgezet onderwijs. Levende Talen, 204-215. addock, R. Lloyd-Jones, R., & Schoer, L. (1963). Research in written composition. Urbana, IL: National Council of Teachers of English. Breland, H.M., Conlon, G.C., & Rogosa, D. (1976). A preliminary study of the test of standard written english. Princeton, NJ: Educational Testing Service. Breland, H.M. (1977a). A study of college english placement and the Test of Standard Written English. (Research and DevelopmentReportRDR-76-77). Princeton, NJ: College Entrance Examination Board.
Breland, H.M. (1977b). Can multiple choice tests measure writing skills? College Board Review, 103. Breland, H.M., & Gaynor, L. (1979). A comparison of direct and indirect assessments of writing skins. Journal of Educational Measurement, 16, 119-128. Breland, H.M. & Jones, R.J. (1982). Percerptions of writing skill. New York: College Entrance Examinations Board, Campbell, D.T. & Fiske, D.W. (1959). Convergent and dicriminant validation by the multitrait-multimethod matrix. Psychological Bulletin. 56, 81-105. Capeil, F.J., Quellmalz, E.S. (1980). Empirical validation studies of alternate response modes for writing assessment. Test Design Project. Nat-Inst. of Ed., Washington , D.C. ED 205 598. Carlson, S.B. & Camp, R. (1985). Relationships between direct and indirect measures of writing ability. Paper presented at the Annual Meeting of the National Council on Measurement in Education. Chicago, IL: ED 255 543. Clemson, E. (1978). A study of the basic skills assesment. Direct and indirect measures of writing ability. ETS. ED 204 409. Cheketts, K.T. & Christensen, M.G. (1974). The validity of awarding credit by examination in english composition. Educational and Psychological Measurement, 34, 357-361. Coffman, W.E. (1966). On the validity of essay tests of achievement. Journal of Educational Measurement, 3, 151-156. Coffman, W.E. & Kaufman, D.A. (1968). A comparison of two methods of reading essay examinations. American Educational Research Journal, 5, 99-107. Coffman, W.E. (1971). Essay examinations. In R.L. Thorndike (Ed.). Educational Measurement, 2nd. ed. (pp. 271-302). Washington, D.C: American Council on Education. Cook, T.D. & Campbell, D.T. (1979). Quasi-experimentation. Design & analysis issues for field settings. Boston: Houghton Mifflin Company. Cooper, C.R., & Odell, L. (Eds.). (1977). Evaluating writingi Describing, measuring, judging. Urbana, IL: National Council of Teachers of English.
Cooper, P.L. (1984). The assessment of writing ability: a review of research. Educational Testing Service, Princeton, N.J.: Graduate Record Examinations Board. ED 250 332. Crocker, L., e.a. (1979). Predicting children's writing performance from standardized achievement tests. Paper presented at the Annual Meeting of the National Council on Measurement in Education. San Fransico. California. ED 174 684. Culpepper, M.M. & Ramsdell, R. (1982). A comparison of a multiple choice and an essay test of writing skills. Research in the Teaching of English, 16, no 3, 295-297. Diederich, P. (1974). Measuring growth in writing. Urbana III: NCTE. Dirksen, A. (z.j.). Grammatica-onderwijs als zinsbouwonderwijs: de samengestelde zin als probleem van schriftelijke taalbeheersing voor 11-14-jarigen. Deelrapport 1: De analyse van grammaticale fouten in opstellen. Utrecht: Instituut de Vooys.
Ebel, R.L. (1972). Essentials of educational measurement. Englewood Cliffs, N.J.: Prentice Hall. Eley, EG. (1955). Should the general composition test be continued? The test satisfies an educational need. College Board Review, 25, 9-13. French, J.W. (1962). Schools of thought in judging excellence of english themes. 1961 Proceedings of Invitational Conference on Testing Problems, Educational Testing Service, Princeton, New Jersey. Godschalk, F.I., Swineford, F., & Coffman, W.E. (1966). The measurement of writing ability. New York: College Entrance Examination Board. Gorrell, D. (1983). Toward determining a minimal competency entrance examination for freshman composition. Research in the Teaching of English, 17, nr. 3, 263-274. Groot, A.D. de (1961). Methodologie. Grondslagen van onderzoek en denken in de gedragswetenschappen 's-Gravenhage: Mouton en Co. Grosse, M.E. & Wright, B.D. (1985). Validity and reliability of truefalse tests. Educational and Psychological Measurement, 45, 113.
Gustafsson, J.E. (1980). Testing and obtaining fit of data to the Rasch-model. British Journal of Mathematical and Statistica' Psychology, 33, 205-233. Hambleton, R.K. & Swaminathan, H. (1985). Item response theory. Principles and applications. Dordrecht: Kluwer. Halpin, G., Halpin, G. & Schaar, B.B. (1981). Research on writing: A search for objective measures related to holistically scored essays. Paper presented at the Annual Meeting of the Eastern Educational Research Association. Philadelphia, PA. ED 208042. Hartnett, C.G. (1978) Measuring writing skills. Urbana, IL: National Council of Teachers of English. ED 170 014. Hayes, J.R. & Flower, L.S. (1980). Identifying the organization of writing processes. In L.W. Gregg & E.R. Steinberg (Eds.), Cognitive processes in writing (pp. 3-30). Hillsdale, N.J. Hogan, T.P. & Mishler, C. (1980). Relationships between essay tests and objective tests of language skills at grades 4, 7 and 10. Journal of Educational Measurement, 19, 37-48. Hogan, T.P. & Mishler, C. (1982). Relationships among measures of writing skill. Education Commission of the States, Denver, Colo. NAEP. ED 224 812. Huddleston, E.M. (1954). Measurement of writing ability at the college entrance level: Objective versus subjective testing techniques. Journal of Experimental Education, 22, 165-213. Hudson, S.A. & Veal, L.R. (1981). An empirical investigation of direct and indirect measures of writing. Report of the 1980-81 GeorgiaCompetencyBoardEducationWritingAssessmentProject. ED 205 993. Huntley, R.M., Schmeiser, C.B., & Stiggins, R.J. (1979). The assessment of rhetorical proficiency: The roles of objective tests and writing samples. Paper presented at the National Council of Measurement in Education, San Fransisco, California: ED 173 419. ITED (The Iowa Tests of Educational Development). (1952). State University of Iowa. Chicago: Science Research Associates. Jiireskog, K.G. & &k bom, D. (1986). LISREL VI. Analysis of lineair structural relationships by the method of maximum likelihood. University of Uppsala. -
Koffler, S.L. (1984). Assessing students' writing skills: A comparison of direct & indirect methods. Paper presented at the Annual Meeting of the American Educational Research Association. New Orleans. LA. ED 242 771. Matalene, C.B. (1982). Objective testing: Polities, problems, possibilities. College English, 44, nr. 4, 368-381. McColly, W. (1970). What does educational research say about the judging of writing ability? The Journal of Educational Research, 64, 148-156. Meerling (1981). Methoden en technieken van psychologisch onderzoek. Deel 1 en 2. Meppel: Boom. Mellenbergh, G.J. (1971). Studies in studietoetsen. (Proefschrift) Psychologisch Laboratorium Universiteit van Amsterdam. Meulen, Jr. van der (1971). Spellinginstructie en woordverklaring. Het betwijfelde teken. 12e druk. Groningen, Wolters Noordhoff. Moss, P.A., Cole, N.S. & Khampalakit, C.T. (1982). A comparison of procedures to assess written language skills at grades 4, 7 and 10. Journal of Educational Measurement, 19. 37-48. Noyes, E.S. (1963). Essays and objective tests in english. College Board Review, no. 49, 7-10. Pearson, R. (1955) Should the general composition test be continued? The test fails as an entrance examination. College Board Review, 43, 534-539. Plantenga, D., Prins, R., Doorenbosch, L., Moed, K., Verbeek, M., Koster, A., Geest, T. v.d., Jansonius, K. & Fonderie, L. (1971). Evaluatie van de "gemengde taalopgaven" van de Cito-schooltoets asisonderwijs 1971 door de Werkgroep Taaltesten, Instituut voor Toegepaste Taalkunde, UvA. Arnhem: Cito.
Prater, D., & Padia, W. (1983). Effects of modes of discourse on writing performance in grades four and six. Research in the Teaching of English, 17, no. 2, 127-134. Quellmalz, E.S., Capell, F.J., & Chih-Ping, C. (1982). Effects of discourse and response mode on the measurement of writing competence. Journal of Educational Measurement, 19, 24-258. Quellmalz, E. & Capell, F. (1979). Defining writing domains: Effects of discourse and response mode. California Univ., L.A. Center for the Study of Evaluation. ED 212 661.
Warries, E. (1969). Proefwerken met vierkeuze-vragen voor het basisonderwijs. Pedagogische Studiën, 46, nr. 1, 22-41. Weiss, D. & Jackson, R. (1983). The validity of the descriptive
tests of language skills: Relationships to direct measures of writing ability and to grades in introductory college engelish courses. College Entrance Examination Board, N.Y.: ED 241 589.
Wens, C.E., Breland, H.M., Grandy, J., & Rock, D. (1980). Using longitudinal data to estimate reliability in the presence of correlated measurement errors. Educational and Psychological Measurement, 40, 19-29. Wesdorp, H. (1970). Itemtypen ter meting van de taalvaardigheid. Arnhem: Cito. (Cito-publikatie nr. 3.). Wesdorp, H. (1971a). Een poging tot concretisering van de doelstellingen van het onderwijs in het produktief-schriftelijk taalgebruik. Arnhem: Cito.
Wesdorp, H. (1971b). Experimentele constructie van een aantal toetsen voor de moedertaal. Niveau: eind-HAVO. Arnhem: Cito. (Cito-memo nr. 21.). Wesdorp, H. (1972). De validiteit van de subtoets spelling uit de Schooltoetsen Basisonderwijs van het Cito. Arnhem: Cito. (Citomemo nr. 34.). Wesdorp, H. (1973). Enkele praktische suggesties voor de constructie van schrijfvaardigheidstoetsen. Arnhem: Cito. (Cito-memo nr. 61.). Wesdorp, H. (1974). Het meten van de produktie-schriftelijke taalvaardigheid. Directe en indirecte methoden: 'opstelbeoordeling' versus 'schrijfvaardigheidstoetsen'. (Proefschrift)
Purmerend: Muusses.
Wesdorp, H. (1978). Evaluatie-technieken voor het moedertaalonderwijs. Een inventarisatie van beoordelingsmethoden voor de stelvaardigheid, het begrijpend lezen, de spreek-, luister- en discussievaardigheid. Den Haag: Staatsuitgeverij, RITP.
BIJLAGE 1
Een overzicht van de studies naar de criteriumvaliditeit van meerkeuzetoetsen om schrijfvaardigheid te meten
Bijlage 1: Een overzicht van de studies naar de criteriumvaliditeit van meerkeuzetoetsen om schrijfvaardigheid te meten. In bijlage 1 staat een overzicht van de resultaten van de voor dit onderzoek bekeken studies op het gebied van de criteriumvaliditeit van meerkeuzetoetsen om schrijfvaardigheid te meten. In deze bijlage wordt aangegeven uit hoeveel schrijfopdrachten het criterium bestond, hoeveel beoordelaars per schrijfopdracht gebruikt zijn en, indien vermeld in de studie, in welke communicatieve stijlen de opdrachten geschreven werden. Daarnaast wordt het aantal proefpersonen vermeld (N). Hoe groter dit aantal is, hoe kleiner de standaardmeetfout van de geobserveerde correlatie. Tevens wordt de leeftijd van de proefpersonen vermeld, om na te kunnen gaan of de criteriumvaliditeit van de toetsen van de leeftijd van de proefpersonen afhankelijk is. De betrouwbaarheden van zowel de meerkeuzetoets als van de schrijfvaardigheidsmeting met schrijfopdrachten zijn gegeven, omdat deze direct de correlatie tussen de meerkeuzetoets en het criterium beïnvloeden. e betrouwbaarheid van de verschillende meerkeuzetoetsen is vaak gegeven in de vorm van Cronbachs alpha of KR-20 (de homogeniteit van de items) (RXX'mkt). Alpha moet als ondergrens van de ware betrouwbaarheid opgevat worden, omdat alpha onterecht lager wordt als de items waarover alpha berekend wordt niet perfect parallel zijn. RXX' inter is de interbeoordelaarsbetrouwbaarbeid waarmee het criterium gemeten is. RXX' score is de scorebetrouwbaarheid waarmee het criterium gemeten is. Naast de correlaties tussen de criteria en de meerkeuzetoetsen (Rxy) staan in de tabel ook de correlaties tussen de verschillende subtests van de meerkeuzetoetsen en de criteria. Deze correlaties zijn van belang omdat ze inzicht kunnen geven in de validiteit van de verschillende in de studies gehanteerde categorieën. Indien mogelijk worden achter de ongecorrigeerde correlaties de voor attenuatie gecorrigeerde correlaties gegeven (Rxy'). Deze laatste staan tussen haakjes. Ook worden, indien in de studies vermeld, de aantallen vragen per meerkeuzetoets en per categorie tussen haakjes vermeld, omdat deze aantallen de betrouwbaarheid en de validiteit van de metingen beïnvloeden.
Onderzoek
leeftijd
N m.k.toets
Categorieën
Godshalk Swineford
16-17
646 English Composition Test
- Paragraph organization - Usage - Sentence correction Prose groups - Error recognition - Construction-6 shift - Combi 3 subtests (willekeurig
Wesdorp (1974)
12
213 OA 50 items 212 OB 50 items
- Formele conventies - Grammatica - Woordkeus en stijl - Opbouw - Inhoud - Totaal OA - Totaal OB
Spooner Smith (1987)
16-17
103 ? 37items
- Focus (5)
Coffmann (1966)
- Development (5) - Organization (5) - Support (5) - Paragraphing (5) - Error recognition (12) - Totaal
Hartnett 18 7 Test of (1978) Standard Written English (TSWE)
Rxy
Criterium
.46 .71 .71
Somscore van vijf opstellen over vijf verschillende onderwerpen in verschillende communicatieve stijlen; elk door vijf beoordelaars beoordeeld.
.57 59 .65 .71.77
RXX' RXX' inter score .92
RXX' nikt Bijzonderheden
.84
Stijlen: -beschrijvend -vertellend -argumentatief (2x) Aantallen items niet gegeven, wel de afnametijd. Voor elke subtest bedroeg deze ongeveer 20 minuten
.68 .67
Somscore van vijf .94 opstellen over vijf verschillende ,94 onderwerpen in verschillende com- municatieve stijlen; elk door vijf beoordelaars beoordeeld.
,24 Somscore twee (.44) opstellen. Beide .46 informatief. Elk (.86) meer dan 200 .45 woorden (2 (.59) beoordelaars) .35 (.45) .57 (.78) .53 (.68) .65 (.76)
.61
Score voor één opstel, holistisch gescoord (2 beoordelaars).
.87
.89 .89
OA en OB zijn parallelle versies. Stijlen: -informatief -creatief .86 -verhalend .86 -argumentarief .34 Meerkeuzetoets, speciaal .33 gemaakt om vaardigheid in .68 informatief schrijven te .71 meten (correctie zelf .57 berekend) .69 .83
m.k.toets
Onderzoek
leeftijd
N
Clemson (1978)
13
567 A writer's skills (75 items)
Categorieën - Spelling (14) - Capitalization and punctuation (14) - Usage (17) - Logic and evaluation (26) - Totaal - Totaal - Totaal - Totaal - Totaal - Totaal
Huntley, Schmeiser & Stiggins (1979)
18
50
18
50
18 18
ACT-English Usage (35 items)
ACTRhetorical Proficiency I (18 items) 50 ACTRhetorical Proficiency II (20 items) 50 ACT-totaal (73 items)
- Punctuation - Grammar - Sentence stucture Wordchoice & Style -Logic & Organizadon -Totaal
Rxy
Criterium
.55 (.76) .52 (.70)
Somscore twee opstellen (2 beoordelaars)
.47 (.61) 54 (.67)
RXX' RXX' RXX' nikt Bijzonderheden inter score .71
.74 De categorie 'Iogic and .77 evaluation' correleert het hoogst met de 4 schrijf.83 opdrachten samen .89
Score voor één creatief opstel (2 beoordelaars) Inhoudsscore .62 zakenbrief (2 beoordelaars Invullen formulier .28 (2 beoordelaars) Score vorm .33 zakenbrief (2 beoordelaars) Somscore creatief .70 opstel + inhoud (.86) zakelijke brief (2 beoordelaars) Somscore van de .72 vier schrijfopdrachten (2 beoordelaars)
.94 RXX' meerkeuzetoets = KR 20 Schrijfopdrachten: - formulier invullen - zakenbrief - informatief opstel - creatief opstel (correcties zelf berekend)
.67
Somscore drie schrijfopdrachten & twee beoordelaars per opdracht idem
.83
.53
idem
.73
.69
idem
.89
62
51
.63
ACT-usage is vooral gericht op organisatie en minder op grammatica en spelling.
Onderzoek
leeftijd
N m.k.toets
Huntley, Schmeiser & Stiggins (1979)
18
50 SAT-Verbal - Antonyms - Analogies (Scholastic Aptitude - Reading comprehension Test) - Totaal - Grammar 50 TWSE (50 items) - Sentence structure Wordchoice & Style Totaal
18
Breland & Gaynor (1979)
18
TSWE (50 items)
Categorieën
- Grammar - Sentence structure - Wordchoice & Style
819 TSWE le afname 926 TSWE 2e afname 517 TSWE 3e afname 697 TSWE le+2e afname 278 TSWE 2e+3e afname 234 TSWE le+2e+3e 261 afname TSWE le 288 afname TSWE 2e 294 afname TSWE 3e afname Crocker, Onderasik & Lamme (1979)
9
112 Metropolitan - Word-knowledge Achievement - Reading comprehension Test - Language arts - Spelling - Totaal
Rxy
Criterium Somscore drie schrijfopdrachten (2 beoordelaars)
RXX' 'COC RXX' inkt Bijzonderheden inter score .58
.58
.58
.90
66
(.86) .58
(2 beoordelaars) 3e opstel
.72
opstel 1 + 2 (2 beoordelaars) opstel 2 + 3 (2 beoordelaars) opstel 1 + 2 + 3 (2 beoordelaars) opstel 1 + 2 + 3 (2 beoordelaars) opstel 1 + 2 + 3 (2 beoordelaars) opstel 1 + 2 + 3 (2 beoordelaars)
.72 .76 (.90) .72 .74 .69
.45 .52 .30 43 .55
Eén fictionele schrijfopdracht (4 beoordelaars)
.51
.83
afname eind le semester, 3e schooljaar. Alle 3 de opstellen waren argumentatief.
.70
Resultaat euta regressieersianalyse: nls:d de enige ng siginificante iiat predictor rdco (FF ratio) s rto is 'tekstbegrip' 'esbgi' .) (a = 0.5) (
Onderzoek
leeftijd
N m.k.toets
Categorieën
Quellmalz & Capell (1979)
16-17
±40 (5 items per subtest)
- Focus - Organization - Support - willekeurige subtoets
Hogan & Mishler (1980)
8
±140De 'Language Instructional Tests' van de 'Metropolitan Achievement Test' (MAT)
- Punctuation & capitalization - Listening comprehension - Usage - Grarnmar & syntax - Spelling - Study skins - Totaal
13
±150idem
- Punctuation & capitalization - Listening comprehension - Usage - Grammar & syntax - Spelling - Study skilis - Totaal
8
±65 MatLanguage Instructional Test
- Punctuation & capitalization - Listening comprehension - Usage - Grammar & syntax - Spelling - Study skins - Totaal
Rxy
23.52 .55 .57
Criterium
RXX' RXX' RXX' inter score mkt Bijzonderheden .22
.86
Gegeven is de range van de correlatie tussen een willekeurige subtest en één opstel
Eén opstel in 20 .92 minuten geschreven (2 beoordelaars)
.77
.79 De correlaties zijn gecor.75 rigeerd voor de betrouw.80 baarheid van .85 de meerkeuzesubtests,zo.95 dat de .87 correlaties .97 vergelijkbaar zijn. Er is niet gecorrigeerd voor de betrouwbaarheid van de opstelbeoordeling.
idem
.71
.98 Voor acht- en dertienjarigen zijn er twee verschillende .82 versies van de .86 MAT gebruikt.
Eén opstel informatief of verhalend (2 beoordelaars)
.64 .68 .61 .68 .69 (.79)
.68
.88
.61 .54 .60 .61 .66 (.78) .73
.88 .88 .96 idem
.91
.71
.91
62
.75
.63 .64
.80 .85
.68 .79 .76 (.90)
.95 .87 .97
Onderzoek
leeftijd
N m.k.toets
Categorieën
Hogan & Mishler (1980)
13
±65 idem
- Punctuation & capitalization - Listening comprehension - Usage - Grammar & syntax - Spelling - Study skins - Totaal
Hudson &
15
258 Iowa Test of - Spelling Basic Skills - Capitalization - Punctuation (I.T.B.S) - Usage - Paragraph organisation - Letter - Totaal
15
- Spelling 233 Test of Achievement - Capitalization - Punctuation and - Usage Proficiency - Sentence (T.A.P.) structure - Paragraph organisation - Essay - Letter - Totaal
Veal
(1981)
RXX' RXX' RXX' inter score mkt Bijzonderheden
Rxy
Criterium
.77
Eén opstel in 20 .91 minuten geschreven (2 beoordelaars)
.71
.89
.81 .79
.82 .86
.71 .77 .83 (.99)
.88 .88 .96
.52 .60 .65 .65 .48
Eén opstel holistisch beoor- deeld (2 beoor- delaars)
.74
.54 .70 (.86) .29 .23 36 42 16
De correlaties zijn gecorrigeerd voor de betrouwbaarheid van de meerkeuzesubtests, zodat de correlaties vergelijkbaar zijn. Er is niet gecorrigeerd voor de betrouwbaarheid van de opstelbeoordeling. Voor acht-en dertienjarigen zijn er twee verschillende versies van de MAT.
.08 RXX' meer.71 keuzetoets = .73 KR 20 .90 .74 .88 .89
Eén opstel holistisch beoor- deeld (2 17eoor- delaars)
.71
.47 idem .83 .64 .53 .51
.29
-.02
24 .29 .42 (.55)
.50 .57 .83
Categorieën
Onderzoek
leeftijd
N m.k.toets
Hudson & Veal (1981)
15
257 California - Spelling Achievement - Capitalization Test (C.A.T.) - Punctuation - Usage - Sentence structure - Paragraph organisation - Totaal
15
276 Writing - Spelling - Capitalization Proficiency Test (W.P.T.) - Punctuation - Usage - Sentence structure - Paragraph organisation - Essay - Letter - Totaal
19-20
Punctuation 172 Missouri College English Test - Capitalization (90 items) Grammar
Halpin e.a. (1981)
- Spelling - Styie - Paragraph organization Totaal
Moss, Cole & Kham- palikit (1982)
9
83 De 'Language - Spelling (8) Test' van de - Punctuation (8) 3R's Achieve- - Capitalization ment Test (40 (8) Grammar, worditems) choice, Organization & Clarity (16) Totaal
Rxy
Criterium
RXX' RXX' inter score
RXX' inkt Bijzonderheden
-.06 -.20 .35 .29
Een opstel
.76
.53 RXX m.k.t = .31 KR20 .59 .31 .47
.37
holistisch beoor-
deeld (2 beoordelaars)
- .09
.46
40 (.60)
.59
.43 .44 .45 .51 .43
Eén opstel holistisch beoor- deeld (2 beoor- delaars)
.70
.47 idem .22 .12 .50 .18
47
.85
.23 35 .57 (.76)
.69 .76 .80
.40 (.45) .25 (.31) .35 (.46) .39 (.52) .35 (.47) .26 (.30) .49 (.55)
.12 (.20)
Eén opstel van 30 minuten (3 beoordelaars)
Twee schrijfopdrachten 1. brief met verzoek 2. verslag voor 'science' les. Holistisch beoordeeld (4 beoordeeld).
.86
.80 RXX meerkeuzetoets = KR 20
.72 .34 .75 .78 .94
.41
.84
Voor de correctie zijn de scorebetrouwbaarheid & de KR 20 van de meerkeuzetoets gebruikt
Categorieën
Onderzoek
leeftijd
N m.k.toets
Moss, Cole & Kham- palikit (1982)
12
40 De 'Language - Spelling (8) Test' van de - Punctuation (8) 3R's Achieve- - Capitalization ment Test (40 (8) items) - Grammar, wordchoice, Organization & Clarity (16) - Totaal
15
94 idem
- Spelling (8) - Punctuation (8) - Capitalization(8) - Grammar, wordchoice, Organization & Clarity (16) - Totaal
Bamberg (1982)
18
?
- Usage - Sentence structure
Culpepper & Ramsdell (1982)
18
202 (60 items)
(35 items)
- Grammar & spelling (18) - Style (18) - Organization & logica (24) - Totaal (60)
Rxy
.39 (.67)
RXX' RXX' inter score
RXX' inkt Bijzonderheden
Twee schrijfopdrachten 1. brief niet verzoek 2. verslag voor 'science' les. Holistisch beoordeeld (4 beoordelaars).
.90
.43 .56 .00
idem
.86
Criterium
.05 .67 .34 .77 .52 .78
Gegeven is de range van correlaties tussen de meerkeuzetoets en de somscore van de twee opstellen. De holistische beoordeling was vooral gericht op de kwaliteit van de gebruikte ideeën, de ondersteuning van die ideeën, de organisatie en de stijl.
Somscore van één zakelijk opstel van 40 minuten en één opstel van 20 minuten. Holis- tisch beoordeeld.
Eén holistisch beoordeeld opstel (2 beoordelaars) .56 (.61)
.46
.$6
.47 (.75)
.20- .30
.50
.97
'Organisatie & logica'correleerde het hoogst met het criterium, .88 maar had ook de hoogste KR 20.
Onderzoek
leeftijd
N m.k.toets
Categorieën
Weis & Jackson (1983)
18
224 Descriptive Test of Language Skills
- Reading comprehension (45) - Logical relations (50) - Word-use (30) - Usage & grammar (40) - Sentence Su ucture (35) -
18
224 idem
- Reading comprehension (45) - Logical relations (50) - Word-use (30) - Usage & grammar (40) - Sentence structure (35)
18
224 idem
- Reading comprehension (45) - Logical relations (50) - Word-use (30) - Usage & grammar (40) - Sentence Structure (35)
Gorrell (1983)
18
103 ACT English
RXX' RXX' inter score
RXX' mkt Bijzonderheden
.71
.73
Twee opstellen (20 .81 minuten), argumentatief. Holistisch beoordeeld.
.73
.89 RXX meerkeuzetoets = KR20 RXX score = .89 correlatie tussen 4 korte .82 schrijfopdrachten en de .85 somscore van de twee .84 holistisch beoordeelde argumentatieve opdrachten. .89
Rxy
Criterium
.56 (.69) 62 (.77) .53 (.69) .63 (.80) .62 (.79)
Vier korte schrijfopdrachten in verschillende communicatieve stijlen (analytische scores gesommeerd) (2 beoordelaars)
.58 (.72) .66 (.52) .56 (.72) .65 (.83) .65 (.83)
.
.89 .82 .85 .84
.49 (.59) .44 (.53) .44 (.53) .47 (.57) .54 (.67)
Eén lang argumen- .77 tatief opstel. Holistisch beoordeeld.
.65
Eén holistisch beoordeeld opstel
.89 .89 .89 .85 .84
.65
Het laatste criterium (één lang argumentatief opstel) is na een schrijfcursus gegeven. De afname van de meerkeuzetoets vond voor de schrijfcursus plaats.
Onderzoek
leeftijd
N m.k.toets
Categorieën
Koffler (1984)
14
7326(54 items)
- Sentence structure (11) - Usage (21) - Punctuation & Capitalization (7) - Spelling (6) Totaal Combinatie Sentence structure & Idioom (32)
Benton & Kiewra (1986)
18-21
105 TSWE (50 items)
- Grammar - Sentence structure - Word-choice & style - Totaal
Rxy
Criterium
.50 (.80) .63 (.84) .49 (.78)
Eén opstel van 30 minuten, holis- tisch beoordeeld(2 beoordelaars)
RXX' RXX' RXX' inter score mkt Bijzonderheden .76 RXX' mkt = KR20 .58 .57
37 (.59) .41 (.71) .68 (.86) .71 (.90)
.57 .48 .90
Twee opstellen van .83 40 minuten (2 beoordelaars) 47
.80
Beide opstellen beschrijvend.
BIJLAGE 2
Omschrijving van de vragen in de verschillende subtests uit het voor de literatuurstudie bekeken onderzoek
Bijlage 2 Omschrijving van de vragen in de verschillende subtests uit het voor de literatuurstudie bekeken onderzoek. Godshalk, Swineford & Coffman (1966) onderscheidden zes subtests paragraph organization, usage, sentence correction, prose g roups, error recognition en construction shift. Bij de eerste categorie vragen moesten de proefpersonen de volgorde aangeven waarin door elkaar gezette zinnen van één alinea horen te staan. Bij de tweede categorie moesten de proefpersonen fouten herkennen in zinnen. Deze fouten betroffen grammatica, woordkeus, spelling en interpunctie. Bij de derde categorie moesten onderstreepte zin stukken een verbeterd van worden door het correcte alternatief voor het onderstreepte deel van de zin aan te kruisen. De fouten betroffen dezelfde zaken als bij de tweede categorie vragen. Bij de vierde categorie moesten de proefpersonen aangeven welke van vier zinnen op een opengelaten plaats in een alinea thuishoort. Bij de vijfde categorie moesten de proefpersonen aangeven of een zin goed of fout is. De fouten betroffen idioom, stijl (redundantie en clichés), en grammatica. Bij de zesde en laatste categorie moesten de proefpersonen een zin in gedachten herformuleren, waarbij een deel van de nieuwe zin gegeven werd. Aangegeven moest worden welk van vier gegeven woorden in de nieuwe zin voorkomt. -
Spooner Smith (1978) hanteerde een meerkeuzetoets waarin zij zes categorieën vragen develonment, onderscheidde: focus, paragraphing, support, organization, en error recognition. De eerste categorie bestond uit vragen waarbij de proefpersonen uit vier gegeven zinnen de beste als titel of conclusie van een gegeven tekstje moest kiezen. Bij de tweede categorie moesten de proefpersonen uit vier zinnen één zin kiezen die het beste aansloot op een gegeven stukje tekst. Bij de derde categorie moest de proefpersoon aangeven welke zin het best een gegeven generalisatie illustreerde, bij de vierde categorie moest aangegeven worden waar in een tekst een nieuwe alinea begon. Bij de vijfde categorie moesten de proefpersonen aangeven welke volgorde van een aantal gegeven zinnen de meest logische was. Tot slot is er een laatste categorie vragen onderscheiden, waarbij de proefpersonen een stuk tekst kregen met fouten erin die betrekking hadden op dezelfde gebieden als waar de vragen in de categorieën één, twee, drie en vijf over gingen. De proefpersonen werd gevraagd het alternatief aan te kruisen dat de gegeven fout in de tekst het best verbeterde. Er zijn in deze meerkeuzetoets dus geen vragen opgenomen die betrekking hadden op spelling en grammatica. vijf categorieën vragen: onderscheidde Clemson (1978) usage, en logje & spelling, punctuation, capilizadon & evaluation. Een beschrijving van de verschillende categorieën vragen wordt niet gegeven. Huntley, Schmeiser & Stiggins (1979) gebruikten voor hun onderzoek verschillende meerkeuzetoetsen. De ACT-English Usage
Test, de ACT-rhetiorical proficiency tests 1 en 2, de SAT-verbal en de SAT-Test of Standard Written English (S AT-TS WE). De ACTE n glish Usage Test bevat vragen die betrekking hebben op interpunctie, grammatica, woordkeus, stijl, logisch taalgebruik en organisatie. Deze toets legt meer nadruk op organisatie dan op spelling en grammatica. De ACT-rhetorical proficiency test 1 en 2 bevatten vragen op het gebied van doel- en publiekgerichtheid en ondersteuning van beweringen. De SAT-verbal kent drie soorten vragen; antoniemen, analogieën en tekstbegripvragen. De vragen van de categorie 'antoniemen' vragen naar het tegengestelde van een gegeven woord en de vragen van de categorie 'analogieën' vragen twee woorden te kiezen waarin dezelfde relatie tot uiting komt als de relatie tussen twee gegeven woorden. De SAT-TSWE bevat vragen op het gebied van grammatica, idioom, woordkeus en stijl. Crocker, Ondrasik & Lamme (1979) hanteerden een meerkeuzetoets met vier categorieën vragen: ' word-knowledge', 'reading comprehension', 'language arts' en ' spelling '. De 'language arts' bevat categorie vragen interpunctie, met betrekking tot hoofdlettergebruik en grammatica. Bij de tekstbegripvragen (reading comprehension) moesten de proefpersonen de hoofdgedachte van een stuk tekst identificeren-. Hogan & Mishler namen twee keer de 'Language Instructional Tests' van de 'Metropolitan Achievement Test' af, beide keren bij zowel acht- als dertienjarigen. Uitleg over de vorm en de inhoud van de vragen wordt niet door hen gegeven. Hudson & Veal (1981) namen vier verschillende meerkeuzetoetsen af met alle vier ongeveer dezelfde categorieën. Alle toetsen bevatten de categorieën 'spelling', 'capitalization', punctuation', 'usage' (idioom), en 'paragraph organization' (alinea indeling). Drie toetsen bevatten ook nog de categorieën 'sentence structure' (= grammatica) en enkele vragen over hoe een brief eruit moet zien. Twee toetsen bevatten ook nog vragen over hoe een opstel opgebouwd moet worden. Helaas geven ook deze auteurs nauwelijks informatie over wat voor soort vragen er in de verschillende categorieën voorkwamen. Halpin e.a. (1981) gebruikten voor hun studie een meerkeuzetoets met zes categorieën vragen: punctuation, capitalization, organization. en paragraph style grammar, spelling, Omschrijvingen van de vragen worden niet gegeven. Weiss & Jackson (1983) geven de correlaties russen de subtests van de ' Descriptive Tests of Language Skills' en drie verschillende criteria. De subtests zijn: reading comprehension, logical relations, word- use, usage & grammar, en sentence structure. Bij de eerste soort vragen werden korte stukjes tekst gegeven. De proefpersonen moesten de zin uitzoeken die de hoofdgedachte van het stuk tekst het best weergaf of zij moesten de beste parafrase van een stuk tekst kiezen of zij moesten een op grond van de gegeven tekst juiste gevolgtrekking kiezen. Bij
relaties, moesten logische vragen, tweede soort de de proefpersonen ideeën categoriseren, juiste voegwoorden gebruiken, analogieën maken en organisatieprincipes herkennen. Bij de derde soort vragen werd de proefpersonen gevraagd een correct synoniem van een gegeven woord te kiezen. Bij de vierde soort vragen werd de proefpersonen gevraagd fouten te herkennen in het gebruik van voornaamwoorden, bepalingen, idioom en werkwoorden. Bij de vijfde categorie vragen moesten de proefpersonen zinnen op grammaticale compleetheid beoordelen, neven- en onderschikkende voegwoorden correct hanteren en bepalingen op de juiste plaats in de zin zetten. Bij deze laatste categorie werden de vragen op twee verschillende manieren eerste moesten de gesteld. Ten proefpersonen aangeven of er een fout in een onderstreept deel van een zin voorkwam en ten tweede moesten de proefpersonen volgens bepaalde aanwijzingen een gegeven zin herformuleren en aangeven welk van de geboden alternatieven een fragment van de nieuw gevormde zin betrof. Koffler (1984) nam een meerkeuzetoets af met de categorieën 'sentence structure', 'usage', 'punctuation', 'capitalization' en 'spelling'. Omschrijvingen van de vragen worden niet gegeven.
BIJLAGE 3
De toetsboekjes
Bijlage 3: De toetsboekjes.
ALGEMENE INSTRUCTIE -
-
Voor je ligt een pak met vragen. Al deze vragen gaan over taal. Je moet alle vragen proberen te maken. Er zijn verschillende soorten vragen. Soms moet je bij voorbeeld aangeven of een woord goed is gespeld, en soms moet je aangeven welke zin van vier zinnen de beste is. Lees dus steeds eerst goed wat je moet doen! Als je een vraag niet begrijpt, lees de vraag en de uitleg dan nog eens goed door. Als je een vraag dan nog niet snapt, mag je je vinger opsteken. Werk rustig en probeer alle vragen te maken. Als je het antwoord op een vraag echt niet weet, mag je die vraag overslaan. Blijf niet te lang nadenken over een vraag als je het antwoord niet weet. Ga dan door met de volgende vraag. Als je niet alle vragen af krijgt, is dat niet erg. Je hoeft je dus niet te haasten. Je moet gewoon rustig doorwerken en elke vraag proberen.
Veel succes.
GRAMMATICA Jongen/meisje * Geboortedatum: Naam van de school: Moedertaal: Nederlands/Anders *; namelijk ........ ......... Laatste rapportcijfer voor Nederlands: * betekent doorhalen wat niet van toepassing is.
Geef bij de onderstaande zinnen aan of ze goed of fout zijn, door een hokje aan te kruisen. Voorbeeld: -Ik lopen lange afstanden.- goed Ei fout
Fx1
Als je je vergist, verbeter dan en zet een pijl bij het hokje dat je bedoelt. Voorbeeld: -Ik lopen lange afstanden.- goedkl fout Maak nu de vragen. Veel succes.
[X -
--
- - - -
1
Er liep een jongen met een rode schooltas en een oude voetbal liep er over straat.
goed
fout
2
Van de huiden van gedode dieren goed maken ze bontjassen van.
fout
3
Hij ging zo snel met zijn fiets door de bocht om, dat hij de stoeprand raakte.
goed
fout
4
goed Men vond dat het schilderij door een meisje aan de burgemeester overhandigd moest worden, en niet door een jongen.
fout
5
Praten of spelen kan ze wel, maar aan werken heeft ze een hekel.
goed
fout
6
Denk om dat je niemand over- slaat.
goed
fout
7
Over het hek springen is ge- makkelijker dan onderdoor.
goed
fout
8
Een paar jongens liepen over straat.
goed
fout
9
Een aantal leerlingen leren het nooit.
goed
fout
10 -
Ieder mens die een moord pleegt en ieder mens die brand sticht zijn hier niet welkom.
goed
fout
11 -
Er is twee flessen melk zuur geworden.
goed
fout
12 -
Een kudde schapen graast de heide kaal.
goed
fout
13 -
Die jas was daar opgehangen.
goed
fout
14 -
Ik heb de mand weer opgehijst.
goed
fout
15
Ik heb het pakje daar neergelegen.
goed
fout
16
Hij heeft zijn baas bedrogen.
goed
fout
17
De stier brieste één keer en likte toen mijn hand.
goed
fout
18
-
Narietje blooste toen ik vroeg wat ze met mijn broer gedaan had.
goed
fout
19
-
De schapen graasden in de wei.
goed
fout
20
-
Toen hij niesde was de betovering verbroken.
goed
fout
21
-
Zij had een kettinkje om.
goed
fout
22
-
In die stad is een museumtje met spaarpotten.
goed
fout
23
-
Het biggetje kwam uit de stal.
goed
fout
24
-
In de tuin hingen slingers en lampiontjes.
goed
fout
25
-
In de slagerij lagen de beenderen schots en scheef door elkaar op de grond.
goed
fout
Ik wil een ommelet met twee eien erin.
goed
fout
De vatten met bier werden naar het café gebracht.
goed
fout
28
Na de gymles moesten de matten weer worden opgeruimd.
goed
fout
29
Jan is beterder dan Piet.
goed
fout
30
Mies is het wijst van de klas.
goed
fout
26 27
-
31
De meest gelezen krant is niet te koop.
goed
fout
32 -
Deze film is meer eng dan die andere.
goed
fout
33 -
Dat is de gehaatste leraar van onze school.
goed
fout
34 -
Deze vraag is makkelijker, volgens mij.
goed
fout
35 -
Dit is de oersterkste jongen van onze klas.
goed
fout
Geef bij de volgende vragen aan welke van de vier gegeven zinnen de beste zin is. Kies steeds maar één zin door het hokje achter A, B, C of D aan te kruisen. Voorbeeld: A Ik drink thee. B Drink thee ik. C Thee ik drink. D Ik thee drink.
E
Als je je vergist en je een verkeerd hokje aangekruist hebt, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten. Voorbeeld: A Ik drink thee. B Drink thee ik. C Thee ik drink. D Ik thee drink.
1
Maak nu de vragen. Veel succes.
36 -
Welke van de vier onderstaande zinnen is de beste zin?
A Toen ik het aan hem bood, nam hij het aan. B Toen ik het aan hem bood, aannam hij het. C Toen ik het hem aanbood, nam hij het aan. D Toen ik het hem aanbood, aannam hij het. 37
Welke van de vier onderstaande zinnen is de beste zin?
A Hij heeft voor zich genomen om alle ellende te voorkomen. B Hij heeft voor zich genomen om alle ellende voor te komen. C Hij heeft zich voorgenomen om alle ellende voor te komen. D Hij heeft zich voorgenomen om alle ellende te voorkomen. 38 -
Welke van de vier onderstaande zinnen is de beste zin?
A Ik denk er niet aan om mijn adres te opgeven. B Ik denk er niet aan om mijn adres op te geven. C Ik denk niet eraan om mijn adres te opgeven. D Ik denk niet eraan om mijn adres op te geven. 39 -
Welke van de vier onderstaande zinnen is de beste zin?
A De dijken zullen Zeeland beschermen en zal het veilig verschanst liggen voor het water. B De dijken zullen Zeeland beschermen en daardoor zal het veilig verschanst liggen voor het water. C De dijken zullen Zeeland beschermen en zal het dus veilig verschanst liggen voor het water. D De dijken zullen Zeeland beschermen en zal het zo veilig verschanst liggen voor het water.
40
Welke van de vier onderstaande zinnen is de beste zin?
A Ik vind die film niet leuk omdat het zo saai is. B Ik vind die film niet leuk omdat het daarom zo saai is. C Ik vind die film niet leuk omdat het verhaal zo saai is. D Ik vind die film niet leuk omdat ik het zo saai vind. 41 -
Welke van de vier onderstaande zinnen is de beste zin?
A De jonge tuinier was blij, omdat hij meer groente kweekte dan de tuin van zijn buurman, die al jaren groente kweekte. B De jonge tuinier was blij, omdat hij meer groente kweekte dan zijn buurman, die al jaren groente kweekte. C De jonge tuinier was blij, omdat hij meer groente kweekte dan zijn buurmans tuin, die al jaren groente kweekte. D De jonge tuinier was blij, omdat hij meer groente kweekte dan zijn buurmans tuin opleverde, die al jaren groente kweekte. 42
Welke van de vier onderstaande zinnen is de beste zin?
A Maria voelt zich niet lekker maar blijft ze niet thuis. B Maria voelt zich niet lekker, toch ze blijft niet thuis. C Maria voelt zich niet lekker en toch blijft ze niet thuis. D Maria voelt zich niet lekker en blijft ze niet thuis.
43 -
Welke van de vier onderstaande zinnen is de beste zin?
A Gerard twijfelt er nu nog aan of het is nodig zo vroeg te vertrekken; gisteren kwam hij al te laat en vandaag hij zal ook wel niet op tijd zijn. B Gerard twijfelt er nu nog aan of het nodig is zo vroeg te vertrekken; gisteren kwam hij al te laat en vandaag zal hij ook wel niet op tijd zijn. C Gerard twijfelt er nu nog aan of het nodig is zo vroeg te vertrekken; gisteren kwam hij al te laat en vandaag hij zal ook wel niet op tijd zijn. D Gerard twijfelt er nu nog aan of het is nodig zo vroeg te vertrekken; gisteren kwam hij al te laat en vandaag zal hij ook wel niet op tijd zijn. 44 -
Welke van de vier onderstaande zinnen is de beste zin?
A Ik had je wel willen helpen als jij dat op prijs stelt. B Ik had je wel willen helpen als jij dat op prijs gesteld had. C Ik had je wel willen helpen als jij dat op prijs gesteld hebt. D Ik had je wel willen helpen als jij dat op prijs zult stellen. 45 -
Welke van de vier onderstaande zinnen is de beste zin?
A Plotseling werd de deftige dame zo boos, dat ze zich een zware gouden ring van de vinger rukte en die in het water slingerde. B Plotseling werd de deftige dame zo boos, dat ze zich een zware gouden ring van de vinger had gerukt en die in het water slingerde. C Plotseling werd de deftige dame zo boos, dat ze zich een zware gouden ring van de vinger heeft gerukt en die in het water slingerde. D Plotseling werd de deftige dame zo boos, dat ze zich een zware gouden ring van de vinger rukt en die in het water slingerde.
46 -
Welke van de vier onderstaande zinnen is de beste zin?
A Toen de man gegeten had, liep hij naar buiten en glijdt uit over een bananenschil. B Toen de man gegeten had, liep hij naar buiten en gleed uit over een bananenschil. C Toen de man gegeten had, liep hij naar buiten en is uitgegleden over een bananenschil. D Toen de man gegeten had, liep hij naar buiten en was uitgegleden over een bananenschil. 47 -
Welke van de vier onderstaande zinnen is de beste zin?
A Als ik dat geweten had, zal ik nooit gegaan zijn. B Als ik dat geweten had, zal ik nooit gaan. C Als ik dat geweten had, zou ik nooit gaan. D Als ik dat geweten had, zou ik nooit gegaan zijn. 48 -
Welke van de vier onderstaande zinnen is de beste zin?
A Zij is even oud als ik. B Zij is even oud als mij. C Zij is even oud dan ik. D Zij is even oud dan mij. 49 -
Welke van de vier onderstaande zinnen is de beste zin?
A Theo loopt niet harder dan jou. B Theo loopt niet harder dan jij. C Theo loopt niet harder als jou. D Theo loopt niet harder als jij. 50 -
Welke van de volgende vier zinnen is de beste zin? (Let op de onderstreepte woorden!)
A Dit is de druk bezochtste bioscoop van de hele stad. B Dit is de drukst bezochte bioscoop van de hele stad. C Dit is de drukst bezochtste bioscoop van de hele stad. D Dit is de drukste bezochtste bioscoop van de hele stad.
Geef bij de volgende zinnen aan welk deel kan worden weggelaten, zodat er nog een echte (goede) zin overblijft. (De zin die overblijft moet kloppen, maar hoeft niet hetzelfde te betekenen als de gegeven zin.) Voorbeeld: -Marietje liep met een tas vol boeken naar school.A Marietje B liep C met een tas vol boeken D tas vol boeken Het goede antwoord is 'C', want 'Marietie liep naar school' is een goede zin. Je kunt dus 'met een tas vol boeken' weglaten. Als je per ongeluk een verkeerd hokje aankruist, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten. Voorbeeld: -Marietje liep met een tas vol boeken naar school.A Marietje B liep C met een tas vol boeken D tas vol boeken Maak nu de vragen. Veel succes.
-
51
Welk deel kan worden weggelaten? -Een auto, die een lading hout vervoerde, is verongelukt op het kruispunt.A , die een lading hout vervoerde, B Een auto, die een lading C een lading hout D , is verongelukt op het kruispunt
52
Welk deel kan worden weggelaten? -De vrachtwagen van mijn broer wordt geschilderd door de buurvrouw en haar dochter.A door de buurvrouw B mijn broer C en haar dochter D geschilderd
53 -
Welk deel kan worden weggelaten? -Met een piepend geluid kwam de grote bus vlak voor het ravijn in een wolk van stof tot stilstand.A de grote bus B voor het ravijn C een wolk van stof tot D in een wolk van stof
54 -
Welk deel kan worden weggelaten? -Als je bij mij in de klas een vraag fout beantwoordt, stuurt de leraar je meteen naar huis, terwijl de leerlingen die het dichtst bij het raam zitten, luid juichend je tas, tafel en stoel naar buiten werpen.A stuurt de leraar je meteen naar huis, B meteen naar huis, terwijl C die het dichtst bij het raam zitten, D de leerlingen
Geef bij de volgende zinnen aan welk woord op de openstaande plaats moet worden ingevuld. (Bij één zin moet je twee woorden invullen.) Er is altijd maar één antwoord goed. Voorbeeld: -De jongen
ik gezien heb.-
A die B dat C wat D deze 'A' is het goede antwoord, want de goede zin is 'De jongen die ik gezien heb'. Als je per ongeluk een verkeerd hokje aankruist, verbeter dan door het goede hokje aan te kruisen en daar een pjjj bij te zetten. Voorbeeld: -De jongen ..... ik gezien heb.A die B dat C wat D deze Hier is eerst per ongeluk "B" aangekruist en verbeterd in "A". Maak nu de vragen. Veel succes.
-
55 -
Het meisje in de rode pyjama, is er vandaag niet.-
ik gisteren aansprak,
A die B wat C dat D wie 56 -
We leggen het kind te slapen en geven kruik.-
een warme
A dat B die C deze D het 57
Het aantal jongens dan je denkt.-
redelijk kan voetballen is groter
A die B dat C wat D wie 58 -
Het probleem is
• we hebben geen geld meer.-
A dat B die C deze D dit 59 -
Mevrouw, mijn man zijn baard is langer dan van u.A dat B dit C die D dat
dat dit die die
van
60 -
De klok van mijn zusje, is weggegooid.A die B wat C dat D dezelfde
een kapotte wijzerplaat had,
Geef bij de onderstaande zinnen aan welke woorden op (" de" of "het") op de open plaatsen moeten staan. Als er géén woord moet staan kies dan 'C'. A = de B = het C = (-) 'geen woord' Voorbeeld: -..... meisje liep naast auto van 1 2 het de 1 AH B[X1 C 2 C Alx B BT c X 3 A
haar vader.3
Het goede antwoord is 1B, 2A en 3C want de goede zin is 'Het meisje liep naast de auto van (-) haar vader'. Bij 1 moet dus 'Het', bij 2 'de' en bij 3 niets ingevuld worden. Als je per ongeluk een verkeerd hokje aankruist, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten. Voorbeeld: -..... meisje liep naast 1 1 2 3
A A A
./ B i B B ,■
auto van 2 /‘
°
._ J
haar vader.3
C C Cix
Hier heeft iemand per ongeluk 1C aangekruist en verbeterd in 1B, daarna is 2C verbeterd in 2A. Maak nu de vragen. Veel succes.
-.... jongen reed op 61
paard naar 62
A A A
61 62 63
A A
A A A
-Er ligt
69 70
B B B
gebied.68 C C C
zand op ..... vloer.69 70 A A
-Als
B B
C C
president zou hij dat moeten weten.71
71
65
gewassen is ook te danken aan
66 ongereptheid van 67
66 67 68
Terschelling is zeer
B C B C
-De rijkdom aan
63
BC BC BC
aantal plantesoorten op 64 groot.-
64 65
bruggetje.-
AB
C
Geef bij de volgende vragen aan of de onderstreepte woorden goed of fout zijn geschreven. Voorbeeld: -Een rood huis.-
goed x
fout [11
Als je je vergist, verbeter dan door het goede hok je aan te kruisen en zet daar dan een pijl bij. Voorbeeld: -Een rood huis.-
goed
fout
72 - een vierkant doosje
goed
fout
73 - een groen appel
goed
fout
74 - een tamelijk moeilijke hoofdstuk goed
fout
75 - dat oersaaie boek
goed
fout
76 - een driehoekig verkeersbord
goed
fout
77
goed
fout
78 een onverklaarbare oorzaak
goed
fout
79 een vreemde geval
goed
fout
Maak nu de vragen. Veel succes.
het knalrood jurkje
k
Iemand die voetbalt kun je een 'voetballer' noemen, maar iemand die schoenen maakt noem je een 'schoenmaker'. Geef aan hoe het woord eindigt dat op de drie puntjes ingevuld moet worden. Voorbeeld: - Een man die een molen heeft, is een ...A ....aard B ....aar C ....er D ....maker E ....eur F ....ast "B" is het goede antwoord, want een man die een molen heeft, is een molenaar en dat eindigt op ....aar. Als je je vergist, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten. Voorbeeld: - Een man die een molen heeft, is een ...A ....aard B ....aar C ....er D ....maker E ....eur F ....ast Hier is dus per ongeluk" A" aangekruist, en toen verbeterd tot " B'. Maak nu de vragen. Veel succes.
80 - Iemand die alles regelt, heet een ... A ....aard B ....aar C ....er D ....maker E ....eur F ....ast 81 - Iemand die vaak dronken is, is een ... A ....aard B ....aar C ....er D ....maker E ....eur F ....ast 82 - Iemand die repareert, heet een ... A ....aard B ....aar C ....er D ....maker E ....eur F ....ast 83 - Iemand die metselt, heet een ... A ....aard B ....aar C ....er D ....maker E ....eur F ....ast 84 - Iemand die veel leugens vertelt, is een ... A ....aard B ....aar C ....er D ....maker E ....eur F ....ast
85 - Iemand die veel fantaseert, is een ... A ....aard B ....aar
C ....er D ....maker E ....eur F ....ast
Nu volgen tot slot nog drie verschillende vragen. Bij elke vraag staat wat je moet doen. Veel succes. 86 - Welke zin betekent hetzelfde als de zin die hieronder staat? Er is maar één antwoord goed! -Klaas en Jan verdedigen elkaar.A Klaas en Jan verdedigen zich. B Klaas verdedigt Klaas en Jan verdedigt Jan. C Klaas verdedigt Jan en Jan verdedigt Klaas. D Klaas verdedigt Jan en Klaas, en Jan verdedigt Jan en Klaas. 87 - Welk woord moet op de open plaats in de onderstaande zin ingevuld worden? Er is maar één antwoord goed. -Jullie moeten
meer inspannen.-
A elkaar B zich C je Djou 88 - Welk woord moet op de open plaats in de onderstaande zin ingevuld worden? -Jan en Kees vergisten gedaan.A elkaar B hem C zich D mij
toen zij beweerden dat ik het had
SPELLING + INTERPUNCTIE
Jongen/meisje * Geboortedatum: Naam van de school: Moedertaal: Nederlands/Anders *, namelijk .......... ....... Laatste rapportcijfer voor Nederlands: * betekent doorhalen wat niet van toepassing is.
Spelling 1 Hieronder zie je een aantal korte zinnetjes. In elk zinnetje is één woord onderstreept. Geef aan of het onderstreepte woord goed of fout is gespeld, door het hokje bij 'goed" of bij "fout" aan te kruisen. Voorbeeld: -Ik maak een vout.-
goed_ fout FO
Als je een verkeerd hokje aankruist en je wilt verbeteren, zet dan een pijl bij het hokje dat je bedoelt. Voorbeeld: -Ik maak een vout.-
11‘ goed x fout
Hier is dus eerst per ongeluk "goed" aangekruist en verbeterd in "fout". Maak nu de vragen. Veel succes. Vragen: 1 Mischien komt hij.
goed fout
2 Hij fantaseerde over zijn verjaardag.
goed fout
3 De man lijdt de expeditie.
goed fout
4 De koning heeft een gauden kroon.
goed fout
5 De margarine was bedorven,
goed fout
6 Ik ben benieuwd of hij slaagt.
goed fout
7 Zij ondekten een schat.
goed fout
8 Joop is een klein dikkertje.
goed fout
9 Zij draagt een weide trui.
goed fout
10 Zag het elfje de kabouter?
goed fout
11 De chauffeur reed in de auto.
goed fout
12 De leerlingen sloegen alarm.
goed
fout
13 De arestant werd opgesloten,
goed
fout
14 Hij kreeg veel applaus na de voorstelling.
goed
fout
15 De dokter had een assistent.
goed
fout
16 Oma verkocht de pelzen van de vossen.
goed
fout
17 Is hij lings of rechts?
goed
fout
18 Ik hoorde gelag in de klas.
goed
fout
19 De prinses verkocht haar briljanten.
goed
fout
20 De kanibaal at een kleuter,
goed
fout
21 De fotografen maakten foto's.
goed
fout
22 Na hard werken moet je ontspanning zoeken.
goed
fout
23 Zij breit een trui.
goed
fout
24 Een pauw is een vogel,
goed
fout
25 De muziekant speelde fluit.
goed
fout
26 De filmster gaf een interview,
goed
fout
27 Wat jij wilt is onmogelijk,
goed
fout
28 Het buskruid ontplofte,
goed
fout
29 Leraren grijnzen in plaats van te huilen.
goed
fout
30 Hij eet rouwe biefstuk.
goed
fout
31 De professor gaf les.
goed
fout
32 De invallide liep op krukken.
goed
fout
33 De leerlingen vonden de les interressant.
goed fout
34 Hij had een heel aparte auto.
goed fout
35 De bloessem hing aan de bomen
goed fout
36 De poezen liggen voor het raam.
goed fout
37 Er kwam een auto langs.
goed fout
38 Hij ligt op de grond.
goed fout
39 Die man verdient een millioen per jaar.
goed fout
40 De Japanner nam foto's.
goed fout
41 Ik lust geen mayonaise.
goed fout
42 Hoeveel fabriken bezit die man.
goed fout
43 Een vis heeft kiewen.
goed fout
44 De bruid had geen witte jurk aan.
goed fout
45 Ik heb veel eelt onder mijn voeten,
goed fout
46 Wie is die jufrouw?
goed fout
47 Krijgt hij een erffenis?
goed fout
48 Die muggen irriteren me.
goed fout
49 Woont hij in een villa?
goed fout
50 Ik herinnerde mij niets,
goed fout
51 Schrijf het adres op een envellop.
goed fout
52 Is dat een scheeraparaat?
goed fout
53 Zie je hoe mooi die auto's glansen?
goed fout
54 Hij schrijft op pappier.
goed fout
55 Die lamp geeft veel licht.
goed
fout
56 Dat meisje is heel nieuwschierig.
goed
fout
57 Lust jij annanas?
goed
fout
58 Ik zag baronnen en grafen.
goed
fout
59 Is hij Chinees?
goed
fout
60 Was jij op de begravenis?
goed
fout
61 Duiven kunnen vliegen.
goed
fout
Spelling 2, vervoegingen Hieronder zie je een aantal korte zinnetjes. In elk zinnetje is één woord onderstreept. Geef aan of het onderstreepte woord goed of fout is gespeld, door het hokje bij 'goed" of bij "fout" aan te kruisen. Voorbeeld: -Ik loopt op straat.-
goed! !fout
[]
Als je een verkeerd hokje aanstreept en je wilt verbeteren, zet dan een pijl bij het hokje dat je bedoelt. Voorbeeld: -Ik loopt op straat.-
goed[i] fout 722
Maak nu de vragen. Veel succes.
Vragen: 62 Achter de boerderij ligt een mestvaalt die een doordringende geur verspreid.
goed fout
63 Jij bevrijdt de kippen uit het hok.
goed fout
64 De postbode heeft de reclamefol- ders verspreidt.
goed fout
65 Hij heeft het aanbod niet
goed fout
aanvaard.
66 Dat gezeur verveelt mij.
goed fout
67. Hij heeft die zaak te laat
goed fout
behandelt.
68 Wat gebeurd is, zullen we maar snel vergeten.
goed fout
69 De man die achter ons woont, beweerd dat hij drie auto's heeft.
goed fout
70 Wordt je broer morgen lid van de voetbalclub?
goed fout
71 Vindt jij het niet leuk om naar school te gaan?
goed
fout
72 Antwoord hij direct als er iets gevraagd wordt?
goed
fout
73 Ik vind dit niet zo moeilijk.
goed
fout
74 Hij aanvaart het cadeau.
goed
fout
75 Ontroert dat boek jou?
goed
fout
76 Hij heeft een schip gekocht.
goed
fout
77 Hij heeft een hok getimmerd.
goed
fout
78 Het heeft lang geduurt.
goed
fout
79 Hij heeft in bed geplasd.
goed
fout
80 Hij heeft haar omhelsd.
goed
fout
81 Hij heeft lang Beleeft.
goed
fout
82 De fotograaf vergrote de foto.
goed
fout
83 Hij verwachtte bezoek die avond.
goed
fout
84 Mijn verkleedde broertje werd uitgelachen.
goed
fout
85 De verwachte gasten kwamen niet opdagen.
goed
fout
86 Hij antwoordde niet.
goed
fout
87 Het water stroomdde langs de kade.
goed
fout
88 Hij grijnsde naar zijn vrouw.
goed
fout
89 Ik raadde het antwoord niet.
goed
fout
90 Ik wachtte op de kat.
goed
fout
91 Hij lachtte om de kat.
goed
fout
92 Ik vergiste me.
goed
fout
93 De kat kotstte op het kleed.
goed
fout
94 De gegeven cadeaus.
goed
fout
95 De verlope man.
goed
fout
96 De gezochten boef.
goed
fout
97 De geverfde tafel.
goed
fout
98 Hij ronde het getal af.
goed
fout
99 De man groete mij niet.
goed
fout
Spelling 3, verbuigingen Hieronder zie je een aantal korte zinnetjes. In elk zinnetje is één woord onderstreept. Geef aan of het onderstreepte woord goed of fout is gespeld, door het hokje bij "goed" of "fout" aan te kruisen. Voorbeeld: -Hij heeft twee stoels.-
..._ goed fout
et
Hier moet je 'fout ' aankruisen, want 'stoels' is fout en moet 'stoelen' zijn. Als je een verkeerd hokje aankruist, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten. Voorbeeld: -Hij heeft twee stoels.-
goed6L fout [N]
Maak nu de vragen. Veel succes.
Vragen: 100 Onze opaas waren thuis.
goed fout
101 Deze horloges komen uit Japan.
goed fout
102 Die kanarie' s hebben geen voer.
goed fout
103 Hij heeft blare op zijn hand.
goed fout
104 Niet alle landen in ZuidAmerika zijn democratiën.
goed fout
105 Suiker bevat veel calorieën.
goed fout
106 Hij heeft pijn aan zijn voeten.
goed fout
107 Heb jij de foto's van de vakantie gezien?
goed fout
108 Gisteren waren er niet veel vogels in de tuin, maar vandaag zijn er echt honderden aan komen
goed fout
vliegen.
109 Ik heb u televisie geleend.
goed
fout
110 De meeste vrouwen werken op het land.
goed fout
111 Twee mannen waren niet gekomen, omdat beide ziek waren.
goed fout
112 Als ik jou was zou ik dat niet doen.
goed fout
113 Allen mannen waren naar huis gegaan.
goed fout
114 Uw fiets is gestolen.
goed fout
115 Heeft hij jouw bedankt?
goed fout
116 Ik heb opa's fiets gerepareerd.
goed fout
117 Willem's verhalen zijn vaak gelogen.
goed fout
118 Kees' tante vroeg om een zak- doek.
goed fout
119 Annies' jurk was gescheurd.
goed fout
120 Vaders stoel was weg.
goed fout
121 Mamaas wil is wet.
goed fout
122 Wij gingen 's middags naar huis.
goed fout
123 Ik heb m' niet gezien.
goed fout
124 Hij heeft gouden tanden in zijn mond.
goed fout
125 Hij heeft een witten broek.
goed fout
126 Het zieke kind zag er slecht uit.
goed fout
127 Hij heeft een houte been.
goed fout
128 Hij zag een woninkje in het bos.
goed fout
129 Zij gooide de appelschillen in de prullebak.
goed fout
130 Het kraantje lekte.
goed fout
131 Het jongentje was stout.
goed fout
132 De knop van de radio is kapot.
goed fout
133 De wont in zijn been werd verbonden.
goed fout
134 De spin zat in haar web.
goed fout
135 zij veegde haar voeten op de
goed fout
deurmad.
136 De schapen lopen op de heide.
goed fout
137 De verfraaing van mijn jurk was duur.
goed fout
138 Zij had een kettingkje om.
goed fout
139 De ratten knaagen aan de koek.
goed fout
140 De wijdte van de broek was onvoldoende.
goed fout
141 Hij vroeg naar de breette van balk.
goed fout
142 De grootte van de taart was een verrassing.
goed fout
143 Hij had een zeer grootte vrachtwagen.
goed fout
144 De verrotting van vis stinkt heel erg.
goed fout
145 Hij bekeek de samensstelling van het elftal.
goed fout
146 Is dat een brulaap? goed fout
1471-lij deed de ritsluiting dicht.
goed
fout
(Let bij de volgende vier vragen op, of de woorden aan elkaar of los geschreven moeten worden.)
148 Als hij erop gelet had, was er niets gebeurd.
goed fout
149 Hij gaat nergensheen. goed fout 150 Hij was alles behalve vrien- delijk.
goed fout
151 Een nieuw jaar brak voor hem aan.
goed fout
(Let bij de volgende acht vragen op, of de verbindingsstreepjes (-) goed of fout gebruikt zijn.)
152 Hij werkt bij de radio-omroep. goed fout 153 Heb jij nog een fietswiel over?
goed fout
154 Durf jij van de duik-plank te springen?
goed fout
155 Hij woont in Noordbrabant. goed fout 156 Daar staan de tennisschoenen en goed fout -rackets.
157 Zie je die grote- en kleine kin- deren?
goed fout
158 Dat is de exkeizer van Oeganda.
goed fout
159 Wat is het nummer van jouw
goed fout
girorekening?
INTERPUNCTIE Hier volgen vier verhaalt jes waarin punten, komma's, hoofdletters en andere leestekens zijn weggelaten. De stukjes bestaan uit één of meer hele zinnen. Plaats de punten en hoofdletters waar ze horen en tel het aantal zinnen. Als je kunt kiezen uit een punt of een ander leesteken (komma, dubbele punt, etc.) plaats dan een punt en laat een nieuwe zin beginnen. Je moet de hoofdletters en punten dus zo toevoegen dat je zoveel mogelijk goede zinnen krijgt. Geef aan door A, B, C of D te kiezen uit hoeveel zinnen het verhaaltje bestaat. Voorbeeld: -hij zag een man de man schopte een hond.A één zin B twee zinnen C drie zinnen D vier zinnen
J
Het goede antwoord is 'B', want het stukje bestaat uit twee zinnen. Als je je vergist, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten. Voorbeeld: -hij zag een man de man schopte een hond.A één zin B twee zinnen C drie zinnen D vier zinnen Maak nu de vragen. Veel succes.
1 op een zonnige morgen in de lente maakten wij een wandeling door het bos het leek als ontwaakt uit een winterslaap wij genoten van de frisse kleuren zeer voldaan keerden wij tegen de middag huiswaarts Uit hoeveel zinnen bestaat dit verhaaltje? A één zin B twee zinnen C drie zinnen D vier zinnen 2 gedurende de lange winter wachtte ik op het uitkomen van de krokussen omdat mijn moeder mij gevraagd had een bosje voor haar mee te nemen en ik niet zonder bloemen durfde te komen Uit hoeveel zinnen bestaat dit verhaaltje? A één zin B twee zinnen C drie zinnen D vier zinnen 3 het zal misschien wel eens gebeuren dat er per ongeluk een paar ratten in de kelder van een museum rondscharrelen dat de directie van een museum met opzet ratten in het gebouw haalt zal echter niemand willen geloven toch is dit het geval in een museum in washington waar men onder andere kan zien in wat voor omstandigheden amerikanen leven Uit hoeveel zinnen bestaat dit verhaaltje? A één zin B twee zinnen C drie zinnen D vier zinnen
4 veel mensen geloven dat er door het gebruik van computers veel zal veranderen in ons leven niet iedereen is erg blij met deze ontwikkeling de discussie over het gebruik van de computer is in volle gang zonder de computer zouden de amerikanen nooit op de maan gekomen zijn evenmin zouden we televisiebeelden van de andere kant van de oceaan kunnen ontvangen toch zijn mensen bang dat de computer ons leven zal gaan beheersen hoe zal onze omgeving er over twintig jaar uitzien Uit hoeveel zinnen bestaat dit verhaaltje? A vijf zinnen B zes zinnen C zeven zinnen D acht zinnen
Geef aan of de onderstaande woorden goed of fout zijn afgebroken. Voorbeeld: -Scho-olmeester
goed
fout 62
Hier moet je 'fout' aankruisen, want 'schoolmeester' moet zo afgebroken worden: school-meester. Als je per ongeluk het verkeerde hokje hebt aangekruist en je wilt verbeteren, zet dan een pijl bij het hokje dat je bedoelt. Voorbeeld: -scho-olmeester-
41(' goedU
fout 62
5 be-staan
goed
fout
6 her-inneren
goed
fout
7 paar-dje
goed
fout
8 ko-ning-in
goed
fout
9 ek-ster
goed
fout
10 kijk-en
goed
fout
Maak de volgende vragen. Veel succes.
Geef bij de zinnen die hieronder staan aan of de komma's goed gebruikt zijn. Zinnen kunnen fout zijn, omdat er komma's teveel of te weinig in staan of omdat de komma's op de verkeerde plaats staan. Voorbeeld: -Jan liep over de, straat.-
goed
fout[]
Hier moet je 'fout' aankruisen, want in deze zin moet helemaal geen komma staan. Als je per ongeluk het verkeerde hokje hebt aangekruist en je wilt verbeteren, zet dan een pijl bij het hokje dat je bedoelt. Voorbeeld: goed [i
fout I -7
11 Januari, de koudste maand van het jaar, is voor dit doel ongeschikt.
goed
fout
12 De Eiffeltoren die in Parijs staat, is heel erg hoog.
goed
fout
13 Scholieren die meer dan twee on- voldoendes hebben, blijven zitten.
goed
fout
14 Meisjes, die rood haar hebben, vallen meer op in het donker.
goed
fout
15 Toch leverde de Zeeuwse polders, eenmaal drooggevallen, spoedig weer rijke oogsten.
goed
fout
16 Die winkel verkoopt pennen schrif- goed ten en potloden.
fout
goed
fout
-Jan liep over de, straat.- Maak nu de vragen. Veel succes.
17 Als ik jou help, help jij mij dan ook?
18 Kerel wat doe je dat klungelig.
goed
fout
19 In deze gevallen mogen de agenten goed zelfs zonder voorafgaande waarschuwing van hun pistool gebruik maken.
fout
20 Wat hij kan kan ik ook.
goed
fout
21 Ze konden dammen, schaken, biljar- goed ten en voetballen.
fout
22 Jongen, wat laat je me schrikken,
fout
goed
Geef bij de zinnen die hieronder staan aan of de aanhalingstekens („ ") goed gebruikt zijn. Zinnen kunnen fout zijn omdat er teveel of te weinig aanhalingstekens gebruikt worden of omdat de aanhalingstekens verkeerd geplaatst staan. Voorbeeld: -Hij zei: „Ga aan het werk".-
goedf xi fout
[
Als je per ongeluk een verkeerd hokje aankruist, verbeter dan en zet een pijl bij het hokje dat je bedoelt. Voorbeeld: -Hij zei: „Ga aan het werk".
goed x
fout _.X
23 Nog eenmaal zei hij kalm; „Ik ben onschuldig".
goed
fout
24 De meester zei dat „Joop onschul- dig was".
goed
fout
25 Geroep en geschreeuw leidt nergens toe.
goed
fout
26 Wat is dat voor onzin dacht Hans.
goed
fout
Maak nu de vragen. Veel succes.
Geef bij de woorden die hieronder staan aan of ze goed of fout zijn gespeld. Let op het gebruik van het trema (-)!
27 patiënt
goed
fout
28 chabs
goed
fout
29 verfraaiing
goed
fout
30 egoist
goed
fout
Geef bij de volgende zinnen aan of de hoofdletters goed zijn gebruikt. Voorbeeld:
goed E fout
-hier beginnen we.-
Als je per ongeluk het verkeerde hokje aankruist, verbeter dan en zet een pijl bij het goede hokje. Voorbeeld:
-hier beginnen we.-
goed
1x fout
Maak nu de vragen. Veel succes. 31 Hij is Lid van de Partij van de Arbeid.
goed
fout
32 Dit is een Franse pannekoek.
goed
fout
- goed
fout
goed
fout
33 Hij woont op de leidsegracht in Amsterdam. 34 Ik ben in januari jarig,
35 - Welke aanvang is het best om een brief mee te beginnen. (Let op hoofdletters en witregels!)
A
geachte heer De Boer,
Amsterdam, 1-1-'80
Naar aanleiding van ons telefoongesprek B
Amsterdam, 1-1'80 Geachte heer De Boer, Naar aanleiding van ons telefoongesprek
C
Amsterdam, 1-1'80 Geachte heer De Boer, Naar aanleiding van ons telefoongesprek
D
Geachte heer De Boer,
Amsterdam, 1-1-'80
Naar aanleiding van ons telefoongesprek
36 - Welk slot is voor een officiële brief het best? (Let op hoofdletters en witregels!) A Ik hoop dat alles zo voldoende duidelijk is. Hoogachtend, E. van Putten B Ik hoop dat alles zo voldoende duidelijk is. Hoogachtend, E. van Putten C Ik hoop dat alles zo voldoende duidelijk is. Hoogachtend, E. van Putten D Ik hoop dat alles zo voldoede duidelijk is. hoogachtend, E. van Putten
INHOUD EN ORGANISATIE
Jongen/meisje * Geboortedatum: Naam van de school: Moedertaal: Nederlands/Anders *; namelijk . ........ ........ Laatste rapportcijfer voor Nederlands: * betekent doorhalen wat niet van toepassing is.
Hieronder staan verschillende vragen. Bij iedere vraag wordt uitgelegd wat je moet doen. Er is steeds maar één antwoord goed. Kruis het vakje van het goede antwoord aan. Voorbeeld: -Wat is de beste zin?A Hij stond op, trok zijn jas aan en liep de deur uit. B Hij trok zijn jas aan, liep de deur uit en stond op. C Hij liep de deur uit, stond op en trok zijn jas aan. D Hij liep de deur uit, trok zijn jas aan en stond op. 'A' is de beste zin, dus hier moet vakje A aangekruist worden. Als je je vergist, verbeter dan door het goede vakje aan te kruisen en daar een pijl bij te zetten. Voorbeeld: -Wat is de beste zin?A Hij stond op, trok zijn jas aan en liep de deur uit. B Hij trok zijn jas aan, liep de deur uit en stond op. C Hij liep de deur uit, stond op en trok zijn jas aan. D Hij liep de deur uit, trok zijn jas aan en stond op.
IxI
71
Ei
Hier is dus per ongeluk eerst "B" aangekruist en toen verbeterd in A t, Maak nu de vragen. Veel succes.
1 - Wat is de beste zin? A De hengelaar, die een zalm ophaalde, wierp zijn lijn uit en deed weer aas aan de haak. B De hengelaar haalde een zalm op, deed weer aas aan zijn haak en wierp zijn lijn uit. C De hengelaar haalde een zalm op, wierp zijn lijn uit, en deed weer aas aan zijn haak. D De hengelaar wierp zijn lijn uit, deed weer aas aan zijn haak en haalde een zalm op. 2 - Welke zin past het best na de onderstaande zin? -Door al die kunstenmakerij viel Piet plotseling met een harde smak van zijn fiets.A Daarom viel hij en waren wij erg geschrokken. B Gelukkig viel hij zachtjes, want anders had hij zich lelijk kunnen bezeren. C We hielpen hen en legden hun fietsen aan de kant. D Wij schrokken erg en legden hem aan de kant van de weg. 3 - Welke zin past het best na de onderstaande zin? -Op een wintermorgen staat Maarten op, kijkt naar buiten, ziet de witte wereld en roept naar zijn broertje:A „Het heeft gesneeuwd, Jan!" B „Het sneeuwde, Jan!" C „Het zal wel gesneeuwd hebben, Jan!" D „Zou het gesneeuwd hebben, Jan!" 4 - Wat is de beste volgorde van deze zinnen? 1 De woeste stroom voerde de boomstammen mee. 2 Het bos stond vol hoge bomen. 3 De fabriek verwerkte de stammen tot planken. 4 Houthakkers hakten de bomen om. A1 B2 C2 D4
-3 - 1 -4 - 1
-2 -3 - 1 - 3
-4 -4 - 3 -2
5 - Zet de volgende zinnen in de juiste volgorde, maar laat de éne zin die er niet bijhoon, weg. 1 De jongen had de bijnaam 'Big' omdat hij knorrende geluidjes maakte. 2 De man zei tegen de vrouw dat hij weer weg moest. 3 In een armoedig huisje aan de rand van de stad woonde een jongen met zijn moeder. 4 Zijn moeder had veel zorgen in haar leven gehad. A2 B3 C3 D3 6
- 3 - 1 - 1 -2
- 1 -2 -4 - 1
Zet de volgende zinnen in de juiste volgorde. 1 Als het dan niet goed smaakte, zou hij veertien dagen gratis brood leveren. 2 De bakker zei, dat ze het moest laten ontdooien. 3 Een bakker had een klein jongetje een diepvriesbrood verkocht. 4 Zijn moeder kwam het verontwaardigd terugbrengen. A3 B3 C3 D3
- 1 -2 -2 -4
-2 - 1 -4 -2
- -
4 4 1 1
Geef bij de volgende drie vragen aan welke zin het best bij de twee andere zinnen past. Er is steeds maar één antwoord goed. (Als je je vergist, verbeter dan door het goede antwoord aan te kruisen en daar een pijl bij te zetten.) Voorbeeld: -Welke zin past het best op de stippeltjes?-Henk heeft eten gemaakt. - Straks eet hij alles op. A Nu loopt hij naar huis. B Nu dekt hij de tafel. C Nu gooit hij het weg. D Nu vraag hij hoe laat het is. Maak nu de vragen. Veel succes.
7
Welke zin past het best op de stippeltjes. - Koeien lopen in de wei. - Ik zou dat niet lusten. A Ze zijn zwart-wit gevlekt. B Spruitjes vind ik vies. C Ze eten meestal gras. D Soms loeien ze heel hard.
8 - Welke zin past het best op de stippeltjes? - Wij hebben thuis een kanarie. - Soms fluit hij het hoogste lied. A Wij hebben ook een hond. B Mijn zusje heeft een blokfluit. C Hij zit op een stokje in de kamer. D Maar we hebben geen konijn. 9 - Welke zin past het best op de stippeltjes? - Ik wilde schoenen kopen. - Jammer, maar ze hadden mijn maat niet. A Laatst ging ik naar de markt. B Laatst ging ik naar de bioscoop. C Ik heb mijn schoenen gepoetst. D Ik wist niet wat ik wilde.
Bij de vragen staat steeds een zin. Deze zinnen komen uit een opstel getiteld: 'Regenachtige dagen'. Het opstel bestaat uit vier stukken (alinea's). Deze vier stukken gaan over de volgende onderwerpen (A tot en met D): A Hoe ik me voel als ik opsta en het blijkt een regenachtige dag te worden. B De verschillen tussen regendagen in lente, zomer, herfst en winter. C De goede, nuttige kanten van de regen. D Leuke dingen, die je op regenachtige dagen kunt doen. Zeg van elke zin die bij een vraag staat bij welk onderwerp (A, B, C of D) deze zin hoort. (Als je je vergist, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten.) Voorbeeld: -Op regenachtige dagen kun je in de plassen stampen en dat vind ik leuk.-
F A 1 tE —-
_J
D
"D" is het goede antwoord, want deze zin gaat over leuke dingen die je kunt doen als het regent, en dat past bij onderwerp "D". Maak nu de vragen. Veel succes.
10 - Bij welk onderwerp hoort de volgende zin? -Als ik opsta op zo'n dag, voel ik me alsof ik in een gevangenis zit opgesloten.A
B
C
D
11 - Bij welk onderwerp hoort de volgende zin? -Met vriendjes kun je thuis allerlei leuke spelletjes doen op zulke dagen.A
B
C
D
12 - Bij welk onderwerp hoort de volgende zin? -'s Winters zijn de regenbuien ijskoud; soms bevriest de regen tot een gladde ijslaag.A
B
C
D
13 - Bij welk onderwerp hoort de volgende zin? -En als je je zo gevangen voelt, komt dat omdat je niet kunt buitenspelen.A
B
C D
14 - Bij welk onderwerp hoort de volgende zin? -Natuurlijk weet ik, dat de regen ook nodig is voor een heleboel dingen.A
B
C
D
15 - Bij welk onderwerp hoort de volgende zin? -De lentebuien zijn veel vriendelijker. Je kunt er soms zelfs vrolijk door worden.A
B
C
D
16 - Bij welk onderwerp hoort de volgende zin? -Regen zuivert de lucht en wast het stof van de planten.A
B
C
D
17 - Bij welk onderwerp hoort de volgende zin? -Door de regen is de bodem vochtig, en dat maakt het mogelijk dat planten groeien.A
B
C
D
18 - Bij welk onderwerp hoort de volgende zin? -Je kunt kleine klusjes doen, je kunt iets knutselen, of iets repareren.A
B
C
D
Stel je voor, dat je vriend of vriendin een aantal ideetjes op papier gezet heeft, waaruit hij of zij moet kiezen om een kort opstel (van één pagina) te maken. Nu moet jij zeggen wat je van die ideetjes denkt. Kies A als het ideetje een te uitvoerig onderwerp betreft, dat veel te veel omvat voor een kort opstel van één pagina. Kies B als het ideetje een te beperkt onderwerp aansnijdt, waarover niet genoeg te zeggen is, zelfs niet in een kort opstel van één pagina. Kies C als het idee bruikbaar is. Dus als het over een onderwerp gaat dat best in een kort opstel van één pagina kan worden behandeld. Als je je vergist, verbeter dan door het goede hokje aan te kruisen en een pijl te zetten bij het goede hokje. Voorbeeld: -Ik wil gaan vertellen hoe ik heet. B C J [-A— "B ' is het goede antwoord, want je kunt nooit een opstel van één pagina schrijven over hoe je heet. Dit onderwerp is te beperkt, er is niet genoeg over te vertellen. Kies niet meer dan één antwoord. Maak nu de vragen. Veel succes.
19 - Mijn bedoeling is om de term 'hands', die gebruikt wordt bij voetbal, uit te leggen. A
B
C
20 - Mijn bedoeling is om alles over voetbal te vertellen. A
B
C
21 - Mijn bedoeling is om uit te leggen hoe een voetbalteam een uitwedstrijd moet spelen. A
B
C
22 - Mijn bedoeling is om de geschiedenis van Nederland te vertellen van de Middeleeuwen tot nu. A
B
C
23 - Mijn bedoeling is om te vertellen hoe mijn huis eruitziet. A
B
C
24 - Mijn bedoeling is om te vertellen wat voor kunstjes mijn hond kent. A
B
C
25 - Mijn bedoeling is om te vertellen hoe alle vogels die in Nederland voorkomen, eruitzien. A
B
C
26 - Mijn bedoeling is om uit te leggen hoe je moet breien. A
B
C
Hieronder staat een verhaaltje. Eén zin hoort niet in dit verhaalt te thuis. Geef aan, door A, B, C of D te kiezen welke zin niet in dit verhaaltje hoort. (Als je je vergist, zet dan een pijl bij het goede hokje.) Er is maar één antwoord goed. 27 - Hoe de planten verhuizen 1 Planten blijven niet altijd op dezelfde plek wonen. 2 Ze verhuizen. 3 Dat komt onder andere door de wind. 4 De wind blaast bij voorbeeld de pluisjes van een paardebloem weg. 5 Niet alleen de wind verspreidt de zaden, ook dieren doen dat. 6 Er blijven soms zaadjes aan de vacht van een konijn haken. 7 Ook blijven er wel eens takjes aan de vacht van een konijn hangen. 8 Ook de vogels zorgen voor de verspreiding van de planten. 9 Dat gaat zo. 10 Eerst eten ze de kersen van de bomen en dan poepen ze later de pit ergens anders uit. 11 Zelfs mieren helpen mee met de verhuizing van planten. 12 Die brengen bij voorbeeld het zaad van de viooltjes van de ene plaats naar de andere. A zin 1 B zin 3 C zin 7 D zin 8
Hieronder staat een verhaaltje. Eén zin hoort niet in dit verhaaltje thuis. Geef aan, door A, B, C of D te kiezen welke zin niet in dit verhaaltje hoort. (Als je je vergist, zet dan een pijl bij het goede hokje.) Er is maar één antwoord goed. 28 - Schelpen op het strand. 1 Wie wel eens naar het strand geweest is, heeft daar zeker schelpen gezien. 2 Er liggen allerlei soorten. 3 Bekende schelpen zijn de strandschelp en de kokkel. 4 Ook mosselen zijn bekend, want die worden vaak door mensen gegeten. 5 Dan is er ook nog de zwaardschede. 6 Je begrijpt misschien wel, waarom ze die zo'n naam gegeven hebben. 7 Dat komt, omdat die schelp op een zwaard lijkt. 8 Ridders gebruikten vroeger zwaarden om mee te vechten. 9 Een schelpdier heeft veel vijanden. 10 Denk maar eens aan de strandvogels, de zeesterren en de krabben. 11 Ook zeeslakken achtervolgen de schelpdieren. 12 Weet je hoe zo'n zeeslak een schelpdiertje aanvalt? 13 Dat doet hij met zijn scherpe tong! 14 Daarmee boort hij een gaatje in de schelp. 15 Door dat gaatje steekt hij zijn tong naar binnen en eet zo het schelpdier op. 16 Daarom zie op het strand ook vaak schelpen met een rond gaatje. 17 Als je zo'n schelp vind, weet je dat de zeeslak weer gesmuld heeft. A zin 8 B zin 17 C zin 2 D zin 7
Hieronder staan een vraag en het antwoord op die vraag. In het antwoord staan zinnen die niet nodig zijn. Geef aan door A, B, C of D te kiezen welke zinnen je uit het antwoord kunt weglaten, zodat degene die de vraag stelt toch nog het station kan vinden. (Als je je vergist, zet dan een pijl bij het goede hokje.) Er is maar één antwoord goed. 29 -
1 Vraag: Meneer, weet u waar het station is? 2 Antwoord: Ja hoor, ik zal dat eens snel uitleggen. 3 Je moet eerst gewoon rechtuit lopen. 4 De eerste zijstraat aan je rechterhand, moet je niet hebben. 5 Als je die in zou gaan, kom je niet bij het station maar bij het zwembad. 6 Je moet de tweede zijstraat hebben. 7 Je gaat dan rechtsaf. 8 Als je dat gedaan hebt, zie je een bakkerswinkel. 9 Ze verkopen daar van die lekkere slagroomsoezen. 10 Bij de bakker ga je linksaf. 11 Je komt dan in een hele lange straat. 12 Ik heb daar vroeger zelf nog gewoond. 13 Ik weet nog dat we daar altijd voetbalden. 14 Je loopt door tot aan de stoplichten en dan ga je naar rechts. 15 Als je dat doet, zie je het station zo voor je. 16 Weet je het nu? A B C D
2, 4, 5, 2, 4, 5, 3, 5, 7, 4, 5, 9,
6, 8, 9, 12, 13. 8, 9, 11, 12, 13, 14. 9, 11, 13, 14. 12, 13.
Hieronder staat een verhaaltje dat in stukken geknipt is. Eén van deze stukken hoort niet in dit verhaaltje thuis. Geef aan door A, B, C of D te kiezen welke stukken in het verhaaltje thuishoren én in welke volgorde ze moeten staan. (Als je je vergist, verbeter dan door het goede antwoord aan te kruisen en daar een pijl bij te zetten.) Er is maar één antwoord goed. 30 - 1 Ach, zuchtte de uil toen hij daarover nadacht. Maar helaas zuchtte hij zo erg, dat hij pardoes van de tak viel. 2 De uil vond het eerlijk gezegd niet zo leuk als de dieren hem Jopie noemden. Laatst op een feest had Simon de Spreeuw in een dronken bui zelfs geroepen „Jopie, Jopie, wat drink je toch een hopie!" 3 En zo bleek dat zelfs een wijze uil zich soms een buil kan vallen. 4 Op zekere dag kwam er een vos langs de boom van de uil. Goeie morgen Jopie, zei de vos. Gegroet heer Vos, sprak de uil. 5 Er was eens een uil die ook dacht dat hij slim was. Jopie Slim, noemden de dieren van het bos hem. 6 De uil is een vogel die je overdag bijna nooit ziet. Dat komt omdat hij dan slaapt. Zo'n slaapplaats vindt de uil in de holte van een boom of in de gaten van oude muren. A B C D
6-5 5-4 5-6 5 - 1
-4 -2 - 1 -4
-2 - 1 -4 -2
-3 -3 -3 - 3
Het verhaal hieronder bestaat uit drie stukken (alinea's). Geef aan door A, B, C of D te kiezen waar het tweede en het derde stuk (alinea) beginnen. (Als je je vergist, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten.) Er is maar één antwoord goed. 31 - Op tentoonstelling grap ontdekt 1 Vanaf vorige week vrijdag zijn de bezoekers van de Openluchttentoonstelling van moderne kunst in Weert van slachtoffer geweest van een grap. 2 Eén van de tentoongestelde kunstwerken blijkt door enige monteurs van een plaatselijk garagebedrijf te zijn vervaardigd van oude auto-onderdelen en in de nacht voor de opening, de donderdagnacht, in het geheim tussen de tentoongestelde kunstwerken te zijn geplaatst. 3 De stunt is ontdekt, doordat verschillende bezoekers aan de suppoosten hadden gevraagd wie toch de ontwerper van het autokunstwerk was, want in de catalogus hadden ze het niet kunnen vinden. 4 Pas gisteren kreeg de heer A. Gerritsen, werkzaam bij de gemeente en belast met de organisatie van deze openluchttentoonstelling, argwaan. 5 Nader onderzoek leerde hem dat niemand kon vertellen door wie en wanneer het kunstwerk was gebracht. 6 Eenmaal onraad vermoedend kon hij de herkomst snel vaststellen. 7 Monteurs van de tegenover het tentoonstellingsterrein gelegen garage Mobiel gaven grif toe dat zij de 'kunstenaars' waren. 8 De heer Gerritsen heeft inmiddels namens het organiserend comité verklaard dat hij de stunt wel kan waarderen en dat hij heeft besloten het 'kunstwerk' op de tentoonstelling te laten staan. 9 Hij hoopt dat dit voor vele plaatsgenoten aanleiding zal zijn de openluchttentoonstelling te bezoeken. 10 De tentoonstelling is nog te bezichtigen tot zondag 16 september van 09.00 uur 's morgens tot 19.00 uur 's avonds.
A De tweede alinea (het tweede stuk) begint met regel 3 en de derde met regel 7. B De tweede alinea (het tweede stuk) begint met regel 3 en de derde met regel 8. C De tweede alinea (het tweede stuk) begint met regel 4 en de derde met regel 8. D De tweede alinea (het tweede stuk) begint met regel 4 en de derde met regel 9.
Hieronder staat een verhaaltje. Dit verhaaltje bestaat uit drie stukken (alinea's). Geef aan door A, B, C of D te kiezen waar de tweede en de derde alinea beginnen. (Als je je vergist, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten.) Er is maar één antwoord goed. 32 - De dodo 1 Misschien heb je wel eens van de dodo gehoord. 2 De dodo is een vogel die er een beetje gek uitziet. 3 De nek van de vogel lijkt op de nek van een zwaan. 4 De snavel heeft de vorm van een haak. 5 De vleugels van de dodo zijn erg kort. 6 Ze zijn zo kort, dat de vogel er niet mee kan vliegen. 7 De dodo is zeker geen mager vogeltje. 8 Het dier kan ruim 20 kilo wegen. 9 Helaas zijn er geen levende dodo's meer. 10 Al meer dan 200 jaar is de dodo uitgestorven. 11 Weet je hoe dat kwam? 12 Hollandse zeelieden ontdekten de dodo op een eiland. 13 Dat eiland heet Mauritius en het ligt in de oceaan. 14 De zeelieden gebruikten de dodo als voedsel. 15 Het was erg gemakkelijk om de dodo te vangen, want de dodo was helemaal niet bang voor de mensen. 16 Ook de eieren van de dodo vonden de zeelieden lekker. 17 Je kunt wel raden wat er gebeurde toen tenslotte alle dodo-eieren opgegeten waren. 18 Gelukkig zijn er tegenwoordig nog een paar herinneringen aan de dodo. 19 Vroeger hebben ze wel eens een dodo naar Nederland meegenomen. 20 Er zijn toen tekeningen van gemaakt. 21 Een tekening van de dodo staat ook in een heel leuk kinderverhaal. 22 Dat verhaal heet 'Alice in Wonderland'. 23 Als je dat boek ooit te pakken krijgt, kijk dan even naar de afbeelding van de dodo. A De tweede alinea begint met regel 7 en de derde met regel 15. B De tweede alinea begint met regel 8 en de derde met regel 17. C De tweede alinea begint met regel 9 en de derde met regel 18. D De tweede alinea begint met regel 10 en de derde met regel 19.
IDIOOM EN STIJL Jongen/meisje * Geboortedatum: Naam van de school: Moedertaal: Nederlands/Anders *; namelijk: ........... Laatste rapportcijfer voor Nederlands: * betekent doorhalen wat niet van toepassing is.
Geef bij de volgende vragen aan welk woord op de open plaats in deonderstaandeziningevuldmoetworden.Erismaaréénantwoord goed. Zet een kruis door het hokje van het goede antwoord. Voorbeeld: -Vandaag ben ik niet thuis,
morgen wel.-
A maar B want C omdat D doordat Als je je vergist, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten. Voorbeeld: -Vandaag ben ik niet thuis,
morgen wel.-
A maar B want C omdat D doordat Hier is dus eerst" C" aangekruist. Daarnaisverbeterddoor" A" aan te kruisen en daar een pijl bij te zetten. Maak nu de vragen. Veel succes.
Idioom en Stijl, deel A 1 - Welk woord moet op de open plaats in de onderstaande zin ingevuld worden? Kies één antwoord. -De voorwaarde .... ik wekelijks moet trainen, vind ik onaanvaardbaar.A omdat B dat C of D doordat 2 - Welk woord moet op de open plaats in de onderstaande zin ingevuld worden? Kies één antwoord. -Ik kan niet voetballen, .... ik mijn been gebroken heb.A mits B doordat C toen D door 3
Welk woord moet op de open plaats in de onderstaande zin ingevuld worden? Kies één antwoord. -
ik dit allemaal gehoord heb, begrijp ik het veel beter.-
A Mits B Toen C Nu D Dat 4 - Welk woord moet op de open plaats in de onderstaande zin ingevuld worden? Kies één antwoord. -Ik blijf binnen, A mits B omdat C voor D doordat
het zo hard regent.-
5
Welk woord moet op de open plaats in de onderstaande zin ingevuld worden? Kies één antwoord. -Ze gedraagt zich,
ze hier de baas is.-
A als B of C dat D om 6
Welk woord moet op de open plaats in de onderstaande zin ingevuld worden? Kies één antwoord. -Ze hebben een kleine,
mooie woning.-
A want B hetzij C maar D mits 7 - Welk woord moet op de open plaats in de onderstaande zin ingevuld worden? Kies één antwoord. -Ik ben bereid een baan aan te nemen, word. -
ik goed betaald
A mits B tenzij C hoewel D en 8
Welk woord moet op de open plaats in de onderstaande zin ingevuld worden? Kies één antwoord. -Hij kan ieder ogenblik ontslagen worden; het is niet prettig om op de .... te zitten.A draagstoel B klapstoel C schietstoel D schopstoel
9 - Welke woorden moeten op de open plaatsen in de onderstaande zin ingevuld worden? Kies één antwoord (A, B, C of D). -Het is een (1)
pil, maar we zullen (2) ....-
A (1) bittere --- (2) erdoorheen moeten bijten B (1) bittere --- (2) hem moeten slikken C (1) zure --- (2) erdoorheen moeten bijten D (1) zure --- (2) hem moeten slikken 10 - Welke woorden moeten op de open plaatsen in de onderstaande zin ingevuld worden? Kies één antwoord (A, B, C of D). -Ik heb je eerlijke bedoelingen nooit in twijfel (1) toch heb je die man veel schade (2) -
maar
A (1) genomen --- (2) berokkend B (1) genomen --- (2) gegeven C (1) getrokken --- (2) berokkend D (1) getrokken --- (2) gegeven _ 11 - Welk woord moet op de open plaats in de onderstaande zin ingevuld worden? Kies één antwoord. -Geef je nog .... Peter, of houd je niet meer van hem?A om B voor C over D op 12 - Welk woord moet op de open plaats in de onderstaande zin ingevuld worden? Kies één antwoord. -Dit grenst .... het ongelooflijke.A aan B naar C tegen D op
13 - Welk woord moet op de open plaats in de onderstaande zin ingevuld worden? Kies één antwoord.
-Dit verhaal bestaat .... een aaneenschakeling van toevalligheden.A van B voor C in D uit 14 - Welk woord moet op de open plaats in de onderstaande zin ingevuld worden? Kies één antwoord.
-Als hij zou berusten .... zijn lot, zou alles beter gaan.A onder B in C op D bij
Geef bij de onderstaande uitdrukkingen aan of ze goed of fout zijn. Soms is de uitdrukking in een grotere zin gezet. De uitdrukking zelf is steeds onderstreept. Voorbeeld: -Wie de schoen past, gooit hem uit goed het raam. -
fout '..?_ 171
Hier moet 'fout' aangekruist worden, want de goedeuitdrukking is 'Wie de schoen past, trekke hem aan'. Als je je vergist, verbeter dan door het hokje aan te kruisen dat je bedoelt en zet daar dan een pijl bij. Voorbeeld: -Wie de schoen past, gooit hem uit goed X fout het raam.Hier is dus per ongeluk het hokje 'goed' aangekruist, en verbeterd door het hokje 'fout' aan te kruisen en daar een pijl bij te zetten. Maak nu de vragen. Veel succes.
15 - Hij heeft de ontslagen beambte
goed
fout
goed
fout
17 - Deze vakman is van alle markt- goed
fout
in ere hersteld.
16 - Door de diefstal was hij lelijk in de aap gelogeerd.
kramen thuis.
18 - Die man loopt op grote voet. goed
fout
19 - De kruik gaat zolang te water goed
fout
tot zij zinkt.
20 - Als je hem beschuldigt, moet ook de hand in eigen boezem steken.
goed
fout
Geef bij de onderstaande zinnen aan hoe je het onderstreepte deel het best kunt verbeteren. Als de zin goed is, kies dan A. Kies één antwoord. Voorbeeld: -Hij viel met een smak op de grond gevallen.A op de grond gevallen. B op de grond. C op zijn gezicht gevallen. D op zijn hoofd gevallen.
De goede zin is 'Hij viel met een smak op de grond.' 'B' is dus het goede antwoord. Als je je vergist, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten. Voorbeeld: -Hij viel met een smak op de grond gevallen.A op de grond gevallen. B op de grond. C op zijn gezicht gevallen. D op zijn hoofd gevallen. Maak nu de vragen. Veel succes. 21 - Verbeter het onderstreepte deel van de zin door B, C of D te kiezen. Als de zin goed is, kies dan A. -Hij heeft toestemming gevraagd zich in Panama te mogen vestigen.A zich in Panama te mogen vestigen. B om in Panama te mogen wonen. C of hij zich in Panama mocht vestigen. D om zich in Panama te vestigen.
22 - Verbeter het onderstreepte deel van de zin door B, C of D te kiezen. Als de zin goed is, kies dan A. -De deftige man woonde in een groot huis; toch bleek hij niet in staat al zijn schuldeisers te kunnen betalen.-
A toch bleek hij niet in staat al zijn schuldeisers te kunnen betalen. B toch bleek hij niet in staat al zijn schuldeisers te betalen. C toch bleek hij niet in staat al zijn schulden te kunnen betalen. D toch bleek hij niet in staat de schulden van zijn schuldeisers te kunnen betalen. 23 - Verbeter het onderstreepte deel van de zin door B, C of D te kiezen. Als de zin goed is, kies dan A. -Hij houdt wel van wandelen, maar hij heeft echter nog nooit aan de vierdaagse meegedaan.-
A maar hij heeft echter nog nooit aan de vierdaagse meegedaan. B maar hij heeft echter de vierdaagse nog niet gelopen. C maar hij heeft nog nooit aan de vierdaagse meegedaan. D maar hij heeft echter nog nooit de vierdaagse gelopen. 24 - Verbeter het onderstreepte deel van de zin door B, C of D te kiezen. Als de zin goed is, kies dan A. -Geen van de tentoongestelde auto's beviel me en evenzo met de motorfietsen.-
A en evenzo met de motorfietsen. B en ook niet de motorfietsen die tentoongesteld waren. C en ook de motorfietsen konden me niet bekoren. D en ook de motorfietsen niet.
25 - Verbeter het onderstreepte deel van de zin door B, C of D te kiezen. Als de zin goed is, kies dan A. -Als je bedenkt hoe duur die tomaten kosten, lust je ze niet eens meer.A hoe duur die tomaten kosten B hoe veel die tomaten zijn C hoe veel die tomaten kosten D hoe veel geld die tomaten zijn 26 - Verbeter het onderstreepte deel van de zin door B, C of D te kiezen. Als de zin goed is, kies dan A. -De lerares complimenteerde de nieuwe leerlinge dat zij haar werk heel goed gedaan had.-
A dat zij haar werk heel goed gedaan had. B over hoe goed zij haar werk deed. C met haar werk. D met het goed doen van haar werk. 27 - Verbeter het onderstreepte deel van de zin door B, C of D te kiezen. Als de zin goed is, kies dan A. -De agent verzocht mij of ik zijn veter vast wilde maken.A of ik zijn veter vast wilde maken. B of ik bereid was zijn veter vast te maken. C om zijn veter vast te willen maken D om zijn veter vast te maken.
Nu volgen nog vijf verschillende vragen. Bij elke vraag staat wat je moet doen. Veel succes. 28 - In welke zin wordt het woord 'brug' fout gebruikt? Kies één antwoord. A De paus heeft geprobeerd een brug te slaan tussen de arme en de rijke volkeren. B Je kunt je geheimen best aan hem toevertrouwen, want hij kan zwijgen als een brug. C Na al die beloften wordt het wel hoog tijd, dat hij eens over de brug komt. D Toen het begon te stormen verscheen de kapitein zelf op de brug. 29 - Wat betekent de uitdrukking 'Hoge bomen vangen veel wind? Kies één antwoord. A Een goed vakman kan heus wel eens een fout in zijn werk maken. B Men geeft graag de schuld aan anderen. C Op mensen met een verantwoordelijke baan is vaak veel kritiek. D Sommige mensen kunnen nooit iets goed doen. 30 - Welk spreekwoord past het best bij de onderstaande zin? Kies één antwoord. -Het is erg gemakkelijk gul te zijn met andermans dingen.A Beter een half ei dan een lege dop. B Door schade en schande wordt men wijs. C Van andermans leer is het goed riemen snijden. D Zuinigheid met vlijt bouwt huizen als kastelen.
31 - Welk spreekwoord past het best bij de onderstaande zin? Kies één antwoord. -Die gestolen appels zullen je slecht bekomen.A Aan de vruchten kent men de boom. B De appel valt niet ver van de stam. C Gestolen goed gedijt niet. D Hoogmoed komt voor de val. 32 - Welke uitdrukking past het best bij de onderstaande zin? Kies één antwoord. -Nauwelijks was de automobilist de overweg gepasseerd, of de trein raasde voorbij.A Dat ging zijn neus voorbij. B Hij is door het oog van de naald ge kropen. C Hij is geen knip voor zijn neus waar d. D Hij zette grote ogen op.
Geef bij de volgende zinnen aan welk woord het best past op de open plaats. Let op, het gaat bij deze vragen om het beste woord, en niet om goed of fout. Kies dus niet te snel en kijk of je beste woord kunt vinden. Kies één antwoord. Voorbeeld: -Hij is zo sterk als een .....A leeuw B muis C kabouter D fietspomp Je ziet dat alle vier de woorden kunnen worden ingevuld, maar het woord bij 'A' past het best in de zin. Daarom is 'A' het goede antwoord. Als je je vergist, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten. Voorbeeld: -Hij is zo sterk als een ....A leeuw B muis C kabouter D fietspomp
4-
Hier is dus per ongeluk "B" aangekruist en verbeterd in "A". Maak nu de vragen. Veel succes.
Idioom en Stijl, deel B 1 - Welk woord past het best op de open plaats in onderstaande zin? -Deze jongen is niet in staat een .... gesprek te voeren; hij kan alleen maar gekke dingen zeggen.A mooi B leuk C grappig D zinnig 2 - Welk woord past het best op de open plaats in onderstaande zin? -De zieke lag te .... van de koorts.A vibreren B trillen C rillen D huiveren 3 - Welk woord past het best op de open plaats in onderstaande zin? -De oude man takelde geest elijk steeds verder af en werd uiteindelijk helemaal A kinderlijk B kinderachtig C kinds D kindachtig 4 - Welk woord past het best op de open plaats in onderstaande zin? -De man is met vele talenten ....A vergeven B begiftigd C verleend D geschonken
-
5
Welk woord past het best op de open plaats in onderstaande zin? -De spreker .... een ogenblik, totdat het gelach in de zaal bedaard zou zijn.A twijfelde B zuchtte C aarzelde D wachtte
6 - Welk woord past het best op de open plaats in onderstaande zin? -De verpleegster .... te hulp toen de patiënt uit bed viel.A racete B rende C holde D snelde 7 - Welk woord past het best op de open plaats in onderstaande zin? -Het meisje was met haar gedachten niet bij haar werk; zij zat te .... over het mooie boek dat zij gelezen had.A denken B mijmeren C zuchten D weifelen 8 - Welk woord past het best op de open plaats in onderstaande zin? -Er was geen levende ziel in het huis te ....A erkennen B ontkennen C verkennen D bekennen
9 - Welk woord past het best op de open plaats in de onderstaande zin? -Eerst waren de beelden van de film scherp, maar al snel werden zij ....A bot B stomp C vaag D zwak 10 - Welk woord past het best op de open plaats in de onderstaande zin? -Hij hecht er weinig waarde aan, dat de leerlingen allerlei feiten in hun hoofd stampen. Hij wil er mensen van maken, geen ....A encyclopedieën B experimenten C filosofen D studenten 11 - Welk woord past het best op de open plaats in de onderstaande zin? -Omdat hij genoeg had van het stadsrumoer, kocht hij een buitenhuisje om er van de .... rust van het platteland te genieten.A weelderige B gewelddadige C geweldige D weldadige 12 - Welk woord past het best op de open plaats in de onderstaande zin? -Terwijl we wachtten tot de storm ging ...., zaten we bij het vuur naar een van Jans griezelverhalen te luisteren.A afnemen B liggen C rusten D woeden
Op de volgende bladzijden staat bij iedere vraag een korte zin. In die zin is telkens één woord onderstreept. Geef aan, door A, B, C of D te kiezen, wat het onderstreepte woord betekent. Voorbeeld: -Jan staat op de toren.A lange boot B kerk C smal, hoog gebouw D krant Het goede antwoord is 'C', want een toren is een smal, hoog gebouw. Bij elke vraag is steeds maar één antwoord goed. Als je je vergist, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten. Voorbeeld: -Jan staat op de toren.A lange boot B kerk C smal, hoog gebouw D krant Hier is dus eerst 'B' aangekruist, en toen verbeterd door 'C' aan te kruisen en een pijl erbij te zetten. Maak nu de vragen. Veel succes.
13 - Zij snippert de appel. A eet hem lekker op B pakt hem stiekem C snijdt hem in kleine stukjes D wast hem 14 - Hij heeft geen vrees. A is niet tevreden B kan met iedereen omgaan C heeft geen beesten D is niet bang 15 - Het is erg waarschijnlijk. A bijna zeker B zwaar bewolkt C erg glanzend D helemaal waar 16 - Slagers gebruiken darmen voor het maken van worst. A huid van dieren B ingewanden C soort tuinkruid D mannetjesbijen 17 - Het probleem wordt door haar geponeerd. A opgelost B beantwoord C begrepen D naar voren gebracht 18 - Hij is erg wantrouwig. A heeft er veel spijt van B is onvriendelijk C vertrouwt niemand D is erg stiekem
19
-
De bokser daagde de kampioen uit. A riep de kampioen op te vechten. B sloeg de kampioen bewusteloos. C begon de kampioen te begrijpen. D schold de kampioen uit.
20 - Langzaam bedaarde hij. A werd hij moe B werd hij boos C werd hij kalm D werd het hem duidelijk 21 - Hij is een reële man. A redelijke B godsdienstige C slimme D vrolijke 22 - De tekening is erg wazig. A kostbaar B onduidelijk C slecht D vlekkerig 23 - Wil je dat eens motiveren? A uitleggen waarom je het doet B je excuses ervoor aanbieden C warm maken D opruimen
Geef bij de volgende zinnen aan wat ze betekenen. Er is steeds maar één antwoord goed. Voorbeeld: -De jongen was in de vierde klas blijven zitten.A De jongen ging niet meer naar school. B De jongen moest de vierde klas overdoen. C De jongen ging nooit meer van school af. D De jongen bleef tussen de middag op school eten. Als je je vergist, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten. Voorbeeld: -De jongen was in de vierde klas blijven zitten.A De jongen ging niet meer naar school. B De jongen moest de vierde klas overdoen. C De jongen ging nooit meer van school af. D De jongen bleef tussen de middag op school eten. Hier is per ongeluk "D" aangekruist en verbeterd in "B" Maak nu de vragen. Veel succes.
iX!
24 - Wat betekent de onderstaande zin? -Deze groepen waren op het congres vertegenwoordigd.-
A Deze groepen hadden naar het congres vertegenwoordigers gestuurd. B Deze groepen waren naar het congres gezonden als afgevaardigden. C Deze groepen waren op het congres aanwezig. D Enkele van deze groepen waren op het congres aanwezig. 25 - Wat betekent de onderstaande zin? -Dankzij de medewerking van ouders en politie is voorkomen, dat er teveel schade werd aangericht.A Door de medewerking van ouders en politie is bereikt, dat er geen schade werd aangericht. B Door de medewerking van ouders en politie is bereikt, dat er veel schade werd aangericht. C Door de medewerking van ouders en politie is bereikt, dat er vrij veel schade werd aangericht. D Door de medewerking van ouders en politie is bereikt, dat er vrij weinig schade werd aangericht. 26 - Wat betekent onderstaande zin? -Hij is zo slim als een vos.A Een vos is heel slim. B Hij is heel lang. C Hij is heel slim. D Hij wil een vos vangen. 27 - Wat betekent onderstaande zin? -Hij zwijgt in alle talen.A Hij heeft het helemaal vergeten. B Hij is heel dom. C Hij kan niet zo goed praten. D Hij zegt helemaal niets.
Idioom en Stijl, deel C Hieronder staat een opstel van een leerling. In dit opstel wordt een k am peerboerderi j beschreven. Deleerling die dit opstel geschreven heeft, heeft met zijn klas in deze boerderij gelogeerd. In het opstel zitten een aantal fouten. De zinnen zijn genummerd, zodat er in de vragen naar de zinnen verwezen kan worden. Lees het opstel en beantwoord dan de vragen. 1. De kampeerboerderij 2 Ik zal jullie beschrijf hoe onze kampeerboerderij eruit ziet. 3 Wij zaten in een erg mooie omgeving. 4 Achter, links en rechts van de kampeerboerderij was een bos. 5 Vóór de kampeerboerderij liep een weg, waar je als je rechtsafging, het dorp Helmwijk inliep. 6 In het dorp was van alles te doen. 7 De molen 'De Einder' hebben we ook bezocht, hoewel sommigen de trappen eng vonden. 8 Verder was er ook een zwembad, waar we, als het warm was, heengingen. 9 We gingen ook een middag naar de marktplaats, waar we souveniertjes voor thuis kochten. 10 Die middag hebben we ook ansichtkaarten gekocht, en toen zijn we ijs gaan eten en toen zijn we naar de zee gegaan. 11 Voor de kampeerboerderij loopt een smal wandelpaadje. 12 Aan het eind daarvan kon je linksaf en ging je door de duinen naar de zee. 13 De kampeerboerderij was eigenlijk een soort kruis. 14 Aan de linkerkant waren de slaapzalen en de douches en de toiletten. 15 In het midden had je de eet- en recreatiezaal. 16 Rechts waren de slaapzaaltjes voor de begeleiders met douches en toiletten. 17 Bij de poort liep je door een soort tuintje naar de ingang, daarachter was dan de eet- en recreatiezaal. 18 Als je dan rechtdoor liep had je links de keuken en rechts was privé. 19 Wij hadden een heel leuk schoolreisje.
De volgende vragen gaan over het opstel dat je net gelezen hebt. In de vragen wordt gevraagd hoe je een zin uit het opstel het best kunt verbeteren. Het is de bedoeling dat je de beste zin kiest van de zinnen die bij B, C en D gegeven worden. Als je vindt dat de zin in het opstel beter is dan de zinnen bij B, C en D, kies dat A "De zin is goed". Let op! Soms zijn er meerdere zinnen goed. Kies dan de zin die volgens jou de beste is. Voorbeeld: -Hoe kun je zin twee het best verbeteren? (Als de zin goed is, kruis dan 'A' aan.)" A De zin is goed. B Ik zal jullie beschrijven hoe onze kampeerboerderij eruit ziet. C Ik zou jullie beschrijf hoe onze kampeerboerderij eruit zien. D Ik beschrijven jullie hoe eruit ziet onze kampeerboerderij. Als je zin twee van het opstel bekijkt en vergelijkt met B, C en D zie je dat B het goede antwoord is. Als je je vergist, verbeter dan door het goede hokje aan te kruisen en daar een pijl bij te zetten. Voorbeeld: -Hoe kun je zin twee het best verbeteren? (Als de zin goed is, kruis dan "A" aan.) A De zin is goed. B Ik zou jullie beschrijven hoe onze kampeerboerderij eruit ziet. C Ik zal jullie beschrijf hoe onze kampeerboerderij eruit zien. D Ik beschrijven jullie hoe eruit ziet onze kampeerboerderij. Maak nu de vragen. Veel succes.
I _J
1 - Hoe kun je zin 4 het best verbeteren? (Als de zin goed is, kruis dan "A" aan.) A De zin is goed. B Links en rechts achter de kampeerboerderij was een bos. C Links achter en rechts achter de kampeerboerderij was een bos. D Achter de kampeerboerderij was een bos links en rechts. 2 - Hoe kun je zin vijf het beste verbeteren? (Als de zin goed is, kruis dan "A" aan.) A De zin is goed. B Vóór de kampeerboerderij liep een weg. Als je op deze weg rechtsaf ging, kwam je in het dorp Helmwijk. C Vóór de kampeerboerderij liep een weg. Als je op deze weg rechtsaf de weg afliep, kwam je in het dorp Helmwijk. D Vóór de kampeerboerderij liep een weg rechtsaf het dorp Helmwijk in.
3 - Hoe kun je zin acht het best verbeteren? (Als de zin goed is, kruis dan "A" aan.) A De zin is goed. B Verder was er ook een zwembad als het warm was waar we heengingen. C Verder als het warm was, waar we heengingen, was een zwembad. D Verder was er ook een zwembad, waar we heengingen als het warm was.
4 - Hoe kun je zin tien het best verbeteren? (Als de zin goed is, kruis dan "A" aan.) A De zin is goed. B Die middag hebben we ook ansichtkaarten gekocht. Daarna hebben we ijs gegeten en toen zijn we naar zee gegaan. C Die middag hebben we ook ansichtkaarten gekocht en toen hebben we ijs gekocht en naar zee gegaan. D Toen hebben we ansichtkaarten gekocht en ijs gekocht en zijn we naar zee gegaan. 5 - Hoe kun je zin 11 het beste verbeteren? (Als de zin goed is, kruis dan "A" aan.) A De zin is goed B Voor de kampeerboerderij liep een smal wandelpaadje. C Voor de kampeerboerderij zou een smal wandelpaadje lopen. D Voor de kampeerboerderij is een smal wandelpaadje. 6 - Hoe kun je zin 13 het best verbeteren? (Als de zin goed is, kruis dan "A" aan.) A De zin is goed. B De kampeerboerderij was eigenlijk een soort van kruisvorm. C De kampeerboerderij had de vorm van een kruis. D De kampeerboerderij had eigenlijk de vorm van een soort kruis. 7 - Hoe kun je zin 18 het best verbeteren? (Als de zin goed is, kruis dan "A" aan.) A De zin is goed. B Als je dan rechtdoor liep had je links de keuken en rechts had je privé. C Als je dan rechtdoor liep had je links de keuken en rechts waren privé-vertrekken. D Als je dan rechtdoor liep had je links en rechts de keuken en privé-vertrekken.
BIJLAGE 4
Itemverdeling over de subtests, goede antwoorden en bevraagde probleemtypen
Bijlage 4:
De itemverdeling over de subtests en de goede antwoorden.
Spelling: Woordbeeld-spelling: item 1 tot en met 61. item- juiste probleem- item- juiste probleemnr. antwoord type* nr. antwoord type* -verwisseling gelijkluidende grafemen 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 *
fout goed fout fout goed goed fout fout fout goed goed goed fout goed goed goed fout fout goed fout goed goed goed goed fout goed goed fout goed fout
s/ss s/ss ei/ij au/ou i/ie ieu/ie on/ont t/d ei/ij ou/au ff/f 1/11 r/rr pp/p ss/s z/s ng/nk g/ch lj/li n/nn f/v ont/on ei/ij au/ou ie/i ie/ieu on/ont d/t ij/ei ou/au
31 goed 32 fout 33 fout goed 34 fout 35 36 goed goed 37 38 goed 39 fout 40 goed 41 goed 42 fout fout 43 44 goed 45 goed 46 fout 47 fout 48 goed 49 goed 50 goed 51 fout 52 fout 53 fout 54 fout goed 55 fout 56 57 fout 58 fout goed 59 60 fout goed 61 (aangeboden vorm/alternatieve vol in)
-verwisseling gelijkluidende grafemen f/ff 11/1 rr/r p/pp ss/s z/s ng/nk g/ch li/lj nn/n n/nn i/ie ie/ieu d/t t/d f/ff ff/f rr/r 11/1 r/rr 11/1 p/pp s/z P/PP ch/g ch/g nn/n f/v i/ie v/f v/f
•stuurde spelling, vervoegingen , item 62 tot en met item 99 .
juiste antwoord
probleemtype (aangeboden vorm) - verwisseling voltooid deelwoord (dit) en o.t.t. prefixwerkwoorden
6 6 .4 '1
fout goed fout goed goed fout goed fout
o.t.t., stam eindigt op 'd' o.t.t., stam eindigt op 'd' volt, tijd, stam eindigt op 'd' volt. tijd, stam eindigt op 'd' o.t.t., stam eindigt niet op 'd' volt. tijd, stam eindigt niet op 'd' volt. tijd, stam eindigt niet op 'd' o.t.t., stam eindigt niet op 'd' - o.t.t. eindigend op 'd', 't' of 'dt'
, 1 79 73
goed fout fout goed fout goed
dt dt d d t t - volt. deelwoord eindigend op 't' of 'd'
7 f, goed h goed fout fout goed fout -,
-
t d t d d t - verwisseling o.v.t. en bijvoeglijk gebruikt volt. deelwoord
fout goed fout goed
o.v.t. o.v.t. bijvoeglijk gebruikt voltooid deelwoord bijvoeglijk gebruikt voltooid deelwoord
itemnr.
juiste antwoord
probleemtype (aangeboden vorm) - o.v.t., stam al dan niet eindigend op 'd' of 't'
86 87 88 89 90 91 92 93 98 99
goed fout goed goed goed fout goed fout fout fout
d d d d t t t t
d t
- verwisseling bijvoeglijk gebruikte infinitief en volt. deelwoord 94 95 96 97
goed fout fout goed
met 'n' zonder 'n' met 'n' zonder 'n'
_ elgestuurde spelling, verbuigingen., items 100 tot en met 159 .
juiste antwoord
probleemtype (aangeboden vorm)
- meervoudsvorming ] ,: ! 1 : J I .; 104 105 106 107
fout goed fout fout fout goed goed goed
s s 's e in ieën en 's
- zelfstandig voornaamwoordelijk mervoud met of zonder -n 108 110 111 113
goed goed fout fout.
en e 0 en
- bezittelijk gebruikt persoonlijk voornaamwoord met of zonder -w 109 112
114 115
fout goed goed fout
pen 'w' geen 'w' wei 'w' wel 'w'
- genitief-s of apostrof en weglatingsapostrof 116 117 118 119 12.0 121 122 123
goed fout goed fout goed fout goed fout
's 's S' s' s s
,s
m'
itemnr.
juiste antwoord
probleemtype (aangeboden vorm) - stoffelijk bijvoeglijk naamwoord al dan niet eindigend op 'en'
124 125 126 127
goed fout goed fout
en en e e - vorming verkleinwoorden
128 130 131 138
goed goed fout fout
nk/ng ntje/tje ntje/tje ngk/nk - stemhebbende of -loze medeklinker als uitgang
132 133 134 135
goed fout goed fout
lilb t/d b/p dit - vocaal of consonant enkel of dubbel
129 136 137 139
goed goed fout fout
11/1 a/aa ai/aii aa/a -zelfstandig gebruikte bijvoeglijke naamwoorden
140 141 142 143
goed fout goed fout
dt tt tt tt
..:.nr.
juiste antwoord
probleemtype (aangeboden vorm) - samenstellingen al dan niet met dubbele medeklinker
1 1
goed fout goed fout
rr/r ss/s 1/11 s/ss - los of vast schrijven van woorden
IL 1
goed fout fout goed
vast vast los los
- gebruik koppelteken 1,2 1. 54
1
1 ,,' 158 159
goed goed fout fout goed fout fout goed
met koppelteken zonder koppelteken met koppelteken zonder koppelteken met koppelteken met koppelteken zonder koppelteken zonder koppelteken
6
Interpunctie en vormaspecten opbouw
itemnr.
juiste
antwoord
probleemtype (aangeboden vorm) - zinsgrenzen herkennen
1 2 3 4
D A C C - correct afbreken van woorden
5 6 7 8 9 10
goed goed fout fout goed fout - komma-gebruik
11 12 13 14 15 16 17 18 19 20 21 22
goed fout goed fout goed fout goed fout fout fout goed goed
uitbreidende zinnen met komma uitbreidende zinnen zonder komma beperkende bijzin zonder komma beperkende bijzin met komma tussenwerpsel met komma's opsomming zonder komma's twee persoonsvormen met komma aanroep zonder komma tussenwerpsel zonder komma twee persoonsvormen zonder komma opsomming met komma's aanroep met komma - gebruik aanhalingstekens
23 24 25 26
goed fout goed fout
met aanhalingstekens met aanhalingstekens zonder aanhalingstekens zonder aanhalingstekens
juiste antwoord
probleemtype (aangeboden vorm) - gebruik trema's
27
•
goed fout goed fout
met trema met trema zonder trema zonder trema - gebruik hoofdletters
32 33 34
fout goed fout goed
met hoofdletter met hoofdletter zonder hoofdletter zonder hoofdletter - vormaspecten brief
35 „..r5
D C
Inhoud en organisatie
itemnr.
juiste antwoord
probleemtype (aangeboden vorm) - het bepalen van de beste volgorde binnen één zin en tussen zinnen
1 2 3 4 5 6
B D A C C D - passende zin bij gegeven zinnen kiezen
7 8 9
C C A - zinnen rangschikken onder opsteltitels
10 11 12 13 14 15 16 17 18
A D B A C B C C D - opstelonderwerpen beoordelen op geschiktheid voor het maken van een opstel van één bladzijde
19 20 21 22 23 24 25 26
B A C A C C A C
juiste antwoord
probleenitype (aangeboden vorm) - niet passende zin uit verhaaltje halen
C A D B
- tekst in alinea's verdelen 7', 1
B C 5:n stijl: deel A juiste antwoord
probleemtype - kiezen van de juiste voegwoorden frbetekenis voegwoorden)
-
2 3 4 5 6 7
B B C B B C A
juiste uitdrukking kiezen of bepalen of de
voun van een uitdrukking correct is 6
15 . 20
D B C goed goed fout fout fout goed
itemnr.
juiste antwoord
probleemtype • - juiste voorzetsels bij voorzetselvoorwerpen kiezen
11 12 13 14
A A D B - verbeteren van contaminatie en verkeerde samentrekking
21 22 23 24 25 26 27
D B C C C C D betekenisvan uitdrUkkingen bepalen
28 29 30 31 32
B C C C B
:••177;• ,1 en stijl: deel B juiste antwoord
probleemtype - het passende woord in context kiezen
2 3 4 $ 6 7 8 10 1 1 12.
D C C B D D B D C A D B
- woordbetekenissen aangeven 13 14 1.5 16 17 18
C D A B D C A C A B A A D C D
Idioom en stijl: deel C
itemnr.
juiste antwoord
probleemtype - stijlfouten in opstel verbeteren
1 2 3 4 5 6 7
B B D B B C C
•
nr.
juiste antwoord
probleemtype (aangeboden v - gebrekkige zinsstructuur herkennen
2 3 4 7
fout fout fout goed goed fout fout - incongruentie onderwerp en persoonsvorm
9 11 12
goed fout fout fout goed
m.v./e.v. m.v./e.v. m.v./e.v. e.v./m.v. e.v./m.v. - vervoegingsfouten
13 14 15 16 17 18 19 20
goed fout fout goed goed fout goed fout - verbuigingsfouten: verkleinwoorden
21 22, 23 24
goed fout goed fout
itemnr.
juiste antwoord
probleemtype (aangeboden vorm) - meervoudsvorming
25 26 27 28
goed fout fout goed - comperatief en superlatief
29 30 31 32 33 34 35 50
fout goed goed fout fout goed fout B
-er/-st meest meer/-er -ste/meest -er -ste/- vorming zelfstandige naamwoorden
80 81 82 83 84 85
B A E B B - verbuiging bijvoeglijke naamwoorden
72 73 74 75 76 77 78 79
goed fout fout goed goed fout goed fout
zonder 'e'/met 'e' zonder 'e'/met 'e' met 'e'/zonder 'e' met 'e'/zonder 'e' zonder 'e'/met 'e' zonder 'e'/met 'e' met 'e'/zonder 'e' met 'e'/zonder 'e'
juiste antwoord
probleemtype (aangeboden vorm) - herkennen correcte plaatsing van scheidbaar en onscheidbaar samengestelde werkwoorden
C D B - aangeven welke zinsdeel weggelaten kan worden zonder de grammaticaliteit van de zin aan te tasten A C D C - verwijzing hanteren: verwijzing herkennen
B C B • juiste voornaamwoorden invullen
C D B D C A - voegwoorden en inversie van de bijzin C
B
itemnr.
juiste antwoord
probleemtype - juiste lidwoord bij zelfstandignaarnwoord in een zin kiezen (ook generiek gebruik)
61 62 63 64 65 66 67 68 69 70 71
A B B B C C A B C A C - correct gebruik wederkerende en wederkerige voornaamwoorden
86 87 88
C C C - onjuiste vermeningen van tijden herkennen
44 45 46 47
B A B D - keuze van het persoonlijk voornaamwoord bij de stellende en de vergrotende trap
48 49
A B