Toetsen, zin en onzin, een kritische beschouwing
Ad Boes Inhoudsopgave 1
Inleiding
2
Is toetsen in het onderwijs: iets nieuws?
3
De Wet op het Primair Onderwijs
4
Hoe groot zijn de 'gewone' en 'gegeven' verschillen
5
Goede en slechte toetsen
6
Toetsen zijn objectief: dat is toch een hele verbetering?
7
Samenvatting
8
Literatuur
1 Inleiding Er zullen (nog) maar weinig mensen te vinden zijn die zich principieel uitspreken tegen het gebruik van toetsen in het onderwijs. Maar toch hebben we kennelijk met een controversieel onderwerp te maken, zoals opnieuw blijkt uit de inhoud van dit themanummer. Discussies over toetsen in het onderwijs worden in tal van landen gevoerd, vooral waar ze in toenemende mate het gezicht van het onderwijs bepalen, zoals in Engeland en de Verenigde Staten. In ons taalgebied kwam de Academie voor Ontwikkelingsgericht Onderwijs met een kritische publicatie over het onderwerp (Barendse 2000). Inmiddels is er de actie tegen de praktijk van de eindtoets in het basisonderwijs die alom de aandacht heeft getrokken (Boes 2002). In artikelen hebben diverse critici, waaronder de hoogleraren Stevens, Schuyt en Standaert (ook in Boes c.s., 2002), al eerder stelling genomen. Een toets in het onderwijs is een middel om op een verantwoorde wijze vast te stellen of een kind een onderwijsdoel heeft gehaald, anders dan 'met een natte vinger'. Zo kan worden vastgesteld of onderwijs voor een kind in voldoende mate zin heeft gehad. We formuleren nog wat nauwkeuriger én principiëler. Met de uitslag van een toets kan een leraar vaststellen in hoeverre wat hij beoogde is bereikt. 'Principiëler', want de uitslag van een toets geeft niet aan of een kind z'n best deed - zo werden en worden schoolcijfers nog vaak geïnterpreteerd maar of de leraar zijn werk naar behoren heeft gedaan. Prof.A.D.de Groot heeft destijds in zijn spraakmakende boek 'Vijven en zessen' (1e druk 1966!) voor die verrassende invalshoek gekozen. Hij distantieerde zich van onderwijspraktijken waarbij cijfers worden gebruikt voor een continue proces van vooral negatieve selectie. Een school die een kind toelaat heeft de verplichting het tot over de eindstreep te brengen, zo stelde hij. Om elke willekeur daarbij uit te sluiten zouden er objectieve toetsen moeten komen. Eindtoetsing geeft daarbij
kwaliteitsgarantie, terwijl tussentijdse evaluatie zowel kan voorkomen dat een kind onderweg afhaakt en als aangeven of een tussendoel is gehaald. De oprichting van een instituut dat scholen bij het vervaardigen van toetsen helpt of die taak overneemt lag in de voorstellen die De Groot deed besloten. Zo is er een rechtstreeks verband tussen zijn opvattingen en het totstandkomen van het CITO. Het CITO is nu een instituut naast vele andere en schooltoetsen zijn het product van de educatieve industrie waarin miljoenen omgaan.
2 Is toetsen in het onderwijs iets nieuws Leraren uit het vroegere buitengewoon en latere speciaal onderwijs maakten, nu al weer ruim twintig jaar geleden, melding van kinderen die in het reguliere onderwijs onopgemerkt zo waren achter geraakt dat ze dat het onderwijs niet meer konden volgen. Bij toelatingsonderzoek bleek de werkelijke omvang van de achterstand vaak veel groter dan door de reguliere school opgegeven. Om die reden heeft men in scholen moeten leren signaleren, diagnosticeren en remediëren. Dat is een goede zaak De teneur van de wet op het primair onderwijs (WPO) is dat scholen bij hun onderwijs 'uitgaan van verschillen' en moeten trachten discontinuïteit in het onderwijsleerproces van alle kinderen te voorkomen. Alleen onder die voorwaarden is het immers verantwoord om zoveel mogelijk kinderen binnen het reguliere onderwijs te houden. Dat dat ideaal nog niet is bereikt staat wel vast. Een van de redenen daarvoor is dat de omstandigheden waaronder leraren hun werk doen verre van optimaal zijn. Het personeelstekort is er de oorzaak van dat remedial teachers of interne begeleiders (leraren) vaak aan expliciete zorgverbreding worden onttrokken, ze worden voor de vervanging van groepsleraren ingezet. Het gaat hierbij om een hoogst ernstige situatie die scholen verhindert om een van de belangrijkste taken, het verzorgen van voor ieder kind passend onderwijs, naar behoren uit te voeren. We hebben met deze introductie aangegeven waartoe toetsing in de eerste plaats moet dienen, 'een hulp onderweg' om goed onderwijs mogelijk te maken. Maar hoe anders ziet de toetspraktijk in een groot deel van de scholen eruit. Van de door de overheid met de mond beleden autonomie van scholen komt - ook hier - niet veel terecht. Als voorstellen, van onder meer de Onderwijsraad, voor leerstandaarden in wetgeving worden omgezet zal een rigide toetscultuur het basisonderwijs kenmerken, een en ander naar buitenlands voorbeeld. Het is daarbij een raadsel dat niet wordt geluisterd naar critici, binnen en buiten de landsgrenzen. Veel ontwikkelingen op het gebied van toetsing zijn opgelegd, maar ook moet worden vastgesteld dat scholen zich niet of veel te laat tegen ongewenste ontwikkelingen verzetten. In het vervolg van dit artikel volgt een aantal kritische opmerkingen bij wat men ten onrechte in veel scholen al gewoon is gaan vinden.
3 De Wet op het Primair Onderwijs In het basisonderwijs moet voor ieder kind een continue ontwikkeling worden mogelijk
gemaakt
Dat kan ervoor zorgen dat het zittenblijven verdwijnt (memorie van toelichting bij de WPO) en meer kinderen in het regulier onderwijs kunnen blijven (het project Weer Samen naar School, diverse publicaties van het Procesmanagement Primair Onderwijs). Een en ander is alleen mogelijk als de koppeling van leerstof en leerjaar wordt losgelaten, dat wordt in alle genoemde publicaties terecht gesteld. Maar in de zogenaamde toetskalenders is die koppeling doorgaans het uitgangspunt. Ieder kind wordt geacht op een tevoren vastgesteld moment een bepaald minimumniveau te halen, bijvoorbeeld aan het eind van groep vier. Het valt vaak samen met de gemiddelde score, zoals in het CITO-leerlingvolgsysteem. (artikel 8 van de WPO).
Daartoe is natuurlijk niet elk kind in staat en zo krijgen we twee groepen leerlingen: wie gemiddeld en verder is enerzijds en wie 'achter' is anderzijds. We kunnen die 'achterstand' hard maken, bijvoorbeeld met behulp van de vijf categorieën A t/m E die bij CITO-toetsen worden onderscheiden of - nog erger - uitgedrukt in maanden verschil in vergelijking met de gemiddelde vorderingen met behulp van zgn. didactische leeftijdsequivalenten (DLE's). Beide systemen zijn verwerpelijk en staan haaks op de intenties van de WPO. Daarover kan geen enkel misverstand bestaan. Verschillen tussen kinderen zijn een gegeven en acceptatie daarvan behoort uitgangspunt te zijn. Prof.Stevens heeft aan dit onderwerp een uitvoerige brochure besteed (Stevens 1997).
4 Hoe groot zijn de 'gewone' en 'gegeven' verschillen Ze variëren in jaren mentale ontwikkeling van ongeveer drie jaren bij vierjarige basisschoolkinderen tot zeven jaar aan het einde van groep acht. Ze nemen dus toe, zoals ieder die het onderwijs enigszins kent zelf kan vaststellen. Onderwijs dat zulke verschillen 'wegwerkt', 'compenseert' of hoe je dat ook zou willen uitdrukken bestaat eenvoudig niet. In de Engelstalige onderwijskundige literatuur spreekt men in dit verband van de 'seven years gap' bij twaalfjarige kinderen. Scholen die aan die verschillen voorbij gaan maken slachtoffers. We hebben het hier niet over door nadelige milieuomstandigheden veroorzaakte verschillen die wellicht en dan nog maar gedeeltelijk, wél 'compenseerbaar' zijn. In goed onderwijs worden verschillen gezien én geaccepteerd en het onderwijs wordt zo georganiseerd dat allen van het aanbod kunnen profiteren. Individueel onderwijs is dé oplossing, zo zou een voorbarige conclusie kunnen luiden. In het algemeen gesproken is die onjuist. Kinderen halen uit een rijk vormingsaanbod wat ze nodig hebben. Wat ze leren hoeft niet steeds in hapklare porties te worden aangeboden. Zo leren ze thuis hun eerste taal, in een sterk heterogene omgeving. Waarom toch zou de school het heel anders moeten doen? Wie van tijd tot tijd wil nagaan of een kind in voldoende van het onderwijs heeft geprofiteerd moet vaststellen in hoeverre het is verder gekomen, waarbij die vordering wordt vergeleken met het resultaat van een vorig meetmoment bij hetzelfde kind. Bij het overgrote deel van de vorderingen kunnen we volstaan met evaluatie die op waarneming in omgangssituaties is gebaseerd. Alleen bij moeizaam vorderen doen we er verstandig aan de vinger wat vaker aan de pols te houden. En steeds ieder kind toetsen? Dat is meestal niet nodig. Vaak toetsen betekent verlies van schaarse tijd.
5 Goede en slechte toetsen Zijn toetsen per definitie slecht? Neen, we stellen hier oneigenlijk en onjuist gebruik aan de kaak. Zijn er slechte toetsen? Zeker. Op de toetsmarkt kan flink worden verdiend, menigeen probeert dus een graantje mee te pikken. Daarbij hoort misleidende reclame met kreten als 'Eindelijk een toets die voorspelt', en 'Gelukkig is er nu een toets die gebaseerd is op de ontwikkeling van het kind'. Het is allemaal baarlijke nonsens. Een toets voorspelt in het individuele geval - daar gaat het immers om - helemaal niets. Of een kind een bepaalde ontwikkeling zal doormaken kan vooraf niet worden vastgesteld. En dan de onzinnige suggestie alsof we al jaren ongeduldig op iets nieuws zitten te wachten. 'De' ontwikkeling van kinderen bestaat niet. Er zijn hoogstens trends die nooit volledig op een individueel geval van toepassing zijn.
6 Toetsen zijn objectief: dat is toch een hele verbetering? De eigenschap 'objectiviteit' suggereert een inhoudelijke onafhankelijkheid. 'Methodegebonden' toetsen gaan door voor het tegengestelde. De laatste zouden niet deugen. Als een school wil nagaan of een kind van het onderwijsaanbod heeft geprofiteerd moet een toets van de gevolgde methodiek of methode zijn afgeleid. Dat is bij de makers van toetsen natuurlijk bekend, daarom gaan ze bij de constructie van toetsen uit van het gemiddelde onderwijsaanbod (lees: de meest gebruikte methoden). Methoden zouden door deskundigen vervaardigde toetsen moeten omvatten. Het totstandkomen van een toets is echter een kostbare zaak en daarom wordt genoegen genomen met een afwijking tussen onderwijsaanbod en toetsinhoud en dat is, voorzichtig uitgedrukt, slordig. Daarom hebben we 'landelijke toetsen', voorstanders daarvan suggereren ten onrechte dat die beter zijn. Een school die weinig courante methoden en methodieken hanteert moet geen 'methodeonafhankelijke' toetsen gebruiken, omdat de scores vooral de verschillen tussen de methode en de toetsinhoud meten. Erger is het dat instanties als de onderwijsinspectie, de onderwijspers, schoolbesturen en onderwijspolitici slechts in de schoolscores geïnteresseerd lijken te zijn. Daarvoor wordt het totaal van de individuele scores berekend, want zo denkt men scholen met elkaar te kunnen vergelijken. We zijn daarmee ver verwijderd van het doel waarvoor toetsen zijn gemaakt. Het vergelijken van scholen is een hachelijke zaak, omdat populaties zo sterk verschillen. Daarvoor is geen acceptabel wegingssysteem voorhanden, ook niet in landen waar een veel langere toetstraditie bestaat dan bij ons. Bij ons wordt voor die weging door het CITO en de onderwijsinspectie gebruik gemaakt van een zevental categorieën. Ze zijn afgeleid van de zogenaamde leerlingenweging met behulp waarvan extra formatie wordt toegekend. Ook daarvoor is die weging ongeschikt, dat wordt alom erkend. Het probleem is nog groter als men zich realiseert dat scholen met een zwak sociaal-culturele populatie bij vergelijkingen in het nadeel blijken te zijn. We kennen geen Nederlands onderzoek op dit gebied, maar de critici van kwaliteitssystemen die sterk op de onze lijken in de Verenigde Staten en Engeland brengen dit bezwaar steevast naar voren.
Resteert nog een opmerking. In goede toetshandleidingen besteden de auteurs veel aandacht aan de omstandigheden waaronder toetsen worden afgelegd en aan de deskundigheid van de degenen die ze afnemen. Met beide is in veel scholen droevig gesteld. Specialisten op het gebied van zorgverbreding zijn geschoold in het afnemen van toetsen, groepsleraren niet. Je krijgt bij het beoordelen van de ontwikkeling van kinderen steeds meer de indruk dat alleen toetsscores tellen, onoordeelkundig toetsen is dan heel kwalijk. Er is veel voor te zeggen dat aan deskundigen over te laten. Zo'n strategie leidt vanzelf tot minder toetsen. 7 Samenvatting •
bij veel toetsing verliest men het oorspronkelijke doel uit het oog, namelijk vaststellen of het beoogde bij een kind is bereikt en verkrijgen van informatie over wat nog moet gebeuren of wat een volgende stap is
•
veel toetsen gaan uit van het vergelijken van scores met wat gemiddeld wordt gepresteerd door kinderen met eenzelfde leeftijd of van eenzelfde leerjaar, zonder rekening te houden met gegeven verschillen tussen kinderen (het ligt in de lijn van de WPO het prestaties van kinderen te vergelijken met eerdere vorderingen van hetzelfde kind)
•
er wordt in veel scholen onnodig vaak getoetst, hetgeen ten koste gaat van onderwijstijd
•
de resultaten van toetsen worden vaak aangewend voor oneigenlijke doelen, zoals het vergelijken van de kwaliteit van scholen; de onderwijsinspectie en veel schoolbesturen geven daarbij het slechte voorbeeld
•
wie scholen wil vergelijken moet dat doen met instrumenten die uitsluitend voor dat doel zijn vervaardigd; er zijn tal van redenen om er geheel van af te zien
Dit artikel is verre van volledig, terwijl de beperkte omvang niet aan alle problematiek recht doet. Om die redenen bevelen we lezing van de aangegeven literatuur aan. Uit: JSW, december 2002
8 Literatuur J.Barendse (red.) Toetsen van betekenis?!, Academie voor Ontwikkelingsgericht Onderwijs, Sint Maarten 2000 A.W.Boes (c.s.) Een streep door de eindtoets, toelichting en achtergronden (SOVO), Valthe 2001 L.M.Stevens Overdenken en doen (PMPO) Den Haag 1997