455
Ethiek in (taal)toetsing?' Piet Van Avermaet KULeuven, Centrum voor Taal en Migratie, Blijde Inkomststraat 7, 3000 Leuven, België.
1. Inleiding Mijn interesse voor ethische kwesties in (taal)toetsing is in de eerste plaats van professionele aard. Als medewerker van het Certificaat Nederlands als Vreemde Taal (CNaVT) ben ik betrokken bij de jaarlijkse ontwikkeling van examens Nederlands als vreemde taal. Bij elke stap in het proces van toetsontwikkeling, toetsadministratie, verwerking van gegevens en communicatie met de gebruikers komen ethische aspecten om de hoek kijken. Maar ook het gevaar van unfair gebruik van toetsresultaten is een onderwerp dat frequent terugkomt in de discussies binnen het CNaVT-team. Daarnaast is er een persoonlijke interesse in de ethische aspecten van (taal)toetsing. Als ouder ben ik geïnteresseerd in het doen en laten van mijn kinderen op school. Ik wil graag weten hoe ze zich voelen in de klas- of leefgroep op school. Maar ik wil ook weten hoe het staat met hun vaardigheden en kennis. Kunnen ze mee in de klas? Doen ze het goed? Hoe staat het met hun schoolvorderingen? En zoals elke ouder verhoop je het beste. Je bent fier als het goed gaat. En als het minder goed gaat, zoek je naar argumenten om te verklaren waarom? In die zoektocht stoot je nogal eens op discrepanties tussen wat men op school beoogt te meten en de wijze van operationalisering, op een gebrek aan kwaliteit of eerlijkheid in toetsing of op een problematisch gebruik van toetsen en toetsscores. Ten derde ben ik geïnteresseerd in de ethiek van (taal)toetsing vanuit een breder maatschappelijk perspectief. Toetsen - en meer bepaald certificaten of diploma's die men via een toets kan behalen - hebben steeds hun plaats gehad in de samenleving. Ze kunnen mensen kansen bieden maar ze kunnen ook mensen kansen ontnemen. Een certificaat kan iets zeggen over iemands (taal)vaardigheid die bijvoorbeeld nodig is om een bepaalde job uit te oefenen. Een werkgever heeft er belang bij te weten wie het meest geschikt is voor die functie. Een certificaat, diploma of ander bewijs van verworven vaardigheid of kennis kan helpen om een goede selectie te maken. Maar toetsen worden soms ook ontwikkeld of gebruikt om mensen uit te sluiten, om hen kansen in de maatschappij te ontnemen, om macht uit te oefenen, om normen op te leggen, enz. Zijn de redenen om een (taal)toets te ontwikkelen maatschappelijk, politiek of ideologisch altijd even correct? Is de wijze waarop je je toets ontwikkelt wel adequaat en passend? Is er nagedacht over goed of slecht gebruik van toetsresultaten? In deze bijdrage wil ik op een aantal van de genoemde aspecten ingaan. Ik wil dit zoveel mogelijk doen aan de hand van concrete voorbeelden. Voor ik dieper inga op een aantal van de ethische problemen waar je als `toetsenmaker' 2 mee te maken hebt, wil ik in een eerste paragraaf even stilstaan bij enkele algemene - meer theoretische - aspecten van ethiek en de relatie met (taal)toetsing.
2. Ethiek en (taal)toetsing: een mes dat langs veel meer dan twee kanten snijdt? Een Gordiaanse knoop? Een onmogelijk huwelijk? Of toch noodzakelijk? Een simpele blik in een encyclopedie levert een al even simpele definitie op van het begrip `ethiek'. "Ethiek is de wijsgerige bezinning op het zedelijk leven van de mens. (Grote
456
Winkler Prins Encyclopedie 1980: 357)". Volgens diezelfde encyclopedie heeft "... de ethiek haar oorsprong in de vraag: wat is goed, en wat moet ik doen? (ibid.)". Zoals dat meestal gaat bij complexe concepten is ook hier de vraag zeer snel geformuleerd, maar zijn de antwoorden erop veel minder vanzelfsprekend. Fundamenteel en kritisch nadenken over wat goed en niet goed is, is moeilijk. Los van een bepaalde context kan het echter nog in een zekere vrijheid en van op een zekere afstand gebeuren. Nadenken over ethiek in een professionele context is echter minder vanzelfsprekend, maar daarom niet minder noodzakelijk. Wat zijn de ethische verantwoordelijkheden van leden van een bepaald professioneel domein – in mijn geval dat van taaltoetsing – voor taaltoetsontwikkeling of de consequenties en de nevenwerkingen ervan? Hoe kan ik – met mijn beide voeten diep in de toetsmodder – toch kritisch en van op een zekere afstand nadenken over mijn ethische verantwoordelijkheden? Hoever gaan mijn verantwoordelijkheden? Ik wil hier even dieper ingaan op de laatste twee vragen. Een manier om over professionele ethiek na te denken is uitgaan van wat Bishop (2002: 2) "guidelines for action" noemt: algemene richtlijnen als basis voor ethisch handelen. Maar meteen wijst Bishop (ibid.) zelf op de beperking van dergelijke ethische richtlijnen. Zij geeft het voorbeeld van de Verklaring van de Mensenrechten van de Verenigde Naties. Door hun algemeenheid zijn de VN Mensenrechten zo vaag dat ze nauwelijks afdwingbaar zijn. Ze bieden leden van de VN de mogelijkheid ze toch te onderschrijven en tegelijk bepaalde machtsposities te behouden en zich de facto nauwelijks iets van mensenrechten aan te trekken. Volgens Bishop (ibid.) ontbreekt het dergelijke ethische richtlijnen aan een zekere mate van specificiteit om ze afdwingbaar te maken. Het probleem is echter dat richtlijnen niet anders dan algemeen kunnen zijn. Principes voor ethisch handelen kunnen enkel aspiraties uitdrukken voor ideaal handelen. Want we mogen nooit vergeten dat diegenen die richtlijnen voor ethische handelen opstellen ook mensen zijn, die functioneren in een bepaalde context, die vanuit een eigen ideologisch referentiekader aan de samenleving participeren, die een bepaalde positie in de samenleving innemen. Zij bevinden zich in een uiterste machtige positie wanneer zij de opdracht krijgen of zich toe-eigenen om ethische richtlijnen op te stellen. Hoe concreter die richtlijnen worden, hoe groter het gevaar wordt dat ze in meerdere of mindere mate het referentiekader van de opsteller(s) representeren. Als de richtlijnen door hun toenemende mate van specificiteit meer afdwingbare kracht krijgen, des te machtiger de positie van de opstellers wordt. En des te groter het gevaar, dat de opstellers van de specifieke richtlijnen hun normen opleggen en tot regels, waaraan anderen moeten voldoen, verheffen. Het is goed om hier even te verwijzen naar de steeds voortdurende discussie over cultureel relativisme versus universalisme met betrekking tot ethische principes i . Wellicht wek ik door de in paragraaf één gestelde vragen en wat in de vorige alinea staat over de relatie tussen taal en macht de indruk van het perspectief van het cultureel relativisme te benadrukken. Ik wil hiermee echter niet aangeven dat ik geloof in een puur relativistische benadering van dit probleem. Het lijkt me uiterst moeilijk om tussen het zogenaamde dilemma van relativisme en universalisme een keuze te maken. Davies (2002) stelt in dit verband ook dat het probleem van ethisch universalisme is dat het een legitimering kan zijn voor een machtige cultuur die haar eigen waarden oplegt aan anderen, door een monopolie op de morele waarheid te claimen. Hij betwijfelt echter of daarmee de strijd dan is beslecht in het voordeel van het cultureel relativisme. Volgens hem gaat het hier om een valse tegenstelling. De discussie start inderdaad vanuit een valse paradox. Want de stelling dat ethische principes alleen onderheving zouden moeten zijn aan cultureel relativisme is zelf een universalistische uitspraak. Davies gaat ervan uit dat als ethiek noodzakelijkerwijs steunt op de universele toepasbaarheid van haar principes, dit niet zou mogen impliceren dat iedereen die moet accepteren.
457
Bishop stelt dat richtlijnen voor ethisch handelen eerder "...design documents than blueprints or houses. (Bishop 2002: 7)" zijn. Willen principes voor ethisch handelen toch tot zinvolle acties kunnen leiden, moeten ze op een eerste niveau algemeen blijven. Pas in een tweede fase kunnen ze geconcretiseerd worden. Die concretisering kan enkel gebeuren binnen een specifieke context op basis van alle factoren die in die context van bepalende of beïnvloedende aard kunnen zijn en in communicatie met alle participanten in die context. Gecontextualiseerde specificaties van ethische principes geven ons de mogelijkheid om ons handelen er aan aan te passen, zonder dat die van bovenaf worden opgelegd. Enkel wanneer ze met alle betrokkenen binnen een bepaalde context zijn gespecificeerd, bestaat de kans dat ze niet als opgelegde regels zullen worden gezien. Dat dit een moeilijke denkoefening is, spreekt voor zich. Veelal wordt ze niet gemaakt omdat men een bepaalde positie of toestand wil kunnen behouden of omwille van praktische overwegingen of tijdsdruk. Anderen maken deze denkoefening liever niet omdat ethische principes als utopisch en naïef worden afgedaan. De kans dat dit argument wordt aangehaald om één van de andere te verdoezelen is niet denkbeeldig. Bishop is echter heel duidelijk op dit vlak: "Serious commitment to our professional and ethical ends requires thinking of them from the point of their general formulation through to their implementation in policies and activities in daily life. (Bishop 2002: 7)". Terwijl ik hierboven in ben gegaan op de vraag hoe ik kan nadenken over mijn ethische verantwoordelijkheden om aldus te kunnen handelen, wil ik nu even stilstaan bij de vraag hoever mijn verantwoordelijkheden als toetsontwikkelaar gaan? Shohamy (2001) onderscheidt vijf perspectieven als het om de verantwoordelijkheid van de toetsontwikkelaar in dit proces gaat. • een 'ethisch perspectief': Davies (1997, in Shohamy 2001) definieert een ethisch perspectief van professionele moraliteit als een contract tussen de toetsontwikkelaar, het individu en het publiek. Dit impliceert volgens Davies dat de maatschappelijke consequenties voor de toetsontwikkelaar bij het gebruik van een toets beperkt zijn. Met andere woorden de toetsontwikkelaar kan niet verantwoordelijk worden gesteld voor alle mogelijke gevolgen. • een 'bewustmakingsperspectief': een zienswijze die dicht bij Davies ligt is deze die de verantwoordelijkheid van de toetsontwikkelaar beperkt tot het attenderen op alle aspecten van de toets. • een 'alle consequenties perspectief: Hamps-Lyon (1997, in Shohamy 2001) stelt dat de toetsontwikkelaar de verantwoordelijkheid van alle consequenties moet dragen. • een perspectief van 'sancties opleggen': nog verdergaand dan het vorige perspectief, is de zienswijze die stelt dat niet alleen de verantwoordelijkheid van alle consequenties moet worden gedragen door de toetsontwikkelaar, maar dat die ook sancties moet opleggen in geval van incorrect gebruik. • een perspectief van 'gedeelde verantwoordelijkheid en open communicatie': vanuit haar pleidooi om de machtsverhoudingen met betrekking tot tests te veranderen en beter in balans te brengen, breekt Shohamy (2001) een lans om de verantwoordelijkheden van alle in het toetsproces betrokkenen te delen en dit via open communicatie. Madaus (1990, in Shohamy 2001) pleit ervoor dat meer niet-technici bij het hele proces moeten worden betrokken. De vier eerste perspectieven zijn uiterst interessant, maar ze doen niets aan de bestaande machtsverhoudingen tussen bijvoorbeeld degene die opdracht geeft om een toets te
458
ontwikkelen, de toetsontwikkelaar en/of de toetsgebruiker aan de ene kant en degene die de toets moet afleggen aan de andere kant. Alleen het vijfde perspectief biedt een mogelijkheid om daar iets aan te veranderen. Uiteraard kan ook het vijfde perspectief wat betreft zijn consequenties gevoelig zijn voor de machtsverhoudingen tussen alle betrokkenen. Maar juist omdat het pleit voor open communicatie tussen alle betrokkenen biedt het perspectieven om bepaalde machtsmechanismen bloot te leggen, om de verhoudingen ter discussie te stellen en om alle consequenties van keuzes in het toetsproces te bespreken. Als we in het derde perspectief het begrip 'toetsontwikkelaar' zouden vervangen door 'toetsenmaker', dan zou een combinatie van het vijfde en derde perspectief aantrekkelijk zijn. In de volgende paragrafen wil ik de voorbeelden die ik ga bespreken onder andere ophangen aan het probleem van het niet in balans zijn van bepaalde machtsverhoudingen, het gebrek aan open communicatie en de gevolgen daarvan bij het gebruik van toetsen. In paragraaf drie wil ik dit ophangen aan zogenaamde 'low stake'-examens: toetservaringen van mijn kinderen op school. In paragraaf vier wil ik dieper ingaan op voorbeelden van 'high stake'-examens: al of niet gestandaardiseerde tests waarvan het maatschappelijk, politiek, educatief of professioneel belang hoog is.
3. De verongelijkte vader? Mijn dochter Renee zit in klas drie van de basisschool (groep 5 in Nederland). Een tijdje terug kwam ze naar huis met een rekentaak als huiswerk. Het ging om een spinnenwebtaak. Je weet wel, in het midden van het web staat een getal. Aan het uiteinde van elke draad staat ook een getal. Beide getallen zijn verbonden met een pijl. De opdracht luidde: vul de bewerking op de pijl in. en tussen haakjes stond (+, -, X, :). Renee noteerde bij elke pijl correct een +, -, X of : . Ik had nog een korte discussie met haar of er niet meer (een cijfer) diende ingevuld te worden. Samen beslisten we, na herlezing van de opdrachtzin, om het bij de bewerking te laten. Groot was onze beider verbazing toen Renee het huiswerk terugkreeg met de mededeling: 'huiswerk maar half gemaakt.' Daar stond het, in opvallende rode inkt. Renee voelde zich niet correct behandeld. Ze voelde zich tekortgedaan. Nu is Renee het type - zoals vele kinderen - dat wel tegen een stootje kan. En dit incident is verre van dramatisch. Maar ze zijn symptomatisch voor het soms te ondoordacht omgaan met of reageren op toetsof huistaakresultaten door leerkrachten die toetsen of taken maken/geven/corrigeren: kan het zijn dat mijn opdracht niet duidelijk was? Wat zou het kind vinden van zo'n opmerking in rood? Zou er van die percepties iets kunnen blijven hangen later? Wat de twee laatste vragen betreft, niet veel -zoals ik zonet al zei. Renee voegde aan de bewerkingen de bijhorende getallen toe en ging daarna verder spelen. Maar zo onschuldig blijft het niet altijd. De gevolgen van een slechte score op een test (of huistaak) kunnen groot zijn. Shohamy (2001) geeft het voorbeeld van een drugsverslaafde die vertelt dat hij in die toestand was terecht gekomen - nadat hij een gestandaardiseerde test in groep 7 zeer slecht had gemaakt - omdat zijn vader (een universiteitsprofessor) zo ontgoocheld was dat hij zijn zoon vanaf dat moment begon te negeren en af te wijzen. Of dit verhaal klopt of niet is voor Shohamy van ondergeschikt belang. Het geeft wel aan dat percepties van personen - zelfs op basis van één slechte ervaring - het begin van een proces kunnen zijn, dat dramatische gevolgen kan hebben. In dit voorbeeld moet uiteraard worden aangestipt dat niet alleen de test maar ook de vader voor een deel verantwoordelijk kan worden geacht voor de toestand waarin de drugverslaafde was terechtgekomen. Brecht, onze zoon, zit in de eerste klas van het secundair onderwijs (voortgezet onderwijs in Nederland). Hij had al twee jaar Frans achter de rug in de basisschool. Maar nu
459
zou hij voor het eerst Engels krijgen. Hij keek er reikhalzend naar uit. Na een vakantie in Zuid-Afrika vorig jaar en een twee weken durend verblijf van een Engelstalige vriendin (en collega) bij ons thuis, had hij een goed gevoel over zijn Engels. Een gevoel dat uiteraard wordt versterkt door het dagdagelijkse aanbod Engels via TV, muziek en reclame. Hij vond dat hij aardig overweg kon met Engels. En inderdaad, het was leuk te merken hoe vlot een gesprek verliep tussen onze Engelstalige vriendin en Brecht. Groot was zijn ontgoocheling na één week Engels op school. De leerlingen hadden een eerste les gekregen over 'voorwerpen in de klas'. De tweede les (een week later) hadden de leerlingen een 'onaangekondigde toets'. De leerkracht schreef tien woorden die verwezen naar concepten in de klas in het Nederlands op bord. De kinderen moesten het Engelse woord op een blad noteren. De score van Brecht en nog andere leerlingen: 0 op 10 en de opmerking 'volgende keer les leren'. Zijn zelfbeeld en zijn goed gevoel over zijn vaardigheid Engels hadden een enorme deuk gekregen. Uitspraken als "zie je wel dat ik er toch niets van bak" en "ik ben helemaal niet goed in Engels" staken de kop op. Met als gevolg dat zijn motivatie was gezakt tot onder het vriespunt. Nu kan ook Brecht wel tegen een stootje en is hij er ondertussen al lang overheen. Maar ik ben er wel van overtuigd dat zijn beeld over talen en talen leren na dat 'onschuldig' incident niet meer samenvalt met het op een functionele of leuke manier kunnen gebruiken van een taal in de werkelijkheid (de wereld waarin hij functioneert), maar alles met het van buiten leren van woordjes. Shohamy (2002) stelt dat tests een educatief en cognitief effect hebben. De test van Engels van Brecht heeft invloed op de wijze waarop hij naar kennis en het verwerken van kennis kijkt. Door de wijze van meten, door het niet aankondigen van de toets, door het niet gecommuniceerde doel en door het geven van droge punten met ongenuanceerde opmerkingen, wordt geen rekening gehouden met de motivatie van leerlingen, met de leerlingen zelf, met zijn buitenschoolse taalervaringen. Verhoeven et al. (2002) stellen dat puntentoetsen vaak worden gebruikt voor dingen waarvoor ze niet geschikt zijn. De tien voorwerpen uit de klas vertalen van het Nederlands naar het Engels is daar een voorbeeld van. Als ze die uit het hoofd hebben geleerd, halen ze tien op tien. Als ze die niet hebben geleerd nul op tien. Maar het zegt niet hoe taalvaardig ze zijn in het Engels. Nog een voorbeeld van Brecht. Tijdens de eerste schoolweek dit schooljaar was er een informatieavond voor de ouders. Met interesse luisterden we naar de enthousiaste uiteenzetting van de leerkracht Nederlands over de nieuwe eindtermen Nederlands voor het secundair onderwijs in Vlaanderen. "Het gaat bij Nederlands niet meer om de kennis van de taal - zoals vroeger - maar om het vaardig zijn in de taal" was de zin van de leerkracht die mij als muziek in de oren klonk. Groot was mijn verbazing toen ik een paar dagen later een toets Nederlands van Brecht onder ogen kreeg. De toets bestond uit drie onderdelen: open en gesloten lettergrepen, hoofdletters en interpunctie. De muziek in mijn oren verstomde bij het aanschouwen van de toets. Volgens Shohamy (persoonlijke communicatie) hebben eindtermen of curricula nauwelijks invloed op de onderwijsdidactiek. Tests daarentegen zijn een veel krachtiger instrument om veranderingen in het onderwijs te realiseren. Zolang men tests blijft gebruiken die samenhangen met traditionele manieren van taallesgeven zal het effect van eindtermen uiterst gering zijn. Tests zijn machtige instrumenten in de handen van leerkrachten. Ze bepalen het klasbeleid van een leerkracht en ze kunnen daarmee percepties bij leerlingen bestendigen of wijzingen. Tests zijn geen vacuum in de klas. Ze zijn ingebed in het heel onderwijssysteem en hebben er een enorme impact op. Deze drie voorbeelden geven aan dat er iets grondig fout is wat betreft de machtsverhoudingen tussen de verschillende actoren: leerkracht, school, leerling en ouder. De leerkracht test in de eerste plaats om punten te kunnen geven. Tests zijn toevallige momentopnames. Het zijn machtige instrumenten die een valse sfeer van objectiviteit oproepen. Maar ze beïnvloeden zeer sterk wat een leerling zal leren, hoe hij zal leren. Ze
460
hebben ook een verpletterend effect op ouders. Voor ouders zijn toetsen en punten heilig. Ouders verwachten dat er tests worden afgenomen. Ze verwachten punten. Andere, meer procesmatige, meetinstrumenten worden niet als 'vol', als 'echt' beschouwd. En dit heeft tot gevolg dat leerkrachten zich achter ouders kunnen wegsteken en tests blijven afnemen. De drie voorbeelden van Brecht en Renee geven ook aan dat in het onderwijs in de eerste plaats wordt getoetst om te beoordelen (Verhoeven et al. 2002). De voorbeelden van mijn kinderen hebben geen dramatische gevolgen. Het gebeurt elke dag duizenden keren bij duizenden kinderen. Ieder van jullie kent zulke voorbeelden. Maar ze zeggen wel iets over het onzorgvuldig omgaan met toetsen en toetsresultaten en onvoldoende stilstaan bij de verantwoordelijkheden van de leerkracht en school als toetsontwikkelaar en/of toetsafnemer. Terecht stelt Shohamy (2001) dat we meer uit deze feiten moeten leren, dat we meer naar de stem van de toetsgebruiker moeten luisteren, dat er meer moet worden gecommuniceerd tussen alle betrokken in het proces van diagnose stellen of evalueren. Tot slot van deze paragraaf wil ik jullie een gedicht van McGahern (1977) - geciteerd in Shohamy (2001: 7) - niet onthouden. Please God may I not fail Please God may I get over sixty per cent Please God may 1 get a high place Please God may all those likely to beat me get killed in road accidents and may they die roaring.
Overdreven, bij de haren getrokken. Misschien wel. Maar mijn dochter - en voor zover ik uit mijn directe omgeving begrijp is zij geen uitzondering - vertrekt toch geregeld naar school met uitlatingen als "ik hoop dat ik het beter zal doen dan Mara" of "shit, Jill had meer punten dan ik". Het gedicht en de wijze waarop kinderen naar toetsen kijken, geeft aan welke centrale plaats ze in ons leven innemen, hoe bepalend in positieve of negatieve zin ze kunnen zijn, hoe ze machtverhoudingen bestendigen of versterken, hoezeer ze scherprechter over iemands toekomst kunnen zijn. Hier spreekt niet de verongelijkte vader - ook al is hij dat diep van binnen wel een beetje zal u denken - maar een bezorgde ouder en toetsontwikkelaar. Dit is tevens geen pleidooi tegen klastesten en voor gestandaardiseerde testen. Want de hierboven geschetste mechanismen en gevaren zijn volgens mij minstens evenzeer aanwezig bij centrale gestandaardiseerde testen - maar misschien subversiever en nog minder ter discussie te stellen omwille van het valse gevoel van objectiviteit dat ze uitstralen. Het wijst op de nood aan professionalisering van leerkrachten op dit terrein. Een professionalisering die ook verder gaat dan een betrouwbare of valide test ontwikkelen, die stilstaat bij gevaren van tests, gevolgen en blijvende negatieve percepties bij leerlingen en een professionalisering die meer vanuit een perspectief van gedeelde verantwoordelijkheid en in een open communicatieklimaat naar ontwikkeling, gebruik en gevolgen van meetinstrumenten kijkt . 4. Wat met de guillotine? 4.1 Moeten we altijd meten om te weten? We kunnen er niet omheen. In Nederland en in Vlaanderen wint het adagium "meten is weten" meer en meer veld. Nederland heeft al een lange traditie van centrale gestandaardiseerde toetsontwikkeling. Verdere ontwikkelingen op dit terrein nemen op dit
461
moment snel toe in Nederland. Vlaanderen heeft geen traditie op dit vlak. Maar de laatste jaren nemen de discussies over gestandaardiseerde toetsen toe. De roep om meer 'objectieve' meetinstrumenten wordt steeds luider. Er is de inburgeringstoets in Nederland, de recente taaltoetsen voor nationaliteitsverwerving in een aantal Europese landen, de discussie over een inburgerings- en nationaliteitstoets in Vlaanderen, de voorstellen van het demissionaire kabinet in Nederland waarbij wordt afgestapt van het toekennen van extra middelen voor onderwijs op basis van het aantal leerlingen met een kwetsbare sociaal-culturele achtergrond en wordt overgegaan op een systeem waarbij men systematisch de taalvaardigheid van alle kinderen van zes, negen en twaalf jaar wil testen, de studievaardigheidstest COVAAR in Vlaanderen, de TOBA en TIBO in Vlaanderen, enz. Met deze "boom" aan (taal)toetsen is op het eerste gezicht niets mis. Het is logisch dat we willen weten hoe het met de vorderingen van mensen staat, dat we diagnoses kunnen stellen of evaluaties kunnen maken, dat we mensen kunnen doorverwijzen naar vervolgopleidingen, dat mensen zelf een beeld krijgen van hun verworven (taal)vaardigheden, enz. De vraag is echter of daar altijd toetsen – in hun traditionele betekenis – voor nodig zijn. Is een taaltoets het meest aangewezen instrument om de taalvaardigheid van kleuters in kaart te brengen? Zijn goede procesgerichte observatieinstrumenten niet meer aangewezen? Zijn centraal ontwikkelde taaltoetsen om de taalvaardigheid van kinderen op geregelde tijdstippen te meten (zie nieuwe beleidsoptie in Nederland) wel de beste keuze? Wat zijn de consequenties voor scholen? Kunnen zij gestraft of beloond worden? Wat zijn de gevolgen voor de leerlingen en de schoolpolitiek? Wat is de verborgen agenda van de overheid achter dergelijke nieuwe ontwikkelingen? Als alles en iedereen op school en in de klas moet/kan getest worden met gestandaardiseerde tests, hoe groot wordt de impact van tests dan op het pedagogisch/didactisch klimaat? Biedt toetsontwikkeling op klasniveau waarbij rekening kan worden gehouden met variatie in sociale, culturele en talige contexten, meer garanties? Anderzijds, zal er aan de negatieve toetseffecten iets veranderen als op klasniveau ontwikkelde toetsen worden gebruikt in een niet gewijzigde verhouding tussen leerkracht en leerling? Zijn 'self-assessment' en 'peerassessment' instrumenten soms niet meer aangewezen in (taal)onderwijs aan volwassenen dan traditionele toetsen die vaak onethisch worden gebruikt en bewust of onbewust als "gatekeeper" worden gebruikt? Een ander belangrijk punt – naast de vraag of we wel altijd toetsen nodig hebben om te ` weten' – is het gebruik van toetsen en de al dan niet democratische op ontwikkeling van het individu gerichte onderwijs- en toetspraktijk. Zonder een verandering van deze context, zullen de gevolgen van toetsen (zowel gestandaardiseerde als toetsen ontwikkeld op klasniveau) niet veranderen. Denk maar aan de voorbeelden uit paragraaf drie. 4.2 De verleiding van de 'objectieve' toets? Om het onderscheid te maken tussen hoog- en laaggeschoolde potentiële NT2-leerders in Vlaanderen is een paar jaar terug een studievaardigheidstoets (COVAAR) ontwikkeld. Ik wil hier niet ingaan op de kwaliteit van de toets op zich of op het gebruik en de gevolgen. Ook al is daar veel op aan te merken. Ik wil hier dieper ingaan op de wijze waarop deze toets tot stand is gekomen en de argumenten waarom hij werd ontwikkeld. Na de eerste ronde tafelconferentie (RTC) van 1993 over NT2 in Vlaanderen hadden de Centra voor Basiseducatie (CBE) en de Centra voor Volwassenenonderwijs (CVO) afgesproken dat CBE het aanbod NT2 voor laaggeschoolden en CVO het aanbod voor hogergeschoolde anderstaligen zouden verzorgen. Om de afspraken over het verdelen van de "markt" enigszins hard te maken werd een omschrijving van de doelgroepen in termen van genoten scholingsgraad (o.a. in herkomstland) gehanteerd. Na enkele jaren bleek die omschrijving
462
volgens beide "spelers op de markt" niet echt te voldoen. Er waren nog geregeld discussies of een bepaalde NT2-cursist nu al of niet in de CBE of de CVO hoorde. Nu is het ontegensprekelijk zo dat elke cursist de kans moet krijgen om het juiste traject te volgen, om een opleiding te volgen die aansluit bij zijn behoeften, zijn educatieve achtergrond, maar ook bij zijn persoonlijke preferenties. Voor heel wat cursisten is een juiste oriëntering niet zo'n moeilijke oefening. De ervaring leert echter dat er heel wat cursisten zijn die als "grensgeval" kunnen worden beschouwd. Zouden ze nu best een cursus in de CBE of de CVO volgen? De omschrijving van de genoten opleiding geeft geen uitsluitsel of de trajectbegeleider of docent is niet zeker van de waarde van de door de cursist opgegeven opleidingsachtergrond. In dergelijke gevallen zie je dat de belangen van de instellingen nogal eens durven voorgaan op die van de cursisten. Door de, ten onrechte, soms concurrentiële positie waarin CBE en CVO zich door de jaren heen hebben weten te manoeuvreren, zoeken beide instellingen soms naar argumenten om de cursist toch binnen de eigen instelling te houden. De eerlijkheid gebied me hier te zeggen dat er regio's zijn in Vlaanderen waar beide instellingen trachten via regelmatig overleg op een constructieve wijze te bepalen waar een cursist "thuishoort". Een paar jaar geleden werd beslist om een toets te ontwikkelen die de studievaardigheid van cursisten zou meten. Die toets zou veel objectiever zijn en de tot ambiguïteit leidende oude afspraak kunnen vervangen. Dit werd de "Cognitieve Vaardigheden toets" (COVAAR). Deze toets beoogt te meten hoe snel en gemakkelijk iemand in staat is om te leren om zo op een meer "objectieve" manier te kunnen bepalen of een cursist in CBE of CVO "thuishoort". Om die zogenaamde "objectiviteit" was het de betrokken instellingen en de overheid te doen. De COVAAR zou gezien worden als een objectief en fair instrument en aan die zogenaamde "objectiviteit" zou het zijn gezag ontlenen. Instellingen zouden niet meer moeten onderhandelen of "ruziën" over een cursist. De test zou dit oplossen. De vraag is echter of een instrument als de COVAAR wel zo objectief is? Kan die test de motivatie en/of de attitude van een cursist meten? Nochtans twee uiterst belangrijke aspecten in leren in het algemeen en taalleren in het bijzonder. Kan een test wel het epitheton 'objectief claimen? Is een test niet altijd een representatie van een door mensen bepaalde interpretatie van wat in dit geval het concept 'studievaardigheid' betekent? Is een test niet altijd een reflectie van opinies of ideeën van diegenen die opdracht geven tot het maken van zo'n test over onderwijs en/of de samenleving? Maar nog belangrijker is de vraag of een dergelijke test die een zweem van objectiviteit wil uitstralen niet eerder bedrieglijk en misleidend is en wegfocust van de werkelijkheid en de cursist achter zo'n test? Spolsky (1998: 9, in Shohamy 2001) is daarover zeer duidelijk. Hij heeft het over het testen van taalvaardigheid: "purely objective language testing appears to have failed, for while it measures something reliably, the something is measured was not the language proficiency that was assumed. The improvements that objectivity brought seem than to have been illusory." Dezelfde bedenking kunnen we maken met betrekking tot tests als de COVAAR. Bovendien kan men zich de vraag stellen of deze "objectieve" toets niet eerder een instrument is - wellicht onbewust en onbedoeld - om discussies tussen aanbodverstrekkers te beslechten dan om cursisten optimale kansen te geven in hun NT2-opleiding. De metafoor die vaak wordt gehanteerd bij de keuze tussen een weinig betrouwbaar of onvoldoende objectief instrument of een betrouwbare en objectieve gestandaardiseerde test is die van de guillotine: beter een scherp mes dan een bot mes. Het slachtoffer zal minder lijden. De vraag is echter of het zinvol is om een guillotine - hoe scherp het mes ook moge zijn - te ontwikkelen. In plaats van een COVAAR - die niet meer is dan een kort, eenmalig en eenzijdig instrument - lijkt het me meer aangewezen om in functie van goede trajectbegeleiding of oriëntering van cursisten te kiezen voor een bredere waaier van meetinstrumenten, voor een meer dynamisch assessment systeem. Waarom niet een
463
heterogene groep cursisten bij het eerste onthaal gedurende een periode (bijv. een week) les geven? Tijdens die lesweek kunnen de cursisten worden geobserveerd door de docent. Ze kunnen worden geïnterviewd. Ze kunnen zichzelf inschatten en vragenlijsten invullen. Er kunnen tests worden afgenomen. Er kan werk worden gemaakt van het invullen van een (taal)portfolio. Een meer dynamische en gevarieerde vorm van meten - waarbij alle participanten (dus ook cursisten zelf) worden betrokken - zal een genuanceerder beeld geven en leiden tot betere trajectbegeleiding. En de machtige rol van een 'objectieve test' wordt zo wat teruggedrongen. 4.3 Zijn tests machtige instrumenten in de handen van beleidsmakers? De vraag of het ontwikkelen van een toets en zo 'a welke vorm) aangewezen is, wordt nog grote maatschappetkluijn-epohb.mWac belangrijker als die toets een denken hierbij aan taaltoetsen in het kader van een "inburgeringsprogramma" of taaltoetsen bij "nationaliteitsprocedures". De laatste tijd zijn discussies in Nederland, Vlaanderen en de ons omringende landen over de multilinguale en multiculturele samenleving niet uit het nieuws weg te branden. Veelal wordt die discussie over de "participatie van verschillende etnische, sociale en culturele groepen in de samenleving" verengd tot een discussie over de "inburgering van leden van de minderheidsgroep in de samenleving van de meerderheidsgroep". Een discussie die onder andere door het gebruik van ongelukkige woorden als 'inburgering' het discours van 'zij' versus 'wij' alleen maar versterkt. Een maatschappelijk-politieke discussie die ook invloed heeft op de procedures voor `nationaliteitsverwerving'. Het volgen van een inburgeringsprogramma is in Nederland al een paar jaar verplicht en aan het programma is een (taal)toets verbonden. In Vlaanderen woedt de discussie over het al of niet verplichten van inburgeringsprogramma's, over mogelijke (financiële) sanctionering bij weigering tot deelname, over de ontwikkeling van een bijhorende taaltoets nog volop. Ik wil hier niet dieper ingaan op de discussie over de organisatie en de verplichting van inburgeringsprogramma's. Wel wil ik mijn daarnet geuite bezorgdheid over de gevaren van een discours van 'wij' en 'zij' nog eens beklemtonen. Het gebruik van begrippen als 'inburgering', 'verplicht',, 'sanctioneren' en het huidige discours over samenleven in een de facto multiculturele en multilinguale maatschappij, dreigen zowel bij leden van de meerderheidsgroep als van de minderheidsgroep percepties over etniciteit, monolingualiteit en monoculturaliteit te versterken. Als op het attitudinele niveau mensen geneigd zijn om taal en etniciteit sterk aan elkaar te verbinden dan zullen verplichte taalcursussen Nederlands dergelijke percepties zowel bij leden van de meerderheidsgroep (voor het Nederlands), maar ook bij leden van de minderheidsgroep (voor de eigen taal) alleen maar versterken. Machtige instrumenten als toetsen, die willen meten of iemand voldoende is ingeburgerd of voldoende taalvaardig is om de Belgische of Nederlandse nationaliteit te verwerven, dreigen dergelijke percepties nog verder te versterken. Het gevaar van een toenemende polarisering tussen meerderheid en minderheid en een verdere stigmatisering van die laatste is dan groot. Het monolinguale denken wordt bevestigd en versterkt. Bovendien moeten we er ons ook voldoende van bewust zijn dat het huidige discours waaraan we als toetsontwikkelaar, materiaalontwikkelaar of aanbodverstrekker van NT2opleidingen deelnemen - in een op dit moment in Europa overwegend conservatief politiek klimaat wordt gevoerd. Is het in dit maatschappelijk-politiek klimaat en binnen een discours van 'zij' en 'wij' verdedigbaar om taaltoetsen te ontwikkelen, te gebruiken of - zoals in Vlaanderen - te pleiten voor het gebruik van taaltoetsen bij 'verplichte' inburgeringsprogramma's of naturalisatieprocedures? Moeten we binnen het huidige discours
464
toetsen ontwikkelen waarvan we weten dat ze kunnen worden gebruikt om een bepaalde migratiepolitiek vorm te geven, toetsen die tot exclusie kunnen leiden? Het ontwikkelen en gebruiken van taaltests wordt door de overheid en verdedigers ervan gezien als een objectief en eerlijk instrument om te kijken of iemand voldoende Nederlands kent om in Vlaanderen of Nederland te kunnen leven of om de Belgische of Nederlands nationaliteit te kunnen krijgen. Een taaltest wordt beschouwd als het logische gevolg van een verplicht inburgeringsprogramma. Het wordt beschouwd als een kwalitatieve service naar de betrokkenen. Maar zoals ik al een paar zei, tests zijn machtige instrumenten en we moeten ons bewust zijn van de maatschappelijke consequenties van het gebruik van tests. Test zijn volgens Shohamy (2002) geen objectieve op zichzelf staande gebeurtenissen. Ze zijn altijd ingebed in de samenleving en kunnen derhalve die samenleving sterk beïnvloeden. Ze kunnen, zoals ik zonet zei, worden gebruikt als een instrument om een assimilatiepolitiek te realiseren of om immigranten zoveel mogelijk buiten onze grenzen te houden. Maar tegelijkertijd worden de beslissing om een test te ontwikkelen (bijv. bij verplichte inburgeringsprogramma's of naturalisatieprocedures), de inhoud van een test, het niveau van taalvaardigheid dat wordt gemeten en het gebruik ervan op hun beurt beïnvloed door sociale machtsmechanismen. Tests zijn niet neutraal (Shohamy 2002). Ze hebben altijd verborgen agenda's. West-Europa is bang overspoeld te worden met immigranten en is een gevoel van onveiligheid aangepraat. De oude negentiende-eeuwse ideeën van één staat, één identiteit en één taal blijken paradoxaal genoeg sterker te worden in een zich steeds verder globaliserende wereld en een wereld waarin steeds meer mensen met gemak Engels gebruiken. Hoe meer Europa één wordt en mensen verschillende talen gaan gebruiken en met verschillende culturen in contact komen, hoe sterker de monoculturele en monolinguale houding lijkt te worden ten aanzien van etnische minderheidsgroepen en immigranten. Sommige overheden spelen in op die angsten of willen daar iets aan doen. In het discours voor verplichte inburgering en bijhorende taaltests in Vlaanderen en de dreigende verstrenging in België van de naturalisatieprocedure (o.a. een voorstel van Belgische parketmagistraten om een taaltest toe te voegen) stelt de politiek het welzijn en de volwaardige kans tot participatie van de leden van etnische minderheidsgroepen centraal. We mogen echter niet vergeten dat verplichte inburgering en een bijhorende taaltest ook beleidsinstrumenten zijn voor een politiek-maatschappelijk en electoraal discours naar de meerderheid. Tests kunnen dus worden gebruikt als instrumenten van beleidsmakers. Door hun objectieve aureool kunnen ze functioneren als afleiders van een bepaalde politieke agenda. Shohamy (2001) zegt dat tests veelal worden gemaakt door instituten met een hoge status en die veel macht uitstralen. De status van tests wordt nog versterkt omdat de – nagenoeg onaantastbare - taal van de wetenschap en de taal van cijfers en getallen wordt gebruikt. Daardoor wordt een test, het gebruik ervan of een score van gebruikers nauwelijks ter discussie gesteld. Door de uitstraling van objectiviteit zijn tests en alles wat er bij hoort als het ware in steen gebeiteld. Daardoor is er zo goed als geen onderhandelingsruimte over wat er achter de test zit, over wie opdracht heeft gegeven om de test te ontwikkelen, over wie de test heeft ontwikkeld en waarom de test is ontwikkeld, over de negatieve gevolgen van het gebruik van de test. Volgens Shohamy (persoonlijke communicatie) berokkenen tests vaak – gewild of ongewild - veel schade. Taaltests bij een procedure van nationaliteitsverwerving of bij een verplicht inburgeringsprogramma kunnen vaak tot exclusie leiden. Ze kunnen zelfs bewust worden gebruikt als exclusie-instrument. Dit ontkennen zou uiterst naïef zijn. McNamara (2002) geeft eén aantal interessante voorbeelden van taaltests die in het verleden werden
465
gebruikt om de identiteit van individuen te verifiëren, om mensen buiten te sluiten of in functie van sociale competitie. Uit een kleinschalig onderzoek van Gysen, Rbeling en Van Berlo (2002) naar procedures voor nationaliteitsverwerving in Europese landen blijkt dat landen met strengere voorwaarden meestal ook een taaltest hebben in hun naturalisatieprocedure. Ik zei reeds dat tests percepties kunnen versterken. Een test bij een verplicht inburgeringsprogramma of als onderdeel voor een naturalisatieprocedure versterkt de perceptie zowel bij leden van de meerderheidsgroep als leden van een minderheidsgroep dat Nederlands de enige taal is die telt. Dergelijke tests beïnvloeden de identiteit van mensen. Ze geven signalen dat wie de test doet en er op slaagt bij de groep hoort. Wie geen inburgeringsprogramma en test wil doen wordt beschouwd als iemand die niet tot de meerderheidsgroep wil behoren, die zich niet wil identificeren met de meerderheidsgroep. In de discussie over het al of niet verplichten van een inburgeringsprogramma en het ontwikkelen van een test in dat kader of als onderdeel van een naturalisatieprocedure worden steeds drie argumenten aangehaald die pleiten voor ontwikkeling en afname van taaltests. De eerste twee zijn pragmatisch: het zou de kwaliteit ten goede komen en het is een hefboom voor NT2-verstrekkers om meer geld van de overheid te krijgen. De vraag is of dit eerste argument opweegt tegen de hierboven geschetste gevaren. En van het tweede zou je je kunnen afvragen of dat niet aan de rand van het perverse grenst. Als derde argument om toch maar een test voor inburgering of naturalisatie te ontwikkelen wordt vaak gezegd dat als 'wij' het niet doen 'anderen' het wel zullen doen en dat de kwaliteit dan wel eens slechter zou kunnen zijn. Los van het hoge pretentiegehalte, doet dit argument – net zoals bij de COVAAR – denken aan de guillotinemetafoor: liever een scherp dan een bot mes. Maar ook hier moet de eerste vraag zijn of taaltests in dit geval wel wenselijk zijn? En daarnaast moet grondiger worden stilgestaan bij de wijze waarop beslissingen over het al of niet ontwikkelen van taaltests in dit kader tot stand komen.
5. Conclusie Tot slot enkele korte overwegingen. Vanuit de vaststelling dat in een sociaal-politiek veranderend Europa het adagium 'meten is weten' en 'alles moet meetbaar zijn' meer en meer veld wint, wil ik aan allen die betrokken zijn bij het proces van toetsing een oproep doen om werk te maken van een ethische code. EengdrascoizlBhp(20) suggereert in twee fasen zou kunnen worden opgesteld. Een eerste fase met algemene richtlijnen en een tweede fase met meer specifieke maar gecontextualiseerde principes. Verder vind ik dat iedereen die betrokken is bij het proces van toetsing zich in alle fasen van dat proces be moet zijn van de macht van toetsen, van de verborgen agenda's achter toetsen, van d impact an het gebruik van toetsen op sociaal, educatief, politiek en economisch vlak (Sho amy 2002), van het feit dat toetsen nooit objectieve, neutrale instrumenten kunnen zijn die in een vacuum bestaan. Maar dat ze ingebed zijn in de samenleving en er derhalve invloed op hebben en er door worden beïnvloed. Ik wil ook leiten voor het verder zetten en intensifiëren van het gebruik van andere vormen van assessment . Ik denk hierbij aan meervoudige assessment procedures: taalportfolio, self-assessment, peer-assessment, observaties, vragenlijsten, tests, enz. In dit verband wil ik ook een lans breken om aspecten van diagnose en evaluatie, de ontwikkeling en het gebruik van tests, de interpretatie van scores, enz. veel meer te onderhandelen met alle participanten in het toetsingsproces. Daarom ben ik voorstander van de ontwikkeling van een
466
soort 'toetsen expertise bank' die tot doel heeft om docenten op alle niveau van het onderwijs te professionaliseren als evaluator. In het kader van taaltests voor verplichte inburgering en procedures voor nationaliteitsverwerving mag niet worden geredeneerd in termen van de guillotinemetafoor. Over doel, ontwikkeling en gebruik van dergelijke 'high-stake tests' moet worden onderhandeld met alle participanten. Maar in de eerste plaats moet van bij het prille begin en doorheen het hele proces met de overheid worden gediscussieerd over de (on)zin, het niveau, de inhoud, de gevaren, de impact en de effecten van dergelijke tests. Vanuit een sociaalethisch perspectief kunnen we onszelf niet als 'louter uitvoerders' langs de zijlijn plaatsen. We hebben als toetsontwikkelaars - maar als toetsenmakers in het algemeen - een maatschappelijke en educatieve verantwoordelijkheid. Noten !
Ik wil Henk Kuyper van CITO bedanken voor zijn zeer constructieve hulp en feedback op een eerste versie van dit artikel. 2 Ik maak hier onderscheid tussen de begrippen `toetsenmaker', 'toetsontwikkelaar', 'toetsafnemer' en 'toetsgebruiker'. De eerste term wordt hier in zijn breedst mogelijke betekenis gedefinieerd: eenieder die in het proces van toetsing een rol heeft. Toetsontwikkelaar verwijst naar het individu of de instelling die de toets ontwikkelt. Toetsafnemer is degene die de toets bij een kandidaat afneemt. In veel gevallen kan iemand zowel twee als drie zijn. Toetsgebruiker is het individu dat een toets aflegt. 3 1k ben Henk Kuyper zeer erkentelijk om mij op dit punt attent te maken.
Literatuurlijst Bishop, S. (2002), Thinking about a Professional Ethics, in conferentiebundel van Language Assessment Ethics Conference. Los Angeles, California State University. Davies, A. (1997), Demands of being professional in language testing, Language Testing 14 (3): 328339. Davies, A. (2002), Language testing and the golden rule, in conferentiebundel van Language Assessment Ethics Conference. Los Angeles, California State University. Grote Winkler Prins (1980), Encyclopedie in 25 delen. Achtste druk. Deel 8. Amsterdam, Brussel: Elsevier. Gysen, S., H. Rbeling & H. van Berlo (2002), Language testing and Citizenship. Presentatie op 25ste ALTE-conferentie. Salamanca: intern document. Hamp-Lyons, L. (1997), Washback, impact and validity: Ethical concerns, Language Testing 14 (3): 295-303. Madaus, G. (1990), Testing as a Social Technology. The Inaugural Annual Boise Lecture on Education and Public Policy, Boston: Boston College. McGahern, J. (1977), The Dark, New York: Quartet. McNamara, T. (2002), Insider, Outsider: Language Tests as Weapons in Intergroup Conflict, in conferentiebundel van Language Assessment Ethics Conference. Los Angeles, California State University. Ronde Tafel Conferentie Nederlands als Tweede Taal (1993), Rapport van de eerste RTC NT2 in Vlaanderen, Brussel. Shohamy, E. (2001), The Power of Tests. A critical perspective on the uses of language tests, London: Longman. Shohamy, E. (2002), Impact of Tests and the ALTE Code of Practice. Presentatie en workshop op 25ste ALTE-conferentie. Salamanca: intern document.
467
Spolsky, B. (1998), What is the user's perspective in language testing? Paper presented at the National Colloquium, The State of the Art in Language Testing: The Users' Perspective, Foreign Language Center, The John Hopkins University, Washington DC, 15 June. Verhoeven, J. e. a. (2002), Evalueren in Vlaamse secundaire scholen, een onderzoek bij leraren en directeurs, Leuven: Garant.