Studie naar de wenselijkheid en haalbaarheid van de invoering van centrale taaltoetsen in Vlaanderen in functie van gelijke onderwijskansen
Marleen Colpin Sara Gysen Koen Jaspaert Robin Heymans Kris Van den Branden Machteld Verhelst
Centrum voor Taal en Onderwijs, K.U.Leuven, 2006
Inhoudstafel Inleiding Onderzoeksmethode Opbouw van het rapport
1 2 2
1 Hoofdstuk 1: Probleemverkenningen
4
1.1 Probleemverkenning 1: De relatie tussen taalkenmerken en schoolsucces
4
1.1.1 Maatschappelijke achterstand en onderwijs Onderwijs, emancipatie en achterstandsbestrijding Kansenongelijkheid in het Vlaamse onderwijs
4 4 5
1.1.2 De rol van taal bij het tot stand komen van effectief onderwijs Taal als oorzakelijke factor voor maatschappelijke achterstand Taal als oorzakelijke factor voor schoolse achterstand Taalachterstand: het verschil tussen thuistaal en schooltaal
8 8 8 9
1.1.3. Schoolse taalvaardigheid en onderwijssucces
13
1.2 Probleemverkenning 2: De relatie tussen (schoolse) taalvaardigheid en taaltoetsen
14
1.2.1 Validiteit Constructvaliditeit en inhoudsvaliditeit Face validiteit en backwash-effect Concurrente validiteit Valse positieven – valse negatieven Predictieve validiteit
15 15 18 19 19 20
1.2.2 Efficiëntie en economie Efficiëntie Economie
21 21 22
2 Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
23
2.1 Screening van taalvaardigheid op leerlingniveau 2.1.1 Directe versus indirecte screening 2.1.2 Wanneer screenen? 2.1.3 Het beoordelen van leerlingprestaties
26 26 28 32
2.2 Diagnose op leerlingniveau
35
2.3 Screening en diagnose op schoolniveau 2.3.1 Eind-, begin-, en tussenscreening 2.3.2 Het bepalen van de toegevoegde waarde 2.3.3 Naar een volwaardige diagnose op schoolniveau
39 39 40 42
2.4 De impact van centrale taaltoetsen op screening en diagnose
48
3 Hoofdstuk 3: Financiering van doelgroepleerlingen
57
3.1 Inleiding
57
3.2 Doelstellingen van de overheid
57
3.3 Identificering van doelgroepleerlingen Conclusies
59 63
3.4 Identificatie van doelgroepleerlingen d.m.v. taaltoetsen
63
3.4.1 Voorafgaande overwegingen Taaltoetsen als indirecte indicator van leerbedreigdheid Leerbedreigdheid en taalachterstand Sociaal versus individueel bepaalde achterstand Krachtige leeromgeving versus wegwerken van achterstand Weggewerkte achterstand en blijvende leerbedreiging Mogelijke perverse effecten van achterstand als indicator voor leerbedreiging Verzamelen van de toetsgegevens Conclusies
63 63 64 64 65 65 66 66 66
3.4.2 Vroege identificering van doelgroepleerlingen d.m.v. taaltoetsen Taalvaardigheidsmeting bij het begin van het kleuteronderwijs Taalvaardigheidsmeting op 5 à 6-jarige leeftijd Conclusies
67 67 68 72
3.4.3 Herijking van leerbedreigdheid: taaltoetsen bij de overgang van lager naar secundair onderwijs Schoolse taalvaardigheid als indicator van kansenongelijkheid bij begin secundair onderwijs Effect van opsplitsing in richtingen op leerbedreiging en kansenongelijkheid Naar een gedifferentieerd systeem van identificering, financiering en onderwijsaandacht Relatie tussen schoolse prestaties en sociale achtergrond in het secundair onderwijs Identificatie in een eerste graad basisvorming Conclusies
73 74 75 75 76 81 83
3.4.4 Herijking van leerbedreigdheid: tussentijdse toetsen in het basisonderwijs Probleem van curriculumafhankelijkheid Beoogde effecten van herijking Toetsvorm en afnameprocedure Conclusies
83 84 85 86 87
3.4.5 Herijking van de leerbedreigdheid: toetsen bij overgang 1e-2e graad secundair onderwijs Conclusies
87
3.5 Weging van doelgroepleerlingen
89
89
3.6 Identificering van doelgroepleerlingen: gebruik van alternatieve taalkenmerken Conclusies
90 93
4 Hoofdstuk 4: Beleidsscenario’s
94
Referenties
103
BIJLAGEN Bijlage 1:
Overzicht van centraal beschikbare gestandaardiseerde toetsen of toetsbatterijen voor taal
Bijlage 2:
Personen en instellingen geconsulteerd in binnen- en buitenland
Bijlage 3:
Questionnaire
1
Inleiding In opdracht van de Minister van Onderwijs van de Vlaamse Gemeenschap werd tussen 1 februari 2006 en 30 juni 2006 door het Centrum voor Taal en Onderwijs (K.U.Leuven) een onderzoek uitgevoerd naar de opportuniteit en wenselijkheid van de invoering van centrale taaltoetsen in Vlaanderen. Dit rapport bevat de neerslag van dat onderzoek en de beleidsaanbevelingen die daaruit voortvloeien. In de opdrachtstelling vanuit het Departement Onderwijs werd verwezen naar twee mogelijke functies die de invoering van centrale taaltoetsen kunnen dienen. Beide hebben te maken met de link tussen taalkenmerken van de leerlingen en onderwijssucces. Functie 1 wordt in de opdracht omschreven als het verhogen van het beleidsvoerend vermogen en de interne kwaliteitszorg van de school op het vlak van taalbeleid. We citeren letterlijk uit de opdracht: “De minister wil werk maken van de verbetering van de taalbeheersing van het Nederlands als instructietaal. De minister erkent dat de beheersing van het Nederlands als instructietaal de noodzakelijke voorwaarde is voor het welslagen van om het even welk schools leerproces. Daarom overweegt hij de invoering van taaltoetsen op een aantal belangrijke scharniermomenten in de schoolloopbaan. De scholen moeten kunnen beschikken over een algemeen screeningsinstrument om te meten in welke mate een leerling een voldoende niveau van beheersing van de instructietaal bezit om in een bepaald onderwijsniveau zonder problemen de lessen in het Nederlands te volgen. Voor de leerlingen die zwak of onvoldoende scoren moet men vervolgens kunnen nagaan, via diagnostische toetsen, op welke manier de leerling in kwestie extra begeleid kan worden met het oog op remediëring. Toetsresultaten moeten scholen aanzetten om een adequaat antwoord te bieden op de vraag van de zwak scorende leerlingen. Het is belangrijk dat de toetsresultaten iedere school in staat zouden stellen én uitdagen om voor zichzelf een goede analyse te maken. De resultaten van hun leerlingen op de taaltoetsen moeten de scholen een spiegel voorhouden. Afname, verwerking en terugkoppeling van de resultaten naar scholen moeten zo gebeuren dat ze scholen stimuleren in ‘zelfreflectie’ over het eigen taalbeleid. De confrontatie met toetsresultaten moet dus een plaats krijgen in het proces van interne kwaliteitszorg.” Bij functie 2 wordt de inzet van centrale taaltoetsen gelinkt aan de financiering van scholen: “De minister wil ook de haalbaarheid onderzoeken van een directe meting van taalachterstand. Op basis van een taaltoets zou dan een indicator voor taalachterstand geconstrueerd kunnen worden die de overheid kan verrekenen in het nieuwe financieringssysteem. Dergelijke taaltoets heeft duidelijk een andere finaliteit dan de algemene taaltoetsen die scholen inzetten met het oog op diagnose en remediëring. De toets zou op een kosten- en tijdsefficiënte manier moeten kunnen vaststellen of een leerling al dan niet over voldoende vaardigheden beschikt om schoolse taaltaken eigen aan het onderwijsniveau waarin hij zich bevindt, uit te voeren. In het huidige systeem van voorwaardelijke GOK-financiering is de meting van schoolachterstand weinig betrouwbaar. Inzake taalachterstand kunnen we alleen een beroep doen op een ‘verklaring op eer’ dat het Nederlands niet de thuistaal is. Op die manier vatten we ook niet de Nederlandstalige leerlingen met taalachterstand voor het Nederlands als instructietaal.”
Inleiding
2 Onderzoeksmethode De bedoeling van deze studie is dat aan het beleid advies wordt verstrekt met betrekking tot de haalbaarheid van het invoeren van taaltoetsen in functie van de bovenvermelde bezorgdheden. Gezien de beperkte tijd die beschikbaar was om de studie uit te voeren, was het van in den beginne duidelijk dat de onderzoekers bijzonder weinig ruimte hadden om zelf empirisch onderzoek rond de centrale onderzoeksvragen uit te voeren. Veeleer moest de opdracht opgevat worden als een samenbrengen van beschikbare onderzoeksrapporten, theoretische literatuur en opinies van experts uit binnen- en buitenland. Deze meta-analyse moest de empirische en theoretische gronden opleveren om beleidsaanbevelingen en concrete beleidsscenario’s met betrekking tot de eventuele invoering van taaltoetsen, te onderstutten. De bronnen die het Centrum voor Taal en Onderwijs heeft geraadpleegd om deze studie uit te voeren, vallen grosso modo uiteen in de volgende vier categorieën: a. Exploratie van onderzoeks- en theoretische literatuur rond de opportuniteit en haalbaarheid van taaltoetsen: o.a. impactstudies rond taaltoetsing; studies naar betrouwbaarheid, validiteit en efficiëntie van toetsen, onderzoek naar de link tussen taal(toetsing) en gelijke onderwijskansen; literatuur rond ontwikkeling van toetsen; buitenlandse studies naar de haalbaarheid van de invoering van centrale taaltoetsen e.d.; b. Inventarisatie en beschrijving van bestaande taaltoetsen Nederlands (o.a. in functie van mogelijke herbruikbaarheid of inzet voor de bovenvermelde functies); c. Raadpleging (via schriftelijke enquêtering en mondelinge interviews) van experts en beleidsverantwoordelijkheden in een aantal landen die met deze problematiek geconfronteerd worden; d. Uitvoeren van een aantal statistische analyses op bestaande datasets die voor deze studie relevant zijn. Een eerste versie van het rapport werd besproken met een uitvoerige stuurgroep, waarin naast het kabinet en departement Onderwijs (o.a. inspectie, beleidscoördinatie) ook de pedagogische begeleidingsdiensten, de CLB-centra en een aantal wetenschappelijke experts waren betrokken. Ook via deze stuurgroep werden bijkomende bronnen op het spoor gekomen.
Opbouw van het rapport Wat beide bovenvermelde functies gemeenschappelijk hebben, is dat zij verwijzen naar een fundamentele link tussen taalkenmerken van leerlingen en onderwijsachterstand. Bij de eerste functie wordt dit expliciet uitgedrukt (beheersing van de instructietaal als voorwaarde voor schools leren), maar ook uit de verwoording van de tweede functie kunnen we dat afleiden: het gaat hier immers om het bepalen van de financiering van scholen, en meer bepaald om het vinden van betrouwbare indicatoren voor het toekennen van gelijkekansenmiddelen aan scholen. Voor beide functies acht de opdrachtgever het essentieel dat taalkenmerken (bijv. ‘taalachterstand’) kunnen worden vastgesteld, teneinde er op de gepaste manier op te reageren. Bij de eerste functie dient de school de taalachterstand te screenen en te diagnosticeren, teneinde een betere ondersteuning aan taalzwakke leerlingen te bieden (interne kwaliteitszorg), bij de tweede functie dient de overheid de nodige conclusies te
Inleiding
3 kunnen trekken m.b.t. het gedifferentieerd financieren van verschillende scholen. In beide gevallen wordt als uiteindelijke doel het verhogen van gelijke onderwijskansen beoogd. Precies om die reden achten we het noodzakelijk om in een eerste hoofdstuk de link tussen taalkenmerken en onderwijsachterstand te verkennen. Wat is er op dit moment geweten over de impact van taalkenmerken op onderwijssucces? Is schoolse taalvaardigheid een determinerende variabele voor schoolsucces? Welke impact heeft thuistaal op onderwijssucces? Deze vragen worden opgenomen in Probleemverkenning 1. In een tweede probleemverkenning zetten we een aantal algemene feiten op een rij die te maken hebben met het in kaart brengen van taalkenmerken van leerlingen. In hoeverre is het mogelijk om dat op een betrouwbare, valide en efficiënte manier te doen, en met welke algemene voorwaarden moet daarbij rekening gehouden worden? Beide probleemverkenningen vormen de onderlegger voor de eigenlijke behandeling van de twee functies die door de opdrachtgever centraal naar voor worden geschoven. In hoofdstuk 2 van dit rapport zoomen we in op de functie die te maken heeft met interne kwaliteitszorg. Daarbij zullen we screening en diagnose enerzijds, en het leerling- en schoolniveau anderzijds, van mekaar onderscheiden om tot een heldere analyse te komen van de opportuniteit en haalbaarheid van taaltoetsen in functie van het verhogen van de interne kwaliteitszorg van scholen. In hoofdstuk 3 bespreken we de functie van taaltoetsen die te maken heeft met financiering van scholen. Ook daar maken we een onderscheid tussen een financiering op basis van de vaststelling van taalachterstand enerzijds, en de vaststelling van een risico op taal- en onderwijsachterstand anderzijds. In dit hoofdstuk focussen we op leerlingen die vanuit sociale groepskenmerken een risico lopen op onderwijsachterstand, of die hebben opgelopen. In hoofdstuk 4 vertalen we de argumentatie die werd ontplooid in de vorige hoofdstukken naar concrete beleidsscenario’s. Daarbij gaan we uit van een incrementeel opgebouwd beleidsscenario waarbij we de eerst voorgestelde stappen als meer prioritair en meer zinvol vanuit een beleidsperspectief naar voor schuiven dan de laatst voorgestelde stappen. Volgend op de bibliografische referenties bevatten de bijlagen een beschrijving van bestaande taaltoetsen (bijlage 1), een overzicht van de buitenlandse experts die mondeling of schriftelijk reageerden op onze bevraging (bijlage 2), en de bevraging zelf (bijlage 3).
Inleiding
4
1 Hoofdstuk 1: Probleemverkenningen In dit hoofdstuk stellen we twee inleidende probleemverkenningen centraal: één naar de relatie tussen taalkenmerken en schoolsucces, en één naar de basisvoorwaarden voor het in kaart brengen van taalkenmerken van leerlingen. 1.1 Probleemverkenning 1: De relatie tussen taalkenmerken en schoolsucces In deze eerste probleemverkenning trachten we een aantal concepten die een cruciale rol spelen in deze studie scherp te definiëren, en gaan we ook in op een aantal hypotheses die ten grondslag liggen aan de opdrachtstelling. Centraal in dit hoofdstuk staat de relatie tussen taal en onderwijsachterstand. Deze ligt immers aan de basis van beide functies. We zullen ingaan op de theoretische literatuur en het wetenschappelijk onderzoek die een breder licht kunnen werpen op de precieze relatie tussen taalachterstand (i.e. een te geringe beheersing van de instructietaal) en onderwijssucces. 1.1.1 Maatschappelijke achterstand en onderwijs Onderwijs, emancipatie en achterstandsbestrijding In een rapport voor de Nederlandse Taalunie heeft Jaspaert (2005) het over de relatie tussen onderwijs, emancipatie en achterstandsbestrijding. Onderwijs moet aan leerlingen vooral kansen bieden: onderwijs moet leerlingen helpen om als volwaardige burgers in de maatschappij te functioneren. Het onderwijs realiseert die functie door leerlingen kennis, vaardigheden en attitudes bij te brengen. Deze op emancipatie gerichte basisfunctie dient het onderwijs te vervullen voor al zijn leerlingen. Iedereen moet kennis, vaardigheden en attitudes verwerven die hij of zij nodig heeft om als volwaardige burger te functioneren. Naast de invulling van deze basisopdracht van de school, houdt deze functie ook een meer specifieke opdracht in. De school is immers niet de enige actor die zich bezighoudt met emancipatie. Ook van huis uit krijgen jongeren kennis, attitudes en vaardigheden aangereikt die hen in staat moeten stellen om volwaardig maatschappelijk te functioneren. Daarbij is het onmiskenbaar zo dat vanuit bepaalde sociale milieus meer van die belangrijk geachte kennis, vaardigheden en attitudes aangereikt worden dan vanuit andere. In de mate dat naar het onderwijs gekeken wordt om die ongelijkheid in kansen recht te trekken, is er sprake van een specifieke emancipatieopdracht voor de school: de school moet ervoor zorgen dat de positie die iemand in de maatschappij bereikt, niet afhankelijk is van de kansen die het thuismilieu kan bieden. Daarbij gaat de aandacht vooral uit naar sociaal zwakke groepen. Uit tal van gegevens blijkt dat de school er vooralsnog niet altijd in slaagt om die emanciperende opdracht ten volle uit te voeren. Kinderen die met minder kansen aan het onderwijs beginnen blijken het heel moeilijk te hebben om het onderwijs te gebruiken om die achterstand in te lopen. Vaak blijkt de achterstand van die leerlingen tijdens hun onderwijsloopbaan eerder groter dan kleiner te worden. Heel wat internationaal onderzoek illustreert de hechte relatie tussen SES en schoolprestaties. In dit verband hebben de resultaten van het PISA-onderzoek (De Meyer, Pauly & Van de Poele, 2004) de laatste tijd de meeste aandacht gekregen. Ander interessant onderzoek in dit verband is White (1982) en Sirin (2005). Zij voerden beide een meta-analyse uit van Amerikaanse studies die de relatie tussen SES en schoolprestaties onderzoeken.
Hoofdstuk 1: Probleemverkenningen
5 Kansenongelijkheid en emancipatie in het Vlaamse onderwijs Ook het Vlaamse onderwijs worstelt met het probleem van de reproductie van sociale ongelijkheid. In de visietekst van het Steunpunt GOK (Laevers, Van den Branden & Verlot, 2004)1 stellen de auteurs zich de vraag hoe groot het probleem van kansenongelijkheid in het Vlaamse onderwijs is. Een probleem kan algemeen gedefinieerd worden als “een verschil tussen een maatstaf (beginsel, norm) en een voorstelling van een bestaande of verwachte situatie”. Als we dit toepassen op kansenongelijkheid in het onderwijs, moeten we ons de volgende drie vragen stellen: a. Wat is de maatstaf? b. Hoe ziet (de voorstelling van) de bestaande situatie er op dit moment uit? c. Is er een discrepantie tussen de bestaande situatie en de maatstaf? De maatstaf kan worden omschreven als ‘kansengelijkheid in het onderwijs’: ieder individu, ongeacht zijn of haar achtergrond, krijgt gelijke kansen om succesvol te zijn in het onderwijs. Op basis van eindtermen, omzendbrieven e.d. kunnen we vaststellen dat het Vlaamse onderwijsbeleid ernaar streeft dat ieder individu het leerplichtonderwijs afsluit met een diploma hoger secundair onderwijs. Uit het feit dat ‘zittenblijven’ en ‘doorverwijzing naar het buitengewoon onderwijs’ vaak worden gebruikt als indicatoren van minder succesvolle loopbanen, kunnen we afleiden dat het doorlopen en succesvol afsluiten van het leerplichtonderwijs bij voorkeur binnen een tijdsspanne van 12 jaar gebeurt, en bij voorkeur binnen de structuren van het gewoon regulier onderwijs. Bovendien stelt de overheid als maatstaf dat iedere leerplichtige aan het einde van die twaalf jaar een duidelijk omschreven pakket van vaardigheden, inzichten en attitudes moet hebben verworven. Dat doet de overheid middels het uitvaardigen van officiële eindtermen. Dit zijn ‘minimumdoelstellingen’. Het gaat hier om een pakket aan vaardigheden waarover ieder moet beschikken om volwaardig te functioneren in de maatschappij, en om uitzicht te blijven behouden op instroom in een of andere vorm van vervolgonderwijs. Het onderwijs hoeft zich uiteraard niet tot dat minimum te beperken: ze dient er bij voorkeur naar te streven dat leerlingen het leerpotentieel dat zij bezitten tijdens hun leerplichtperiode maximaal benutten en ontwikkelen. De maatstaf waarop we ons richten, kunnen we dus voorlopig als volgt omschrijven: “Alle leerplichtigen sluiten bij voorkeur op de leeftijd van 18 jaar het leerplichtonderwijs af met een volwaardig diploma secundair onderwijs, hebben op dat moment het basispakket aan vaardigheden, kennis en attitudes (zoals beschreven in de eindtermen) verworven, en hebben bovendien de kans gekregen om zich maximaal te ontplooien.” Wetenschappelijk onderzoek toont aan dat het Vlaamse onderwijs, hoewel het tot het beste van de wereld wordt gerekend, deze maatstaf niet volledig haalt. Zo is er recent onderzoek dat aantoont dat ongeveer 800.000 Vlamingen (16% van de Vlaamse volwassenen) zeer laaggeletterd zijn en veel moeite hebben met alledaagse schriftelijke taken (Bohnenn et al., 2004). Het beeld dat uit het meest recente PISA-onderzoek naar voren komt, sluit eveneens nauw aan bij de vaststelling dat Vlaanderen nog steeds een onaanvaardbaar hoog percentage laaggeletterden telt. Ook de cijfers omtrent het aantal jongeren die afstuderen zonder een diploma hoger secundair onderwijs spreken boekdelen. In een recent onderzoek van Van
1
Deze paragraaf is integraal gebaseerd op Laevers, Van den Branden & Verlot (2004).
Hoofdstuk 1: Probleemverkenningen
6 Landeghem en Van Damme (2004) wordt de ongekwalificeerde uitstroom uit het secundair onderwijs op 18% geschat. Dit hoeft echter nog niet te betekenen dat er in het Vlaamse onderwijs sprake zou zijn van systematische kansenongelijkheid. Binnen een meritocratische visie op onderwijs slagen en falen leerlingen op basis van hun eigen talenten (aanleg) enerzijds, en hun verdiensten anderzijds (de moeite die ze doen, de energie die ze aan de dag leggen, de eigen leerinspanningen). Als men ervan uitgaat dat leerpotentieel, aanleg en bereidheid tot leerinspanningen gelijk verdeeld zijn over de verschillende lagen in de bevolking, kan men pas van systematische kansenongelijkheid spreken indien bepaalde groepen van leerders die dezelfde achtergrondkenmerken vertonen (bijvoorbeeld geslacht, socio-economische situatie of etnische afkomst), systematisch slechter presteren. Dat brengt onze maatstaf bij de volgende formulering: “Alle leerplichtigen, ongeacht hun achtergrondkenmerken (afkomst, SES, geslacht) krijgen gelijke kansen om het leerplichtonderwijs af te sluiten met een volwaardig diploma secundair onderwijs, om het basispakket beschreven binnen de eindtermen te verwerven, en om zich maximaal te ontplooien.” Er zijn duidelijke aanwijzingen dat de bestaande situatie in het Vlaamse onderwijs ook (nog) niet strookt met deze maatstaf. Geslacht en SES blijken in dit verband onafhankelijke variabelen te zijn die systematisch samenhangen met verschillen in onderwijssucces. Wat geslacht betreft, blijkt de ongekwalificeerde uitstroom bij jongens systematischer hoger te liggen dan bij meisjes (Van Landeghem & Van Damme, 2004). Meisjes halen ook een hoger niveau van ‘laatste succesvolle positie in het onderwijs’ dan jongens (Hermans, Opdenakker, & Van Damme, 2003). Wat SES betreft, toont o.a. recent PISA-onderzoek dat leerlingen met een lage SES oververtegenwoordigd zijn in de groep van Vlaamse leerlingen die slecht scoort op internationale begrijpend-leespeilingen. De kloof tussen de scores van kinderen van hoogopgeleide ouders en kinderen van laagopgeleide ouders blijkt in België zelfs groter te zijn dan in de meeste andere landen die aan dit internationaal vergelijkend onderzoek hebben deelgenomen. Ook in eerder PISA-onderzoek naar begrijpend lezen was opgevallen dat de kloof tussen kinderen van laagopgeleide versus hoogopgeleide ouders in België relatief groot is in vergelijking met andere landen in de wereld. De Wit (2000) toont aan dat de kans op zittenblijven van leerlingen in het lager secundair onderwijs verschilt naargelang de socio-economische gezinskenmerken. Kinderen van werklozen, ongeschoolde arbeiders of kleine zelfstandigen, leerlingen van wie de moeder laaggeschoold is, en kinderen uit lage-inkomensgezinnen hebben beduidend meer kans op zittenblijven dan de andere kinderen. Van de Velde e.a. (1996) concludeerden uit hun onderzoek dat de studieoriëntatie in het secundair onderwijs sociaal ongelijk is. Zo zijn kinderen van laagopgeleide moeders oververtegenwoordigd in het beroepssecundair onderwijs. De groep leerlingen die ongekwalificeerd uitstroomt zit volgens een onderzoek van Verhaeghe e.a. (2000) geconcentreerd in de lage sociale klassen. Ook de doorstroom naar het hoger onderwijs is in hetzelfde bedje ziek: slechts 35% van de arbeiderskinderen gaat naar het hoger onderwijs tegenover 75% van kinderen van hogere bedienden. Arbeiderskinderen kiezen ook makkelijker voor hoger onderwijs van het kortere type. Tan (1998) concludeert in een analyse van sociale ongelijkheid in het hoger onderwijs tussen 1976 en 1992 dat de
Hoofdstuk 1: Probleemverkenningen
7 democratisering van het hoger onderwijs wel heeft gewerkt voor meisjes (dus voor de achtergrondvariabele geslacht), maar niet voor arbeiderskinderen (dus voor de achtergrondvariabele socio-economische achtergrond). Opvallend in een aantal van deze onderzoeken is dat het effect van de factor etniciteit niet bovenop het effect van de factor SES komt. Meer zelfs, in het secundair onderwijs blijkt uit recent onderzoek (Hermans, Opdenakker, & Van Damme, 2004) dat het effect van etniciteit gaandeweg verdwijnt. Allochtonen doen het in het onderwijs dus niet per definitie slechter dan autochtonen: “Wat de bijdrage van het secundair onderwijs betreft, gemeten aan de hand van de wijziging in de effecten van geslacht, etniciteit en SES, na controle voor de intredekenmerken prestatieniveau op schoolse toetsen en de intelligentie bij aanvang van het secundair onderwijs, zien we dat de effecten van geslacht en SES verkleinen en dat het effect van etniciteit zelfs verdwijnt. Dus in ons secundair onderwijs doen, rekening houdend met hun aanvangskenmerken, allochtonen het even goed als autochtonen. Meisjes doen het beter dan jongens en leerlingen met een hogere socioeconomische achtergrond doen het beter dan die met een lagere socio-economische achtergrond.” (Hermans, Opdenakker, & Van Damme, 2004: 42). Het effect van socio-economische achtergrond (opleiding en beroep van de ouders) is bijzonder hardnekkig en vertoont zich reeds zeer vroeg tijdens de schoolloopbaan van de kinderen. Het is duidelijk dat SES een invloed heeft op de basisbagage waarmee leerlingen het onderwijs instromen, en op de buitenschoolse omstandigheden waarin zij hun schoolloopbaan doorlopen. Leerlingen zijn niet gelijk als ze het onderwijs instromen, en zijn niet gelijk terwijl ze schoollopen. Voor sommige leerlingen is de opvoeding die ze van thuis uit genieten slecht aangepast aan de waarden, interactiepatronen, en methoden van kennisverwerving die op school worden gehanteerd. Bij sommige leerlingen zijn bepaalde cognitieve vaardigheden die in het schoolse curriculum sterk worden aangesproken, vanuit de interactie met hun thuismilieu sterker ontwikkeld dan bij andere (Tesser, 1999). “Kansarme kinderen gebruiken reeds op kleuterleeftijd een minder uitgebreide woordenschat en een minder abstracte taal, die ze ingelepeld gekregen hebben van hun minder geschoolde ouders. Hun ouders kunnen hun minder helpen bij huiswerk of leerproblemen. Deze kinderen hebben ook meer ongevallen en chronische ziekten; ze worden vaker gepest op school, hebben minder ondersteunende contacten, minder culturele bagage, minder speelgoed, minder ruimte, minder stilte, meer stress en onzekerheid...” (Nicaise, 2001: 387). Als leervermogen, talent, en natuurlijke aanleg gelijk verdeeld zouden zijn over de sociale klassen bij de geboorte van kinderen, dan zijn ze dat wellicht niet meer bij de instroom van kinderen in het leerplichtonderwijs. Als het onderwijs gelijke kansen wil bieden aan alle leerlingen, zal ze dus deze diversiteit moeten erkennen, en haar methoden aan die diversiteit moeten aanpassen, zodat ze voor de verschillen in instroombagage weet te compenseren. Met andere woorden: om gelijke kansen te bieden aan leerlingen, moeten leerlingen ongelijk worden behandeld. De school past zich aan aan de leerlingen, eerder dan omgekeerd. De ultieme ambitie van een school die gelijke onderwijskansen wil scheppen is dat het effect van SES doorheen de schoolloopbaan van de leerlingen gaandeweg verkleint, en uiteindelijk verdwijnt. Met andere woorden, dat het probleem van sociale reproductie zo hardnekkig is, hoeft geenszins te betekenen dat de school de handdoek maar beter in de ring gooit.
Hoofdstuk 1: Probleemverkenningen
8 Schooleffectiviteitsonderzoek2 laat immers zien dat scholen met een gelijkaardige instroom verschillende effecten bereiken (De Fraine et al., 2003; De Maeyer et al., 2003; Schryvers & Hillewaere, 2002). Er blijken grote verschillen te bestaan in de mate waarin scholen in de emancipatieopdracht slagen (Hillewaere, 2001; Rymenans et al., 1996; Teddlie & Reynolds, 2000; Van Damme et al., 2004,). Uit talrijk onderzoek blijkt dat met name voor risicoleerlingen het sterk uitmaakt wat de instructiekwaliteit is (Creemers, 1994; Garcia, 2002; Teddlie & Reynolds, 2000; Jungbluth, 2003; Black, 2004; Good & Brophy, 2003; Opdenakker & Van Damme, 2004; Teddlie & Stringfield, 1993; Opdenakker et al. 2002).
1.1.2 De rol van taal bij het tot stand komen van effectief onderwijs Taal als oorzakelijke factor voor maatschappelijke achterstand Opvallend in de discussie over de emanciperende functie van onderwijs is dat taal en taalonderwijs daarbij volgens Jaspaert (2005) steeds een belangrijke rol spelen. Verbazen hoeft die aandacht voor taal niet. Taal is bij uitstek een vehikel voor maatschappelijk functioneren: elke rol, taak, opdracht in de maatschappij brengt specifieke taaleisen met zich mee. Het maatschappelijk functioneren van wie niet goed genoeg kan lezen en schrijven wordt in heel veel situaties ernstig bemoeilijkt. Dus wordt van het onderwijs verwacht dat het alle leerlingen die lees- en schrijfvaardigheid bijbrengt. En wie in het zakenleven, in de juridische wereld of bijvoorbeeld in de ambtenarij wil functioneren, zal zich het taalgebruik van de betreffende sector eigen moeten maken. Onderwijs dat op die carrières voorbereidt, moet ook aandacht geven aan de verwerving van die taalvaardigheid. Ook waar het gaat om emancipatie in de hierboven geschetste meer specifieke zin, en dus om achterstandsbestrijding, speelt taal een belangrijke rol. Mensen die in een achterstandssituatie opgroeien, beschikken vaak niet over de nodige taalvaardigheid om te functioneren zoals de maatschappij dat van hen verwacht. Ze hebben moeite met het verwerken van de grote stroom schriftelijke informatie die hen bereikt, ze zijn niet vaardig genoeg in de standaardtaal om hun stem in het maatschappelijke debat te laten horen, ze vermijden te schrijven omdat ze weten dat ze erg veel spelfouten maken. De school krijgt de opdracht om voor deze achterstand te compenseren: de leerlingen moeten de kans krijgen om die noodzakelijke vaardigheid via het onderwijs uit te bouwen. Taal als oorzakelijke factor voor schoolse achterstand Bij de vraag wat de school met taal moet doen om haar leerlingen maatschappelijk kansen te bieden, gaat het in eerste instantie om vaardigheid, en minder om kennis en attitude. Het is het ontbreken van specifieke vaardigheden dat als probleem ervaren wordt, en het is de opdracht van de school om dat probleem te verhelpen. Voor een buitenstaander lijkt deze opdracht voor de school misschien eenvoudig. We zijn immers gewend om naar taal en taalonderwijs te kijken vanuit een bepaald perspectief. Vanuit dat perspectief gaat het hier om het aanbrengen van de relevante woorden, constructies, uitspraakelementen enzovoort, en het aanbieden van heel veel oefenmogelijkheden. Er is echter veel meer aan de hand. Het laten verwerven van de relevante taalvaardigheid is onlosmakelijk verbonden met het leren uitvoeren van een aantal cognitieve handelingen die 2
Voor een overzicht van het Leuvense onderzoek, cf. Van Damme e.a., 2006
Hoofdstuk 1: Probleemverkenningen
9 een leerling in een achterstandspositie in zijn eigen milieu vaak niet hoeft uit te voeren. In essentie gaat het erom dat op school en in de maatschappelijke domeinen waar prestige te rapen valt, op een andere wijze wordt gecommuniceerd dan in de meeste sociale groepen in een achterstandspositie. Die andere communicatiewijze moet daarbij niet als een tekort of als deficiëntie gezien worden: ze sluit aan bij wat binnen die groep waardevol wordt geacht3. Taalachterstand: het verschil tussen thuistaal en schooltaal Het Taalforum van de Nederlandse Taalunie4, een digitale kennisbasis rond taalachterstand en onderwijssucces, stelt vast dat het feit dat anderstalige kinderen taalproblemen hebben op school, haast onvermijdelijk lijkt: “doordat zij thuis weinig of geen Nederlands spreken, beheersen zij de taal die op school gesproken wordt, niet zo goed. Maar zo simpel ligt het niet altijd: er zijn namelijk ook van huis uit Nederlandstalige kinderen met een taalachterstand én anderstalige kinderen zonder een taalachterstand op school. Waarom het ene kind wel taalproblemen heeft, en het andere niet, ligt in wezen aan een combinatie van twee zaken: 1. het verschil tussen schooltaal en thuistaal 2. de aard van het taalverwervingsproces5 Samengevat komt het hierop neer dat hoe groter de kloof tussen thuistaal en schooltaal is, en hoe kleiner het vermogen van het kind om die kloof via zijn of haar taalleervermogen te overbruggen, hoe meer kans een kind heeft om op school een taalachterstand op te lopen.” Het Steunpunt NT2 (K.U.Leuven) bracht in het begin van de jaren ‘90, bij de opstart van het Onderwijsvoorrangsbeleid, de omvang van het ‘taalprobleem’ van kwetsbare leerlingen in kaart (Jaspaert, 1996; De Vlieghere e.a., 1999). Daarbij werd gefocust op de ‘schoolse taalvaardigheid’ van leerlingen: de taalvaardigheid die kinderen nodig hebben om enerzijds de boodschappen waarmee ze in schoolverband worden geconfronteerd te begrijpen, en anderzijds om zelf boodschappen in een schoolse context op een adequate en begrijpelijke manier te produceren. Bij de overgang van het kleuteronderwijs naar het eerste leerjaar bleek anno 1991 de meerderheid van de Turkse en Marokkaanse leerlingen over onvoldoende (schoolse) taalvaardigheid Nederlands te beschikken om zonder problemen te begrijpen wat er in het eerste leerjaar werd gezegd. Bij de overgang van het lager onderwijs naar het secundair onderwijs bleek het aantal allochtonen dat onvoldoende taalvaardig in het Nederlands was, ronduit dramatische proporties aangenomen te hebben. Het probleem bleek echter niet beperkt te zijn tot allochtone leerlingen. Ook vele autochtone leerlingen vielen, bij de taaltoetsen die door het Steunpunt NT2 in 1991 werden afgenomen, door de mand. Ook voor deze leerlingen geldt dat het Nederlands dat op school wordt gebruikt een moeilijke ‘tweede’ taal is, en dat hun schooltaalprobleem er in de loop van de jaren alleen maar groter op werd. Nochtans gaat het hier om leerlingen die thuis in het Nederlands zijn opgevoed.
3
Deze kwestie is in de sociolinguïstische literatuur bekend als de discussie tussen de deficiëntie en de differentieopvatting. Volgens de deficiëntiedenkers gebruiken kinderen in achterstandspositie vaak een verbasterde, corrupte variëteit van de standaardtaal, die helemaal niet geschikt is om er onderwijs in te geven of om te gebruiken op andere formele domeinen. Voor de differentiedenkers is die taalvariëteit niet corrupt, maar gewoon anders, en is het een maatschappelijke keuze of men toestaat dat ze op domeinen als onderwijs gebruikt wordt. Voor een goede discussie over deze kwestie, zie Atkinson 1985. Voor een toepassing van die discussie op de onderwijssituatie in Nederland zie Kroon & Vallen, 2004. 4 http://taalunieversum.org/onderwijs/taalforum/toon_vraag.php?vraagid=41 5 Voor een overzicht van factoren die het taalverwervingsproces kunnen beïnvloeden, cf. Appel & Vermeer (1994)
Hoofdstuk 1: Probleemverkenningen
10 Deze onderzoeksresultaten suggereerden dat het hier in essentie niet om een probleem van bepaalde leerlingen gaat, maar om een probleem van de school. Of beter uitgedrukt: het gaat om een probleem van de wijze waarop onderwijs wordt ingericht en van de doelstellingen die binnen dat onderwijs prioritair worden nagestreefd. Onderzoek van het Steunpunt NT2 naar de specifieke aard van schooltaal (Schrooten, 1997) en internationale literatuur hieromtrent (voor een overzicht, cf. Valdés, 2004) gaven duidelijk aan dat de eisen die het onderwijs aan de taalvaardigheid van kinderen stelt, bijzonder hoog liggen. De taal die de school hanteert is zeer complex en verschilt in tal van aspecten van de taal die kinderen thuis hanteren (Van den Branden & Van Avermaet, 2001). In de handleiding van de TAL-toets (Cucchiarini & Jaspaert, 1995) wordt de specifieke aard van schooltaalvaardigheid als volgt omschreven: “Dat schoolse taalvaardigheden aanzienlijk verschillen van algemene taalvaardigheden is intussen een geaccepteerd feit (Cummins 1979, 1984; Hulstijn 1984; De Haan 1985, 1987; Litjens 1989). Cummins (1986; 1994) vat de complexiteit van instructietaal samen door gebruik te maken van 2 assen: cognitieve complexiteit van de taal, en de mate waarin de taal gecontextualiseerd is. Van academische instructietaal geldt dat ze in hoge mate cognitief complex is, en gedecontextualiseerd. De twee soorten taalvaardigheid worden vaak aangeduid met de acroniemen die Cummins (1980) heeft geïntroduceerd, namelijk BICS (Basic Interpersonal Communicative Skills) en CALP (Cognitive Academic Language Proficiency). BICS refereren naar dagelijkse taalvaardigheden, terwijl CALP voor het meer cognitief belastend, minder contextrijk taalgebruik staat dat typerend is voor schoolse situaties. In eerste instantie werden deze twee typen van taalvaardigheid als een dichotomie gepresenteerd. Later (Cummins 1984) worden BICS en CALP voorgesteld als mogelijke posities langs twee continua. Het eerste continuüm staat voor de hoeveelheid contextuele ondersteuning en het tweede voor de mate van cognitieve inspanning die vereist wordt. Elk voorbeeld van communicatief gedrag kan in principe langs deze twee continua geplaatst worden. Belangrijk hierbij is echter dat met de taalgebruiker rekening wordt gehouden. Volgens Cummins (1984: 15) worden taaltaken niet als zodanig getypeerd als cognitief-veeleisend of contextrijk, maar met betrekking tot bepaalde taalgebruikers. Het is dus best mogelijk dat een en dezelfde taak voor de ene taalgebruiker cognitief veeleisend of contextarm is en voor de andere niet. Dit maakt het ook mogelijk om BICS en CALP in een ontwikkelingsperspectief te plaatsen. Bijvoorbeeld, zoals Cummins (1984: 13) zegt: ‘As mastery is developed, specific linguistic tasks and skills travel from the bottom towards the top of the vertical continuum' (het continuüm dat gaat van cognitief weinig eisende tot cognitief veeleisende taken). Het belang van de taalgebruiker voor het BICS-CALP onderscheid wordt vaak over het hoofd gezien, met het resultaat dat BICS en CALP als statisch worden opgevat: sommige taken horen nu eenmaal bij de BICS en sommige bij de CALP. In aansluiting hierbij wordt ook vaak gesuggereerd dat op school een verschuiving zou optreden van het gebruik van BICS in de onderbouw van het basisonderwijs naar een gebruik van CALP in de bovenbouw (Litjens 1990: 46). Volgens deze voorstelling van zaken zouden kinderen pas in de laatste jaren van het basisonderwijs moeilijkheden ondervinden, wanneer van BICS naar CALP wordt overgegaan. Als men echter BICS en CALP dynamisch opvat en vanuit die optiek het taalgebruik thuis en op school vergelijkt, dan is het duidelijk dat heel wat kinderen al vanaf het begin van hun schoolcarrière met cognitief ingewikkelde, contextarme taal geconfronteerd worden. Dat is met name het geval bij kinderen voor wie de taal die op school gesproken wordt
Hoofdstuk 1: Probleemverkenningen
11 niet de moedertaal is; (Cummins 1984: 15). Cummins beweert dat voor tweedetaalleerders het verwerven van de instructietaal ongeveer 7 jaar in beslag neemt.” (Cucchiarini & Jaspaert, 1995: 1-3). Uit het wetenschappelijk onderzoek dat is verricht naar de ‘eigen-aardigheid’ van schooltaal (o.a. Hajer & Meestringa, 1995; Geudens, Rymenans & Daems, 1992; Bogaert, 1998), kan het volgende worden geconcludeerd6: a. Er wordt in de school over andere onderwerpen gepraat dan thuis. Ten eerste gaat het om onderwerpen die veelal van wetenschappelijke disciplines zijn afgeleid, en die daardoor vaak ver van de concrete leefwereld van leerlingen liggen. Veel van de onderwerpen overstijgen het hier-en-nu: dingen die niet zichtbaar zijn (bijv. ‘sapstromen’, ‘zwaartekracht’, ‘atomen’) en/of zich in het verleden of ver van huis afspelen (‘de middeleeuwen’, ‘de hoofdstad van Letland’) komen veelvuldig in de school aan bod. Dat maakt het voor de leerling vaak moeilijk om de betekenis van de gebruikte taal te ontrafelen aan de hand van de context of op basis van zijn kennis van de wereld. Bovendien wordt in een school meestal over onderwerpen gecommuniceerd die niet door de leerling maar door de leerkracht zijn gekozen. In het thuismilieu draagt een kind/jongere op een meer evenwichtige mate bij tot de keuze van het onderwerp, hetgeen de interesse van het kind/jongere in het gesprek ten goede komt. b. Er wordt in de school met een andere bedoeling taal gebruikt: talige interactie heeft in de traditionele school voornamelijk een transmissieve functie. Taal wordt er gebruikt om kennis over te brengen: de opdracht van de leerling is de taal van de kennisoverdracht te begrijpen en op die manier kennis op te slorpen. De leerling krijgt in de school, in vergelijking met het thuismilieu, relatief minder kans om zijn eigen kennis te verwoorden en over te brengen, zijn eigen mening te verkondigen en te verdedigen, te protesteren, met taal te spelen, etcetera. De leerling vervult in schoolse communicatie vaak de rol van (passieve) luisteraar. In een thuismilieu is er naast dat luisteren vaak meer ruimte voor het zelf (vrijuit) produceren van taal. Dat is belangrijk voor het opgroeiende kind, daar het volop bezig is zich op allerlei vlakken te ontwikkelen en allerhande kennis en vaardigheden op te doen. Dat laatste doet het thuis, in een natuurlijke situatie, veelal vanuit eigen concrete en actieve ervaringen, en daarbij gebruikt het kind taal om die ervaringen en indrukken te verwoorden, te ordenen, te verwerken, en er met anderen over te communiceren. c. Er wordt in de school op een andere manier gecommuniceerd, m.a.w. de gehanteerde interactiepatronen in de school verschillen danig van die van het thuismilieu. In schoolse interactie vervult de leerkracht vaak een centrale functie. Hij eist het merendeel van de spreektijd voor zichzelf op en heeft bovendien het recht om anderen het woord te geven en te ontnemen. Leerlingen moeten in de klas met mekaar concurreren om een beurt te bemachtigen en moeten daarvoor via de leerkracht. Dit heeft in veel klassen tot gevolg dat een kleine minderheid van de leerlingen vaker aan het woord komen dan de andere. Sommige leerlingen krijgen daardoor nauwelijks een kans om taal te produceren. In een thuismilieu beschikken kinderen/jongeren over een grotere vrijheid om te bepalen wanneer ze het woord nemen, en waarover ze dat doen. Wat leerlingen mogen zeggen in een klas wordt veelal aan banden gelegd: heel vaak moeten leerlingen antwoorden op de vragen van de leerkracht, en wordt van hen verwacht dat ze precies het antwoord geven dat de leerkracht in zijn hoofd heeft. Dit gegeven kan de leerling behoorlijk fnuiken in de mogelijkheid om vrijuit zijn eigen mening en ideeën te verkondigen, om zijn eigen 6
Deze paragraaf is integraal gebaseerd op Van den Branden & Van Avermaet, 2001.
Hoofdstuk 1: Probleemverkenningen
12 ervaringskennis te expliciteren en te toetsen aan die van anderen, en om zo al doende zijn spreekvaardigheid uit te breiden. d. Er wordt in de school van andere talige elementen gebruik gemaakt dan thuis. Een duidelijk voorbeeld is de woordenschat. Omdat schooltaal afgeleid is van wetenschapstaal bevat het enerzijds heel wat vakjargon, i.e. woorden die heel typisch zijn voor bepaalde vakken (bijv. ‘aminozuren’, ‘cumuluswolken’, ‘plaatjes’), en anderzijds algemene schooltaalwoordenschat, i.e. woorden die niet typisch zijn voor bepaalde vakken, maar doorheen verschillende vakken voorkomen (bijvoorbeeld: ‘oorzaak’, ‘beargumenteren’, ‘hypothese’, ‘vermits’, ‘etcetera’). Daarnaast treden in schooltaal ook bepaalde grammaticale constructies vaker op dan in thuistaal. Zo komen, relatief gesproken, in schooltaal veel meer samengestelde zinnen met complexe zinsverbanden voor. Met schooltaal probeert de leerkracht of het handboek immers complexe processen te verklaren, en om die complexe processen onder woorden te brengen is vaak een uitgekiend evenwichtsspel met talige elementen nodig. e. In de school is de verhouding tussen de gesprekspartners veel asymmetrischer dan thuis. In het verlengde van het bovenstaande kan afgeleid worden dat de leerkracht zich vaak opstelt als de allesweter, die kennis doorgeeft en vervolgens evalueert of de leerlingen de uitleg hebben begrepen en de beoogde kennis hebben opgedaan. De leerkracht is degene die de kennis bezit; de leerlingen zijn leken die met nieuwe en vaak wereldvreemde kennisgehelen worden geconfronteerd. De leerkracht is een insider, de leerlingen zijn outsiders. Dat maakt ook vaak dat de leerkracht zich niet altijd bewust is van de onwetendheid van de leerlingen, en veel verbanden in zijn uitleg impliciet laat. Het probleem is bovendien dat leerlingen niet sterk geneigd zijn om hun onbegrip van al die moeilijke schooltaal duidelijk te maken (Van den Branden, 1995). Ze zijn ten eerste niet altijd geïnteresseerd in de onderwerpen die de leerkracht heeft gekozen en de uitleg die hij geeft, ze schuwen ervoor hun onbegrip duidelijk te maken aan de hele klas (het zgn. ‘publiekseffect’), en ze lopen het gevaar op hun leerkracht een slechte indruk te maken telkens ze hun onbegrip duidelijk maken. Met een boutade: leerlingen zitten niet in de klas om domme vragen te stellen, maar om juiste antwoorden te geven. Als gevolg van het feit dat de school de bovenvermelde talige eisen stelt, zowel op receptief als op productief vlak, moeten alle leerlingen als het ware een nieuwe taal verwerven. Ook leerlingen die thuis in het Nederlands worden opgevoed, zullen het Nederlands als instructietaal moeten verwerven. Nederlands als instructietaal kan met andere woorden niet alleen voor anderstalig opgevoede leerlingen een ‘struikelblok’ vormen. Nadere analyse van resultaten die leerlingen halen op schoolse taaltoetsen leert dat vooral allochtone en autochtone leerlingen van een lage socio-economische afkomst het met de schoolse taal moeilijk blijken te hebben (Zwarts, 1990; Klatter-Folmer, 1996; Tan, 1997; Holvoet, 2000; Nicaise, 2000; Bosker e.a., 2001; Onderwijsraad, 2001, 2002, 2003; De Maeyer et al., 2003; Hermans, Opdenakker & Van Damme, 2003; Oomens, Driessen & Scheepers, 2003; Roeleveld, 2003; Meijnen 2004). Andere interessante internationale publicaties rond het verband tussen SES en taal- en/of leesvaardigheid zijn die van Raz & Bryant (1990), Bowey (1995), McLoyd (1998), Duncan & Seymour (2000), McClelland, Kessenich & Morrison (2003) en Willms & Somers (2005). Eén van de mediërende factoren in de relatie tussen SES en schools presteren die in deze literatuur vrij veel aandacht heeft gekregen is de 'Home Literacy Environment' (aanwezigheid van boeken in het gezin, voorlezen aan kinderen, mate waarin ouders hun kinderen al spelenderwijs letters leren lezen, enz...; bijv. Sénéchal & LeFevre, 2002).
Hoofdstuk 1: Probleemverkenningen
13 Slechts in een kleine minderheid van deze onderzoeken is het effect van deze factoren minimaal of moet het worden genuanceerd (Smeyers & Vandommele, 2003; López & Tashakkori, 2003). Een conclusie uit al dit onderzoek is dat de factor SES meer verschillen in prestaties verklaart dan de factor etniciteit (De Fraine et al., 2003; Sijtstra et al., 2002; Van der Slik et al, 2000; Kerkhoff, 1988). De breuk tussen thuistaal en schooltaal is met andere woorden in de eerste plaats socio-economisch bepaald, eerder dan etnisch. 1.1.3 Schoolse taalvaardigheid en onderwijssucces Uit de hierboven behandelde relatie tussen schoolse taalvaardigheid en het vermogen om op school tot leren te komen, valt duidelijk af te leiden dat een beperkte schoolse taalvaardigheid leidt tot schoolse achterstand. Daarmee is ook duidelijk dat die schoolse taalvaardigheid aandacht verdient van wie een bijdrage wil leveren aan emanciperend onderwijs. Enerzijds biedt deze relatie de mogelijkheid om schoolse taalvaardigheid te gebruiken als indicatie voor potentiële leerproblemen In probleemverkenning 2 wordt dieper ingegaan op de voorspellende waarde van taaltoetsen. Anderzijds wordt de versterking van de schoolse taalvaardigheid van de leerlingen meteen ook een belangrijk doel voor emanciperend onderwijs. Uiteraard betekent deze relatie niet dat schoolse taalvaardigheid de enige kwestie is die aandacht dient te krijgen in de uitwerking van emanciperend onderwijs. Ook andere factoren beïnvloeden in sterk(er)e mate het succes van een onderwijsleerproces. Van Damme e.a. (2006) bespreken het Vlaams onderzoek dat schoolsucces en effectiviteit van onderwijs in kaart brengt. Schoolsucces wordt in het meeste onderzoek gedefinieerd als ‘achievement criteria’ voor in de eerste plaats cognitieve ‘outcomes’ (met name taal en rekenen). Zij stellen zelf dat ook andere vaardigheden, ‘noncognitive outcomes’, bijdragen tot schoolsucces (cf. ook Reynolds, 1992). Ook de Nederlandse onderwijsraad (2003) pleit voor het meenemen van bijvoorbeeld sociale competenties als schoolsucces in kaart moet worden gebracht. Blommaert & Van Avermaet (2006) waarschuwen eveneens voor een te sterke gerichtheid op taal en taalonderwijs alleen: “Bij een te sterke en exclusieve klemtoon op de kennis van het Nederlands in het kader van gelijke onderwijskansen dreigt de samenhang met en het belang van andere factoren om onderwijsachterstand te bestrijden en kwaliteitsvol onderwijs te realiseren ondergesneeuwd te raken”. In Rapportage Minderheden (1999) wordt in dit verband naast taalvaardigheid ook de cognitieve ontwikkeling van kinderen van laagopgeleide ouders genoemd. Die ontwikkeling wordt dan weer in verband gebracht met de manier waarop ouders met kinderen omgaan, en met de kennis van de wereld van kinderen uit deze groep (zie ook Litjens, 2000). Verder is het belangrijk er hier op te wijzen dat naast schoolse taalvaardigheid ook andere taalkenmerken met schoolsucces in verband gebracht kunnen worden. Zo is menig onderwijsbetrokkene ervan overtuigd dat niet het niveau van schoolse vaardigheid, maar het feit dat thuis een andere taal wordt gesproken de sterkste verklaring biedt voor het zwakke presteren van allochtone leerlingen. Die visie vindt slechts ten dele steun in onderzoeksresultaten (zie o.a. De Meyer, Pauly & Van de Poele, 2004; zie ook hoofdstuk 3). In het huidige GOK-beleid wordt van die samenhang gebruik gemaakt om leerlingen op te sporen van wie men verwacht dat ze een grote kans maken om achterstand op te lopen. Uit de hierboven besproken verschillen tussen de wijze van communiceren op school en in bepaalde
Hoofdstuk 1: Probleemverkenningen
14 thuismilieus kan men afleiden dat niet zozeer het niveau van taalvaardigheid als wel de wijze van communiceren in verband gebracht moet worden met schoolsucces en emanciperend onderwijs. Omdat de opdracht voor deze studie erin bestaat na te gaan welke bijdrage taaltoetsen kunnen leveren voor de ontwikkeling van adequaat emanciperend onderwijs, willen wij ons in wat volgt vooral richten op het niveau van schoolse taalvaardigheid als relevant kenmerk. Het is immers dit niveau dat aan de hand van taaltoetsen in kaart gebracht dient te worden vanwege haar link met onderwijssucces, en dus de basis vormt voor de eventuele bijdrage die die toetsen in dit verband kunnen leveren. Andere taalkenmerken die in dit verband een rol spelen, komen waar relevant aan de orde. In de tweede probleemverkenning willen we inleidend nagaan of we aan de hand van taaltoetsen een betrouwbaar en valide beeld van het taalkenmerk niveau van schoolse vaardigheid kunnen opbouwen.
1.2 Probleemverkenning 2: De relatie tussen (schoolse) taalvaardigheid en taaltoetsen Als niveau van schoolse taalvaardigheid een belangrijke parameter voor schoolsucces vormt, is het van belang dat dat kenmerk op cruciale momenten in de schoolloopbaan in kaart kan worden gebracht. Taaltoetsen lijken het aangewezen middel om deze taalkenmerken op een gestandaardiseerde manier te meten. Met taaltoetsen bedoelen we hier instrumenten waarmee op één welbepaald moment gemeten wordt in hoeverre een leerling een set gestandaardiseerde opgaven of opdrachten kan uitvoeren en waarbij de meetresultaten worden gebruikt om algemene uitspraken te doen over taalkenmerken van een leerling. Het is echter niet zo vanzelfsprekend om geschikte taaltoetsen hiervoor te selecteren en in te zetten. Er zijn immers veel variaties in toetsopzet en toetsinhoud denkbaar waarbij de ene toetsvorm meer inzet op bepaalde kwaliteitskenmerken, bijvoorbeeld efficiëntie en gebruiksgemak, en de andere juist meer op andere kenmerken (zoals betrouwbaarheid). Toetsvormen kunnen ook vanuit heel verschillende benaderingen zijn ontwikkeld. Bovendien dienen we ook stil te staan bij de vraag hoe ‘goed’ schoolse taalvaardigheid zich feitelijk laat meten. Taalvaardigheid is immers geen tastbaar, duidelijk afgelijnd concept. Anders dan het meten van de lengte van een tafel of het vaststellen van iemands gewicht, zal men bij taaltoetsen een theoretisch kader voor het abstracte concept ‘taalvaardigheid’ moeten hanteren. Het is dit theoretisch kader dat ook de basis vormt om de geldigheid of validiteit van een toets aan te tonen. Dat taalvaardigheid niet als een heel concreet kenmerk is vast te stellen, of te meten, heeft tevens repercussies voor de betrouwbaarheid van een taaltoets. In deze probleemverkenning behandelen we de vraag in welke mate verschillende types van taaltoetsen een betrouwbaar en valide beeld kunnen opleveren van schoolse taalvaardigheid, een beeld dat onderwijs in staat kan stellen om de inschatting van het niveau van schoolse taalvaardigheid van leerlingen aan te wenden om zijn emanciperende taak uit te voeren. Daarbij gebruiken we validiteit als een leidend concept. Betrouwbaarheid beschouwen we als een onderdeel van die validiteit. Dit sluit ook aan bij de integrale validiteitsvisie die de laatste jaren internationaal terrein wint (Weir, 2005). Bij de bespreking van de validiteitskwesties, willen we waar relevant voor de discussie ook de relatie tussen validiteit en verschillende types toetsen bespreken. Taaltoetsen kunnen immers op verschillende manieren in types onderverdeeld worden. Wij behandelen in wat volgt de volgende onderscheidingen: direct-
Hoofdstuk 1: Probleemverkenningen
15 indirect; discreet-integratief, norm-criteriumgerelateerd. Vervolgens gaan we in op andere kenmerken van taaltoetsen (o.a. backwash-effect, economie en efficiëntie).
1.2.1 Validiteit Constructvaliditeit en inhoudsvaliditeit Bij het meten van taalvaardigheid moeten we rekening houden met het feit dat we steeds vertrekken van een theoretisch, abstract concept van taal. Met het oog op het verzamelen van garanties voor de validiteit van een toets dient men dan ook de band aan te tonen tussen de theoretische benadering van taalkenmerken en de operationalisering ervan in de toets. Dit noemen we de constructvaliditeit of begripsvaliditeit van een toets: deze geeft aan in hoeverre die toets een goede meting is van het onderliggende theoretisch concept of begrip. Het begrip ‘taalvaardigheid’ kan in grote lijnen vanuit twee verschillende basisvisies op taal benaderd worden. Sommigen zien taal als een verzameling elementen en regels die met elkaar gecombineerd moeten worden tot zinnen en teksten, om zo tot taalactiviteit te komen. Anderen benaderen taalvaardigheid van de andere kant, en leggen vooral de klemtoon op het integrale communicatieve aspect van taalgedrag. Talig functioneren vinden zij niet reduceerbaar tot kennis en combinatie van elementen en regels7. Het is evident dat de inschatting van hoe goed een toets taalvaardigheid meet, sterk bepaald zal worden door de visie op taal die men hanteert. Wie de elementvisie aanhangt, en woordenschat daarbij een cruciaal element vindt, zal een toets naar schooltaalwoordenschat een valide instrument vinden, terwijl een aanhanger van de integratieve visie zich zal afvragen of de leerling de woorden waarvan hij de betekenis misschien uit het hoofd heeft geleerd, ook zou kunnen gebruiken in een naturalistische setting. Bemerk dat deze oppositie niet noodzakelijk hoeft te betekenen dat een aanhanger van de integratieve visie die woordenschattoets noodzakelijkerwijze waardeloos vindt. Hij kan heel goed van mening zijn dat wie in een toets de woordbetekenis niet kan geven, sowieso in een naturalistische situatie niet in staat zal blijken om zich talig adequaat te gedragen. In dat geval geeft de woordenschattoets als het ware indirect informatie over de functioneringsvaardigheid van degene die wordt getoetst. Wat dus vanuit de ene visie op taalvaardigheid een directe toets van een deelvaardigheid is, kan voor iemand met een andere visie op taalvaardigheid als indirecte meting gelden. Het onderscheid tussen directe en indirecte toetsen is met betrekking tot validiteit van belang, omdat indirecte toetsen doorgaans een groter validiteitsprobleem stellen dan directe. Indirecte toetsen gaan uit van de toetsprestatie als indicator voor het construct dat men wil toetsen (woordenschatkennis als indicator voor leesvaardigheid bijvoorbeeld). Wat in de toetssituatie wordt gedaan is niet iets wat men op die manier in reële talige situaties zou moeten doen. Hierbij wordt meestal een bepaald (deel)aspect van taalvaardigheid getoetst en wordt vervolgens een relatie gelegd met het abstracter construct van taalvaardigheid via empirisch onderzoek. Deze indirecte relatie dient men dus te bewijzen.
7
In de literatuur rond taalverwerving speelt deze oppositie momenteel erg sterk, in die mate zelfs dat hier gesproken wordt over een strijd tussen verschillende paradigma’s (zie o.a. Watson-Gegeo 2004, Gregg 2004, Jordan 2005).
Hoofdstuk 1: Probleemverkenningen
16 Bij directe toetsen daarentegen is er sprake van een directe relatie tussen de prestatie in de toets en het construct dat men bij het meten voor ogen heeft. Men toetst de vaardigheid die men in kaart wil brengen rechtstreeks. Vaak wordt daarbij de vaardigheid grondig gedefinieerd en beschreven, waarna door (professionele) toetsontwikkelaars het toetsen van de vaardigheid wordt geoperationaliseerd in toetstaken die het etaleren van de vaardigheid op een rechtstreekse manier uitlokt. Hierbij worden vaak de ontwikkelde toetstaken, alsmede de gehanteerde definitie van de vaardigheid, door een commissie van experts beoordeeld, en zo nodig bijgeschaafd. De experts staan dan als het ware borg voor het feit dat de toetstaken die aan de leerling worden voorgeschoteld, de doelvaardigheid in kaart brengen en garanderen dus zo de validiteit van de toets. Skehan (1998) hanteert voor de directe vorm van taalvaardigheidsmeting Bachmans term ‘real-life approach’. Daarover zegt hij het volgende: “The contrasting real-life approach achieves much greater success in predicting performance in the real world. Since it aims only to predict performance in restricted situations, the test formats that it uses can simply simulate the desired situations fairly accurately, using realistic performance conditions as well as contextually-based material which is close to what will be encountered in the real world (Bachman, 1990). In general, this approach has emphasized [content] validity” (Skehan, 1998:156). Als er dus naar gestreefd wordt om doelstellingen zo direct mogelijk te toetsen, biedt dat, aldus Skehan, een goede garantie dat men op basis van het resultaat van de getoetste ook effectief kan voorspellen dat de kandidaat dit ook buiten de toetssituatie kan. Hierbij komt echter ook een ander aspect van validiteit, namelijk de inhoudsvaliditeit, om de hoek kijken. Wanneer men bijvoorbeeld op basis van een taaltoets een uitspraak wil doen over schoolsucces, bestaat de eerste onontbeerlijke stap uit het inventariseren en expliciteren van de taalvaardigheid die men noodzakelijk acht voor schoolsucces in de vorm van een set te toetsen doelstellingen (Weir, 2005; Skehan, 1998). Vervolgens dient men aan te tonen dat de inhoud van de toets representatief en compleet genoeg is ten aanzien van de set doelstellingen. In het geval dat een toets voor leesvaardigheid als een directe toets wordt opgezet, waarin de kandidaat een tekst moet lezen, moet tevens een keuze worden gemaakt voor een bepaalde tekst of geheel van verschillende teksten. Of die teksten dan representatief zijn, of men met andere woorden op basis van het toetsresultaat kan voorspellen of de kandidaat ook andere teksten zou kunnen lezen, is dan een cruciale vraag. Een toets zal doorgaans niet álle doelstellingen in álle contexten in de vorm van opgaven en opdrachten kunnen bevatten. Bovendien is de set doelstellingen op haar beurt ook een indikking van alle talige situaties waarin een leerling moet kunnen functioneren om op school succesrijk te zijn. Het is van belang dat voldoende doelstellingen en in voldoende variatie aan bod komen in de toets om te kunnen generaliseren naar de hele set van doelstellingen en van daaruit naar het hele doeldomein, met name het schooldomein. Deze inhoudelijke representativiteit en generaliseerbaarheid noemt men inhoudsvaliditeit. Het wordt zo ook duidelijk dat bij de inhoudsvalidering van een taaltoets niet alleen strikt talige aspecten, maar ook contextuele variabelen die de opdrachten in de toets én de talige situaties in het doeldomein karakteriseren, aan de orde zullen zijn. Een ander belangrijk aandachtspunt met betrekking tot het direct toetsen betreft de mogelijk ontoereikende vaardigheden van de toetskandidaten wanneer deze op jonge leeftijd worden getoetst. Dit heeft tot gevolg dat afgeweken moet worden van het ideaal van een echt directe
Hoofdstuk 1: Probleemverkenningen
17 toets. Men wil bijvoorbeeld op basis van een toets een uitspraak doen of de getoetste leerlingen in de nabije toekomst, bijvoorbeeld het eerste leerjaar, in het algemeen op school zullen kunnen functioneren door het toetsen van een basisvereiste die daaraan ten grondslag ligt, bijvoorbeeld het kunnen begrijpen van mondelinge instructies. Of de getoetsten ook, eens ze hebben leren lezen, in staat zullen zijn om schriftelijke instructies te begrijpen, en of ze ook in staat zullen zijn om gaandeweg zelf de nodige taal te produceren, kan nog niet worden nagegaan. In die zin is zo een toets indirect, omdat de uitspraken die op basis van het resultaat worden gedaan, ruimer zijn dan wat er wordt getoetst. Door middel van een onderzoek naar de predictieve validiteit (zie verder) van de toets, kan eventueel bevestigd worden dat deze algemene uitspraken mogen worden gedaan. Hoe dan ook mogen de begrippen ‘direct’ en ‘indirect’ niet als een eenvoudige dichotomie worden beschouwd, maar eerder als uitersten op een continuüm. In de praktijk kunnen alle toetsen ergens op dit continuüm worden gesitueerd, dichter bij de ene of de andere pool, afhankelijk van de aard van de toetsopgave en de visie op taalvaardigheid. De visie op taalvaardigheid die men als toetsontwikkelaar hanteert, is ook van belang bij de kwestie van dimensionaliteit. In de elementvisie kan taalvaardigheid gemakkelijk opgesplitst worden in verschillende deelvaardigheden, en kunnen die deelvaardigheden dan weer opgedeeld worden in aparte aspecten die eendimensioneel zijn. Deze eendimensionele kenmerken vormen vanuit deze visie de beste uitgangspunten voor toetsing. Vanuit een integratieve visie is deze indeling in eendimensionele kenmerken niet echt te maken. Taalgedrag is in deze visie immers steeds een complexe activiteit waarbij verschillende kenmerken op diverse wijze met elkaar interageren. Dit gebrek aan eendimensionaliteit vormt een serieuze uitdaging voor de validiteit van toetsen. In dit verband moeten pleidooien begrepen worden om niet met een toets, maar met een combinatie van toetsen op verschillende aspecten te werken (Dockrell, 2001) of om gebruik te maken van meer dynamische vormen van assessment (Meijer & Elshout, 2001). Ook het onderscheid tussen discrete en integratieve toetsen speelt hierbij een rol. Discrete toetsen proberen een beeld op te bouwen door een complexe vaardigheid in aparte elementen uiteen te leggen. Met discrete toetsen kan men afzonderlijke elementen toetsen, bijvoorbeeld specifieke grammaticale structuren zoals de verleden tijd van werkwoorden. Integratieve toetsen daarentegen proberen, vaak op een indirecte wijze, een beeld te geven van een complexe vaardigheid. Ze weerspiegelen daarmee de integratieve manier waarop vaardigheden ook in reëel taalgebruik aangewend worden. Het is belangrijk om op te merken dat het discreet of integratief karakter van een toets niet alleen bepaald wordt door de aard van de opdrachten in de toets, maar ook door de manier van scoren. Bijvoorbeeld, een integratieve toets zoals een uitnodiging schrijven kan discreet worden gemaakt als de beoordelaars alleen op de werkwoordsvervoeging letten. Gangbare toetsvormen zoals editing toetsen en clozetoetsen zijn voorbeelden van integratieve, maar indirecte toetsen. Een clozetoets bestaat uit een tekst waarbij woorden zijn verwijderd en waarbij toetsdeelnemers de ontbrekende woorden moeten invullen. In een editing toets krijgen toetsdeelnemers een tekst waarin overtollige woorden staan, die moeten worden geschrapt. Wat men de kandidaat bij deze toetsvormen doet, is niet iets wat men onder normale communicatieve omstandigheden zou moeten doen. Niet iedereen acht deze toetstypes dan ook geschikt voor het meten van communicatieve vaardigheid, omdat invullen van woorden in een tekst met gaten of schrappen van overtollige woorden niet iets is wat men in reële talige situaties zou doen.
Hoofdstuk 1: Probleemverkenningen
18 Face validiteit en backwash-effect Construct- en inhoudsvaliditeit spelen een belangrijke rol wanneer men taaltoetsen voor diagnostische doeleinden wil gebruiken. Het diagnosticeren van de tekorten in de taalvaardigheid van leerlingen gebeurt immers steeds in het kader van de theoretische visie die men hanteert op hoe taalvaardigheid zich ontwikkelt. Bovendien dient de toets ook inhoudelijk voldoende genuanceerde informatie op te leveren om een diagnose te kunnen stellen (hierop wordt uitgebreider ingegaan in hoofdstuk 2). In dit verband is ook face validiteit van belang. Met face validiteit wordt verwezen naar de mate waarin de gebruiker van de toets de prestatie die in de toets gevraagd wordt, in verband brengt met het kenmerk dat wordt gemeten. Zo kan via wetenschappelijk onderzoek worden vastgesteld dat het toetsen van de kennis van passieve woordenschat aangeboden in geïsoleerde, niet-functionele contexten of het in kaart brengen van metalinguïstische kennis een betrouwbare, indirecte indicatie oplevert van schoolse taalvaardigheid, maar houdt volgens hedendaagse opvattingen over taalonderwijs (Appel, 2000; Daems, Van den Branden & Verschaffel, 2005) het systematisch onderwijzen van deze twee aspecten een sterk gevaar op een verschraling van het pedagogisch klimaat in, omdat dit wel eens tot een overbeklemtoning van passief woordenschatonderwijs of grammatica-onderwijs zou kunnen leiden. Op die manier is er dan sprake van een ongewenst zogenaamd backwash-effect van de toets. Op het eerste gezicht zijn toetsen die de na te streven standaarden (eindtermen/ontwikkelingsdoelen) op directe wijze in kaart brengen qua voorbeeldfunctie hier in het voordeel, al kan dit bij indirecte toetsen, die bijvoorbeeld zeer hoog zouden scoren op het vlak van betrouwbaarheid, validiteit en efficiëntie, opgelost worden door zeer veel zorg te besteden aan de implementatie en de ondersteuning van het lerarenkorps om op gepaste wijze met de aangeboden toetsen om te gaan. Bovendien bestaan er ook indirecte toetsen (zoals bijvoorbeeld editing toetsen) die geen traditie in het onderwijsgebeuren hebben, en als dusdanig veel minder snel door leerkrachten zullen worden omgezet in onderwijsactiviteiten. Hoe dan ook vormt deze kwestie een niet te onderschatten probleem voor de ontwikkeling van een centraal toetssysteem in een onderwijslandschap dat gekenmerkt is door vrijheid van onderwijs, en dus ook door vrijheid van onderliggende theoretische visie op taalvaardigheid en de verwerving ervan. Bij tussentoetsen (toetsen die tussen begin- en einde van een bepaald traject of onderwijsniveau in kaart brengen of een leerling bepaalde tussendoelen heeft gehaald) zorgen construct-, inhouds- en face validiteit voor een sterke samenhang met het onderwijscurriculum waarin zij een plek krijgen. Ook dat onderwijscurriculum is immers gebaseerd op een theoretische visie op taalvaardigheid en hoe die kan worden ontwikkeld. Wie vanuit een elementvisie een onderwijslijn uitbouwt gericht op het verwerven van een bepaalde woordenschat, zal met tussentoetsen bij voorkeur willen/moeten vaststellen of leerlingen op bepaalde tussenmomenten reeds bepaalde woorden (die zijn onderwezen) hebben verworven. Met andere woorden, daar waar het bij begin- en eindscreening meer is aangewezen om curriculumonafhankelijk te toetsen, is het aangewezen om bij tussentoetsing (ook) curriculumafhankelijk te toetsen. Op die manier kan men immers ook informatie verkrijgen over de efficiëntie van de (leer/onderwijs)weg die men voor de leerling heeft uitgestippeld.
Hoofdstuk 1: Probleemverkenningen
19 Concurrente validiteit Naast construct-, inhouds- en face validiteit speelt ook concurrente validiteit een rol bij de inzet van taaltoetsen om schoolse taalvaardigheid in kaart te brengen. Met concurrente validiteit wordt verwezen naar de mate waarin een toets een werkelijkheidsgetrouw beeld geeft van het kenmerk dat men in kaart wenst te brengen. Hier gaat het dus om de vraag hoe zeker men ervan kan zijn dat een score op een toets een correcte afspiegeling biedt van de werkelijke taalvaardigheid op het moment dat de toets wordt afgenomen. Men kan er zeker niet vanuit gaan dat scores op een taalvaardigheidstoets steeds een betrouwbaar beeld van werkelijke taalvaardigheid geven. We noemen hieronder een aantal kwesties die ons tot voorzichtigheid in interpretatie aan moeten zetten. Een eerste punt in dit verband betreft de stabiliteit van gegevens over taalvaardigheid. Los van de discussie over welke type toets men gebruikt, en welke aspect van taalvaardigheid men meet, blijkt dat, als men dezelfde test twee keer van dezelfde groep afneemt, de ene afname de resultaten van de andere zelden of nooit voor meer dan 70% kan voorspellen. Als gebruik gemaakt wordt van andere tests voor hetzelfde aspect van taalvaardigheid, of van tests voor andere aspecten of deelvaardigheden, daalt de relatie tussen beide toetsen nog gevoelig. In onderzoek worden zelden correlaties tussen toetsen van meer dan .60 gerapporteerd. Ook uit Vlaams onderzoek blijkt dat we meestal te maken krijgen met correlaties in die orde van grootte. Het spreekt voor zich dat het gebrek aan stabiliteit van de meting van taalvaardigheid ertoe leidt dat er in de bepaling van de groep doelgroepleerlingen aan de hand van taaltoetsen steeds sprake zal zijn van een substantiële groep leerlingen die verkeerd ingeschat wordt. Een tweede aspect dat hier van belang is en dat we al aanraakten, is de moeilijkheid om de taalvaardigheid van specifieke groepen op een betrouwbare wijze te toetsen. Zo wijzen zeer veel publicaties op het feit dat proefpersonen jonger dan 6 jaar zeer moeilijk te toetsen blijken (zie hoofdstuk 2). Ook het toetsen van allochtone leerlingen kan problemen (bijvoorbeeld toetsbias) opleveren. Valse positieven – valse negatieven Voor het gebruik van taaltoetsen bij de uitwerking van emancipatiegericht onderwijs komt daarbij dat men aan de hand van de toets graag een onderscheid wil maken tussen zij die op een gegeven moment een achterstand hebben op het gebied van taalvaardigheid en zij die geen achterstand hebben. Om die inschatting te maken moet men de resultaten van elke leerling met een bepaalde maatstaf vergelijken. De afstand tussen de prestatie van de leerling en de maatstaf bepaalt dat of de leerling goed, minder goed of slecht scoort. Die maatstaf kan extern worden vastgesteld (criteriumgerelateerd), of hij kan aan de prestaties van de groep in het algemeen worden ontleend (normgerelateerd). Op basis van die maatstaf kan men een cesuur in de toetsresultaten aanbrengen: wie lager scoort dan de cesuurwaarde wordt geacht een achterstand in taalvaardigheid te hebben; wie boven die waarde scoort, heeft die achterstand niet. Als we in de resultaten op een taalvaardigheidstoets een cesuur aanbrengen tussen de leerlingen die wel en de leerlingen die niet een taalachterstand hebben, en dat gegeven verbinden met de concurrente validiteit van de toets, kunnen we de onderzochte populatie onderverdelen in vier groepen (cf. onderstaande figuur). In kwadrant A staan de leerlingen voor wie de toets terecht aangeeft dat ze taalachterstand hebben, in kwadrant C de groep van wie op grond van de toets terecht wordt aangenomen dat ze geen taalachterstand vertonen. In
Hoofdstuk 1: Probleemverkenningen
20 kwadrant B en D bevinden zich de zogenaamde valse positieven (D) en valse negatieven (B). Valse positieven zijn leerlingen die door de test aangemerkt worden als leerlingen met achterstand, maar die dat in feite niet blijken te zijn. Werkelijke taalvaardigheid D
A
C
B
Resultaten op test Tabel 1.1: Valse positieven en negatieven
Valse negatieven zijn leerlingen die op grond van de testresultaten beschouwd worden als leerlingen zonder achterstand, maar die in feite wel een achterstand hebben8. Vanuit het oogpunt van emanciperend onderwijs, vormen leerlingen in de kwadranten B en D een probleem: valse positieven zorgen ervoor dat aandacht en geld gespendeerd wordt aan leerlingen die in feite geen achterstand hebben, en valse negatieven hebben die extra ondersteuning wel nodig, maar krijgen ze niet. Daarbij vormen valse negatieven vanuit een emancipatieoogpunt een groter probleem dan valse positieven. Predictieve validiteit Als men op basis van de taaltoets wil voorspellen hoe leerlingen in de toekomst zullen presteren, dient men ook bewijzen voor de predictieve validiteit of de voorspellende kracht van de toets aan te leveren. Onder predictieve validiteit verstaat men de mate waarin voorspellingen gedaan op basis van de toetsprestaties, bevestigd worden door observaties op een later tijdstip. Men moet dus de scores van leerlingen op een taaltoets aan het begin van schoolloopbaan vergelijken met gegevens over de prestaties van de leerlingen gedurende hun schoolcarrière. Een hoge positieve correlatie tussen de twee soorten data zal dan betekenen dat de begintoets een goede voorspeller is van schoolsucces. In de eerste probleemverkenning hebben we al de relatie besproken tussen taalvaardigheid en schoolsucces. Daaruit is duidelijk gebleken dat taalvaardigheid in algemene termen valide voorspellingen voor schoolsucces oplevert. Dit algemeen verband betekent echter niet vanzelf dat taalvaardigheid ook inzetbaar is om emanciperend onderwijs vorm te geven. Dat hangt heel sterk af van wat de acties die men op grond van de resultaten wil ondernemen, en het niveau waarop men zich daarbij richt. In de volgende hoofdstukken gaan we dieper op deze kwestie in. Hier willen we volstaan met de vaststelling dat de predictieve validiteit van taalvaardigheidstoetsen ten aanzien van schoolsucces van de individuele leerling niet zonder 8
De termen valse positieven en valse negatieven worden in een deel van de literatuur gereserveerd voor behandeling van concurrente validiteit. In relatie tot predictieve validiteit wordt dan gesproken over specificiteit en sensibiliteit van de predictie. Sommige onderzoekers maken dit onderscheid niet en spreken in beide gevallen over valse positieven en negatieven (zie bijv. Verhoeven & Vermeer, 2005), waarbij de richting positief en negatief dan nog soms wordt omgewisseld. Wij gebruiken in wat volgt de termen valse positieven en valse negatieven in deze ruimere interpretatie, en in de richting die hier wordt aangegeven.
Hoofdstuk 1: Probleemverkenningen
21 meer afgeleid kan worden van de algemene samenhang tussen schoolse taalvaardigheid en schoolsucces.
1.2.2 Efficiëntie en economie Tot slot van dit hoofdstuk willen we nog wijzen op een laatste belangrijk criterium voor een goed meetinstrument: namelijk efficiëntie en economie. In de Engelse literatuur wordt dit criterium doorgaans met één term aangeduid, ‘practicality’. Dit wordt meestal als een iets minder belangrijk principe dan de principes van validiteit en betrouwbaarheid beschouwd, maar het speelt vanaf het plannen of overwegen van een toets al een grote rol én is ook van invloed op de andere principes van kwaliteitsvolle toetsing. Het is vanzelfsprekend dat een uitgekiende toets op vlak van betrouwbaarheid en validiteit die niet haalbaar is in termen van tijd, logistiek en/of kosten, vergeefse moeite is. Efficiëntie Toetsen vraagt heel wat tijd: voorbereidingstijd bijvoorbeeld om de afname-instructies door te nemen, de tijd voor de afname zelf, het scorewerk, het interpreteren en eventueel bespreken van de resultaten…, dat alles nog afhankelijk van de groepsgrootte. Een toets is efficiënt als hij op zo kort mogelijke tijd zoveel mogelijk informatie oplevert en als hij op alle vlakken, dus naast afname ook scoring etc., praktisch in gebruik is. Vaak moeten op dit vlak toegevingen worden gedaan, met het oog op het vervullen van allerlei andere voorwaarden. Deze idealen mogen echter niet uit het oog worden verloren. Een toets mag niet te lang duren, want dan neemt hij teveel kostbare (onderwijs)tijd in beslag. Bovendien kan er bij langdurige toetsen sprake zijn van concentratieverlies, wat mogelijk ruis op de toetsresultaten veroorzaakt. Maar tegelijkertijd dient een toets zoveel mogelijk informatie op te leveren over datgene wat men wil weten. Hoe meer specifieke informatie een toets moet opleveren, hoe meer taken en opgaven een toets moet bevatten, en hoe langer hij dus wordt. Daarnaast geldt ook dat hoe meer items (scoremomenten) een toets bevat, hoe betrouwbaarder het eindresultaat is: hoe vaker men iets meet, hoe zekerder men kan zijn dat het resultaat een juiste weergave van de getoetste vaardigheid is. Het is dus zaak om een goed evenwicht te vinden tussen toetslengte en de informatie die de toets moet opleveren. Het is duidelijk dat ook de validiteit van een toets (dat wat men wil meten) en praktische haalbaarheid soms op gespannen voet komen te staan, en dat er tussen beide weloverwogen keuzes moeten gemaakt worden. De keuze voor een bepaalde toetsvorm houdt een aantal consequenties op het vlak van efficiëntie in. Zo kan men bijvoorbeeld omwille van de efficiëntie kiezen om een gesprekstaak in een toets als een opdracht met meerkeuzevragen te operationaliseren: in plaats van zelf te antwoorden op vragen in een gesprek, moeten de toetsdeelnemers een geschikt antwoord kiezen uit een set van vier alternatieven. Deze manier van antwoorden en daarna het scoren is erg efficiënt, want ze vraagt veel minder tijd, is heel praktisch, want kan klassikaal gebeuren én verhoogt sterk de betrouwbaarheid van de resultaten vanwege de objectieve scoorbaarheid. Op dat punt bestaat er dus geen spanning tussen efficiëntie en het toetsprincipe betrouwbaarheid. Er bestaat wel een spanning met het principe validiteit. De validiteit zou groter zijn als men de leerlingen mondeling zou laten reageren op de vragen in de gesprekstaak.
Hoofdstuk 1: Probleemverkenningen
22 Indirecte toetsen bieden als voordeel dat ze meestal efficiënter in het gebruik zijn, omdat ze slechts deelaspecten of indicatoren meten, en dus minder lang zijn. Vaak opteert men ook voor die aspecten of indicatoren die men via een groot aantal items snel en objectief kan scoren, wat de betrouwbaarheid van deze toetsen aanzienlijk hoog maakt. Het grootste nadeel van indirecte toetsen is, zoals we reeds aanhaalden, dat men moet bewijzen, op basis van theorie of via empirie, dat het getoetste aspect een goede indicator is voor de doelstelling of vaardigheid die men voor ogen heeft. Economie Praktisch haalbaar moet een instrument ook op het vlak van de ermee samenhangende kosten zijn. De toets moet, zoals elk product op de markt, economisch zijn: de kosten moeten in verhouding zijn tot het kunnen inzetten van de toets en het gebruiken van de toetsresultaten. Deze kosteffectiviteit van een toets is een belangrijk criterium om al dan niet over te gaan tot het inzetten van de toets. Wanneer de kosten van een toets geraamd worden, moeten de kosten in alle fasen van het toetsproces tot en met het uiteindelijk kunnen gebruiken van de resultaten in rekening worden genomen. Dat betekent dat niet alleen de kost van het ontwikkelen van het instrument, inclusief bijvoorbeeld pretesting, normerings- of cesuurbepalingsonderzoek berekend moet worden, maar evengoed de afnamekosten, en de scoringskosten. Ook hier blijft het tegemoet komen aan de verschillende principes niet altijd een gemakkelijke evenwichtsoefening. Wanneer men bijvoorbeeld in het kader van centraal georganiseerde toetsing kiest voor het inzetten van getrainde externe toetsafnemers en beoordelaars met het oog op een zo hoog mogelijke betrouwbaarheid van het toetssysteem, dan moet ook de werktijd van deze afnemers betaald worden. Dat verhoogt aanzienlijk de kosten die met een dergelijk centraal toetssysteem gepaard gaan. Ook bij het ontwikkelen en implementeren van toetsen zal men dus steeds een kosten-baten analyse moeten maken, waarbij validiteit, betrouwbaarheid, ‘practicality’ en backwash-effect centraal staan en met elkaar in evenwicht moeten worden gebracht.
Hoofdstuk 1: Probleemverkenningen
23
2 Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning In dit hoofdstuk gaan we in op de wenselijkheid, opportuniteit en haalbaarheid van het invoeren van taaltoetsen in functie van het verhogen van de kwaliteit van ondersteuning die aan leerlingen met een ‘taalachterstand’ kan worden geboden. Het basisidee achter deze functie is dat met taaltoetsen een screening en diagnose kan worden uitgevoerd van de schoolse taalvaardigheid van de leerlingen, en dat aan die screening en diagnose een krachtig gevolg (in de vorm van betere ondersteuning aan individuele leerlingen of aan groepen van leerlingen) kan worden gegeven. Uit het bovenstaande blijkt dat we bij het bespreken van deze functie een onderscheid zullen moeten maken tussen diverse mogelijke aanwendingen van taaltoetsen. Dat zullen we doen op basis van twee dimensies: 1. de dimensie ‘diepgang’ van evaluatie, waarbij een onderscheid moet worden gemaakt tussen screening en diagnose; 2. de dimensie ‘niveau’ van evaluatie, waarbij een onderscheid kan gemaakt worden tussen het niveau van de individuele leerling, het niveau van de school, en het niveau van het onderwijssysteem. De combinatie van deze twee dimensies geeft in principe aanleiding tot 6 combinatiemogelijkheden: 1. 2. 3. 4. 5. 6.
screening op leerlingniveau; diagnose op leerlingniveau; screening op schoolniveau; diagnose op schoolniveau; screening op systeemniveau; diagnose op systeemniveau;
In dit hoofdstuk zullen we voornamelijk focussen op 1-4, omdat in de opdracht duidelijk vermeld staat dat het de overheid in de eerste plaats te doen is om het invoeren van taaltoetsen die het schooleigen taalbeleid (de ‘interne kwaliteitszorg’) positief kunnen beïnvloeden. Daar waar relevant zullen we in de bespreking van deze 4 combinatiemogelijkheden de overige 2 (op systeemniveau) mee betrekken. Bij wijze van inleiding lichten we het bovenvermelde verschil tussen screening en diagnose eerst verder toe. Bij screening (of ‘signalering’) ambieert men in de eerste plaats om prestaties in kaart te brengen en vanuit een vergelijking met ofwel een criterium, de prestaties van andere leerlingen of de onderlinge vergelijking van de leerling met zichzelf, een uitspraak te doen over het kwaliteitsniveau van de geleverde prestatie. Dat kwaliteitsniveau kan men op diverse wijze uitdrukken, gebruikmakend van schalen, percentielen, absolute cijfers, codes of zelfs verbale commentaar. De basisfunctie van screening op leerlingniveau is een uitspraak te doen over de mate waarin de prestatie als voldoende of onvoldoende kan worden beschouwd, waarbij deze twee termen uiteraard met verdere verfijningen genuanceerd kunnen worden. Diagnose daarentegen heeft tot doel om achter de prestatie te kijken, en met name te ontleden (a) welke processen aanleiding hebben gegeven tot de geleverde prestatie, en (b) welke aspecten van de prestatie wel succesvol waren, en welke andere aspecten niet. Bij diagnose heeft de evaluator de ambitie om een gedetailleerd zicht te krijgen op de wijze waarop de leerling de toetstaak heeft aangepakt en op de subniveaus van taakuitvoering die hij wel en Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
24 niet beheerst, om op die manier veel meer informatie te verkrijgen over de wijze waarop de doelcompetentie bij de leerder kan worden bevorderd. Daarbij is het vaak van belang om het composiet van kennis, vaardigheden en attitudes die bij het leveren van de doelprestatie om de hoek komen kijken, te ontleden, en ze in de prestatie van de leerling na te gaan, teneinde een scherper zicht te krijgen op hoe de verdere ondersteuning van de leerling het best vorm kan krijgen. Om het anders te verwoorden, screening (of ‘signalering’) kan tot op zekere hoogte blootleggen wiens prestatie problematisch is, en hoe problematisch die is, maar er is diagnose nodig om te analyseren (a) welke processen aanleiding hebben gegeven tot de ‘problematische’ prestatie, en (b) welke deelvaardigheden, -kennis, en attitudes wel en niet verworven zijn. Hieruit volgt dat wie lessen wil trekken over het beter ondersteunen van leerlingen via screening slechts vrij algemene informatie verkrijgt (voornamelijk over wie voor diepgaandere ondersteuning in aanmerking komt), terwijl diagnose kan leiden tot gerichtere info over welke vorm de ondersteuning het best aanneemt en op welke vaardigheden, kennis en attitudes ze zich primair hoort te richten om enig leereffect tot stand te brengen. “Om leerproblemen doeltreffend aan te pakken, is het belangrijk dat je zo goed mogelijk weet wat er aan de hand is. (Een goed evaluatie-instrument) voorziet dan ook tussen het signaleren en het handelen een diagnostisch moment.” (Billiaert & Grysolle, 1998: 36). De complexiteit en uitgebreidheid van de diagnose neemt toe naarmate de competentie die in kaart wordt gebracht complexer wordt. Om dit te illustreren en te concretiseren zullen we hieronder, bij wijze van voorbeeld, even ingaan op het verschil tussen technisch lezen en begrijpend lezen. Van technisch lezen (het vlot en automatisch decoderen van schriftbeelden) wordt algemeen aangenomen dat het een vaardigheid is die een overzichtelijk en beschrijfbaar geheel van deelprocessen en deelvaardigheden omvat (Leseman, 2000; Vernooy, 2004; Van den Broeck, 2004). In leerlingvolgsystemen wordt technisch lezen omschreven als een vaardigheid die een welbepaald aantal, vrij goed te omschrijven deelvaardigheden omvat, zoals het maken van grafeem-foneemkoppelingen, het auditief synthetiseren van fonemen tot een auditief woordbeeld, het auditief analyseren van schriftbeelden tot afzonderlijke fonemen en het direct herkennen van woordbeelden. De meest gebruikte methodes voor technisch lezen (bijvoorbeeld Veilig Leren Lezen) bevatten dan ook een uitgebreide instructiemethode waarbij deze afzonderlijke deelprocessen systematisch worden gedemonstreerd en uitgelegd aan de leerlingen en vervolgens ingeoefend, teneinde tot een verregaande automatisering van het decoderingsproces te komen. De relatieve eenvoud van deze ‘mechanistische’ vaardigheid leidt er ook toe dat het mogelijk is een leerlingvolgsysteem voor technisch lezen te ontwikkelen waarbij het niet alleen mogelijk is prestaties van leerlingen te screenen, maar ze verregaand te diagnosticeren, met het oog op het gericht ondersteunen op deelvaardigheden die te traag worden ontwikkeld. In het in Vlaanderen veel gebruikte leerlingvolgsysteem van het VCLB (Billiaert & Grysolle, 1998) en het Leerlingvolgsysteem voor Vlaanderen (vervlaamsing van Cito-LVS, 20039) gebeurt een eerste screening (signalering) van technisch lezen met de minutentoetsen die op regelmatige tijdstippen worden afgenomen, voornamelijk 9
Bij dit LVS is gebruik gemaakt van IRT, waardoor het minder afhankelijk is van de steekproef bij wie de toets is afgenomen. Alle items staan op één schaal. Op verschillende meetmomenten hoeft men slechts een deel van de toets af te nemen. Zo kan men de vooruitgang van individuele leerlingen op die manier in kaart brengen.
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
25 in het eerste tot en met het derde leerjaar. Bij deze screeningstoetsen laat men leerlingen tegen de tijd woordbeelden hardop verklanken. De tijdsfactor en correctheid geven een indicatie van de mate waarin de leerling vlot en automatisch (tijdsdimensie) en accuraat (correctheid) technisch leest. Leerlingen die vanuit deze eerste screening een prestatie leveren die onder het gewenste niveau ligt (i.e. normcategorieën D en E, gebaseerd op percentielen van een grote representatieve steekproef) of die plots een bruuske daling in normcategorie vertonen, worden in het VCLB-LVS aan een diagnose onderworpen (de zogenaamde ‘analyse’) die tot handelen moet kunnen leiden (vandaar ‘handelingsgerichte diagnostiek’). Bij deze analyse moeten de leerlingen bijkomende technisch-leesprestaties leveren (bijvoorbeeld het hardop voorlezen van contrasterende paren) om te ontdekken welke aspecten van het decodeerproces zij al wel hebben verworven en welke niet, en welke factoren remmend optreden bij het vlot verwerven van de technisch leesvaardigheid. Vervolgens kunnen dan aangepaste oefeningen aan de leerling worden aangeboden. Daar waar de focus (i.e. het aantal mogelijke bepalende deelprocessen) bij technisch lezen nog vrij overzichtelijk is, ligt dat bij begrijpend lezen helemaal anders. De cognitieve operaties, (voor)kennis en de basisattitudes die nodig zijn om een begrijpend-leestaak tot een goed einde te brengen zijn bijzonder veelomvattend, zelfs in die mate zo dat tot op heden de taalwetenschap de complexiteit van begrijpend-leesprocessen nog niet volledig in kaart heeft weten te brengen. De meest vooraanstaande basiswerken in dit verband (Kintsch & van Dyck, 1978; Kintsch, 1998; Perfetti, 1985) duiden op een aantal clusters van subprocessen die bij het uitvoeren van begrijpend-leestaken om de hoek komen kijken, met name: (a) algemeencognitieve mentale handelingen; (b) linguïstische deelprocessen en (c) attitudinele processen. Onder deze clusters gaat telkens een grote veelheid van handelingen en strategieën, soorten kennis en attitudes schuil. (a) algemeen-cognitieve mentale handelingen omvatten o.a. het oproepen van de gepaste concepten en kennis van de wereld bij de tekst; het uitvoeren van ‘cognitive comparisons’ waarbij informatie in de tekst wordt vergeleken met kennis die hierrond reeds werd verworven, het maken van voorspellingen op basis van de reeds verwerkte informatie; het beoordelen van de functie van de tekst en het breed reflecteren op de geboden informatie; het toepassen van de tekst in levensechte contexten; het inzetten van algemeen-probleemoplossende vaardigheden en compensatiestrategieën; het meta-tekstueel monitoren van taakuitvoering (door het afwegen van doel, gewenste output en geleverde output ten opzichte van elkaar); (b) onder linguïstische kennis hoort o.a. het verbinden van de gedecodeerde woordbeelden met concepten op woordniveau; het interpreteren van volgorde, morfemen om een syntactische analyse van de zinnen te maken; het ontrafelen van de betekenis van moeilijke woorden of zinnen; het maken van inferenties van impliciet gebleven informatie; het samenbrengen van informatie die thematisch/conceptueel bij mekaar hoort; het structureren van de tekst op basis van signaalwoorden, e.d.; het onderscheiden van hoofdzaken en bijzaken; het linken van verwerkte informatie aan een betekenisintentie van de zender en het daarbij verwerken van socio-pragmatische informatie (tot stand brengen van gezamenlijke referentiekaders, interpreteren van ironie en dubbelzinnige boodschappen, het interpreteren van ‘sociale’ info vervat in de tekst (bijvoorbeeld de impact van woordkeuze op beeldvorming en sociale relaties); het inzetten van gepaste leesstrategieën naargelang het doel van de tekst (bijvoorbeeld scannend lezen);
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
26 (c) attitudinele processen: het investeren van mentale energie in het begrijpen van de tekst; het volhouden van die mentale energie bij het optreden van begripsmoeilijkheden; het inzetten van empathische vermogens (bijv. zich verplaatsen in het standpunt en de intentie van de zender); het kritisch benaderen van de tekst vanuit eigen emoties, opinies en kennis; het inroepen van hulp van anderen op een positieve manier. De bovenstaande lijst is niet exhaustief, en kan op zeer diverse manieren worden gestructureerd. Bedoeling van de opsomming hierboven is duidelijk te maken dat begrijpendleesprocessen een complexe interactie tussen tekst en lezer vereisen, en dat indien problemen bij het opbouwen van leesbegrip ontstaan, deze op ontelbaar verschillende wijzen kunnen ontstaan. Bij diagnose van begrijpend-leesproblemen zal met dat uitgangspunt rekening moeten worden gehouden, wat de diagnose er in vergelijking met technisch lezen, niet minder noodzakelijk, maar wel veel complexer op maakt: “…children bring a range of cognitive and linguistic strengths and weaknesses to the task of reading. Accurate and full assessments of the nature of reading difficulties are important as they allow for the most appropriate type of intervention to be chosen.” (Nation & Snowling, 1997: 369). Een gelijkaardige toename van complexiteit doet zich voor bij het screenen en diagnosticeren van spelling versus functionele schrijfvaardigheid, en bij het screening en diagnosticeren van uitspraak versus functionele spreekvaardigheid. 2.1 Screening van taalvaardigheid op leerlingniveau 2.1.1 Directe versus indirecte screening Wie de taalvaardigheid van leerlingen via screening in kaart brengt, creëert een voorstelling van een bestaande situatie. Die voorstelling wordt gebaseerd op een prestatie van de leerling, die gerelateerd wordt aan een bepaald construct (bijvoorbeeld een tekst lezen en er tien vragen over beantwoorden als indicator van begrijpend-leesvaardigheid). Vervolgens moet die prestatie gerelateerd worden aan een maatstaf, om een oordeel te kunnen vellen over de vraag of er zich een probleem stelt of niet. Het doen van uitspraken over ‘problemen’ van individuele leerlingen hangt dus in sterke mate af van: a) de mate waarin de door de leerling geleverde prestatie een afspiegeling of aanduiding vormt van de vaardigheid die men voor ogen heeft; b) de maatstaf die men hanteert; c) de relatie tussen de door de leerling geleverde prestatie en de maatstaf die men hanteert. Een analyse van de bestaande toetsen en leerlingvolgsystemen (zie bijlage 1 voor een gedetailleerde bespreking van de bestaande toetsen10) in Nederland en Vlaanderen geeft een duidelijk beeld van welke methodieken veelal worden gebruikt om prestaties van leerlingen in kaart te brengen op het vlak van taalvaardigheid. 10
De referenties naar toetsen in deze tekst worden niet in de literatuurlijst opgenomen, omdat ze in bijlage 1 staan.
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
27 Wat in bijlage 1 opvalt, is dat de link tussen prestatie en construct op verschillende manieren tot stand wordt gebracht en beargumenteerd. Twee grote categorieën vallen te onderscheiden: a. ‘directe’ relatie tussen prestatie en construct (cf. probleemverkenning 2 in hoofdstuk 1). Een heel aantal toetsen die voorhanden zijn, meten functionele taalvaardigheid op een directe manier, i.e. door de leerling te confronteren met functionele taaltaken. Dat is o.a. het geval voor de Vlaamse periodieke peilingsinstrumenten voor luisteren, lezen en schrijven aan het einde van het basisonderwijs, de VLOT-toetsen, sommige van de Cito-toetsen, en de TASANtoets (voor het einde onthaalklas in het secundair onderwijs). In veel van deze gevallen werd de ‘directheid’ van de toetsen gevalideerd door een commissie of resonansgroep van experts; b. ‘indirecte’ relatie tussen prestatie en een hoger gelegen construct. Hierbij wordt meestal een bepaald (deel)aspect van taalvaardigheid getoetst en wordt vervolgens een relatie gelegd met een hoger gelegen construct (bijvoorbeeld schoolse taalvaardigheid of schoolsucces) door middel van wetenschappelijk onderzoek. Dit is o.a. het geval bij toetsen als TAL, TALK, de TAK (Taaltoets alle kinderen), en ook bij het genre ‘edittoetsen en clozetoetsen’. Zo werd voor de TAL, die het mondelinge begrip van stukjes taalaanbod of contexten, opgebouwd rond relevante schoolse woordenschat, door kleuters aan het einde van de derde kleuterklas in kaart brengt, een predictief validiteitsonderzoek uitgevoerd, waarbij bleek dat de TAL een sterke voorspellende waarde had naar het schoolsucces van de leerlingen aan het einde van het eerste leerjaar (Werkgroep Taaltoetsen, 1995). Gelijkaardig onderzoek werd o.a. voor de Nederlandse TAK uitgevoerd (Verhoeven en Vermeer, 2005). Voor cloze- en edittoetsen werd onder andere door Kerkhoff (1995) de relatie tussen prestaties op dergelijke toetsen en schoolresultaten onderzocht, waarbij werd vastgesteld dat edittoetsen en clozetoetsen een sterk verband vertoonden met schoolsucces, en als dusdanig een goede indicatie van de schoolse taalvaardigheid van individuele leerlingen biedt. Een ander voorbeeld betreft de schrijftaken in sommige diocesane en interdiocesane toetsen van het katholiek basisonderwijs. Hierbij wordt door de toetsontwikkelaars aangenomen dat leerlingen niet zelf hoeven te schrijven om hun schrijfvaardigheid te tonen, maar dat ook een beoordeling van andermans schrijfproducten (dus indirecte meting) hiervan een goede voorstelling kan bieden. Het zeer sterk verspreide VCLB-leerlingvolgsysteem en de vervlaamste versie van het Cito-LVS (Leerlingvolgsysteem voor Vlaanderen) beogen in de eerste plaats een directe meting van technisch lezen en spelling, maar wordt door scholen die niet beschikken over directe toetsen voor functionele taalvaardigheid, vaak ook gehanteerd als een indirecte indicator van die functionele taalvaardigheid. Deze relatie is echter omstreden: de relatie tussen bijvoorbeeld technisch leesvaardigheid en begrijpend lezen is vrij complex, en het is niet zo dat iedere leerling die sterk technisch kan lezen zich ook ontpopt tot een goede begrijpend lezer (Leseman, 2000; Van den Broeck, 2004). Het overzicht in bijlage 1 van de bestaande toetsen en leerlingvolgsystemen in Nederland en Vlaanderen leert dat heel wat van de op dit moment sterk verspreide instrumenten voor een indirecte meting van taalvaardigheid kiezen (vooral dan bij de jonge kleuters), of voor de directe meting van technische deelaspecten van taalvaardigheid (technisch lezen en spelling bij uitstek). Op kleuterniveau is er een behoorlijke lacune voor wat betreft de directe meting van functionele schooltaalvaardigheid; dat stelden Van den Branden et al. (2001) reeds vast in
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
28 hun analyse van de beschikbaarheid van directe meetinstrumenten voor de functionele taaldoelen voor allochtone kleuters op het einde van het kleuteronderwijs. Met name de functionele spreekvaardigheid (en ook luistervaardigheid) van de kleuters wordt slechts mondjesmaat in kaart gebracht. De bestaande kleutertoetsen focussen vooral op woordenschatkennis en metalinguïstische kennis (leesvoorwaarden). Van den Branden et al. (2001) concluderen dat er voor het einde van het kleuteronderwijs (of begin eerste leerjaar) geen screeningsinstrument voorhanden is dat op directe wijze de functionele taaldoelen van de Vlaamse ontwikkelingsdoelen en Nederlandse tussendoelen in kaart brengt. Op het niveau van het lager onderwijs zijn er wel toetsen voor de directe meting van functionele taalvaardigheid, maar ook hier is het aanbod niet volledig dekkend. De Cito-toetsen zijn uit Nederland afkomstig, wat soms tot een verschil in taalgebruik en terminologie leidt (van sommige toetsen werd ondertussen wel een Vlaamse versie geproduceerd, maar ook hier ligt de focus op technisch lezen en spelling), terwijl het Vlaamse VLOT in haar normcategorieën vooral goed naar de lagere scores differentieert (omdat het zich vooral op OVB-scholen richtte) en minder sterk naar de hogere scores. De Vlaamse periodieke peilingsinstrumenten vertonen een hoge betrouwbaarheid en goede indicaties qua validiteit en linking met de eindtermen, maar beperken zich tot het einde van het lager onderwijs, en zijn in essentie bedoeld om informatie te verschaffen op systeemniveau, eerder dan op individueel leerlingniveau. 2.1.2 Wanneer screenen? In bijlage 1 valt ook op dat de bestaande screeningsinstrumenten op zeer verschillende momenten in de onderwijsloopbaan van de leerlingen worden afgenomen. Op de eindscreenings van Cito en de periodieke peilingsinstrumenten na, hebben de meeste toetsen expliciet de bedoeling om een tijdige screening mogelijk te maken, namelijk op het moment dat er nog tijd is voor diagnose en een langdurige leerlinggerichte ondersteuning. In dit verband tonen meta-analyses van schooleffectiviteitsonderzoek (Teddlie & Reynolds, 2000; De Maeyer & Rymenans, 2004; Scheerens & Bosker, 1997; De Fraine et al., 2003) dat voor schoolsucces in het algemeen, en voor schoolse taalvaardigheid, het opvolgen van de leerlingen (bijvoorbeeld via het hanteren van een leerlingvolgsysteem) een kenmerk is van krachtig onderwijs (naast andere factoren zoals hoge verwachtingen, sterk leiderschap, effectief gebruik van de leertijd, samenstelling van de klas). Screening op leerlingniveau heeft dus vaak de functie van het alarmsignaal dat gaat knipperen en dat schoolteams alert kan maken op het feit dat sommige leerlingen extra zorg behoeven. In veel landen (o.a. Nederland, Duitsland, Verenigde Staten) begint men zeer vroeg met de eerste screenings. Reeds op 4-jarige leeftijd (en soms zelfs vroeger (bijvoorbeeld Zweden)) worden leerlingen aan taaltoetsen onderworpen met de bedoeling om vroegtijdig taalachterstanden op te sporen of om aan bepaalde leerlingen gerichte ondersteuning te kunnen geven. Zo kreeg ook in Vlaanderen een beginmeting voor 4-jarigen opnieuw aandacht naar aanleiding van de actuele praktijk in Noord-Rijnland-Westfalen. Na moeizame debatten keurde het parlement daar onlangs een resolutie goed om bij alle vierjarige kleuters vast te stellen in welke mate ze Duits spreken. Ook in andere deelstaten vindt het idee steeds meer ingang. De idee hierachter is dat vroegtijdige detectie van taalachterstand kan leiden tot betere ondersteuning. In Engeland, Schotland, Australië en Nieuw-Zeeland wordt momenteel van 4jarige kleuters de PIPS-toets afgenomen. In Nederland is een vertaling van deze toets gemaakt (de OBIS-toets, ITS, 2005). Nog in Nederland bieden o.a. de Toets Tweetaligheid en de TAKonderbouw, beide van het Cito, de kans om op jonge leeftijd een indicatie te krijgen van de
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
29 taalvaardigheid van jonge kleuters. In Vlaanderen is er het Kleuterobservatie-instrument Taalvaardigheid, bedoeld voor afname in de tweede kleuterklas, sterk verspreid. Al deze instrumenten roepen in de wetenschappelijke onderzoeksliteratuur de vraag op vanaf welke leeftijd kleuters überhaupt toetsbaar zijn. Uit een screening van bestaande kleutertoetsen voor de eerste kleuterklas in het doctoraatsonderzoek van Verhelst (2002) bleek dat kinderen voor de leeftijd van 4 jaar nauwelijks te toetsen zijn. Ook Leibing (1999) komt tot deze conclusie. In het onderzoek van Verhelst waarbij woordenschattesten van 2,5 tot 3jarige kleuters werden afgenomen, bleek de betrouwbaarheid (alsook de haalbaarheid van afname) problematisch. Jonge kleuters kunnen zich bijvoorbeeld nauwelijks langer dan 10 minuten concentreren en moeten al erg vertrouwd zijn met de testafnemer vooraleer ze aanspreekbaar zijn. Als het om anderstalige kleuters gaat, is er bovendien de vraag naar de begrijpelijkheid van de instructies. Bij kinderen die in het Nederlands worden getoetst terwijl ze die taal nog niet goed spreken, is niet duidelijk waardoor een fout antwoord veroorzaakt wordt: door het niet begrijpen van de vraag, of door het niet weten van het goede antwoord. Volgens ontwikkelingspsychologen (bijv. Goorhuis, 200511; Geert, 200512) vertoont kleuterontwikkeling bovendien zulke grillige patronen en zoveel fluctuaties in prestaties (“kleuters verschillen meer van zichzelf dan zij van anderen verschillen”) dat toetsen van jonge kleuters een heel precaire aangelegenheid wordt. Op basis van haar studie van kindvolgsystemen, concludeerde Bijlsma (2004): “Jonge kinderen presteren in een testsituatie niet altijd optimaal. Zij zijn niet altijd gemotiveerd om mee te doen, voelen zich niet altijd veilig bij onbekenden, weten niet altijd wat van hun in de testsituatie wordt verwacht. Dit alles kan de prestatie negatief beïnvloeden. Het beeld van de ontwikkeling van het kind is het meest betrouwbaar vast te stellen in een voor kinderen veilige en vertrouwde situatie, waarin het kind actief en spontaan betrokken is bij het op het kind ingestelde activiteiten”. (Bijlsma, 2004: 25) Dezelfde spanning tussen de betrouwbaarheid en validiteit van testing bij jonge kleuters en de gevolgen die er vaak toch aan worden verbonden, vinden we terug in de conclusies van de bevindingen van de Association for Childhood Education International (ACEI, 1991): "…Testing does not provide useful information about individual children, yet often becomes the basis for decisions about children's entry into kindergarten, promotion and retention in the grades, and placement in special education classes.”13 In opdracht van de Nederlandse onderwijsminister Netelenbos onderzocht ontwikkelingspsycholoog Kohnstamm (Commissie Indicatiestelling Onderwijsachterstanden, 1996) de zin van een centrale test voor vierjarigen. Kohnstamm bestudeerde bestaande testen in Nederland, Engeland en Amerika, en kwam tot de conclusie dat ze zeer weinig voorspellende waarde hebben, in puur psychometrische zin wel ‘in zekere zin betrouwbaar’ kunnen zijn, maar dat de validiteit (en voorspellende kracht) van de testen veel problematischer is. Verhoeven & Vermeer (2005) en de Commissie Indicatiestelling Onderwijsachterstanden concludeerden dat de kleutertoetsen slechts indicaties van taalachterstand en zorgbehoeften op dat vlak bevatten, die überhaupt niet waterdicht zijn, 11
http://www.onderde18.vrijeschooldenhaag.nl/site/ouders/kleuters_hoeven_bij_ons_niet_te_presteren van Geert, P., Een vrolijke chaos. Over de vorm van vroege ontwikkelingsprocessen. Zwolle 25 november 2005, congres "De kleuterschool moet terug!": http://www.kleuterschoolterug.nl/100654 13 http://users.stargate.net/~cokids/Standard.testsNOT.html 12
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
30 noch naar de beslissing over welke kleuters precies extra zorg behoeven (zie verder hoofdstuk 3), noch naar wat voor soort ondersteuning de kleuters dan precies nodig hebben (zie deel diagnose van dit hoofdstuk). Staatssecretaris Netelenbos zag onder andere op basis van Kohnstamms advies (en dat van de onderwijsraad, cf. verder) van de toets af14. Een blik op de Cito-toetsen voor kleuters, en de bovenvermelde, internationaal opgang makende PIPS-toets, tonen aan dat met dit soort kritische overwegingen wel degelijk wordt rekening gehouden door de toetsontwikkelaars. Zo presenteren deze toetsen zich in de eerste plaats als (genormeerde) indicatoren van taalachterstand die moeten worden aangevuld met de observaties die leerkracht tijdens de dagdagelijkse bezigheden in de kleuterklas vaststelt, en die voor een groot gedeelte zelfs die observaties zullen bevestigen. Bovendien hoeden de handleidingen van deze tests zich om uitspraken te doen over met welke specifieke didactische ondersteuning op lage prestaties moet worden gereageerd. PIPS vermijdt dat zelfs volledig, terwijl de Cito-handleidingen verwijzen naar algemene principes van een goede taalvaardigheidsaanpak (zoals veel taalaanbod, veel vertellen en voorlezen, aandacht voor woordenschat, etc.). Het meest voor de hand liggende gebruik van de toetsen is volgens de handleiding dat van een herhaalde screening. De gebruikers wordt aangeraden om bij de leerlingen de toets af te nemen, vervolgens een krachtige taalvaardigheidsaanpak te ontwikkelen en daarbij gedifferentieerde ondersteuning te voorzien aan de leerlingen die laag scoorden, en ten slotte (bijvoorbeeld een jaar na de eerste afname) de toets opnieuw af te nemen om te kijken of het kind in ontwikkeling is. Deze inzet van de kleutertoets is grotendeels conform met de filosofie van het Vlaamse Kleuterobservatie-instrument Taalvaardigheid (KOBI-TV), dat bij 4-jarigen (tweede kleuterklas) wordt afgenomen. Ook met de afname van deze toets kan de leerkracht de scores van de leerling vergelijken met Vlaamse (en specifieke OVB-normen), en wordt de school vervolgens aangeraden om een krachtige taalvaardigheidsaanpak te ontwikkelen in heterogene groepen (waarbij wordt vermeden dat de taalaanpak naar de zwak-presterende kleuters wordt gereduceerd tot het geïsoleerd aanleren van woordenschat en grammatica in aparte klasjes), en vervolgens op een later moment het instrument opnieuw af te nemen om de groei van taalvaardigheid systematisch op te volgen. Ook hier wordt duidelijk aangeven dat een dergelijke kleutertoets, gezien de leeftijd van de kinderen, niet geschikt is voor een volledige diagnose van de taalkenmerken van het kind, en dat daarvoor gerichte en brede observatie van de kleuter doorheen de klasdag(en) nodig is. Recentelijk onderzocht de Nederlandse onderwijsraad (2003) de vraag of het noodzakelijk is dat een begintoets voor vierjarigen een rol speelt in de bepaling van toegevoegde waarde van scholen (cf. 2.3.2): “Toetsmethoden die bij jonge kinderen niet goed uitvoerbaar zijn, zijn bijvoorbeeld de traditionele gestandaardiseerde papier- en pentesten; onder andere vanwege de nog beperkte leesvaardigheid, korte spanningsboog en de neiging tot onvoorspelbare reacties in toetssituaties. Leeftijd geeft een globale indicatie van de mate van ontwikkeling, maar hierbij moet wel bedacht worden dat leeftijd een objectieve, administratieve aanduiding is, die slechts als een ruwe indicator van ontwikkelingen en ontwikkelingsniveaus mag worden opgevat. Gezien de grote variatie in de capaciteiten van kinderen op allerlei terreinen is het verstandig instrumentatie te gebruiken met een groot bereik qua ontwikkelingsniveau (Mooij, 2000). Zo moet een kind van zes jaar waarvan het ontwikkelingsniveau vergelijkbaar is met het 14
Cf. http://ocw.epona.nl/OCWvragen.asp?VraagId=318
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
31 ontwikkelingsniveau van het 'gemiddelde' vierjarig kind, de toets ook kunnen maken. Met andere woorden, bij het ontwerp van een meetinstrument dient een groot bereik in ontwikkelingsniveau centraal te staan, uitgaande van het niveau van het gemiddelde zesjarige kind. Een factor die toetsen op jonge leeftijd problematisch maakt is dat kinderen gauw zijn afgeleid, waardoor scores per dag kunnen verschillen (Commissie Indicatiestelling Onderwijsachterstanden, 1996). Naarmate kinderen ouder worden spelen deze problemen minder. Tot slot moet een toetssysteem in schoolse situaties inzetbaar zijn en, afhankelijk van de functie, te hanteren zijn door het onderwijzend personeel dan wel door externe toetsafnemers. Omdat de klassieke grootschalige schriftelijke toetsen voor jonge kinderen niet bruikbaar zijn, zal individueel getoetst moeten worden, hetgeen veel tijd en deskundigheid vergt. Financiën en beschikbaarheid van deskundigheid spelen derhalve een grote rol.” (Onderwijsraad, 2003: 28-29). Mede op basis van een studie in 2002 komt de Nederlandse Onderwijsraad tot de conclusie dat pas vanaf de leeftijd van ca. 6 jaar centrale toetsing van kleuters meerdere toepassingsmogelijkheden (o.a. voor het bepalen van toegevoegde waarde) schept: “De taxatie hierbij is dat omstreeks deze leeftijd, als ruwe aanduiding van ontwikkelingniveau, er meer mogelijkheden voor de inzet van toetsinstrumenten zullen zijn die eenvoudig zijn af te nemen. Dit maakt het makkelijker dergelijke toetsen in te passen in een systeem voor het vaststellen van de toegevoegde waarde. Bovendien is toetsing in een eerder stadium minder geschikt vanwege de ongelijke instroommomenten van leerlingen. Praktisch biedt een meetmoment omstreeks het zesde jaar ook voordelen: • toetsing vergt minder tijd; • toetsen zijn klassikaal afneembaar; en • de meting is betrouwbaarder dan op vierjarige leeftijd.” (Onderwijsraad, 2003: 3536) Vanaf de leeftijd van 5 à 6 jaar (in Vlaanderen derde kleuterklas – eerste leerjaar) is op het vlak van toetsing veel meer mogelijk dan bij nog jongere kinderen, en kunnen leerlingen op het vlak van taalvaardigheid makkelijker met regelmatige tussenpozen doorheen het onderwijs gescreend worden. Dat heeft dan het voordeel dat leerlingen niet alleen systematisch kunnen worden vergeleken met andere leerlingen of criteria, maar ook met zichzelf, dat m.a.w. hun groei in kaart gebracht kan worden. Een aantal bestaande leerlingvolgsystemen spelen sterk in op dit ‘longitudinale’ aspect van evaluatie. LVSpakketten die met normcategorieën werken over leerjaren heen raden de leerkrachten in de handleiding aan om de beweging van een leerling over de normcategorieën scherp in de gaten te houden. Als een leerling met regelmatige tussenpozen wordt gescreend (bijvoorbeeld eenmaal per trimester, of eenmaal per schooljaar) en de leerling zich steeds in dezelfde normcategorie handhaaft, maakt hij een ‘normale’ of ‘gemiddelde’ groei door; als de leerling in normcategorie afdaalt, is zijn groei trager dan die van de normgroep, en als de leerling in normcategorie stijgt is er sprake van leerwinst (sterkere groei dan de ‘gemiddelde’ leerling). Tragere groei kan een krachtig signaal vormen dat een nadere diagnose van de oorzaken ervan nodig is teneinde tot gepaste ondersteuning te bieden.
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
32 Een potentieel nadeel van herhaalde screening is echter dat veel tijd naar toetsing gaat. Er zal dus met andere woorden moeten worden gezocht naar toetsen die op een minimale tijdsspanne (ook voor de leerling), en met een relatief economische inzet van menskracht (schoolpersoneel) kunnen worden afgenomen, maar die desondanks maximale informatie opleveren. In dit opzicht zijn klassikaal af te nemen toetsen te verkiezen boven individueel af te nemen toetsen, als zij tenminste dezelfde kwaliteit aan informatie opleveren. Voor de meeste op de markt zijnde LVS-systemen geldt dat zij klassikaal, en binnen een relatief beperkte tijdsspanne zijn af te nemen; uitzonderingen vormen hier enerzijds de toetsen voor technisch lezen (die individueel worden afgenomen) en de toetsen voor spreekvaardigheid (die niet alleen afzonderlijk moeten worden afgenomen, maar bovendien relatief veel inzet van schoolpersoneel vragen omdat zij pas nadien kunnen worden gescoord op basis van uitgebreide scoringswijzers en audio-opnames). 2.1.3 Het beoordelen van leerlingprestaties Prestaties die verwijzen naar een bepaald construct moeten beoordeeld worden. In sommige van de bovenstaande gevallen is de beoordelingsmethode vrij eenduidig en waterdicht, zoals bijvoorbeeld het tellen van het aantal woorden dat een kind hardop heeft voorgelezen, of het tellen van het aantal juist aangekruiste vragen (met multiple choice in een luisteropdracht). Ook bij edittoetsen valt enkel te tellen hoeveel van de weg te strepen woorden de leerlingen daadwerkelijk hebben weggestreept. In een paar andere gevallen is de beoordeling complexer, en open voor meer interpretatie. Dat is het meest uitgesproken het geval voor spreek- en schrijftoetsen (met name die schrijftoetsen waarbij de leerling wordt gevraagd om een functionele schrijftaak uit te voeren). Hiervoor moeten door de ontwikkelaars uitgebreide beoordelingswijzers worden opgesteld, die vervolgens door getrainde beoordelaars worden toegepast. Uit wetenschappelijk onderzoek blijkt dat zonder uitgebreide beoordelingswijzers de scoring van spreek- en schrijftaken aan zeer veel willekeur en subjectiviteit onderhevig zijn (Rudner, 1992; Blok & de Glopper, 1992). De ‘score’ van de leerling moet vervolgens aan de maatstaf getoetst worden, om te bepalen of er van een probleem sprake is. a. In de bovenvermelde toetsen wordt overwegend normgerelateerd gewerkt. Dat houdt in dat de prestatie van een individuele leerling wordt vergeleken met de scores van een uitgebreide steekproef, waarvan de scores in percentielen of normcategorieën zijn ondergebracht. Leerlingen worden hierbij dus met andere leerlingen vergeleken. Verschillende technieken worden gebruikt om de normcategorieën te definiëren: zo maakt de ene toets gebruik van het gemiddelde van de steekproefscores en de standaarddeviatie, terwijl andere toetsen gebruik maken van decielen. b. In een aantal gevallen wordt de prestatie van de leerling (ook) vergeleken met een criterium. Bijvoorbeeld in het geval van de Vlaamse periodieke peilingsinstrumenten wordt een cesuur bepaald door een commissie van experts, die een uitspraak doet over het niveau (bijv. item op IRT-schaal) dat leerlingen zouden moeten halen om de eindtermen voor de desbetreffende vaardigheid te bereiken. Ook uit predictief validiteitsonderzoek, zoals dat van de TAL, kan een criterium worden afgeleid: de analyses van zulk onderzoek tonen aan dat indien de prestatie van een leerling onder een bepaalde drempelscore vallen, de kans op ‘problemen’ (in het geval van de TAL: de kans op niet-slagen in het eerste leerjaar) aanzienlijk worden. Een criterium voor prestaties op de ene toets kan m.a.w. bepaald worden
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
33 op basis van prestaties op een andere toets, die bijvoorbeeld later in de schoolloopbaan wordt afgenomen. Zo kunnen scores op een kleutertoets worden gelinkt via wetenschappelijk onderzoek (bij voorkeur longitudinaal onderzoek waarbij leerlingen gevolgd worden) met toetsen in het lager onderwijs die genormeerd zijn of van een cesuur zijn voorzien, en kan, mits voldoende hoge correlaties, vervolgens een criteriumscore voor de kleutertoets worden bepaald. Het bovenstaande geeft aan dat er in essentie twee manieren bestaan om van een ‘probleem’ (in dit geval: ‘taalachterstand’) te spreken: normgerelateerd of criteriumgerelateerd. In het eerste geval vindt men een prestatie problematisch omdat ze te sterk achterop hinkt bij de gemiddelde prestatie van de leerlingengroep. Aan deze probleembepaling zal men de voorkeur geven indien men de verschillen tussen de prestaties van individuele leerlingen binnen bepaalde ranges wil houden. Dit is niet de eerste bezorgdheid bij een criteriumgerelateerde bepaling van taalachterstand. In dit laatste geval gaat men na of leerlingen een minimumdrempel hebben behaald, en focust men minder op het feit dat een aantal leerlingen veel hogere beheersingsniveaus etaleren. In het Vlaamse onderwijslandschap wijst een benadering vanuit de eindtermen in de richting van een drempelgerelateerde benadering. Het is dan ook niet toevallig dat bij de ontwikkeling van de periodieke peilingsinstrumenten voor begrijpend lezen, schrijven en luisteren telkens met een cesuurbepaling werd gewerkt, waarbij een commissie van experts op een IRT-schaal een niveau aanbracht waarop gezegd kan worden dat de leerling de eindtermen haalt. Deze cesuur kan dus geïnterpreteerd worden als de drempel waarover leerlingen moeten geraken qua beheersingsniveau. Met betrekking tot de inzet van taaltoetsen om de kwaliteit van ondersteuning aan individuele leerlingen te verhogen, hebben zowel een normgerelateerde bepaling van het probleem als een drempelgerelateerde bepaling hun voor- en nadelen. Normgerelateerde probleembepaling vereist ten eerste dat met zorg wordt overdacht met welke andere leerlingen individuele leerlingen worden vergeleken. Indien de normgroep niet representatief is voor de populatie zou dit tot een scheeftrekking van de probleembepaling (of maatstaf) kunnen leiden. Ten tweede moet men in contexten waarin men pleit voor een geïntegreerde en structurele aanpak van onderwijs- en taalachterstanden, er rekening mee houden dat zulk een aanpak niet alleen de zwakkere leerlingen ten goede komt, maar ook de betere leerlingen, met als gevolg dat hoeveel moeite men ook doet, en hoeveel winst men op het vlak van onderwijskwaliteit ook boekt, het verschil tussen taalzwakkere en taalsterkere leerlingen niet noodzakelijk kleiner wordt (en het ‘probleem’ dus niet opgelost geraakt). Een drempelgerelateerde bepaling is absoluter en dus vaster (over de tijd heen), maar kan het nadeel hebben dat leerlingen die net met de hakken over de sloot geraken, geen bijkomende ondersteuning krijgen (die ze misschien wel nodig hebben). Drempels zijn ook niet absoluut. Dat heeft o.a. te maken met de relatie tussen de van de leerling gevraagde prestatie en het construct dat in kaart wordt gebracht. Met name voor zgn. directe toetsen stelt zich de vraag hoe ‘direct’ de meting dan wel is. Is bijvoorbeeld een drempeltaak waarbij de leerlingen wordt gevraagd om een uitnodiging te schrijven voor leeftijdsgenoten indicatief voor de globale schrijfvaardigheid van de leerling, of enkel voor het uitvoeren van schrijftaken van een specifieke aard (bijvoorbeeld het genre van de desbetreffende eindterm)? Wetenschappelijk onderzoek laat hier geen sluitende conclusies toe. Zo durven de correlaties tussen toetsen van dezelfde vaardigheid (gesitueerd binnen eenzelfde niveau) sterk van elkaar verschillen. Dit probleem is in de toetsliteratuur bekend als het probleem van extrapolatie (Bachman, 2001; Gysen & Van Avermaet, 2006; Norris, 2005). Dit probleem is nauw verwant met de mate van eendimensionaliteit van (taal)vaardigheden. Eendimensionaliteit leidt ertoe dat onder
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
34 verschillende prestaties (bijvoorbeeld het uitvoeren van luistertaken van verschillende teksttypes) dezelfde eendimensionele vaardigheid schuilgaat. In toetsconstructie die vanuit een IRT-paradigma wordt opgezet, uit zich deze eendimensionaliteit in het construeren van één schaal waarop de items van verschillende toetstaken samen kunnen worden geplaatst. Bij de ontwikkeling van de periodieke peilingsinstrumenten voor begrijpend lezen en luisteren in Vlaanderen (referenties) bleken de items wel degelijk op één schaal te passen, terwijl dat voor functioneel schrijven niet het geval bleek te zijn. “Dit onderzoek heeft aangetoond dat het niet mogelijk is om een enkele vaardigheidsschaal voor schrijven te ontwikkelen, maar wel een voor elk van de zes verschillende aspecten. De overheid moet zich realiseren dat over toekomstig peilingsonderzoek schrijven op een andere manier gerapporteerd zal dienen te worden dan over begrijpend lezen. In plaats van uitspraken te doen over de mate waarin leerlingen elk van de eindtermen schrijven halen, kan gedetailleerd aangegeven worden in welke mate de leerlingen elk van de deelvaardigheden voor schrijven realiseren, over alle eindtermen heen.” (Colpin, Heymans & Rymenans, 2005) Ook voor het Nederlandse PPON-instrument voor de periodieke peiling van schrijfvaardigheid bleek geen eengemaakte IRT-schaal uit de analyses te komen. Daar werden in het uiteindelijke instrument ook verschillende schalen onderscheiden, die verwijzen naar verschillende eisen die aan de uitvoering van een schrijfproduct worden gesteld, en die (zo suggereert) de IRT-analyse, een appèl doen op sterk van mekaar te onderscheiden mentale processen. Een gevolg van dit alles is dat men voor schrijfvaardigheid dus niet één drempel (cesuur) kon bepalen, maar in essentie verschillende cesuren moet onderscheiden. Dit schept uiteraard nieuwe problemen, zoals het bepalen van de relatie tussen, en het relatieve gewicht van, de afzonderlijke cesuren. Dit alles sluit aan bij de aanwijzingen in de wetenschappelijke literatuur die stellen dat de productieve vaardigheden (spreken en schrijven) een complexer composiet van diverse mentale processen en deelvaardigheden vereisen dan receptieve vaardigheden (lezen en luisteren) (Levelt, 1978; Izumi, 2004; Swain, 1985, 1995). Voor de productieve vaardigheden blijkt het dus minder eenvoudig om op basis van schrijf- of spreekprestaties van leerlingen uitspraken te doen over dé schrijfvaardigheid en dé spreekvaardigheid van leerlingen, eerder dan over bepaalde dimensies van hun spreek- en schrijfgedrag. Voor wie vanuit de eindtermen vertrekt wordt het extrapolatieprobleem nog versterkt doordat een analyse van de eindtermen systematisch aantoont dat voor sommige vaardigheden bepaalde eindtermen vrij fundamenteel van andere eindtermen verschillen, en dat bovendien sommige eindtermen moeilijk te operationaliseren zijn tot toetstaken voor gestandaardiseerde screening. Met name bij spreken en luisteren (Daems et al., 2005) stelt zich het verschil tussen zogenaamd monologische (of eenrichtingsverkeer-) situaties en dialogische/polylogische situaties. Voor sommige eindtermen (zoals het luisteren naar een uiteenzetting of het luisteren naar een radiobericht) is de leerling enkel luisteraar; doch voor andere eindtermen (zoals het voeren van een telefoongesprek of het voeren van een discussie) is de leerling zowel luisteraar als spreker tegelijk. De context van de taakuitvoering verschilt in beide gevallen fundamenteel, omdat in tweerichtingssituaties luisteraars een invloed op het gesprek kunnen hebben die in eenrichtingssituaties niet mogelijk is. Zo kan in echte dialogen de luisteraar om opheldering vragen indien hij iets niet begrijpt, de gang van het onderwerp sturen qua onderwerp, bepaalde hypothesen over de informatie die wordt overgebracht expliciet toetsen, etc. Toetsmethodologisch leveren tweerichtingssituaties veel problemen op. Al sluiten ze het sterkst aan bij natuurlijke, communicatieve situaties (en dus qua prestatie sterke indicaties
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
35 kunnen geven van de functionele communicatieve taalvaardigheid van de leerlingen), ze lenen zich vrij slecht tot situaties van gestandaardiseerde toetsing. De meest voorkomende problemen zijn: (a) de onderlinge afhankelijkheid van de prestaties van verschillende leerlingen; (b) de moeilijkheid om (zo gewenst) vaardigheden nog van mekaar te onderscheiden en dus apart te beoordelen; (c) de technologische noodzaak om opnames te maken van de gesprekken en deze pas nadien (aan de hand van een beoordelingssleutel) te kunnen scoren). Het is dan ook geen toeval dat in de leerlingvolgsystemen die op de markt aanwezig zijn zo weinig toetstaken voor spreek- en luistervaardigheid, zeker wat betreft echte dialoogsituaties, opgenomen zijn. Ook bij de ontwikkeling van het Vlaamse periodieke peilingsinstrument voor luistervaardigheid werden de echt dialogische situaties niet in de toetsontwikkeling opgenomen. Zelfs in leerlingvolgsystemen waar spreken en luisteren systematisch zijn uitgewerkt, wordt de voorkeur gegeven aan vrij kunstmatige situaties waarin de leerkracht de gesprekspartner vormt (o.a. om met probleem (a) af te rekenen). Vanuit deze vaststelling wordt in de internationale toetsliteratuur dan ook sterk gepleit voor een evaluatie van spreeken luistervaardigheid vanuit observatie in functionele klas- of buitenklassituaties, eerder dan vanuit strak gestandaardiseerde toetsing (Norris et al., 2000). Bij dit laatste dient de beoordelaar uiteraard ook gebruik te maken van gestandaardiseerde beoordelingswijzers of – schalen waarmee hij bepaalde aspecten van de spreek- en luisterprestatie kan afzetten tegen de prestatie van andere leerlingen of een bepaalde drempelnorm. Dit alles maakt dat het toetsen van begrijpend lezen in grootschalige gestandaardiseerde screenings (zoals PIRLS en PISA, en binnen de nationale toetssystemen in bijvoorbeeld Noorwegen, USA, e.a.) veel meer voor de hand ligt dan de toetsing van spreken, luisteren en schrijven. Bij begrijpend lezen kan met relatief waterdichte beoordelingswijzers worden gewerkt (meer dan bij schrijven en spreken), begrijpend-leestoetsen kunnen qua afname makkelijker uniform worden georganiseerd dan spreken en luisteren (zo kan bijvoorbeeld de invloed van de toetsafnemer sterker worden uitgeschakeld), begrijpend-leestoetsen vereisen geen inzet van audioapparatuur (wat bij luisteren en spreken vaak het geval is), en ze hebben bij individuele afnames een hogere face validiteit in termen van functionaliteit en levensechtheid dan spreek-, luister- of schrijftoetsen. Ook edittoetsen en clozetoetsen vertonen de meeste van deze positieve eigenschappen, op het laatste (face validiteit) na. 2.2 Diagnose op leerlingniveau Zoals eerder gesteld is er een fundamenteel verschil tussen screening en diagnose. De beide termen zijn echter geen complete tegengestelden, maar vormen eerder de uiteinden van een lang continuüm. Aan het ene einde van het continuüm ligt een vorm van screening die een signaal geeft omtrent de relatieve taalvaardigheid (of groei van taalvaardigheid) van de leerling, maar verder zeer weinig inzicht biedt in waar nu precies het probleem van de leerling inzake taalvaardigheid ligt. Eén van de meest prototypische voorbeelden van een dergelijke signaleringstoets is de edittoets. Los van alle voordelen die de edittoets biedt (inzake hoge betrouwbaarheid, klassikale afname, empirisch-gevalideerde link met schoolsucces) biedt een edittoets bijzonder weinig houvast over welke (deel)aspecten van taalvaardigheid de leerling wel/niet heeft verworven, welke processen de leerling doorloopt bij het uitvoeren van taaltaken, en welke vorm van ondersteuning de leerling kan helpen om tot een versnelde groei
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
36 van taalvaardigheid te komen. Dat heeft enerzijds te maken met het feit dat vooralsnog niet duidelijk is welke deelprocessen of taalvaardigheden de edittoets precies aanspreekt, en het zelfs onduidelijk is of het oplossen van een edittoets niet veeleer algemeen-cognitieve (‘schoolse’) denk- of toetsoplossingsvaardigheden en –strategieën vereist, eerder dan puur talige kennis, vaardigheden en attitudes (Kerkhoff, 1995). Aan het andere uiterste van het continuüm ligt een volwaardige diagnose, die toelaat een zicht te krijgen op zowel het proces en product van taakuitvoering door de leerling, waarbij de leerkracht inzicht verwerft in de (deel)processen, strategieën, (deel)vaardigheden, kennis en attitudes die nadere ondersteuning behoeven in zulke mate dat gerichte ondersteuning kan worden geboden. Zulk een volwaardige diagnose (Lidz, 1994; Shepard, 2000) heeft als voornaamste kenmerken dat ze: a. dynamisch is: i.e. verbonden aan processen van taakuitvoering, en product (performantie-niveau) en proces (strategische weg van taakuitvoering) voortdurend aan mekaar linkt (i.e. hoe komt het dat de leerling bij het uitvoeren van deze taak dit gedrag vertoont?); b. interactief is, in de zin dat vooral via de interactie tussen leerling en degene die de diagnose stelt kan worden scherpgesteld waar zich het probleem stelt (en ook wat de leerling al goed doet/kan/weet), en dat via de interactie interne processen naar boven worden gebracht (i.e. geëxpliciteerd); c. zowel taakspecifiek als taakoverschrijdend wordt uitgevoerd, dit met het doel te bepalen of het probleem dat zich stelt enkel optreedt bij het uitvoeren van specifieke taken die aan bepaalde kenmerken voldoen (bijvoorbeeld spreken in grotere groepen over een abstract onderwerp) of systematisch optreden over taaktypes (en evt. vaardigheden) heen. Voor dit soort van diagnose wordt in de pedagogische literatuur en taalwetenschappelijke literatuur vooral gewezen in de richting van probleemanalyserende en leerbevorderende interacties tussen leerkracht en leerling, bijvoorbeeld aan de hand van mediërende ondersteuning die de leerkracht tijdens leertaken aan leerlingen aanbiedt, of aan de hand van hardop-denkprotocollen waarbij leerlingen na de taakuitvoering expliciteren (bijv. voor de leerkracht) hoe ze de taak hebben aangepakt, tegen welke problemen ze zijn aangestoten, hoe ze die problemen hebben proberen aan te pakken, etc. In de huidige literatuur rond alternatieve evaluatie (Brown & Hudson, 1998; Bultynck, 2004; Genesee & Upshur, 1996; Van Petegem & Vanhoof, 2002) wordt sterk gehamerd op het belang van het integreren van leren en evalueren, het bezorgen van feedback op toetsprestaties van leerling, het uitgebreid en analyserend nabespreken van taakuitvoeringen, e.d. Ook dit past in het interactief en dynamisch diagnosticeren van taalproblemen. De vraag die zich hier stelt is waar taaltoetsen zich bevinden op dit continuüm. In principe kunnen zij zich, al naargelang de aard van de toets, op verschillende punten op het continuüm bevinden, al kan worden vastgesteld dat de huidige bestaande taaltoetsen zich veeleer aan de kant van de pure screening bevinden dan aan de kant van de volwaardige diagnose. Enkel in de leerlingvolgsystemen voor technisch lezen en spellen wordt een stevige aanzet tot handelingsgerichte diagnose na signalering geboden. Het nadeel van deze instrumenten is evenwel dat zij zich richten op deelaspecten van de functionele vaardigheden waar het in de eindtermen om draait, namelijk technisch lezen als deelvaardigheid van begrijpend lezen, en spelling als deelvaardigheid van schrijven. De toetsen en leerlingvolgsystemen die ernaar streven om functionele taalvaardigheid in kaart te brengen, geven expliciet aan dat hun eerste
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
37 functie die van screening (signalering) is, en dat zij slechts karige info bieden op het vlak van diagnostiek. Zo vermeldt bijvoorbeeld de handleiding van de Cito-toetsen begrijpend lezen: “De TBL kunnen bij het diagnosticeren van problemen een rol spelen, maar zijn op zich genomen niet diagnostisch.” (Verhoeven, Staphorsius & Krom, 1992: 42) Van de voorhanden zijnde toetsen en leerlingvolgsystemen ambiëren slechts een paar instrumenten om verder te gaan dan de eerste stap van de screening. Zo vermelden TIST (een Vlaamse toets voor taalvaardigheid aan het begin van het eerste jaar secundair onderwijs), Diatekst (een Nederlandse toets voor hetzelfde moment) en TASAN (toets taalvaardigheid aan het einde van de onthaalklas secundair onderwijs) dat ze kansen tot diagnostiek bieden. De manier waarop dit bewerkstelligd wordt is in deze gevallen dezelfde: door het stellen of analyseren van verschillende types van vragen of opdrachten bij de taakuitvoering, wordt verhoopt dat een scherper inzicht wordt verkregen in welke subvaardigheden, kennis en attitudes de leerling wel/niet heeft verworven. Bij Diatekst wordt dit verkregen door vragen te stellen op drie niveaus: het ‘microniveau’, het ‘mesoniveau’ en het ‘macroniveau’. Het microniveau heeft betrekking op het woordniveau en de inhoudelijke details van een tekst. Aan de hand van dit niveau kan volgens de makers gekeken worden in hoeverre leerlingen woorden herkennen en begrijpen en of zij in staat zijn om tekst te begrijpen wanneer daar complexe grammaticale structuren in gebruikt worden (Hacquebord, 1996). Het ‘mesoniveau’ heeft te maken met de samenhang tussen de verschillende delen van een tekst. Hier gaat het met name om de herkenning van functiewoorden en structuuraanduiders. Er kan bijvoorbeeld gevraagd worden naar het verband tussen twee zinnen. Het ‘macroniveau’ ten slotte heeft betrekking op de tekst als geheel, hier wordt bijvoorbeeld gevraagd naar de hoofdgedachte van de tekst of de leerling moet een andere titel voor de tekst kiezen. Ook de functie van de tekst kan bij een vraag op macroniveau aan de orde komen. Diatekst vervult dus met andere woorden zijn diagnostische functie door leerlingen vragen van verschillende aard te stellen, en te analyseren hoe de leerlingen daarop scoren. Dat komt sterk overeen met wat de bovenvermelde toetsen begrijpend lezen van het Cito ook doen, waarbij de laatste organisatie toegeeft dat dit niet met echte diagnostiek gelijkgesteld mag worden. Dat laatste heeft vooral te maken met het feit dat het stellen van verschillende soorten vragen hoegenaamd geen garantie op inzicht biedt in het denkproces dat de leerling heeft doorgemaakt om voor een bepaald antwoord te kiezen en de strategieën die hij al dan niet heeft toegepast. Bovendien mag het fout beantwoorden van bijvoorbeeld een woordenschatvraag op microniveau niet blindelings worden gelijkgesteld met een woordenschatprobleem. Zo wijst Hacquebord (1989, 1998) er zelf op dat de verschillende begripsniveaus van Diatekst niet als separate deelvaardigheden moeten worden gezien, maar als interagerende aspecten van het leesproces. Begrip van microniveau kan immers tot stand komen op basis van macrobegrip en andersom. TIST en TASAN, twee Vlaamse toetsen voor het secundair onderwijs, bieden de gebruiker naast een totaalscore op de toetstaken ook subscores op verschillende categorieën, die samenhangen met verschillende aspecten van de toetstaken, namelijk: ‘vaardigheid’ (welke vaardigheid wordt aangesproken, bijvoorbeeld receptief of productief taalgebruik?), ‘talige ondersteuning’ (biedt de tekst veel redundantie?), ‘verwerkingsniveau’ (welk verwerkingsniveau (beschrijvend, structurerend, etc.) wordt aangesproken?), en ‘perspectiefneming’ (abstracte info versus concrete info?). Wat voor Diatekst geldt, geldt ook hier. De subscores kunnen zeker een eerste aanzet tot diagnostische informatie bieden, maar
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
38 dit zal om de hierboven genoemde redenen via meer procesgerichte dialoog en via observatie van de leerling tijdens taakuitvoeringen aangevuld moeten worden om het probleem van de leerling echt scherp te krijgen. Samenvattend betwijfelt Alderson (2000) dan ook sterk of men via toetsing lees- en andere taalproblemen kàn diagnosticeren: “Even if there are separate skills in the reading process which one could identify by a rational process of analysis of one’s own reading behaviour, it appears to be extremely difficult if not impossible to isolate them for the sake of testing or research.” (Alderson, 2000: 49) De bestaande taaltoetsen beschreven in bijlage 1 besteden bovendien bijzonder weinig aandacht aan de attitudinele processen die in de taakuitvoering van taaltaken van bijzonder groot belang kunnen zijn (Dörnyei, 2000; 2001). Variabelen zoals motivatie, welbevinden, betrokkenheid, zelfsturing, en andere socio-emotionele factoren die creatief probleemoplossend gedrag kunnen beïnvloeden (zoals impulsiviteit of planmatigheid) worden niet in kaart gebracht. Het feit dat de hierboven vermelde diagnostische toetsen slechts focussen op een klein segment van de mogelijke probleemfactoren, maakt dat een rechtstreekse link met onderwijsondersteuning, puur op basis van wat de toets aan (diagnostische) informatie oplevert, een beweging op zeer glad ijs dreigt te worden. Dat is ook de conclusie van de Commissie Indicatiestelling Onderwijsachterstanden bij het beoordelen van kleutertoetsen: “… de vraag of de scores op objectieve tests, afgenomen in groep 1, de leerkrachten concrete aanwijzingen kunnen geven voor een op individuele noden gerichte didactische aanpak, kan alleen positief beantwoord worden als er een voldoende sterk verband is aangetoond tussen die vroege testuitslagen en latere onderwijsprestaties. Tot nog toe zijn die aangetoonde verbanden te zwak om de leerkracht te kunnen overtuigen dat het noodzakelijk is te werken aan juist die lacunes die uit de testuitslagen afgeleid kunnen worden.” (Commissie Indicatiestelling Onderwijsachterstanden, 1996: 29) Om op dit gebied vorderingen te maken is volgens de Commissie veel meer gericht wetenschappelijk onderzoek nodig dat gebruik maakt van pretest/posttest designs, en is tevens een scherper inzicht in de opbouw van functionele taalvaardigheden nodig zodat het mogelijk wordt om scherpere tussendoelen af te bakenen. Dit alles maakt dat taaltoetsen slechts een eerste stap kunnen zijn in de richting van gerichte, gedifferentieerde ondersteuning van leerlingen van wie via de screening is vastgesteld dat de ontwikkeling traag of problematisch verloopt, of dat een bepaald niveau van presteren op een bepaald moment niet is gehaald. Screening en eerste diagnose via taaltoetsing kan het voordeel bieden dat leerkrachten niet alleen het probleem zien, maar ook zelfs een zeker beeld krijgen van de grootte van het probleem (bijvoorbeeld de afstand tussen de gemiddelde prestatie en de prestatie van bepaalde individuele leerlingen), maar om het probleem op een efficiënte en effectieve manier aan te pakken, moet de leerkracht alle kwalitatieve info die hij reeds heeft over het talig functioneren van de leerling inzetten, of bijkomende procesmatige informatie verzamelen. De evaluatie moet na het moment van de screening dus sterk ‘verbreed’ worden met andere brede evaluatietechnieken zoals observatie, interactieve mediatie, portfolio, zelfevaluatie door de leerling e.a. (Shepard, 2000). De rol van sterk
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
39 gestandaardiseerde toetsen is op dat moment grotendeels uitgespeeld; de rol van gepersonaliseerde, handelingsgerichte diagnose wordt dan des te belangrijker. Voor de screening en diagnose op leerlingniveau kunnen we dan ook besluiten dat: a. screening van taalvaardigheid ertoe kan leiden dat leerkrachten de vinger aan de pols houden van de groei van hun leerlingen, en tijdig alarmsignalen kunnen verkrijgen over leerlingen bij wie de ontwikkeling te traag verloopt; b. die screening van taalvaardigheid met taaltoetsen kan worden uitgevoerd, bij voorkeur met toetsen die een hoge mix van betrouwbaarheid, validiteit, efficiëntie en kleine kans op negatieve backwash-effecten vertonen; op dit vlak scoren doorgaans begrijpend-leestoetsen relatief beter dan spreek-, luister-, schrijf-, deelvaardigheids- en edittoetsen; c. taaltoetsing die met relatieve tussenpozen wordt uitgevoerd, het voordeel biedt dat de leerling in zijn groei gevolgd kan worden, maar dat gestandaardiseerde screening via taaltoetsing voor de leeftijd van 5-6 jaar niet altijd leidt tot echt betrouwbare en valide informatie, en niet tot gedetailleerde informatie in verband met diagnosticering en ondersteuning; d. taaltoetsen algemeen op het vlak van diagnose van problemen en dus gerichte aanduidingen voor daadwerkelijke gedifferentieerde ondersteuning van individuele leerlingen slechts een beperkte waarde hebben; hiervoor zal nodig zijn dat de info uit taaltoetsen sterk aangevuld wordt met kwalitatieve, procesmatige informatie uit observaties van een breed scala van taak- en deeltaakuitvoeringen en interactieve procesanalyses.
2.3 Screening en diagnose op schoolniveau De bespreking van het gebruik van taaltoetsing voor de screening van taalvaardigheid op schoolniveau ligt uiteraard sterk in het verlengde van de screening op leerlingniveau. Toch ligt het accent hier anders: daar waar op leerlingniveau de basisvraag is: ‘hoe doet de leerling het?’ is bij screening op schoolniveau de basisvraag: ‘hoe doet de school het?’. Eerder dan in te zoomen op individuele leerlingen, zoekt het schoolteam in eerste instantie een antwoord op de vraag: ‘slagen wij erin om met ons onderwijs het vereiste niveau op het vlak van taalvaardigheid te halen?’ Ook hier zal het voor het schoolteam belangrijk zijn om een maatstaf te bepalen (wat is het vereiste niveau?), ten tweede een valide, betrouwbare voorstelling van de bestaande situatie (de taalvaardigheid van de leerlingen) op te bouwen, en ten slotte uit de vergelijking van maatstaf en bestaande situatie de gepaste conclusies te trekken. 2.3.1 Eind-, begin-, en tussenscreening Wat de maatstaf betreft, ligt het voor Vlaamse scholen voor de hand om de eindtermen en ontwikkelingsdoelen als richtsnoer te nemen. De eindtermen en ontwikkelingsdoelen beschrijven op verschillende niveaus van de onderwijsloopbaan wat leerlingen met taal moeten kunnen doen. In de geest van het finaliteitsdenken van de eindtermen (die voorschrijven wat de leerlingen op het einde van een bepaald niveau moeten kunnen), kan via toetsing gescreend worden of de leerlingen het door die eindtermen beschreven niveau behalen.
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
40 Als een school dat aan het einde van een bepaald niveau doet (bijvoorbeeld aan het einde van het basisonderwijs toetsen of de leerlingen de eindtermen halen), spreken we van eindscreening. Ook aan het begin van een onderwijsniveau kan screening nuttig zijn, bijvoorbeeld om vast te stellen hoe het met het beginniveau van de leerlingen is gesteld. Deze vorm van beginscreening kan gebaseerd zijn op de ontwikkelingsdoelen/eindtermen van het voorgaande niveau (bijvoorbeeld een toets afnemen van leerlingen 1ste jaar secundair die qua moeilijkheidsgraad gelinkt is aan de eindtermen basisonderwijs) of aan de ontwikkelingsdoelen/eindtermen van het niveau zelf. In het laatste geval zal men vaak werken met een normgerelateerde maatstaf (bijvoorbeeld de vergelijking met andere leerlingen) omdat het niet eenvoudig is te bepalen welke doelen op welk niveau op een bepaald tussenmoment behaald moeten zijn, of zal men een anker/relatie tot stand moeten brengen met prestaties op een eindscreening van datzelfde niveau. Naast eind- en beginscreening kan men uiteraard ook tussentijds screenen. Zo kan men bijvoorbeeld tussen de beginscreening in het eerste leerjaar van het lager onderwijs en de eindscreening in het zesde leerjaar nog een aantal tussentijdse metingen inlassen (bijvoorbeeld aan het einde van elk leerjaar) om de groei van de leerlingengroepen te blijven volgen. Zoals uit bijlage 1 kan worden opgemaakt, laten genormeerde leerlingvolgsystemen als VLOT en Cito systematisch toe om de scores van de klasgroepen te vergelijken met de prestaties van grotere groepen leerlingen (meestal genormeerd op landelijk niveau). Met andere woorden, heel wat toetsen die ingezet kunnen worden voor de screening op leerlingniveau, kunnen ook dienst doen voor de screening op schoolniveau. Eerder dan te focussen op individuele leerlingen, zal het schoolteam op dit niveau haar aandacht richten op de verdeling en bewegingen van de leerlingen over de normcategorieën en de proportie van de leerlingen die de gewenste normcategorieën (of het gewenste niveau) haalt. Op tussentijdse screening zoals die door VLOT en Cito worden gehanteerd, komt vaak de kritiek dat ze te zeer op het leerstof-jaarklassensysteem zijn gebaseerd. Zij wekken met andere woorden de schijn dat alle leerlingen zich op hetzelfde tempo en volgens dezelfde route zouden moeten ontwikkelen. Zij houden te weinig rekening met het feit dat de natuurlijke ontwikkeling van vele leerlingen geen uniform lineair proces is, maar vaak met bokkensprongen verloopt. Dat kan dan als gevolg hebben dat op sommige tussentijden de school zich over sommige leerlingen (of groepen van leerlingen) te veel of te weinig zorgen maakt. Deze kritiek wijst er opnieuw op dat de school bij de interpretatie van screeningsgegevens ook op schoolniveau heel wat andere gegevens in rekening zal moeten brengen. 2.3.2 Het bepalen van de toegevoegde waarde Screening van de prestaties van haar leerlingen kan de school een beeld opleveren van haar effectiviteit. Niet voor alle scholen werken landelijk genormeerde screeningsinstrumenten echter even goed. Bijvoorbeeld scholen met hoge percentages doelgroepleerlingen geven vaak aan dat de steekproef waarop de normering van de leerlingvolgsystemen was gebaseerd, niet representatief is voor de leerlingenpopulatie op de school. Zij hebben dan het gevoel dat de normen (dus: de maatstaf) te hoog ligt. Het is in dit opzicht dan ook veel correcter om bij het in kaart brengen van leerlingresultaten de input- en contextfactoren van de school mee in rekening te brengen (De Fraine, 2005). De toelichting bij de Cito-eindtoets basisonderwijs zet dit sterk in de verf:
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
41 “Het kan informatief zijn om het eigen schoolgemiddelde met dat van andere scholen te vergelijken. Een school weet dan of en hoeveel het schoolgemiddelde lager of hoger is dan het landelijk gemiddelde. Van die positie kan echter niet zonder meer de kwaliteit van het onderwijs worden afgeleid! Uiteraard niet. ‘Boven het gemiddelde’ is niet automatisch 'goed', zoals ‘(ver) onder het gemiddelde’ niet vanzelfsprekend 'slecht' is. Bij de beoordeling van de kwaliteit van het onderwijs komt meer kijken dan alleen het schoolgemiddelde. Er zijn namelijk tal van factoren waar scholen geen invloed op hebben, maar die wel mede de resultaten van hun onderwijs bepalen. Bijvoorbeeld instroomkenmerken zoals de sociaal culturele achtergrond van leerlingen en het gemak waarmee leerlingen leren. De Inspectie van het Onderwijs weet dat als geen ander en gaat bepaald niet alleen op de gemiddelde score af. En dit geldt niet alleen voor de gemiddelde score op de Cito-toets, maar ook voor de gemiddelde score op allerlei andere toetsen zoals de toetsen van leerlingvolgsystemen.” Betere aanduidingen van de schooleffectiviteit kan men bijgevolg bekomen door de resultaten van de leerlingen van een school te vergelijken met de resultaten van scholen met een gelijkaardige instroom van leerlingen die binnen een gelijkaardige context opereren. De bestaande leerlingvolgsystemen en toetsen in Vlaanderen en Nederland bieden op dit vlak echter weinig steun. Enkel het Kleuterobservatie-instrument Taalvaardigheid (KOBI-TV) bevat naast ‘Vlaamse’ normen ook ‘OVB-normen’: deze werden berekend op basis van de allochtone leerlingen in de steekproef die aan de doelgroepindicatoren van het toenmalige OVB voldeden. Aan OVB-scholen werd in de handleiding de raad gegeven om de scores van hun leerlingen in de eerste plaats met die normen te vergelijken. Dit is echter slechts een zeer gedeeltelijke tegemoetkoming aan het bovenvermelde probleem: de diversiteit binnen de toenmalige OVB-scholen in termen van instroom was immers nog bijzonder groot. Scholen met een specifiek type instroom dreigen dan ook op eigen houtje op zoek te moeten naar scholen met dezelfde input- en contextgegevens om op basis van de outputgegevens van hun leerlingen een beeld te krijgen van hun effectiviteit. Bovendien krijgt een school pas echt een zicht op haar effectiviteit op het moment dat zij niet alleen context- en inputgegevens verrekent, maar ook een vergelijking maakt tussen de vaardigheid van de leerlingen bij instap en de vaardigheid van de leerlingen bij het einde van een bepaald traject. “The effectiveness judgement should be based upon whether a school has enhanced the performance of its students between entry and exit. Including pre-test scores or initial achievement means estimating the ‘value added’ by a school.” (De Fraine, Van Damme & Onghena, 2002: 405) Met andere woorden, de school krijgt een zicht op haar toegevoegde waarde door een beginscreening te vergelijken met een eindscreening en daarbij context- en inputfactoren in rekening te brengen (bijvoorbeeld door haar verschil tussen begin- en eindscreening te vergelijken met die van gelijkaardige scholen). In onderzoek naar schoolloopbanen en schooleffectiviteit worden op deze manier analyses van de toegevoegde waarde van scholen berekend, en wordt systematisch vastgesteld dat er tussen scholen zeer grote verschillen optreden met betrekking tot hun toegevoegde waarde (De Fraine et al., 2003). “The results indicate that school effects do exist and that the difference between schools are large. The between school variances for language achievement is 29%. And when variations in the characteristics of the students are taken into account, substantial school differences remain. Some schools are more successful than others in promoting students’ language learning.” (De Fraine et al., 2003: 854)
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
42 2.3.3 Naar een volwaardige diagnose op schoolniveau Zeker voor scholen waarvan de toegevoegde waarde of de scores van de leerlingen bij de screening (systematisch) te laag uitvallen, kan screening op schoolniveau een eerste stap betekenen naar een fundamentele reflectie over haar schooleffectiviteit en een zoektocht naar manieren om deze op te krikken. Scholen worden dan als het ware een spiegel voorgehouden met betrekking tot de mate waarin ze erin slagen om de leerlingen de gewenste of haalbare groei in taalvaardigheid te doen doormaken. Op het moment dat de school naast de contexten input- ook haar procesvariabelen mee in deze reflectie betrekt, zet ze een belangrijke stap op weg naar een volwaardige diagnose op schoolniveau. De school maakt dan een analyse van de inspanningen die ze getroost om de leerlingen tot leren te brengen in functie van het verhogen van de kwaliteit van het door haar aangeboden onderwijs, rekening houdend met de context waarin het schoolteam opereert. Net zoals in het geval van leerlingscreening, zou een gedegen diagnose van een dusdanige kwaliteit moeten zijn dat ze aanwijzingen geeft voor het ondernemen van doelgerichte actie ter verbetering van de kwaliteit van het onderwijs. In essentie stoten we hier op de basisfilosofie die het ondersteuningsluik van het huidige GOK-beleid schraagt. De GOK-cyclus met haar ingrediënten van beginsituatie-analyse, zelfevaluatie en inspectiecontrole drukt sterk op het uitvoeren van een grondige diagnose van het onderwijskansenbeleid dat binnen de school wordt gevoerd in functie van het prioriteren van doelstellingen en acties die erop gericht zijn de kwaliteit en effectiviteit van het onderwijs voor alle leerlingen te verhogen. Daarbij wordt aan scholen sterk aangeraden om de resultaten op leerlingniveau te linken met de inspanningen die op leerkrachtniveau en schoolniveau worden gedaan. Zo wordt in de visietekst rond de zelfevaluatie van GOK-scholen (geschreven door het Steunpunt GOK en de pedagogische begeleiding binnen het kader van een ad-hoc VLOR-werkgroep) aan scholen aangeraden om de link tussen de resultaten die ze bij haar leerlingen vaststelt en de kwaliteit van het door haar aangeboden onderwijs in een diepgaande analyses te leggen en daaruit lessen te trekken voor evt. acties ter optimalisering die daaruit kunnen voortvloeien. Op hun beurt moet de procesmatige en productmatige evaluatie van die acties terug gerelateerd worden aan de verhoging van de algehele onderwijskwaliteit en de output bij de leerlingen. Dit vindt haar visuele neerslag in de zogenaamde ‘grote cirkel’:
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
43
Figuur 2.1: ‘De grote cirkel’
Wat taalvaardigheid betreft, houdt diagnose in dat de school de vaststelling (screening) van leerlingresultaten op het vlak van taalvaardigheid integreert in een analyse van haar taalbeleid (Corson, 1979; Kroon & Vallen, 2000; Van den Branden, 2005), dat een integraal deel uitmaakt van haar breed zorg- en gelijke-onderwijskansenbeleid. In binnen- en buitenlandse taalbeleidsinstrumenten, inclusief het beginsituatie-analyse-instrument voor het thema taalvaardigheid ontwikkeld door het Steunpunt GOK, wordt aan scholen gevraagd de kenmerken van haar leerlingenpopulatie (inclusief prestaties op taaltoetsen) in kaart te brengen en deze te linken aan aspecten van onderwijsproces zoals de invulling van het taalvaardigheidsonderwijs, de rol van taal in de niet-taalvakken, de teamwerking binnen het schoolteam rond taalbeleid, het nascholingsbeleid rond taal, en de communicatie met ouders hierrond. Hierbij wordt zeer sterk benadrukt dat het in kaart brengen van het taalbeleid en de reflectie daarover een teamaangelegenheid is: ten eerste kan het beeld van de school op het vlak van taalondersteuning maar echt scherp worden gesteld als alle leerkrachten inzage bieden in hun percepties en klaspraktijk in verband met taal. Ten tweede zal de kracht van het gevoerde taalbeleid toenemen indien meerdere (idealiter: alle) leden van het schoolteam gezamenlijk de doelen bepalen waarnaar gewerkt zal worden, gezamenlijk betrokken worden bij de uitvoering en opvolging van het actieplan, en gezamenlijk verantwoordelijkheid dragen voor het evalueren en eventueel bijsturen van het plan aan gewijzigde omstandigheden. Diagnose en actie ter verbetering van de onderwijskwaliteit mogen dus niet afgeschoven worden op een GOK-leerkracht of een gemotiveerde witte raaf, maar moeten samen worden opgenomen.
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
44 Onderzoek naar de implementatie van de eerste GOK-cyclus (Van Petegem et al., 2005; Onderwijsspiegel 2004-2005) wijst echter uit dat het leggen van de link tussen resultaten op leerlingniveau en inspanningen op leerkracht- en schoolniveau, niet systematisch door de huidige GOK-scholen wordt gedaan. Scholen vragen zich met andere woorden te weinig systematisch af of de inspanningen die ze zich getroosten om goed onderwijs te bieden, wel degelijk voor alle leerlingen het verhoopte effect hebben. Dat zou theoretisch te maken kunnen hebben te maken met het feit dat ze het effect van hun inspanningen soms te weinig systematisch in kaart brengen; uit steekproeven zoals die van Verhelst (2005) in VlaamsBrabant valt voor taal echter af te leiden dat nagenoeg alle scholen beschikken over, en gebruik maken van toetsen om taal te screenen, al moet hierbij opgemerkt worden dat toetsen voor spelling en technisch lezen nog steeds sterker in gebruik zijn dan toetsen die functionele taalvaardigheid direct in kaart brengen. De bovenstaande onderzoeken naar de implementatie van de eerste GOK-cyclus suggereren dat het probleem in de eerste plaats te maken met het feit dat veel scholen er vooralsnog moeilijk in slagen om de interpretatie van resultaten te verbinden aan een planmatige reflectie op het eigen beleidsvoerend vermogen. Schoolteams blijken het name moeilijk te hebben om met een voldoende breed draagvlak impulsen voor de bijsturing van haar (taal)beleid te maken die uit een zelfevaluatie en diagnose voortkomen. Dat heeft op haar beurt met verschillende factoren te maken: schoolteams hebben het moeilijk om “SMART-e” doelstellingen of gepaste thema’s voor hun situatie te formuleren, creëren te weinig netwerking en draagvlak binnen de school om tot een gezamenlijk gedragen project te komen, linken doelstellingen voor het lerarenkorps te weinig aan doelstellingen op leerlingen schoolniveau, en zijn niet altijd in staat om een op maat gesneden nascholings- of begeleidingsaanbod te kiezen. “Uit de kwantitatieve en kwalitatieve analyses blijkt dat scholen die werken volgens de kwaliteitscirkel en die rekening houden met de drie niveaus school, leraren en leerlingen, met het creëren van een voldoende groot draagvlak, met netwerking en professionele aanpak van vraaggestuurde nascholing en professionalisering juist de voorbeelden van goede praktijk zijn” (Onderwijsspiegel 2004-2005: 25). Met andere woorden, er kan betwijfeld worden of het ter beschikking stellen van (meer) taaltoetsen het beleidsvoerend vermogen van scholen automatisch zal verhogen. De relatie ligt eerder omgekeerd: uit de analyses van de eerste GOK-cyclus kan geconcludeerd worden dat een hoog beleidsvoerend vermogen de kans verhoogt dat het afnemen van toetsen leidt tot een gedegen diagnose en weldoordachte, planmatige actie. De kwaliteit van het beleidsvoerend vermogen van de scholen zal dan ook een sterke invloed hebben op de aard van de conclusies die de school trekt uit de reflectie op de link tussen leerlingresultaten en schoolinspanningen. Onderzoek in binnen- en buitenland (Hillewaere, 2001; Van Petegem et al., 2005; Hanushek & Raymond, 2005; Nicaise, 2000) toont aan dat scholen bij tegenvallende resultaten niet altijd doelstellingen en acties bepalen die rechtstreeks met de verhoging van de onderwijskwaliteit of met de professionalisering van het leerkrachtenteam hebben te maken. Een eerste vaak vastgestelde reactie op de screening van leerlingresultaten is een (her)homogenisering van de leerlinggroepen. Dit kan zowel op schoolniveau (bijvoorbeeld in onderwijsstromen of studierichtingen), klasniveau (sterkere versus zwakkere klassen) als op groepsniveau (niveaugroepen) gebeuren. Daarbij worden leerlingen van een bepaald niveau samen gezet, en krijgen ze aangepast onderwijs. Internationaal onderzoek (Dar & Resh, 1986; 1994; Murphy & Hallinger, 1989) wijst uit dat verregaande vormen van homogenisering
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
45 potentieel negatieve effecten op gelijke onderwijskansen kunnen hebben, vooral indien deze herhomogenisering gepaard gaat met een verlaging van verwachtingen vanwege de leerkrachten ten aanzien van de leerlingen in de zogenaamde ‘zwakkere’ groepen. Deze kunnen op hun beurt leiden tot curriculumreductie en een verschraling van het onderwijsaanbod. Dat in Vlaanderen een substantieel gedeelte van de leerlingen uit het leerplichtonderwijs, en met name uit de BSO-richtingen, uitstroomt met een onvoldoende hoog niveau van functionele geletterdheid (Van Damme, 2000; Bohnenn et al., 2004), zou gedeeltelijk vanuit het mechanisme van curriculumverenging verklaard kunnen worden, waarbij (in functie van het welbevinden van de leerling of als uitloper van bepaalde verwachtingen van het leerkrachtenkorps ten opzichte van de leerlingen) centraal wordt ingezet op beroeps- of praktijkgerichte competenties, en minder op algemeenmaatschappelijke competenties zoals geletterdheid. “Teachers tailor their instructional practices to the academic level of the group of students. This refers to the concept of ‘didactic fit’: adjustment of curriculum, learning materials, method of instruction, effective learning time, assessment, etc. to the ability level of the class (Dar & Resh, 1986, 1994). In most classes, the content and pace of teaching are geared to the middle level of ability in that class. In lower classes, there is a more limited academic focus, poor use of instructional time and a reduced opportunity to learn…” ( De Fraine et al., 2002: 424) Tegelijk kunnen in verregaande vormen van homogenisering de potentiële effecten van heterogeniteit niet meer uitgebuit worden: uit onderzoek blijkt dat zogenaamde zwakkere leerlingen sterker gedijen in groepen met een gemiddeld hoog cognitief gehalte, of (op taalvlak) met hoger taalvaardige, native speakers van de onderwijstaal (Van den Branden, 1997; 2000; Westerbeek, 2000; Van Keer, 2001; OECD, 2002), en dat daar waar het onderwijssysteem of de keuzes van schoolteams tot verregaande gettovorming van kansarme leerlingen leidt, die laatste hiervan dan ook de dupe zijn (sterkere presteerders blijken minder last van herhomogenisering te hebben). Als gevolg dreigt de ongelijke-kansenkloof te verbreden in plaats van te versmallen (Hanushek & Raymond, 2003; Mcneill, 2000; Jungbluth, 2004; Meijnen, 2002). Het is in dit verband dan ook kentekenend dat heel wat handleidingen van centrale toetsen die ingaan op welk soort acties geschikt zijn om de taalontwikkeling van laag-scorende kinderen te verhogen, pleiten voor het werken in heterogene groepen. Onder andere TAL, KOBI-TV, TAS en TIST, maar ook bijvoorbeeld de handleiding van de Nederlandse Toets Tweetaligheid van het Cito pleiten hier expliciet voor: “Groepjes met kinderen van verschillend niveau kunnen positief werken. Kleuters die al wat verder in hun taalontwikkeling zijn gevorderd, kunnen als model fungeren voor de andere kinderen” (Verhoeven et al., 1995: 52-53) Het gevaar van een sterke herhomogenisering van de leerlinggroepen doet zich sterk gevoelen bij de overgang van leerlingen van de ene klas naar de andere, of van het ene onderwijsniveau naar het andere. Met andere woorden, screening die zich afspeelt aan het einde van het ene onderwijsniveau en een impact kan hebben op de samenstelling van de groepen van het daaropvolgende niveau, kan potentieel bijdragen tot herhomogenisering op dat volgende niveau. In het Vlaamse onderwijssysteem is de overgang van het basisonderwijs naar het secundair onderwijs in dit verband een cruciaal moment. Gezien het grote aanbod van secundaire scholen, het bestaan van de 1B-variant, en een de facto praktijk waarbij de invulling van de keuze-uren in veel scholen oriënterend/voorbereidend is op de TSO/BSO/ASO-structuur vanaf de tweede graad, dreigt bij het ingaan van het secundair onderwijs een
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
46 sterke segmentering c.q. herhomogenisering van de leerlingpopulatie tot stand te komen. Nicaise & De Smedt (2005) tonen aan, onder andere op basis van LOSO- en PISA-onderzoek, dat het Vlaamse ‘scholenpark’ van het secundair onderwijs sterk gesegregeerd is, en België één van de PISA-landen is waar secundaire scholen het sterkst verschillen qua socioeconomische en culturele verschillen van de leerlinginstroom. Allerhande mechanismen, waaronder de wijze waarop scholen, leerlingen en hun ouders reageren op, en zich bewegen binnen, de onderwijsmarkt blijken hiervoor verantwoordelijk te zijn. “Naast scholen, selecteren ook bepaalde groepen ouders (met name de middenklasse). Zij streven naar plaatsing op goed presterende scholen (…); de overige ouders stromen in in de resterende scholen met lagere prestatiecijfers. Deze reacties van ouders en scholen versterken de ongelijkheid, zowel tussen scholen als tussen ouders. Bepaalde groepen ouders krijgen wat ze willen, namelijk hun voorkeursschool (…), anderen niet. Bepaalde scholen werken met leerlingen met een goed perspectief op hoge onderwijsresultaten, andere scholen werken met leerlingen waarvan van meet af aan vaststaat dat hun onderwijscarrière minder ver en minder hoog zal eindigen. Aangezien de onderwijsmarkt niet naar een evenwicht tussen vraag en aanbod tendeert, staat men voor de keus of men van overheidswege de effecten wil corrigeren (de ‘visible hand’ van de overheid in de publieke markt), dan wel de ongelijkheid accepteert.” (Onderwijsraad, 1999: 66) Met de negatieve effecten van herhomogenisering in het achterhoofd, is het dan ook niet verwonderlijk dat op een recente rondetafelconferentie van de Stichting Gerrit Kreveld een aantal academici een sterke oproep doen voor een echte comprehensieve eerste graad in Vlaanderen (Van Houtte, 2005). Met dat pleidooi sluiten deze academici aan bij vaststelling die o.a. door OECD (2004) werden gedaan op basis van een analyse van de PISA-2000resultaten: "Across the OECD countries, mean student performance in reading literacy tends to be lower in countries with a high degree of institutional differentiation at an early age, as compared to countries with integrated school systems where selection has not taken place at the age of 15 (…) PISA 2000 results suggest that the performance of students enrolled in comprehensive education systems is less dependent on their socioeconomic background” (OECD, 2003: 94). In dit verband hebben taaltoetsen zelfs het potentieel om homogeniseringsmechanismen te versterken. Taaltoetsen, vooral die toetsen die een aura van objectiviteit uitstralen vanwege hun uniform, gestandaardiseerd karakter, hun waterdichte scoringswijzers, en hun vastliggende cesuren of normen, hebben het potentieel om beslissingen aangaande doorverwijzing of oriëntering van leerlingen een even objectief en onaanvechtbaar aura te geven, en andere factoren die van belang zijn bij een oriëntering (bredere kijk op de competenties van de leerling, interesse en toekomstperspectieven van de leerling zelf, studiehouding, etc.) te overtroeven. Sommige toetsontwikkelaars zijn zich daar terdege van bewust. Zo waarschuwen de auteurs van de TAS-toets, een gestandaardiseerde, genormeerde toets voor het begin van het eerste jaar secundair onderwijs, dat de toets niet is bedoeld is om (homogene) klassen of leerlingengroepen samen te stellen. Het is de bedoeling dat de toets pas wordt afgenomen in de tweede helft van september, op het moment dat de (heterogene) klassen reeds zijn samengesteld, en de toets kan fungeren als een beginscreening die de leerkracht de kans geeft een beeld te krijgen van de taalvaardigheid van de groep (en met name ook de samenstelling van de groep in termen van hoger- en lagertaalvaardigen).
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
47 Naast herhomogenisering is een strakke focus op remediëring van individuele leerlingen een andere typische reactie op tegenvallende toetsresultaten die scholen vertonen. Screening van taalvaardigheid, zelfs indien die het doel heeft een schoolbeeld op te leveren, levert immers info op over de prestaties van individuele leerlingen. Het is dan ook verleidelijk om op basis van taaltoetsen een zeer gerichte, individuele remediëring van de probleemleerlingen (door gespecialiseerde leerkrachten) op te zetten en daarvan alle heil te verwachten. Deze praktijk was bijvoorbeeld voor de opstart van het Vlaamse Onderwijsvoorrangsbeleid in 1990 zeer sterk verbreid (getuige, bijvoorbeeld, de speciale NT2-remediëringsklasjes voor allochtone leerlingen) (Van den Branden & Van Avermaet, 2001). Internationaal onderzoek, en vooral ook de analyse van de wijze waarop momenteel op internationaal vlak met de bevordering van gelijke onderwijskansen wordt omgegaan, tonen aan dat een structureel werken aan de basisaanpak (met name, het structureel verhogen van de onderwijskwaliteit zodat doorheen het onderwijssysteem krachtige leeromgevingen voor leerlingen ontstaan en veel problemen kunnen worden voorkomen) een basisvoorwaarde is voor een duurzaam onderwijskansenbeleid: “For long-term success, ethnolinguistic minority students must receive the same benefits of a supportive learning environment that society automatically affords the majority language group." i.e. "... in classrooms where ethnolinguistic groups are not isolated, but where all students interact together.” (Thomas & Collier, 2000: 33-34). In dit verband schuift CREDE (Centre for Research on Education, Diversity and Excellence, het federaal gesubsidieerd onderzoekscentrum in de Verenigde Staten dat meta-analyses uitvoert naar het onderwijssucces van nationale minderheden) de volgende kwaliteitsindicatoren van een kansenbevorderende basisaanpak naar voor: 1. Teachers and students working together: Use instructional group activities in which students and teacher work together to create a product or idea; 2. Developing language and literacy skills across the curriculum: Apply literacy strategies and develop language competence in all subject areas; 3. Connecting lessons to students’ lives: Contextualize teaching and curriculum in students' existing experiences in home, community, and school; 4. Engaging students with challenging lessons: Maintain challenging standards for student performance; design activities to advance understanding to more complex levels; 5. Emphasizing dialogue over lectures: Instruct through teacher-student dialogue, especially academic, goal-directed, small-group conversations (known as instructional conversations), rather than lecture. Binnen die structurele basisaanpak kan een doordachte, systematische inpassing van individuele remediëring uiteraard een functionele plaats innemen, maar de aanpak van gelijke onderwijskansen mag niet tot die remediëring gereduceerd worden. Van essentieel belang voor schooleffectiviteit blijkt volgens de analyse van de internationale PISA-resultaten (Schleicher, 2006) de mate te zijn waarin schoolteams professioneel en vanuit hoge verwachtingen met de heterogene samenstelling van hun klassen weten om te gaan, en de resultaten van toetsen aangrijpen om fundamenteel te leren nadenken over hoe het onderwijs (nog) beter kan:
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
48 “What is important is that two things go hand in hand in the countries that scored best in PISA, clear and universally high ambitions for students, on the one hand, and access to best practice and professional development in schools, on the other, in ways that support teachers to expand their repertoire of pedagogic strategies to personalise learning for all of their students and to adopt innovative approaches to timetabling and the deployment of increasingly differentiated staffing models. (…) Many of the high performing PISA countries provide clearly formulated educational goals and standards, but have become less prescriptive in terms of how teachers should translate these goals into practice. Rather, they put the emphasis on creating a “knowledge rich” education system, in which teachers and school principals act as partners and have the authority to act, the necessary information to do so, and access to effective support systems to assist them in implementing change. (…) What may be most crucial is that the results from such assessments are feeding back to help students to learn better, teachers to teach better, and school to be more effective.” (Schleicher, 2006) Met andere woorden, schoolteams hebben nood aan beleidsruimte en stimulansen c.q. ondersteuning om hun professionele deskundigheid te verhogen. Vertrekkend van duidelijke doelstellingen, kunnen toetsen (waaronder een begin- en eindscreening waarbij scholen hun output kunnen vergelijken met die van vergelijkbare scholen) een informatierijk element vormen in een brede evaluatiepraktijk die ook minder meetbare aspecten van leerlingontwikkeling in kaart brengt en een brede reflectie op het onderwijsgebeuren centraal stelt. Concreet kan, de structuur van het Vlaamse onderwijs indachtig, gedacht worden aan een eindscreening voor het niveau lager onderwijs (en niet vroeger gezien de methodologische problemen verbonden aan kleutertoetsing), eventueel gecombineerd met een beginscreening lager onderwijs en info over context en instroomgegevens van de school, zodat de school op basis van deze gegevens zichzelf een spiegel kan voorhouden over hoe goed ze heeft gewerkt. Daarbij kan voor een eerste screening bijvoorbeeld gebruik gemaakt worden van begrijpend-leestoetsen, maar dient binnen een volledigere diagnose de brede evaluatie van de andere taal- en sociale vaardigheden en de procesdiagnose van strategieën, deelvaardigheden en attitudinele aspecten van taalgebruik opgenomen te worden, en dient centraal uitgegaan te worden van het principe dat toets- en brede evaluatiegegevens voor de school kansen tot reflectie, leren en ontwikkeling vormen. Die reflectie dient, geheel conform met de wijze waarop in binnen- en buitenland tijdens de afgelopen jaren vorm is gegeven aan een gelijke-onderwijskansenbeleid, zich centraal op een structurele verhoging van de kwaliteit van de basisaanpak (en dus de preventie van leerproblemen) te concentreren, en de remediëring van individuele leerproblemen daarin een gepaste plaats te verlenen. Voor het secundair onderwijs kan aan een gelijkaardig scenario gedacht worden (bijvoorbeeld einde eerste graad secundair onderwijs, tweede graad secundair onderwijs, einde secundair onderwijs), al hebben we er in het bovenstaande sterk op gewezen dat met name hier het gevaar op perverse neveneffecten op het vlak van herhomogenisering, reductie van curriculum, daling van verwachtingen en (verdere) streaming van leerlingen veel groter zijn dan in het basisonderwijs. Hier zal het belang van flankerende beleidsmaatregelen die een stevige dam opwerpen tegen deze neveneffecten van essentieel belang zijn. 2.4 De impact van centrale taaltoetsen op screening en diagnose Hieronder zullen we bespreken wat de mogelijke impact van centrale taaltoetsen op een schooltaalbeleid kan zijn. De term ‘centraal’ kan veel betekenissen hebben. Van Dale wijst in haar definities van het woord ‘centraal’ niet alleen op het middelpunt zelf, maar ook op
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
49 ‘werkingen die vanuit een middelpunt uitgaan’. Centrale taaltoetsen zullen we dan ook definiëren als taaltoetsen die vanuit een bepaald middelpunt (centraal punt) uitgaan. Daarmee is nog niet precies bepaald hoe de relatie tussen dat middelpunt en het veld er precies uitziet. De volgende varianten komen in de huidige internationale onderwijspraktijk het meest voor: a.
b.
c.
d. e.
Een centrale overheid ontwikkelt taaltoetsen en neemt de toetsen in steekproeven van scholen af teneinde op systeemniveau informatie te krijgen over de kwaliteit van het onderwijs of de haalbaarheid van bepaalde standaarden (doelstellingen); Een centrale overheid ontwikkelt taaltoetsen die aan het veld ter beschikking worden gesteld; een variant hierop is dat de centrale overheid een gespecialiseerde instelling subsidieert om taaltoetsen te ontwikkelen en die vervolgens aan het veld ter beschikking te stellen. In deze variant is het veld vrij om van de toetsen al dan niet gebruik te maken, en bepaalt het veld ook wat ze precies met de resultaten doet, en naar wie ze die communiceert; De centrale overheid stelt taaltoetsen niet alleen ter beschikking, maar verplicht of stimuleert het veld tevens om deze toetsen op een bepaald moment af te nemen; het staat de scholen wel vrij om zelf te beslissen wat ze precies met de resultaten doet en met wie ze die communiceert; De centrale overheid stelt taaltoetsen ter beschikking, verplicht of stimuleert het veld om de toetsen af te nemen, en vraagt de resultaten die werden geboekt, op; De centrale overheid stelt taaltoetsen ter beschikking, verplicht of stimuleert het veld om de toetsen af te nemen, en verplicht de scholen ook om de resultaten niet alleen bekend te maken aan de overheid, maar ook publiek te maken; een variant op deze situatie is dat de overheid zelf (of een instelling op een tussenniveau) de resultaten bekendmaakt. Deze laatste variant leidt in de praktijk vaak tot publieke ‘ranking’ van scholen.
Op deze vijf standaardsituaties zijn talloze varianten mogelijk, maar de essentiële dimensies waarmee hier boven rekening wordt gehouden, zijn: (a) wie ontwikkelt de toetsen en wie stelt ze ter beschikking; (b) hoe verplicht/vrijblijvend is het afnemen; (c) aan wie worden de resultaten bekendgemaakt? We stellen vast dat in tal van Europese en niet-Europese landen er momenteel een tendens valt waar nemen van a. of b. naar d. en e. (Field, 2006). Onder andere in het Verenigd Koninkrijk, Zweden, Noorwegen en de Verenigde Staten is een systeem van publieke ‘accountability’ ingevoerd; in Hongarije wordt het binnenkort ingevoerd. De Vlaamse overheid heeft zich tot hiertoe op domeinen a. en b. bewogen. Via periodieke peilingen (situatie a.) heeft de overheid systeeminformatie verzameld over de mate waarin eindtermen met betrekking tot taal, wiskunde en wereldoriëntatie op het einde van het basisonderwijs worden gehaald. Ook heeft de Vlaamse overheid bepaalde instellingen gesubsidieerd (zoals bijvoorbeeld het Steunpunt NT2) die een aantal taaltoetsen hebben ontwikkeld en genormeerd, die dan vervolgens vrijblijvend aan de scholen werden aangeboden. Recentelijk heeft de Vlaamse overheid te kennen gegeven om middels haar OPBWO-programma voor onderwijsgericht onderzoek een beweging in de richting van situatie c. te maken: binnen dat programma wil de overheid tijdens de periode 2006-2011 een programma uitvoeren voor periodieke peiling van leerlingprestaties in het leerplichtonderwijs. Tot hiertoe dienden periodieke peilingen een functie op systeemniveau, namelijk het leveren van objectieve, betrouwbare en landelijke informatie over de mate waarin de getoetste eindtermen of ontwikkelingsdoelen bereikt zijn door de betrokken leerlingen. Dat laat de overheid toe een grondige analyse te maken van “de sterke en zwakke punten in het
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
50 onderwijscurriculum en daaruit de nodige lessen te trekken. De peilingresultaten leveren informatie op die mogelijk leidt tot bijsturingen van de eindtermen en/of van de leer- en onderwijsmethodes.” In het nieuwe OPBWO-programma voegt de Vlaamse overheid daar een functie aan toe die rechtstreeks heeft te maken met de ‘interne kwaliteitszorg van de scholen’. “Wil het Vlaamse onderwijs zijn ambitie waarmaken om hoge kwaliteit voor alle leerlingen te realiseren, dan zal het nodig zijn om de onderwijskwaliteit zo goed mogelijk in kaart te brengen. Dat kan enkel wanneer zowel de overheid als de scholen een beleid voeren op basis van een integraal systeem van kwaliteitszorg dat steunt op een informatierijke omgeving. Een doeltreffend kwaliteitszorgsysteem vereist m.a.w. dat zowel de overheid als de scholen regelmatig zicht krijgen op de resultaten en effecten van hun beleid. Daarom moeten peilingen niet alleen informatie leveren aan de overheid, maar moeten ze de scholen ook leerkansen bieden. Scholen moeten zicht krijgen op, en geconfronteerd worden met de resultaten die ze boeken en daarbij rekening houden met de kenmerken van hun instroom en de context waarin ze moeten werken. Om hun beleidskracht te versterken, hebben de scholen informatie nodig over wat ze zouden kunnen doen – of anders gezegd: aan welke factoren ze iets kunnen veranderen – om de leerprestaties van hun leerlingen te verbeteren. Als men de scholen een spiegel van hun kwaliteit wil voorhouden, moet bij de peilingen ook de relatie tussen verschillen in leerlingprestaties en leerling-, groeps- en schoolkenmerken onderzocht worden. Dat moet toelaten om interpretatiemodellen te construeren om de resultaten naar de scholen terug te koppelen in de vorm van een 'informatief verhaal'. Op die manier zijn de peilingresultaten ook relevant voor de scholen die niet in de steekproef zitten en vormen zij een basis voor feedback naar alle scholen. Wanneer de verbanden tussen leerlingenprestaties en kenmerken van leerlingen, leerlingengroepen en scholen op een herkenbare manier geschetst worden, kunnen scholen die niet deelnamen ook leren uit die verbanden. Zo kunnen alle scholen en ook de overheid leren uit de peilingresultaten, en kunnen de resultaten een aanzet vormen tot zelfreflectie en bijsturing van het gevoerde beleid. De overheid wil scholen ook ondersteunen in hun zelfevaluatie door betrouwbare en valide toetsinstrumenten ter beschikking te stellen die op grote schaal genormeerd zijn en waarmee ze zichzelf kunnen positioneren ten opzichte van gelijkaardige scholen. Daarom zal voor elke peiling zowel een toets voor de peiling als een parallelversie van deze toets ontworpen worden die de scholen kunnen gebruiken buiten de context van de specifieke landelijke peiling. Aangezien de opgaven uit de parallelversie tegelijk met het eigenlijke peilinginstrument worden gekalibreerd en voorzien van een toetsnorm, meet deze parallelversie exact hetzelfde als de landelijke peiling. De overheid zal deze paralleltoets vrijblijvend ter beschikking stellen van de scholen nadat de resultaten op de landelijke peiling zijn bekendgemaakt. Scholen kunnen er dan voor kiezen om deze toets zelf af te nemen bij hun leerlingen. Op die manier krijgen ze aan de hand van een wetenschappelijk onderbouwd instrument (gestandaardiseerd en objectief) de kans om na te gaan in welke mate hun leerlingen de betrokken eindtermen hebben bereikt. Om scholen op basis van de parallelversies inzicht te bieden in hun ‘gecorrigeerde’ prestaties, d.w.z. prestaties waarbij rekening gehouden wordt met achtergrondkenmerken van hun leerlingen en eventueel ook met schoolkenmerken, dan zal er door de overheid voorzien moeten worden in een systeem van schoolfeedback. Peilingen zullen ook herhaald worden. Door peilingen te herhalen kan men drie doelen realiseren. Wanneer men weet dat een peiling regelmatig zal herhaald worden, zal men wellicht ook meer geneigd zijn om daadwerkelijk iets te doen aan tegenvallende
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
51 resultaten en/of om goede resultaten te bestendigen. Ten tweede kunnen door herhalingen de ontwikkelingen in de tijd in kaart gebracht worden. Peilingen brengen de stand van zaken in het onderwijs van nu in beeld. Als eenzelfde peiling een aantal jaar later wordt herhaald, kan de huidige peiling als vergelijkingsbasis dienen. Herhaalde peilingen kunnen ten slotte empirische informatie leveren over kwaliteitsstijgingen en/of –dalingen m.b.t. de getoetste eindtermen.” De OBPWO-oproep geeft duidelijk aan dat de overheid parallelversies van de genormeerde, aan de eindtermen/ontwikkelingsdoelen gelinkte peilingsinstrumenten vrijblijvend aan de scholen zal aanbieden, en via een centraal schoolfeedbacksysteem aan de scholen info zal bezorgen omtrent ‘gecorrigeerde prestaties’ die rekening houden met achtergrondkenmerken van leerlingen en eventueel schoolkenmerken. De potentiële winst van dit voornemen situeert zich dus op verschillende niveaus: 1. De scholen krijgen valide en betrouwbare instrumenten om de eindtermen/ontwikkelingsdoelen te toetsen. Indien voor sommige domeinen of eindtermen zulke instrumenten niet bestaan, kunnen de scholen via dit overheidsinitiatief voorbeelden krijgen van hoe zulke toetsen eruit zien, en tot een kwaliteitsvollere evaluatie van de betrokken doelstellingen overgaan; dit kan mogelijk ook een positief backwash-effect hebben op de eigen (tussentijdse) toetsen die de school hanteert. Dit potentieel wordt met name groot op scholen die voor eindtermen taal zich tot hiertoe beroepen op louter indirecte toetsen of toetsen die enkel deelvaardigheden in kaart brengen. 2. De introductie van directe toetsen voor functionele taaldoelstellingen kan ook potentieel een positief backwash-effect hebben op de didactiek van het taalonderwijs. Volgens Weir (1990: 27) is “a communicative approach to language teaching more likely to be adopted when the test at the end of a course is itself communicative. A test can be a very powerful instrument for effecting change in the language curriculum...”. 3. De school ontwikkelt een ‘correcter zicht’ op haar interne kwaliteitszorg en een meer informatierijke omgeving door haar uitkomsten te vergelijken met de resultaten van andere scholen die onder vergelijkbare omstandigheden aan dezelfde doelstellingen werken. Op basis van de bovenstaande OBPWO-oproep kan afgeleid worden dat de Vlaamse overheid vooralsnog geen expliciete plannen heeft om op te schuiven richting d. en e. waarbij afname van centrale toetsen verplicht wordt en resultaten publiek worden gemaakt. Met name tegen dat laatste systeem van verplichte toetsing en publieke resultaten wordt in tal van publicaties bijzonder veel kritiek geuit (Boes & Both, 2001; Darling-Hammond, 1997; Dijkstra, 2001; Eisner, 2001; Elliott, 2002; Kohn, 2000, 2001; McNeill, 2000; Meier, 2000; Ohanian, 1999, 2001). De meest voorkomende punten van kritiek worden hieronder opgesomd, waarbij kan worden opgemerkt dat een aantal punten van kritiek ook van toepassing zijn op situatie c.: 1. De koppeling van ‘high-stakes’ centrale toetsing aan de evaluatie van individuele leervorderingen dwingt leraren om hun onderwijs af te stemmen op de toets, en tot specifieke training over te gaan op het afleggen van de toets; dat kan negatieve gevolgen hebben aangezien in centrale toetsing, vanuit het sterk geüniformiseerd en gestandaardiseerd karakter van de toetsen en hun afnamemodaliteiten, vooral gefocust op wat makkelijk meetbaar is; dit alles kan op termijn leiden tot curriculumverenging (doelen die niet gemeten kunnen worden, worden uit het oog verloren of worden als
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
52 minder belangrijk ervaren), of tot een grotere eenvormigheid in het didactische aanbod van verschillende scholen. In de periode voor de toets dreigen ‘niet relevante’ vakken verwaarloosd en ‘inefficiënte’ activiteiten opgeofferd te worden. 2. Training voor de centrale testen kan niet alleen bij de leerkrachten aangewakkerd worden, maar ook bij ouders; er kan dan een risico ontstaan dat net kinderen uit kansrijkere gezinnen ‘beter’ en intensiever worden getraind door hun ouders, waardoor hun kansen om goede testscores te halen, verhogen en de sociale kloof vergroot. 3. Didactisch kan het invoeren van centrale, publieke toetssystemen leiden tot een stap terug in de tijd; samenhangend met de direct meetbare items die in de toets voorkomen, kan de didactiek zich terug sterker richten op diezelfde items die makkelijk onderwijsbaar zijn; dit staat haaks op de huidige overheersende visies op leren, waarin met name het ontwikkelen van complexe competenties die kunnen aangewend worden in levensechte situaties centraal staat; de Vlaamse respondenten in een Delphi-studie rond dit onderwerp (Van Petegem & Vanhoof, 2006), gaven dit als één van hun allerbelangrijkste zorgpunten aan. 4. Toetsenmakers krijgen een sterke machtspositie over wat er in het onderwijs gebeurt; dit staat haaks op het basisprincipe van de pedagogische autonomie. 5. Leraren gaan op de duur testscores meer vertrouwen dan hun eigen professionele oordeel van leerlingontwikkeling, dat nochtans gebaseerd is op langdurige en diepgravende observaties. Centrale toetsen dreigen leerkrachten op die manier te ‘deprofessionaliseren’. 6. Samenhangend met het vorige punt, dreigen leraren steeds minder te reflecteren op hun eigen werk en steeds minder van collega’s van andere scholen te (willen) leren. In plaats daarvan gaan ze zich afschermen en verdedigen tegen de concurrenten van de andere scholen. 7. Verplichte centrale taaltoetsen - met hun nadruk op strak meetbare output, verantwoording en doorgedreven transparantie - verhogen het economisch bedrijfskarakter van een school, en voeden het beeld dat het onderwijskorps door de overheid wordt gewantrouwd. Bij sommige leraren heeft dat als gevolg dat ze geen risico’s meer durven te nemen, en hun praktijk niet meer vernieuwen, bij andere leraren en directeurs is dit een reden om het onderwijs te verlaten. 8. De grote druk en mogelijke sancties bij lage scores verhogen de kans op frauduleuze praktijken bij de toetsafnames. 9. Leraren ontwikkelen een negatieve houding tegenover laag scorende kinderen, omdat ook zij op die lage scores dreigen te worden afgerekend. Dit kan in sommige scholen leiden tot een verhoging van het ‘wegdraineren’ van slecht scorende kinderen om de eigen scores te verfraaien. 10. Het beleid in de school, en het overleg daarover, dreigt te worden versmald tot de inzet van de centrale toetsen; het beleidsvoerend vermogen dreigt zich centraal toe te spitsen op prestaties die rechtstreeks met de toetsen samenhangen, eerder dan op het brede, eigen pedagogisch project. 11. De leerlingen zelf dreigen een zeer eenzijdig beeld van ontwikkeling op te bouwen. Je goed ontwikkelen op school dreigt gelijk te komen staan met goed scoren op bepaalde toetsen. 12. Leerlingen dreigen geïdentificeerd (en in het slechtste geval gereduceerd) te worden met hun toetsscores. Leerlingen die aan centrale toetsen worden onderworpen, dreigen een etiket opgeplakt te krijgen of ‘vanuit objectieve gronden’ met lage verwachtingen vanwege de leerkrachten bejegend te worden. In diezelfde geest dreigt centrale taaltoetsing de homogeniseringsdrang in het onderwijs aan te wakkeren.
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
53 13. Als centrale toetsen met normcategorieën werken waarbij kinderen met elkaar worden vergeleken zullen er altijd winnaars en verliezers zijn, namelijk kinderen die relatief beter scoren en kinderen die relatief zwakker scoren. Dit kan in het nadeel werken van scholen die veel kinderen inschrijven die uit socio-economische milieus komen die een grotere kloof met het schoolleven vertonen, want zij maken veel kans om bij de lagere scoorders terecht te komen. 14. Het is voor leraren aantrekkelijker om op scholen te werken met hoge scores, dan op scholen met lage scores die onder druk van sancties moeten leven. Laagscorende scholen zouden het daardoor op termijn moeilijker kunnen krijgen om (goede) leerkrachten aan te trekken en te behouden. Dit is paradoxaal, omdat achter het idee van ‘accountability’ precies het voornemen zit om vooral in die scholen die laag scoren, beter onderwijs te stimuleren. 15. Het publiek maken van de resultaten verhoogt het risico dat de pers eenzijdig op (bepaalde) cijfers zal focussen en scholen op eenzijdige wijze zal stigmatiseren. Sommige scholen dreigen op die manier afgestraft te worden ondanks hun harde werk. Het is opvallend dat de bovenvermelde critici geen tegenstanders van toetsen tout court zijn, maar vooral de uitwassen aan de kaak stellen van een te strak doorgedacht systeem van centrale toetsing. Veel van de boven aangehaalde punten zijn gebaseerd op kleinschalige studies of op theoretische pleidooien. Toch bestaan er ook studies op grotere schaal, die met name voor deze haalbaarheidsstudie interessant zijn omdat ze ingaan op de impact van publieke ‘accountability’ systemen van centrale toetsing op gelijke onderwijskansen. Zo besluiten McNeill (2000) en Haney (2002) op basis van hun studies in Texas dat centrale toetsing die gepaard gaat met ranking van scholen, negatieve effecten heeft voor scholen met sociaal-economisch achtergestelde kinderen: met name versmalt het curriculum in deze scholen sterk tot toetstraining en ‘basic skills’, terwijl in scholen met een hogere SESinstroom volop ruimte blijft voor probleemoplossende activiteiten, verkenning van de wereld en ‘higher-level critical thinking’. Hillocks (2002) stelt vast dat vooral in scholen met veel doelgroepleerlingen het schrijfonderwijs sterk verengd wordt tot het aanleren van schrijfconventies en vele vormen van creatief denken worden geweerd. Deze scholen worden bovendien sterk onder druk gezet om bepaalde lesmethoden en materialen die rechtstreeks op de toets voorbereiden, in te voeren: “a cumulative deficit grows, separating minority students from the education being provided their more privileged peers” (McNeil, 2000). In Arizona stellen Koretz et al. (2003) vast dat in hoge SES-scholen de verwachtingen van leerkrachten stijgen, terwijl die in lage SES-scholen onder de invloed van testscores dalen. In hun grootschalige studie onderzochten Hanushek & Raymond (2004) of ‘school accountability’ heeft geleid tot verbeterde leerlingprestaties en gelijkere onderwijskansen. Zij richtten zich op de grootschalige ‘No Child Left Behind’-policy in de Verenigde Staten (NCLB). Een uitgangspunt van dit beleid is “that standards, testing and accountability were the path to improved performance” (Hanushek & Raymond, 2004: 1). Staten werden opgeroepen om ‘accountability systems’ op te richten waarbij alle kinderen tussen 3th and 8th grade van de basisschool jaarlijks werden getest (op wiskunde, Engels en wetenschappen). Staten maken de resultaten van hun scholen publiekelijk bekend. Op het moment van het onderzoek hadden 39 staten van de Verenigde Staten een systeem van publieke ‘accountability’ ingevoerd.
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
54 De onderzoekers brachten informatie over de door de staten ingevoerde systemen in verband met de scores van de leerlingen op de afgenomen centrale taaltoetsen; zij vergeleken daarbij de scores van blanke leerlingen met die van Hispanics en zwarte leerlingen. Daarbij werden de resultaten van 4th grade met die van 8th grade vergeleken. De onderzoekers komen tot de conclusie dat in de Verenigde Staten het systeem van ‘accountability’ heeft geleid tot hogere gemiddelde scores op de toetsen. In staten waar het systeem sneller werd ingevoerd, is de winst hoger dan bij de zogenaamde ‘late adopters’. Opvallend is dat het volume aan overheidsgeld dat in het onderwijsbeleid wordt gepompt, geen cruciale impact heeft op de effectiviteit van de scholen: “Consistent with past evidence on the impact of resources, the pattern of NAEP scores across states is not explained by spending.” (Hanushek & Raymond, 2004: 19) De resultaten zijn echter niet onverdeeld positief. Vrij verontrustend vinden de onderzoekers dat Hispanics en zwarte leerlingen veel minder vooruitgaan dan blanke leerlingen. Vooral zwarte leerlingen blijken de dupe van het systeem te zijn. De onderzoekers stellen zelfs vast dat de inhaalbeweging die Hispanics en zwarte leerlingen aan het maken waren voor het invoeren van het accountability systeem, nu wordt teruggedraaid. “Thus, even though accountability provides a positive gain on average, that dividend is not sufficient to override the prevailing differential in performance when students are broken out by race/ethnicity. This finding of lower black and Hispanic growth is particularly interesting in light of the narrowing of the achievement gap that occurred in the late 1980s and the subsequent explanations for this improvement. The analysis of state details here that controls for state policy, family backgrounds and testing exclusions shows a clear reversal of the trend in the prior decade.” (Hanushek & Raymond, 2004: 20). De onderzoekers concluderen dat publieke ‘accountability’ systemen an sich niet de kracht hebben om de ongelijke-onderwijskansenkloof te dichten, en soms zelfs het tegenovergestelde effect blijken te hebben. Dat heeft in de onderzochte staten te maken met het feit dat heel wat andere factoren op het onderwijs inwerken (en sommige van de bovenvermelde negatieve neveneffecten opspelen), waarmee binnen een beleid dan ook rekening moet worden gehouden. Zo blijkt uit de verdere analyses van Hanushek & Raymond o.a. dat de sterke concentratie van zwarte leerlingen in bepaalde gettoscholen een zeer negatieve impact heeft op de resultaten. “Again, as is frequently the case, a single policy cannot effectively work for two different objectives – raising overall student performance and providing more equal outcomes across groups.” (Hanushek & Raymond, 2004: 32) Deze meta-analyse toont dat een beleid dat, in minder of meerdere mate, nadruk legt op outputverantwoording door scholen, omringd moet worden met tal van andere overheidsmaatregelen die er sterk op gericht zijn mogelijke uitwassen van het systeem tegen te gaan. Met name blijken maatregelen ter bevordering van het beleidsvoerend vermogen van de scholen, de vrijwaring van heterogene school- en klassamenstellingen, en de professionalisering en verhoging van de doelmatigheidsbeleving van het lerarenkorps volgens de bovenvermelde bronnen van bijzonder groot belang te zijn. De invoering van centrale taaltoetsen kan met andere woorden enkel bijdragen tot een informatierijke omgeving indien de informatie waarop de school zich baseert om na te denken over leerlinggroei en de
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
55 onderwijsinspanningen die ze daartegenover zet, niet wordt verarmd tot de resultaten van de taaltoetsen alleen. Een opschuiven naar de meest doorgedreven vormen van publieke ‘accountability’ verhoogt de kans dat dat laatste gebeurt. Taaltoetsen vormen vanuit deze vaststelling dan ook beter niet de spil van een gelijke-onderwijskansenbeleid, maar eerder een element dat gericht is op een stimulering van de groei van scholen tot beleidseffectieve, hoogreflectieve en daadkrachtige teams die op deskundige wijze de kansen van alle leerlingen op volwaardige ontplooiing vanuit hoge verwachtingen gaaf houden. Dat is ook een van de belangrijkste conclusies van het onderzoeksrapport ‘Handle with care’ van de Nederlandse Onderwijsraad (1999) naar de ‘public accountability’ systemen in Engeland en Frankrijk en van het onderzoek in Vlaanderen van Van Petegem en Vanhoof (2006). “De negatieve effecten van het publiceren van prestatie-indicatoren zijn bij herhaling genoemd: demotivatie, strategisch en cosmetisch gedrag van scholen, meer ongelijkheid tussen ouders/leerlingen en tussen scholen (evenals meer polarisatie en minder samenwerking tussen scholen.” (Onderwijsraad, 1999: 65) Ook hier pleiten de onderzoekers voor het belang van een brede (school)diagnose en het ondersteunen van de scholen daarin. Schoolverbetering vereist volgens hen veel meer dan het louter geconfronteerd worden met toetsgegevens. “Scholen voelen zich volledig ‘in the dark’ als ze in een zeer beperkt aantal openbare indicatoren zien weergegeven dat ze niet naar behoren presteren, zo blijkt in Frankrijk en Engeland. Aggregatie leidt onvermijdelijk tot informatieverlies. Ze hebben waarschijnlijk behoefte aan meer gedetailleerde gegevens over de onderdelen van de school (schooltypen, specialisaties, vaksecties) waarop men slecht scoort, evenals welke samenhangen tussen hun prestaties en andere variabelen bestaan (waar wijkt men bijvoorbeeld af van beter presterende scholen?). (…) Scholen zien daardoor niet alleen hoe ze presteren in vergelijking met o.a. qua leerlingpopulatie vergelijkbare scholen, maar eveneens wat in vergelijkbare scholen de attituden en aspiraties van leerlingen en de kenmerken van het onderwijsleerproces zijn. Scholen blijken daar behoefte aan te hebben en erin te willen investeren in termen van menskracht en geld. Een dergelijke activiteit gaat aanmerkelijk verder dan het publiceren van schoolprestatiegegevens, zoals we dat al enige tijd in Nederland kennen. Echter, de kans dat de kwaliteit van Nederlandse scholen zal verbeteren louter door het openbaar maken van een beperkt aantal prestatie-indicatoren en, in het verlengde daarvan, door het handelen van ouders en leerlingen als onderwijsconsumenten achten wij gering.” (Onderwijsraad, 1999: 64). Daartegenover staat wel dat het aanbieden van uniforme toetsen de overheid de mogelijkheid biedt om een monitoring-systeem op te bouwen, waarmee ze, bijvoorbeeld via de doorlichtingen van de inspectie, beter zicht kan krijgen op de scholen die sterk onderpresteren. Zonder dat de povere resultaten van zulke scholen publiek moeten worden gemaakt, dient de overheid na te denken over hoe met deze scholen moet worden omgegaan. De sterke effecten van schoolkwaliteit op schooleffectiviteit indachtig, kan een ‘highsupport/high-challenge’ programma (Hopkins, 2005; Onderwijsraad, 1999), waarbij de echt pover scorende scholen een intensieve ondersteuning krijgen en met de uitdaging worden geconfronteerd om binnen een vooraf bepaalde periode betere resultaten voor te leggen, de zwakke plekken van het onderwijssysteem gerichter aanpakken. De screening via taaltoetsing
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
56 kan dan een eerste signaal opleveren dat de school de gewenste of (in haar context) haalbare resultaten niet haalt; dat signaal kan de aanleiding vormen voor een uitgebreide diagnose in de geest van de GOK-kwaliteitscirkel, en de formulering van een concreet actieplan dat vervolgens onder begeleiding door het schoolteam wordt uitgevoerd.
Hoofdstuk 2: Taaltoetsen als hefboom voor taalondersteuning
57
3 Hoofdstuk 3: Financiering van doelgroepleerlingen 3.1 Inleiding Sinds 1990 wordt in Vlaanderen beleid gevoerd dat erop gericht is kinderen uit sociaal zwakke milieus via onderwijs meer kansen op maatschappelijk succes te bieden. Eén van de peilers van dit beleid is het ter beschikking stellen van extra middelen aan scholen die leerlingen uit die sociaal zwakke milieus rekruteren. Om de verdeling van die extra middelen op een transparante en objectieve manier te laten verlopen, heeft de overheid een procedure uitgewerkt. Via die procedure worden schoolkenmerken gecombineerd met individuele leerlingkenmerken om te bepalen hoeveel extra middelen aan welke school worden toegekend. De huidige minister van Onderwijs wil de toewijzing van middelen in het kader van het GOKbeleid evalueren. Hij wil op termijn komen tot een financieringswijze die sterker leerlinggebonden is15. Om dit te bewerkstelligen wil hij laten onderzoeken op basis van welke objectieve criteria risicoleerlingen het best geïdentificeerd worden. Eén van de vragen die hij daarbij stelt is welke rol taaltoetsen bij het identificeren van risicoleerlingen kunnen spelen16. Dit hoofdstuk probeert een antwoord op die vraag te geven.
3.2 Doelstellingen van de overheid Om na te gaan welke rol taaltoetsen in dit verband kunnen spelen, is het van belang eerst duidelijk te expliciteren wat de visie van de overheid is op onderwijs en gelijke kansen. Een adequate financieringssysstematiek moet immers aansluiten bij de ideeën op het terrein van onderwijs en achterstandsbestrijding die de overheid in praktijk wenst te brengen. Door de jaren heen heeft de Vlaamse overheid haar intenties met betrekking tot gelijke onderwijskansen steeds verder uitgewerkt. Als men gaat kijken welke rol taaltoetsen in dit verband kunnen spelen, blijkt echter ook dat er nog een aantal kwesties ongeëxpliciteerd zijn gebleven. Met de financiering die is ontstaan in het kader van onderwijsvoorrang en zorgverbreding, en verder is verfijnd in het GOK-beleid, wil de overheid aan de scholen de middelen ter beschikking stellen die ze nodig hebben om met al hun leerlingen een maximaal rendement te bereiken. Het uitgangsidee hierbij is dat de school hiervoor voor sommige leerlingen meer inspanningen moet leveren, en dus ook meer middelen nodig heeft dan voor andere. Het komt er dus op aan die leerlingen te identificeren en de scholen waarop zij onderwijs volgen de middelen ter beschikking te stellen om die grotere inspanningen te leveren. Voor de overheid betekent dit dat ze over informatie moet beschikken om de leerlingen die grotere onderwijsinspanning vergen (verder doelgroepleerlingen) te identificeren en te lokaliseren, en om na te gaan of de school die grotere inspanning ook daadwerkelijk levert. Het is immers
15
De minister blijft er wel vanuit gaan dat de financiering gebaseerd moet zijn op een combinatie van individuele leerlingkenmerken en schoolkenmerken (Vandenbroucke, 2004). Wat hij beoogt is dat de financiële ondersteuning van de overheid voor risicoleerlingen volledig geïntegreerd wordt in de basisfinanciering per leerling. 16 Al bij de invoering van het GOK-decreet werd in het vooruitzicht gesteld dat taaltoetsen in dit verband een rol zouden kunnen gaan spelen (Vanderpoorten, 2000).
Hoofdstuk 3: Financiering van doelgroepleerlingen
58 niet de aanwezigheid van die leerlingen op een school die een ruimere financiering wettigt, maar wel de inspanning die de school voor hen levert.17 Daarbij kan men een onderscheid maken tussen diverse vormen van inspanning van de school. De overheid kan met de identificering van doelgroepleerlingen beogen dat middelen ter beschikking gesteld worden die ook in de mate van het mogelijke individueel18 aangewend worden. Met andere woorden, de school krijgt extra middelen om de individuele leerling te begeleiden. In de mate dat die begeleiding gericht is op het wegwerken van de gebleken achterstand, hebben we te maken met onderwijs dat zeer sterk het accent op remediëring legt. Waar die extra inspanning erop gericht is om achterstand in de toekomst te vermijden, kunnen we van preventie spreken, hoewel deze twee vormen van benadering van de individuele leerling in de praktijk wellicht weinig van elkaar zullen verschillen. Wat wel een verschillend resultaat oplevert is een benadering waarbij de overheid via de geïdentificeerde leerling scholen met een grote populatie doelgroepleerlingen de mogelijkheid wil bieden om zijn regulier onderwijs aan te passen aan die doelgroepleerlingen. Men probeert niet zozeer een gebleken achterstand weg te werken, dan wel een vorm van onderwijs te ontwerpen waar de achterstandsleerling effectief tot leren wordt gebracht. Men focust niet op remediëring, maar op de uitbouw van een structureel krachtige leeromgeving. In dit geval hoeven de middelen strikt genomen niet ingezet te worden voor de leerling die ze heeft gegenereerd, maar kunnen ze gebruikt worden voor de uitbouw van een algeheel effectiever onderwijs. De verschillen in benadering kristalliseren in het feit dat de eerste werkwijze meestal leidt tot een homogenisering van groepen waarmee men werkt, en de tweede tot het uitwerken van effectief onderwijs aan heterogene groepen. De voor- en nadelen van beide benaderingen hebben we reeds in het vorige hoofdstuk besproken. We hebben aangegeven dat uit onderzoek vooral naar voren komt dat structureel werken aan de leeromgeving over het algemeen betere resultaten oplevert dan de doorgedreven uitwerking van, en focus op, individuele remediëring. We zijn daar tot de conclusie gekomen dat de inzet van taaltoetsen voor screening en diagnose van taalachterstand er niet toe mag leiden dat school dat algemenere perspectief op achterstandsbestrijding weer gaat inruilen voor een schoolbeleid louter gebaseerd op individuele remediëring. Mutatis mutandis geldt ook voor de uitwerking van een financieringssysteem gebaseerd op taaltoetsen dat het niet de indruk moet wekken dat vanaf nu individuele remediëring de centrale boodschap is. De keuze voor een uitwerking van emanciperend onderwijs in de richting van de uitbouw van een krachtiger leeromgeving impliceert ook dat de kloof tussen sterke en zwakke leerlingen niet noodzakelijk verkleind wordt. Van een krachtige leeromgeving profiteren alle leerlingen van een heterogene groep, dus ook de sterke leerlingen. Zwakkere leerlingen kunnen dan wel tot betere leerprestaties gebracht worden, maar ook de sterkere leerlingen gaan vooruit. Dit betekent dat het succes van het onderwijsbeleid niet zozeer afgelezen kan worden aan het verschil in prestatie tussen beide groepen, maar aan de mate dat een zwakke groep vooruitgang boekt. 17
We hebben hier te maken met de voorwaardelijkheid van de financiering. In het originele Onderwijsvoorrangsbeleid werd die voorwaardelijkheid als centraal element in de financiering ingebouwd. In het GOKdecreet werd het idee van de voorwaardelijkheid behouden, maar werd de uitwerking ervan minder zwaar aangezet. Ook in de toekomst wil de minister een zekere vorm van voorwaardelijkheid behouden (Vandenbroucke, 2004). 18 In werkelijkheid gaat het hier meestal om het inrichten van speciale remediëringsactiviteiten voor homogene groepjes achterstandsleerlingen. Wat verder gezegd wordt over individuele remediëring, geldt ook voor het werken met deze groepjes.
Hoofdstuk 3: Financiering van doelgroepleerlingen
59 Eén en ander betekent dat de invoering van taaltoetsen geen alternatief biedt voor de voorwaardelijkheid van financiering: ook met een systeem waarbij doelgroepleerlingen efficiënter geïdentificeerd worden door gebruikmaking van taaltoetsen, blijft het belangrijk dat de overheid de effectiviteit van de acties die met de achterstandsmiddelen worden uitgewerkt, bij de toekenning van financiering betrekt.
3.3 Identificering van doelgroepleerlingen In het huidige GOK-beleid worden doelgroepleerlingen vooral geïdentificeerd met behulp van sociale kenmerken van de leerlingen. Aan de hand van een vijftal sociale groepsindicatoren wordt nagegaan of een leerling sociaal gezien tot een risicogroep behoort. Vanaf de tweede en derde graad van het secundair onderwijs gaat ook zittenblijven een rol spelen. Zittenblijven wordt hierbij geïnterpreteerd als een indicator voor opgelopen achterstand19. Met de introductie van niveau van taalvaardigheid als criterium beoogt de overheid de financiering sterker af te laten hangen van dergelijke individuele kenmerken. Een leerling wordt als doelgroepleerling beschouwd als hij aan minstens één van de onderzochte kenmerken beantwoordt. Uitzondering wordt gemaakt voor het criterium thuistaal, dat samen met een ander criterium moet voorkomen om een leerling de doelgroepstatus te verlenen. Op basis van de weging van de relevante criteria wordt per doelgroepleerling een gewicht bepaald tussen 0.4 en 1.2. Deze gewichten worden in rekening gebracht bij het bepalen van het lestijdenpakket dat de school ontvangt. De toewijzing van de lestijden is dus zowel afhankelijk van de identificatie als van de weging van de doelgroepleerlingen. In wat volgt willen we kijken naar het effect van het huidige identificatie- en wegingssysteem dat de overheid hanteert. We baseren ons daarbij op gegevens uit het (voorlopige) LOARapport 41 (Reynders et al., te verschijnen), en op secundaire analyses van de resultaten uit het PISA-onderzoek. In opdracht van het ministerie van onderwijs heeft het Steunpunt LOA onderzocht in welke mate de identificatie en weging van doelgroepleerling overeenstemt met andere indicatoren van leerbedreigdheid. Een eerste vaststelling is dat in hun steekproef 24% van de leerlingen de status van doelgroepleerling krijgen toegewezen. Van die leerlingen volgt een kleine groep onderwijs in een school die minder dan 10% doelgroepleerlingen heeft, en daarom geen extra financiering krijgt. De overige leerlingen zijn verdeeld over 72 % van de scholen. Dit betekent dus dat de GOK-middelen over een groot aantal scholen worden verdeeld. Een tweede vaststelling is dat de toewijzing van het kenmerk kansarm op grond van een clusteranalyse een indeling oplevert van de leerlingen in de steekproef die duidelijk in verband staat met hun beginpositie in het onderwijs. Bij kinderen uit de derde kleuterklas bleek dat hun indeling in clusters op basis van sociale kenmerken, grote overeenkomst vertoont met hun prestaties op taal en rekenen. (de clusters 2, 3 en 6 worden beschouwd als de ‘kansarme’ clusters).
19
De introductie van dit kenmerk betekent dus dat leerlingen uit een sociaal milieu dat niet wordt geacht achterstand in de hand te werken, maar die toch achterstand heeft opgelopen, toch voor extra ondersteuning in aanmerking komt. In die zin is dat laatste kenmerk van een andere aard dan de vorige.
Hoofdstuk 3: Financiering van doelgroepleerlingen
60
Cluster 1 2 3 4 5 6 7
Score taal 22.1 21.1 15.6 24.0 23.3 15.1 26.6
Score wisk 24.6 24.3 14.4 27.9 26.3 16.1 31.7
Tabel 3.1: Score taal en rekenen per sociaal cluster (uit: Reynders et al., te verschijnen)
Opvallend is dat de indeling van leerlingen in clusters op een aantal punten sterk verschilt van de indeling op basis van de GOK-criteria. Als we de eerste uitkomsten van de kansarmoedeanalyse uit het LOA-rapport als referentiepunt nemen, zien we dat de GOK-identificatie 42% van de kansarmoedeleerlingen mist. Dit zijn leerlingen die we valse negatieven zouden kunnen noemen (zie hoofdstuk 1 voor definitie van valse negatieven). Daarbij blijkt 18% van de leerlingen te behoren tot de groep die we valse positieven hebben genoemd. Als we daarbij in gedachten houden dat de criteria die in het LOA-onderzoek gehanteerd werden, restrictiever zijn dan die die in GOK worden gebruikt (respectievelijk 16% kansarmen versus 24% GOK-leerlingen), is met name de groep valse negatieven toch verontrustend groot. Freq. % Rij% Kolom%
GOK-leerling
Niet GOK-leerling
Totaal
Kansarm (Cluster 2, 3 of 6)
328 9.21 57.64 38.10
241 6.77 42.36 8.93
569 15.98
Niet Kansarm (Cluster 1, 4, 5 of 7)
533 14.97 17.81 61.90
2459 69.05 82.19 91.07
2992 84.02
Totaal
861 24.18
2700 75.82
3561 100.00
Tabel 3.2: Overlap tussen cluster-2-3-6-leerlingen en GOK-leerlingen (uit: Reynders et al., te verschijnen)
De LOA-studie geeft verder simulaties van wat er gebeurt als de GOK-criteria beter aangepast worden aan de variabelen die ook uit de kansarmoede-analyse komen. Men kan immers niet zonder meer stellen dat de kansarmoedeclusters het gegeven leerbedreigdheid beter vatten dan de huidige GOK-criteria. Ter vergelijking geven we de gemiddelde scores op de taal- en rekentests van de GOK- versus niet-GOK-leerlingen, en van de leerlingen in een kansarmoedecluster versus leerlingen in een andere cluster.
GOK-leerling Niet-GOK-leerling Leerling in kansarme cluster Leerling in andere cluster
Taal 19,4 24,6 18,3 24,4
Rekenen 20,5 28,4 19,5 28,3
Tabel 3.3: Gemiddelde op taal en rekenen van leerlingen ingedeeld naar GOK-status en kansarmoedecluster (op basis van Reynders et al., te verschijnen)
Hoofdstuk 3: Financiering van doelgroepleerlingen
61 Zoals uit de tabel valt af te leiden, liggen de gemiddelde scores van de groepen die door beide methodes als risicogroep zijn geïdentificeerd, niet erg ver uit elkaar. In het besef dat die groepen voor een groot deel uit verschillende leerlingen bestaat, moet dit betekenen dat op beide methodes nogal wat ruis zit. Een vergelijkbaar beeld tekent zich af als we naar de leerlingen kijken die hebben meegewerkt aan het PISA-onderzoek. Ook hier zien we dat een analyse op basis van kenmerken die met sociale positie in verband gebracht kunnen worden, een ander resultaat oplevert dan een analyse waarbij rekening gehouden wordt met de criteria die bij de bepaling van de GOK-status aangewend worden. Als we gebruik maken van de variabele hoogste beroep van één van de ouders enerzijds, en geboorteland van de moeder anderzijds, kunnen we grofweg een groep leerlingen identificeren waarvan we kunnen stellen dat ze uit een sociaal milieu komen dat geen optimale kansen op schoolse ontwikkeling bieden20. Als we de selectie van leerlingen op basis van dit criterium vergelijken met de groep die ontstaat als we op de PISA-steekproef de GOK-criteria toepassen, zien we dat we ook hier de doelgroepen die ontstaan op basis van de twee sets criteria, erg verschillend zijn21.
geen risico
geen risico 2502 52,3%
risico 994 20,8%
risico (minstens 1 van de 5 indicatoren)
601 12,6%
683 14,3%
Tabel 3.4: Vergelijking van aantal doelgroepleerlingen geïdentificeerd op basis van SES en geboorteland moeder (horizontaal) versus GOK-indicatoren (verticaal) (bron: PISA 2003)
Als we daarenboven ook hier nagaan hoe de beide groepsindelingen zich verhouden tot de schoolse prestaties van de leerlingen, stellen we vast dat de groep die wordt geïdentificeerd op basis van de beroepsindex en het geboorteland van de moeder, beter leerlingen met een achterstand identificeert dan de groep geïdentificeerd op basis van de GOK-criteria22.
geen doelgroep doelgroep (1 van de 5 indicatoren) totaal
geen doelgroep
doelgroep
totaal
565,49
505,13
548,33
544,22
480,87
510,52
561,37
495,25
538,17
Tabel 3.5: Score op lezen voor doelgroepleerlingen geïdentificeerd op basis van SES en geboorteland moeder (horizontaal) versus GOK-indicatoren (verticaal) (bron: PISA 2003) 20
We hebben er voor deze verkenning voor gekozen om die groep te definiëren als de leerlingen die 40 of lager scoren op de beroepsindex van de ouders, plus de leerlingen van wie de moeder in het buitenland is geboren. 21 We hebben de GOK-criteria in dit geval niet exact, maar bij benadering toegepast. 22 Om de relatie te onderzoeken tussen de identificatie en schoolprestaties hebben we ons gebaseerd op de prestatie van de leerlingen in die groepen op de variabele begrijpend lezen. We hebben als variabele het gemiddelde genomen van de vijf ‘plausible scores on reading’ die in de PISA-dataset voorkwamen. Verder hebben we een cesuur aangebracht op 500: leerlingen die lager dan 500 scoren, worden geacht zwak te presteren.
Hoofdstuk 3: Financiering van doelgroepleerlingen
62 Natuurlijk betekenen ook deze cijfers niet dat de huidige GOK-indicatoren niet werken als manier om leerbedreigde leerlingen te identificeren. Wat uit deze analyses op het niveau van de basisschool en het secundair onderwijs blijkt, is dat identificatie van doelgroepleerlingen aan de hand van sociale kenmerken een belangrijk aandeel valse negatieven en valse positieven oplevert. Vanuit het oogpunt van een financieringsbeleid gericht op het wegwerken van achterstanden, vormen die valse negatieven en valse positieven een probleem: valse positieven zorgen ervoor dat de overheid geld spendeert aan leerlingen die in feite niet leerbedreigd zijn, en valse negatieven hebben die extra ondersteuning wel nodig, maar krijgen ze niet. Het is daarom belangrijk na te gaan of de mogelijkheid bestaat om een systeem te ontwikkelen dat minder valse negatieven en positieven oplevert. De vraag naar het gebruik van taaltoetsen om te komen naar een beter financieringssysteem ten behoeve van leerbedreigde kinderen, kan daarom geherformuleerd worden als volgt: levert een financieringssysteem dat gebruik maakt van taaltoetsen minder valse positieven en/of negatieven op dan andere systemen, bijvoorbeeld het huidige systeem dat in GOK wordt gebruikt? Vooraleer we bovenstaande vraag proberen te beantwoorden, willen we eerst nog wijzen op drie kenmerken van valse positieven en valse negatieven in dit verband. Ten eerste is het belangrijk dat men zich realiseert dat beide groepen de overheid weliswaar voor problemen stelt, maar dat die problemen voor beide groepen van verschillende aard zijn. Voor valse positieven is het probleem vooral dat de overheid extra geld uitgeeft waar dat op grond van individuele kenmerken niet nodig is, bij valse negatieven gaat het erom dat er geen extra geld uitgegeven wordt aan leerlingen voor wie dat wel nodig wordt geacht. In dit verband moet men zich ook realiseren dat dit probleem veel groter en belangrijker is voor onderwijs dat achterstand wil bestrijden door te remediëren en te werken met homogene groepen. Voor een aanpak gericht op aangepast onderwijs aan heterogene groepen stelt het probleem zich veel minder scherp. Vanuit dit perspectief betekent elke valse positieve immers niet automatisch dat financiering niet goed terecht komt, en blijft elke valse negatieve niet noodzakelijk in de kou staan. Als een school met 40% echte positieven en 10% valse negatieven zijn onderwijs aan die groep positieven aanpast, zullen ook de valse negatieven van dat onderwijs profiteren. En als er op die school daarbij ook nog een groep valse positieven aanwezig is, zullen de mogelijkheden van de school om aangepast onderwijs te verzorgen voor risicoleerlingen, niet grondig afwijken van wat een 100% correcte inschatting zou opleveren. Problemen ontstaan dus pas als de inschatting van de omvang van de groep leerbedreigde leerlingen significant afwijkt van de werkelijke groep. Ten tweede staat het aantal valse positieven en valse negatieven met elkaar in verband. Door de cesuur aan te passen die gehanteerd wordt om leerbedreigde leerlingen te onderscheiden van leerlingen zonder leerbedreiging, kan men ervoor zorgen dat de kans om leerlingen ten onrechte wel of niet extra financiering toe te kennen, vergroot of verkleint. Als men de cesuur hoger legt (d.w.z. dat niet alleen leerlingen met een lage sociale herkomst, maar ook leerlingen met een sociale herkomst net onder het gemiddelde in aanmerking genomen worden), zal de groep leerlingen waarvan men aanneemt dat ze leerbedreigd zijn, vergroten en zal dus ook de groep valse negatieven verkleinen. Tezelfdertijd zal de groep valse positieven echter vergroten. Als de cesuur lager wordt gelegd, voltrekt zich de omgekeerde beweging. Ten derde wordt het belang van valse negatieven en valse positieven ook bepaald door de weging die de overheid aan doelgroepleerlingen meegeeft. Een ‘valse positieve’ die een weging van 1.2 heeft meegekregen, vertegenwoordigt veel meer verkeerd besteed overheidsgeld dan een valse positieve die als 0.4 werd gewogen. En een leerling met een
Hoofdstuk 3: Financiering van doelgroepleerlingen
63 sterke leerbedreiging die desondanks niet of als een ‘lichte’ doelgroepleerling werd geïdentificeerd, krijgt wellicht niet de ondersteuning die hij nodig heeft. Vanuit dit perspectief is het belangrijk te constateren dat uit de eerste analyses van het onderzoek van het Steunpunt LOA (Reynders et al., te verschijnen) ook valt af te leiden dat de weging van de doelgroepleerlingen in het huidige GOK-beleid niet de gewenste resultaten levert. Zo blijken leerlingen met een 1.0 weging zowel voor taal als voor rekenen beter te scoren dan leerlingen met een 0.8 weging, en blijkt er geen verschil in score te zijn tussen 0.4 en 0.6 leerlingen. Dit versterkt de stelling dat het een goed idee is om te verkennen of er alternatieven voor de huidige financieringswijze gevonden kunnen worden. Ook geeft dit aan dat die alternatieven niet alleen verkend moeten worden voor wat de identificatie van doelgroepleerlingen betreft, maar dat ook gekeken moet worden of zij een alternatief bieden voor de huidige weging. Conclusies Uit de bespreking van de mogelijkheid om leerbedreigdheid in te schatten op basis van sociale kenmerken van leerlingen, blijkt dat identificatie van doelgroepleerlingen op deze wijze niet zonder problemen is. Een groot deel van de leerlingen in het Vlaamse onderwijs worden met deze methode weliswaar juist ingedeeld, maar er blijft ook een belangrijke groep valse negatieven en valse positieven over. Als men daarbij bedenkt dat het administratief niet steeds mogelijk is die sociale kenmerken op een betrouwbare wijze te registreren, moeten we concluderen dat er zeker voldoende redenen zijn om te verkennen of andere inschattingswijzen mogelijk zijn. Bij die verkenning kan de huidige GOK-praktijk gebruikt worden als een soort referentiepunt: elke andere inschattingswijze is slechts zinvol als er voldoende argumenten zijn om aan te nemen dat ze betere resultaten oplevert dan de huidige GOK-praktijk. Daarenboven mag die andere manier van werken niet onevenredig veel moeilijker implementeerbaar te zijn. We moeten met andere woorden op zoek naar een werkwijze die een betere kosten-baten verhouding laat zien dan de huidige. In de volgende paragraaf kijken we of de inzet van taaltoetsen daarbij een rol zou kunnen spelen.
3.4 Identificatie van doelgroepleerlingen d.m.v. taaltoetsen 3.4.1 Voorafgaande overwegingen Taaltoetsen als indirecte indicator van leerbedreigdheid Het idee om taaltoetsen te hanteren als alternatief voor het gebruik van sociale gegevens voor de identificatie van doelgroepleerlingen, ligt om meerdere redenen voor de hand. We hebben in hoofdstuk 1 uitgebreid de relatie aan de orde gesteld tussen schooltaal en thuistaal, en daarbij aangegeven dat met name voor leerlingen uit lage sociale klasse de discrepantie tussen de twee taalregisters (thuistaal – schooltaal) groot is. Deze samenhang betekent dat de schooltaalvaardigheid van die leerlingen bij het begin van hun onderwijscarrière laag is, en dat een toets die die vaardigheid op een valide wijze in kaart brengt, gebruikt kan worden als indicator voor sociaal bepaalde leerbedreigdheid. Sterker nog, door de scharnierfunctie die schoolse taalvaardigheid krijgt in het tot stand komen van de relatie tussen sociale herkomst en schoolsucces, is het een indicator die in principe een preciezer beeld op moet leveren van leerbedreigdheid dan de sociale herkomstvariabelen zelf. Op grond van de eerder besproken samenhang verwachten we immers dat een lage sociale herkomst die om één of andere reden niet met een schooltaalachterstand samengaat, niet resulteert in leerbedreiging, en dat achterstand in schooltaalvaardigheid die om één of andere
Hoofdstuk 3: Financiering van doelgroepleerlingen
64 reden niet met een zwakke sociale positie in verband staat, wel leerbedreiging als gevolg heeft. Die sterke positie van taalvaardigheid als indicator werd bevestigd door onderzoek waaruit bleek dat taalvaardigheid in vele gevallen een betere voorspeller bleek voor later schoolsucces dan sociale kenmerken (zie probleemverkenning 1). Verder zijn (bepaalde) taaltoetsen door de band relatief gemakkelijk af te nemen, en is er in de onderwijswereld in Vlaanderen en elders heel wat ervaring met de constructie en interpretatie ervan. Leerbedreigdheid en taalachterstand Dat taaltoetsen een aantrekkelijk alternatief lijken te bieden voor de inzet van sociale gegevens, betekent natuurlijk niet dat het gebruik ervan zonder problemen is. In wat volgt willen we nagaan of taaltoetsen een alternatief kunnen bieden dat ook kosten-batengewijs interessanter blijkt dan het huidige systeem. Maar los daarvan is het van belang dat men zich ook realiseert dat er zich met het gebruik van taaltoetsen een aantal andere problemen aandient die mee in de keuze voor één of ander model betrokken dienen te worden. Een belangrijk punt in dit verband is dat met het gebruik van taaltoetsen in plaats van sociale gegevens een vrij stabiele indicator van iemands sociaal profiel vervangen wordt door een variabele indicator van iemands gedrag. In de mate dat men een maat voor taalvaardigheid hanteert als een indirecte indicator voor sociaal profiel, vormt dat niet noodzakelijk een probleem. Het simpele feit echter dat het hier om een andersoortig gegeven gaat, zorgt ervoor dat er ook op een andere, soms niet-gewenste, manier gebruik van gemaakt kan worden. Sociaal versus individueel bepaalde achterstand Zo is het huidige GOK-beleid gericht op het versterken van de mogelijkheden van de school om kansarme leerlingen naar schoolsucces te leiden. Er zijn echter ook leerlingen voor wie het gebrek aan schoolsucces niet in verband staat met kansarmoede. Los van het effect van sociale herkomst beschikken sommige leerlingen over een beperkter vermogen om uit het algemene aanbod van de school te leren dan andere. De beperking van het vermogen kan veroorzaakt zijn door cognitieve, psychische of fysieke kenmerken. Bij het gebruik maken van een taaltoets voor de identificering van doelgroepleerlingen ligt het voor de hand dat deze leerlingen ook ingedeeld zullen worden bij de groep negatieven of positieven. Deze groep leerlingen verschilt echter in nogal wat opzichten van de groep leerlingen die om sociale redenen in een achterstandspositie terecht komen. Vooreerst blijkt de predictieve validiteit van toetsen vaak verschillend te zijn afhankelijk van de groep waartoe men behoort. Verder is het maar zeer de vraag of de acties die met deze groep leerlingen ondernomen moeten worden, dezelfde zijn als die waar leerlingen uit de sociale achterstandsgroep om vragen. Uit het verleden is bekend wat de gevolgen kunnen zijn van het niet maken van het onderscheid tussen beide groepen. De oververtegenwoordiging van allochtone en sociaal zwakke leerlingen in richtingen die bedoeld zijn voor leerlingen met individuele leerproblemen, is hier een goed voorbeeld van. Daaruit volgt dat het wellicht goed is om een screeningssysteem te hebben dat deze twee groepen van elkaar kan onderscheiden. Dat zou kunnen door de gegevens over taalvaardigheid te combineren met gegevens over de sociale en etnische achtergrond van de leerlingen bij de identificatie van doelgroepleerlingen.
Hoofdstuk 3: Financiering van doelgroepleerlingen
65 Krachtige leeromgeving versus wegwerken van achterstand Een tweede kwestie die in dit verband belangrijk is, is het onderscheid tussen leerbedreiging en achterstand. We hebben hierboven aangegeven dat we in wat volgt willen verkennen of taaltoetsen ingezet kunnen worden als indirecte indicator voor leerbedreiging die ontstaat als gevolg van kansarmoede. Maar natuurlijk kunnen die resultaten van de toetsen ook gebruikt worden als directe indicator van achterstand op een belangrijk terrein van schools presteren, namelijk taalvaardigheid. In dat geval zou men geneigd kunnen zijn om als reactie op een slechte score niet zozeer te investeren in de ontwikkeling van een krachtige leeromgeving voor kansarme leerlingen, maar veel gerichter te gaan werken aan de remediëring van de beperkte schooltaalvaardigheid van de individuele doelgroepleerling. In wat voorafging hebben we er al verschillende keren op gewezen dat dit wellicht een kwalijke ontwikkeling zou zijn. Vanuit didactisch oogpunt valt van een dergelijke benadering weinig heil te verwachten. En bovendien zorgt die manier van werken ervoor dat het probleem van de valse negatieven en positieven veel scherper speelt dan in het geval van actie die op een benadering van de algehele leeromgeving is gebaseerd. Het is ook heel belangrijk niet uit het oog te verliezen dat taalvaardigheid weliswaar een goede indirecte indicator van leerbedreiging is en een belangrijk onderdeel van schools leren, maar ook niet meer dan dat. Het wegwerken van de taalvaardigheidsachterstand betekent dus helemaal niet dat alle leerachterstand is weggewerkt. Weggewerkte achterstand en blijvende leerbedreiging De relatie tussen leerbedreiging en taalachterstand brengt ons bij een derde kwestie. Van een identificering van leerachterstand op basis van sociale kenmerken is het gemakkelijk te zien dat men die identificering één keer uitvoert, en dat die identificering vervolgens met de leerling meereist doorheen zijn hele onderwijscarrière. Eventueel kan op bepaalde tijdstippen nog een controle uitgevoerd worden, maar de centrale gedachte is in elk geval dat leerbedreigdheid een vrij stabiel gegeven is. Met een identificering op basis van achterstand ligt dat anders. Zeker als men acties op het oog heeft die erop gericht zijn die achterstand individueel weg te werken, moet men er in feite van uitgaan dat die achterstand elk jaar bij alle leerlingen gecontroleerd zou moeten worden. Eén keer de achterstand is verdwenen, is een leerling immers geen risico- of doelgroepleerling meer. Vanuit een redenering die schoolsucces koppelt aan kansarmoede, blijft die leerling wel leerbedreigd, ongeacht het feit of hij zijn taalachterstand heeft weten weg te werken. De vraag die hier beantwoord dient te worden, is hoe stabiel men schoolsucces acht in het perspectief van leerbedreiging vanuit sociaal oogpunt. Gelooft men dat kansarme leerlingen die hun achterstand hebben weten in te lopen, verder zonder extra ondersteuning met de groep meekunnen, en in gelijke mate van het verdere onderwijs kunnen profiteren als kansrijke leerlingen? Of denkt men dat die leerlingen een risico op een terugval lopen op het moment dat de ondersteuning wordt weggenomen? Ook dit is één van die vragen die wellicht anders beantwoord dient te worden voor achterstand die op sociale herkomst terug te voeren is, versus achterstand die met individuele kenmerken te maken heeft. Voor wat ‘sociale’ achterstand betreft, ligt het antwoord wellicht in het midden: ongetwijfeld bestaat het gevaar op terugval als de speciale aandacht te vroeg wordt weggenomen, maar ongetwijfeld slagen heel wat leerlingen er ook hun achterstand in te lopen zonder dat ze daarbij een terugval riskeren. In elk geval zal met deze kwestie rekening gehouden moeten worden bij de ontwikkeling van een financieringssysteem voor leerbedreigde leerlingen dat van taaltoetsen gebruik maakt. Wij opteren voor het gebruik van taaltoetsen als indirecte indicator van leerbedreigdheid. Dat betekent dat we in principe eerst willen nagaan of taaltoetsen gebruikt kunnen worden voor de identificering van
Hoofdstuk 3: Financiering van doelgroepleerlingen
66 doelgroepleerlingen in een vroeg onderwijsstadium. Daarna bespreken we de vraag of taaltoetsen op een later tijdstip gebruikt kunnen worden om de eerste identificatie bij te stellen. Mogelijke perverse effecten van achterstand als indicator voor leerbedreiging Ten slotte willen we, in samenhang met het vorige punt, nog op het probleem wijzen van de stabiliteit waarmee taalachterstand als een indicator voor leerbedreigdheid aangewend kan worden. Onderwijs is er namelijk op gericht om leerlingen kansen te bieden om die schoolse taalvaardigheid te ontwikkelen. Hoe succesvoller de school daarbij is, hoe minder leerlingen ze zal tellen met een taalachterstand. Als gevolg hiervan zou het gebruik van achterstand als basis voor de financiering van leerbedreigde leerlingen het perverse effect kunnen genereren dat scholen die goed werk leveren, minder middelen krijgen dan scholen die niets aan de initiële achterstand veranderen. Het spreekt voor zich dat het gebruik van taaltoetsen niet tot een dergelijk effect mag leiden. Ook hierom is het van belang om in eerste instantie te kijken naar vroege identificatie, en taaltoetsen die op latere momenten eventueel ter controle ingezet worden, met de nodige zorg te hanteren. De financiering van effectieve versus ineffectieve scholen is trouwens niet het enige perverse effect waarvoor gewaakt dient te worden. Een ander betreft de mogelijkheid dat op basis van de resultaten op de taaltoetsen, een streaming-praktijk opgezet of versterkt wordt. Die kan zowel plaatsvinden in het basisonderwijs, in de vorm van samenstelling van homogene klassen, als op de overgang tussen basis en secundair onderwijs, waarbij leerlingen met een lage score naar TSO- en vooral BSO-richtingen worden geleid. Een dergelijke streaming lijkt ons in complete tegenspraak met de bedoelingen die aan GOK ten grondslag liggen. In GOK is het erom te doen om leerlingen de kans te bieden om juist hun potentieel ten volle te ontwikkelen, en niet om voor hen de verwachtingen lager te stellen. Verzamelen van de toetsgegevens Aansluitend bij het vorige punt lijkt het ons hier een goede plaats om erop te wijzen dat taaltoetsing slechts een valabel alternatief voor financiering van doelgroepleerlingen kan bieden als de toetsgegevens verzameld worden door personen die zich onafhankelijk van de school op kunnen stellen. In de mate dat de financiering van de school afhangt van het aantal leerlingen dat zwak scoort op de toets, valt het niet uit te sluiten dat bepaalde scholen anders bij de verzameling van de gegevens strategieën aanwenden om een ruimere financiering te verwerven dan gewettigd is (Onderwijsraad, 1999). Conclusies Op basis van deze eerste verkenning van de mogelijkheden en onmogelijkheden om taaltoetsen in te zetten om doelgroepleerlingen te identificeren, kunnen we stellen dat er zeker argumenten zijn om te proberen een dergelijk systeem uit te werken. Daarnaast is gebleken dat er een aantal gevaren zijn die sterk in de gaten gehouden moeten worden. Conform wat we hierbij besproken hebben, willen we eerst kijken naar de mogelijkheden om taaltoetsen in te zetten voor een vroege identificatie van doelgroepleerlingen. Vervolgens willen we nagaan of taaltoetsen ook inzetbaar zijn om op andere momenten de identificatie van doelgroepleerlingen bij te stellen.
Hoofdstuk 3: Financiering van doelgroepleerlingen
67 3.4.2 Vroege identificering van doelgroepleerlingen d.m.v. taaltoetsen Om taaltoetsen in te kunnen zetten om op een vroeg tijdstip doelgroepleerlingen te identificeren, moeten we beschikken over een toets of een verzameling van toetsen die ons een valide beeld geeft van de schoolse taalvaardigheid van leerlingen op het moment dat ze de school binnenkomen. Verder moeten we kunnen vaststellen of de gebleken schoolse taalvaardigheid in verband gebracht kan worden met de schoolse prestaties op een later tijdstip. Taalvaardigheidsmeting bij het begin van het kleuteronderwijs In hoofdstuk 2 hebben we al aangegeven dat er een probleem is met het meten van de taalvaardigheid van zeer jonge kinderen. Het blijkt niet zo goed mogelijk om de schoolse taalvaardigheid van hele jonge kleuters op een betrouwbare wijze in kaart te brengen. Alleen wanneer men bereid is heel wat informatie te verzamelen op een zeer arbeidsintensieve wijze (en toetsafnames met name te combineren met uitgebreide observaties), slaagt men er min of meer in een degelijke inschatting van die vaardigheid te maken. We zijn tot de conclusie gekomen dat een relatief eenvoudige, betrouwbare inschatting wellicht pas mogelijk wordt vanaf de leeftijd van 5-6 jaar, en dat zelfs dan zeer omzichtig moet worden omgegaan met het trekken van allerhande conclusies, inclusief conclusies naar financiering toe. Als men ervoor kiest om te investeren in het verzamelen van gegevens over de taalvaardigheid van kinderen bij de intrede in de kleuterschool (dus op 2,5 à 3-jarige leeftijd), moet men zich bovendien realiseren dat de kostprijs van deze actie hoog zal oplopen. Geschat wordt dat het verzamelen en verwerken van die gegevens per kind gemakkelijk een uur in beslag zal nemen. Dat betekent dat het niet realistisch is te verwachten dat een toetsafnemer meer dan vijf kinderen per dag test. Met een cohortgrootte van ruim 60.000 kinderen, betekent dat dat ruim 12.000 dataverzameldagen moeten worden voorzien. De eisen die aan deze dataverzamelaars gesteld worden, zijn daarenboven erg hoog: deze mensen moeten gewend zijn om met heel jonge kinderen om te gaan. Als we uitgaan van een kostprijs per dag van € 250, brengt ons dat bij een personele kostprijs van € 3.000.000 voor de verzameling van de data alleen. Rekening houdend met materiële kosten voor de afname en kosten voor de ontwikkeling en de verwerking van de toetsen, lijkt het ons waarschijnlijk dat de inzet van een dergelijk instrument minimaal € 4.320.000 kost23. In hoofdstuk 1 en 2 hebben we aangegeven dat de validiteit van de meting op deze extreem jonge leeftijd hoe dan ook bediscussieerbaar is. Ook de mate waarin op basis van de taalgegevens schoolse achterstand op een veel later tijdstip voorspeld kan worden, is niet erg groot. Er zijn eigenlijk nauwelijks argumenten om aan te nemen dat het werken met taaltoetsen in dit verband minder valse negatieven en positieven op zou leveren dan de methode die nu in het kader van GOK wordt gehanteerd. Het lijkt ons daarom ook niet zinvol om een screening op basis van taalvaardigheid in te voeren bij het begin van de kleuterschool, en daar de beslissing over financiering van doelgroepleerlingen op te baseren. Daarom adviseren wij om de eerste screening voor leerbedreigdheid naar een later tijdstip te verplaatsen. Hieronder verkennen we de mogelijkheid om die te laten plaatsvinden in de 23
Dit bedrag is als volgt samengesteld: personele kosten dataverzameling € 3.000.000 / materiële kosten dataverzameling € 50.000 / reiskosten t.b.v. dataverzameling € 50.000 / ontwikkeling van toets en verwerking van data: 2 fte inhoudelijk € 120.000 + 7 fte administratief* € 350.000 (bevat 5 FTE voor correctie van toetsen en invoer van data) / werkingskosten € 20.000 / infrastructuur € 10.000. Totaal: € 3.600.000 + overhead + onvoorzien 20% € 720.000 = Algemeen totaal € 4.320.000.
Hoofdstuk 3: Financiering van doelgroepleerlingen
68 derde kleuterklas of het eerste leerjaar. Deze keuze heeft natuurlijk wel als consequentie dat de leerbedreigdheid in het vroege kleuteronderwijs op een andere wijze in kaart gebracht dient te worden dan met taaltoetsen. Taalvaardigheidsmeting op 5 à 6-jarige leeftijd Uit de bespreking van de testbaarheid van jonge kinderen in hoofdstuk 2 bleek dat het vanaf de leeftijd van 5 á 6 jaar beter mogelijk wordt om een betrouwbaar beeld te verwerven van de taalvaardigheid van jonge kinderen. Het verzamelen van de noodzakelijke gegevens is voor deze leeftijdsgroep daarenboven veel minder ingewikkeld en tijdrovend dan bij jongere kinderen. Daardoor wordt het screenen van leerlingen van deze leeftijd een veel realistischere optie dan het screenen van leerlingen bij intrede in de kleuterschool. Dat de optie realistischer is, betekent natuurlijk nog niet dat ze een goed alternatief biedt voor de huidige screeningsmethode. Om die conclusie te kunnen trekken, moet eerst gekeken worden naar wat nodig is om een dergelijk betrouwbaar beeld van taalvaardigheid op te bouwen, en hoe groot de predictieve validiteit van die taalvaardigheid ten aanzien van later schoolsucces blijkt te zijn. Zoals aangegeven in hoofdstuk 1 kunnen we verschillende theoretische benaderingen van taalvaardigheid onderscheiden, en leiden die benaderingen naar verschillende manieren om die vaardigheid in kaart te brengen. Wie taalvaardigheid beschouwt als een optelsom van verschillende deelvaardigheden en kennisaspecten, is geneigd zoveel mogelijk van die aparte deelaspecten in kaart te brengen. Achterstand kan immers betrekking hebben op het geheel dan wel op een specifiek onderdeel. Vanuit dit perspectief wordt er vaak voor gepleit om voor screeningsdoeleinden steeds verschillende aspecten te toetsen (Dockrell, 2001). Anderen zien taalvaardigheid meer als een functioneel geheel. Ook zij toetsen vooral deelaspecten van die vaardigheid, maar zij gaan op zoek naar deelvaardigheden die het best als indicator van die algemene vaardigheid kunnen dienen. Daar waar men in het eerste geval zijn best doet om deelvaardigheden en aspecten van taalvaardigheid afzonderlijk te benaderen, vindt men het vanuit de tweede benadering juist een pluspunt als meerdere aspecten van die vaardigheid in een toets aan bod komen. Voor de leeftijdsgroep die ons hier interesseert, zien we dat heel wat toetsen ontwikkeld zijn vanuit de deelaspectenvisie op taalvaardigheid. Vooral woordenschattoetsen zijn daarbij populair. Dat hoeft niet te verwonderen: van alle deelaspecten van vaardigheid is woordenschat op deze leeftijd wellicht het makkelijkst te toetsen. Ook meer integratieve toetsen worden voor deze groep ingezet (zie bijlage 1). In de meeste gevallen gaat het hierbij om begripstoetsen die het niveau van het louter lexicale overstijgen24. Als we kijken naar de predictieve validiteit van dit soort toetsen, zien we dat er vaak sprake is van samenhang tussen taalvaardigheid op deze leeftijd en schoolsucces op latere leeftijd25. Toch blijkt ook uit deze studies dat taaltoetsen niet zondermeer een schatting van 24
Bij deze toetsen rekenen we ook toetsen voor rekenbegrippen, omdat ze meestal niet alleen de kennis van rekenkundige termen, maar het bredere begrip van wiskundig taalgebruik toetsen. 25 In het onderzoek waar hier naar verwezen wordt, is er niet steeds enkel sprake van taaltoetsen bij de leeftijdsgroep die we hier behandelen. In veel van dit onderzoek wordt ook samenhang behandeld tussen taalvaardigheid en schoolsucces van jongere kinderen. Zo gaat het onderzoek van Vermeer & Verhoeven (2005) over kinderen bij het begin van de basisschool in Nederland, kinderen van 4 jaar dus. Waar relevant wordt op deze leeftijdskwestie ingegaan.
Hoofdstuk 3: Financiering van doelgroepleerlingen
69 leerbedreigdheid opleveren die in de plaats van de huidige GOK-criteria kan worden gesteld. Een eerste interessante vaststelling in dit verband is dat er geen sprake is van een universeel verband tussen taalkenmerken in een vroeg stadium en gebleken achterstand. Aan de hand van een meta-analyse van 44 studies naar samenhang tussen taal en latere achterstand laten (Kim & Suen, 2003) zien we dat de effecten door verschillende aspecten van de testsituatie worden bepaald. Het meest in het oog springt de constatering dat de manier waarop de test wordt afgenomen een belangrijk effect heeft op de predictieve validiteit ervan (tests die gescoord worden aan de hand van een rating system, vertonen een hogere predictieve validiteit dan tests die gebaseerd zijn op item scores.). Ook Law et al. (2000) presenteren een meta-analyse die op grond van verschillende studies de vraag probeert te beantwoorden of een vroeg screeningsinstrument mogelijkheden biedt om schoolse achterstand in een vroeg stadium te voorspellen. De conclusie van de onderzoekers is dat het veel moeilijker is om correct te voorspellen wie achterstand op zal lopen dan om te voorspellen wie dat niet zal doen. Met andere woorden, de kans op valse negatieven is over het algemeen groter dan de kans op valse positieven. Op grond van hun bevindingen pleiten Law et al. tegen de invoering van een algemeen screeningsinstrument. Catts et al. (2001) rapporteren over een onderzoek in de Verenigde Staten waarbij ze een groep kinderen uit een epidemiologisch onderzoek naar vroege taalproblemen volgden in de tweede en vierde graad van het lager onderwijs. Zij laten zien dat ze met een combinatie van resultaten op verschillende types taaltoetsen en metingen, in staat zijn om een redelijke voorspelling te geven van de kans dat een leerling in het tweede of vierde jaar achterstand oploopt. Nochtans blijkt ook in hun onderzoek de groep valse negatieven en valse positieven erg groot. Op basis van de tests voorspellen zij de waarschijnlijkheid dat een kind leesproblemen zal hebben in de tweede graad. Als ze een cesuur hanteren van 70% (i.e. 70% kans dat een kind leesproblemen heeft), blijken meer dan de helft van de kinderen die daadwerkelijk leesproblemen hebben in de tweede graad, niet te zijn gedetecteerd, en zijn er 2% kinderen die onterecht bij de leesbedreigden zijn ingedeeld. Als de cesuur lager wordt gelegd, bijvoorbeeld rond 30%, blijven er nog steeds bijna 30% ongedetecteerde kinderen met leesproblemen over, en groeit de groep onterecht gedetecteerden tot bijna 10%. In Nederland werd in de jaren ‘90 van de vorige eeuw de commissie Kohnstamm gevraagd een antwoord te geven op de vraag of het mogelijk was aan de hand van een toets bij het begin van de schoolcarrière uit te maken in welke mate leerlingen een risico op schoolse achterstand lopen. Om hierover een uitspraak te doen, verwerkte de Commissie Kohnstamm de informatie die op dat moment beschikbaar was in de Verenigde Staten, Het Verenigd Koninkrijk en Nederland. De Commissie kwam tot de conclusie dat een dergelijke screening niet wenselijk was. Het belangrijkste argument hiervoor was dat met name het aantal valse negatieven onaanvaardbaar hoog blijft (Commissie Indicatiestelling Onderwijsachterstanden, 1006). Ook Verhoeven & Vermeer (2005) gaan na in hoeverre de score op de Cito-eindtoets op het einde van de basisschool aan de hand van gegevens over vroege taalontwikkeling voorspeld kan worden. Zij concluderen dat er sprake is van duidelijke samenhang met een groep van factoren, waarbij resultaten op taaltests bij het begin van de basisschool een belangrijk onderdeel voor hun rekening nemen. Interessant is dat één van de onderzoekers ons meldde dat met name de deeltoets ‘tekstbegrip’ van de TAK een correlatie van .40 bleek te hebben met de Cito-eindtoets (Vermeer, persoonlijke communicatie). Als we in aanmerking nemen dat tussen beide meetmomenten ruim 7 jaar ligt, jaren waarin de school zich heeft ingespannen om de aanvankelijke achterstand weg te werken, is deze correlatie erg betekenisvol. Desondanks concluderen de onderzoekers dat de voorspelling op basis van de
Hoofdstuk 3: Financiering van doelgroepleerlingen
70 cluster van factoren te veel marge voor fouten laat om als basis voor financiering van achterstandsleerlingen te dienen26. Vlaams onderzoek dat de predictieve validiteit van scores op taaltoetsen voor leerachterstand onderzoekt op individueel niveau, is ons niet bekend. Wellicht komt het onderzoek naar de validiteit van de TAL-toets nog het dichtst in de buurt (Cucchiarini & Jaspaert, 1995). Uit dat onderzoek blijkt een belangrijke samenhang tussen taalvaardigheid aan het begin van het eerste leerjaar en schoolprestaties aan het einde van dat leerjaar. Afhankelijk van de berekeningswijze schommelen de gevonden correlaties tussen .46 en .55. Uit de grafieken van de samenhang tussen beide variabelen kan ook hier afgeleid worden dat het aantal valse negatieven vrij hoog is. Ook het onderzoek van het Steunpunt LOA naar de loopbaan van kansarme leerlingen in het basisonderwijs (Verachtert et al., 2005a), levert vergelijkbare gegevens op. Deze onderzoekers namen de Taaltoets voor Kleuters en een toets rekenbegrip af bij het begin van het eerste leerjaar, en vervolgens toetsen technisch lezen, spellen, en rekenen bij het einde van datzelfde leerjaar. De correlaties tussen de toetsen bij het begin en het einde van het leerjaar variëren tussen .30 en .69. De laagste correlaties hebben betrekking op de eindtoetsen technisch lezen, de hoogste op de correlatie tussen de begintoets rekenbegrip en de eindtoets wiskunde (Verachtert et al., 2005a). Al deze gegevens bevestigen dat gegevens over taalvaardigheid gebruikt kunnen worden als predictor voor schoolsucces. Vraag is nu of identificering van doelgroepleerlingen met gebruikmaking van deze gegevens ook minder valse negatieven en positieven oplevert dan we kregen met gebruik van sociale kenmerken. Een eenduidig antwoord valt niet te geven op deze vraag. Wel zijn er een aantal argumenten aan te halen die suggereren dat het antwoord positief is: a. Vooreerst blijkt de samenhang tussen taalvaardigheid en schoolsucces over het algemeen hoger te liggen dan tussen een set sociale kenmerken en schoolsucces (zie probleemverkenning 1); b. Daarnaast blijkt in multivariate verklaringsmodellen de beginmeting taalvaardigheid meer verklaring te bieden voor schools presteren op een later moment dan sociale kenmerken. Dit komt bijvoorbeeld tot uiting uit het verdere onderzoek van het Steunpunt LOA op de gegevens uit het eerste leerjaar (Verachtert et al., 2005a). Daarbij blijkt dat zowel voor technisch lezen, spelling als wiskunde, de resultaten op de tests bij aanvang van het eerste leerjaar een sterkere voorspeller blijken dan de set sociale en culturele kenmerken die in de analyse worden ingevoerd27. Voor wiskunde is het zelfs zo dat de inbreng van die kenmerken nauwelijks verklaarde variantie in het model toevoegt. Ook Vermeer (persoonlijke communicatie) vermeldt dat toevoeging van sociale herkomst in zijn onderzoek nauwelijks meer verklaarde variantie oplevert. Duidelijk is echter ook dat de verbetering in identificering die van taaltoetsen op deze leeftijd kan uitgaan, niet dermate groot is dat daarmee de vraag naar de vormgeving van een 26
In een artikel uit 2003 hadden beide auteurs zich iets positiever uitgelaten over de mogelijkheid om financiering op dergelijke gegevens te baseren (Verhoeven & Vermeer, 2003). 27 Voor technisch lezen en spelling werden de resultaten van de Taaltoets voor Kleuters uit het Vlaamse CitoLVS (cf. bijlage 1) gebruikt, voor wiskunde de begrippentoets rekenen (ontwikkeld door SIBO/Steunpunt LOA zelf).
Hoofdstuk 3: Financiering van doelgroepleerlingen
71 identificeringsinstrument eenduidig in het voordeel van taaltoetsen beslecht is. We hebben er al op gewezen dat velen zich zorgen blijven maken over het grote aantal valse negatieven. Ook het LOA-onderzoek voedt deze bekommernis. Voor hun toets wiskunde geven zij immers aan dat de relatie tussen begin- en eindtoets minder sterk is voor wie op de begintoets hoog scoort. Dat een hoge score op de begintoets minder voorspellende waarde blijkt te hebben, kan niets anders betekenen dan dat het risico op valse negatieven groter is dan dat op valse positieven. Dus ook hier komt tot uiting dat taaltoetsen niet de ultieme oplossing voor de identificering van doelgroepleerlingen bieden. Te overwegen valt om de resultaten van een taaltoets te gebruiken voor de identificering van doelgroepleerlingen in combinatie met relevant gebleken sociale en culturele gegevens. Of dit mogelijk en nuttig is, hangt natuurlijk in hoge mate af van de inspanningen die moeten worden geleverd om die gegevens te verzamelen, en van de betrouwbaarheid ervan. Het onderzoek dat hierboven besproken werd, stelt ons ook in staat om iets meer te zeggen over het type toets dat het best gehanteerd kan worden bij de identificering van doelgroepleerlingen op deze leeftijd. Het lijkt er sterk op dat integratieve toetsen betere resultaten opleveren dan toetsen die op kleinere deelaspecten zijn gericht. Met name de toetsen die begrip van functionele taal meten, blijken een goede predictieve kracht te hebben. Dit is zeker het geval voor de TAL, maar ook het onderzoek van Verhoeven & Vermeer en dat van het Steunpunt LOA wijst in deze richting. Bij Verhoeven & Vermeer is het immers de tekstbegripstaak die voor het leeuwendeel van de verklaarde variantie zorgt. Andere toetsonderdelen, zoals zinsbegrip en passieve woordenschat, zijn veel minder krachtige voorspellers. In het LOA-onderzoek blijkt de toets voor rekenbegrippen een sterkere verklaring te bieden dan de Taaltoets voor Kleuters, een toets die uit een aantal onderdelen bestaat waarvan we de meeste tot de niet-integratieve toetsvormen rekenen. Ook het belang van ratingscores kan in deze zin geïnterpreteerd worden. Het lijkt dan ook aangewezen dat vooral in de richting van integratieve begripstoetsen gekeken wordt bij de zoektocht naar een geschikt instrument in het kader van de identificering van doelgroepleerlingen. De keuze voor dat type toetsen houdt wel in dat scholen na verloop van tijd weten dat dit type toetsen gebruikt wordt voor financiering. Zij kunnen vervolgens het belang van deze toets in hun werking laten doorwerken. Die doorwerking zou in theorie een perverse vorm aan kunnen nemen, in de zin dat scholen op de een of andere manier proberen te vermijden dat kinderen goed scoren op een dergelijke toets. Waarschijnlijker is echter dat ze juist het belang van de getoetste vaardigheid overschatten en specifiek gaan werken aan dat onderdeel van de achterstand van de leerling. In het licht van het feit dat de toets hier de functie van indicator speelt, kan dat betekenen dat de school wel de indicator voor achterstand wegneemt, maar dat die achterstand op vele andere, talige zowel als niet-talige, onderdelen blijft bestaan. Om dit effect te vermijden is het goed om de toetsvorm na een aantal jaren af te wisselen. De voorkeur voor integratieve begripstoetsen is op zich goed nieuws voor wie in dit kader taaltoetsen wil gebruiken. Dergelijke toetsen zijn ongetwijfeld minder arbeidsintensief wat de afname betreft dan een batterij toetsen van diverse elementen en deelaspecten. Als we de TAL (een toets voor einde derde kleuterklas, cf. bijlage 1) als model nemen, kunnen we er van uitgaan dat een dergelijke toets kan worden afgenomen van (kleine) groepjes van kinderen. Op die manier moet het zeker mogelijk zijn om van gemiddeld 30 kinderen per dag een dergelijke test af te nemen28. Uitgaande van een cohortgrootte van ruim 60.000 kinderen, betekent dit dat rekening gehouden moet worden met 2000 dagen voor de verzameling van de 28
We gaan ervan uit dat het gemiddelde op grote scholen iets hoger kan liggen, en op kleine scholen iets lager.
Hoofdstuk 3: Financiering van doelgroepleerlingen
72 gegevens. Met een kostprijs per dag van € 250, betekent dit een kost voor de verzameling van de gegevens van € 500.00029. Rekening houdend met de kosten voor ontwikkeling en verwerking van het instrument, en de materiële kosten voor de afname, schatten wij de kostprijs voor de invoering van een taaltoets op het niveau derde kleuterklas/eerste leerjaar ten behoeve van de identificering van doelgroepleerlingenmeting, op € 1.310.00030. Conclusies •
•
•
•
Samenvattend kunnen we stellen dat taaltoetsen op de leeftijd 5-6 jaar wellicht een alternatief kunnen bieden voor het huidige identificeringssysteem van doelgroepleerlingen in het kader van het GOK-beleid. We verwachten dat het gebruik van taaltoetsen leidt tot een beperkte verbetering van de voorspelling van schoolsucces, zeker als men de taalgegevens kan gebruiken in combinatie met betrouwbare gegevens over de sociale herkomst van de leerling. Die combinatie van gegevens van een taaltoets met sociale achtergrondkenmerken is ook om een andere reden interessant. Indien men ervoor kiest om een type toets in te voeren zoals hier besproken, moet men zich ook realiseren dat het erg moeilijk wordt om een onderscheid te maken tussen leerlingen die op sociale gronden leerbedreigd genoemd kunnen worden, en leerlingen die in die groep terecht komen als gevolg van individuele leerbelemmering. We hebben erop gewezen dat deze twee groepen niet noodzakelijk dezelfde aanpak nodig hebben. Een combinatie van gegevens uit taaltoetsen met sociale achtergrondgegevens kan de school in staat stellen om een eerste indicatie te krijgen van de oorzaken waarom iemand in de leerbedreigde groep terecht komt. Ze kan dan ook beter een aanpak ontwikkelen die bij elk van de groepen past. Of die beperkte verbetering voldoende is om die toetsen in te voeren, blijft ook voor ons een vraag. Wij hebben te weinig zicht op de betrouwbaarheid van de dataverzameling in het huidige systeem om hierover harde uitspraken te doen. Mocht de overheid invoering van taaltoetsen in dit verband overwegen, dan moet zij zich wel realiseren dat ze met die toetsen in elk geval niet voor alle leerlingen een alternatief voor de huidige werkwijze kan bieden. Er blijft nog steeds het probleem dat de identificering van doelgroepkleuters met de invoering van taaltoetsen niet bereikt wordt. Hoe met dit punt omgegaan zou kunnen worden, wordt in één van de volgende punten besproken. Ook willen we er nog eens op wijzen dat een toets die hier wordt ingevoerd, niet zonder meer recycleerbaar is in het kader van screening en diagnose op leerlingen- en schoolniveau, de functie van taaltoetsen die we in hoofdstuk 2 hebben besproken. We hebben daar aangegeven dat het type toetsen waarover we het hier hebben, sowieso niet bruikbaar zijn voor diagnose op leerlingniveau. Voor screening en diagnose op schoolniveau zien we wel mogelijkheden, maar daarvan werd gesteld dat een toets op het einde van de lagere school voor die functie volgens ons een hogere prioriteit heeft. De toets die we hier hebben besproken kan in samenhang met die eindtoets basisonderwijs de school wel een beter en preciezer beeld geven van de kwaliteit van haar werking Nederlands, en van haar toegevoegde waarde.
29
Hierbij kan gewezen worden op het feit dat het verzamelen van deze gegevens minder moeilijk is dan het verzamelen van gegevens bij jongere kleuters. De eisen die aan het in te zetten personeel moeten worden gesteld, zijn in dit geval dan ook minder hoog. 30 Dit bedrag is op dezelfde wijze samengesteld als dat voor de toets aan het begin van de kleuterschool. We gaan ervan uit dat de inspanningen die toetsontwikkeling en de verwerking van data vragen, in beide gevallen vergelijkbaar zijn.
Hoofdstuk 3: Financiering van doelgroepleerlingen
73 3.4.3 Herijking van leerbedreigdheid: taaltoetsen bij de overgang van lager naar secundair onderwijs We hebben eerder aangegeven waarom de inzet van taaltoetsen niet betekent dat de overheid voor de financiering van doelgroepleerlingen overstapt van een leerbedreigdheidsperspectief naar een achterstandsperspectief. We hebben duidelijk gemaakt waarom beperkte schooltaalvaardigheid in dit verband beschouwd dient te worden als een indicator van leerbedreigdheid, en niet als een signaal dat de taalvaardigheid van de leerling dringend geremedieerd dient te worden. Het perspectief van leerbedreigdheid zorgt er tevens ook voor dat die taalvaardigheid niet steeds opnieuw in kaart gebracht dient te worden: vroege achterstand qua schooltaalvaardigheid wordt gezien als een indicator voor leerbedreiging die de leerling gedurende een flink deel van zijn schoolloopbaan kenmerkt. Natuurlijk betekent dit niet dat die leerbedreiging steeds blijft bestaan. Het is dan ook legitiem zich af te vragen of die achterstand qua schooltaalvaardigheid ook op andere tijdstippen gemeten dient te worden, en of en hoe de resultaten van die meting gebruikt kunnen worden om het beeld van leerbedreigdheid bij te stellen. Het is evident dat het eerste moment dat daarbij in gedachten komt, de overgang van lager naar middelbaar onderwijs betreft. Enerzijds komt de leerling in een heel nieuw schools milieu terecht, waar onderwijs een heel andere vormgeving kent, en er ongetwijfeld ook andere, bijkomende eisen aan de schooltaalvaardigheid van de leerling worden gesteld. Een belangrijke overweging in dit verband is ook dat voor het niveau eind basisonderwijs eindtermen zijn geformuleerd. Dat betekent dat men zich bij de constructie van een toets op dit moment kan baseren op een aantal aspecten van taalvaardigheid die elke leerling op dat onderwijsmoment verworven zou moeten hebben. Men kan met andere woorden een toets ontwikkelen die onafhankelijk is van het curriculum dat de school heeft gevolgd om haar leerlingen tot de verwerving van die eindtermen te brengen. Anderzijds is ook de leerling veranderd. Voor sommige leerlingen die als leerbedreigden aan de basisschool zijn begonnen, heeft de school er ongetwijfeld voor kunnen zorgen dat hun achterstand helemaal of voor een groot gedeelte is weggewerkt. Voor andere leerlingen en andere scholen is de schoolse interventie in de basisschool duidelijk veel minder succesrijk gebleken: hun achterstand ten aanzien van de zich modaal ontwikkelende leerling is soms nog groter geworden (Verachtert et al., 2005b). Er is nog een zeer praktische reden te noemen om te kijken welke rol taaltoetsen op dit onderwijsmoment kunnen spelen voor de identificering van doelgroepleerlingen. In hoofdstuk 2 hebben we gepleit voor de invoering van een soort parallelversie van de periodieke peilingstoetsen voor taal. Indien deze toetsen op de één of andere manier gerecycleerd kunnen worden voor het gebruik in het kader van de financiering van doelgroepleerlingen in het secundair onderwijs, zou de invoering van een herijking van leerbedreiging door middel van taalachterstand relatief eenvoudig opgezet kunnen worden. Op het eerste gezicht is het gebruik van gegevens over schooltaalvaardigheid voor de identificering van doelgroepleerlingen in het secundair onderwijs zeer vergelijkbaar met het beeld dat we van het gebruik van dit soort gegevens voor de identificering van doelgroepleerlingen in het basisonderwijs hebben geschetst. Ook hier kunnen we stellen dat wie een te lage schooltaalvaardigheid heeft, als lerend individu in het secundair onderwijs in de problemen komt, en dat daarom die schooltaalvaardigheid een goede indicator kan zijn voor leerbedreigdheid. Er zijn echter twee factoren te noemen die de redenering op het niveau overgang lager-secundair onderwijs heel wat complexer maken.
Hoofdstuk 3: Financiering van doelgroepleerlingen
74 Schoolse taalvaardigheid als indicator van kansenongelijkheid bij begin secundair onderwijs Vooreerst is de schooltaalvaardigheid die een leerling bezit op het einde van de basisschool, niet zonder meer een kenmerk van de bagage die de leerling van thuis uit meekrijgt, zoals dat wel het geval is bij het begin van de basisschool. Het is ook, en wellicht vooral, het resultaat van het schoolsucces van die leerling in de basisschool. We hebben eerder al aangegeven dat individuele verschillen in leervermogen verantwoordelijk zijn voor een deel van de variatie in de taalvaardigheid van de leerlingen. Bij metingen op latere leeftijd, zoals hier op de overgang tussen lager en secundair onderwijs, hebben die verschillen in leervermogen ongetwijfeld een groter effect op het schoolvaardigheidsresultaat dan op jonge leeftijd. Sommige leerlingen die in eerste instantie als positieven uit de screening kwamen, en die als gevolg daarvan extra aandacht hebben gekregen, zullen over het leervermogen beschikt hebben om die extra aandacht aan te wenden om hun achterstand te verkleinen of in te lopen. Van andere leerlingen zal intussen gebleken zijn dat hen dat, met dezelfde ondersteuning, niet lukt. Op dezelfde wijze zal blijken dat in de groep negatieven, die werd geïdentificeerd aan het begin van de basisschool, leerlingen zitten die in die groep terecht zijn gekomen door hun sociaal voordelige startpositie, maar door individuele beperkingen van hun leervermogen het moeilijk hebben om de gemiddelde ontwikkeling met betrekking tot schooltaalvaardigheid te volgen. Bij de doorwerking van die individuele verschillen komt in dit stadium ook de doorwerking van de manier waarop de school met de gesignaleerde leerbedreiging is omgegaan. We weten dat er scholen zijn die erin slagen het grootste deel van hun achterstandsleerlingen een inhaalbeweging te laten maken, maar dat er ook scholen zijn waar de kloof tussen de leerbedreigde leerlingen en de andere leerlingen alleen maar groter wordt (Verachtert et al., 2005b). Een bepaald niveau van schoolse taalvaardigheid verwijst in deze gevallen dus niet naar een ander patroon van taalgebruik in de thuissituatie, maar (ook) naar de mate waarin het basisonderwijs voor de leerling in kwestie heeft gewerkt. Natuurlijk blijft het zo dat een beperkte schoolse taalvaardigheid de leerling voor problemen zal stellen in het secundair onderwijs, en dat daar best iets aan kan gebeuren. Voor de leerling voor wie de school gefaald heeft, betekent het dat het secundair onderwijs een compenserende rol op kan nemen, deze keer niet zozeer voor het feit dat zijn thuismilieu minder goed aansluit bij het schoolse, maar voor de basisschool die haar werk onvoldoende heeft gedaan. Voor de leerling voor wie individuele kenmerken aan de beperkte taalvaardigheid ten grondslag liggen, blijft het probleem wat het ook al in de basisschool was, namelijk dat het onderwijs dat wil compenseren voor sociale kansenongelijkheid, niet noodzakelijk ook werkt voor leerlingen met individuele leerbelemmering. In principe kan voor de hele populatie onderzocht worden hoe die componenten (sociale ongelijkheid, individuele cognitieve verschillen, falende scholen en onderwijsbeleid) bijdragen tot de variatie in schooltaalvaardigheid bij de overgang van lager naar secundair onderwijs. Als het onderwijs zijn werk heeft gedaan - dit wil zeggen, als het onderwijs erin geslaagd is om de leerbedreigden in een vroeg stadium onderwijs aan te bieden dat kan compenseren voor de zwakke startpositie - dan valt te verwachten dat de samenhang tussen schoolse achterstand en sociale achtergrondkenmerken afneemt. Neemt die samenhang niet af, of daarentegen zelfs toe, dan is het aannemelijk dat het emanciperend onderwijs in de basisschool niet het resultaat geeft dat ervan werd verwacht. In het geval dat dat emanciperend onderwijs wel werkt, zal de variatie in schoolprestaties die gemeten wordt, in grotere mate het gevolg zijn van individuele cognitieve verschillen tussen leerlingen dan bij het begin van de basisschool. Werkt het emanciperend onderwijs niet naar behoren, dan zal de
Hoofdstuk 3: Financiering van doelgroepleerlingen
75 variatie in schoolprestaties in gelijke of zelfs in grotere mate aan sociale verschillen gerelateerd moeten worden. In elk geval is het niveau van schoolse taalvaardigheid bij de overgang van lager naar secundair onderwijs veel moeilijker interpreteerbaar in termen van sociale ongelijkheid die verschillen in onderwijskansen genereert. Met die diversiteit van interpretatie zal bij de herijking van leerbedreiging rekening gehouden moeten worden. Effect van opsplitsing in richtingen op leerbedreiging en kansenongelijkheid De hierboven besproken moeilijkheid bij de herijking van leerbedreiging wordt sterk verhoogd door het feit dat die herijking plaats moet vinden in een context die door een hoge mate van homogenisering van leerlingengroepen wordt gekenmerkt. We doelen hier op het feit dat na het basisonderwijs leerlingen hun onderwijs verderzetten in diverse richtingen. Hoewel die richtingen in theorie gekoppeld worden aan verschillen in interesse van leerlingen, gaat het in de praktijk vaak om een opsplitsing die op cognitieve verschillen tussen leerlingen is gebaseerd. Ook meer theoretisch dan praktisch is het uitgangspunt dat deze splitsing pas plaatsvindt vanaf het derde jaar van het secundair onderwijs. In de praktijk is de opsplitsing al van bij het begin van het eerste, en zeker van bij het begin van het tweede jaar al goeddeels gerealiseerd. In de mate dat schoolse taalvaardigheid, als één van de cognitieve prestaties van een leerling, mee in rekening genomen wordt om een leerling naar de ene of de andere richting te oriënteren, ontstaat er een probleem voor het gebruik van datzelfde kenmerk voor de identificering van leerbedreigden in het secundair onderwijs. Vanuit dit perspectief draagt een lage schoolse taalvaardigheid ertoe bij dat een leerling georiënteerd wordt naar een richting die cognitief minder eisend is. Gegeven het bekende verband tussen lagere verwachtingen ten aanzien van de leerling en schoolprestaties, valt te verwachten dat de verschillen in cognitieve leerprestaties tussen deze leerlingen en zij die naar cognitief sterkere richtingen worden geleid, eerder zullen toenemen dan afnemen. Als de geconstateerde lagere taalvaardigheid inderdaad te maken heeft met individuele factoren die de cognitieve prestatie van de leerling afremmen, valt deze oriëntatie wellicht te verdedigen. Als de lage schooltaalvaardigheid echter een effect is van de sociale achtergrond van de leerling, gecombineerd met een nietoptimaal emanciperende basisschool, dan is ze dat in elk geval niet. Wat er zou moeten gebeuren is dat deze leerlingen georiënteerd worden naar de richting die het best bij hun cognitieve mogelijkheden past, en ze daarbij de ondersteuning krijgen die ze nodig hebben om met succes dat onderwijs te volgen. Naar een gedifferentieerd systeem van identificering, financiering en onderwijsaandacht Als we het bovenstaande bekijken in termen van financiering en de extra onderwijsaandacht die met die financiering gegenereerd kan worden, is het zeer de vraag of het zinvol is een systeem uit te werken van identificering en ondersteuning van doelgroepleerlingen op het niveau van het secundair onderwijs. In de vormen van onderwijs waarin de geïdentificeerde doelgroepleerlingen terecht komen, zal het aantal leerlingen met een laag schooltaalniveau wellicht overheersen. Vandaar dat men zou kunnen stellen dat het voor deze groep weinig zin heeft om op individueel niveau doelgroepleerlingen te identificeren. Men kan beter een onderwijsaanpak ontwikkelen en ondersteunen voor al deze scholen die erop gericht is dat zij met al hun leerlingen een aantal minimale cognitieve doelen bereiken. Voor taal moeten die betrekking hebben op de taalvaardigheid die men nodig heeft om in de maatschappij (en in het
Hoofdstuk 3: Financiering van doelgroepleerlingen
76 verdere traject van het onderwijs) te functioneren. Wij denken hier vooral aan een basisgeletterdheid, en aan een minimale vaardigheid in formeel taalgebruik. Natuurlijk zijn taaltoetsen bij het ontwikkelen van aangepast onderwijs voor deze scholen een zeer nuttig instrument. We hebben het dan echter wel over toetsen die op schoolniveau ingezet worden voor de screening en diagnose op school- en leerlingniveau. De kwestie van de invoering van die toetsen hebben we in hoofdstuk 2 besproken. Voor leerlingen die georiënteerd worden naar cognitief meer-eisende richtingen is identificatie en ondersteuning van doelgroepleerlingen wel van belang. Zonder die ondersteuning zullen de meeste van die leerlingen die hun achterstand niet of niet volledig hebben weggewerkt, wellicht in de bekende waterval terechtkomen en op termijn afgeleid worden naar de cognitief minder-eisende richtingen. Het is trouwens ook de vraag hoe het leerlingen zal vergaan die hun achterstand wel hebben weten weg te werken. Er zijn ons geen studies bekend waaruit afgeleid kan worden in welke mate dit type leerlingen zich in de cognitief sterke richtingen in het secundair onderwijs weten te handhaven. Als we de cijfers over de aanwezigheid van bijvoorbeeld allochtone leerlingen in het ASO, en verder ook in het hoger onderwijs bekijken, lijkt ons de conclusie voor de hand te liggen dat wellicht ook voor hen extra ondersteuning noodzakelijk is. Dit zou dan impliceren dat de identificatie van de te ondersteunen leerlingen een heel ingewikkelde kwestie wordt. Als men ervoor kiest om taaltoetsen in te zetten, moet men ervoor zorgen dat er op één of andere wijze een onderscheid gemaakt wordt tussen de zwak scorenden voor wie de zwakke score op cognitieve beperkingen wijst, en zwak scorenden voor wie hun scores vooral op sociale achtergrond en/of falend emancipatieonderwijs in de basisschool wijst. Hoe dit onderscheid gemaakt kan worden is erg onduidelijk. Aangezien ook de meeste cognitief georiënteerde toetsen in belangrijke mate een beroep doen op taalvaardigheid (op een enkel non-verbale toets zoals bijv. de COVAAR (Magez, 2003) na), is het moeilijk voor te stellen hoe beide groepen leerlingen op een eenvoudige wijze onderscheiden kunnen worden. Als men het ermee eens is dat ook leerlingen die hun achterstand hebben ingelopen, in de cognitief meer-eisende richtingen ondersteuning moeten krijgen, zou men er ook aan kunnen denken om alle leerlingen die in het basisonderwijs geïdentificeerd werden als doelgroepleerling én die in cognitief meer-eisende richtingen instromen, als doelgroepleerling te beschouwen. Relatie tussen schoolse prestaties en sociale achtergrond in het secundair onderwijs We zijn er hierboven bij uitgekomen dat de wijze waarop we met taaltoetsen ter identificering van doelgroepleerlingen in het secundair onderwijs omgaan, in sterke mate afhankelijk is van de mate waarin we die toetsresultaten kunnen relateren aan één van de genoemde factoren die verantwoordelijk kunnen zijn voor een zwakke score. We hebben er daarbij ook op gewezen dat de samenhang tussen schoolse prestaties en sociale-herkomstkenmerken een belangrijke indicatie voor deze interpretatie bieden. In deze paragraaf willen we daarom die samenhang belichten door een aantal onderzoeksgegevens de revue te laten passeren. We baseren ons daarbij vooral op analyses die we hebben uitgevoerd op het databestand van het PISAonderzoek. Wat we kunnen vaststellen is dat halverwege het secundair onderwijs de samenhang tussen sociale achtergrond van de leerlingen en schoolsucces niet afgenomen lijkt te zijn ten opzichte van het begin van de schoolcarrière. Daar waar bij het begin van de derde kleuterklas een aantal sociale factoren die met achterstand in verband werden gebracht, 26 % van de variantie verklaarde in de scores op wiskunde en 16% van de variantie in de scores op taal (Reynders et al., te verschijnen), blijkt uit het PISA-onderzoek dat de socio-culturele index die in het
Hoofdstuk 3: Financiering van doelgroepleerlingen
77 onderzoek wordt gehanteerd, samen met de variabele geboorteland van moeder, 27% van de variantie verklaart in zowel de scores voor lezen als voor wiskunde. Als ook het aantal jaren opgelopen onderwijsachterstand in de analyse wordt toegevoegd, stijgt de hoeveelheid verklaarde variantie in beide gevallen tot 39%31. Het feit dat de samenhang tussen sociale herkomst en schoolsucces doorheen de jaren niet afgenomen is, kan op verschillende manieren verklaard worden. Een mogelijke eerste verklaring doet vragen rijzen bij de effectiviteit van het GOK-beleid. Het lijkt erop dat we bij het begin van de basisschool wel doelgroepleerlingen identificeren, en hen vervolgens ondersteunen, maar dat dat er niet toe leidt dat leerlingen die vanuit sociaal perspectief leerbedreigd genoemd kunnen worden, hierdoor tot betere leerprestaties gebracht worden. Men kan de verklaring voor de gevonden samenhang tussen sociale kenmerken en schoolsucces echter ook in een andere richting zoeken. Als we de data uit het PISA-onderzoek nader bekijken, stellen we vast dat de verschillen tussen leerlingen op het gebied van wiskunde en lezen sterk samenhangen met de richting waarin die leerlingen les volgen. ASOleerlingen scoren veel beter dat TSO-leerlingen, en TSO-leerlingen scoren op hun beurt weer beter dat BSO-leerlingen. DBSO-leerlingen en BUSO-leerlingen sluiten de rij. Als we richtingen in het secundair onderwijs in de regressieanalyse toevoegen, dan stijgt het percentage verklaarde variantie naar .6032. Opmerkelijk is dat in een stepwise procedure (regressie-analyse) de variabele BSO en ASO, samen met de variabele die het aantal jaren onderwijsvertraging geeft, eerst in het model opgenomen worden, en dat die drie variabelen 57,5% van de variantie verklaren. De introductie in het model van de socio-culturele index en het geboorteland van de moeder voegen slechts 2,5% verklaarde variantie toe. Dit patroon wijst erop dat we zeer voorzichtig moeten zijn met een interpretatie in termen van ineffectieve GOK-werking in het basisonderwijs. Het is namelijk zeer opvallend dat de doorstroming naar de verschillende richtingen in het secundair onderwijs zeer sterk sociaal gekleurd is. Zoals uit de volgende tabel blijkt, zijn leerlingen uit sociaal zwakkere milieus ruim oververtegenwoordigd in het BSO en ondervertegenwoordigd in het ASO. Highest Index of Socio- parental Economic and occupational Cultural Status status
Onderwijsrichting ASO
TSO
KSO
BSO
DBSO
Mean
,6507593
58,32
N
2243
2229
Std. Deviation
,75947629
15,138
Mean
,0313495
47,56
N
1479
1454
Std. Deviation
,75756172
15,290
Mean
,3299563
51,79
N
52
52
Std. Deviation
,65719245
13,257
Mean
-,4831399
39,52
N
960
908
Std. Deviation
,78309969
13,856
Mean
-,9730166
36,08
31
Op basis van een lineaire regressieanalyse. De effecten van alle genoemde variabele zijn significant (p< .001). We hebben in de regressieanalyse twee dichotome variabelen toegevoegd, een die 1 geeft voor ASO-leerlingen en 0 voor andere leerlingen, en een die 1 geeft voor (D)BSO en BUSO-leerlingen en 0 voor alle andere. 32
Hoofdstuk 3: Financiering van doelgroepleerlingen
78
Missing
Totaal
N
44
39
Std. Deviation
,85601452
12,675
Mean
-1,2702396
31,73
N
23
22
Std. Deviation
,89490835
9,056
Mean
,1896272
50,81
N
4902
4791
Std. Deviation
,90368737
16,760
Tabel 3.6: Gemiddelden op socio-culturele index per studierichting in PISA 2003
Als die doorstroming naar verschillende richtingen in het secundair onderwijs gebaseerd is op objectieve verschillen in bereikt schoolsucces in de basisschool van deze leerlingen, is er inderdaad sprake van GOK-beleid dat niet goed genoeg werkt om deze leerlingen met lage sociale herkomst de kans te bieden om tegen het einde van de basisschool hun achterstand te hebben weggewerkt. Zij stromen dan door naar een richting in het secundair onderwijs waar de niet-ingelopen achterstand bestendigd of zelfs uitgediept wordt. Het is echter ook goed mogelijk dat de doorstroming naar de verschillende richtingen in het secundair voor een groot deel bepaald wordt door de sociale herkomst van de leerlingen, en dat objectieve verschillen in bereikt resultaat er veel minder toe doen. In dat geval komen leerlingen met een lage sociale herkomst samen in het (D)BSO of BUSO. Als dan blijkt dat die richtingen er niet goed in slagen om de schoolse prestaties van hun leerlingen verder te ondersteunen, ontstaat er in het secundair onderwijs een samenhang met sociale indicatoren die niet of minder sterk aanwezig was op het einde van de basisschool. Om deze interpretatiemogelijkheid te controleren hebben we ook een regressieanalyse uitgevoerd op de data van het normeringsonderzoek van de TAS (cf. bijlage 1). De TAS is een Vlaamse taaltoets voor leerlingen aan het begin van het secundair onderwijs. In het normeringsonderzoek werd van 900 leerlingen uit een representatieve steekproef van middelbare scholen in Vlaanderen drie taalvaardigheidstoetsen afgenomen, twee edittoetsen en een luistertoets. Van de deelnemende leerlingen werden ook een aantal sociale kenmerken geregistreerd33. Uit het regressieonderzoek bleek dat de sociale kenmerken samen tussen de 5 % en de 14 % van de variantie verklaarden in de drie toetsen. De hoeveelheid verklaarde variantie is dus duidelijk minder dan wat de onderzoekers van het Steunpunt LOA constateerden in de derde kleuterklas en het eerste leerjaar. Natuurlijk zijn beide bestanden en onderzoeken moeilijk met elkaar te vergelijken, maar als er al van een tendens sprake is, is het er één naar minder variantie in schoolprestatie die met sociale herkomst samenhangt. Voor zover dit iets zegt, wijst deze tendens in de richting van een GOK dat er in het basisonderwijs in slaagt om de invloed van sociale achtergrond op taalvaardigheid te verminderen. Dit maakt aannemelijker dat de grote samenhang tussen schoolprestaties en sociale herkomstkenmerken die we in het PISA-onderzoek aantreffen, eerder een gevolg is van specifieke ontwikkelingen in het secundair onderwijs dan van een falend GOK-beleid in de basisschool. Onderstaande tabel laat zien dat de zwakke prestatie van grote groepen leerlingen in het PISA-onderzoek misschien beter toegeschreven kan worden aan een effect van BSO dan aan een effect van sociale herkomst van de leerlingen.
33
Het betreft hier het studieniveau van vader en moeder, de beroepsactiviteit van vader en moeder, de gezinsvorm waarin de leerling leeft en het feit of hij al of niet GOK-doelgroepleerling is.
Hoofdstuk 3: Financiering van doelgroepleerlingen
79
onderwijsrichting ASO
ses 1,00
2,00
3,00
4,00
Total
TSO
1,00
2,00
3,00
4,00
Total
KSO
1,00
2,00
3,00
Total
BSO
1,00
2,00
3,00
lezen
wiskunde
Mean
559,8366
590,4679
N
38
38
Std. Deviation
68,03300
76,60083
Mean
588,6330
612,8360
N
497
497
Std. Deviation
47,03010
59,47676
Mean
595,9638
627,2371
N
1456
1456
Std. Deviation
52,89219
60,91991
Mean
608,6541
636,8473
N
238
238
Std. Deviation
50,72544
61,34197
Mean
595,0684
624,4254
N
2229
2229
Std. Deviation
52,15926
61,48281
Mean
520,0570
538,7221
N
77
77
Std. Deviation
58,08941
70,31438
Mean
522,8735
544,3821
N
683
683
Std. Deviation
57,11598
62,92481
Mean
530,4337
550,8373
N
643
643
Std. Deviation
57,24296
66,02195
Mean
530,5551
561,2089
N
51
51
Std. Deviation
50,30589
52,59981
Mean
526,3371
547,5272
N
1454
1454
Std. Deviation
57,08229
64,48600
Mean
532,9025
558,2957
N
2
2
Std. Deviation
38,76170
18,22021
Mean
556,4425
559,8060
N
20
20
Std. Deviation
41,34297
45,26120
Mean
551,5562
541,1253
N
30
30
Std. Deviation
50,86281
58,86660
Mean
552,7181
548,9706
N
52
52
Std. Deviation
46,46420
53,15837
Mean
426,4652
431,8716
N
100
100
Std. Deviation
72,06526
69,97585
Mean
438,8045
450,5578
N
562
562
Std. Deviation
62,23809
63,69383
Mean
450,3336
462,5488
N
233
233
Hoofdstuk 3: Financiering van doelgroepleerlingen
80
4,00
Total
DBSO
1,00
2,00
3,00
Total
Missing
1,00
2,00
3,00
Total
Total
1,00
2,00
3,00
4,00
Total
Std. Deviation
62,87878
59,16235
Mean
459,2547
496,4181
N
13
13
Std. Deviation
52,34891
54,12380
Mean N Std. Deviation Mean
440,6968 908 63,74701 365,4646
452,2334 908 63,87949 390,1097
N
7
7
Std. Deviation
64,48159
51,22279
Mean
350,0732
374,4303
N
25
25
Std. Deviation
95,80424
81,28134
Mean
396,0571
381,6994
N
7
7
Std. Deviation
92,22162
88,18256
Mean
361,0893
378,5493
N
39
39
Std. Deviation
90,02722
76,50052
Mean
313,0973
366,3265
N
6
6
Std. Deviation
134,05151
123,53593
Mean
344,1457
395,7138
N
15
15
Std. Deviation
81,14249
85,36934
Mean
439,1058
521,3273
N
1
1
Std. Deviation
.
.
Mean
339,9943
393,4088
N
22
22
Std. Deviation
96,71971
97,38977
Mean
472,7475
488,6556
N
242
242
Std. Deviation
92,60327
98,10161
Mean N Std. Deviation Mean
508,4195 1852 86,41823 561,3106
527,6352 1852 92,47651 586,9724
N
2393
2393
Std. Deviation
74,30867
84,22812
Mean
587,5480
616,6762
N
304
304
Std. Deviation
67,22521
72,75479
Mean
538,0565
560,9538
N
4791
4791
Std. Deviation
85,68172
94,31363
Tabel 3.7: Gemiddelden op lezen en wiskunde in PISA 2003, per onderwijsrichting en SES-niveau (SES afgeleid van variabele hoogste beroepsniveau van ouders)
De hier gepresenteerde gegevens bevestigen ons inziens de suggesties die we onder het kopje Effect van opsplitsing in richtingen op leerbedreiging en kansenongelijkheid hebben gedaan met betrekking tot de identificatie en financiering van doelgroepleerlingen. Voor leerlingen die worden georiënteerd naar het (D)BSO lijkt het niet veel zin te hebben veel energie te spenderen aan een herijking van de identificering van doelgroepleerlingen. Het probleem Hoofdstuk 3: Financiering van doelgroepleerlingen
81 blijkt in dit geval niet bij identificering, maar wel bij de werking met de doelgroepleerlingen te liggen. Het advies in dit geval kan enkel zijn om eerst te investeren in de uitbouw van een effectieve werking. Uit de gepresenteerde cijfers in de tabel blijkt dat ruim 73% van de leerlingen in het (D)BSO een lager dan gemiddelde sociale herkomst hebben en dat het (D)BSO het moeilijk heeft om met zijn leerlingen een redelijk niveau van algemene vaardigheid te bereiken, ongeacht de sociale herkomst van haar leerlingen. Zolang de sociale homogenisering die in deze richting plaatsvindt de omvang aan blijft nemen die hij nu heeft, doet men er volgens ons goed aan elke leerling hier als een doelgroepleerling te beschouwen. Uit de gepresenteerde data blijkt ook dat leerlingen uit lagere sociale herkomst weinig of geen kans maken in het ASO. Zij zijn er om te beginnen zwaar ondervertegenwoordigd: daar waar de totale steekproef ongeveer 5% leerlingen telt in SES-categorie 1 en 44% in categorie 1+2, bedragen die percentages voor het ASO respectievelijk 1,7% en 24%. De leerlingen uit die categorieën blijken daarbij nog erg zwak te scoren, wat het aannemelijk maakt dat ze op een later tijdstip onderwijsachterstand oplopen of in het watervalsysteem terechtkomen. In elk geval is het weinig aannemelijk dat dit onderwijs een belangrijke groep leerlingen aflevert die ondanks hun zwakke sociale positie bij de start van het onderwijs, erin slagen om schoolsucces te boeken. Het eerste probleem is hier dus niet uit te zoeken welke leerlingen die besluiten naar het ASO te gaan extra gefinancierd moeten worden, maar een manier te vinden om een grotere groep leerlingen met een sociaal zwakke uitgangspositie naar het ASO toe te leiden en hen daar ook te houden. Dat kan volgens ons het best gebeuren door leerlingen die aangemerkt werden als doelgroepleerling in het basisonderwijs te stimuleren en te ondersteunen als ze naar het ASO trekken. Een herijking van leerbedreiging is hier volgens ons niet nodig. Het TSO neemt in dit hele verhaal een ietwat aparte plaats in. Daar waar er in ASO en BSO duidelijk sprake is van een overrekrutering van de ene of andere sociale groep, weerspiegelt de groep leerlingen in het TSO een sociale opbouw die goed vergelijkbaar is met die van gehele schoolpopulatie. Ook is er voor het TSO wellicht het minst sprake van selectie die al in het eerste jaar secundair begint. Daar waar voor veel ASO-richtingen die selectie doorgevoerd wordt doordat de school alleen ASO aanbiedt, en door het inrichten van richtingen als Klassieke Studiën (Latijn), en er ook voor het BSO specifieke toeleidingswegen bestaan met de richtingen 1B en 2BVL, is die toeleiding voor het TSO veel minder uitgesproken. Sommige scholen die naast TSO ook ASO en/of BSO aanbieden, kiezen er zelfs bewust voor om de groepen in het eerste jaar niet te homogeniseren. Vanuit dit perspectief kan voor leerlingen die uiteindelijk in het TSO terecht komen, gesteld worden dat ze meer dan voor de andere richtingen in het secundair onderwijs, in de eerste graad nog steeds in onderwijs voor algemene basisvorming terechtkomen. Hoe vanuit een dergelijk perspectief met de herijking van leerbedreigdheid bij de overgang lager-secundair onderwijs zou kunnen worden omgegaan, wordt in het volgende punt besproken. Identificatie in een eerste graad basisvorming In het voorgaande zijn we uitgegaan van de praktijk waarin het streamingseffect in het Vlaamse onderwijs al sterk voelbaar is bij de overgang van het lager naar het secundair onderwijs. We hebben er echter ook op gewezen dat in theorie de eerste graad van het secundair onderwijs, en zeker het eerste jaar daarin, die opdeling in cognitief veel en mindereisende richtingen niet kent. Vanuit dat perspectief kan men ook het standpunt innemen dat een praktijk van identificatie en financiering van doelgroepleerlingen geënt dient te worden op de kenmerken van het onderwijssysteem zoals het bedoeld is, en niet zoals het in de
Hoofdstuk 3: Financiering van doelgroepleerlingen
82 praktijk uitpakt. Vanuit dat perspectief wordt een herijking van leerbedreigdheid op basis van taaltoetsen bij de overgang van het lager naar het secundair onderwijs, wel weer zinvol. Men kan er in dit geval zelfs voor kiezen om de resultaten van de schoolgebonden paralleltoets van het periodiek peilingsonderzoek in de basisschool (zie hoofdstuk 2) te recycleren en te gebruiken om een herijking van leerbedreigdheid uit te voeren. Men moet zich dan echter wel realiseren dat het niveau van vaardigheid waarop men die herijking baseert, nog steeds bepaald wordt door de drie bronnen van variatie die we eerder hebben besproken, en dat die drievoudige herkomst van de variatie ook vanuit een comprehensief perspectief heel wat problemen blijft opleveren. We proberen dit duidelijk te maken aan de hand van de criteria positieven en negatieven die we al eerder hebben gehanteerd.
Herijking positief Herijking negatief
Begin BaO positief A: 2 x positief C:Valse positieven
Begin BaO negatief B: Valse negatieven D: 2 x negatief
Tabel 3.8: Relatie tussen identificatie begin basisonderwijs en herijking op overgang lager-secundair onderwijs
Voor groep D verandert er na de herijking weinig of niets: zij bleken bij de eerste screening niet geïdentificeerd te worden als leerbedreigd, en de herijking bevestigt gewoon dit beeld. Voor groep A liggen de zaken al iets gecompliceerder. Voor hen wordt het beeld van leerbedreigdheid bevestigd. We mogen er echter van uitgaan dat de eerste identificering aanleiding heeft gegeven om die leerlingen extra onderwijsaandacht te geven. Uit het feit dat ze ook bij de herijking bij een achterstand qua schooltaalvaardigheid blijken te hebben, valt af te leiden dat die extra aandacht (te) weinig effect heeft gesorteerd. Zoals eerder aangegeven kan de oorzaak daarvan in verschillende richtingen gezocht worden. Hoe het ook zij, het lijkt ons geen goede zaak dat het signaal rond de extra aandacht voor deze groep leerlingen pas op dit moment gegeven wordt. Een vroegere herijking biedt meer mogelijkheden om het tij alsnog te keren. Daarnaast lijkt het ook weinig waarschijnlijk dat verlengde extra aandacht de leerbedreigdheid wel zal weten op te heffen, tenzij men zicht heeft op wat er is misgegaan en de aanpak van de leerling op een andere leest schoeit. Ook voor groep C, de valse positieven, is niet zondermeer duidelijk wat moet gebeuren. Dit zijn de leerlingen die in eerste instantie als leerbedreigd werden geïdentificeerd, maar die nu geen achterstand (meer) blijken te hebben. In deze groep zitten, naast de ‘echte’ valse positieven, zij die ten onrechte bij de eerste screening bij de groep leerbedreigden werden ingedeeld, ook de leerlingen die bij het begin van de basisschool terecht in deze groep werden ingedeeld, en die met gebruikmaking van de extra onderwijsaandacht erin zijn geslaagd om hun achterstand weg te werken. Zij hebben dus blijk gegeven van het feit dat het extra versterkte onderwijs voor hen werkt. De vraag is nu wat met die leerlingen gebeurt als die extra ondersteuning wegvalt, zeker als dat gebeurt op een moment van ingrijpende verandering in onderwijscontext zoals de overgang van lager naar secundair onderwijs er één is. De kans is reëel dat deze leerlingen in die nieuwe situatie toch niet goed weten te presteren, en in hun achterstandspositie terugvallen. Hoe groot dit risico is, weten we niet. Er is ons geen onderzoek bekend dat ons hierover informatie verschaft. Ervaringen met de praktijk doen ons ertoe besluiten dat het risico reëel genoeg is om ervoor te pleiten de ondersteuning voor deze leerlingen niet weg te nemen op het ogenblik van de overgang van lager naar secundair. Indien men een herijking nodig acht, kan die wellicht beter op een later tijdstip uitgevoerd worden.
Hoofdstuk 3: Financiering van doelgroepleerlingen
83 Groep B ten slotte, de valse negatieven, zijn volgens ons ook niet gebaat met een herijking van leerbedreigdheid bij de overgang van lager naar secundair onderwijs. Zij zijn de groep die bij de eerste meting ten onrechte niet als leerbedreigd werden aangemerkt. Het valt niet te verdedigen dat een correctie op die inschattingsfout zes jaar op zich laat wachten. Voor deze groep is, net als voor een deel van groep A, een herijking op een vroeger moment aangewezen. Conclusies •
•
•
•
•
Schoolse taalvaardigheid kan bij de overgang van lager naar secundair onderwijs veel minder dan bij het begin van de basisschool fungeren als indicator voor de socioculturele omstandigheden waarin een kind opgroeit en de mate waarin die omstandigheden het kind beter of minder goed in staat stellen om van het onderwijs te profiteren. Bij het einde van de basisschool wordt het niveau van die vaardigheid daarvoor te sterk bepaald door het effect van het onderwijs dat eraan voorafgaat. Daarom is het gebruik van taaltoetsen voor de identificatie van doelgroepleerlingen op deze leeftijd problematischer dan in een vroeger stadium. Een correcte identificatie van doelgroepleerlingen lijkt ook niet het grootste probleem te zijn voor de uitbouw van effectief emanciperend secundair onderwijs. Het grote probleem lijkt de sociale selectie te zijn, die zorgt dat leerlingen met lagere sociale herkomst sterk oververtegenwoordigd zijn in het beroepsonderwijs, en sterk ondervertegenwoordigd in het algemeen vormend onderwijs. Een tweede probleem lijkt te zijn dat het beroepsonderwijs er niet goed in slaagt zijn leerlingen een aantal eindtermen te laten halen die in de sfeer van dat algemeen vormend onderwijs liggen. In dit verband hebben we specifiek gewezen op het niveau van algemene geletterdheid dat elkeen nodig heeft om zonder problemen in de maatschappij te kunnen functioneren. In het licht van het voorgaande pleiten wij ervoor om in het beroepsonderwijs en alle richtingen die naar het beroepsonderwijs toeleiden, geen onderscheid meer te maken in doelgroepleerlingen en niet-doelgroepleerlingen. De uitdaging voor deze onderwijsrichting is juist om wegen te ontdekken om al haar leerlingen de eindtermen van het secundair onderwijs te laten halen. Verder dient onderzocht te worden hoe leerlingen die in het basisonderwijs de status van doelgroepleerling hadden, gestimuleerd kunnen worden om door te stromen naar ASO- en TSO-richtingen. Voor deze groep leerlingen pleiten we ervoor om niet een herijking van leerbedreigdheid door te voeren bij de overgang van het lager naar het secundair onderwijs. Dit zou betekenen dat deze leerlingen bij het begin van het secundair onderwijs hun identificatie als doelgroepleerling of niet-doelgroepleerling uit het basisonderwijs behouden. Als men een herijking nodig acht, kan men die wellicht beter uitvoeren bij de overgang tussen de eerste en tweede graad secundair onderwijs. Ten slotte denken we dat ook een vroegere herijking nuttig kan zijn. Op die kwestie gaan we in in de volgende paragraaf.
Hoofdstuk 3: Financiering van doelgroepleerlingen
84 3.4.4 Herijking van leerbedreigdheid: tussentijdse toetsen in het basisonderwijs Eén van de gevolgen van de keuze om geen herijking van leerbedreigdheid door te voeren bij de overgang van lager naar secundair onderwijs, is dat de inschatting die gemaakt wordt bij de overgang van kleuter- naar lager onderwijs minimaal een achttal jaren van kracht blijft. We hebben eerder geargumenteerd dat de stabiliteit van de identificering een logisch gevolg is van het feit dat we taalvaardigheid in dit verband gebruiken als een indirecte indicator van de socio-culturele omstandigheden waarin een leerling opgroeit, en van het effect dat die omstandigheden hebben op zijn kansen om van het geboden onderwijs te profiteren. We hebben er echter ook op gewezen dat elke inschatting van leerbedreigdheid, en dus ook een inschatting die op taalvaardigheidsgegevens is gebaseerd, noodzakelijkerwijze fouten bevat, en dat daarbij de zogenaamde valse negatieven het grootste probleem vormen. Het ligt dan ook voor de hand dat er in de onderwijsloopbaan van de leerling momenten voorzien worden waarbij de correctheid van de eerst gemaakte inschatting wordt gecontroleerd. In het voorgaande hebben we uitgelegd waarom we geloven dat die controle beter in een relatief vroeg stadium plaats kan vinden. Het lijkt ons om diverse redenen aangewezen om een dergelijke controle te organiseren halverwege het lager onderwijs. Probleem van curriculumafhankelijkheid Bij de introductie van paragraaf 3.4.3 hebben we aangegeven dat voor de overgang van lager naar secundair onderwijs eindtermen zijn geformuleerd, en dat dat een goede reden vormt om herijking van leerbedreigdheid op dat moment te overwegen. Deze redenering was gebaseerd op de vaststelling dat die eindtermen ons in staat te stellen de schoolse taalvaardigheid van leerlingen op een curriculumonafhankelijke wijze te benaderen. Voor de periode die we hebben aangeduid als halfweg het lager onderwijs, bestaan die eindtermen niet. Dit betekent dat we niet op dezelfde wijze kunnen stellen dat er wel een taaltoets te maken valt die op een curriculumonafhankelijke wijze een beeld geeft van de schoolse taalvaardigheid van leerlingen. Afhankelijk van de weg die een school kiest om de eindtermen basisonderwijs met haar leerlingen te realiseren, hebben sommige leerlingen in bijvoorbeeld het derde leerjaar al bepaalde aspecten van taalvaardigheid geoefend, die in andere scholen pas later aan bod komen. Als gevolg hiervan treedt er variatie op in de leerlingpopulatie die niet verwijst naar verschillen in leerbedreiging of onderwijsrendement, maar simpelweg naar verschillen in het gevolgde curriculum. Net zoals bij de overgang van lager naar secundair onderwijs de verschillende bronnen van variatie in schoolse taalvaardigheid een probleem bleken te zijn voor de interpretatie van die vaardigheid in termen van leerbedreigdheid, zorgt ook deze nieuwe bron van variatie voor interpretatieproblemen. Nochtans denken wij dat deze bron van variatie geen beletstel hoeft te vormen om halfweg het basisonderwijs een herijking van leerbedreigdheid uit te voeren. Vooreerst is er op dat moment in het onderwijstraject sprake van een overgang die in termen van schoolse taalvaardigheid beschreven kan worden. Voor de meeste scholen wordt de aandacht in het taalonderwijs in het derde leerjaar verlegd van technisch lezen naar begrijpend lezen. Ook voor het schrijfonderwijs doet naast de verwerving van elementaire spellingregels ook het schrijven als communicatieve act zijn echte intrede. Voor het overige wordt in deze periode ook het zaakvakkenonderwijs geïntroduceerd of sterker aangezet. Elk van deze stappen doet een beroep op specifieke schoolse taalvaardigheid. We kunnen stellen dat alle leerlingen bij de overgang naar het vierde leerjaar moeten beschikken over een bepaalde mate van die schooltaalvaardigheid om met succes het verdere onderwijs te kunnen volgen. Daar waar in de vorige leerjaren sommige leerlingen nog konden compenseren voor de gedeeltelijke
Hoofdstuk 3: Financiering van doelgroepleerlingen
85 afwezigheid van die schoolse taalvaardigheid, kan dat vanaf leerjaar vier wellicht veel moeilijker. Vanuit dat perspectief kan men stellen dat die noodzakelijke vaardigheid de basis kan worden voor de ontwikkeling van een taaltoets die erop gericht is om de identificering van doelgroepleerlingen te controleren. Beoogde effecten van herijking Als men besluit een taaltoets in te voeren in het derde leerjaar om zo eventueel de eerder gemaakte identificering van doelgroepleerlingen bij te stellen, dienen we de vraag te stellen welke consequenties verbonden kunnen worden aan welke resultaten. We kunnen bij de bespreking hiervan uitgaan van dezelfde tabel die we al hebben gepresenteerd voor het secundair onderwijs, en waarbij we het onderscheid maken tussen vier groepen valse en echte positieven en negatieven. Voor de 2 x negatieven verandert de screening tijdens het derde leerjaar niets aan hun status als niet-doelgroepleerling. Voor de valse negatieven dient de screening in het derde leerjaar ertoe te leiden dat ze in tegenstelling tot hun vroegere positionering, wel als doelgroepleerling worden beschouwd. Voor de twee andere categorieën is het minder duidelijk welke conclusies moeten worden getrokken. We hebben er ook bij de bespreking van de groep valse positieven bij het secundair onderwijs op gewezen dat het weghalen van de extra aandacht voor deze leerlingen zou kunnen leiden tot een terugval in schoolprestaties: zij hebben blijk gegeven goed te presteren als ze die ondersteuning krijgen, we weten niet of ze even goed blijven presteren zonder die ondersteuning. Voor de groep 2 x positieven geldt dat de ondersteuning er niet toe heeft geleid dat de achterstand is weggewerkt. Nu is dat voor de leerlingen op dit moment in hun onderwijsloopbaan in de meeste gevallen ook niet te verwachten. Wel verwachten we dat de achterstand in de periode tussen de twee metingen verkleind is, of toch in elk geval niet is gegroeid. Dit brengt met zich mee dat het goed zou zijn de groep 2 x positieven in twee subgroepen op te splitsten. Er zijn dan enerzijds de leerlingen waarvan bij controle van de achterstand in het derde leerjaar blijkt dat ze inderdaad niets van hun achterstand hebben ingelopen. Het heeft weinig zin om met die leerlingen op dezelfde manier verder te werken. Aan de werking met deze leerlingen moet iets veranderen. De leerlingen voor wie blijkt dat ze wel positief zijn geëvolueerd, maar dat ze er nog niet in geslaagd zijn de achterstand weg te werken, hoeft er niets te veranderen. Zij kunnen op dezelfde wijze als doelgroepleerling geïdentificeerd blijven. De opsplitsing van de groep 2 x positieven brengt ons bij een kwestie die we verder in dit hoofdstuk nog aan de orde willen stellen. Een dergelijke opsplitsing komt neer op de invoering van een weging voor doelgroepleerlingen. De hier behandelde opsplitsing laat zien hoe delicaat een dergelijke weging kan zijn. Men zou kunnen stellen dat voor de groep 2 x positieven die geen vooruitgang hebben geboekt, blijkt dat er een nog grotere inspanning geleverd moet worden, en dat men daarom de weging van die leerlingen verhoogt. Zoals eerder aangegeven is het gebrek aan vooruitgang van deze leerlingen echter niet altijd te wijten aan verschillen in het vermogen van de leerling om van dat onderwijs met extra ondersteuning te profiteren. In vele gevallen heeft het ook te maken met kenmerken van dat onderwijs zelf. Kort door de bocht zou het zwaarder wegen van dit type leerlingen kunnen betekenen dat zwakke scholen beloond worden voor hun gebrek aan resultaat. Het spreekt voor zich dat bij de uitwerking van een weging gezorgd zal moeten worden dat dit soort perverse effecten niet ontstaat.
Hoofdstuk 3: Financiering van doelgroepleerlingen
86 Toetsvorm en afnameprocedure Het toetsen van taalvaardigheid op een betrouwbare en valide wijze vormt bij 9 à 10-jarigen veel minder een probleem dan bij jongere kinderen. We kunnen dan ook bij de keuze van de toets argumenten met betrekking tot economie en efficiëntie van afname en verwerking een grotere rol laten spelen dat bij de screening op jongere leeftijd. Om redenen die eerder al zijn besproken, kijken we ook hier in de richting van directe toetsen die ten minste op een mesoniveau een deelvaardigheid meten. Omdat zij makkelijker af te nemen zijn dan toetsen van andere vaardigheden, zijn vooral toetsen begrijpend lezen voor dit doel erg bruikbaar. Ook integratieve toetsen zoals een edittoets komen in aanmerking. Van beide toetstypes weten we dat ze goede resultaten opleveren: zij correleren meestal hoog met toetsen van andere vaardigheden en met toetsen van andere schoolse prestaties. Een toets begrijpend lezen heeft wel als probleem dat leerkrachten niet zullen zien dat de toets als indicator voor een veel algemener kenmerk gebruikt wordt en eruit zullen afleiden dat GOK-praktijk het best gelijkgesteld kan worden aan extra aandacht voor begrijpend lezen. Nu is begrijpend lezen natuurlijk een belangrijk onderdeel van taalvaardigheidsonderwijs, dat op zijn beurt een belangrijk onderdeel van gelijkekansenonderwijs is, maar een verenging van dat gelijkekansenbeleid tot begrijpend lezen lijkt ons geen goede zaak. Om dit zogenaamde backwash-effect te vermijden, zou men ervoor kunnen kiezen om de geteste vaardigheid af te wisselen. Dat geeft wel de moeilijkheid dat veel van die andere vaardigheden veel moeilijker te toetsen zijn. Vanuit dit perspectief verdient het aanbeveling om toch vooral gebruik te maken van indirecte, integratieve toetsen. Die toetsen leiden minder aan het bovenvermelde backwash- effect, omdat ze minder direct appelleren aan gekende onderwijsactiviteiten. Voor de afname van de toets op dit moment geldt dat, net als bij de screening aan het begin van de basisschool, de data verzameld dienen te worden door een persoon die niet aan de school verbonden is. Omdat de toets makkelijk klassikaal af te nemen is, kunnen veel meer leerlingen per dataverzamelaar per dag getoetst worden. Wij gaan uit van de afname van 60 toetsen per dag. Volgens dezelfde berekeningswijze die we hoger hebben ontwikkeld, komt dat neer op een personele kostprijs van € 250.000 voor de verzameling van de gegevens. Als we ook de materiële kosten voor de dataverzameling, de toetsontwikkeling en verwerking mee in rekening brengen, komen we uit bij een geschatte kostprijs voor de screening op dit onderwijsmoment van € 1.000.000. Conclusies •
•
•
Als de overheid ervoor kiest om in het systeem van identificering en financiering van doelgroepleerlingen een herijking op te nemen en daarvoor taaltoetsen in wil zetten, adviseren wij om dat in het derde leerjaar uit te voeren. Het moment laat toe om fouten in de eerdere screening te corrigeren op een moment dat de correctie voor de leerling nog een verschil maakt. Het is ook een moment waarvoor een aantal behoeften aan schoolse taalvaardigheid kunnen worden geformuleerd die tamelijk onafhankelijk zijn van het onderwijscurriculum dat de school volgt. Bij een dergelijke herijking van de inschatting van leerbedreigdheid kan best gebruik gemaakt worden van een toets begrijpend lezen en/of een indirecte integratieve taaltoets. De toetsresultaten moeten vooral worden aangewend om zogenaamde valse negatieven in de eerste screening op te sporen en hen de status van doelgroepleerling te geven. Als men ook de doelgroepstatus van andere groepen aan wil passen, moet men erg voorzichtig zijn om geen ongewenste effecten te sorteren.
Hoofdstuk 3: Financiering van doelgroepleerlingen
87 •
Het verschil in score tussen de twee screeningsmomenten kan men gebruiken om een weging van doelgroepleerlingen in te voeren. Dit punt wordt verder uitgewerkt.
3.4.5 Herijking van de leerbedreigdheid: toetsen bij overgang 1e-2e graad secundair onderwijs Bij de bespreking van de identificering van doelgroepleerlingen bij de overgang van lager naar secundair onderwijs, hebben we niet alleen gepleit voor een vroegere, maar ook voor een latere herijking van de leerbedreigdheid. Het idee achter die latere herijking was dat het wellicht zinvol was om te kijken naar de achterstandspositie in termen van schoolse taalvaardigheid van leerlingen op een moment dat ze zich al hebben kunnen aanpassen aan de manier van onderwijs verstrekken in het secundair onderwijs. Voor leerlingen van wie op het einde van de basisschool vastgesteld kan worden dat ze hun achterstand qua taalvaardigheid geheel of gedeeltelijk hebben kunnen wegwerken, valt moeilijk te voorspellen of ze de positie die ze hebben verworven ook kunnen behouden in het secundair onderwijs. Als na twee jaar secundair onderwijs blijkt dat ze daar inderdaad in slagen, kan men met groter vertrouwen besluiten dat de achterstand op een stabiele wijze is weggewerkt, en kan men daar de nodige consequenties aan verbinden. Nochtans kleven er aan een herijking van leerbedreigdheid op dit moment ook heel wat bezwaren. De meeste daarvan zijn in dit hoofdstuk al in een ander verband ter sprake gekomen. Een van de belangrijkste is zeker dat ook de overgang van de eerste naar de tweede graad secundair een moment is waarop streaming plaatsvindt. Als men hier door middel van een toets inschat wie nog een achterstand heeft, is het ook hier mogelijk dat die informatie wordt aangewend om leerlingen die nog steeds een achterstand hebben, naar een cognitief minder-eisende richting te leiden. De belangrijkste vraag die hier gesteld moet worden is of de invoering van een screening op basis van een taaltoets enige meerwaarde biedt ten aanzien van andere vormen van identificering van doelgroepleerlingen. Voor het BSO kunnen we die vraag relatief gemakkelijk beantwoorden. We hebben er in 3.4.3 voor gepleit om alle leerlingen in het BSO automatisch als doelgroepleerlingen te beschouwen. Het heeft volgens ons weinig zin om een screeningssysteem op te zetten, met gebruikmaking van sociale achtergrondgegevens of van de resultaten op een taaltoets, dat er uiteindelijk toe leidt dat 25% van de leerlingen niet de status van doelgroepleerling krijgt. Vanuit het perspectief dat de identificatie van doelgroepleerlingen de school de middelen moet verschaffen om zijn onderwijs aan de aanwezigheid van leerbedreigde leerlingen aan te passen, zal een dergelijk systeem wellicht zeer beperkt andere uitkomsten opleveren dan een systeem dat alle leerlingen als doelgroepleerling beschouwt. Deze keuze wil overigens niet zeggen dat wij ervan uitgaan dat taaltoetsen geen belangrijke rol kunnen spelen bij het verbeteren van het emanciperend onderwijs aan deze leerlingen. Wij hebben er in hoofdstuk 2 juist voor gepleit dat voor deze leerlingen tijdig gekeken wordt wie de talige eindtermen die met algemeen maatschappelijk functioneren in verband gebracht kunnen worden, niet dreigt te halen. Voor die leerlingen kan dan een aangepast programma uitgewerkt worden. Dit gebruik van taaltoetsen vormen een belangrijk onderdeel van de functies van taaltoetsen die we in hoofdstuk 2 hebben besproken. Ook voor het ASO lijkt ons een systeem dat taaltoetsen gebruikt, niet zinvol. We pleiten voor het ASO wel sterk voor de identificatie en de daarmee gepaard gaande extra ondersteuning van doelgroepleerlingen. Als we echter afgaan op het sociale profiel van ASO-opleidingen dat
Hoofdstuk 3: Financiering van doelgroepleerlingen
88 we in 3.4.3 hebben besproken, en dat in verband brengen met de resultaten voor lezen die de diverse SES-groepen in het ASO halen, lijkt een eenvoudige identificering van doelgroepleerlingen op basis van sociale achtergrondkenmerken ons een vrij eenvoudig en efficiënt systeem op te leveren. Bemerk dat als men hier de resultaten op een taaltoets als criterium in zou voeren, men wellicht een grote groep leerlingen in de groep positieven krijgt, voor wie het weliswaar moeilijk is om schoolsucces te behalen, maar die helemaal niet aan de doelgroep van het GOK-beleid beantwoorden. We doelen hier op de groep leerlingen van gemiddelde of hoge sociale herkomst die het op grond van individueel cognitief vermogen moeilijk hebben in het ASO. Aangezien de taaltoets veel meer dan op eerdere meetmomenten het succes meet van het taalonderwijs op school, zal een flink deel van deze leerlingen op de toets onder de norm scoren. Maar door de sociale bias ten voordele van het ASO, zullen zij wel proberen zo lang mogelijk in deze onderwijsvorm te blijven. Het gevolg van deze combinatie van factoren, is dat heel wat middelen die bestemd zijn voor emanciperend onderwijs aan deze groep zullen worden besteed. Daarbij is het dan nog maar de vraag of die middelen voor deze groep veel effect zullen sorteren. We hebben er al vaker op gewezen dat interventies ter bevordering van het schoolsucces van wie het door zijn sociale achtergrond op school moeilijker heeft, niet noodzakelijk ook leerlingen die op grond van individuele kenmerken niet of onvoldoende succesrijk zijn, vooruit helpen. Als men eraan denkt taaltoetsen te gebruiken ter identificering van doelgroepleerlingen van het GOK-beleid, dan kunnen die het best ingezet worden in het TSO. Het TSO heeft een belangrijke rol te spelen in het verminderen van de sociale rekrutering in het ASO en BSO. Het is weinig waarschijnlijk dat het sociale evenwicht in het secundair onderwijs op korte termijn zal verbeteren doordat een substantiële groep leerlingen uit lagere sociale klassen naar het ASO trekken, en een groep leerlingen uit hogere sociale klassen de omgekeerde beweging naar het BSO maken. Veel waarschijnlijker is dat het TSO hier zal fungeren als een scharnieropleiding. Als leerlingen uit lagere sociale klassen beginnen met in grotere getale andere studierichtingen te overwegen dan het BSO, zal hun aandacht in eerste instantie naar het TSO uitgaan. En als leerlingen uit de hogere sociale klassen minder sterk vast blijven houden aan het ASO, zullen ook zij in eerste instantie bepaalde richtingen in het TSO overwegen. Als die beweging zich inzet, is het van belang dat die leerlingen in het TSO in een rijke leeromgeving terechtkomen waar hen de ondersteuning geboden kan worden die ze nodig hebben. Voor leerlingen uit zwakkere sociale milieus betekent dit de ondersteuning om achterstand die het gevolg is van sociale achtergrond weg te werken. Voor leerlingen uit hogere sociale milieus zal dit in vele gevallen betrekking hebben op achterstand die met individuele factoren in verband gebracht kan worden. In elk geval is het nodig dat deze leerlingen geïdentificeerd kunnen worden, en dat de school de mogelijkheid krijgt hen te ondersteunen. Een andere opmerkelijke ontwikkeling in het TSO is dat steeds meer afgestudeerden uit deze richting in het hoger onderwijs terecht komen in allerlei richtingen. In combinatie met de vorige observatie betekent dit dat het TSO leerlingen uit kansarmere milieus een venster biedt op hoger onderwijs, en zo op maatschappelijke emancipatie. Die participatie van leerlingen uit kansarme milieus is natuurlijk als het ware het sluitstuk van een effectief GOK-beleid. Ook om de rol die TSO daarbij kan spelen, is het van belang deze leerlingen te identificeren en te ondersteunen. Hoe een identificering van doelgroepleerlingen bij de overgang naar de 2e graad TSO gebruik zou kunnen maken van taaltoetsen is momenteel niet duidelijk. Aan de ene kant is er weinig bekend over de samenhang tussen sociale achtergrond en schoolsucces in de 2e en 3e graad
Hoofdstuk 3: Financiering van doelgroepleerlingen
89 van het TSO. Ook moet men er rekening mee houden dat alle problemen die we hebben besproken met betrekking tot de bruikbaarheid van taaltoetsen voor de identificering van doelgroepleerlingen, groter worden naarmate de leerling vordert in zijn onderwijsloopbaan. De resultaten op de toetsen zijn nog moeilijk te relateren aan achterstand die sociaal interpreteerbaar is, ook hier weer kunnen de toetsresultaten gebruikt worden voor streamingsdoeleinden. De grootste moeilijkheid is echter dat wij niet zien hoe de resultaten op een taaltoets zouden kunnen leiden naar een effectieve ondersteuning van kansarme leerlingen in de 2e graad TSO. Het is ons bijvoorbeeld niet duidelijk hoe de inschatting die op basis van de toets tot stand komt, zich zou moeten verhouden tot het oordeel dat de klassenraad geveld heeft bij het toekennen van het attest. Als de klassenraad een attest uitreikt dat toegang geeft tot een bepaalde richting in de 2e graad TSO, zijn zij in elk geval van mening dat de leerling die richting aankan. Als zij daarbij enige reserve uitspreken voor een of ander vak, heeft de school al de mogelijkheid om voor dat vak extra ondersteuning te bieden. Het is ons niet duidelijk wat een centrale taaltoets in dit geval extra kan bieden. We denken dan ook dat men op dit punt in de onderwijsloopbaan doelgroepleerlingen op dit moment beter identificeert aan de hand van sociale kenmerken. Of men kiest ervoor om de doelgroepstatus uit het basisonderwijs toch door te laten lopen, eventueel met enige correctie zoals dat ook werd bepleit voor de tussentijdse screening in het basisonderwijs. Wij willen wel aanbevelen dat er onderzoek wordt gedaan naar de relatie tussen taalvaardigheid op dit moment en onderwijssucces in de latere TSO-loopbaan van de leerlingen. Wellicht kan een dergelijke studie bruikbare informatie opleveren om bij het begin van de 2e graad een herijking van de identificering van doelgroepleerlingen door te voeren die niet alleen betrekking hoeft te hebben op valse negatieven. Conclusies • • •
We pleiten ervoor om leerlingen in het BSO allemaal als doelgroepleerlingen te behandelen. In het ASO stellen wij voor om alle leerlingen uit lage sociale klasse als doelgroepleerling te beschouwen Ook in het TSO denken we dat identificering van doelgroepleerlingen het best op sociale gegevens gebaseerd kan worden. We vinden wel dat de speciale positie die het TSO inneemt in het kader van de democratisering van het secundair en hoger onderwijs, wettigt dat er met meer aandacht gekeken wordt naar de taalvaardigheid die leerlingen nodig hebben om zich in TSO te handhaven en door te stromen naar verschillende vormen van hoger onderwijs. Doelgroepleerlingen moeten ondersteund kunnen worden bij de verwerving van die taalvaardigheid.
3.5 Weging van doelgroepleerlingen In het huidige GOK-beleid worden leerlingen niet alleen als doelgroepleerling geïdentificeerd op basis van sociale kenmerken, ze krijgen ook een bepaalde weging mee (zie 3.3). Als het huidige systeem vervangen wordt door een systeem waarin de identificering gebeurt op basis van taaltoetsen, is het evident dat de vraag gesteld moet worden of die taaltoetsen ook een alternatief voor de weging van doelgroepleerlingen op kan leveren. Wij willen deze vraag behandelen op dezelfde wijze als de identificeringsvraag. Eerst kijken we naar de effectiviteit van de huidige wegingspraktijk. Daarna gaan we na of taaltoetsen een effectiever alternatief kunnen bieden. Gegeven de opdracht van het onderzoek en de beperkte onderzoekstijd, kunnen we deze kwestie veel minder grondig behandelen dan de identificeringskwestie.
Hoofdstuk 3: Financiering van doelgroepleerlingen
90 Uit de eerste resultaten van het onderzoek van Reynders et al. (te verschijnen) blijkt duidelijk dat er sprake is van verschillen in schoolse prestaties tussen doelgroepleerlingen met een verschillend gewicht:
GOK-gewicht 0.0 0.4 0.6 0.8 1.0 1.2
Score taal 24.6 20.0 20.0 15.9 18.6 15.3
Score wisk. 28.4 20.7 21.5 16.2 19.0 14.6
Tabel 3.9: Score taal en wiskunde per GOK-gewicht (uit Reynders et al., te verschijnen)
Wat echter opvalt, is dat de verschillen niet netjes lineair geordend zijn. Het is niet zo dat leerlingen met een hoger gewicht gemiddeld lager scoren dan leerlingen met een lager gewicht. Zo te zien lijkt een systeem dat met twee of hoogstens drie verschillende gewichten werkt, beter bij de prestatieverschillen van leerlingen aan te sluiten dan het huidige systeem met vijf gewichten. Een systeem met een beperkt aantal gewichten lijkt ook beter overeen te stemmen met een aantal gekende voorbeelden uit het buitenland. In Nederland werd heel lang met drie gewichten gewerkt. Recent is dat aantal tot twee teruggebracht. Alternatieven voor de huidige manier om gewichten te bepalen zijn niet moeilijk te bedenken. Als men besluit om de identificering van doelgroepleerlingen uit te voeren door middel van taaltoetsen, bieden die toetsen meteen ook een goede basis om een gewichtenregeling uit te werken. Technisch komt het erop neer dat men in een toetsscore niet één cesuur aanbrengt, maar verschillende cesuren. Daar waar die ene hoofdcesuur gebruikt wordt om het onderscheid te maken tussen doelgroepleerlingen en niet-doelgroepleerlingen, dienen de andere om doelgroepleerlingen met verschillende gewichten van elkaar te onderscheiden. Voorwaarde is wel dat de toets goed discrimineert naar beneden toe. Maar zelfs met een goed discriminerende toets is het niet zinvol om teveel cesuren aan te brengen. Wellicht is ook voor het wegen aan de hand van een taaltoets twee à drie gewichten een voldoende aantal. In dit verband is het interessant om erop te wijzen dat een dergelijke weging al voor sommige toetsen is doorgevoerd. De TAL (cf. bijlage 1) werkt met twee cesuren, en weegt dus de leerlingen die als leerling met taalvaardigheidsachterstand worden geïdentificeerd in een groep met matige en grote achterstand. De toetsen van het VLOT-leerlingvolgsysteem en van het Cito-leerlingvolgsysteem werken met vijf verschillende categorieën van scores. De groep laag scorende leerlingen (de leerlingen die geïdentificeerd worden als leerlingen met achterstand) worden daarbij ingedeeld in twee categorieën.
3.6 Identificering van doelgroepleerlingen: gebruik van alternatieve taalkenmerken We hebben in paragraaf 3.4 de mogelijkheden verkend om doelgroepleerlingen te identificeren aan de hand van taaltoetsen. Het beeld van de mogelijkheden dat uit die verkenning naar voren is gekomen, is zeker niet over de hele lijn positief te noemen. In het beste geval zijn we erbij uitgekomen dat taaltoetsen wel een alternatief voor de huidige screeningswijze bieden dat relatief betere inschattingen op kan leveren, maar dat er aan het gebruik ervan steeds ook een aantal gevaren en een praktische bezwaren verbonden waren. Taaltoetsen bieden zeker niet zonder meer een succesformule om doelgroepleerlingen in te schatten. Wat uit de voorgaande bespreking voortkomt, is een genuanceerd beeld van hoe een
Hoofdstuk 3: Financiering van doelgroepleerlingen
91 identificeringssysteem voor doelgroepen zou kunnen werken met gebruikmaking van taaltoetsen en andere gegevens. In onze verkenning van de inzetbaarheid van taaltoetsen zijn we een aantal problemen tegengekomen waarvoor we tot nu toe geen bevredigende oplossing hebben gevonden. Het meest in het oog springt het feit dat in de voorstellen die we hebben geformuleerd, we nog geen suggesties hebben kunnen doen voor de identificering van doelgroepleerlingen in de kleuterschool. Nochtans moet juist voor die groep taal het beste bruikbaar zijn als indicator voor de socio-culturele context waarin de kleuters zijn opgegroeid. Het feit dat we geen alternatieve identificeringsmethode hebben kunnen voorstellen, heeft dus niets te maken met de plaats van taal zelf in dit verband, maar alles met het feit dat deze jonge kinderen niet goed toetsbaar blijken. Het probleem met de inzetbaarheid van taaltoetsen voor deze groep ligt met andere woorden niet bij taal maar bij toetsen. Dit brengt ons ertoe om te verkennen of we taal niet op een andere wijze aan kunnen wenden om doelgroepleerlingen te identificeren. Het idee om taal te betrekken bij de identificatie van doelgroepleerlingen is natuurlijk niet nieuw. In het huidige GOK-beleid wordt thuistaal als een van de indicatoren voor leerbedreiging gehanteerd. Het gebruik van thuistaal in dit verband wordt ondersteund door de uitkomsten van recent wetenschappelijk onderzoek (PISA, De Meyer, Pauly & Van de Poele, 2004). Hun analyse van de PISA 2003-resultaten laat zien dat leerlingen die thuis een ‘andere taal’34 spreken ruim lager scoren op wiskundige geletterdheid dan leerlingen voor wie dat niet het geval is. Een grondiger analyse van deze data laat echter zien dat het criterium thuistaal niet zonder meer met achterstand verbonden kan worden. We hebben eerder al aangegeven dat vooral de studierichting in het secundair onderwijs een belangrijke impact heeft op de schoolprestaties. Als de gegevens uit het PISA 2003-onderzoek opgesplitst worden naar studierichting en feitelijke thuistaal, wordt al snel duidelijk dat er een aantal problemen zijn met de koppeling van thuistaal aan leerbedreigdheid.
Nederlands standaardtaal Nederlands dialect Frans Turks Arabisch
ASO 627 N=1761 637 N=278 586 N=52 534 N=14 516 N=6
TSO 548 N=977 568 N=320 511 N=25 480 N=12 495 N=4
BSO 454 N=579 475 N=181 387 N=14 374 N=36 411 N=11
DBSO 366 N=23 393 N=15
Tabel 3.10: Scores op Wiskunde uit het PISA-onderzoek, per studierichting en thuistaal
Vooreerst blijkt dat de groep leerlingen met een thuistaal die typisch is voor GOK-leerlingen, binnen de verschillende studierichtingen erg klein is. Daarenboven scoort deze kleine groep gemiddeld behoorlijk in vergelijking met de gemiddelde score van de totale groep, zeker als we ook de scores van de laagste sociale groep (zie tabel 3.7) in gedachten houden. Overigens 34
Een andere taal betekent hier een taal die niet het Nederlands, Frans, Duits of een dialect van het Nederlands
is.
Hoofdstuk 3: Financiering van doelgroepleerlingen
92 voegt de toevoeging van thuistaal in de regressie-analyse die in 3.4.3 werd besproken, minder dan 1% verklaarde variantie aan het model toe35. Daarbij moet men er rekening mee houden dat de groepen per moedertaal bijna allemaal te klein zijn om er uitspraken over te doen. De beperkte invloed van thuistaal wordt ook door ander onderzoek bevestigd (cf. probleemverkenning 1). Taal kan echter ook op nog een andere manier gehanteerd worden als indicator voor leerbedreiging. In hoofdstuk 1 hebben we beschreven hoe thuistaal in vele opzichten verschilt van de taal die de school hanteert. Het is precies dit verschil dat het interessant maakte om na te gaan of taalvaardigheid als indicator kon dienen voor de mate waarin het thuismilieu cultureel aansluiting vond bij de school. We hebben dat in het voorgaande vooral gezocht in de relatie tussen prestaties op toetsen schoolse taalvaardigheid en andere schoolprestaties. De redenering hierachter was dat leerlingen die thuis taal op een andere wijze gebruiken, daar niet het soort taalvaardigheid verwerven dat ze op school nodig hebben. In feite stellen we daarbij de kwalitatieve verschillen tussen het taalgebruik op twee domeinen – school en thuis – voor als verschil in kwantiteit van schooltaal. Die voorstelling van zaken bleek adequaat te zijn voor ons doel zolang die kwantiteit aan schooltaal niet door andere factoren werd bepaald. We hebben gezien dat in de mate dat die kwantiteit van schooltaal een effect werd van succesrijk onderwijs, het moeilijker werd om schoolse taalvaardigheid te interpreteren als indicator voor sociaal bepaalde leerbedreigdheid. De verbinding van de verschillen tussen schooltaal en thuistaal met de kwantiteit aan schooltaal die een leerling beheerst, zou ons bijna doen vergeten dat die verschillen ook in kaart gebracht kunnen worden door een beeld te schetsten van de manier waarop de leerling thuis met taal omgaat. Het idee hierbij is dat iedereen wel met taal omgaat op de typische thuistaalwijze, maar dat bepaalde sociale groepen daarbovenop ook hun kinderen voorbereiden op de schoolse omgang met taal door tijdens de opvoeding ook die manier van taalgebruik te introduceren. Zij trekken de aandacht van hun kinderen op correctheid van taal, ze expliciteren talig wat ze doen, ook als dat voor de communicatie niet nodig is, ze introduceren geschreven teksten door voor te lezen, enzovoort. Daardoor leren hun kinderen die schoolse taal al beter gebruiken, en scoren ze hoger op een toets schoolse taalvaardigheid bij intrede in het schoolsysteem. Dit verschil in taalgedrag tussen sociale groepen kan echter ook in kaart gebracht worden door na te gaan hoe in de thuissituatie met taal wordt omgegaan. Het idee daarbij is dat kinderen uit milieus waar bijna exclusief in die informele thuistaalwijze talig wordt gehandeld, minder goed op het functioneren op school zijn voorbereid. De manier waarop thuis met taal wordt omgegaan wordt dan niet met een toets maar met een enquête geregistreerd. De informatie hoeft daarbij niet door het kind geleverd te worden, maar kan ook afkomstig zijn van de ouders of van iemand die het kind in zijn contact met zijn ouders heeft geobserveerd. Op die wijze kunnen de problemen die het gebruik van tests met zich meebrengen, worden omzeild. Daarbij bedoelen we niet alleen de problemen die ontstaan door de beperkte toetsbaarheid van jonge kinderen, maar ook zaken als het backwash-effect van tests en het misbruik van testresultaten voor homogeniseringsdoeleinden. Met het gebruik van dit type informatie kunnen we ook afgeraken van het probleem dat tests niet alleen verschillen in schoolse taalvaardigheid registreren die het gevolg zijn van andere factoren dan sociale kansarmoede. Vooral als het instrument peilt naar subtiele en vaak onbewuste aspecten van taalgebruik, kan het zeer goede diensten bewijzen. In theorie is een identificatie 35
Thuistaal werd toegevoegd als dichotome variabele die 0 gaf voor Nederlands en Nederlands dialect, en 1 voor alle andere talen.
Hoofdstuk 3: Financiering van doelgroepleerlingen
93 van leerbedreigden op basis van informatie over hoe taal in de thuissituatie gebruikt wordt, te verkiezen boven informatie over de mate van beheersing van de schooltaalvaardigheid die met een toets verkregen wordt. Het probleem is echter dat het helemaal niet duidelijk is hoe die theorie in de praktijk gebracht kan worden. We weten niet hoe die relevante informatie over verschillen in taalgebruik op een eenvoudige en kosteneffectieve wijze verzameld kan worden. Internationaal zijn er van een dergelijk screeningsinstrument geen echte goede voorbeelden. In Australië en Groot-Brittannië wordt voor screening vaker gewerkt met vragenlijsten over taalgebruik van het kind die door de ouders moeten worden ingevuld36. Het gaat hierbij echter meestal om instrumenten die op een andere wijze proberen de taalontwikkeling van het kind in kaart te brengen. Ze gaan niet of slechts in zeer beperkte mate over de wijze waarop taal thuis gebruikt wordt. Dit gebrek aan ervaring met deze manier van screening betekent zonder meer dat het niet realistisch is te geloven dat taalgebruiksgegevens op korte tijd de plaats van toetsen in de screeningpraktijk in zullen nemen. Toch denken wij dat het perspectief te veelbelovend is om er niets mee aan te vangen. Daarom adviseren wij dat naast de uitwerking van screening zoals in de vorige paragrafen besproken werd, er ook een ontwikkelingsgericht onderzoeksproject opgezet zou worden waarin nagegaan wordt hoe dit taalgebruiksperspectief met het oog op het identificeren van doelgroepleerlingen uitgewerkt zou kunnen worden. Wij suggereren hierbij dat dit project zich in eerste instantie zou richten op de mogelijkheden om deze screeningstechniek te gebruiken voor de identificering van doelgroepleerlingen in de kleuterklas. In afwachting van de resultaten van dit onderzoek adviseren wij doelgroepleerlingen in de kleuterschool te blijven identificeren aan de hand van sociale kenmerken. Mocht blijken dat de onderzochte screeningsmethode ook in de praktijk werkt, dan kan gekeken worden naar de wijze waarop ze kan worden uitgebreid naar andere momenten in het onderwijsproces. Conclusies •
•
•
We stellen voor een project op te zetten waarin nagegaan wordt of identificering van doelgroepleerlingen plaats kan vinden door gebruik te maken van gegevens over taalgebruik in de thuissituatie. We stellen voor dat dat onderzoek in eerste instantie gericht wordt op de aanwending van die methode voor de identificering van doelgroepleerlingen in het kleuteronderwijs. Indien de werkwijze succesvol blijkt, moet worden onderzocht hoe ze kan worden toegepast op andere momenten die belangrijk zijn voor de identificatie van doelgroepleerlingen.
36
Het instrument dat hiervoor in Engeland (en andere landen) wordt gebruikt, De MacArthur CDI-schalen (Fenson et al, 1993, 2000), werd in het Nederlands vertaald en voor Vlaanderen geijkt (de N-CDI’s, cf. Zink & Lejaegere, 2002).
Hoofdstuk 3: Financiering van doelgroepleerlingen
94
4 Hoofdstuk 4: Beleidsscenario’s Op basis van de conclusies uit de vorige hoofdstukken, proberen we in dit hoofdstuk mogelijke scenario’s uit te tekenen voor de inzet van taaltoetsen in het onderwijs in Vlaanderen ter verbetering van het leersucces van leerbedreigde leerlingen. We hebben ervoor gekozen om de mogelijke scenario’s incrementeel op te bouwen: we beginnen met de inzet van die taaltoetsen die uit de verkenning in de vorige hoofdstukken als meest essentieel naar voren zijn gekomen. We bespreken bij die toets de uitwerkings- en invoeringsmodaliteiten, de mogelijkheden en gevaren die de introductie van de toets met zich mee brengt, en de omkaderende maatregelen die nodig zijn om de meerwaarde van de toets voor emanciperend onderwijs te garanderen. Daarna bespreken we de toevoeging van de inzet van taaltoetsen die volgens ons in tweede instantie het meest aan de effectiviteit van emanciperend onderwijs bijdraagt. Zo gaan we verder tot alle door ons zinvol geachte inbreng van toetsen besproken is. Toetsen of toetspraktijken waarover in de voorgaande hoofdstukken is geconcludeerd dat ze niet zinvol zijn, worden niet in de scenario’s opgenomen. Stap 1 moet hierbij gezien worden als een vorm van een nulstap, waarbij het huidige systeem van gegevensverzameling wordt geoptimaliseerd. Vanaf stap 2 doet de inzet van taaltoetsen haar intrede.
Stap 1:
Identificatie van doelgroepleerling
Opsporen van leerlingen voor wie de school meer inspanningen moet leveren om met hen de gestelde doelen te bereiken. Typering inzet taalgegevens: Informatie over thuistaal, in combinatie met gegevens over de socio-culturele achtergrond van leerlingen. Effect: De school heeft de middelen om zijn onderwijs aan te passen aan zijn leerlingpopulatie. Moment van afname: Verzamelen van socio-culturele achtergrondgegevens: vanaf begin kleuterschool (en doorheen de rest van het onderwijs) Flankerende aandachtspunten en maatregelen: • Thuistaal wordt gehanteerd als indicator voor leerbedreigdheid, niet als oorzaak ervan. Het verzamelen van thuistaalgegevens in deze context mag er niet toe leiden dat de school de ouders culpabiliseert. • Verhogen van de betrouwbaarheid van de verzamelde gegevens. Bruikbaarheid van bestaande instrumenten: De overheid verzamelt nu reeds veel van deze gegevens. Wellicht kan die verzamelwijze verfijnd worden, en kan beter op fraude worden gecontroleerd (zie resultaten van het LOA-onderzoek). Praktische uitvoering: • Monitoring van bestaande werkwijze. • Verspreiding van correcte informatie over gebruik van thuistaal in dit verband. Kostprijs: n.v.t. Functie:
Hoofdstuk 4: Beleidsscenario’s
95 Stap 2:
Invoering van eindtoetsen op eindtermmomenten: BaO, 1ste graad SO
Diagnose op schoolniveau. Screening en diagnose op systeemniveau. Typering inzet taalgegevens: Het gaat hier om een soort periodieke peiling, die de school in staat moet stellen om na te gaan of ze met haar leerlingen de eindtermen bereikt. Het gaat hier om een directe toets van schoolse taalvaardigheid, evt. gecombineerd met een indirecte integratieve toets. Deze toetsing kan om de twee of drie jaar worden georganiseerd, en worden afgewisseld met het toetsen van eindtermen op andere terreinen dan Nederlands. Effect: De toets moet de school in staat stellen om het rendement van haar aanpak van doelgroepleerlingen te evalueren. Als blijkt dat een belangrijk deel van de leerlingen de eindtermen niet haalt, dient de school na te gaan wat ze aan haar aanpak kan veranderen om dat rendement te verhogen. Moment van afname: Het meest ligt hier het einde van de basisschool voor de hand. Ook na de eerste graad van het secundair onderwijs is een dergelijke toets wenselijk, zeker voor het terugdringen van de ongekwalificeerde uitstroom, maar hier moet sterk aan flankerende maatregelen gewerkt worden die ongewenste neveneffecten (o.a. streaming, herhomogenisering) tegengaan of voorkomen. Flankerende aandachtspunten en maatregelen: • Een dergelijke toets is slechts rendabel in de mate dat een school in staat is om een evaluatie van de eigen aanpak van taal door te voeren. Hiervoor zal de school instrumenten en ondersteuning ter hand gesteld moeten worden. • Om redenen aangehaald in hoofdstuk 2 moeten deze toetsresultaten niet gebruikt worden voor de uitwerking van een publiek accountability systeem. Van de andere kant kunnen ze wel de basis vormen voor de uitwerking van de voorwaardelijkheid in de financiering. Daarbij kan de inspectie een belangrijke rol spelen. De inspectie kan nagaan of de school de toets correct heeft afgenomen, of een school met een zwakke score een adequate evaluatie van de eigen aanpak heeft uitgevoerd, en daaruit de nodige consequenties heeft getrokken. • De taaltoets heeft hier vooral een functie van indicator van rendement met doelgroepleerlingen. De diagnose kan zich hier dan ook niet beperken tot de wijze waarop met de opbouw van de taalvaardigheid van de leerlingen wordt omgegaan, maar dient betrekking te hebben op wat de school doet om de doelgroepleerlingen tot leren te brengen. • Bij invoering van een dergelijke toets op scharniermomenten bestaat het gevaar dat de resultaten ervan op individueel niveau gebruikt worden voor de streaming van leerlingen naar bepaalde afdelingen. Dit zou kunnen betekenen dat achterstandsleerlingen het blijvend moeilijk hebben om naar het ASO door te stromen, of in het ASO te blijven. Daarom moet de invoering van een dergelijke toets gepaard gaan met de intensivering van de doelgroepwerking op de middelbare scholen. • De toetsresultaten worden niet overgedragen aan het volgende onderwijsniveau. Of, als ze worden overgedragen moet er voor worden gezorgd dat ze niet als basis dienen voor individuele streaming en remediëring. Ze kunnen wel dienen als inputgegevens voor de uitwerking van een taalbeleidsplan in dit onderwijsniveau (zie ook stap 7). Functie:
Hoofdstuk 4: Beleidsscenario’s
96 Bruikbaarheid van bestaande instrumenten: • Voor eind basisonderwijs: periodieke peilingen. • Voor secundair onderwijs: periodieke peilingen (momenteel nog niet voor het Nederlands beschikbaar, maar dat is gepland (staat om die reden NIET in het overzicht). Er is ook hier sprake om parallelversies te ontwikkelen. • Voor einde 1e jaar/begin 2e jaar: TIST (geënt op eindtermen 2e jaar): screening en diagnose op leerlingniveau (via cesuur en normen) voor lezen, luisteren en schrijven! vrij volledige toets • Voor einde onthaalklas anderstalige nieuwkomers: TASAN: diagnose op leerlingniveau • In Nederland bestaat na het 2e jaar de Adviestoets (Cito), die kernvaardigheden toetst waaronder Nederlands, maar enkel lezen en woordenschat: screening op leerlingniveau (verschillende versies voor vmbo, havo en vwo). Daarnaast ook Dia-taal (Etoc): deze adaptieve toets bevat online toetsen voor woordenschat en leesvaardigheid: screening en diagnose Praktische uitvoering: • Eind basisonderwijs: Aan de periodieke peilingsonderzoeken die de overheid nu reeds uit laat voeren, kan een luik worden vastgehangen. Voor de peilingsonderzoeken schoolse taalvaardigheid wordt naast de peilingstoets ook een parallelle versie ontwikkeld, die aan de scholen ter beschikking wordt gesteld. De scholen worden zelf verantwoordelijk gemaakt voor de afname van die versie, en voor de opvolging die ze aan de resultaten geven. De inspectie controleert de kwaliteit van de afname en de opvolging die aan de resultaten werd gegeven. Hierbij kan ook gedacht worden aan een schoolfeedbacksysteem waarbij de school haar resultaten kan vergelijken met de resultaten van scholen met een gelijkaardige instroom of opererend in een gelijkaardige context. Het invoeren van een schoolfeedbacksysteem veronderstelt het opstellen en hanteren van een correcte deontologie voor de individuele school en over de scholen heen. • Voor de eerste graad secundair kan op dezelfde wijze gewerkt worden. Voor het BVL staan momenteel geen peilingsopdrachten op het programma. De TIST is wel ook genormeerd (en cesuur bepaald) voor Aén B-stroom. • In Nederland is er drempelonderzoek 678 voor het vmbo (vergelijkbaar met BVL) dat voor de onderbouw (1e graad) spelling, woordenschat en begrijpend lezen meet: screening op leerlingniveau, wordt meestal aan het begin van het SO gebruikt, maar kan ook op het einde. Scores worden omgezet naar DLE’s (didactische leeftijdsequivalenten). • Voor de eerste graad ASO (TSO?) dient een evaluatie van de werking gemaakt te worden op grond van het sociaal profiel van de instromende leerlingen in vergelijking met het sociale profiel van de leerlingen in de buurt waaruit de school rekruteert. Bij deze analyse kunnen best geen gegevens uit taaltoetsen worden betrokken. • Algemeen: er zijn veel meer toetsen (met name in NL) voor instroom en oriëntering in het begin van SO beschikbaar dan aan het eind van de 1e graad. Kostprijs: • Ontwikkeling van parallelle toetsen PPON.
Hoofdstuk 4: Beleidsscenario’s
97 • • • • •
Ontwikkeling van toets BVL. Ontwikkeling van diagnosewijzer t.b.v. begeleiding. Scholing van begeleiding in het begeleiden van het diagnoseproces. Uitwerken van aangepast doorlichtingsinstrument inspectie. Uitwerken van schoolfeedbacksysteem
Stap 3: Identificatie van doelgroepleerlingen: inzet van toetsgegevens schoolse taalvaardigheid einde kleuterschool/begin lager onderwijs Functie: Verfijning van de identificatie van doelgroepleerlingen. Typering inzet taalgegevens: Afname van een toets schoolse taalvaardigheid Effect: Het aantal valse negatieven en valse positieven bij de toewijzing van GOKmiddelen daalt. Moment van uitvoering: Derde kleuterklas. Flankerende aandachtspunten en maatregelen: • De toetsgegevens dienen te worden verzameld door personen die onafhankelijk zijn van de school. • De toetsgegevens dienen te worden gecombineerd met socio-economische indicatoren, zeker in een eerste fase. • Voor deze meting wordt het best een directe toets van een (deel)taalvaardigheid gebruikt. Gedacht wordt vooral aan een integratieve toets die begrip toetst van functioneel taalgebruik. • Om ongewenste backwash-effecten tegen te gaan kan best niet elk jaar hetzelfde toetstype worden gebruikt. Bruikbaarheid van bestaande instrumenten: Er zijn in Vlaanderen en Nederland wel toetsen van dit type op de markt (TAL, TALK, KOBI-TV). Om de objectiviteit van de resultaten te garanderen kan van deze toetsen echter geen gebruik worden gemaakt. Voor dit doel moet elk jaar een nieuwe toets worden ontwikkeld. Praktische uitvoering: • Ontwikkeling van instrument. • Verzamelen van de data. • Administratieve en inhoudelijke verwerking van de gegevens. Kostprijs: +/- € 1.310.000.
Stap 4: Identificatie van doelgroepleerlingen: inzet van taalgebruiksgegevens Functie: Verfijning van de identificatie van doelgroepleerlingen Typering inzet taalgegevens: Verzamelen van gegevens over taalgebruik Effect: Het aantal valse negatieven en valse positieven bij de toewijzing van GOKmiddelen daalt. Moment van uitvoering: Begin kleuterschool. Flankerende aandachtspunten en maatregelen: • Het uitwerking van een screeningssysteem waarbij taalgebruiksgegevens worden ingezet, ligt op theoretische gronden erg voor de hand. Momenteel is er echter weinig ervaring mee; ook wetenschappelijk (effect)onderzoek ontbreekt. We bevelen aan dat een ontwikkelingsgericht onderzoeksproject wordt opgezet om een dergelijk screeningsinstrument uit te werken.
Hoofdstuk 4: Beleidsscenario’s
98 Als de overheid ervoor zou kiezen om meer aandacht te geven aan remediëring van individuele achterstanden, verdient het aanbeveling deze actie als stap 2 uit te voeren. Bruikbaarheid van bestaande instrumenten: Nihil. Praktische uitvoering: • ontwikkeling van instrument. • administratieve verwerking van de gegevens. • uitwerking van een controlemechanisme op fraude. Kostprijs: 3 jaar x +/-€ 200.000 per jaar. •
Stap 5:
Invoering van eindtoetsen op eindtermmomenten: einde SO
Diagnose op schoolniveau. Screening en diagnose op systeemniveau. Typering inzet taalgegevens: Het gaat hier om een soort periodieke peiling, die de school in staat moet stellen om na te gaan of ze met haar leerlingen de eindtermen bereikt. Het gaat hier om een directe toets van schoolse taalvaardigheid, gecombineerd met een indirecte integratieve toets. Deze toetsing kan om de twee of drie jaar worden georganiseerd, en worden afgewisseld met het toetsen van eindtermen op andere terreinen dan Nederlands. Effect: De toets moet de school in staat stellen om het rendement van haar aanpak van doelgroepleerlingen te evalueren. Als blijkt dat een belangrijk deel van de leerlingen de eindtermen niet haalt, dient de school na te gaan wat ze aan haar aanpak kan veranderen om dat rendement te verhogen. Moment van afname: Eind secundair onderwijs Flankerende aandachtspunten en maatregelen: • Een dergelijke toets is slechts rendabel in de mate dat een school in staat is om een evaluatie (diagnose) van de eigen aanpak van taal door te voeren. Hiervoor zal de school instrumenten en ondersteuning ter hand gesteld moeten worden. • Om redenen aangehaald in hoofdstuk 2 moeten deze toetsresultaten niet gebruikt worden voor de uitwerking van een publiek accountability systeem. Van de andere kant kunnen ze wel de basis vormen voor de uitwerking van de voorwaardelijkheid in de financiering. Daarbij kan de inspectie een belangrijke rol spelen. De inspectie kan nagaan of de school de toets correct heeft afgenomen, of een school met een zwakke score een adequate evaluatie van de eigen aanpak heeft uitgevoerd, en daaruit de nodige consequenties heeft getrokken. Bruikbaarheid van bestaande instrumenten: In Vlaanderen zijn geen centraal beschikbare toetsen beschikbaar voor einde SO. In Nederland haast ook niet (Dia-taal bestrijkt enkel de eerste vier jaren). In Nederland bestaat het centrale examen (voor Nederland alleen voor lezen (havo/vwo) en lezen en schrijven (vmbo). Voor het vmbo is er ook een schoolexamen kijk- en luistervaardigheid op het einde van het traject. Daarnaast bestaat de voortgangstoetsen leesvaardigheid voor havo en vwo (NIET voor vmbo) die zich richten op eindtermen van de bovenbouw in Nederland. Er zijn ook dictee- en spellingstoetsen beschikbaar in Nederland die doorheen het hele secundair onderwijs (dus eventueel ook op het einde) kunnen worden gebruikt, maar die meten enkel een heel beperkt facet van taalvaardigheid. Alle normeringen gelden uitsluitend voor Nederland. Functie:
Hoofdstuk 4: Beleidsscenario’s
99 Praktische uitvoering en kostprijs: zie stap 2
Stap 6:
Invoering van begintoetsen op sleutelmomenten: basisonderwijs
Functie: Verfijning van de diagnose op schoolniveau. Inzet taalgegevens: Taaltoets bij het begin van een onderwijsniveau. Effect: De school wordt in staat gesteld om niet alleen te vergelijken met een beeld van het algemene rendement van het onderwijs, maar ook met het eigen beginniveau. Door het gebruik van deze toetsen kan de school ook snel reageren op een veranderende instroom. Moment van afname: Derde kleuterklas, begin lager onderwijs. Flankerende aandachtspunten en maatregelen: • Deze stap kan op twee manieren gezet worden. Als de overheid heeft besloten om stap 3 te nemen, kunnen de data van die toets aan de school ter beschikking gesteld worden, en kan de school die resultaten gebruiken voor de hier beschreven functie. In het andere geval kan de school gebruik maken van bestaande instrumenten. De instrumenten die werden ontwikkeld in het kader van stap 3, kunnen na gebruik ook aan de scholen ter beschikking worden gesteld. • Als de scores van de identificeringstoets uit stap 3 aan de school worden doorgegeven, dient dat betrekking te hebben op het schoolniveau, en niet op het individuele leerlingniveau. Bruikbaarheid van bestaande instrumenten: Toetsen van het type TAL, Cito-LVS (tekstbegrip, kritisch luisteren...). Praktische uitwerking: • Bij de verwerking van de gegevens uit stap 3 wordt een schoolprofiel opgemaakt. Dat profiel bevat het gemiddelde instapniveau van leerlingen in de lagere school, de heterogeniteit en het culturele profiel van de instromende populatie. De school kan die gegevens gebruiken om haar instappende publiek te vergelijken met dat van andere scholen (cf. het bovenvermelde schoolfeedbacksysteem). • Als de school zelf de beginsituatie vastlegt, kan ze gebruik maken van bestaande instrumenten. Kostprijs: p.m.
Stap 7:
Invoering van toets begin BSO
Screening op leerlingniveau. Diagnose op schoolniveau. Inzet taalgegevens: Toets algemene taalvaardigheid, in het bijzonder lees- en schrijfvaardigheid. Effect: De school krijgt zicht op de leerlingen die de school dreigen te verlaten zonder de noodzakelijke minimale geletterdheid. Moment van afname: Eind BVL, begin 2e graad BSO Flankerende aandachtspunten en maatregelen: • Aan leerlingen waarvan blijkt dat ze tot de groep behoren die het risico loopt het onderwijs te verlaten zonder de minimaal noodzakelijk geachte Functie:
Hoofdstuk 4: Beleidsscenario’s
100 functionele geletterdheid, moet een intensief, aangepast geletterdheidsprogramma worden aangeboden. Dit programma moet worden uitgewerkt en geïmplementeerd. • Het aanbieden van het programma moet voor scholen met deze leerlingen uit deze groep een aspect van de voorwaardelijkheid van financiering zijn. • Scholen waarvoor blijkt dat de risicogroep laaggeletterden groot blijft in verhouding tot hun instroom, dienen hier aantoonbaar rekening mee te houden bij de diagnose en aanpak van hun onderwijs Nederlands in de eerste twee jaar. • De toets kan worden geïntegreerd met de toets voor het BVL in stap 2. Bruikbaarheid van bestaande instrumenten: zie ook boven bij stap 2, in Vlaanderen kan TIST bruikbaar zijn, cesuur en normen werden bepaald voor A en B stroom, schrijfvaardigheid wordt hier ook in kaart gebracht. In Nederland bestaat Diataal voor leesvaardigheid dat o.a. op het einde van het 2e jaar kan worden gebruikt. Daarnaast bestaan de volgtoets (eind 1e jaar) en de adviestoets (eind 2e jaar) waarin lezen is opgenomen en die ook versies bevat voor vmbo (BSO bij ons). Ook het drempelonderzoek 678 wordt in het vmbo gebruikt. Ten slotte kan ook de Nederlandse toelatingsproef ingezet worden. Praktische uitwerking: • De toets kan door de scholen zelf worden afgenomen en verwerkt. De ontwikkeling ervan dient centraal te gebeuren. • Er dient een interventieprogramma geletterdheid voor deze groep te worden ontwikkeld. Gezien het probleem waarop deze stap een antwoord probeert te zijn, kan dit interventieprogramma waarschijnlijk samen met Nederland worden ontwikkeld. • Voor de implementatie van het interventieprogramma moet intensieve scholing van leerkrachten worden voorzien. Kostprijs: • Ontwikkeling van de toets: eenmalig € 100.000 • Uitwerking van het interventie-instrument: eenmalig € 200.000 (in het geval Vlaanderen dit alleen aanpakt) • Implementatie: eenmalig € 100.000
Stap 8:
Invoering van begintoets op sleutelmomenten: secundair onderwijs
Functie: Verfijning van de diagnose op schoolniveau. Inzet taalgegevens: Taaltoets bij het begin van een onderwijsniveau. Effect: De school wordt in staat gesteld om niet alleen te vergelijken met een beeld van het algemene rendement van het onderwijs, maar ook met het eigen beginniveau. Door het gebruik van deze toetsen kan de school ook snel reageren op een veranderende instroom. Moment van afname: Begin secundair onderwijs. Flankerende aandachtspunten en maatregelen: Voor deze stap kan gebruik gemaakt worden van de overdracht van toetsgegevens uit stap 2. Wanneer die overdracht plaatsvindt, moet men ervoor zorgen dat de mogelijke negatieve effecten van de overdracht van de toetsgegevens (streaming, ongewenste selectie) worden vermeden.
Hoofdstuk 4: Beleidsscenario’s
101 Bruikbaarheid van bestaande instrumenten: Hiervoor zijn vrij veel toetsen beschikbaar, meestal om op leerlingniveau te gebruiken. In Vlaanderen bestaan TAS en TASAN (deze laatste voor ex-anderstalige nieuwkomers). TASAN doet eerste aanzetten tot diagnostiek op leerlingniveau. Daarnaast bestaan de Dicteetoetsen van Dudal, af te nemen op einde 6e leerjaar of begin 1e jaar SO en met normering voor richtingen binnen A en B stroom. In Nederland zijn een aantal toetsen beschikbaar die slechts beperkte facetten van taalvaardigheid in het Nederlands toetsen: ofwel gericht op lezen (begrijpend leestoetsen van Aarnoutse, Dia-tekst in Dia-taal), technisch lezen (De Klepel, één-minuut test), woordenschat (Dia-woord in Dia-taal) of spelling (PI signaleringsdictee). Soms ook een aantal van deze facetten samen (drempel 678: spelling, woordenschat, begrijpend lezen, entreetoets VO: begrijpend lezen, woordenschat). De Nederlandse toetsen zijn allen bedoeld voor screening (en aanzet tot diagnose) op leerlingniveau. Praktische uitwerking: • Bij de verwerking van de gegevens uit stap 2 wordt een schoolprofiel opgemaakt. Dat profiel bevat het gemiddelde instapniveau van leerlingen in de middelbare school, de heterogeniteit en het culturele profiel van de instromende populatie. De school kan die gegevens gebruiken om haar instappende publiek te vergelijken met dat van andere scholen. • Als de school zelf de beginsituatie vastlegt, kan ze gebruik maken van bestaande instrumenten. Kostprijs: p.m.
Stap 9:
Invoering tussentijdse toets basisonderwijs
Screening op leerlingniveau. Diagnose op schoolniveau. Typering inzet taalgegevens: Curriculumafhankelijke vorderingstoets(en). Effect: Verfijndere screening en opvolging op leerling-/schoolniveau. De school wordt in staat gesteld om de groei van de leerlingen op te volgen, en deze gegevens te gebruiken om te reflecteren over de kwaliteit van het aangeboden onderwijs. Moment van afname: Eind derde leerjaar. Flankerende aandachtspunten en maatregelen: • In hoofdstuk 2 hebben we erop gewezen dat er in grote lijnen twee didactische benaderingen van emanciperend taalonderwijs mogelijk zijn. Hoewel binnen elke hoofdrichting grote verschillen in curricula kunnen voorkomen, achten we het mogelijk om voor elke richting op het eind van het derde leerjaar een relevant tussenniveau in kaart te brengen. De school moet wel de mogelijkheid blijven behouden om aan te geven in welke mate beide toetsen al dan niet aansluiten bij het curriculum dat ze volgt. Aangezien curricula in Vlaanderen meestal door de koepels worden vastgelegd, kan men hier ook denken aan een motivatie per scholengroep. • De resultaten van de toets dienen betrokken te worden bij de diagnose op schoolniveau (zie stap 2). • De resultaten dienen ook aanleiding te geven tot extra aandacht voor leerlingen die niet de gewenste evolutie laten zien. Die aandacht moet aansluiten bij de gekozen didactiek. De toets mag geen aanleiding geven tot zittenblijven. Functie:
Hoofdstuk 4: Beleidsscenario’s
102 Scholen die goed gebruik maken van een (geschikt) leerlingvolgsysteem, krijgen deze informatie via dat systeem. Als men een centraal instrument ontwikkelt, kan men het bereikte niveau beter in verband brengen met het begin- en eindniveau waardoor de school gekenmerkt wordt. • De mogelijkheid bestaat ook om hier een curriculumonafhankelijke toets in te voeren. Die toets kan dan worden gebruikt voor de herijking van de inschatting van leerbedreigdheid. Als de toets ook die functie moet vervullen, moeten er andere eisen gesteld worden aan de ontwikkeling en de afname van de toets. Dit heeft vooral zijn repercussies voor de afname van de toets en voor de kostprijs van het geheel. Een toets die die functie vervult, kan ook nog steeds gebruikt worden voor de functie diagnose op schoolniveau. Daarvoor is vereist dat de centrale instantie die instaat voor de verwerking van de toets, de gegevens overdraagt aan de school op de wijze die al in stap 6 werd beschreven. • De inspectie dient bovenstaande aspecten bij haar doorlichting van de school te bekijken. Bruikbaarheid van bestaande instrumenten: er zijn heel wat toetsen in omloop die deze functie althans voor een deel kunnen vervullen. Het grootste probleem met deze toetsen is dat het moeilijk is om de uitkomsten ervan op een betrouwbare en valide manier in verband te brengen met het geconstateerde begin- en eindniveau. Kostprijs: • Als men besluit dat de scholen hiervoor best bestaande instrumenten inzetten: p.m. • Als alleen de functie diagnose op schoolniveau beoogd wordt, maar men een instrument wil dat goed aan het centraal geconstateerde begin en eindniveau kan worden gelinkt: eenmalig +/- € 100.000. • Als ook identificering en financiering van doelgroepleerlingen beoogd wordt: +/- € 1.000.000 per jaar. •
Stap 10:
Invoering van LVS voor taal in het basisonderwijs
Functie: Screening en diagnose op leerlingniveau. Typering inzet taalgegevens: Inzet van samenhangende set curriculumafhankelijke toetsen. Effect: De school beschikt binnen de rationale van de door haar gekozen didactiek over instrumenten om uitvallende leerlingen snel te identificeren en te diagnosticeren. Moment van uitvoering: Doorheen het basisonderwijs. Flankerende aandachtspunten en maatregelen: • Het gebruik van een LVS is vaak curriculumgebonden. Een dergelijk systeem kan daarom niet centraal ontwikkeld worden. De overheid kan hoogstens het gebruik van een systeem stimuleren. Zelfs het verplicht stellen van het gebruik van een dergelijk systeem is riskant, omdat moeilijk een set van criteria aan te geven valt waaraan een systeem zou moeten voldoen. • De invoering van een LVS maakt stap 6 wellicht overbodig. Het kan echter geen vervanging bieden voor stappen 2 en 4. Bruikbaarheid van bestaande instrumenten: Cito-LVS, VLOT, LVS voor Vlaanderen (vervlaamste versie van Cito-LVS). Kostprijs: p.m. Hoofdstuk 4: Beleidsscenario’s
103
Referenties37 ACEI, (1991). On Standardized Testing: A Position Paper of the Association for Childhood Education International. In: Childhood Education, 130-142. Alderson, J., (2000). Assessing reading. Cambridge: Cambridge University Press. Appel, R. & A. Vermeer, (1994). Tweede-taalverwerving en tweede-taalonderwijs. Bussum: Dick Coutinho. Atkinson, P., (1985). Language, Structure and Reproduction: an Introduction to the sociology of Basil Bernstein. London: Methuen. Bachman, L., (1990). Fundamental considerations in language testing. New York. Bachman, L., (2002). Some reflections on task-based language performance assessment. In: Language Testing, 19. 453-476. Bachman, L. & A. Palmer, (1996). Language testing in practice. New York: Oxford University Press. Belsito, L., B. A. Ryan, & K. Brophy, (2005). Using behavioral and academic indicators in the classroom to screen for at-risk status. In: Psychology in the Schools, 42. 151-158. Berglund, E. & M. Eriksson, (2000). Reliability and content validity of a new instrument for assessment of communicative skills and language abilities in young Swedish children. In: Logopedics Phoniatrics Vocology, 25. 176-185. Bijslma, B., (2004). Het kiezen van een kindvolgsysteem. Leeuwarden: Partoer. Blok, H. & K. de Glopper, (1992). Large-scale writing assessment. In: L. Verhoeven & J.H.A.L. De Jong (eds.), The Construct of Language Proficiency: Applications of Psychological Models to Language Assessment. Amsterdam: John Benjamins Publishing Company, 101-111. Blommaert, J. & P. Van Avermaet, (2006). Wiens Nederlands? Over taalnaïviteit in het beleid. In: Sampol, 13. Boes, A. & K. Both, (2001). Een streep door de eindtoets. Valthe: Netwerk SOVO. Bogaert, N, (1998). Kennisverwerving en taal: de puntjes op de i. In: Handboek leerlingenbegeleiding, 109-142. Bohnenn, E, C. Ceulemans, C. van de Guchte, J. Kurvers, & T. Van Tendeloo, (2004). Laaggeletterd in de Lage Landen. Hoge prioriteit voor beleid. Den Haag: Nederlandse Taalunie. Bordignon, C. M. & T. C. M. Lam, (2004). The early assessment conundrum: Lessons from the past, implications for the future. In: Psychology in the Schools, 41. 737-749. 37
In deze lijst staan geen referenties van toetsen die zijn opgenomen in bijlage 1.
Referenties
104 Bosker, R., A. Béguin, & L. Rekers-Mombarg, (2001). Hoe meten we de prestaties van een school? In: A.B. Dijkstra, S. Karsten, R. Veenstra, & A. J. Visscher (eds.), Het oog der natie: scholen op rapport. Standaarden voor de publicatie van schoolprestaties. Assen: Van Gorcum, 121-135. Bowey, J.A., (1995). Socioeconomic status differences in preschool phonological sensivity and first-grade reading achievement. In: Journal of Educational Psychology, 87. 476487. Brown, J. & T. Hudson, (1998). Alternatives in language assessment. In: TESOL Quarterly, 32. 653-675. Bultynck, K., (2004). Wie A zegt, moet ook B zeggen. Breder Evalueren. In: Les, 129. 21-24. Catts, H.W., M. Fey, X. Zhang, & J.B. Tomblin, (2001). Estimating the Risk of Future Reading Difficulties in Kindergarten Children: A Research-Based Model and Its Clinical Implementation. In: Language, Speech, and Hearing Services in Schools, 32. 38-50. Catts, H.W., M. E. Fey, J.B. Tomblin, & X. Zhang, (2002). A Longitudinal Investigation of Reading Outcomes in Children With Language Impairments. In: Journal of Speech, Language, and Hearing Research, 45. 1142-1157. Colpin, M., Daems, F., R. Heymans, Rymenans, R. & K. Van den Branden, (2005). Ontwikkeling van een instrument voor periodiek peilingsonderzoek schrijven (PPONS). Eindrapport. Leuven/Antwerpen: UA en K.U.Leuven. Colpin, M. & S. Gysen, (2006). Developing and introducing task-based language tests. In: K. Van den Branden (ed.), Task-based language education: from theory to practice, Cambridge Applied Linguistics Series. Cambridge: Cambridge University Press. Commissie Indicatiestelling Onderwijsachterstanden, (1996). Zo onvoorspelbaar als het leven zelf : advies van de Commissie Indicatiestelling Onderwijsachterstanden uitgebracht aan de Staatssecretaris van Onderwijs, Cultuur en Wetenschappen, mevr. T. Netelenbos. Den Haag: OC&W/Sdu. Corson, D., (1987). Language Policy Across the Curriculum. Clevedon: Multilingual Matters Ltd. Creemers, B., (1994). The Effective Classroom. London: Cassell. Cucchiarini, C. & K. Jaspaert, (1995). Taalvaardigheidstoets Aanvang Lager onderwijs: Achtergronden. Leuven: Steunpunt NT2. Cucchiarini, C. & K. Jaspaert, (1996). Tien voor taal? Toetsen van taalvaardigheid. In: VONwerkgroep NT2 (ed.), Taakgericht onderwijs: een onmogelijke taak? Deurne: Uitgeverij Plantyn, 195-226. Cummins, J, (1979). Linguistic interdependence and the educational development of bilingual children. In: Review of Educational Research, 49. 221-255.
Referenties
105 Cummins, J., (1980). The cross-lingual dimension of language proficiency: implications for bilingual education and the optimal age issue. In: TESOL Quarterly, 14. 175-187. Cummins, J., (1984). Wanted: a theoretical framework for relating language proficiency to academic achievement among bilingual students. In: C. Rivera (ed.), Language proficiency and academic achievement. Clevedon: Multilingual Matters, 2-19. Cummins, J., (1986). Empowering minority students: A framework for intervention. In: Harvard Educational Review, 56. 18-36. Cummins, J., (1994). Knowledge, power, and identity in teaching English as a second language. In: F. Genesee (ed.), Educating second language children: The whole child, the whole curriculum, the whole community. Cambridge, England: Cambridge University Press, 103-125. Daems, F., Janssen, R., van den Branden, K., Berben, M., Maddens, N., Rymenans, R., van Nijlen, D. & T. Venstermans (2005). De constructie van een peilingsinstrument luisteren voor het basisonderwijs. Leuven/Antwerpen: UA en K.U.Leuven. Dale, P.S., T.S. Price, D.V.M. Bishop, & R. Plomin, (2003). Outcomes of Early Language Delay: I. Predicting Persistent and Transient Language Difficulties at 3 and 4 Years. In: Journal of Speech, Language, and Hearing Research, 46. 544-560. Dar, Y. & N. Resh, (1994). Separating and mixing students for learning: concepts and research. In: Pedagogisch Tijdschrift, 19. 109-126. Darling-Hammond, L., (1997). The right to learn. A blueprint for creating schools that work. San Francisco: Jossey-Bass. Davies, A., (1990). Principles of Language Testing. Oxford, Blackwell: Oxford University Press. De Boeck, P., F. Daems, M. Meulders, & R. Rymenans, (1997). Ontwikkeling van een toetsingsmethode voor de eindtermen Nederlands in het basisonderwijs. Eindrapport. Leuven/Antwerpen: UA en K.U.Leuven. De Fraine, B., J. Van Damme, & P. Onghena, (2002). Accountability of schools and teachers: what should be taken into account? In: European Educational Research Journal, 1. 403-428. De Fraine, B., J. Van Damme, G. Van Landeghem, M. C. Opdenakker, & P. Onghena, (2003). The effect of schools and classes on language achievement. In: British Educational Research Journal, 29. 841-859. De Haan, D., (1985). Cognitive academic skills: an attempt to operationalize the concept. In: G. Extra & T. Vallen (eds.), Ethnic minorities and Dutch as a second language. Dordrecht: Foris Publications 147-165. de Maeyer, S, R. Rymenans, & P. van Petegem, (2003). Leerstijlen als outputvariabele in onderzoek naar schooleffectiviteit in het technisch en beroepssecundair onderwijs. In: W. Jochems (ed.), Grenzeloos leren. Heerlen: Open Universiteit.
Referenties
106 de Maeyer, S., R. Rymenans, Fr. Daems, P. van Petegem, & H. van den Bergh, (2003). Effectieve scholen in het technisch en beroepsonderwijs. Eindrapport OBPWO 00.08. Antwerpen: UA & EduBROn. de Maeyer, S., R. Rymenans, Fr. Daems, P. van Petegem, & H. van den Bergh, (2003). Effectiviteit van TSO- en BSO-scholen. Leuven: Acco. de Maeyer, S., R. Rymenans, & P. van Petegem, (2003). Learning styles as an outcome of school effectiveness in technical and vocational secondary education. In: L. Mason (ed.), Improving learning: fostering the will to learn. Padova: CLEUP, 661-. de Maeyer, S. & R. Rymenans, (2004). Onderzoek naar kenmerken van effectieve scholen: kritische factoren in een onderzoek naar schooleffectiviteit in het technisch en beroepssecundair onderwijs in Vlaanderen. Gent: Academia Press, 1-368. De Meyer, I., J. Pauly, & L. Van de Poele, (2004). Leren voor de problemen van morgen. De eerste resultaten van PISA2003. Gent: Ministerie van de Vlaamse Gemeenschap, 1-52. De Wit, K., P Van Petegem, & S De Maeyer, (2000). Gelijke kansen in het Vlaamse onderwijs. Het beleid inzake kansengelijkheid. Leuven: Garant. DES, (1977). Ten Good Schools: A Secondary School Enquiry. London: Department of Education and Science. Devlieghere, J., K. Van den Branden, & M. Geerts, (1999). Duik in Taalvaardigheid. Inscholingspakket taalvaardigheidsonderwijs Nederlands voor het lager onderwijs (Projectmateriaal scholen in de Vlaamse rand rond Brussel). Leuven: Steunpunt Nederlands als Tweede Taal i.o.v. Provincie Vlaams Brabant, 13-41. Dijkstra, A., S. Karsten, R. Veenstra, & A. Visscher, (2001). Het oog der natie. Scholen op rapport. Assen: Van Gorcum. Dockrell, J.E., (2001). Assessing Language Skills in Preschool Children. In: Child and Adolescent Mental Health, 6. 74-85. Dörnyei, Z., (2001). New themes and approaches in second language motivation research. In: Annual Review of Applied Linguistics, 21. 43-59. Dörnyei, Z., (2001). Teaching and researching motivation. Essex: Pearson Education Ltd. Duncan, L. G. & P. H. K. Seymour, (2000). Socio-economic differences in foundation-level literacy. In: British Journal of Psychology, 91. 145-166. Early, P., (1998). School improvement after inspection; school and LEA Responses. London: Sage. Eisner, E. W., (2001). What does it mean to say a school is doing well? In: Phi Delta Kappan, 82. 367-372. Elliott, J., (2002). The impact of 'value for money' performance auditing in educational systems. In: Educational Action Research, 10. 499-505.
Referenties
107 Emmons, M.R. & V.C. Alfonso, (2005). A Critical Review of the Technical Characteristics of Current Preschool Screening Batteries. In: Journal of Psychoeducational Assessment, 23. 111-127. Evans, R., (2005). Reframing the achievement gap. In: Phi Delta Kappan, April. 582-589. Feldman, H.M., P.S. Dale, T.F. Campbell, D.K. Colborn, M. Kurs-Lasky, H.E. Rockette, & J.L. Paradise, (2005). Concurrent and Predictive Validity of Parent Reports of Child Language at Ages 2 and 3 Years. In: Child Development, 76. 856-868. Fenson, L., Dale, P. S., Reznick, J. S., Thal, D., Bates, E., Hartung, J. P., Pethick, S., & Reily, J. S., (1993). Technical manual for the MacArther Communicative Development Inventory. San Diego: Singular Press. Fewster, S. & P. MacMillan, (2002). School-Based Evidence for the Validity of CurriculumBased Measurement of Reading and Writing. In: Remedial and Special Education, 23. Pro-Ed, 149-156. Field, S., (2006). Equity in education. Emerging lessons from the OECD thematic review. VLOR Doorstartdag. Brussel. Garcia, S., (2002). Parent-professional collaboration in culturally sensitive assessment In: A. Artiles & A. Ortiz (eds.), English Language Learners with special education needs: Identification, assessment, and instruction. Washington, DC: Center for Applied Linguistics, 87-103. Genessee, F. & J. Upshur, (1996). Classroom-based evaluation in second language education. Cambridge: Cambridge University Press. Geudens V., Rymenans R. & F. Daems (1992). Nederlands in de niet-taalvakken: eindrapport. Antwerpen: UFSIA, Interfacultair Centrum voor Toegepaste Linguïstiek Good, T. L. & J. Brophy, (2003). Looking in classrooms. Boston, MA: Allyn and Bacon. Gysen, S. & P. Van Avermaet, (2006). From needs to tasks: Language learning needs in a task-based approach. In: K. Van den Branden (ed.), Task-based language education: from theory to practice. Cambridge: Cambridge University Press, 17-46. Hacquebord, H., (1998). Taalhulp op maat. In: Toegepaste Taalwetenschap in Artikelen, 60. 19-28. Hacquebord, H., (1989). Tekstbegrip van Turkse en Nederlandse leerlingen in het voortgezet onderwijs. In: Studies over Taalgebruik 6, Dordrecht: Foris. Hacquebord, H., (1996). Tekstbegriptoets voor de Brugklas. Instrument voor signaleren en typeren van leesproblemen. Handleiding. 's Hertogenbosch: KPC.
Hajer, M. & T. Meestringa, (1995). Schooltaal als struikelblok; didactische wenken voor alle docenten. Bussum: Coutinho.
Referenties
108 Haney, W., (2002). Lake Woebe guaranteed. Misuse of test scores in Massachussets. In: Education Policy Analysis Archives, 10. Hanushek, E. & M. Raymond, (2004). Does school accountability lead to improved student performance? In: NBER Working Papers, National Bureau for of Economic Research. Hermans, D. J., M. C. Opdenakker, & J. Van Damme, (2003). Ongelijke kansen in het secundair onderwijs in Vlaanderen. Een longitudinale analyse van de interactieeffecten van geslacht, etniciteit en socio-economische status op de bereikte onderwijspositie: een vervolg. 17. Leuven: Steunpunt 'Loopbanen doorheen Onderwijs naar Arbeidsmarkt', Cel voor Analyse van Onderwijsloopbanen. Hermans, D. J., M. C. Opdenakker, & J. Van Damme, (2004). Ongelijke kansen in het secundair onderwijs in Vlaanderen. Een longitudinale analyse van de interactieeffecten van geslacht, etniciteit en socio-economische status op de eindonderwijspositie én de vertraging in het secundair onderwijs. 28. Leuven: Steunpunt 'Loopbanen doorheen Onderwijs naar Arbeidsmarkt', Cel voor Analyse van Onderwijsloopbanen. Hillewaere, K., (2001). Evaluatieonderzoek van het onderwijsbeleid ten aanzien van etnische minderheden in het lager onderwijs. Gent: Universiteit Gent, Steunpunt ICO. Hillocks, G., Jr., (2002). The testing trap: How state writing assessments control learning. New York: Teachers College Press. Holvoet, A., (2000). Schoolse taalvaardigheid van leerlingen in het Vlaamse basisonderwijs en de samenhang met hun socio-economische achtergrondkenmerken. Licentiaatsverhandeling. Leuven: K.U.Leuven. Hopkins, D., (2005). Onderwijshervormingen op grote schaal in Engeland. In: VLOR (ed.), Beleidsvoerend vermogen van scholen ontwikkelen. Antwerpen/Apeldoorn: Garant 261-284. Hughes, A., (1989). Testing for Language Teachers. Cambridge: Cambridge University Press. Hulstijn, J., (1984). Vaardigheden in moedertaal en tweede taal. Cummins' theorie van wederzijdse afhankelijkheid. In: Levende Talen, 388. 18-23. Izumi, S., (2003). Comprehension and production processes in second language learning: In search of the psycholinguistic rationale of the Output Hypothesis. In: Applied Linguistics, 24. 168-196. Jaspaert, K., (1996). NT1 en NT2 in Vlaanderen en in Nederland. In: S. Kroon & T. Vallen (eds.), Het verschil voorbij. Onderwijs Nederlands als eerste en tweede taal in Nederland en Vlaanderen. 's Gravenhage: Voorzetten 51. Nederlandse Taalunie, Sdu 13-41. Jaspaert, K., (2005). Onderwijs Nederlands tussen gisteren en morgen. Den Haag: Nederlandse Taalunie, 1-69. Jencks, C. & M. Phillips, (1998). The Black-White test score gap. Washington, DC: Brookings.
Referenties
109 Jungbluth, P., (2003). De ongelijke basisschool. Etniciteit, sociaal milieu, sekse, verborgen differentiatie, segregatie, onderwijskansen en schooleffectiviteit. Nijmegen: ITS. Kerkhoff, A., (1988). Taalvaardigheid en schoolsucces: de relatie tussen taalvaardigheid Nederlands en schoolsucces van allochtone leerlingen aan het einde van de basisschool. Amsterdam: Swets & Zeitlinger. Kim, J. & H.K. Suen, (2003). Predicting children's academic achievement from early assessment scores: a validity generalization study. In: Early Childhood Research Quarterly, 18. 547-566. Kintsch, W. & W. Van Dyck, (1978). Towards a model of text comprehension and production. In: Psychological Review, 95. 165-182. Kintsch, W., (1998). Comprehension: a paradigm for cognition. New York: Cambridge University Press. Klatter-Folmer, J., (1996). Turkse kinderen en hun schoolsucces: een dieptestudie naar de rol van sociaal-culturele oriëntatie, taalvaardigheid en onderwijskenmerken. Tilburg: Tilburg University Press. Kohn, A. (2000). The Case Against Standardized Testing: Raising the Scores, Ruining the Schools. Portsmouth, NH: Heinemann. Kohn, A., (2001). Fighting the tests. A practical guide to rescuing our schools. In: Phi Delta Kappan, 82. 349-357. Koretz, D., (2003). Discerning the effects of the NCLB accountability provisions on learning. Annual Meeting of the American Educational Research Association. Chicago, IL: American Educational Research Association. Kroon, S. & T. Vallen, (2000). Schooltaalbeleid en taakgericht onderwijs. In: M. Colpin, N. Bogaert, J. Devlieghere, G. Goossens, P. Van Avermaet, K. Van den Branden, M. Vandenbroucke, & K. Van Gorp (eds.) , Een taak voor iedereen. Perspectieven voor taakgericht onderwijs. Leuven: Garant, 123-144. Kroon, S. & T. Vallen, (2004). Dialect en school in Limburg. Studies in Meertaligheid/Studies in Multilingualism. Tilburg: Tilburg University Press. Laevers, F., K. Van den Branden, & M. Verlot, (2004). Beter, breder en met meer kleur. Onderwijs voor kwetsbare leerlingen in Vlaanderen. Een terugblik en suggesties voor de toekomst. Leuven: Steunpunt GOK. Law, J., J. Boyle, F. Harris, A. Harkness, & C. Nye, (2000). Prevalence and natural history of primary speech and language delay: findings from a systematic review of the literature. In: International Journal of Language & Communication Disorders, 35. Taylor and Francis Ltd, 165-188. Law, J., J. Boyle, F. Harris, A. Harkness, & C. Nye, (2000). The feasibility of universal screening for primary speech and language delay: findings from a systematic review of the literature. In: Developmental Medicine & Child Neurology, 42. Cambridge: Cambridge University Press, 190-200.
Referenties
110 Leibing, C., (1999). Language acquisition in an English-German bilingual pre-school: The development of the L2 lexicon. Paper presented at the IASCL Congress. San Sebastian. Leseman, P., (2000). Mondelinge en geletterde routes naar leesvaardigheid en schoolsucces. Stichting Lezen Reeks 1. In: D. e. a. Schram (ed.), Lezen en leesbevordering in een multiculturele samenleving. Delft: Uitgeverij Eburon, 13-34. Levelt, W., (1989). Speaking: from intention to articulation. Cambridge: MIT Press. Lidz, C., (1991). Practitioner's guide to dynamic assessment. New York: Guilford Press. Litjens, P., (1989). Ontwikkeling van schoolse taalvaardigheden tijdens de zaakvakken in de bovenbouw van het basisonderwijs. In: M. Kienstra (ed.), Onderwijs aan anderstaligen. Dordrecht: Foris Publications, 79-100. Litjens, P., (1990). Plaatsbepaling en karakterisering van het taalonderwijs Nederlands in meertalige onderwijssituatie. Enschede: SLO. Litjens, P., (2000). Integratie van lees- en zaakvakonderwijs is nodig. In: Taal Lezen primair, 4. 18-19. Lopez, M. & A. Tashakkori, (2003). Utilizing two-way bilingual education for reducing the achievement lag of LEP students in primary grades: A longitudinal study. Annual Meeting of the American Educational Research Association. Chicago, IL. Lopez, M. & A. Tashakkori, (2004). Narrowing the gap: Effects of a two-way bilingual education program on literacy development of at risk primary students. In: Journal of Education for Children Placed at Risk, 9. 325-336. Lopez, M. & A. Tashakkori, (2004). Effects of a Two-Way Bilingual Education Program on the Literacy Development of Students in Kindergarten and the First Grade. In: Bilingual Research Journal, 28. 19-34. Luyten, B. & D. Van Nijlen, (2003). Eerste peiling wiskunde en lezen in het basisonderwijs. Eindrapport. Leuven/Antwerpen: UA en K.U.Leuven. Magez, W. (2003). COVAAR, Cognitieve vaardigheidstest (herziene versie voor het secundair onderwijs). McClelland, M. M., M. Kessenich, & F. J. Morrison, (2003). Pathway's to early literacy: The complex interplay of child, family, and sociocultural factors. In: Advances in Child Development, 31. 411-447. McLoyd, V.C., (1998). Socioeconomic disadvantage and child development. In: American Psychologist, 53. 185-204. McNeill, L., (2000). Contradictions of school reform: Educational costs of standardized testing. New York: Routledge. Meijer, J. & J. J. Elshout, (2001). The predictive and discriminant validity of the zone of proximal development. In: British Journal of Educational Psychology, 71. 93-113.
Referenties
111 Meijnen, W., (2004). Onderwijsachterstanden. Update van een review. SCO Kohnstamm Instituut. Miniscalco, C., S. Marild, & N. G. Pehrsson, (2001). Evaluation of a language-screening programme for 2.5-year-olds at Child Health Centres in Sweden. In: Acta Paediatrica, 90. 339-344. Miniscalco, C., M. Westerlund, & A. Lohmander, (2005). Language skills at age 6 years in Swedish children screened for language delay at 2-¢ years of age. In: Acta Paediatrica, 94. 1798-1806. Moody, Ian., (2001). A case-study of the predictive validity and reliability of Key Stage 2 test results, and teacher assessments, as baseline data for target-setting and value-added at Key Stage 3. In: Curriculum Journal, 12. Taylor & Francis 81-101. Mooij, T., (2000), Screening Children’s Entry Characteristics in Kindergarten. In: Early Child Development and Care, 165. 23-40. Murphy, J. & P. Hallinger, (1989). Equity as access to learning: curricular and instructional treatment differences. In: Journal of Curriculum Studies, 21. 129-149. Nation, K. & M. J. Snowling, (1997). Assessing reading difficulties: the validity and utility of current measures of reading skill. In: British Journal of Educational Psychology, 67. 359-370. Nelson, H.D., P. Nygren, M. Walker, & R. Panoscha, (2006). Screening for Speech and Language Delay in Preschool Children: Systematic Evidence Review for the US Preventive Services Task Force. In: Pediatrics, 117. e298-e319. Nicaise, I., (2000). The right to learn. Educational strategies for socially excluded youth in Europe. Bristol: The Policy Press. Nicaise, I., (2001). Onderwijs en sociale achterstelling: opnieuw ontwaken uit de al te mooie wensdroom. In: Tijdschrift voor Onderwijsrecht en Onderwijsbeleid, 2000-2001. 383392. Nicaise, I. & E. De Smedt, (2005). Etnische segregatie in het onderwijs: Verkenning van het probleem en de polemiek. Plenaire lezing. Colloquim Onderwijs onderweg in de immigratiesamenleving. Gent: Stichting Gerritt Kreveld. Norris, J., J. Brown, T. Hudson, & J. Yoshioka, (1998). Designing second language performance assessments. Honolulu: University of Hawaii Press. Norris, J., (2005). The essential roles of assessment, measurement, and evaluation in taskbased language teaching. Plenary lecture at the TBLT 2005-International conference on task-based language teaching. Leuven. OECD, (2003). School factors related to quality and equity. Results from PISA 2000. OECD: Organisation for Economic Co-operation and Development. OECD, (2004). Learning for tomorrow's world. First results from PISA 2003. OECD: Organisation for Economic Co-operation and Development.
Referenties
112 Ohanian, S., (1999). One size fits few. The folly of educational standards. Portsmouth: Heinemann. Onderwijsraad, (1999). Handle with care. Buitenlandse ervaringen met het publiceren van schoolprestatiegegevens. Den Haag: Onderwijsraad. Onderwijsraad, (2001). Met 't oog op onderwijsachterstanden. Studies bij het advies Wat 't zwaarst weegt…. Den Haag: Onderwijsraad. Onderwijsraad, (2001). Wat het zwaarst weegt… Een nieuwe aanpak voor het onderwijsachterstandenbeleid. Den Haag: Onderwijsraad. Onderwijsraad, (2001). Over leerlinggewichten en schoolgewichten. Den Haag: Onderwijsraad. Onderwijsraad, (2001). De rugzak gewogen… Over de bekostiging van WSNS, LGF en de gewichtenregeling basisonderwijs. Den Haag: Onderwijsraad. Onderwijsraad, (2002). Wat scholen vermogen. Den Haag: Onderwijsraad. Onderwijsraad, (2003). Wat scholen toevoegen. Den Haag: Onderwijsraad. Oomens, S., G. Driessen, & P. Scheepers, (2003). De integratie van allochtone ouders en onderwijsprestaties van hun kinderen: enkele allochtone groepen vergeleken. In: Tijdschrift voor sociologie, 24. 4. 289-313 . Opdenakker, M. C., J. Van Damme, B. De Fraine, G. Van Landeghem, & P. Onghena, (2002). The effect of schools and classes upon mathematics achievement. In: School Effectiveness and School Improvement, 13. 399-427. Perfetti, C., (1985). Reading ability. Oxford: Oxford University Press. Pickstone, C., P. Hannon, & L. Fox, (2002). Surveying and screening preschool language development in community-focused intervention programmes: a review of instruments. In: Child: Care, Health and Development, 28. 251-264. Pomplun, M., (2004). The Differential Predictive Validity of the Initial Skills Analysis: Reading Screening Tests for K-3. In: Educational and Psychological Measurement, 64. 813-827. Rapportage minderheden, (1999). Rapportage minderheden 1999: Positie in het onderwijs en op de arbeidsmarkt. Sociaal en Cultureel Planbureau. Raz, I. S. & P. Bryant, (1990). Social background, phonological awareness and children's reading. In: British Journal of Developmental Psychology, 8. 209-225. Reese, E. & S. Read, (2000). Predictive Validity of the New Zealand MacArthur Communicative Development Inventory: Words and Sentences. In: Journal of Child Language, 27. 255-266.
Referenties
113 Rescorla, L. & A. Alley, (2001). Validation of the Language Development Survey (LDS): A Parent Report Tool for Identifying Language Delay in Toddlers. In: Journal of Speech, Language, and Hearing Research, 44. 434-445. Reynders, T., I. Nicaise & J. Van Damme, (2006, te verschijnen), Longitudinaal onderzoek in het basisonderwijs. Kansarme leerlingen in de derde kleuterklas: Afbakening van de GOK-doelgroep. 41. Leuven: Steunpunt 'Loopbanen doorheen Onderwijs naar Arbeidsmarkt'. Reynolds, A., (1992). Grade Retention and School Adjustment: An Explanatory Analysis. In: Educational Evaluation and Policy Analysis, 14. 101-121. Roeleveld, J., (2003). Herkomstkenmerken en begintoets. Secundaire analyses op het PRIMAcohortonderzoek. Den Haag: Onderwijsraad. Rudner, R., (1992). Reducing errors due to the use of judges. In: Practical Assessment, research and evaluation, 3. Rymenans, R., V. Geudens, H. Coucke, H. van den Bergh, & F. Daems, (1996). Effectiviteit van Vlaamse secundaire scholen: een onderzoek naar de effecten van het onderwijsaanbod, de tijdsbesteding aan het Nederlands en de schoolkenmerken op de lees- en schrijfprestaties. Antwerpen: UIA, Departement Didactiek en Kritiek. Scheerens, J. & R. Bosker, (1997). The foundations of educational effectiveness. Oxford: Pergamon. Schleicher, A., (2006). School factors related to quality and equity. VLOR Doorstartdag. Brussel. Schrooten, W., (1997). De school aan het woord. Een onderzoek naar de lexicale samenstelling van het taalaanbod op de basisschool in Vlaanderen en Nederland. In: Spiegel, 15. 61-81. Schryvers, E. & K. Hillewaere, (2002). Evaluatieonderzoek van het onderwijsvoorrangsbeleid. OBPWO 99.15: Samenvatting en beleidsaanbevelingen. Gent: U.Gent. Scott, M. S. & C. F. Delgado, (2003). Using educational placement in third grade to select and validate a preschool screening measure. In: Psychology in the Schools, 40. 565-582. Sénéchal, M. & J. LeFevre, (2002). Parental involvement in the development of children's reading skill: A five-year longitudinal study. In: Child Development, 73. 445-460. Shepard, L., (2000). The role of assessment in a learning culture. In: Educational Researcher, 29. 4-14. Sijtstra, J. et al., (2002). Balans van het taalonderwijs aan het einde van de basisschool 3. Uitkomsten van de derde peiling in 1998. Arnhem: Cito-groep. Sirin, S. R., (2005). Socioeconomic status and academic achievement: A meta-analytic review of research. In: Review of Educational Research, 75. 417-453.
Referenties
114 Skehan, P., (1998). A cognitive approach to language learning, Chapter 7: Processing perspectives on testing. A cognitive approach to language learning. Oxford: Oxford University Press, 153-184. Smeyers, M. & G. Vandommele, (2003). Taalvaardigheid en taalvaardigheidstoetsen in Vlaanderen. In: T. Koole, B. Tahitu & J. Nortier (eds.), Artikelen van de vierde sociolinguïstische conferentie, Delft: Eburon. Speece, D.L., F.P. Roth, D.H. Cooper, & S. De la Paz, (1999). The Relevance of Oral Language Skills to Early Literacy: A Multivariate Analysis. In: Applied Psycholinguistics, 20. 167-190. Stott, C.M., M.J. Merricks, P.F. Bolton, & I. M. Goodyer, (2002). Screening for Speech and Language Disorders: the reliability, validity and accuracy of the General Language Screen. In: International Journal of Language & Communication Disorders, 37. Taylor and Francis Ltd, 133-151. Strand, S., (2006). Comparing the predictive validity of reasoning tests and national end of Key Stage 2 tests: which tests are the best? In: British Educational Research Journal, 32. Taylor & Francis 209-225. Swain, M., (1985). Communicative competence: some roles of comprehensible input and comprehensible output in its development. In: S. Gass & C. Madden (eds.), Input in Second Language Acquisition. Rowley, Mass.: Newbury House, 235-256. Swain, M., (1995). Three functions of output in second language learning. In: G. Cook & B. Seidlhofer (eds.), Principle and Practice in Applied Linguistics: Studies in Honour of H.G. Widdowson. Oxford: Oxford University Press 125-144. Tan, B., (1998). Blijvende sociale ongelijkheden in het Vlaamse onderwijs. CSB-Berichten. Teddlie, C. & S. Stringfield, (1993). Schools Do Make a Difference: Lessons Learned from a 10-year Study of School Effects. New York: Teachers College Press. Teddlie, C. & D. Reynolds, (2000). The international handbook on school effectiveness research. London/New York: Falmer Press. Tesser, P.T.M., J.G.F. Merens, & C.S. van Praag, (1999). Rapportage Minderheden 1999. Den Haag: Sociaal Cultureel Planbureau. Tesser, P.T.M. & J. Iedema, (2001). Rapportage minderheden 2001. Deel 1: vorderingen op school. Den Haag: Sociaal Cultureel Planbureau. Thomas, W. & V. Collier, (2000). Accelerating schooling for all students: research findings on education in multilingual communities. In: S. Shaw (ed.), Intercultural education in European classrooms. Stoke on Trent: Trentham Books, 15-36. Valdés, G., (2004). Between Support and Marginalisation: The Development of Academic Language in Linguistic Minority Children. In: Bilingual Education and Bilingualism, 7. 102-132.
Referenties
115 Van Damme, D, (1997). Hoe geletterd/gecijferd is Vlaanderen? Functionele taal- en rekenvaardigheden van Vlamingen in internationaal perspectief. Leuven: Garant. Van Damme, J., G. Van Landeghem, B. De Fraine, M. C. Opdenakker, & P. Onghena, (2004). Maakt de school het verschil? Effectiviteit van scholen, leraren en klassen in de eerste graad van het middelbaar onderwijs. Leuven: Acco. Van Damme, J., M. C. Opdenakker, & G. Van Landeghem, (2006). Educational Effectiveness. An Introduction to International and Flemish Research on Schools, Teachers and Classes. Leuven: Acco. Van de Velde, V., B. Van Brusselen, & M. Douterlungne, (1996). Gezin en school. Een onderzoek over het gezin als indicator voor de schoolloopbaan in het secundair onderwijs. Leuven: HIVA. Van den Branden, K, (1997). Effects of negotiation on language learners' output. In: Language Learning, 47. 589-636. Van den Branden, K., (2000). Does negotiation of meaning promote reading comprehension? A study of primary school classes. In: Reading Research Quarterly, 35. 426-443. Van den Branden, K., (2004). Taalbeleid: een hefboom voor gelijke onderwijskansen. In: School en Samenleving, 5. 49-66. Van den Branden, K. & P. Van Avermaet, (2001). Taal, onderwijs, en ongelijkheid: quo vadis? In: Tijdschrift voor Onderwijsrecht en Onderwijsbeleid, 2000-2001. 394-404. Van den Branden, K., D. Van den Nulft, M. Verhallen, & M. Verhelst, (2001). Referentiekader vroege tweede taalverwerving. Een referentiekader voor doelstellingen rond vroege NT2-verwerving in Nederland en Vlaanderen. Den Haag: Nederlandse Taalunie. Van den Broeck, W., (2004). Technisch lezen: de centrale rol van woordherkenning in de schriftelijke taalontwikkeling. In: F. Daems, K. Van den Branden, & L. Verschaffel (eds.), Taal verwerven op school. Leuven: Acco, 131-154. Vandenbroucke, Frank, (2004). Vandaag kampioen in wiskunde, morgen ook in gelijke kansen. Beleidsnota 2004-2009. Brussel: Vlaamse Regering. van der Slik, F., G. Driessen, & K. de Bot, (2000). Thuistaal en taalvaardigheid in het basisonderwijs: een longitudinaal onderzoek. In: Gramma/TTT-tijdschrift voor taalwetenschap, 119-144. Van Gelderen, A., (1992). De evaluatie van spreekvaardigheid in communicatieve situaties. Globale beoordeling en gedetailleerde analyse van spreekprestaties van 11- en 12jarigen (SCO-report 303). Amsterdam: SCO - Universiteit van Amsterdam. Van Houtte, M., (2005). Naar een comprehensieve eerste graad in het secundair onderwijs: meer gelijkheid door uitgestelde differentiatie. In: Verslag rondetafelgesprekken, In: Stichting Gerrit Kreveld (ed.), Onderwijs onderweg in de immigratiesamenleving.
Referenties
116 Van Keer, H., (2001). Een boek voor twee. Een onderzoek naar het verwerven van strategieën voor begrijpend lezen via peer tutoring in de lagere school. In: VONK, 31. 4-16. Van Landeghem, G. & J. Van Damme, (2004). Indicatoren van de ongekwalificeerde uitstroom. Een bijdrage tot de discussie en een aantal nieuwe schattingen. 19. Leuven: Steunpunt 'Loopbanen doorheen Onderwijs naar Arbeidsmarkt', Cel voor Analyse van Onderwijsloopbanen. Van Landeghem, G. & J. Van Damme, (2004). De ongekwalificeerde uitstroom - Een geactualiseerde schatting. 18. Leuven: Steunpunt 'Loopbanen doorheen Onderwijs naar Arbeidsmarkt', Cel voor Analyse van Onderwijsloopbanen. van Petegem, P. & J. Vanhoof, (2002). Evaluatie op de testbank: Een handboek voor het ontwikkelen van alternatieve evaluatievormen. Mechelen: Wolters Plantyn. van Petegem P., Verhoeven, J., Buvens, I. & J. Vanhoof, J. (2005). De implementatie van het gelijke onderwijskansendecreet I: evaluatie-onderzoek naar het zelfevaluerend en beleidsvoerend vermogen van schollen en het ondersteunend aanbod. Antwerpen: EduBROn. van Petegem, P. & J. Vanhoof, (2006). Kwaliteit van scholen (openbaar) vergelijken? Het zwart-wit denken voorbij. Mechelen: Wolters/Plantyn. Verachtert, P., Ghesquiere, P., Hendrickx, K., Maes, F., & Van Damme, J. (2005a). Longitudinaal Onderzoek in het Basisonderwijs. Toetsen eerste leerjaar (schooljaar 2003-2004). 30. Leuven: Steunpunt 'Loopbanen doorheen Onderwijs naar Arbeidsmarkt', Cel voor Analyse van Onderwijsloopbanen. Verachtert, P., Verhaeghe, J. P., Onghena, P., van Petegem, P., & Van Damme, J. (2005b). Longitudinaal onderzoek in het basisonderwijs. Beginsituatie en leerresultaten in het eerste leerjaar. 38. Leuven: Steunpunt 'Loopbanen doorheen Onderwijs naar Arbeidsmarkt', Cel voor Analyse van Onderwijsloopbanen. Verhaeghe, J. P., L. Ackaert, I. Nicaise, J. Bollens, & S. Groenez, (2000). Studietoelagen en participatie in het hoger onderwijs. Gent/Leuven: Vakgroep Onderwijskunde/HIVA. Verhelst, M., (2002). De relatie tussen mondeling taalaanbod en woordenschatverwerving van het Nederlands als tweede taal door 2,5-jarige allochtone kleuters in Brussel. Doctoraatsproefschrift. Leuven: K.U.Leuven. Verhelst, M. , (2005), Evaluatie van taalvaardigheid in kleuter- en lagere scholen in de Rand rond Brussel. Leuven: Centrum voor Taal en Migratie. Verhoeven, L. & A. Vermeer, (2003). Zin en onzin van toetsen bij de aanvang van het basisonderwijs: Predictieve validiteit van taal- en intelligentiepeiling bij autochtone en allochtone kleuters. In: T. Koole, J. Nortier, & B. Tahitu (eds.), Artikelen van de vierde sociolinguïstische conferentie. Delft: Eburon, 532-541. Verhoeven, L. & A. Vermeer, (2005). Het ongelijk van Netelenbos. Toetsing van kleuters en hun prestaties op de Cito Eindtoets Basisonderwijs. In: Toegepaste Taalwetenschap in Artikelen, 74. 123-134.
Referenties
117 Vernooy, C., (2004). Technisch lezen in het Onderwijsverslag 2004/2005. Amersfoort: CPS. Wake, M. & S. Reilly, (2001). Now we're talking... but who are we talking about? In: Journal of Paediatrics and Child Health, 37. 421-422. Weir, C., (1990). Communicative language testing. London: Prentice Hall. Weir, C., (2005). Language Testing and Validation. An Evidence-Based Approach. In: Research and Practice in Applied Linguistics, Palgrave Macmillan. Westerbeek, K., (1999). The colours of my classroom. Rotterdam: CED. White, K. R., (1982). The relation between socioeconomic status and academic achievement. In: Psychological Bulletin, 91. 461-481. Willms, J. & M. Somers, (2005). Raising the Learning Bar in Latin America. Zink, I. & M. Lejaegere, (2002), N-CDIs: lijsten voor communicatieve ontwikkeling: aanpassing en hernormering van de MacArthur CDIs van Fenson et al. Leuven: Acco. Zwarts, M., (1990). Balans van het taalonderwijs aan het einde van de basisschool: Uitkomsten van de eerste taalpeiling einde basisonderwijs. Arnhem: Cito-groep.
Referenties