Verantwoording Taaltoets Alle Kinderen (TAK) Ludo Verhoeven, Radboud Universiteit Nijmegen Anne Vermeer, Universiteit van Tilburg

Verantwoording Taaltoets Alle Kinderen (TAK) Ludo Verhoeven, Radboud Universiteit Nijmegen Anne Vermeer, Universiteit van Tilburg

Arnhem, juli 2006 1

© Cito B.V. Arnhem (2006) Niets uit dit werk mag zonder voorafgaande schriftelijke toestemming van Cito B.V. worden openbaar gemaakt en/of verveelvoudigd door middel van druk, fotografie, scanning, computersoftware of andere elektronische verveelvoudiging of openbaarmaking, microfilm, geluidskopie, film- of videokopie of op welke wijze dan ook. 2

Inhoud

1

Inleiding

2 2.1 2.2 2.3

Beschrijving van de Taaltoets voor Alle Kinderen Doel van de toets 7 Opzet van de TAK 8 Constructie van de afzonderlijke toetstaken 9

3 3.1 3.2

Het normeringsonderzoek Steekproeftrekking 15 Normbepaling 17

4 4.1 4.2

Beschrijvende toetskarakteristieken Betrouwbaarheid van toetstaken 19 Verdeling van toetsscores 19

5 5.1 5.1.1 5.1.2 5.1.3 5.1.4 5.2 5.2.1 5.2.2

De validiteit van de toets 33 Begripsvaliditeit 33 Relaties tussen deeltaken van de TAK 33 Relatie TAK-scores met andere indicatoren van taalvaardigheid 34 Vergelijking tussen kinderen uit regulier onderwijs en speciaal basisonderwijs Vergelijking tussen leerlingen uit regulier onderwijs en ESM-leerlingen 46 Criteriumvaliditeit 50 Predictie van taal-/leesprestaties 50 Predictie van schoolsucces 54

6

Algemene conclusies en discussies

Literatuur

5 7

15

19

61

63

3

40

4

1

Inleiding

Deze verantwoording levert tezamen met de inhoud van de Taaltoets Alle Kinderen (TAK) alle informatie die nodig is voor een snelle en efficiënte beoordeling van de kwaliteit van de toetsen die deel uitmaken van dit pakket. Het genoemde materiaal maakt een beoordeling van TAK mogelijk op de volgende zes aspecten: 1 Uitgangspunten bij de toetsconstructie 2 Kwaliteit van het toetsmateriaal 3 Kwaliteit van de handleiding 4 Wijze van normering 5 Betrouwbaarheid 6 Validiteit Informatie over de uitgangspunten bij de toetsconstructie is te vinden in hoofdstuk 2. Hoofdstuk 3 bevat een beschrijving van het normeringsonderzoek. De betrouwbaarheid en de validiteit van de toetsen uit de TAK komen respectievelijk aan de orde in de hoofdstukken 4 en 5. De kwaliteit van de toets en de handleiding is te bepalen door kennis te nemen van de inhoud van het toetspakket zoals dat bij Cito is uitgegeven.

5

6

2

Beschrijving van de Taaltoets voor Alle Kinderen

2.1

Doel van de toets

Praktijkervaringen maken duidelijk dat er sprake is van een grote mate van individuele variatie in het tempo van taalverwerving. Voor een deel zijn die verschillen terug te voeren op de sociale omstandigheden waarin kinderen verkeren en op de sociale interacties die zij meemaken. Naarmate het taalaanbod van ouders beter aansluit bij de ontwikkeling van het kind, zal het tempo van taalontwikkeling hoger liggen. Daarnaast zijn er ook factoren binnen het kind die er toe doen. Kinderen verschillen in taalaanleg. Aan de ene kant zijn er kinderen met een zuiver taalgevoel die voortdurend via taal bezig zijn met het uitbreiden van hun kennis over de wereld en over zichzelf. Aan de andere kant zijn er taalzwakke kinderen voor wie het begrijpen en met name het produceren van taal moeite kost. Vaak gaat een zwakke taalvaardigheid samen met een beperkte mentale activiteit en/of een geringe mate van zelfsturing. Zo zien we dat veel taalzwakke kinderen minder inventief zijn bij het doen van spelletjes en opdrachten en vaak een grote mate van impulsiviteit vertonen. Verder zijn er ook kinderen met een specifiek taalleerprobleem. Deze kinderen vallen uit op een specifiek onderdeel van het taalsysteem. Daarbij kunnen we onderscheid maken tussen de volgende typen problemen: • Problemen met auditieve verwerking Deze kinderen hebben problemen met het opvangen en vasthouden van binnenkomende informatie. Dit blijkt bijvoorbeeld uit problemen bij het volgen van een instructie. Kinderen met auditieve verwerkingsproblemen hebben vaak problemen met het onderscheiden van spraakklanken. • Problemen met klankarticulatie Deze kinderen hebben geen problemen met taalbegrip. Als ze taal moeten produceren, gaat er echter iets mis. Ze struikelen over hun woorden, of zijn niet in staat de afzonderlijke woorden goed uit te spreken. Voor deze kinderen is het vaak moeilijk om woorden na te spreken. • Problemen met het in volgorde plaatsen van taalelementen Bij deze kinderen zien we een beperkte mate van taalbegrip en taalproductie. Opvallend is echter dat vooral het in volgorde plaatsen van taalelementen problematisch is. Als ze woorden moeten nazeggen, worden die vaak (deels) omgedraaid, bijvoorbeeld: dorp-drop. Ook zien we dat de volgorde van woorden in zinnen voor deze kinderen lastig is, bijvoorbeeld: Gisteren ik ging naar het zwembad. Zulke problemen komen naar voren als we kinderen complexe zinnen laten naspreken. • Problemen met betekenisaspecten van taal Kinderen in deze categorie vinden het moeilijk om betekenissen af te grenzen en relaties te leggen tussen betekenissen. Dit kan het gevolg zijn van een beperkte mentale activiteit, of van een geringe diepgang in de communicatie. Deze kinderen vertonen vaak een beperkte woordenschat en problemen met impliciete betekenisrelaties. Daarnaast zijn er taalleerproblemen die samengaan met het feit dat het Nederlands als tweede taal wordt geleerd. Sommige kinderen worden doorgaans pas bij intree op de basisschool met Nederlands geconfronteerd. Als gevolg van de grote verschillen in het taalaanbod tweede-taalleerders zijn er binnen een klas in de onderbouw van de basisschool vaak grote individuele verschillen in de mate waarin het Nederlands wordt beheerst. Die verschillen lijken bovendien niet kleiner te worden, waarbij het gemiddelde beheersingsniveau in het Nederlands van tweetalige kinderen duidelijk achterblijft bij dat van autochtone Nederlandse kinderen. Meestal hebben tweetalige kinderen al (ongestuurd) Nederlands van hun vriendjes geleerd. Daarbij lijkt het soms alsof een kind al heel wat in zijn mars heeft. Onder andere door gebruik te maken van een aantal formules als kom op, kijk naar je eige en ‘k weet ‘t niet kan het de ‘boodschap’ altijd heel goed overbrengen, zodat het al heel goed Nederlands lijkt te kennen. Maar in feite praat het nog heel ‘krom’ Nederlands en maakt het nog heel veel fouten in zijn werk dat, omdat het kind te hoog in zijn taalontwikkeling wordt ingeschat, eigenlijk nog te moeilijk voor hem is. Het kind lijkt een grote communicatieve vaardigheid te bezitten, maar een belangrijk aspect daarvan, de grammaticale vaardigheid, bezit het nog geenszins. Die schijn wordt deels ook veroorzaakt door de klassesituatie waarin vaak alleen maar korte antwoorden van het kind verwacht worden. Vooral wanneer in het onderwijs met wat meer formele instructie wordt begonnen, bijvoorbeeld met het aanvankelijk leesonderwijs, of wanneer met de zaakvakken aangevangen wordt, struikelen deze kinderen en worden de grote individuele verschillen in taalvaardigheid in het Nederlands duidelijk merkbaar. 7

Uit onderzoek is gebleken dat de volgorde waarin tweetalige kinderen elementen in het Nederlands als tweede taal leren in hoge mate vergelijkbaar is met die waarin autochtone Nederlandse kinderen Nederlands als eerste taal leren. De ‘fouten’ die tweede-taalverwervers maken zijn niet zo toevallig, maar zie je ook in het taalgebruik van Nederlandse kinderen: in plaats van ik liep zegt het kind ik loopte. Die ‘fouten’ zijn ook geen verkeerde stappen, maar juist stappen in de goede richting. Het zijn noodzakelijke stappen om goed Nederlands te leren. Daarmee is het tweede-taalverwervingsproces net zoals het eerste-taalverwervingsproces een creatief proces: het kind imiteert niet domweg, maar destilleert uit het hem aangeboden taalmateriaal een aantal structuur-kenmerken. Op grond daarvan vormt het dan regels die (eventueel) van het volwassenenmodel afwijken. In de loop van het taalverwervingsproces worden die regels dan op grond van wat het kind hoort in zijn omgeving steeds weer bijgesteld. De genoemde overeenkomsten in verwerving tussen eerste en tweede taal maken het goed mogelijk beide processen met elkaar te vergelijken. In een onderwijssituatie, waar tussen individuele kinderen grote verschillen in taalvaardigheid bestaan, wordt door leerkrachten de behoefte gevoeld aan met name diagnostische evaluatieprocedures. Wanneer in de klas een individueel kind bijvoorbeeld de instructie niet begrijpt, hebben leerkrachten een instrument nodig waarmee ze kunnen vaststellen wat de aard is van de talige problemen en wat er aan gedaan kan worden. Met andere woorden: wanneer in de klas, in die specifieke sociale context, een communicatief probleem ontstaat, zou een leerkracht door taalgegevens te verzamelen een diagnose moeten kunnen stellen, aan de hand waarvan hij tot sturing zou kunnen overgaan. Eventueel kan later nagegaan worden of de sturing effect gehad heeft of niet, door weer taalgegevens te verzamelen. In schema: Figuur 1

Stappen in een diagnostische evaluatieprocedure

communicatief probleem

Æ verzameling taalgegevens

Æ diagnose

Æ sturing

Voor het overgrote deel van de kinderen die van huis uit tweetalig zijn geldt dat zij van meet af aan door Nederlandse leerkrachten in het Nederlands worden onderwezen. Deze wijze van opvang stelt bij deze kinderen grote eisen aan hun mondelinge beheersing van het Nederlands. Leerkrachten moeten, om goed in te kunnen spelen op zulke complexe onderwijssituaties met enorme verschillen in taalvaardigheid tussen kinderen, kunnen beschikken over passende evaluatietechnieken, waarmee de mondelinge taalvaardigheid van kinderen in het Nederlands kan worden vastgesteld. De onderhavige Taaltoets voor Alle Kinderen (TAK) wil in die behoefte voorzien. 2.2

Opzet van de TAK

Voor het diagnosticeren van taalvaardigheid wordt uitgegaan van een domeingerichte, discrete procedure, waarin taalvaardigheid ontleed is in deelaspecten die weliswaar samenhangen, maar toch als aparte componenten beschouwd kunnen worden. Een domeingerichte procedure maakt het mogelijk te achterhalen in welke deelaspect van taalvaardigheid een leerling tekort schiet. Om die reden hebben wij bij de opzet van een taaltoets gekozen voor een domeingerichte procedure, voor mondelinge deelvaardigheden met betrekking tot klanken, woorden, morfo-syntaxis en tekst. Gekozen is ook voor een indirecte procedure, omdat de afname, scoring en beoordeling daarvan relatief eenvoudig is en een indirecte procedure de beste garanties biedt voor een betrouwbare uitkomst. Dit geldt te meer daar het onze bedoeling is dat de toets door individuele leerkrachten gehanteerd moet kunnen worden. Dat laatste stelt ook eisen aan de constructie van de toets: de te toetsen deelaspecten moeten transparant zijn voor leerkrachten, en op basis van de analyses van de deeltaken moet een vertaling mogelijk zijn naar onderwijskundig handelen. Dat wil zeggen dat een leerkracht op basis van een lage uitkomst van een deeltoets de leerlingen lesmateriaal kan voorleggen zodat hun prestaties op die deelvaardigheid positief beïnvloed kunnen worden. In het laatste deel van de handleiding bij de toets worden dan ook concrete aanwijzingen gegeven door middel van suggesties en verwijzingen naar bestaand lesmateriaal hoe in aansluiting op de toetsgegevens het onderwijs aan de leerlingen kan worden gestuurd.

8

Bij de constructie van de taken is zoveel mogelijk rekening gehouden met de volgende factoren: culturele afhankelijkheid, eerste-taalachtergrond, moeilijkheidsgraad van de gehanteerde woorden (behalve in de woordenschattaken) en diagnostische waarde. In de toets is culturele afhankelijkheid zoveel mogelijk vermeden door de in de voorbeelden en teksten verdisconteerde betekenisaspecten een vergelijkbare mate van herkenbaarheid te geven voor kinderen met uiteenlopende culturele achtergronden (vgl. Bachman & Cohen, 1998). Niet-universele ervaringen als het vouwen der handen of kamperen, woorden als kurkentrekker of oliebol, of begrippen met een sterk culturele connotatie zoals varken zijn zoveel mogelijk vermeden. De toets is zoveel mogelijk gericht op het domein school, waarmee alle leerplichtige kinderen van verschillende culturele achtergronden te maken hebben. Met eerste-taalachtergrond is rekening gehouden in die zin, dat in de woordenschattoetsen die woorden vermeden zijn waarvoor in dialect een ander woord bestaat (bijvoorbeeld hiel en hak) of in de eerste taal (ongeveer) hetzelfde woord (bijvoorbeeld het Nederlands-Turkse contrast boksen vs. boks yapmak). De moeilijkheidsgraad van de gehanteerde woorden binnen de instructies en van de items van de andere dan de woordenschattaken is zo laag mogelijk gehouden, zodat zwakke toetsresultaten niet in termen van misverstaan van de instructie kan worden uitgelegd. Voor de morfologietaken wordt bijvoorbeeld de regelvorming gevraagd van hoogfrequente woorden die behoren tot de zogenaamde unaniemen in Schaerlaekens, Kohnstamm & Lejaegere, 1999). Met betrekking tot de diagnostische waarde ten slotte dienden de taken zodanig geconstrueerd te worden dat leerkrachten deze zelfstandig kunnen afnemen en interpreteren, waarbij zij zoveel mogelijk aan de toetsresultaten aanwijzingen zouden moeten kunnen ontlenen voor gericht onderwijskundig handelen (zie boven). Om die reden wordt bijvoorbeeld niet ‘de woordvorming’ getoetst, of ‘de meervoudsvorming’, maar de beheersing van de verschillende alternanten van het meervoud (op –s, of –en, met of zonder lexeemmodificatie) in afzonderlijke categorieën. Op deze wijze kan de leerkracht zien dat de leerling al wel de regel tent – tenten en mond – monden beheerst, maar nog niet slot – sloten en stad – steden. Op grond van bovenstaande overwegingen en uitgangspunten ten aanzien van doelgroep, evaluatieprocedure, en deeltaalvaardigheden is uitgegaan van de volgende opbouw van de toets. De TAK bestaat uit twee typen evaluatie: observatiegegevens en toetsgegevens. Met behulp van een observatielijst wordt inzicht verkregen in de sociale taalvaardigheid van de leerlingen, dat wil zeggen de kennis van sociocultureel bepaalde regels van taalgebruik, in de literatuur en de tekst hierboven ook wel ‘pragmatische’ of ‘sociale’ taalvaardigheid genoemd. De leerkracht dient daartoe een aantal beoordelingsschalen in te vullen. Met behulp van deze schalen kan de leerkracht meer zicht krijgen op de strategieën die kinderen hanteren om in het Nederlands bepaalde communicatieve doelen te bereiken. De toetsgegevens hebben betrekking op de grammaticale taalvaardigheid, dat wil zeggen de kennis van taalstructurele regels met betrekking tot klanken, woorden, zinnen en teksten. Ze worden verkregen met behulp van tien receptieve (‘passieve’) en (re)productieve (‘actieve’) taken op de vier onderscheiden deelvaardigheden op het niveau van klanken, woordbetekenis, woorden zinsstructuur en tekststructuur (zie Figuur 2). In de volgende paragrafen wordt nader ingegaan op de constructie van deze toetstaken. Figuur 2

Overzicht deeltaken TAK: grammaticale taalvaardigheid

vaardigheidsniveau klanken woordbetekenis woordstructuur zinsstructuur tekststructuur

2.3

receptief Klankonderscheiding Passieve woordenschat

(re)productief Klankarticulatie Woordomschrijving Woordvorming Zinsvorming Verteltaak

Zinsbegrip 1 en 2 Tekstbegrip

Constructie van de afzonderlijke toetstaken

Klankonderscheiding Met de taak Klankonderscheiding wordt nagegaan in hoeverre kinderen in staat zijn via het gehoor spraakklanken van elkaar te onderscheiden. In de taak worden steeds twee woorden aangeboden die verschillen in één foneem, of in positie, dan wel aantal van fonemen (voorbeelden respectievelijk kas – kaas, dorp – drop, strik – stik). Na elk woordpaar geven kinderen aan of de woorden hetzelfde, dan wel verschillend zijn. In totaal worden 50 woordparen aangeboden: 9

37 verschillende en 13 identieke woordparen. Bij de selectie van woorden is een zo groot mogelijke spreiding van klanken en klankcombinaties van het Nederlands nagestreefd. Speciale aandacht is uitgegaan naar klanken die in een aantal eerste talen van etnische minderheden in Nederland nietbetekenisonderscheidend zijn (p – b, i – ie) dan wel niet voorkomen (ui, r). Klankarticulatie De taak Klankarticulatie is bedoeld om de articulatievaardigheid van kinderen na te gaan. Het correct kunnen articuleren van spraakklanken vraagt van kinderen dat ze klanken in uiteenlopende posities in woorden kunnen uitspreken. De taak gaat uit van 45 woorden die nagesproken moeten worden. Ook hier is bij de selectie van woorden een zo groot mogelijke spreiding van klanken en klankcombinaties van het Nederlands nagestreefd. Klanken en klankcombinaties worden daarbij in verschillende posities beoordeeld: initiaal, mediaal en finaal. Na afname van de taak kan met behulp van een foutenanalyse worden nagegaan welke spraakklanken voor kinderen specifieke problemen opleveren. Daarbij worden in totaal drie foutentypen onderscheiden: substitutie van consonanten (bijvoorbeeld gum – hum), substitutie van vocalen (bijvoorbeeld deuk – duik) en klankdistributie (bijvoorbeeld toevoeging van een klank: spreuk – supureuk; weglating van een klank: schram – scham; of volgordeverwisseling van klanken: arts – arst). Passieve-woordenschattaak Als basis dienden de in Nieuwe Streeflijst woordenschat 6-jarigen (Kohnstamm et al., 1984) en in Woorden in het basisonderwijs (Schrooten & Vermeer, 1994) voorkomende woorden. De Streeflijst geeft door middel van percentages aan hoeveel leerkrachten vonden dat een woord begrepen moest worden door zesjarigen. Deze beoordelingslijst bevat zo’n 7.000 woorden. Schrooten & Vermeer is een frequentielijst van in het basisonderwijs mondeling en schriftelijk aangeboden woorden, met in totaal ruim 15.000 lemma’s die meer dan één keer voorkomen. 9.000 lemma’s hebben een frequentie van meer dan 5. Aangezien negenjarigen in groep 5 een gemiddelde woordenschat hebben van ongeveer 7500 woorden (Verhoeven & Vermeer, 1996: 89), zijn deze aantallen voldoende om als referentiepunt te dienen, met het oog op extrapolatie om een indicatie te kunnen geven van de grootte van de woordenschat van een leerling. Ten behoeve van de woordenschattaak zijn de Streeflijstwoorden in acht categorieën ingedeeld van steeds ongeveer 900 woorden, te beginnen bij de hoogste percentages, en als achtste en laatste categorie de ongeveer 1000 woorden met een beoordelingspercentage lager dan 26%. Uit elke categorie zijn 12 woorden gekozen. Bij de Passieve-woordenschattaak is bij elk van de 96 woorden een viertal tekeningen gemaakt, waarvan er één de referent van het woord aangeeft. Van de drie afleiders is zoveel mogelijk getracht er één in klank overeen te laten komen, en er één uit hetzelfde domein te kiezen. De proefleider zegt het woord en de proefpersoon moet het juiste plaatje aanwijzen. In enkele vooronderzoeken zijn alle woorden aangeboden; in de definitieve versie wordt een afbreeknorm gehanteerd, zoals ook in andere in moeilijkheidsgraad oplopende toetsen gebruikelijk is. In een eerste vooronderzoek zijn de eerste 60 woorden voorgelegd aan 87 leerlingen uit groep 1 en 2. In een tweede vooronderzoek zijn 100 woorden voorgelegd aan 240 leerlingen in groep 3 en 4. Op basis van de gemiddelde p-waarden in deze twee onderzoeken zijn de woorden herordend van makkelijk naar moeilijk, en ook zijn er enkele woorden verwijderd of afleiders vervangen. De definitieve proefversie bestaat uit 96 items, voorafgegaan door twee voorbeelden. Woordomschrijvingstaak In een eerste vooronderzoek zijn 80 woorden – verdeeld over de acht hiervoor genoemde categorieën – van de Woordomschrijvingstaak bevraagd bij leerlingen uit groep 1 en 2. De instructie daarbij was: “Ik ga je nu telkens vragen wat een woord betekent. Jij moet dan steeds zegggen wat dat woord is, of je mag het ook aanwijzen of voordoen. Laten we het eens proberen. Dit is de eerste: Wat is een stoel?” De antwoorden van de kinderen werden genoteerd achter het stimuluswoord. De scoring (goed/fout) gebeurde achteraf, na gezamenlijke bespreking, op basis van de annotaties. De aldus gevormde scoringscriteria (‘modelantwoorden’) zijn vervolgens gebruikt bij de formulering van de itemantwoorden van de definitieve taak. In een eerder vooronderzoek met 27 van de eerste items van deze taak bij vijftig eentalige en tweetalige leerlingen in groep 2 (Van Keulen, 1996; zie ook Vermeer, 1997: 177) was naar voren gekomen dat een scoring van de antwoorden van de leerlingen op een drie-puntsschaal niet beter was en ook geen andere resulaten opleverde dan een scoring goed/fout. Om die reden is in de definitieve taak gekozen voor een scoring goed/fout met ‘model’-antwoorden om het scoren makkelijker en betrouwbaarder te maken. Op basis van de p-waarden uit deze twee

10

vooronderzoeken zijn ook de items herordend in moeilijkheidsgraad, en zijn enige items verwijderd. De definitieve versie bestaat uit 45 items voorafgegaan door twee voorbeelden. Zinsbegripstaken Om de kennis van syntactische patronen en elementen die (mede) de betekenis van een zin bepalen te toetsen zijn twee zinsbegripstaken ontwikkeld. De afnameprocedure is voor beide taken gelijk: er wordt telkens een drietal plaatjes aangeboden, gevolgd door een mondelinge aanbieding van een zin. De betekenis van de zin stemt daarbij met één van de plaatjes overeen. Van de leerling wordt gevraagd voor welk plaatje dit het geval is. Bij beide taken gaat het om door middel van functiewoorden of volgorde van elementen expliciet en impliciet uitgedrukte betekenisrelaties binnen en tussen woordgroepen. In de eerste zinsbegriptaak wordt de kennis van vier typen functiewoorden getoetst: hoeveelheidswoorden (halve, alle, evenveel), ruimtelijke woorden (achter, tussen, tegenover), persoonsaanduidende woorden (hem, haar, zich) en voegwoorden (terwijl, nadat, hoewel). Van de eerste twee typen worden 11 functiewoorden getoetst, van de laatste twee typen elk 10. De elementen waarnaar die functiewoorden of woordgroepen (zouden kunnen) verwijzen zijn in elk van de drie plaatjes aanwezig. Zo wordt bijvoorbeeld het persoonsaanduidende reflexief zich in de zin Moeder wast zich aangeboden in drie plaatjes waarin een vrouw zichzelf, resp. een jongen, resp. een meisje wast, en het voegwoord hoewel in de zin Hoewel het regende ging hij fietsen met drie plaatjes waarin een man in de regen fietst, resp. bij droog weer fietst, resp. bij regen niet fietst. De in totaal 42 items worden voorafgegaan door twee voorbeelditems. In de tweede zinsbegriptaak worden expliciet en impliciet uitgedrukte betekenisrelaties getoetst. Expliciet uitgedrukte relaties binnen woordgroepen worden bijvoorbeeld getoetst door uit te gaan van een zin waarin een element op verschillende woordgroepen betrekking kan hebben. Zo kan zwart in de zin De hoed van de man op de fiets is zwart zowel op de hoed als de fiets worden betrokken, en op de plaatjes zijn dus zowel zwarte als witte fietsen en hoeden te zien. Relaties tussen woordgroepen worden getoetst door semantische rollen van woordgroepen binnen zinnen te contrasteren. Zo worden in de zin De jongen gooit zijn schoen in het zand de rollen object en locatief gecontrasteerd: op het eerste plaatje gooit hij zijn schoen in het zand, op het tweede gooit hij zand in zijn schoen, en op het derde het zand uit zijn schoen. Verschillende rolcontrasten zijn in de taak verwerkt. Net zoals in bovenstaand voorbeeld het voorzetsel in behoort bij het zelfstandig naamwoord waar het voor staat, wordt in het Nederlands het bijvoeglijk naamwoord betrokken op het zelfstandig naamwoord waar het voor staat (in tegenstelling tot het Turks bijvoorbeeld). In de zin De bakker legt op de schaal ronde koekjes zijn de koekjes rond, niet de schaal. Op de plaatjes worden dus ronde en vierkante koekjes en schalen afgebeeld. Bij de impliciet uitgedrukte relaties worden twee typen linguïstische verschijnselen getoetst: presupposities en modale woorden. Onder presuppositie wordt de relatie tussen twee beweringen begrepen, waarbij de waarheid van de ene bewering een noodzakelijke voorwaarde vormt voor het al of niet waar zijn van de andere bewering. In de taak komen vier typen presupposities aan de orde. Ten eerste implicatieve werkwoorden (erin slagen, ervoor zorgen, etc.). Voor deze predicaten geldt dat de geïmpliceerde propositie bij een assertie waar is, en bij een ontkenning onwaar. Ten tweede factieve predicaten (weten, betreuren, doen alsof, etc.). Deze predicaten impliceren de waarheid van hun complement. Ten derde ondergeordende zinnen waarin een conditioneel verband wordt uitgedrukt. Ten slotte comparatieve relaties tussen woordgroepen waarin de existentie van het vergelekene wordt geïmpliceerd. De modale woorden die getoetst worden geven een bepaalde modaliteit aan het predicaat weer, bijvoorbeeld herhaling (nog, eens, weer, etc.), of tijdsbepaling (nog niet, niet meer, etc.). De moeilijkheid van deze betekenisrelaties voor de taalleerder schuilt in het impliciete karakter ervan. De voorbeelden uit Figuur 3 maken dit duidelijk. Door implicatieve werkwoorden en factieve predicaten met elkaar te contrasteren is te zien hoe lastig deze twee in het bijzonder zijn. De in totaal 42 items van Zinsbegriptaak 2 worden voorafgegaan door twee voorbeelditems.

11

Figuur 3

Impliciete betekenisrelaties: presupposities en modale woorden

Implicatieve werkwoorden

Factieve predicaten

Ondergeordende zinnen Comparatieve relaties Modale woorden

– ze zorgt ervoor, dat de poes te eten krijgt (de poes krijgt dus eten) – ze zorgt er niet voor, dat de poes te eten krijgt (de poes krijgt dus geen eten) – ze vindt het erg dat de vaas stuk is (de vaas is dus stuk) – ze vindt het niet erg dat de vaas stuk is (de vaas blijft dus stuk) – als het zou regenen, zou hij wel met de bus gaan (hij gaat dus niet met de bus) – de jongen is niet kleiner (er is dus iets anders dat kleiner is) – hij eet nog een appel (hij heeft er dus al een op) – alleen de poes ligt te slapen (er ligt dus niemand anders te slapen) – regende het maar niet, denkt Ali (het regent dus wel) – hij had beter naar bed kunnen gaan (hij is dus niet naar bed)

Woordvormingstaak Met de Woordvormingstaak wordt nagegaan in hoeverre kinderen in staat zijn tot toepassing van een tweetal woordvormingsregels in het Nederlands, namelijk verbuiging van het meervoud van zelfstandige naamwoorden en de vervoeging van het voltooid deelwoord. Bij beide taken zijn van de onderzochte regelvorming de meest voorkomende alternanten onderscheiden, waarbij van elke alternant steeds vier items zijn gekozen, opdat die gegevens een betrouwbaar beeld zouden opleveren van de beheersing van die alternant door de proefpersoon. De meervoudsvormingstaak bestaat naast drie oefenitems uit drie groepen met elk vier items: de eerste groep omvat alternanten op –en (brillen, ogen), de tweede op –s (vlinders, lepels), de derde op –en met verandering van de kernvocaal (wegen, daken). De verschillende alternanten wisselen elkaar af. De alternanten met verandering van eindconsonant (/paart/ – paarden), die in de oude versie van de TAK zaten, zijn vervallen omdat uit onderzoek bleek dat hiermee meer de verwerving van een fonologische regel dan die van een morfologische getoetst werd (namelijk de verplichte verstemlozing van fricatieven aan het eind van een woord). De proefpersoon wordt een tweetal tekeningen getoond, waarbij een verbale stimulus wordt gegeven van het volgende type: “Dit is één kraan, dat zijn twee ...”. Door intonatie en afwachtende houding wordt duidelijk gemaakt dat de zin afgemaakt moet worden. Bij het voltooid deelwoord worden ook drie alternanten onderscheiden, met elk vier items. De eerste groep betreft de regelmatige (‘zwakke’) vormen met ge+stam+t (gekookt, gespeeld), de tweede groep de ‘sterke’ vormen met klinkerwisseling in de stam (gevlogen, gezeten), en de derde groep betrof de ‘onregelmatige’ vormen (gebracht, verloren). Bij deze deeltoets wordt een ondersteunende afbeelding gegeven bij een verbale stimulus als: “Rosita is een bal aan het gooien. Gisteren heeft zij ook al een bal ...”. De proefpersoon moet de zin afmaken. De items van beide deeltaken (elk twaalf items) worden door drie voorbeelditems voorafgegaan. Zinsvormingstaak De Zinsvormingstaak heeft tot doel inzicht te krijgen in de woorden zinsstructuren die de leerlingen kunnen gebruiken. Ze moeten daartoe twintig zinnen nazeggen, die te lang zijn om louter geïmiteerd te worden. De zinnen variëren in lengte van 9 tot 15 woorden, boven wat als grens wordt gezien om zonder verwerking geïmiteerd te kunnen worden. De vraag is dan welke veranderingen of weglatingen de kinderen aanbrengen in hun zinnen bij het herhalen. Een dergelijke taak heeft doorgaans een zeer hoge betrouwbaarheid. Problematisch kan wel de vaak laag ingeschatte validiteit zijn waardoor het gevaar bestaat dat de toets minder serieus genomen wordt. Voor de betekenis en de plaats van de procedure zie Slobin & Welsh (1973). In de zinnen wordt nagegaan in hoeverre de leerlingen twintig syntactische elementen of functiewoorden correct kunnen gebruiken (voegwoorden als dat, terwijl, maar, hulp- en koppelwerkwoorden (wilde, heeft, schijnt) en woorden als er en het). In elke zin zitten ook twintig zinspatronen die gescoord worden. De zinspatronen hebben betrekking op bijvoorbeeld 12

inversie door vooropplaatsing van bijzinnen en ondergeordende zinnen, en volgordes in complexe verbale, nominale en prepositionele zinsdelen (toen ze thuis kwam, kinderen die van lezen houden, op het drukste plein van de stad, etc.). Bij het scoren wordt voorbijgegaan aan uitspraakfouten en in een aantal aangegeven gevallen is variatie mogelijk (bijvoorbeeld wou of wilde worden beide goed gerekend, als ook de volgordes heeft gezien en gezien heeft). Er worden alleen de bedoelde functiewoorden of patronen goed of fout gerekend. De maximale score is dus 40. Tekstbegrip In de Tekstbegripstaak worden zes korte verhaaltjes van negen tot twaalf zinnen voorgelezen, waarvan de gemiddelde zinslengte geleidelijk toeneemt. Na elk verhaaltje worden vier vragen gesteld. Twee vragen naar informatie die expliciet in de voorgelezen tekst is gegeven, en twee vragen naar tekstimpliciete informatie. Van de tekstexpliciete informatie heeft er één vraag betrekking op betekenisrelaties tussen woordgroepen binnen een zin, zoals in Poes ligt lekker te slapen op de bank. Vraag: Waar ligt poes te slapen? Eén vraag heeft betrekking op referentiële relaties tussen zinnen, zoals de vraag: Waar wil Pieter met zijn vader naar toe? bij de zinnen Pieter vraagt vader of hij morgen met hem mee gaat. Hij wil graag naar de dierentuin. De tekstimpliciete vragen hebben respectievelijk betrekking op presuppositionele relaties binnen een zin, zoals in de vraag Moet vader echt huilen? bij de zin Vader doet net of hij huilt, en ten slotte op implicatieve relaties tussen zinnen, zoals de vraag Regent het als Pieter naar buiten kijkt? bij de zinnen in het verhaal Hij kijkt naar buiten. Dan zegt hij: Wat jammer dat het regent. De antwoorden op de vragen worden goed/fout gescoord, aan de hand van modelantwoorden. De maximale score is dus 24. Verteltaak In de twee productieve verteltaken moeten de leerlingen aan de hand van een tweetal beeldverhalen het verloop van de gebeurtenissen vertellen. De wijze waarop de leerlingen deze verhalen vertellen, wordt bij beide beoordeeld aan de hand van een zestiental elementen die betrekking hebben op de coherentie en de cohesie van de tekst. Tot de elementen die behoren tot de cohesie van een tekst (‘samenhang in vorm’) worden elementen gerekend waarmee bijvoorbeeld middel/doel en oorzaak/ gevolg worden verwoord, zoals door voegwoorden (want, omdat) of juxtapositie (Jan komt niet. Hij is ziek). De coherentie van een tekst (‘samenhang in betekenis’) komt bijvoorbeeld tot uitdrukking door de noodzakelijke inhoudswoorden van de tekst expliciet te verwoorden. Uit elk beeldverhaal zijn negen of tien voor begrip van het verhaal noodzakelijk geachte inhoudswoorden geselecteerd. Daarnaast zijn zes of zeven elementen opgesomd die de samenhang in vorm van het verhaal en de plot of grap weergeven: oorzaak – gevolg relaties, opposities, middel – doel relaties, en probleem – oplossingsrelaties. Elk verhaal wordt goed/fout gescoord op 16 elementen die het kind expliciet heeft verwoord. Observatiegegevens sociale taalvaardigheid Om te komen tot een operationalisering van sociale taalvaardigheid zijn door ons een aantal categorieën onderscheiden die aspecten van sociolinguïstische en strategische competentie vormen. Voor sociolinguïstische competentie zijn dat aspecten van registergebruik, non-verbaal gedrag en intonatie. Voor strategische competentie zijn dat aspecten van gespreksorganisatie, gespreksondersteuning en initiatief. In totaal zijn 24 observatiecategorieën onderscheiden. Verschillende daarvan worden in de literatuur genoemd (Erickson & Omark, 1981; Wallat, 1984 voor overzichten en discussies). Voor elk van deze 24 categorieën is een paar van uitspraken opgesteld, elk met een positieve en een negatieve pool. Op een vijfpuntsschaal bevat de negatieve pool een uitspraak over communicatie-remmend gedrag en de positieve pool een uitspraak over communicatie-bevorderend gedrag, zoals het volgende item: Maakt geen gebruik van gebaren om zijn bedoeling te verduidelijken

O O O O O

kan met handen en voeten spreken

Door omcirkeling kan aangegeven worden of het gedrag van de leerling meer door de linker dan wel door de rechter uitspraak getypeerd kan worden.

13

14

3

Het normeringsonderzoek

3.1

Steekproeftrekking

In het schooljaar 1996-97 werd gestart met een landelijk longitudinaal onderzoek. Dit onderzoek had tot doel toetsen te ontwikkelen met behulp waarvan de ontwikkeling te volgen zou zijn van leerlingen op het leergebied Taal. Voor de samenstelling van het scholencohort waarbij de normering zou plaatsvinden, werd het bestand van Nederlandse basisscholen op basis van hun schoolgewicht opgesplitst in drie strata, een procedure vergelijkbaar met het onderzoek in het kader van de Periodieke Peiling van het OnderwijsNiveau (Wijnstra, 1988): – Stratum 1 scholen met een schoolgewicht ≤ 1.05 In dit stratum zijn vooral scholen vertegenwoordigd met relatief weinig arbeiderskinderen en relatief veel kinderen uit gezinnen met een hogere sociaal-economische status. – Stratum 2 scholen met een schoolgewicht 1.06 – 1.15 De scholen in dit stratum nemen een middenpositie in tussen de beide andere strata. – Stratum 3 scholen met een schoolgewicht > 1.15 Scholen in stratum 3 kenmerken zich door een relatief hoog aantal allochtone leerlingen. Uit deze drie strata werd een aselecte steekproef getrokken. Daarnaast is met het oog op het verkrijgen van voldoende vergelijkingsgegevens van allochtone leerlingen die het Nederlands als tweede taal leren een overrepresentatie van stratum-3-scholen aangeschreven. Alle scholen werden aangeschreven met het verzoek aan het longitudinale onderzoek deel te willen nemen. Voor de strata 1 en 2 werd anderhalf maal het benodigde aantal scholen benaderd, voor stratum 3 tweemaal het benodigde aantal. Op identieke wijze werd voor iedere aangeschreven school een reserveschool aselect uit het bestand van scholen getrokken. Na enige tijd werd aan de scholen uit de eerste steekproef, voor zover ze nog niet gereageerd hadden, een rappel gestuurd. Uiteindelijk is ongeveer de helft van de reservescholen eveneens tot deelname aan het normeringsonderzoek uitgenodigd. In totaal reageerden 88 scholen, met in totaal ongeveer 1400 leerlingen in groep 1, positief. Ter controle is nagegaan in hoeverre de verdeling van scholen over regio’s in Nederland als representatief is te beschouwen. Daartoe zijn de percentages van scholen in de populatie en die in de door ons getrokken steekproef met elkaar vergeleken. Het resultaat staat vermeld in Tabel 1. De tabel laat zien dat de percentages scholen in de populatie en in de steekproef in sterke mate met elkaar overeen komen. De beperkte overrepresentatie van leerlingen in de regio’s Rotterdam/Den Haag en Utrecht heeft te maken met een bewust gekozen overrepresentatie van allochtone leerlingen ten behoeve van de mogelijkheid om ook voor deze doelgroep aparte vergelijkingsgroepen te hebben. Dit kan worden opgevat als een ondersteuning van de representativiteit van de getrokken steekproef.

15

Tabel 1

Percentage scholen in de populatie en in de getrokken steekproef Percentage in populatie 7 6 6 7 8 7 8 8 8 7 7 7 7 8

Regio A Amsterdam e.o. B Kop Noord-Holland C Leiden e.o. D Rotterdam/Den Haag E Zeeland/W-Brabant F Gorinchem e.o. G Utrecht H Arnhem/Nijmegen I Midden/Oost N-Brabant J Limburg K Twente/Achterhoek L NW Overijssel/ZW Drente M Friesland N Groningen Totaal

Aantal in steekproef 7 5 6 9 5 5 9 6 8 7 6 5 5 5 88

Percentage in steekproef 8 5 7 9 6 6 10 7 9 9 7 6 5 6

De eerste afname van de TAK (TAK1) in groep 1 vond plaats in oktober 1996. De tweede afname van TAK was in september 1997 aan het begin van groep 2, de derde afname aan het eind van groep 2 in juni 1998, de vierde afname van de TAK aan het eind van groep 3 in juni 1999, en de vijfde en laatste TAK-afname vond plaats in juni 2000, toen de leerlingen in groep 4 zaten. In de loop van de periode van vier jaar dataverzameling bleef de uitval van leerlingen beperkt. Bij de eerste opname hadden we van 1221 kinderen alle taken. Bij de vijfde afname na vier jaar en acht maanden waren er van deze kinderen nog 807 leerlingen over die in de loop van vier jaar geen enkele taak hadden gemist. Van ruim 900 leerlingen zijn bijna alle taken op alle meetmomenten beschikbaar. De uitschieter naar beneden van 807 leerlingen betreft de Verteltaak op meetmoment 5. Tabel 2 geeft per opnamemoment de aantallen leerlingen bij wie de taken afgenomen zijn, voor de drie onderscheiden groepen apart alsmede voor de totale groep. Tabel 2

Aantallen leerlingen per groep en totaal, per meetmoment

Autocht Ned Surin/Antill Mediterraan totaal

TAK1-okt 96 712 103 325 1355

TAK2-sept 97 663 90 305 1241

TAK3- juni 98 646 86 297 1193

TAK4- juni 99 576 72 256 1035

TAK5-juni2000 534 62 231 929

Vervolgens is nagegaan in hoeverre als gevolg van de uitval in de loop van de tijd de uiteindelijke populatie nog representatief geacht kan worden. Daartoe zijn de gemiddelde scores op de taken van alle kinderen bij de eerste opname vergeleken met die van de bij meetmoment 5 overgebleven populatie kinderen, en wel voor de drie onderscheiden vergelijkingsgroepen apart. De gemiddelde scores van beide populaties laten bij controle slechts zeer geringe en in geen enkel geval significante verschillen zien. Geconcludeerd kan worden dat het verlies van proefpersonen in de loop van de tijd de representativiteit van de populaties niet heeft aangetast. Via de proefleiders en leerkrachten zijn van de leerlingen verschillende achtergrondgegevens verzameld, zoals sekse, leeftijd, leerlinggewicht, opleiding van de ouders, thuistaalgebruik. D gemiddelde leeftijd van de leerlingen was bij de eerste opname 4 jaar en 7 maanden. De Mediterrane leerlingen waren gemiddeld één maand ouder (4;8 jaar, sd= 0;4) dan de autochtoon Nederlandse leerlingen (4;7 jaar, sd= 0;3). Tussen de leerlingen met leerlinggewicht 1.0 en 1.25 is er geen verschil in leeftijd. In Tabel 3 wordt de gemiddelde leeftijd van de leerlingen op elk meetmoment aangegeven.

16

Tabel 3

Leeftijd van de leerlingen op de verschillende meetmomenten TAK1 okt 96 begin groep 1 4;7 jaar

leeftijd

TAK2 sept 97 begin groep 2 5;6 jaar

TAK3 juni 98 eind groep 2 6;3 jaar

TAK4 juni 99 eind groep 3 7;3 jaar

TAK5juni2000 eind groep 4 8;3 jaar

De seksen waren in alle groepen praktisch gelijk verdeeld. In Tabel 4a wordt een overzicht gegeven van de opleiding van de ouders van de verschillende groepen leerlingen. Zoals af te lezen uit de tabel, kloppen de door de directie doorgegeven leerlinggewichten niet altijd met de opgave van de leerkrachten. In Tabel 4b wordt een overzicht gegeven van het thuistaalgebruik. De autochtone leerlingen met niet-Nederlands als thuistaal in Tabel 4b zijn leerlingen van een tweetal scholen uit Limburg. Tabel 4a

Proefpersonen, aantal per groep en opleiding ouders

Sociale achtergrond autochtoon Nederlands autochtoon, 1.0 autochtoon, 1.25 Surin/Antil Mediterraan

Tabel 4b

Lbo laaggeschoold

Mavo/mbo Middelbaar

Havo/hbo/wo hooggeschoold

4 46 45 204

34 222 84 127

195 12 60 48

203 5 39 24

Proefpersonen, aantal per groep en thuistaalgebruik (tussen haakjes: % per groep)

Thuistaalgebruik autochtoon Ned lln. Surin/Antil Mediterrane lln.

3.2

alleen lo ongeschoold

vooral Nederlands + evt. andere taal 727 (98%) 155 (65%) 35 (9%)

evenveel Nederlands als andere taal 1 (0%) 25 (10%) 46 (11%)

vooral andere taal + Nederlands 18 (2%) 59 (25%) 330 (80%)

Normbepaling

De taken werden individueel afgenomen door proefleiders die hiervoor een korte training hadden gekregen van Cito. De batterij toetstaken werd in een random volgorde aangeboden. In de kleutergroepen werden de taken in drie of vier sessies aangeboden; in groep 3 en 4 meestal in twee sessies. De proefleiders achterhaalden ook de benodigde informatie via de leerkrachten. Als centrale norm voor de ontwikkeling van de Nederlandse taalvaardigheid van alle leerlingen fungeert de scoreverdeling van de autochtone Nederlandse leerlingen. Ten aanzien van de tweetalige allochtone leerlingen is de veronderstelling dat zij het vaardigheidsniveau in het Nederlands van autochtone leerlingen dichter zullen benaderen, naarmate zij meer en gedurende langere tijd aanbod krijgen in het Nederlands als tweede taal. De normvergelijking van autochtone leerlingen kwam als volgt tot stand. Per meetmoment zijn de scoreverdelingen van autochtone kinderen op de onderscheiden toetstaken omgezet in een verdeling van percentielscores, zoals leerkrachten dat gewoon zijn bij bijvoorbeeld de toetsen van het leerlingvolgsysteem van Cito. Per taak zijn de toetsscores in vijf groepen verdeeld: – niveau A: goed tot zeer goed (25% hoogst scorende leerlingen); – niveau B: ruim voldoende tot goed (25% net boven het gemiddelde scorende leerlingen); – niveau C: matig tot voldoende (25% net onder het gemiddelde scorende leerlingen); – niveau D: zwak tot matig (15% ruim onder het gemiddelde scorende leerlingen); – niveau E: zwak tot zeer zwak (10% laagst scorende leerlingen). Naast de normvergelijking met autochtone leerlingen wordt ook een vergelijking met twee allochtone groepen beoogd. Hiertoe zijn per jaargroep normen afgeleid voor de toetsscores behaald door 17

Surinaamse/Antilliaanse leerlingen (die thuis doorgaans Nederlands spreken) enerzijds en leerlingen afkomstig uit Mediterrane landen (die thuis doorgaans vooral de eigen taal spreken) anderzijds. Net als bij de autochtone normgroep vormden de geobserveerde scoreverdelingen het uitgangspunt voor de vergelijking. Gezien het feit dat het hier om een aanvullende vergelijking gaat ten behoeve van het Nederlands als tweede taal, is gekozen voor een kleiner aantal geclassificeerde scores. In totaal worden drie niveaus onderscheiden: hoog (scores hoger dan gemiddeld + 1 Standaarddeviatie), laag (scores lager dan gemiddeld – 1 Standaarddeviatie) en gemiddeld (scores tussen beide voornoemde waarden). Ter toetsing van de veronderstelling dat kinderen uit Mediterrane landen een vergelijkbare NT2ontwikkeling doormaken is nagegaan of er op de afzonderlijke taken op enig meetmoment significante verschillen waren tussen Turkse, Marokkaanse en overige Mediterrane leerlingen, met het oog op de vraag of deze leerlingen in één groep samengenomen konden worden. Dit bleek niet het geval. Dezelfde analyses zijn uitgevoerd bij Surinaamse en Antilliaanse kinderen. Ook daar bleken op de afzonderlijke taken op geen van de meetmomenten significante verschillen te zijn tussen de groepen. In het vervolg worden genoemde groepen steeds samengenomen, respectievelijk als de Mediterrane groep en de Surinaams/Antilliaanse groep.

18

4

Beschrijvende toetskarakteristieken

4.1

Betrouwbaarheid van toetstaken

In Tabel 5 staan de waarden van Cronbach’s alpha per leeftijd en per toetstaak vermeld. Voor toetsen waar, zoals bij de TAK het geval is, geen zware consequenties voor leerlingen aan verbonden zijn, geeft de COTAN (1999, 24) aan dat een betrouwbaarheidscoëfficiënt tussen de .70 en de .80 voldoende is, en hoger dan .80 goed. Zoals de tabellen laten zien, is de betrouwbaarheidscoëfficiënt alpha in bijna alle gevallen voldoende of goed. Alleen bij het vijfde meetmoment aan het eind van groep 4 zijn er bij de Klankarticulatietaak en Zinsbegriptaak 1 (functiewoorden) lagere waarden, als direct gevolg van de (verwachte) plafondeffecten: in groep 4 worden de onderzochte klanken en functiewoorden door bijna alle kinderen beheerst. De domeingerichte interpretatie van toetsscores is op dit niveau echter nog steeds zinvol te noemen voor kinderen die in hun taalontwikkeling beduidend achterblijven in vergelijking met leeftijdgenoten. Tabel 5

Cronbach’s alpha per toetstaak en per meetmoment

Cronbach’s alpha

Begin 1

Begin 2

Eind 2

Eind 3

Eind 4

Klankonderscheiding

.97

.95

.96

.89

.87

Articulatie

.93

.88

.88

.81

.50

Woordomschrijving

.91

.92

.92

.92

.93

Passieve woordenschat

.97

.97

.97

.96

.95

Zinsbegrip 1

.89

.85

.82

.74

.65

Zinsbegrip 2

.90

.85

.84

.81

.74

Woordvorming

.91

.91

.91

.89

.89

Zinsvorming

.96

.95

.94

.93

.91

Tekstbegrip

.92

.89

.89

.86

.82

Verteltaak

.91

.90

.89

.91

.89

4.2

Verdeling van toetsscores

Per toetstaak is nagegaan hoe het scoreverloop is van autochtone Nederlandse kinderen, Surinaamse/Antilliaanse kinderen en kinderen van mediterrane herkomst (Turken/Marokkanen) over de eerste vier jaargroepen van het basisonderwijs en wel aan het begin van groep 1 en groep 2 en aan het eind van groep 2, 3 en 4. Met behulp van variantie-analyse is per taak nagegaan in hoeverre de verschillen in scores significant zijn voor Tijd en Groep (herkomst). Klankonderscheidingstaak Tabel 6 geeft de gemiddelden en standaarddeviaties van de normgroep en beide vergelijkingsgroepen op de vijf meetmomenten op de Klankonderscheidingstaak. In Figuur 4 worden de gemiddelden op de taak van de drie groepen over de meetmomenten heen grafisch weergegeven. Uit de tabel en de figuur valt op te maken dat de scores van de autochtone Nederlanders eind groep 2 al het plafond bereiken: praktisch al die kinderen weten de betreffende klanken te onderscheiden. De Mediterrane kinderen lopen hun aanvankelijke achterstand heel snel in, en hebben na een jaar bijna hun autochtoon Nederlandse leeftijdgenoten ingehaald. Eind groep 2 is er ook bij de andere twee groepen al een zeker plafondeffect, maar de standaarddeviaties zijn nog hoog. Een relatief groter aantal Surinaams/Antillliaanse en Mediterrane kinderen beheersen eind groep 2 de klankonderscheiding nog niet volledig. 19

Tabel 6

Gemiddelden en standaarddevaties op de Klankonderscheidingstaak

Klankonderscheiding (n items = 50) autocht Nederlanders Surin/Antil Mediterranen

Figuur 4

begin groep1 gem sd

begin groep2 gem sd

eind groep 2 gem sd

eind groep 3 gem sd

eind groep 4 gem sd

36.6 32.0 29.8

42.9 40.7 39.9

46.6 44.4 44.2

48.5 47.2 47.1

9.2 48.9 48.5

9.7 9.8 9.9

7.0 8.5 8.2

4.2 6.8 6.4

2.1 4.3 4.3

1.4 1.6 2.5

Gemiddelden van de vergelijkingsgroepen over tijd op de Klankonderscheidingstaak

50 45 40 35 30 25 begin gr 1

begin gr 2

autochtone Nederlanders

eind gr 2

eind gr 3

Surinamers/Antillianen

eind gr 4 Mediterranen

Verder blijkt binnen alle groepen sprake van een beduidende toename van scores naarmate de kinderen ouder worden. Met behulp van een variantie-analyse (GLM, Repeated Measures) zijn deze tendenties op significantie getoetst. Zowel TIJD als de interactie TIJD*GROEP bleek significant (within subjects, zie Tabel 7): de verschillen tussen de groepen worden significant kleiner in de loop van de tijd. Ook de verschillen tussen vergelijkingsgroepen waren significant (between subjects, F(2, 907)=44.246, sig of F=.000). Tabel 7 F-waarden, vrijheidsgraden en significantieniveaus (***p <.00) uit de variantie-analyses voor de Klankonderscheidingstaak

Groep Tijd Tijd*Groep

Ned, Sur/Ant, Mediter F (df) 44.246*** (2, 907) 1091.170*** (4, 3628) 19.074*** (8, 3628)

Ned vs. Surinamers/Antill F (df) 31.769*** (1, 653) 617.405*** (4, 2612) 10.543*** (4, 2612)

20

Ned vs. Mediterranen F (df) 84.765*** (1, 764) 1040.130*** (4, 3056) 35.938*** (4, 3056)

Klankarticulatietaak Tabel 8 geeft de gemiddelden en standaarddeviaties van de normgroep en beide vergelijkingsgroepen op de vijf meetmomenten op de Klankarticulatietaak. In Figuur 5 worden de gemiddelden op de taak van de drie groepen over de meetmomenten heen grafisch weergegeven. Tabel 8

Gemiddelden en standaarddevaties op de Klankarticulatietaak

Klankarticulatie (n items = 45) autocht Nederlanders Surin/Antil Mediterranen

begin groep1 gem sd

begin groep2 gem sd

eind groep 2 gem sd

eind groep 3 gem sd

eind groep 4 gem sd

41.3 39.7 37.4

43.3 42.3 41.3

44.1 43.5 42.9

44.6 44.2 44.2

44.8 44.7 44.6

5.1 4.7 8.0

2.5 2.9 4.4

1.6 2.4 3.0

0.9 1.3 1.2

0.5 0.7 0.9

Net zoals bij de Klankonderscheidingstaak valt bij de Klankarticulatietaak uit de tabel en de figuur op te maken dat de scores van de autochtone Nederlanders begin groep 2 al het plafond bereiken: praktisch al die kinderen weten de betreffende klanken te onderscheiden. Ook bij de andere twee groepen is er begin groep 2 al een zeker plafondeffect, maar de standaarddeviaties zijn bij de Mediterranen nog relatief hoog. Een relatief groter aantal Mediterrane kinderen beheerst begin groep 2 de klankonderscheiding nog niet volledig. Zij hebben echter wel een groot deel van hun achterstand na een jaar al grotendeels ingehaald. Figuur 5

Gemiddelden van de vergelijkingsgroepen over tijd op de Klankarticulatietaak

45

42

39

36 begin gr 1

begin gr 2


eind gr 2

eind gr 3



Uit de figuur valt af te lezen dat er in de Kleutergroep nog duidelijk sprake is van verschillen in scores tussen de groepen. Autochtone Nederlandse kinderen scoren het hoogst, gevolgd door de Surinaamse en Antilliaanse kinderen, en Mediterranen het laagst. Verder blijkt binnen alle groepen sprake van een beduidende toename van scores naarmate de kinderen ouder worden. Met behulp van een variantie-analyse (GLM, Repeated Measures) zijn deze tendenties op significantie getoetst. Zowel TIJD als de interactie TIJD*GROEP bleek significant (within subjects, zie Tabel 9): de verschillen tussen de groepen worden significant kleiner in de loop van de tijd. Ook de verschillen tussen vergelijkingsgroepen waren significant (between subjects, F(2, 926)=45.490 sig of F=.000). 21

Tabel 9 F-waarden, vrijheidsgraden en significantieniveaus (***p <.001) uit de variantie-analyses voor de Klankarticulatietaak





Passieve woordenschat Tabel 10 geeft de gemiddelden en standaarddeviaties van de normgroep en beide vergelijkingsgroepen op de vijf meetmomenten op de Passieve-woordenschattaak. In Figuur 6 worden de gemiddelden op de taak van de drie groepen over de meetmomenten heen grafisch weergegeven. Tabel 10

Gemiddelden en standaarddevaties op de Passieve-woordenschattaak

Passievewoordenschat (n=96) autocht Nederlanders Surin/Antil Mediterranen

Figuur 6

begin groep1 gem sd

begin groep2 gem sd

eind groep 2 gem sd

eind groep 3 gem sd

eind groep 4 gem sd

42.5 29.0 14.5

57.7 43.9 28.0

67.4 53.4 38.2

77.2 65.5 54.4

83.8 76.2 64.8

14.1 13.7 10.3

12.8 15.3 12.8

12.0 14.7 13.2

9.7 12.9 15.5

7.5 8.9 13.1

Gemiddelden van de vergelijkingsgroepen over tijd op de Passieve-woordenschattaak

96 84 72 60 48 36 24 12 begin gr 1

begin gr 2


eind gr 2

eind gr 3



Uit de figuur valt af te lezen dat er op elk meetmoment duidelijk sprake is van verschillen in scores tussen de groepen. Autochtone Nederlandse kinderen scoren het hoogst, gevolgd door de Surinaamse en Antilliaanse kinderen, en Mediterranen het laagst. De zeer hoge F-waarde maakt duidelijk dat de achterstand van met name Mediterrane leerlingen substantieel is: in tijd gerekend bedraagt de achterstand steeds zo’n twee jaar. Hun woordenschat is in groep 3 nauwelijks groter dan die van autochtoon Nederlandse leerlingen aan het begin van de basisschool. De Surinaamse en 22

Antilliaanse kinderen zitten met hun scores tussen deze beide groepen in. Verder blijkt binnen alle groepen sprake van een beduidende toename van scores naarmate de kinderen ouder worden. Met behulp van een variantie-analyse (GLM, Repeated Measures) zijn deze tendenties op significantie getoetst. Zowel TIJD als de interactie TIJD*GROEP bleek significant (within subjects, zie Tabel 11): de verschillen tussen de groepen worden significant kleiner in de loop van de tijd. Ook de verschillen tussen vergelijkingsgroepen waren significant (between subjects, F(2, 882)=523.608, sig of F=.000). Met name de Mediterranen hebben een enorme achterstand op de autochtoon Nederlandse kinderen. Tabel 11 F-waarden, vrijheidsgraden en significantieniveaus (***p <.001) uit de variantie-analyses voor de Passieve-woordenschattaak





Woordomschrijving Tabel 12 geeft de gemiddelden en standaarddeviaties van de normgroep en beide vergelijkingsgroepen op de vijf meetmomenten op de Woordomschrijvingstaak. In Figuur 7 worden de gemiddelden op de taak van de drie groepen over de meetmomenten heen grafisch weergegeven. Tabel 12

Gemiddelden en standaarddevaties op de Woordomschrijvingstaak

Woordomschrijving (n items = 45) autocht Nederlanders Surin/Antil Mediterranen

begin groep1 gem sd

begin groep2 gem sd

eind groep 2 gem sd

eind groep 3 gem sd

eind groep 4 gem sd

10.7 6.5 2.4

15.8 11.1 5.4

19.2 13.9 7.8

23.7 18.1 13.2

28.0 22.5 16.9

6.0 5.0 2.9

6.1 5.3 4.1

5.5 4.7 7.6

6.0 5.4 5.3

5.9 5.1 5.4

Uit Figuur 7 valt af te lezen dat er op elk meetmoment duidelijk sprake is van grote verschillen in scores tussen de groepen. Autochtone Nederlandse kinderen scoren het hoogst, gevolgd door de Surinaamse en Antilliaanse kinderen, en Mediterranen het laagst. De achterstand van Mediterrane kinderen op autochtoon Nederlandse kinderen is ook op deze woordenschattaak groot, en bedraagt gemiddeld zo’n drie jaar. Begin groep 1 zijn de scores van Mediterranen bijzonder laag: zij weten gemiddeld maar 2,4 woorden correct te omschrijven, en is er sprake van een bodemeffect. De achterstand wordt mede daardoor in de loop van de tijd zelfs nog iets groter. Verder blijkt binnen alle groepen sprake van een beduidende toename van scores naarmate de kinderen ouder worden.

23

Figuur 7

Gemiddelden van de vergelijkingsgroepen over tijd op de Woordomschrijvingstaak

30 25 20 15 10 5 0 begin gr 1

begin gr 2


eind gr 2

eind gr 3



Met behulp van een variantie-analyse (GLM, Repeated Measures) zijn deze tendenties op significantie getoetst. Zowel TIJD als de interactie TIJD*GROEP bleek significant (within subjects, zie Tabel 13). Vanwege het bodemeffect in de scores van de Mediterrane kinderen op de eerste twee meetmomenten is dit interactie-effect echter niet zonder meer te interpreteren als het groter worden van de verschillen tussen de groepen. Ook de verschillen tussen vergelijkingsgroepen waren significant (between subjects, F(2, 896)=412.934 sig of F=.000). De achterstand van Mediterrane kinderen op autochtoon Nederlandse kinderen is ook op deze woordenschattaak dramatisch te noemen. Tabel 13 F-waarden, vrijheidsgraden en significantieniveaus (***p <.001) uit de variantie-analyses voor de Woordomschrijvingstaak





Woordvorming Tabel 14 geeft de gemiddelden en standaarddeviaties van de normgroep en beide vergelijkingsgroepen op de vijf meetmomenten op de Woordvormingstaak. In Figuur 8 worden de gemiddelden op de taak van de drie groepen over de meetmomenten heen grafisch weergegeven.

24

Tabel 14

Gemiddelden en standaarddevaties op de Woordvormingstaak

Woordvorming (n items = 24) autocht Nederlanders Surin/Antil Mediterranen

Figuur 8

begin groep1 gem sd

begin groep2 gem sd

eind groep 2 gem sd

eind groep 3 gem sd

eind groep 4 gem sd

11.4 6.0 1.8

14.0 9.5 5.4

16.1 12.4 7.5

18.8 16.3 12.0

21.3 19.3 15.5

4.3 5.1 2.8

4.1 5.4 4.5

4.1 5.5 4.7

3.8 4.9 4.6

3.0 3.7 4.6

Gemiddelden van de vergelijkingsgroepen over tijd op de Woordvormingstaak

24 20 16 12 8 4 0 begin gr 1

begin gr 2


eind gr 2

eind gr 3



Uit de figuur valt af te lezen dat er op elk meetmoment duidelijk sprake is van verschillen in scores tussen de groepen. Autochtone Nederlandse kinderen scoren het hoogst, gevolgd door de Surinaamse en Antilliaanse kinderen, en Mediterranen het laagst. De Mediterrane kinderen beheersen begin groep 1 bijna geen enkele woordvormingsregel. Pas eind groep 3 zitten zij op het niveau van autochtone Nederlandse kinderen begin groep 1. Gemiddeld lopen de Mediterranen dus drie jaar achter op hun autochtoon Nederlandse leeftijdsgenoten. Verder blijkt binnen alle groepen sprake van een beduidende toename van scores naarmate de kinderen ouder worden. Met behulp van een variantie-analyse (GLM, Repeated Measures) zijn deze tendenties op significantie getoetst. Zowel TIJD als de interactie TIJD*GROEP bleek significant (within subjects, zie Tabel 15: de verschillen tussen de groepen worden significant kleiner in de loop van de tijd. Ook de verschillen tussen vergelijkingsgroepen waren significant (between subjects, F(2, 870)=432.014 sig of F=.000). Tabel 15 F-waarden, vrijheidsgraden en significantieniveaus (***p <.001) uit de variantie-analyses voor de Woordvormingstaak




25


Zinsbegrip 1 (functiewoorden) Tabel 16 geeft de gemiddelden en standaarddeviaties van de normgroep en beide vergelijkingsgroepen op de vijf meetmomenten op Zinsbegriptaak 1. In Figuur 9 worden de gemiddelden op de taak van de drie groepen over de meetmomenten heen grafisch weergegeven. Tabel 16

Gemiddelden en standaarddevaties op Zinsbegriptaak 1

Zinsbegrip 1 (n items =42) autocht Nederlanders Surin/Antil Mediterranen

Figuur 9

begin groep1 gem sd

begin groep2 gem sd

eind groep 2 gem sd

eind groep 3 gem sd

eind groep 4 gem sd

27.1 21.5 18,2

32.8 29.8 25.6

36.1 33.7 31.0

38.5 37.1 35.9

40.0 38.9 38.0

5.7 6.7 5.4

4.5 5.4 6.1

3.3 4.5 5.2

2.5 3.0 3.2

1.8 2.3 2.3

Gemiddelden van de vergelijkingsgroepen over tijd op Zinsbegriptaak 1

42

35

28

21

14 begin gr 1

begin gr 2


eind gr 2

eind gr 3



Uit de figuur valt af te lezen dat er in de kleutergroepen duidelijk sprake is van verschillen in scores tussen de groepen. Autochtone Nederlandse kinderen scoren het hoogst, gevolgd door de Surinaamse en Antilliaanse kinderen, en Mediterranen het laagst. De scores van de autochtoon Nederlandse kinderen neigt eind groep 4 naar een plafond. De Mediterrane kinderen gaan sterk vooruit in de kleutergroepen, maar blijven toch ongeveer een anderhalf jaar achterlopen.Verder blijkt binnen alle groepen sprake van een beduidende toename van scores naarmate de kinderen ouder worden. Met behulp van een variantie-analyse (GLM, Repeated Measures) zijn deze tendenties op significantie getoetst. Zowel TIJD als de interactie TIJD*GROEP bleek significant (within subjects, zie Tabel 17): de verschillen tussen de groepen worden significant kleiner in de loop van de tijd. Ook de verschillen tussen vergelijkingsgroepen waren significant (between subjects, F(2, 899)=214.805 sig of F=.000).

26

Tabel 17 F-waarden, vrijheidsgraden en significantieniveaus (***p <.001) uit de variantie-analyses voor Zinsbegripstaak 1





Zinsbegrip 2 (zinspatronen) Tabel 18 geeft de gemiddelden en standaarddeviaties van de normgroep en beide vergelijkingsgroepen op de vijf meetmomenten op Zinsbegripstaak 2. In Figuur 10 worden de gemiddelden op de taak van de drie groepen over de meetmomenten heen grafisch weergegeven. Tabel 18

Gemiddelden en standaarddevaties op Zinsbegripstaak 2 (zinspatronen)

Zinsbegripstaak 2 (n items = 42) autocht Nederlanders Surin/Antil Mediterranen

Figuur 10

begin groep1 gem sd

begin groep2 gem sd

eind groep 2 gem sd

eind groep 3 gem sd

eind groep 4 gem sd

25.2 20.2 17.1

31.1 27.3 23.3

34.7 31.4 28.6

37.4 35.2 33.5

39.1 37.3 36.5

6.3 5.9 4.7

4.9 6.1 5.8

3.9 5.3 5.5

3.3 5.4 4.4

2.5 3.6 3.2

Gemiddelden van de vergelijkingsgroepen over tijd op Zinsbegriptaak 2

42

35

28

21

14 begin gr 1

begin gr 2


eind gr 2

eind gr 3



Uit de figuur valt af te lezen dat er tot het vijfde meetmoment duidelijk sprake is van verschillen in scores tussen de groepen. Autochtone Nederlandse kinderen scoren het hoogst, gevolgd door de Surinaamse en Antilliaanse kinderen, en Mediterranen het laagst. Zij lopen steeds ongeveer anderhalf jaar achter bij hun autochtoon Nederlandse leeftijdsgenoten. Verder blijkt binnen alle groepen sprake van een beduidende toename van scores naarmate de kinderen ouder worden. Met behulp van een variantie-analyse (GLM, Repeated Measures) zijn deze tendenties op significantie getoetst. Zowel TIJD als de interactie TIJD*GROEP bleek significant (within subjects, zie Tabel 19): de verschillen 27

tussen de groepen worden significant kleiner in de loop van de tijd. Ook de verschillen tussen vergelijkingsgroepen waren significant (between subjects, F(2, 875)=198.570 sig of F=.000). Tabel 19 F-waarden, vrijheidsgraden en significantieniveaus (***p <.001) uit de variantie-analyses voor Zinsbegripstaak 2 Ned, Sur/Ant, Mediter F (df) 198.570*** (2, 875) 2982.172*** (4, 3500) 46.598*** (8, 3500)




Zinsvorming Tabel 20 geeft de gemiddelden en standaarddeviaties van de normgroep en beide vergelijkingsgroepen op de vijf meetmomenten op de Zinsvormingstaak. In Figuur 11 worden de gemiddelden op de taak van de drie groepen over de meetmomenten heen grafisch weergegeven. Tabel 20

Gemiddelden en standaarddevaties op de Zinsvormingstaak

Zinsvorming (n items = 40) autocht Nederlanders Surin/Antil Mediterranen

Figuur 11

begin groep1 gem sd

begin groep2 gem sd

eind groep 2 gem sd

eind groep 3 gem sd

eind groep 4 gem sd

19.7 12.9 4.9

26.3 21.1 12.0

30.2 25.7 17.9

32.8 29.5 24.9

35.6 33.6 30.0

11.5 10.5 7.0

9.4 10.3 9.0

7.5 9.6 10.0

6.4 8.1 8.5

4.8 5.8 7.3

Gemiddelden van de vergelijkingsgroepen over tijd op de Zinsvormingstaak

40 32 24 16 8 0 begin gr 1

begin gr 2


eind gr 2

eind gr 3



Uit de figuur valt af te lezen dat er op elk meetmoment duidelijk sprake is van verschillen in scores tussen de groepen. Autochtone Nederlandse kinderen scoren het hoogst, gevolgd door de Surinaamse en Antilliaanse kinderen, en Mediterranen het laagst. Met name begin groep 1 scoren de 28

Mediterrane leerlingen zeer laag op deze reproductieve taak, en hun scores blijven in de loop van de tijd ruim twee jaar achter in vergelijking met autochtoon Nederlandse leeftijdsgenoten. Verder blijkt binnen alle groepen sprake van een beduidende toename van scores naarmate de kinderen ouder worden. Met behulp van een variantie-analyse (GLM, Repeated Measures) zijn deze tendenties op significantie getoetst. Zowel TIJD als de interactie TIJD*GROEP bleek significant (within subjects, zie Tabel 21): de verschillen tussen de groepen worden significant kleiner in de loop van de tijd. Ook de verschillen tussen vergelijkingsgroepen waren significant (between subjects, F(2, 877)=192.560 sig of F=.000). Tabel 21 F-waarden, vrijheidsgraden en significantieniveaus (***p <.001) uit de variantie-analyses voor de Zinsvormingstaak Ned, Sur/Ant, Mediter F (df) 192.560*** (2, 877) 1810.235*** (4, 3508) 56.505*** (8, 3508)




Tekstbegrip Tabel 22 geeft de gemiddelden en standaarddeviaties van de normgroep en beide vergelijkingsgroepen op de vijf meetmomenten op de Tekstbegripstaak. In Figuur 12 worden de gemiddelden op de taak van de drie groepen over de meetmomenten heen grafisch weergegeven. Tabel 22

Gemiddelden en standaarddevaties op de Tekstbegripstaak

Tekstbegrip (n items = 24) autocht Nederlanders Surin/Antil Mediterranen

begin groep1 gem sd

begin groep2 gem sd

eind groep 2 gem sd

eind groep 3 gem sd

eind groep 4 gem sd

12.2 7.2 3.2

16.1 12.6 8.3

18.3 15.0 11.2

19.8 17.5 15.2

20.6 18.9 17.5

5.7 5.5 4.0

4.6 5.2 5.2

29

4.1 4.7 5.4

3.5 4.1 5.0

3.2 3.7 4.2

Figuur 12

Gemiddelden van de vergelijkingsgroepen over tijd op de Tekstbegripstaak

24 20 16 12 8 4 0 begin gr 1

begin gr 2


eind gr 2

eind gr 3



Uit de figuur valt af te lezen dat er op elk meetmoment duidelijk sprake is van verschillen in scores tussen de groepen. Autochtone Nederlandse kinderen scoren het hoogst, gevolgd door de Surinaamse en Antilliaanse kinderen, en Mediterranen het laagst. Mediterranen blijven steeds ongeveer twee jaar achterlopen bij hun autochtoon Nederlandse leeftijdsgenoten. Verder blijkt binnen alle groepen sprake van een beduidende toename van scores naarmate de kinderen ouder worden. Met behulp van een variantie-analyse (GLM, Repeated Measures) zijn deze tendenties op significantie getoetst. Zowel TIJD als de interactie TIJD*GROEP bleek significant (within subjects, zie Tabel 23): de verschillen tussen de groepen worden significant kleiner in de loop van de tijd. Ook de verschillen tussen vergelijkingsgroepen waren significant (between subjects, F(2, 873)=247.334 sig of F=.000). Tabel 23 F-waarden, vrijheidsgraden en significantieniveaus (***p <.001) uit de variantie-analyses voor de Tekstbegripstaak



Ned vs. Surinamers/Antill F (df) 81.839*** (1, 628) 829.338*** (4, 2512) 20,277*** (4, 2512)


Verteltaak 1 en 2 Tabel 24 geeft de gemiddelden en standaarddeviaties van de normgroep en beide vergelijkingsgroepen op de vijf meetmomenten op de Verteltaak. In Figuur 13 worden de gemiddelden op de taak van de drie groepen over de meetmomenten heen grafisch weergegeven.

30

Tabel 24

Gemiddelden en standaarddevaties op de Verteltaken

Verteltaak 1 en 2 (n items = 32) autocht Nederlanders Surin/Antil Mediterranen

Figuur 13

begin groep1 gem sd

begin groep2 gem sd

eind groep 2 gem sd

eind groep 3 gem sd

eind groep 4 gem sd

10.5 7.5 5.1

14.2 12.0 9.3

18.3 17.2 14.4

21.1 20.7 18.9

24.2 24.7 22.4

6.6 5.5 5.5

6.5 6.2 5.3

6.1 6.6 6.6

6.9 5.4 7.6

5.8 5.4 6.3

Gemiddelden van de vergelijkingsgroepen over tijd op de Verteltaken

32 28 24 20 16 12 8 4 0 begin gr 1

begin gr 2


eind gr 2

eind gr 3



Uit de figuur valt af te lezen dat er op de meeste meetmomenten sprake is van verschillen in scores tussen de groepen. Autochtone Nederlandse kinderen scoren de eerste vier meetmomenten in de kleutergroepen het hoogst, gevolgd door de Surinaamse en Antilliaanse kinderen, en Mediterranen het laagst. In groep 4 scoren de Surinaamse en Antilliaanse kinderen het hoogst. Op meetmoment 4 en 5 zijn er geen significante verschillen in scores meer tussen autochtoon Nederlandse, en Surinaamse en Antilliaanse kinderen. Verder blijkt binnen alle groepen sprake van een beduidende toename van scores naarmate de kinderen ouder worden. Met behulp van een variantie-analyse (GLM, Repeated Measures) zijn deze tendenties op significantie getoetst. Zowel TIJD als de interactie TIJD*GROEP bleek significant (within subjects, zie Tabel 25): de verschillen tussen de groepen worden significant kleiner in de loop van de tijd. Ook de verschillen tussen vergelijkingsgroepen waren significant (between subjects, F(2, 804)=45.339 sig of F=.000), vooral als gevolg van de verschillen tussen autochtoon Nederlandse en Mediterrane kinderen. Tabel 25 F-waarden, vrijheidsgraden en significantieniveaus (***p <.001, * p <.05) uit de variantieanalyses voor de Verteltaken



Ned vs. Surinamers/Antill F (df) 4.462* (1, 589) 693.248*** (4, 2356) 12.593*** (4, 2356)

31


32

5

De validiteit van de toets

De twee eisen waar de toetsen uit de TAK aan moeten voldoen om valide te zijn, kunnen aangeduid worden met de termen begripsvaliditeit en criteriumvaliditeit. De begripsvaliditeit van de toets richt zich enerzijds op de vraag in hoeverre de scores op de deeltoetsen een stabiel patroon te zien geven in de loop van de tijd en anderzijds op de vraag in hoeverre de deeltoetsen van de TAK onderling interne samenhang te zien geven. De begripsvaliditeit van een toets heeft daarnaast betrekking op de vraag in hoeverre toetsscores toe te schrijven zijn aan verklarende concepten en constructen die deel uitmaken van het theoretische kader dat aan de ontwikkeling van de toets ten grondslag ligt. De criteriumvaliditeit geeft aan in welke mate de toets in staat is latere schoolprestaties te voorspellen. 5.1

Begripsvaliditeit

5.1.1

Relaties tussen deeltaken van de TAK

Om de relaties tussen deeltaken van de TAK na te gaan zijn allereerst partiële correlaties berekend tussen de taken Klankonderscheiding (ko), Klankarticulatie (ka), Passieve Woordenschat (pw), Woordomschrijving (wo), Woordvorming, uitgesplitst naar Meervoud (mv) en Voltooid Deelwoord (vd), Zinsbegrip 1 (begrip functiewoorden: bf) en Zinsbegrip 2 (begrip patronen: bp), Zinsvorming, uitgesplitst naar Zinsvorming Functiewoorden (zf) en Zinsvorming Patronen (zp), Tekstbegrip (tb) en Verteltaak 1 en 2 (vt1, vt2). De partiële correlaties voor deze 13 variabelen zijn weergegeven in Tabel 26. Tabel 26

ko ka pw wo mv vd bf bp zf zp tb vt1 vt2

ko 1 .37 .39 .29 .29 .28 .53 .47 .38 .38 .42 .22 .23

Partiële correlaties voor 13 subtests van de TAK op de totale groep met leeftijd als factor ka

pw

wo

mv

vd

bf

bp

zf

zp

tb

vt1

vt2

1 .31 .25 .26 .28 .42 .37 .37 .36 .32 .19 .19

1 .75 .63 .66 .66 .69 .63 .65 .71 .35 .33

1 .58 .64 .53 .58 .57 .59 .63 .32 .30

1 .60 .54 .55 .54 .55 .56 .34 .31

1 .53 .56 .59 .61 .58 .32 .29

1 .75 .62 .63 .67 .36 .37

1 .62 .63 .68 .36 .35

1 .89 .63 .38 .37

1 .65 .41 .39

1 .35 .35

1 .68

1

We zien relatief hoge correlaties tussen pw en wo die beide woordenschat meten, tussen mv en vd die beide woordvorming meten, tussen zb1 en zb2 die beide zinsbegrip meten, tussen zf en zp die beide zinsvorming meten en tussen vt1 en vt2 die beide vertelvaardigheid meten. Verder valt op dat de correlaties tussen taken op woordniveau en zinsniveau relatief hoog zijn. Vervolgens is met behulp van factoranalyse nagegaan in hoeverre de taken op klank-, woord-, zinsen tekstniveau over de vijf meetmomenten een stabiele samenhang vertonen. Daarbij bleek de beste factoroplossing te worden gevonden met een common and specific factors multi-wave model. In dit model wordt ervan uitgegaan dat de score op een deeltoets deels verklaard wordt door de gemeenschappelijke factor, die een longitudinaal simplex vormt, en deels door de specifieke factor die onafhankelijk is van de tijd. Dit model vertoonde een redelijke fit: Chi-square = 9497.712, df = 1946, p = .000, gfi = .717, agfi = .698, nfi = .831, rmsea = .074, srmr = .081. De common factor bleek erg stabiel met als gestandaardiseerde regressie van meetmoment 1 naar meetmoment 2: .94, van meetmoment 2 naar meetmoment 3: .97, van meetmoment 3 naar meetmoment 4: .95 en van meetmoment 4 naar meetmoment 5: .96. 33

De ladingen van alle variabelen op de gemeenschappelijke factor (G) en op de specifieke factor (S) waartoe zij volgens de bovenstaande indeling behoren, zijn vermeld in Tabel 27. Tabel 27

Ladingen in ‘4 factors common and specific factors 5-wave model’

Spraak ko1 ko2 ko3 ko4 ko5 ka1 ka2 ka3 ka4 ka5

G .59 .46 .46 .43 .36 .47 .46 .40 .35 .25

S .18 .32 .32 .31 .27 .49 .62 .63 .56 .38

Woordenschat G pw1 .76 pw2 .74 pw3 .71 pw4 .72 pw5 .75 wo1 .66 wo2 .66 wo3 .63 wo4 .62 wo5 .69 mm1 .63 mm2 .62 mm3 .62 mm4 .55 mm5 .72 vd1 .68 vd2 .67 vd3 .69 vd4 .68 vd5 .72

Zinsbouw S .26 .37 .40 .38 .38 .34 .42 .51 .56 .52 .33 .24 .20 .19 .23 .19 .23 .23 .23 .16

bf1 bf2 bf3 bf4 bf5 bp1 bp2 bp3 bp4 bp5 zf1 zf2 zf3 zf4 zf5 zp1 zp2 zp3 zp4 zp5 tb1 tb2 tb3 tb4 tb5

G .83 .82 .78 .75 .72 .76 .82 .82 .79 .75 .91 .92 .90 .88 .82 .91 .93 .92 .91 .87 .85 .83 .78 .70 .63

Tekst S .14 .13 .13 .12 .07 .16 .13 .13 .14 .15 .28 .43 .37 .40 .34 .28 .40 .38 .39 .35 .05 .14 .13 .14 .13

vt11 vt12 vt13 vt14 vt15 vt21 vt22 vt23 vt24 vt25

G .63 .52 .53 .32 .37 .65 .51 .48 .31 .30

S .23 .49 .52 .58 .56 .25 .47 .52 .58 .55

Deze tabel laat zien dat de factor spraak voor het grootste deel wordt bepaald door klank-articulatie, woordenschat door de woordomschrijvingstaak, zinsbouw door de zinsvormingstaken (functiewoorden en patronen) en tekstproductie door de twee verteltaken. Concluderend kunnen we stellen dat in de normaalpopulatie sprake is van een hoge mate van interne samenhang tussen de onderscheiden taaltaken. Daarbij blijkt naast een sterke algemene taalfactor ook evidentie voor unieke variantie voor taalaspecten op het niveau van klanken, woorden, zinnen en tekst. Opvallend daarbij is dat de woordvormingstaken samengaan met woordbetekenistaken. Dit kan worden opgevat als een aanwijzing dat we hier te maken hebben met taken die naar het mentale lexicon verwijzen. Verder gaat de tekstbegriptaak samen met zinsbegriptaken en blijkt tekstproductie zoals gemeten met de verteltaken een specifieke factor te vormen. Dit laatst kan worden verklaard vanuit het feit dat in de tekstbegriptaak een beroep wordt gedaan op zinsbouwvaardigheden, terwijl de verteltaken veeleer coherentievaardigheden meten. Zoals ook in de handleiding is aangegeven wordt met deze taken vooral gescoord in welke mate leerlingen samenhang in betekenis kunnen realiseren. 5.1.2

Relatie TAK-scores met andere indicatoren van taalvaardigheid

In deze paragraaf staat de convergente-divergente validiteit van deeltaalvaardigheden gemeten middels de deeltaken van de Taaltoets Alle Kinderen centraal. In een Multi-Trait-Multi-Method-design worden de vaardigheden ('traits'), gemeten in deze indirecte evaluatieprocedure, vergeleken met dezelfde 'traits', gemeten door middel van oordelen van leerkrachten, en door middel van een directe procedure (spontane-taaldata). Daarbij worden binnen het construct ‘communicative proficiency’ (cf. Canale & Swain, 1980; Bachman, 1990) alleen de grammaticale en pragmatische vaardigheden onderzocht, en niet de sociolinguïstische en strategische. Afzonderlijk voor de vaardigheden op het niveau van klanken, woordkennis, morfologie, syntaxis en tekst (cohesie en coherentie) zijn bij 34

180 leerlingen in de eerste vier groepen van het basisonderwijs de gestandaardiseerde toetsen van de TAK afgenomen, spontane-taaldata opgenomen en geanalyseerd, en leerkrachtbeoordelingen verzameld. Met behulp van correlationele analyses wordt nagegaan in hoeverre er convergente en divergente validiteit aangetoond kan worden voor de verschillende onderscheiden deeltaalvaardigheden in de TAK-taken. Vervolgens zal met behulp van variantie-analyses nagegaan worden in hoeverre er tussen jongens en meisjes, dan wel eerste- en tweede-taalsprekers, verschillen bestaan in de drie gehanteerde procedures. Motivering voor het onderscheiden van deze vijf deelvaardigheden op het niveau van klanken, woordkennis, morfologie, syntaxis en tekst is in eerdere hoofdstukken al gegeven en is gelegen in de praktijk van het onderwijs (cf. Bachman & Palmer, 1996), waar deze afzonderlijk worden onderwezen en getoetst: klankvaardigheid met het oog op leren lezen, woordenschat als drager van betekenissen, woorden zinsbouw ten behoeve van het taalbeschouwingsonderwijs, en tekstvaardigheid bij (begrijpend) lezen. Opzet van het onderzoek, proefpersonen en procedure In vier afzonderlijke onderzoeken in groep 1 tot en met 4 in het basisonderwijs zijn toetsgegevens, spontane-taaldata en leerkrachtoordelen verzameld bij 180 leerlingen die het Nederlands als eerste (NT1) of tweede taal (NT2) spreken. De laatste groep bestond hoofdzakelijk uit Turkse of Marokkaanse kinderen. In Tabel 28 staat een overzicht van de aantallen leerlingen, verdeeld over NT1/NT2 en sekse. Alle leerlingen kwamen uit de lagere SES-categorieën (leerlinggewicht 1.25 en 1.9). De jongste was 4;0 jaar, de oudste 9;6 jaar, de gemiddelde leeftijd was 6;3 jaar (sd=1;3), waarbij er geen verschillen waren tussen jongens of meisjes, en zeer geringe tussen NT1- en NT2-sprekers (resp. 6;2 en 6;4 jaar, beide sd. 1;3). Naast de taaldata werden verschillende achtergrondgegevens van de kinderen verzameld, zoals thuistaalgebruik. Tabel 28

Proefpersonen verdeeld over NT1/NT2 en sekse

NT1-sprekers NT2-sprekers totaal

jongens 46 48 94

meisjes 41 45 86

totaal 87 93 180

Naast alle deeltoetsen van de TAK (zie eerdere hoofdstukken) zijn ook gesprekken met de kinderen opgenomen en geanalyseerd. Met elke proefpersoon is een gesprek van een half uur tot drie kwartier gevoerd, waarin zij vertelden aan de hand van een strip zonder woorden en naar aanleiding van vragen hen gesteld over vriendjes, televisie en vakantie. Dit gesprek is op de band opgenomen, getranscribeerd en geanalyseerd op een aantal variabelen met betrekking tot klanken, woorden, morfologie, syntaxis en tekst. Per kind was er een corpus van 150 tot 200 interpreteerbare uitingen, zonder ja, nee, interjecties en directe imitaties van de proefleider. Op de volgende aspecten werden de spontane-taaldata geanalyseerd, te vergelijken met de vaardigheden uit de toetstaken op respectievelijk klank-, woord-, morfologie, syntaxis- en tekstniveau: – Woordarticulatie, gebaseerd op het relatieve aandeel correct gearticuleerde woorden op het totaal aantal woorden in het gesprek; – Woordenschat, gebaseerd op het totaal aantal verschillende lemma's (woordenboek-ingangen) in het gesprek; – Morfologie, gebaseerd op het relatieve aandeel in verplichte context goed verbogen zelfstandige naamwoorden en vervoegingen van het voltooid deelwoord in het gesprek; – Syntaxis, gebaseerd op gemiddelde zinslengte (MLU) van de geanalyseerde zinnen (dus exclusief zinnen met alleen ja of nee); – Tekst, gebaseerd op het relatieve aandeel correcte antwoorden op de door de proefleider in het gesprek gestelde Wh-vragen (alleen in paren Wh-vraag-antwoord). Elke leerkracht is gevraagd zijn of haar leerling individueel te beoordelen op verschillende deeltaalvaardigheden in het Nederlands door middel van een lijst van 24 paren van tegengestelde uitspraken op een vijfpuntsschaal. Telkens vier of vijf uitspraken corresponderen met één van de vijf deelvaardigheden die ook in de toetstaken en de spontane-taalanalyses onderscheiden worden. Elk paar bevat een positieve en negatieve pool over de betreffende deelvaardigheid, en refereert aan direct observeerbaar gedrag, zoals in de volgende paren die geformuleerd zijn bij respectievelijk ‘woordenschat' en ‘morfologie': 35

Zoekt bij het spreken vaak naar woorden Heeft geen problemen werkwoorden correct te vervoegen

2–1–0–1–2 2–1–0–1–2

Heeft bij spreken snel woorden paraat Heeft problemen met juiste werkwoordsvervoeging

Door omcirkeling kan aangegeven worden of het gedrag van de leerling meer door de linker, dan wel de rechter uitspraak kan worden getypeerd. Bij een aantal uitspraken zijn de polen omgedraaid om antwoordtendenties tegen te gaan. Aan de hand van deze 24 paren beoordeelde de leerkracht zonder tijdsdruk de taalvaardigheid van een leerling, waarbij elk van de schalen van 1 tot en met 5 gewaardeerd werd. Er zijn vijf sub-schalen onderscheiden voor klank (vijf paren), woord (zes paren), morfologie (drie schalen), syntaxis (zes paren) en tekst (vier paren). In eerder onderzoek (Verhoeven & Vermeer, 1989; 1996) is de hanteerbaarheid, betrouwbaarheid en validiteit van het instrument voldoende bevonden (Cronbach’s alphas alle p > .90). De betrouwbaarheid is ook in het onderhavige onderzoek betrouwbaar gebleken (interne consistentie, Cronbach's alphas voor de vijf subschalen respectievelijk .92, .95, .92, .96 en .92). De taken van de TAK en de spontane taaldata zijn individueel in aparte ruimtes in de scholen afgenomen door doctoraalstudenten Interculturele Communicatie (Letteren, UvT) in het kader van een onderzoeksgroep. In de periode van onderzoek vulden de leerkrachten de beoordelingsschalen in voor elk van de onderzochte leerlingen. Door middel van correlationele analyses is nagegaan in hoeverre er sprake is van convergente dan wel divergente validiteit. Daarbij zijn, ook omwille van de overzichtelijkheid, alleen de productieve toetstaken vergeleken met de spontane-taalmaten (die immers ook productieve vaardigheden betreffen) en de leerkrachtoordelen. Aangezien het referentiepunt voor het oordeel van elke leerkracht het gemiddelde niveau in een jaargroep is, is dat niveau bijgevolg afhankelijk van de jaargroep (1, 2, 3, of 4) waar hij les aan geeft. Het oordeel is met andere woorden relatief. Om toch een goede vergelijking met de (absolute) toetsdata en spontanetaaldata mogelijk te maken, is eerder nagegaan hoe groot de verschillen in taalvaardigheid tussen de vier jaargroepen zijn. Op de meeste taken bleken de verschillen in de scores op de taken tussen de jaargroepen bijna één standaarddeviatie te zijn. Op basis hiervan lijkt het gerechtvaardigd om bij de leerkrachtoordelen bij de scores op elk item voor de proefpersonen uit groep 2 steeds een punt op te tellen, uit groep 3 twee punten, en groep 4 drie punten. Vervolgens is in variantie-analyses nagegaan in hoeverre er verschillen in de procedures (indirecte TAK, indirect oordeel of directe spontane-taaldata) zijn tussen NT1/NT2-sprekers, en tussen jongens en meisjes. Daarbij zijn de scores op de verschillende variabelen gestandaardiseerd door middel van z-scores, apart voor de drie procedures (toetsen, spontane taaldata en leerkrachtoordelen) en voor de vijf deelaspecten (klank, woord, morfologie, syntaxis, tekst). Resultaten In Tabel 29 worden de gemiddelden en standaarddeviaties gegeven voor de totale groep op de vijf deeltaalvaardigheden van de drie onderscheiden procedures: van de productieve toetstaken (Articulatietaak, Woordomschrijvingstaak, Woordvormingstaak, Zinsvormingstaak, en Verteltaken), de spontane-taaldata (%goed-gearticuleerde woorden, aantal verschillende lemma’s, %goed-verbogen woorden, MLU, %goed-Wh-paren), en de leerkrachtoordelen (oordklank, oordwoord, oordmorf, oordsyntax, oordtekst). Met name op de Articulatietaak (maximale score = 45) en het %goedgearticuleerde woorden worden relatief hoge scores gehaald, waardoor men beducht moet zijn voor plafondeffecten.

36

Tabel 29 Gemiddelden en standaarddeviaties, minimum- en maximumscores (tussen haakjes aantal items c.q. maximaal te behalen score) gemiddelde toetstaken Articulatietaak (45) Woordomschrijvingstaak (45) Woordvormingstaak (24) Zinsvormingstaak (40) Verteltaken (32) spontane-taaldata %goed-gearticuleerd (100) lemma’s %goed-verbogen (100) MLU %goed-Wh-paren (100) leerkrachtoordelen oordklank (40) oordwoord (48) oordmorfologie (24) oordsyntaxis (48) oordtekst (32)

sd

minimum

maximum

40.7 13.7 10.9 23.8 18.4

9.4 8.1 6.4 10.4 6.8

10 0 0 0 0

45 38 24 40 32

98.5 200.6 79.7 5.06 88.5

20.8 78.7 22.4 1.47 14.0

80.0 22 0 1.15 0

100 429 100 8.91 100

26.4 28.5 13.8 29.1 21.4

8.1 10.1 5.6 10.3 6.8

5 6 3 6 4

40 48 24 48 32

Tabel 30 Correlaties tussen de vijf deeltaalvaardigheden in drie verschillende procedures: spontane-taaldata (wit), taken (lichtgrijs) en leerkrachtoordelen (donkergrijs)

.39 .28 .32 .15 .23 .57 .35 .21 .33 .22 .41 .48

Oord.tekst

.43 .44 .90 .53 .70 .95 .51 .70 .93 .51 .71

%Whvragen

.36 .42 .61 .49 .72 .68 .60 .75 .70 .59

Verteltaak

.28 .49 .43 .58 .57 .50 .44 .53 .52

Oord.synt

.42 .43 .85 .56 .71 .91 .56 .72

MLU

.31 .38 .62 .44 .74 .66 .57

tekst

Zinsv.taak

.22 .42 .46 .38 .51 .48

Oord.morf

.41 .42 .87 .52 .65

syntaxis

Morf.taak

.36 .44 .60 .54

%g verbogen

lemma

.23 .35 .46

Oord.wrd

.41 .44

morfologie

Wrd.taak

.34

Oord. Lank

woord Artic.taak

%goed-art

klank

.35 .34 .53 .41 .58 .51 .36 .49 .52 .43 .58 .62 .27

.41 .40 .90 .48 .62 .92 .48 .64 .85 .47 .51 .92 .37 .71

%goed-art Artic.taak Oord.klank lemma Wrdtaak Oord.wrd %g-verb Morf.taak Oord.morf MLU Zinsv.taak Oord.synt %g-Wh Verteltaak Oord.tekst

Vervolgens zijn (Pearson) correlaties bepaald tussen deze scores (zie Tabel 30). Alle correlaties zijn significant op 1%-niveau (p < .01), op één uitzondering na: lemma x %goed-Wh-vragen (r=.15, p=.05). Binnen elke procedure geven de oordelen van de leerkrachten steeds de hoogste correlaties te zien (range van de correlaties .85 – .95), daarna de toetstaken (range van de correlaties .34 – .75), en daarna de spontane taaldata (range van de correlaties .15 – .58). Wat betreft de convergente validiteit (de samenhang tussen testen of maten die dezelfde deelvaardigheid meten) is het zo dat voor elke deelvaardigheid geldt dat de correlatie tussen toetstaken en oordelen steevast wat hoger is dan die tussen toetstaken en spontane-taaldata, of die tussen oordelen en spontane-taaldata. 37

Deze correlaties tussen de drie procedures die dezelfde vaardigheid meten zijn in Tabel 30 steeds per groepje van drie vetgedrukt (voor klank: .44 resp. .34 en .41; voor woord: .65 resp. .54 en .52; voor woordvorming: .72 resp. .57 en .56; voor syntax: .71 resp. .59 en .51; en tekst: .71 resp. .27 en .37). De relatief lage correlatie (maximaal .44) voor klankvaardigheid wordt mogelijk veroorzaakt door de hoge scores (plafondeffect). Op grond van deze (vetgedrukte) correlaties tussen de procedures die dezelfde 'trait' meten, kan met andere woorden gesproken worden van een goede convergente validiteit van de toetstaken. Wat betreft de divergente validiteit (minder samenhang met taken of maten die een andere 'trait' meten) is het zo dat bij de toetstaken de correlatie tussen een taak en het oordeel over dezelfde deeltaalvaardigheid, steeds wat hoger is dan de correlatie tussen die taak en het oordeel over de andere deeltaalvaardigheden. Omwille van de overzichtelijkheid zijn in Tabel 31 deze correlaties tussen toetstaken en oordelen uit Tabel 30 apart weergegeven. De correlatie tussen de toetstaak en de oordelen die dezelfde deelvaardigheid meten, is in Tabel 31 vetgedrukt. Deze correlatie is – behalve bij de woordomschrijvingstaak – steeds wat hoger dan de links en/of rechts staande correlaties met de oordelen over de andere deelvaardigheden (voor de articulatietaak: .44 met oorklank, maar .44, .40, .42 en .43 met de oordelen over de andere deeltaalvaardigheden; voor de woordvormingstaak: .72, maar .66, .64, .70 en .62 met de andere oordelen; voor de zinsvormingstaak: .71, maar .68, .51 .61 en .70 met de andere oordelen, voor de verteltaak: .71, maar .51, .53, .53 en .52 met de andere oordelen). Tabel 31 Correlaties tussen de vijf taalvaardigheden als vastgesteld in de toetstaken (lichtgrijs) en de oordelen (donkergrijs); gedeelte uit Tabel 30 Oord.klank .44 .60 .62 .61 .53

Oord.wrd .42 .65 .66 .68 .51

Oord.morf .43 .71 .72 .70 .52

Oord.synt .44 ,70 .70 .71 .62

Oord.tekst .40 .62 .64 .51 .71

Artic.taak Wrd.taak Morf.taak Zinsv.taak Verteltaak

Alleen bij de woordomschrijvingstaak zijn er twee uitzonderingen: naast de correlatie van .65 met het oordeel over woordenschat zijn er twee lager (.62 en .60) en twee hoger: .70 met het oordeel over syntaxis en .71 met het oordeel over morfologie. In de variantie-analyse verderop in deze verantwoording kunnen we deze uitzonderingen verklaren op grond van een nadere analyse van het oordeel van leerkrachten over woordvaardigheid. Bij de toetstaken gecorreleerd aan de leerkrachtoordelen, zijn er dus slechts twee van de twintig correlaties tussen verschillende deelvaardigheden hoger dan de correlaties tussen de procedures van dezelfde deelvaardigheid, hetgeen op een goede divergente validiteit wijst. Zowel voor wat betreft de convergente als divergente validiteit is er dus voor de toetstaken een goede constructvaliditeit gevonden. De beide andere procedures (leerkrachtoordelen en spontane-taaldata) hebben niet alleen lagere correlaties tussen dezelfde deelvaardigheden, maar ook vaker schendingen van de divergente validiteit: zowel bij ‘oordelen’ gecorreleerd aan ‘spontaan’, als bij ‘spontaan’ gecorreleerd aan ‘toets’, zijn in negen van de twintig gevallen de correlaties tussen verschillende deelvaardigheden hoger dan de correlaties tussen de procedures die dezelfde deelvaardigheid meten. In Tabel 32 zijn de betreffende correlaties tussen de toetstaken en de spontane-taaldata uit Tabel 30 omwille van de duidelijkheid apart gezet. Net als in Tabel 31 zijn ook hier de correlaties tussen de toetstaak en de variabele uit de spontane-taaldata die dezelfde deelvaardigheid meet, vetgedrukt. Bij de spontanetaaldata lijken vooral de plafondeffecten voor het %goed gearticuleerde woorden, en het %goede Whparen, voor zeer lage correlaties te zorgen.

38

Tabel 32 Correlaties tussen de toetstaken (lichtgrijs) en de spontane-taaldata (donkergrijs); gedeelte uit Tabel 30 %g-art .34 .36 .31 .36 .35

lemma .35 .54 .44 .49 .41

%g-verb .42 .51 .57 .60 .36

MLU .49 .57 .53 .59 .43

%g-Wh .28 .23 .21 .41 .27

Artic.taak Wrd.taak Morf.taak Zinsv.taak Verteltaak

Om na te gaan of de verschillende toetsprocedures een verschillend beeld geven van de verschillen tussen groepen leerlingen, met andere woorden: of sekse en T1/T2-vaardigheid methode-variantie opleveren, is in variantie-analyses onderzocht in hoeverre er tussen jongens en meisjes, dan wel eerste- en tweede-taalsprekers, verschillen bestaan tussen de drie gehanteerde procedures. Daarbij zijn de scores op de verschillende maten gestandaardiseerd door middel van z-scores, apart voor de drie procedures (leerkrachtoordelen, toetsen en spontane-taaldata) en voor de vijf deeltaalvaardigheden (klank, woord, morfologie, syntaxis, tekst). Alle toetstaken zijn hierbij meegenomen. Tabel 33

Variantie-analyse, between subjects

NT1/ NT2 Sekse NT1/ NT2 x sekse Error

SS 214.01 .00 18.56 936.87

df 1 1 1 151

MS 214.01 .00 18.56 6.20

F 34.49 .00 2.99

p .00 .99 .09

Zoals te verwachten (cf. Driessen 1996) zijn de verschillen tussen NT1- en NT2-sprekers significant (between subjects, F(1,151) = 34.49, p < .00, zie Tabel 33) maar niet die tussen jongens en meisjes, noch de interactie tussen NT1/NT2 en sekse. Noch de procedures (within subjects, F(2,151) = .343, p = .710), noch de deeltaalvaardigheden (‘trait’) laten significante verschillen zien (within subjects, F(4,151) = .317, p = .866). Op elke deeltaalvaardigheid zijn de verschillen tussen NT1- en NT2-sprekers significant (within subjects, interactie Trait x NT1/NT2, F(4,151) = 15.566, p < .000). Ook de interactie tussen procedure en NT1/NT2-sprekers is significant (within subjects, F(2,151) = 3.792, p = .024), maar niet de interactie tussen procedure en sekse (within subjects, F(2,151) = .469, p = .626), of ‘trait’ en sekse (within subjects, F(4,151) = 1.018, p = .397). Met andere woorden: NT1-sprekers scoren op alle deelvaardigheden bij alle procedures significant hoger dan NT2-sprekers, zonder verschillen tussen jongens en meisjes. Maar bij sommige procedures zijn de verschillen tussen NT1- en NT2-sprekers geringer dan bij andere. Bij sekse is dit niet het geval: ongeacht de procedure scoren jongens en meisjes hetzelfde. In Figuur 14, waarin voor de drie procedures apart, de z-scores van de vijf deeltaalvaardigheden voor NT1- en NT2-sprekers apart zijn weergegeven, is goed te zien dat er systematisch verschillen zijn in de maten: de spontane-taalmaten geven kleinere verschillen aan tussen de twee groepen dan de oordelen en de toetstaken. Met name op klanken vertelvaardigheid is dit het geval. Een ander opvallend verschil is te zien in de deelvaardigheid woordenschat. De woordenschattaken van de toets geven een aanzienlijk groter verschil aan tussen de NT1- en NT2-sprekers dan de twee andere procedures. Dit verschil komt overeen met de (in vergelijking met andere deeltaalvaardigheden) veel grotere achterstand in woordenschat die in onderzoek (cf. Driessen, 1996) gevonden en in de praktijk van het onderwijs (Appel & Vermeer, 1997) aangegeven wordt. De toets geeft vermoedelijk een meer valide beeld van de werkelijkheid dan het oordeel van de leerkracht. De discrepantie tussen woordenschattoets (met grote verschillen tussen lage en hoge scoorders) en leerkrachtoordelen over woordenschat (met kleine verschillen) geeft mogelijk een verklaring voor de relatief lage correlatie tussen die twee (r=.65). Deze verklaring geeft een verdere ondersteuning aan de al gevonden convergente-divergente validiteit van de deelvaardigheidstoetsen, en daarmee aan de constructvaliditeit van de toetstaken van de TAK.

39

Figuur 14 z-scores van de vijf deeltaalvaardigheden (klank, woord, morfologie, syntaxis en tekst) voor NT1- en NT2-sprekers op de drie procedures (toetstaken, spontane-taaldata, leerkrachtoordelen)

0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 -0,1 -0,2 -0,3 -0,4 -0,5

klank

woord

morf

syntax

NT1toets

NT1oor

NT1spont

NT2toets

NT2oor

NT2spont

tekst

Conclusies en discussie In deze paragraaf is de begripsvaliditeit van de deeltaken van de Taaltoets Alle Kinderen onderzocht door de convergente en divergente validiteit van de onderscheiden deeltaalvaardigheden met betrekking tot klanken, woorden, morfologie, syntaxis en tekst onder de loep te nemen. Iedere deeltaalvaardigheid is gemeten met drie procedures: toetstaken, analyse van spontane-taaldata, en leerkrachtoordelen. Uit de correlationele analyses is naar voren gekomen dat de toetstaken van de TAK een goede convergente en divergente validiteit vertonen: de met de toetstaken gemeten deelvaardigheden vertonen niet alleen samenhang (convergentie) met de maten uit de andere procedures die dezelfde deelvaardigheid meten, maar de daarbij gevonden correlaties zijn in bijna alle gevallen steeds wat hoger dan de correlaties met de taken uit dezelfde of andere procedures die een andere deelvaardigheid meten (divergentie). De beide andere procedures (leerkrachtoordelen en spontane-taaldata) hebben zowel lagere correlaties tussen dezelfde deeltalvaardigheden als vaker schendingen van de divergente validiteit. Bovendien is uit variantie-analyses gebleken dat er bij de spontane-taaldata en leerkrachtoordelen methode-variantie optreedt omdat met de maten van de spontane taaldata de verschillen tussen NT1- en NT2-sprekers op alle deelvaardigheden afgevlakt worden, en met de leerkrachtoordelen de verschillen in woordenschat tussen NT1- en NT2-sprekers onderschat worden. 5.1.3

Vergelijking tussen kinderen uit regulier onderwijs en speciaal basisonderwijs

Voor de verschillende aspecten van taalvaardigheid wordt in dit hoofdstuk onderzocht in welke mate allochtone kinderen achterlopen bij autochtone, ook vergeleken met die vaardigheden van die twee groepen kinderen in het reguliere bao. In het licht van de hierboven genoemde problemen van sbao40

leerlingen op het terrein van het hypothesetoetsend verbale leervermogen of problemen met het vermogen tot verbale informatieverwerking in meer brede zin, wordt bijvoorbeeld ook nagegaan of deelvaardigheden waarbij regelafleiding dan wel structurering een belangrijke rol speelt (morfologische en syntactische taken, tekstbegrip), een groter probleem vormen voor sbao- dan voor bao-leerlingen. Daartoe zijn bij 134 leerlingen (7- tot 10-jarigen) in het sbao de toetstaken van de TAK afgenomen (op het niveau van fonologie, woordenschat, morfologie, syntaxis en tekst) en spontanetaaldata geanalyseerd (200 uitingen elke proefpersoon) op dezelfde deeltaalvaardigheidsniveaus. Op basis van deze gegevens zullen de volgende vragen beantwoord worden: (1) Is er op de deeltaken van de TAK sprake van significante verschillen in scores tussen autochtone en allochtone kinderen in het sbao? (2) Hoe verhouden de scores van deze sbao-leerlingen zich ten opzichte van leeftijdgenoten in het reguliere basisonderwijs? (3) Vormen specifieke deeltaken (bijvoorbeeld morfologische en syntactische taken, of tekstbegrip, omdat structurering daarbij een grotere rol speelt), een groter probleem voor sbao- dan voor baoleerlingen? (4) Geven de deeltaken van de TAK in vergelijking met spontane-taaldata en leerkrachtoordelen een goede beoordeling van de taalvaardigheden van de leerlingen? Verondersteld wordt dat er significante verschillen gevonden worden tussen autochtone en allochtone kinderen in het speciaal basisonderwijs. Ook tussen kinderen uit het speciaal basisonderwijs en het basisonderwijs worden grote verschillen verwacht, en dat de grootste verschillen zullen liggen op deelvaardigheden waarin de structuur een belangrijke rol speelt, dus morfologie, zinsvorming en syntaxis, als gevolg van hun leerproblemen. De grootste verschillen tussen autochtonen en allochtonen in het sboa, zullen echter, net zoals in het bao, liggen op het niveau van woordenschat, als gevolg van het beperktere nederlandstalige aanbod dat allochtonen krijgen in vergelijking met autochtonen. Opzet van het onderzoek, proefpersonen en procedure Bij 134 leerlingen uit het speciaal basisonderwijs zijn toetsgegevens, spontane-taaldata, en leerkrachtoordelen verzameld (zie ook Vermeer 2002 en 2003). Tabel 34 geeft een overzicht van de aantallen leerlingen, ook verdeeld over een groep jongere en oudere leerlingen. Tabel 34

Proefpersonen: aantallen, leeftijd per groep en bao/sbao, en totaal

autochtonen allochtonen Totaal

Jongere leerlingen n lft (sd) 38 7;8 (0;5) 30 7;9 (0;5) 68 7;9 (0;5)

Oudere leerlingen n lft (sd) 29 8;11 (0;6) 37 8;11 (0;5) 66 8;11 (0.5)

Totaal n 67 67 134

lft (sd) 8;3 (0;9) 8;5 (0;9) 8;4 (0;9)

lft in mnd min-max 84–122 85–116 84–122

De kinderen waren afkomstig uit verschillende scholen in de regio Tilburg/Breda, maar ook uit Den Haag, Rotterdam, Den Bosch, Nijmegen en Eindhoven. Alle leerlingen komen uit lagere SEScategorieën (leerlinggewicht 1.25 en 1.9). De 134 sbao-leerlingen zijn gemiddeld praktisch even oud (gemiddeld 8 jaar en 4 maanden, sd= 9 maanden) als de bao-leerlingen eind groep 4 (gemiddeld 8 jaar en 3 maanden, sd= 4 maanden). De allochtone leerlingen zijn iets ouder dan de autochtone, net zoals dat bij de leerlingen in het reguliere basisonderwijs het geval is. Noch de verschillen in leeftijd tussen autochtonen en allochtonen, noch die tussen sbao en bao, noch de interactie is significant. De autochtone leerlingen zaten gemiddeld 16 maanden in het sbao (sd=13 maanden), de allochtonen 12 maanden (sd=11 maanden). Dit verschil is net niet significant. Op 6 leerlingen na, zijn de allochtonen van Mediterrane herkomst. Er zijn meer jongens (n=76) dan meisjes (n=58), hetgeen een afspiegeling is van de sbao-populatie. In eerder onderzoek met een gedeelte van deze data (Vermeer 2002) konden geen verschillen tussen jongens en meisjes gevonden worden, noch in de toetsdata, noch in de spontane-taaldata. Naast alle deeltoetsen van de TAK zijn ook gesprekken met de kinderen opgenomen en geanalyseerd, omdat spontane-taaldata mogelijkerwijs andere aspecten van taalvaardigheid laten zien omdat de elicitatieprocedure minder artificieel van karakter is dan bij een toetsbatterij. Met elke proefpersoon is een gesprek van een half uur tot drie kwartier gevoerd, waarin zij vertelden aan de 41

hand van een strip zonder woorden en naar aanleiding van vragen hen gesteld over vriendjes, televisie en vakantie. Dit gesprek is op de band opgenomen, getranscribeerd en geanalyseerd op een aantal variabelen met betrekking tot klanken, woorden, morfologie, syntaxis en tekst. Per kind was er een corpus van 150 tot 200 interpreteerbare uitingen, zonder ja, nee, interjecties en directe imitaties van de proefleider. Op de volgende aspecten werden de spontane-taaldata geanalyseerd, te vergelijken met de vaardigheden uit de toetstaken op respectievelijk klank-, woord-, morfologie, syntaxis- en tekstniveau: – Woordarticulatie, gebaseerd op het relatieve aandeel correct gearticuleerde woorden op het totaal aantal woorden in het gesprek; – Woordenschat, gebaseerd op het totaal aantal verschillende lemma's (woordenboek-ingangen) in het gesprek; – Morfologie, gebaseerd op het relatieve aandeel in verplichte context goed verbogen zelfstandige naamwoorden en vervoegingen van het voltooid deelwoord in het gesprek; – Syntaxis, gebaseerd op gemiddelde zinslengte (MLU) van de geanalyseerde zinnen (dus exclusief zinnen met alleen ja of nee); – Tekst, gebaseerd op het relatieve aandeel correcte antwoorden op de door de proefleider in het gesprek gestelde Wh-vragen (alleen in paren Wh-vraag-antwoord). De taken van de TAK en de spontane-taaldata zijn individueel in aparte ruimtes in de scholen afgenomen door doctoraalstudenten Interculturele Communicatie (Letteren, UvT) in het kader van een onderzoeksgroep. De leerkrachten hebben van elk kind een beoordelingslijst grammaticale taalvaardigheid ingevuld. Met het oog op het onderzoeken van de vragen zijn de scores van de leerlingen op de toetsen, beoordelingslijsten en spontane-taaldata ingevoerd in SPSS. Door middel van variantie-analyses is nagegaan in hoeverre er verschillen in scores zijn tussen sbao en bao, en tussen autochtonen en allochtonen. Om vergelijking tussen de scores op de verschillende maten ook visueel goed mogelijk te maken, zijn daartoe de scores op de verschillende toetstaken gestandaardiseerd door middel van z-scores. Verschillen tussen autochtone en allochtone leerlingen in het sbao In Tabel 35 worden de gemiddelden en standaarddeviaties op de taken van de TAK en de spontanetaalmaten gegeven, apart voor autochtonen en allochtonen voor beide leeftijdsgroepen. Uit de tabel valt af te lezen dat de autochtone leerlingen op praktisch alle toetstaken hoger scoren dan de allochtone leeftijdsgenoten, met uitzondering van de verteltaken bij de jongere, en de klankonderscheidingstaak bij de oudere leerlingen. Op vier taken (Passieve woordenschat, Woordomschrijving, Woordvorming en Zinsbegrip functiewoord) liggen de allochtone leerlingen rond één standaarddeviatie achter op hun autochtone leeftijdsgenoten, en scoren de jongere autochtonen zelfs hoger dan de gemiddeld 1;3 jaar oudere allochtone leerlingen. Op de twee Zinsbegripstaken, de Zinsvormingstaak en de Tekstbegripstaak liggen de allochtonen rond een halve standaarddeviatie achter op hun autochtone leeftijdsgenoten. Uit variantie-analyses komt naar voren dat met uitzondering van de beide klanktaken (waar plafondeffecten zijn) en de verteltaken, de verschillen tussen autochtonen en allochtonen op de toetstaken van de TAK significant zijn (alle sig of F < .01). Vooral bij de woordenschattaken en de woordvormingstaak zijn de F-waarden hoog. Met uitzondering weer van beide klanktaken, zijn ook de verschillen tussen de jondere en oudere leerlingen significant (alle sig of F < .01). De interacties tussen leeftijd en etnische groep is voor geen van de taken significant. Ook tussen de seksen worden geen significante verschillen gevonden. Beide etnische groepen gaan dus in de loop van de tijd vooruit, en de verschillen tussen beide groepen zijn substantieel en worden niet kleiner. Wat betreft de spontane taaldata, zijn er geen verschillen autochtoon en allochtoon op het percentage goed gearticuleerde woorden. Net zoals uit de klanktaken naar voren komt, maken de leerlingen nauwelijks geen fouten meer in de articulatie. Op de overige maten scoren de oudere kinderen hoger dan de jongere, en de autochtonen hoger dan de allochtonen. Uit variantie-analyses komt naar voren dat het verschil tussen autochtonen en allochtonen op het percentage goed verbogen woorden significant is (sig of F < .01), en ook op de gemiddelde zinslengte (MLU) en het percentage goed beantwoorde vraag-antwoord-paren (beide sig of F < .05). Tussen oudere en jongere leerlingen is de toename van het aantal lemma’s (sig of F < .01) en van de MLU (sig of F = .01) significant. Geen van de interacties is significant. Ook op de spontane-taalmaten is het dus zo dat beide etnische groepen in de loop van de tijd vooruit gaan, en dat de verschillen tussen beide groepen op morfologie, zinslengte en vraag-antwoordparen substantieel zijn en niet kleiner worden. 42

Tabel 35 Gemiddelden en standaarddeviaties op de toetstaken en spontane-taalmaten, apart voor autochtonen en allochtonen, en beide leeftijdsgroepen autochtonen Leeftijd 7;8 gem sd Toetsen TAK Klankonderscheiding Articulatie Passieve woordenschat Woordomschrijving Woordvorming Zinsbegrip functiewoord Zinsbegrip patronen Zinsvorming Tekstbegrip Verteltaken Spontane-taaldata % goed gearticuleerd aantal lemma’s % goed verbogen MLU % goede Wh-paren Leerkrachtoordelen Grammaticale taalvaard

allochtonen Leeftijd 8;11 gem sd

Leeftijd 7;9 gem sd

Leeftijd 8;11 gem sd

43.9 42.0 60.6 16.8 13.8 34.0 31.4 23.3 14.9 17.3

5.3 2.7 14.7 4.6 4.0 4.4 4.5 7.7 4.1 4.9

44.2 43.0 72.4 22.2 16.8 37.0 35.8 28.9 18.3 21.4

5.8 2.1 7.8 5.2 4.2 2.5 3.2 7.8 3.6 5.6

43.2 41.4 48.7 11.2 9.9 32.1 28.8 17.7 12.9 18.3

6.8 2.1 15.2 5.1 5.3 4.9 5.5 8.7 4.7 5.6

45.3 42.1 60.1 15.6 12.6 33.7 32.9 24.7 15.9 20.3

4.9 4.0 14.5 6.7 5.2 5.9 5.6 7.0 4.7 5.7

99 222 89 5.6 92

1 64 11 1.1 8

100 272 93 6.5 94

1 70 9 1.8 6

99 201 79 5.4 88

1 57 13 1.2 10

100 261 83 5.7 91

0 89 20 1.1 10

74.9

19.1

87.1

17.9

57.9

19.0

69.1

22.5

Op de Observatielijst Grammaticale taalvaardigheid zijn zowel de verschillen tussen autochtonen en allochtonen, als die tussen beide onderscheiden leeftijdsgroepen, significant. Ook hier is de interactie tussen leeftijd en etnische groep niet significant. Ook tussen jongens en meisjes worden geen verschillen gevonden. De oordelen van de leerkrachten over de taalvaardigheid van de leerlingen komen dus overeen met de uitkomsten van de toetstaken en de spontane taaldata. Overigens schatten zij de taalvaardigheid van de jongere autochtonen veel hoger (74.9) in dan die van de oudere allochtonen (69.1). Dit verschil is veel groter dan de verschillen tussen die beide groepen op de TAKtaken rechtvaardigen. Tussen de drie verschillende operationaliseringen van taalvaardigheid (toetstaken, spontane taaldata en leerkrachtoordelen) worden redelijk hoge correlaties gevonden (alle p < .000). De correlaties tussen de gemiddelde z-scores van de tien TAK-taken, die van de vijf spontane-taalmaten, en die van de leerkrachtoordelen staan in Tabel 36. De correlaties zijn lager dan die gevonden worden in het normeringsonderzoek in groep 1 en 2. De in groep 1 en 2 gevonden correlaties liggen rond de .70. Tabel 36 Spontane taaldata .59

Correlaties tussen TAK, spontane-taaldata, en leerkrachtoordelen Leerkracht oordelen .58 .45

alle p < .000 TAK-taken Spontane taaldata

Verschillen tussen sbao- en bao-leerlingen Omdat de leerlingen in het reguliere basisonderwijs eind groep 4 uit het normeringsonderzoek een gemiddelde leeftijd hebben van 8 jaar en 3 maanden (de Mediterranen 8 jaar en 4 maanden), is voor een vergelijking van sbao-leerlingen met deze bao-leerlingen de totale groep van 134 sbao-leerlingen samengenomen (die gemiddeld 8;4 jaar oud zijn). De gemiddelden en standaard-deviaties op de TAKtaken van autochtonen en allochtonen in beide schooltypen staan in Tabel 37. Bij de allochtone baoleerlingen zijn de scores van de Mediterranen eind groep 4 als vergelijking genomen.

43

Tabel 37 Gemiddelden en standaarddeviaties op de TAK, apart voor autochtonen en allochtonen en per schooltype (sbao en bao)

Klankonderscheiding Articulatie Passieve woordenschat Woordomschrijving Woordvorming Zinsbegrip functiewoord Zinsbegrip patronen Zinsvorming Tekstbegrip Verteltaken

Speciaal Basisonderwijs

Basisonderwijs, eind groep 4

autochtonen gem sd 44.1 5.4 42.5 2.5 66.2 13.7 19.3 5.5 4.5 15.3 35.3 4.0 33.4 4.6 25.8 8.1 16.5 4.2 19.1 5.5

autochtonen gem sd 49.2 1.4 44.8 0.5 83.8 7.5 28.0 5.9 21.3 3.0 40.0 1.8 39.1 2.5 4.8 35.6 3.2 20.6 24.2 5.8

allochtonen gem sd 5.9 44.3 41.8 3.3 55.0 15.8 13.6 6.3 11.4 5.4 33.0 5.5 30.9 5.9 21.2 8.7 14.5 4.9 5.7 19.3

allochtonen gem sd 48.5 2.5 44.6 0.9 64.8 13.1 16.9 5.4 4.6 15.5 38.0 2.3 36.5 3.2 30.0 7.3 17.5 4.2 22.4 6.3

Uit de tabel valt af te lezen dat de bao-leerlingen uit het normeringsonderzoek op alle toetstaken (veel) hoger scoren dan de sbao-leerlingen. Op alle taken (zelfs bij de beide klanktaken en de Zinsbegriptaak functiewoorden, waar plafondeffecten optreden: maximale scores resp. 50, 45 en 42), zijn de verschillen tussen bao en sbao significant (alle taken Sig of F<.000). Daarbij zijn er geen erg grote verschillen tussen de taken: de autochtone sbao-leerlingen scoren over de hele linie op de taken rond één hele standaarddeviatie lager dan de autochtone bao-leerlingen. Bij de Passieve woordenschat en Zinsvormingstaak is het verschil ruim één standaarddeviatie. Het grootste verschil (meer dan anderhalve standaarddeviatie) is er op de Woordomschrijvingstaak. Bij de allochtonen zijn de verschillen tussen beide schooltypen iets minder groot, maar nog steeds substantieel, met verschillen rond een halve standaarddeviatie op de meeste taken. Met uitzondering van beide woordenschattaken scoren de allochtone leerlingen in het reguliere basisonderwijs op alle taken hoger dan de autochtone leeftijdsgenoten in het sbao. In Figuur 15 zijn van de toetstaken de relatieve scores voor autochtonen en allochtonen op de afzonderlijke deelvaardigheden met betrekking tot klanken, woorden, morfologie, zinsbegrip, zinsvorming en tekstvaardigheid weergegeven. Daarbij zijn de 134 leerlingen van het sbao (allen 1.25of 1.90-leerlingen) vergeleken met 134 random geselecteerde 1.25- en 1.90-leerlingen uit het normeringsonderzoek. Vervolgens zijn de scores op de verschillende toetstaken gestandaardiseerd door middel van z-scores. De twee klanktaken zijn samengenomen en gemiddeld, evenals de twee woordenschattaken, de twee zinsbegripstaken en de tekstbegrip- en verteltaken. Uit Figuur 15 is de relatieve positie van beide groepen leerlingen in beide schooltypen op de toetstaken goed af te lezen. Sbao-leerlingen laten op alle deelvaardigheden grote achterstanden zien ten opzichte van baoleerlingen, en allochtonen op autochtonen. Alleen op woordenschat scoren autochtone sbaoleerlingen even hoog als allochtone bao-leerlingen, hetgeen verklaard kan worden door het veel latere en veel geringere contact van allochtonen met het Nederlands. In iets mindere mate geldt dit ook voor morfologie, hetgeen toegeschreven kan worden aan het feit dat frequentie in vorm en aanbod, eerder dan regelvorming, een rol speelt in taalverwerving, en veel morfologisch complexe woorden een eigen lexicale representatie hebben (Bauer & Nation 1993; Vermeer 1997). De verschillen tussen beide schooltypen gemiddeld bedraagt bijna een vol punt (van –.50 bij sbao tot .50 bij bao); alleen bij de teksttaken is dat verschil geringer (van –.33 tot .33).

44

Figuur 15 Grafische weergave van de z-scores van de klanktaken, woordenschattaken, morfologietaak, zinsbegriptaken, zinsvormingstaak en teksttaken van autochtone 1.25- en allochtone 1.90leerlingen uit het bao (n=134) en sbao (n=134).

1 0.8 0.6 0.4 0.2

aut bao

0

all bao aut sbao all sbao

-0.2 -0.4 -0.6 -0.8 -1 klank

woord

morf

zinsb

zinsv

tekst

Conclusies en discussie Het onderzoek laat zien dat leerlingen uit het speciaal basisonderwijs op praktisch alle toetstaken significant lager scoren dan hun leeftijdgenoten in het basisonderwijs. Dit is in lijn met de achterstand van drie tot vier jaar die in het PPON-onderzoek gerapporteerd wordt bij 12-jarige sbao-leerlingen (Van Weerden, Bechger & Hemker 2002). De leerproblemen op grond waarvan kinderen in het speciaal onderwijs zijn geplaatst, blijken samen te hangen met taalvaardigheidsproblemen. Als sbaomet bao-leerlingen vergeleken worden, zijn er tussen de taken geen grote verschillen: ze lopen bij alle taken praktisch evenveel achter. Er is geen voldoende onderbouwing voor de stelling dat taalvaardigheden waarbij structurering een grotere rol speelt, voor kinderen met leerproblemen zoveel moeilijker zouden zijn dan andere taaltaken. In feite scoren ze over de hele linie significant lager. Op de spontane-taalmaten zijn drie van de vijf maten significant verschillend tussen beide schooltypen. Dat in de spontane-taaldata minder grote verschillen in taalvaardigheid gevonden worden, heeft mogelijkerwijs ook te maken met het feit dat in deze ongestuurde conditie sprekers potentiële fouten kunnen vermijden, en dat de toevalligheid van het voorkomen van vormen en verschijnselen ongewenste procedurevariantie oplevert (Chapelle 1998). Als de autochtone met de allochtone kinderen vergeleken worden, zijn er zeer grote verschillen tussen de scores, vooral wat betreft woordenschat verschillen de twee groepen enorm. Opmerkelijk is dat de verschillen tussen autochtone 1.25-leerlingen en allochtone 1.90-leerlingen in beide onderwijs-typen nagenoeg even groot zijn. Alleen in woordenschat en morfologische vaardigheden, zowel op de toetstaken als in de spontane-taaldata, scoren allochtone kinderen in het bao ongeveer hetzelfde als autochtonen in het sbao. Dit verschil kan toegeschreven worden aan verschillen in frequentie van aanbod en contact met Nederlands en nederlandstaligen. Dat allochtonen in het bao, met hun veel hogere score dan autochtone leerlingen uit het sbao op de meeste taken, ondanks hun lage score op woordenschat, niet op het speciaal basisonderwijs zijn terechtgekomen, lijkt erop te wijzen dat kinderen niet louter op basis van hun lagere taalvaardigheid naar het sbao verwezen worden (de ‘discrepantiehypothese’). Uit dit onderzoek komt niet zozeer naar voren dat sbao-leerlingen speciaal problemen zouden hebben met de structuur van taal bij taalleren, maar dat zij, en de allochtonen onder hen in het bijzonder, structureel achterlopen op bijna alle deelvaardigheden. Ook al moeten we, gezien de omvang van de steekproef, de gegevens uit dit onderzoek met de nodige voorzichtigheid interpreteren, de uitkomsten wijzen erop dat allochtone kinderen in het speciaal onderwijs in een dubbele achterstandspositie verkeren. Net als allochtone leerlingen in het basisonderwijs hebben zij een geringe Nederlandse 45

taalvaardigheid ten gevolge van een beperkter nederlandstalig aanbod in de gezinssituatie, wat vooral tot uitdrukking komt in een geringe woordenschat. Daarnaast wordt hun ontwikkeling in de Nederlandse taal eveneens negatief beïnvloed door hun beperkter leervermogen. Aangezien een goede taalvaardigheid een conditio sine qua non is voor schoolplezier en school-succes, is het belangrijk dat een school, speciaal of niet, handelingsplannen heeft voor leerlingen waarvan gebleken is dat zij een achterstand hebben. Dat betekent dat er concrete doelstellingen en subdoelen zijn geformuleerd om die achterstanden in te halen, inclusief organisatorische en didactische maatregelen, met vastleggen van tijdpad, frequentie en evaluatie (Resing e.a. 2002). Uit de verslagen van de Inspectie van het Onderwijs blijkt dat tussen 1997 en 2002 het percentage scholen waarvan de leerlingenzorg voldeed slechts 46 tot 59% is (Inspectie van het Onderwijs 2002). Er zijn dus nog volop mogelijkheden voor minstens 40% van de scholen om de onderwijsprestaties van hun leerlingen te verbeteren. 5.1.4

Vergelijking tussen leerlingen uit regulier onderwijs en ESM-leerlingen

In een drietal studies is de taalvaardigheid van kinderen uit het reguliere basisonderwijs vergeleken met die van leeftijdgenoten in het onderwijs voor kinderen met ernstige spraak-/taalmoeilijkheden (ESM). De eerste studie betreft Van Daal, Verhoeven & Van Balkom (2004). In deze studie is de taalvaardigheid, zoals gemeten met de TAK en enkele aanvullende taken, gemeten bij vierjarige ESMkinderen (N=110) in vergelijking met zich normaal ontwikkelende leeftijdgenoten. De gemiddelden en standaarddeviaties staan vermeld in Tabel 38. Tabel 38 Gemiddelden en standaarddeviaties van 110 vierjarige kinderen met ESM in vergelijking met leeftijdgenoten zonder taalleerproblemen Taak Klankonderscheiding Klankarticulatie Pass. Woordenschat Woordomschrijving Woordvorming Zinsbegrip 1 Zinsbegrip 2 Zinsvorming Tekstbegrip Verteltaak

Mean (SD) ESM 28,40 (7,46) 17,20 (12,02) 29,83 (11,90) 3,54 (3,34) 5,47 (4,00) 21,14 (7,05) 20,36 (7,94) 4,48 (6,49) 8,24 (5,70) 6,64 (5,43)

Mean (SD) normaal 36,55 (9,67) 41,26 (5,13) 42,53 (14,07) 10,69 (5,96) 11,36 (4,23) 27,05 (5,71) 25,17 (6,34) 19,69 (11,46) 12,18 (5,65) 10,51 (6,62)

p <.001 <.001 <.001 <.001 <.001 <.001 <.001 <.001 <.001 <.001

Vervolgens is met behulp van factoranalyse nagegaan in hoeverre de taaldata van de ESM-kinderen op de TAK, en op enkele andere taaltaken, zijn te herleiden tot onderliggende dimensies die verwijzen naar verschillende typen taalleerproblemen die in de literatuur worden gevonden: auditieve verwerkingsproblemen, spraakproblemen, grammaticale problemen en semantische problemen. De andere gemeten vaardigheden betreffen Cijfers Nazeggen en Woordvolgorde van de Kaufman Test. Het resultaat staat vermeld in Tabel 39. Daarbij zijn de taken van de TAK die in het onderzoek zijn meegenomen vet gedrukt. Er is sprake van een oplossing naar vier factoren. Deze zijn te interpreteren als lexicaal-semantisch (factor 1), fonologisch-syntactisch (factor 2), spraakproductie (factor 3) en auditieve verwerking (factor 4). Een dergelijk factorstructuur sluit nauw aan bij theorievorming inzake de diagnose van ernstige spraak-/taalmoeilijkheden van Bishop (2004). Op de eerste factor zien we dat een breed arsenaal van acht taken van de TAK laden. Daarnaast zien we dat de taken Zinsbegrip 1 en 2 alsmede Zinsvorming laden op de tweede factor die sterk grammaticaal bepaald lijkt. Op de derde factor zien we dat de Articulatietaak hoog laadt, naast nog twee andere taken waarbij articulatie een rol speelt: Zinsvorming en Verteltaak. En op de vierde taak zien we een hoge lading van met name Klankonderscheiding. Concluderend kunnen we stellen dat de taken van de TAK bij jonge kinderen met ESM in klinisch opzicht onderscheidend zijn.

46

Tabel 39

Factorladingen per test voor het cohort vierjarige kinderen met ESM Factor 1

Tekstbegrip Passieve Woordenschat Actieve Woordenschat Zinsbegrip 2 Woordvorming Zinsbegrip 1 Woordomschrijving Zinsvorming Verteltaken Klankonderscheiding Cijfers Nazeggen Woordvolgorde Pragmatiekscore (CCC) Woorden Nazeggen Nonsenswoorden Nazeggen Articulatie Fonologische Contrasten LAC-r 1b LAC-r 1a LAC-r 2

.79 .66 .74 .68 .58 .71 .77 .41 62

Factor 2

Factor 3

Factor 4

.43 .39

.41

.50 .43 .30

.64 .31

.84 .67 .46

.41 .38 .38 .33

.45

.85 .71 .68 .46 .81 .77 .56

.30

In een studie van Van Weerdenburg, Verhoeven en Van Balkom (2006) is een zelfde procedure gevolgd als in het voorgaande onderzoek, maar dan met ESM-kinderen in de leeftijd van 6 en 8 jaar. De gemiddelden en standaarddeviaties voor de 6-jarigen (N=148) staan vermeld in Tabel 40 en die voor de 8-jarigen (N=134) in Tabel 41. Tabel 40 Gemiddelden en standaarddeviaties van 148 zesjarige kinderen met ESM in vergelijking met leeftijdgenoten zonder taalleerproblemen Taak Klankonderscheiding Klankarticulatie Pass. Woordenschat Woordomschrijving Woordvorming Zinsbegrip 1 Zinsbegrip 2 Zinsvorming Tekstbegrip Verteltaak

Mean (SD) ESM 39,16 (9,42) 31,96 (10,62) 53,66 (15,16) 8,50 (5,72) 10,05 (4,61) 31,68 (5,45) 29,41 (5,67) 11,89 (8,16) 14,50 (4,95) 13,29 (6,68)

Mean (SD) normaal 46,10 (5,05) 43,84 (2,00) 66,17 (13,09) 18,84 (6,25) 15,70 (4,40) 35,70 (3,90) 34,20 (4,50) 29,40 (8,23) 17,91 (4,38) 18,23 (6,46)

47

p <.001 <.001 <.001 <.001 <.001 <.001 <.001 <.001 <.001 <.001

Tabel 41 Gemiddelden en standaarddeviaties van 134 achtjarige kinderen met ESM in vergelijking met leeftijdgenoten zonder taalleerproblemen Taak Klankonderscheiding Klankarticulatie Pass. Woordenschat Woordomschrijving Woordvorming Zinsbegrip 1 Zinsbegrip 2 Zinsvorming Tekstbegrip Verteltaak

Mean (SD) ESM 46,15 (4,57) 40,75 (5,05) 71,05 (12,66) 15,94 (7,55) 15,69 (5,24) 36,77 (3,30) 35,40 (4,08) 20,78 (7,99) 17,93 (3,61) 19,90 (6,22)

Mean (SD) normaal 49,06 (1,86) 44,85 (0,50) 83,65 (8,07) 27,90 (5,98) 21,34 (3,00) 39,13 (2,50) 39,97 (1,80) 35,52 (4,95) 20,53 (3,32) 24,15 (5,85)

p <.001 <.001 <.001 <.001 <.001 <.001 <.001 <.001 <.001 <.001

In de tabellen 42 en 43 worden de factoroplossingen gegeven voor alle afgenomen toetstaken. Daarbij zijn de taken van de TAK die in het onderzoek zijn meegenomen vet gedrukt. Tabel 42

Factorladingen per test voor het cohort zesjarige kinderen met ESM Factor 1

Tekstbegrip Passieve Woordenschat Actieve Woordenschat Zinsbegrip 2 Woordvorming Zinsbegrip 1 Woordomschrijving Zinsvorming Klankonderscheiding Verteltaken Cijfers Nazeggen Woordvolgorde Pragmatiekscore (CCC) Snel Benoemen Woorden Nazeggen Nonsenswoorden Nazeggen Articulatie Fonologische Contrasten LAC-r 1b LAC-r 1a LAC-r 2

.84 .77 .77 .73 .67 .67 .52 .50 .39 .38

Factor 2

Factor 3

Factor 4

.36 .36 .45

.57 .57 .46 –.41

.41 .38 .38 .33

.45

.30

48

.85 .71 .68 .46 .81 .77 .56

Tabel 43

Factorladingen per test voor het cohort achtjarige kinderen met ESM Factor 1

Actieve Woordenschat Passieve Woordenschat Tekstbegrip Zinsbegrip 2 Woordomschrijving Zinsbegrip 1 Woordvorming Pragmatiekscore (CCC) LAC-r 1a LAC-r 1b LAC-r 2 Klankonderscheiding Cijfers Nazeggen Zinsvorming Woorden Nazeggen Woordvolgorde Snel Benoemen Nonsenswoorden Nazeggen Articulatie Fonologische contrasten Verteltaken

.73 .73 .70 .68 .68 .63 .58 .40

Factor 2

Factor 3

Factor 4

.45 .35 .87 .74 .74 .44

.33 .36 .63 .62 .56 .46

.53

.49 .43

.49

.63 .55 .44 .43

Een nadere inspectie van beide tabellen laat zien dat bij de zesjarigen er een onderscheid kan worden gemaakt tussen een brede range van taken die op eerste factor laden die kan worden aangeduid als lexicaal-semantische factor, de beide zinsbegriptaken en de zinsvormingstaak laden eveneens op de tweede factor die naar grammaticale vaardigheden verwijst en articulatie laadt op de gelijknamige derde factor. Bij de achtjarigen zien we een zelfde beeld. Daar kan nog aan worden toegevoegd dat Klankonderscheiding op een vierde factor laadt die naar auditieve vaardigheden verwijst. Ten slotte is in een onderzoek van Steenge, Verhoeven en van Balkom (2006) nagegaan hoe de scores van allochtone kinderen met ESM zich verhouden ten opzichte van autochtone kinderen met ESM, allochtone kinderen zonder ESM en autochtone kinderen zonder ESM. Tabel 44 presenteert de gemiddelden en standaarddeviaties van monolinguale en bilinguale kinderen met een normale ontwikkeling en met ernstige spraak-/taalmoeilijkheden (ESM).

49

Tabel 44 Gemiddelden en standaarddeviaties voor eentalige (mono) en tweetalige (bili) kinderen met een normale taalontwikkeling (N) en met ernstige spraak-taalmoeilijkheden (ESM) Mono Groep 6

7

8

Taak

Bili

N

ESM

N

ESM

M

SD

n

M

SD

n

M

SD

n

M

SD

n

Aud. Discriminatie Articulatie

45.4 43.8

5.8 2.0

200 200

38.1 32.1

8.8 10.3

42 42

43.4 42.8

6.9 3.8

96 96

37.4 35.1

10.0 8.6

21 21

Pass. Woordenschat

62.6

13.1

200

52.8

15.0

42

37.1

12.6

96

42.1

12.8

21

Woordomschrijving

17.8

6.2

200

9.1

5.1

42

8.5

5.0

96

6.3

3.8

21

Woordvorming

15.2

4.2

200

10.1

4.5

42

7.3

4.9

96

7.7

3.5

21

Zinsbegrip 1

34.5

4.5

200

32.3

4.9

42

30.7

5.4

96

29.2

4.6

21

Zinsbegrip 2

32.9

4.7

200

29.6

6.1

42

27.5

5.4

96

27.5

5.4

21

Zinsvorming

27.6

8.9

200

13.2

8.5

42

18.1

9.7

96

10.5

7.6

21

Tekstbegrip

17.1

4.3

200

14.5

4.9

42

11.5

4.7

96

11.4

5.1

21

Aud. Discriminatie

48.3

2.5

193

41.2

11.3

45

46.6

4.3

99

42.3

6.0

23 23

Articulatie

44.6

1.0

193

35.1

8.9

45

43.8

2.2

99

34.0

9.6

Pass. Woordenschat

76.6

10.9

193

64.1

14.4

45

56.2

16.1

99

49.6

15.3

23

Woordomschrijving

23.3

6.2

193

13.8

6.8

45

13.9

6.5

99

9.9

4.7

23

Woordvorming

18.3

4.2

193

13.4

4.5

45

12.0

5.1

99

9.0

4.5

23

Zinsbegrip 1

38.2

2.9

193

34.0

5.3

45

36.1

3.3

99

32.0

5.0

23

Zinsbegrip 2

36.9

4.0

193

31.8

7.2

45

33.7

4.2

99

29.6

4.9

23

Zinsvorming

31.6

7.8

193

15.1

8.6

45

25.2

9.1

99

15.7

7.3

23

Tekstbegrip

19.6

3.7

193

16.7

5.2

45

14.8

5.1

99

12.9

4.9

23

Aud. Discriminatie

49.0

2.0

148

44.3

8.2

47

48.2

2.9

101

46.0

2.3

21 21

Articulatie

44.7

1.0

148

37.7

9.7

47

44.6

0.8

101

38.9

5.1

Pass. Woordenschat

82.8

9.3

148

72.2

11.3

47

63.1

14.4

101

53.5

12.3

21

Woordomschrijving

27.4

6.0

148

17.1

6.5

47

16.4

6.3

101

11.8

3.9

21

Woordvorming

21.2

3.3

148

14.5

5.9

47

15.3

5.2

101

10.1

3.3

21

Zinsbegrip 1

39.9

2.0

148

35.6

6.3

47

37.7

2.5

101

34.7

2.5

21

Zinsbegrip 2

39.2

2.9

148

35.3

6.8

47

35.7

4.0

101

31.9

4.2

21

Zinsvorming

35.5

5.1

148

19.2

9.7

47

29.1

8.8

101

15.6

6.6

21

Tekstbegrip

20.6

3.2

148

18.3

4.1

47

17.0

4.5

101

13.2

4.3

21

Nadere analyse laat zien dat de verschillen in scores tussen een- en tweetalige kinderen over leeftijden in alle gevallen significant zijn. Hetzelfde blijkt het geval voor de verschillen tussen eentalige kinderen met en zonder ESM. Behalve voor auditieve discriminatie en articulatie geldt bovendien dat de verschillen tussen eentalige kinderen met ESM en tweetalige kinderen met ESM eveneens significant zijn. Deze gegevens duiden erop dat de tweetalige kinderen met ESM voor een dubbele achterstand zijn geplaatst: ze scoren laag vanwege het feit dat ze een taalstoornis hebben en bovendien ook nog eens omdat ze het Nederlands als tweede taal leren. 5.2

Criteriumvaliditeit

5.2.1

Predictie van taal-/leesprestaties

In deze paragraaf zullen we verslag doen van een onderzoek waarbij de predictie van deze intelligentie- en taaltoetsen op de taal- en leesontwikkeling van autochtone en allochtone leerlingen centraal staat. Nagegaan wordt in hoeverre intelligentie- en taalmeting bij vierjarigen de taalvaardigheid Nederlands en de begrijpend-leesvaardigheid van kinderen eind groep 4 prediceert, in hoeverre de mate van predictie voor groepen leerlingen uit verschillende sociaal-culturele strata in gelijke mate geldt, en hoe groot die voorspellende waarde is in vergelijking met bijvoorbeeld de momenteel in gebruik zijnde leerlinggewichten. Opzet van het onderzoek, proefpersonen en procedure In het kader van het normeringsonderzoek van de vernieuwde Taaltoets Alle Kinderen zijn op ruim 80 scholen verspreid over heel Nederland meer dan 1200 kinderen in het basisonderwijs gevolgd vanaf begin groep 1 tot en met eind groep 4, verspreid over regio, urbanisatiegraad en sociale strata. 50

Van deze kinderen kregen er 851 zowel de taal- als de intelligentietaken in groep 1; 458 autochtone Nederlandse kinderen (287 met leerlinggewicht 1.0 en 171 met leerlinggewicht 1.25), en 393 allochtone leerlingen met leerlinggewicht 1.9 (zie Tabel 45). De meesten van hen zijn Mediterranen (w.o. 184 Turken en 144 Marokkanen), waarvan meer dan 80% thuis alleen of vooral de eigen taal spreekt. De gemiddelde leeftijd bij de eerste afname begin groep 1 is voor de groepen 4;7 jaar, met een standaarddeviatie van 4 maanden. Er zijn evenveel jongens als meisjes in elke groep. Alle kinderen hebben hun primaire socialisatie in Nederland. Tabel 45

Proefpersonen, aantal per groep (leerlinggewicht) en gemiddelde leeftijd

leerlinggewicht aantal leeftijd gem sd

autochtonen 1.0 287 4;6 0;3

1.25 171 4;7 0;4

allochtonen 1.9 393 4;7 0;4

Naast de deeltaken van de TAK is de leerlingen tevens een leesbegripstoets afgenomen. Hierbij gaat het om de test Begrijpend lezen uit het Cito-leerlingvolgsysteem waarbij kinderen vragen moesten beantwoorden naar aanleiding van gelezen teksten. Bovendien zijn de cognitieve vaardigheden van de leerlingen getoetst met vier subtaken uit de RAKIT, een gestandaardiseerde intelligentietoets (Bleichrodt, Drenth, Zaal & Resing 1984), die ook voor gebruik bij allochtone kinderen valide en betrouwbaar is bevonden (Resing, Bleichrodt & Drenth 1986). De volgende taken van de RAKIT zijn afgenomen (tussen haakjes het aantal items, c.q. de maximum score). Exclusie (50), waarin het kind uit vier abstracte figuren er één moet kiezen die niet voldoet aan een regel waaraan de overige drie figuren wel voldoen. Er wordt een sterk beroep gedaan op logisch, met name inductief, redeneren, waarbij het gaat om het ontdekken van regels. Geheugenspan (2 x 18), waarbij het kind een bepaalde reeks figuren in de juiste volgorde moet reproduceren. Er is een reeks concrete, makkelijk te benoemen figuren, en een reeks abstracte, minder goed te benoemen figuursequenties. Kwantiteit (65), waarin het kind in meerkeuze-items met afbeeldingen vergelijkingen moet maken in aantal, volume, lengte, afstand, gewicht, oppervlakte en trekkingskansen; de taak is gebaseerd op de theorie van Piaget met betrekking tot de ontwikkeling van het conservatiebegrip. Namen leren (2 x 12), waarin tekeningen van twaalf dieren worden getoond, waarbij een bepaalde naam wordt genoemd. Daarna moet het kind in twee rondes de naam bij een tekening opnieuw noemen. De relatie tussen betekenisvol figureel materiaal en een min of meer willekeurige naam moet worden onthouden, waarbij een beroep wordt gedaan op het associatief geheugen (‘paired associates’). De taken van de TAK en RAKIT zijn individueel in aparte ruimtes in de scholen afgenomen door getrainde proefleiders van Cito. De eerste afnames van de TAK (TAK-1) in groep 1 vonden plaats in september en oktober 1996, in drie of vier sessies; en de afnames van de RAKIT in het voorjaar van 1997 in dezelfde groep. De laatste afname van de TAK (TAK-4) en die van de toets Begrijpend lezen (Leesbegrip) vond plaats in juni 2000, toen de leerlingen in groep 4 zaten. Daarnaast werden verschillende achtergrondgegevens van de kinderen verzameld, zoals leeftijd, sekse, etnische groep, leerlinggewicht, thuistaal, opleiding van de ouders, sociale index van de school, enzovoorts. De leerlinggewichten betreffen de standaardgewichten 1.0, 1.25, en 1.9. Voor de mate waarin thuis de eigen taal dan wel het Nederlands werd gebruikt waren vijf categorieën beschikbaar: alleen Nederlands, vooral Nederlands, beide talen evenveel, vooral de eigen taal, en alleen de eigen taal. Met het oog op het achterhalen van verschillen tussen de leerlinggewichten en verbanden tussen cognitieve en talige vaardigheden van de kinderen zijn SPSS-analyses gedraaid, door middel van pearson-correlaties en variantie-analyses. Met behulp van regressie-analyses zijn de verschillende predictoren van taal- en leesvaardigheid onderzocht. Resultaten per deelgroep Tabel 46 geeft de gemiddelden en standaarddeviaties van de leerlingen uit de drie leerlinggewichtscategorieën op de verschillende taken van de TAK bij de aanvang van het basisonderwijs en op het eind van groep 4. 51

Tabel 46 Gemiddelden en standaarddeviaties op de TAK-taken begin groep 1 en eind groep 4 voor de onderscheiden leerlinggewichten

klankdiscriminatie articulatie pass.woordenschat woordomschrijving zinsbegrip 1 zinsbegrip2 woordvorming zinsvorming tekstbegrip verteltaken

Begin groep 1 1.0 1.25 gem sd gem 37.7 9.3 34.0 41.8 4.7 39.9 44.6 13.4 37.0 11.5 5.8 9.3 28.1 5.4 25.0 25.9 6.4 23.5 11.9 4.1 10.1 21.0 11.1 15.2 13.2 5.4 10.1 11.2 6.6 9.5

sd 9.7 5.5 13.6 5.5 6.0 6.4 4.4 11.2 5.5 6.5

1.90 gem 30.3 38.1 18.9 3.7 19.1 17.9 3.1 7.4 4.5 5.7

Sd 9.7 7.4 12.7 4.0 6.0 5.4 4.1 8.9 5.0 5.6

Eind groep 4 1.0 gem sd 49.2 1.3 44.9 0.4 85.7 6.3 29.0 5.8 40.4 1.6 39.8 2.1 22.1 2.3 36.6 3.8 21.1 2.9 25.1 5.3

1.25 gem 49.0 44.8 80.2 25.4 39.4 37.9 19.9 33.5 19.6 22.6

sd 1.5 0.6 8.1 5.5 1.8 2.8 3.8 6.2 3.6 5.9

1.90 gem 48.6 44.7 67.8 18.1 38.2 36.7 16.4 30.8 17.7 23.1

sd 2.3 0.8 12.8 5.9 2.3 3.6 4.6 7.3 4.2 6.2

Variantie-analyses over alle taken afzonderlijk laat een significant hoofdeffect zien voor gewicht (alle p<.001), hetgeen erop duidt dat de verschillen in taalscores tussen de drie gewichten substantieel zijn. Dit is zowel begin groep 1 als eind groep 4 het geval. Verder blijkt uit een GLM-procedure (repeated measures, TIJD en GEWICHT als factoren) op alle taken apart dat de factor TIJD (van begin groep 1 naar eind groep 4) significant is: de leerlingen zijn op alle taken vooruit gegaan. De interactie op elke taak tussen TIJD en GEWICHT is eveneens significant, hetgeen erop wijst dat de verschillen in scores tussen de drie groepen in de loop van de tijd minder groot worden. Zoals Tabel 46 echter laat zien zijn er, ondanks de plafondeffecten voor 1.0-leerlingen eind groep 4 op sommige taken, nog steeds aanzienlijke (en significante) verschillen in taalscores tussen de drie groepen, met name op de onderdelen woordenschat, woordvorming, zinsvorming, zinsbegrip en tekstbegrip. Tabel 47 geeft een overzicht van de scores van de drie groepen op de intelligentietaken. Ook op de cognitieve taken uit de RAKIT, afgenomen in groep 1, scoren de 1.0-leerlingen het hoogst, gevolgd door de 1.25- en 1.9-leerlingen. Genoemde verschillen zijn steeds significant: tussen 1.0- en 1.25leerlingen voor Namen leren en Exclusie Sig of F <.01, voor Kwantiteit en Geheugenspan Sig of F < .05. Het contrast tussen autochtonen en allochtonen is significant (alle sig of F<.001) voor alle vier de subtaken. Tabel 47

Gemiddelden en standaarddeviaties op de RAKIT

exclusie geheugenspan kwantiteit namen leren

1.0 gem 18.5 8.2 23.5 8.4

sd 5.3 3.2 7.2 3.4

1.25 gem 16.7 7.6 21.8 7.4

sd 5.3 2.9 7.6 3.1

1.90 gem 14.7 6.9 18.8 5.4

sd 5.9 3.0 7.8 2.9

Ten slotte zijn de scores berekend op de toets voor begrijpend lezen eind groep 4 (zie Tabel 48). Het gaat hier om schaalscores met een minimumscore van 82 en maximumscore van 112. Tabel 48

Gemiddelden en standaarddeviaties op de toets Begrijpend lezen

Begrijpend lezen

1.0 gem 102.3

sd 6.2

1.25 gem 98.8

sd 7.2

1.90 gem 97.8

sd 6.1

Hoewel de scores niet erg sterk van elkaar lijken te verschillen, zijn ze tussen de gewichten wel significant, zowel tussen 1.0- en 1.25-leerlingen (Sig of F<.01) als tussen autochtonen en allochtonen 52

(Sig of F<.01). Bij ‘begrijpend lezen’ moet overigens bedacht worden dat deze vaardigheid eind groep 4 nog zwaar leunt op technische leesvaardigheid. Leerlinggewicht, intelligentie en taal als voorspellers van schoolsucces Tabel 49 geeft voor de totale groep de correlaties tussen het leerlinggewicht en de meetinstrumenten afgenomen aan het begin van groep 1 enerzijds en de meetinstrumenten die zijn afgenomen aan het eind van groep 4 anderzijds. In Tabel 50 worden per leerlinggewicht de correlaties gepresenteerd. Daarbij zijn gemiddelde z-scores berekend over de intelligentietaken van de RAKIT enerzijds en de taaltaken van de TAK anderzijds. Tabel 49 Correlaties voor de totale groep tussen leerlinggewicht, intelligentie- en taaltaken aan het begin van groep 1 en taal- en leestaken aan het eind van groep 4 (**= p < .01)

Leerlinggewicht RAKIT groep 1 TAK-1, begin groep 1

TAK-4, eind groep 4 .58** .54** .78**

Begrijpend lezen, eind groep 4 .29** .39** .47**

Tabel 50 Correlaties per gewicht tussen intelligentie- en taaltaken aan het begin van groep 1 en taal- en leestaken eind van groep 4 (**= p < .01, *= p < .05)

RAKIT groep 1 – gewicht =1.0 – gewicht =1.25 – gewicht =1.9 TAK-1, begin groep 1 – gewicht =1.0 – gewicht =1.25 – gewicht =1.9

TAK-4, eind groep 4

Begrijpend lezen, eind groep 4

.40** .64** .42**

.30* .63** .20

.65** .73** .68**

.22 .61** .42**

Tabel 49 en Tabel 50 laten zien dat zowel voor de totale groep als de afzonderlijke gewichtengroepen de RAKIT score substantieel lager correleert met de taal- en begrijpend-leestaken eind groep 4 dan de TAK-1. Wanneer bij de correlatie tussen RAKIT en TAK-4 gecontroleerd wordt voor de score op TAK-1 blijft er nog minder van de correlatie over (partiële r=.13). Vervolgens is met behulp van multiple regressie nagegaan in hoeverre de verschillen in scores op de TAK en de toets Begrijpend lezen op het eind van groep 4 kunnen worden voorspeld vanuit de intelligentie- en taalscores van kinderen aan het begin van groep 1. Daarbij is steeds (stepwise) eerst het leerlinggewicht als predictor in de regressie-analyse opgenomen, als tweede de RAKIT, en ten slotte de TAK-1. Tabel 51 geeft de resultaten voor de TAK-4 weer, Tabel 52 die voor de toets Begrijpend lezen, beide na drie stappen Tabel 51

Multiple regressie (stepwise) met TAK-4 als afhankelijke variabele

Leerlinggewicht RAKIT TAK-1

TAK-4 Beta t .121 3.344 .113 3.216 .658 15.715

53

Sig .001 .001 .000

Multiple R .333 .464 .661

Tabel 52

Multiple regressie (stepwise) met Begrijpend lezen als afhankelijke variabele

Leerlinggewicht RAKIT TAK-1

Begrijpend lezen Beta t .094 .948 .143 .143 .406 3.669

Sig n.s. n.s. .000

Multiple R .036 .116 .206

We kunnen uit Tabel 51 en Tabel 52 aflezen dat de in begin groep 1 afgenomen taaltoets de grootste voorspellende waarde heeft voor de taalvaardigheid Nederlands van de kinderen eind groep 4. Leerlinggewicht en de RAKIT dragen wel (significant) bij, maar beduidend minder. Bij de score op Begrijpend lezen eind groep 4 zijn de beide als eerste ingevoerde factoren niet significant; alleen de in groep 1 afgenomen taaltoets heeft een significante voorspellende waarde. Conclusie moet zijn dat noch de RAKIT, noch het leerlinggewicht van de leerlingen uit de regressie-analyses als sterke determinanten van taal- en leesvaardigheid eind groep 4 naar voren komen. 5.2.2

Predictie van schoolsucces

Ten behoeve van de landelijke, longitudinale normering van de Taaltoets Alle Kinderen zijn aan het begin van groep 1 en 2, en op het eind van groep 2, 3 en 4 taaltoetsen voorgelegd aan 600 autochtone (leerlinggewichten 1.0 en 1.25) en 600 allochtone kinderen (leerlinggewicht 1.9). Een leerlinggewicht van 1.25 wordt toegekend aan autochtoon Nederlandse arbeiderskinderen (in termen van opleiding en/of beroepsniveau van beide ouders). Een leerlinggewicht van 1.9 wordt toegekend aan kinderen uit gezinnen waarvan tenminste een van de ouders van niet-Nederlandse herkomst is, en een beperkt opleidings- en beroepsniveau heeft. Daarnaast is bij 900 van deze kinderen in groep 1 een intelligentiemeting verricht door middel van de volgende onderdelen van de Revisie Amsterdamse Kinder Intelligentietest (RAKIT): Namen Leren, Exclusie, Geheugenspan en Kwantiteit. Dit onderzoek werd uitgevoerd op verzoek van de Commissie Indicatiestelling Onderwijsachterstanden (1996), die een advies uitbracht over alternatieven voor de gewichtenregeling. Een groot deel van deze kinderen (n=485) heeft vervolgens in 2004, toen zij in groep 8 zaten, meegedaan met de Eindtoets Basisonderwijs van Cito. Centraal in de volgende paragrafen staat de predictie van deze intelligentie- en taaltoetsen, afgenomen in het begin van hun schoolcarriëre, op hun schoolsucces. Nagegaan wordt in hoeverre intelligentie- en taalmeting bij vier/vijfjarigen de scores op de Eindtoets Basisonderwijs van Cito van deze kinderen eind groep 8 prediceert, in hoeverre de mate van predictie voor groepen leerlingen uit verschillende sociaal-culturele strata in gelijke mate geldt, en hoe groot die voorspellende waarde is in vergelijking met bijvoorbeeld thuistaalgebruik of opleidingsniveau van de ouders. Opzet van het onderzoek, proefpersonen en procedure In het kader van het normeringsonderzoek van de vernieuwde Taaltoets Alle Kinderen zijn op ruim 80 scholen verspreid over heel Nederland meer dan 1200 kinderen in het basisonderwijs gevolgd vanaf begin groep 1 tot en met eind groep 4, verspreid over regio, urbanisatiegraad en sociale strata. Van 485 van hen hebben we ook de scores op de Eindtoets Basisonderwijs, afgenomen in 2004. In groep 1 werd bij deze kinderen ook een intelligentietoets (RAKIT) afgenomen. 339 van hen zijn autochtone Nederlandse kinderen (230 met leerlinggewicht 1.0 en 109 met leerlinggewicht 1.25), en 146 allochtone leerlingen met leerlinggewicht 1.9 (zie Tabel 53). De meeste allochtonen zijn Mediterranen (105), waarvan er 89 (85%) thuis alleen of vooral de eigen taal spreken. De gemiddelde leeftijd bij de eerste afname begin groep 1 is voor de groepen 4,7 jaar, waarbij de allochtonen iets ouder zijn, met een standaarddeviatie van 4 maanden. Er zijn evenveel jongens als meisjes in elke groep. Alle kinderen hebben hun primaire socialisatie in Nederland. Tabel 54 geeft een overzicht van de verdeling over de opleidingsachtergrond van de ouders van de autochtone en allochtone leerlingen.

54

Tabel 53

Proefpersonen, aantal per groep (leerlinggewicht) en gemiddelde leeftijd

Leerlinggewicht aantal leeftijd gem sd

Tabel 54

autochtonen 1.0 230 4;7 0;3

allochtonen 1.9 146 4;8 0;4

1.25 109 4;7 0;3

Proefpersonen, aantal per groep en opleiding ouders

Sociale achtergrond autochtoon, 1.0 autochtoon, 1.25 allochtoon, 1.9

alleen lo ongeschoold – 12 57

lbo laaggeschoold 8 77 52

mavo/mbo middelbaar 108 11 25

havo/hbo/wo hooggeschoold 112 6 6

Naast de deeltaken van de TAK is tevens een leesbegripstoets afgenomen. Hierbij gaat het om de test Begrijpend lezen uit het Cito-leerlingvolgsysteem waarbij kinderen vragen moesten beantwoorden naar aanleiding van gelezen teksten. Verder zijn de cognitieve vaardigheden van de leerlingen getoetst met vier subtaken uit de RAKIT, een gestandaardiseerde intelligentietoets (Bleichrodt, Drenth, Zaal & Resing 1984), die ook voor gebruik bij allochtone kinderen valide en betrouwbaar is bevonden (Resing, Bleichrodt & Drenth 1986). De volgende taken van de RAKIT zijn afgenomen (tussen haakjes het aantal items, c.q. de maximum score): Exclusie, Geheugenspan, Kwantiteit en Namen Leren (zie 5.2.1). Ten slotte is voor de operationalisering van schoolsucces gebruikgemaakt van de standaardscore op de Eindtoets Basisonderwijs van Cito. De Standaardscore loopt van 501 tot en met 550 en is gebaseerd op de scores op de volgende drie onderdelen (aantal items tussen haakjes): • Taal (100) Gericht op het schrijven van teksten (30) (exclusief spelling); spellen van werkwoorden (10); spellen van niet-werkwoorden (10); begrijpend lezen (30) en woordenschat (20). • Rekenen en Wiskunde (60) Gericht op basiskennis van getallen; hoofdrekenen; bewerkingen; breuken, procenten en verhoudingen; meten, meetkunde, tijd en geld. • Informatieverwerking (40) Gericht op hanteren van informatiebronnen; kaartlezen; lezen van schema’s, tabellen en grafieken; lezen van teksten: identificeren; lezen van teksten: afleiden. De taken van de TAK en RAKIT zijn individueel in aparte ruimtes in de scholen afgenomen door getrainde proefleiders van Cito. De eerste afnames van de TAK (TAK-1) in groep 1 vonden plaats in september en oktober 1996, in drie of vier sessies; en de afnames van de RAKIT in het voorjaar van 1997 in dezelfde groep. De tweede afname van TAK was aan het begin van groep 2, de derde afname aan het eind van groep 2, de vierde afname van de TAK aan het eind van groep 3, en de vijfde en laatste TAK-afname en die van de toets Begrijpend lezen (Leesbegrip) vond plaats in juni 2000, toen de leerlingen in groep 4 zaten. De afnames van de Cito Eindtoets vonden plaats in het voorjaar van 2004, toen de leerlingen in groep 8 zaten. Taalvaardigheid, intelligentie en schoolsucces in de drie sociale groepen Tabel 55 geeft de gemiddelden en standaarddeviaties van de autochtone (1.0 en 1.25-) en allochtone leerlingen op de verschillende toetsen weer. De gemiddelde scores op de TAK worden weergegeven in het gemiddelde van de gemiddelde z-scores op de tien subtaken van de TAK. Z-scores zijn de gemiddelde afwijkingen van het gemiddelde van alle kinderen samen. In de tabel is goed te zien dat de verschillen tussen autochtonen en allochtonen op de TAK in de loop van de tijd afnemen, hoewel die nog steeds significant blijven verschillen. Op de RAKIT, afgenomen in groep 1, scoren de 1.0-leerlingen het hoogst, gevolgd door de 1.25- en 1.9-leerlingen. Genoemde verschillen zijn ook op de deeltaken steeds significant: tussen 1.0- en 1.25-leerlingen voor Namen leren en Exclusie (Sig of F <.01), en ook voor Kwantiteit en Geheugenspan (Sig of F < .05). Het contrast tussen autochtonen en allochtonen is significant (alle sig of F<.001) voor alle vier de subtaken. 55

Tabel 55 Gemiddelden en standaarddeviaties van de verschillende groepen op de verschillende toetsen (sd tussen haakjes)

RAKIT TAK1 TAK2 TAK3 TAK4 TAK5 Leesbegrip groep 4 Eindtoets Basisonderwijs

autochtone 1.0

autochtone 1.25

allochtone 1.9

61.1 (11.5) .64 (.58) .60 (.44) .55 (.38) .47 (.36) .44 (.38) 102.3 (5.8) 536.5 (9.9)

59.1 (10.4) .43 (.66) .44 (.52) .41 (.50) .32 (.45) .31 (.41) 102.8 (5.1) 533.6 (9.9)

48.0 (12.5) –.40 (.55) –.27 (.54) –.26 (.58) –.20 (.46) –.18 (.45) 98.7 (4.7) 529.0 (10.5)

Wat betreft de TAK laten variantie-analyses over alle taken afzonderlijk een significant hoofdeffect zien voor gewicht (alle p<.001), hetgeen erop duidt dat de verschillen in taalscores tussen de drie gewichten substantieel zijn. Dit is ook eind groep 4 nog het geval. Verder blijkt uit een GLM-procedure (repeated measures, TIJD en GEWICHT als factoren) op alle taken apart dat de factor TIJD (van begin groep 1 naar eind groep 4) significant is: de leerlingen zijn op alle taken vooruit gegaan. De interactie op elke taak tussen TIJD en GEWICHT is eveneens significant, hetgeen erop wijst dat de verschillen in scores tussen de drie groepen in de loop van de tijd minder groot worden. Ondanks de plafondeffecten voor 1.0-leerlingen eind groep 4 op sommige taken, zijn er nog steeds aanzienlijke (en significante) verschillen in taalscores tussen de drie groepen, met name op de onderdelen woordenschat, woordvorming, zinsvorming, zinsbegrip en tekstbegrip. Hoewel de scores op leesbegrip niet erg sterk van elkaar lijken te verschillen (het gaat hier om schaalscores met een minimumscore van 82 en maximumscore van 112), zijn ze tussen de autochtonen en allochtonen wel significant (Sig of F<.01). Bij ‘begrijpend lezen’ moet overigens bedacht worden dat deze vaardigheid eind groep 4 nog zwaar leunt op technische leesvaardigheid. Ten slotte zijn de verschillen op de Eindtoets Basisonderwijs tussen de drie onderscheiden groepen significant. (F(2,482)=25.439, Sig of F .000). Zowel tussen 1.0- en 1.25-leerlingen (t(337)=2.549, p= .01) als tussen 1.25- en 1.9-leerlingen (t(253)=3.613, p= .000) is het verschil significant. Intelligentie, taal en opleiding ouders als voorspellers van schoolsucces In Tabel 56 worden de correlaties gegeven tussen taken en achtergrondvariabelen voor de totale groep, in Tabel 57 voor de autochtonen en allochtonen afzonderlijk. De correlaties tussen de Eindtoets en de TAK lopen in de loop van de tijd van groep 1 naar groep 4 op van .44 naar .53. De TAK, afgenomen in groep 1, correleert iets hoger met de Eindtoets in groep 8 dan de RAKIT. Tussen de RAKIT en de TAK zijn hoge correlaties, het hoogst tussen TAK2 en de RAKIT, waarvan de afnames het dichtst bij elkaar in tijd liggen (RAKIT in mei 1997, TAK2 in september 1997). Opleiding, thuistaal en gewicht laten ook redelijk hoge correlaties zien met de toetsen. Tussen de TAK1 en de volgende afnames van de TAK blijven de correlaties hoog (meer dan 50% verklaarde variantie). Tabel 56 Correlaties tussen taken en achtergondvariabelen van alle leerlingen (alle correlaties p<.001) RAKIT TAK1 TAK2 TAK3 TAK4 TAK5 opleid thuist gewicht Eindtoets .41 RAKIT TAK1 Opleiding Thuistaal

.44 .57

.45 .64 .89

.47 .57 .85

.52 .56 .79

.53 .57 .74

56

.30 .37 .45

–.15 –.40 –.53 –.40

–.31 –.44 –.57 –.70 .60

Tabel 57 Correlaties tussen taken en achtergondvariabelen, apart voor autochtonen en allochtonen (alle correlaties p<.01, tenzij aangegeven) Autochtoon RAKIT TAK1 TAK2 TAK3 TAK4 TAK5 opleid thuist

gewicht

Eindtoets RAKIT TAK1 Opleiding Thuistaal

.10 ns –.08 ns .09 ns –.00 ns

–.15 –.08 ns –.15 –.76 –.07 ns

Allochtoon RAKIT TAK1 TAK2 TAK3 TAK4 TAK5 opleid

thuist

gewicht

Eindtoets RAKIT TAK1 Opleiding Thuistaal

.09 ns –.15 ns –.43 –.28

–.05 ns –.07 ns –.24 –.52 .24

.36

.24

.35 .41

.30 .35

.41 .44 .82

.28 .52 .86

.43 .39 .78

.32 .38 .77

.53 .37 .68

.30 .39 .69

.50 .38 .60

.43 .43 .63

.29 .20 .22

.04 ns .12 ns .32

Bij de autochtonen ontlopen de correlaties tussen Eindtoets aan de ene kant, en TAK1 of RAKIT aan de andere kant elkaar niet veel (.35, .36). Opleiding ouders en gewicht correleren ook significant met de Eindtoets. Thuistaal speelt hier zoals verwacht geen rol van betekenis. Dat is bij allochtonen evenmin het geval (r= .09, p=.26). Ook opleiding ouders of gewicht correleren bij hen niet significant met de Eindtoets. De TAK correleert bij de allochtonen hoger met de Eindtoets dan de RAKIT (resp. .30 en .24). Vervolgens is met behulp van multiple regressie nagegaan in hoeverre de verschillen in scores op de Eindtoets Basisonderwijs in groep 8 kunnen worden voorspeld vanuit de intelligentie- en taalscores van kinderen in groep 1. Daarbij zijn steeds (stepwise) eerst het leerlinggewicht, de opleiding van de ouders, en de thuistaal als predictoren in de regressie-analyse opgenomen, vervolgens de RAKIT, en ten slotte de TAK1. Tabel 58 geeft de resultaten voor alle leerlingen weer, na vier stappen, Tabel 59 en Tabel 60 die voor autochtonen en allochtonen apart. Tabel 58 Multiple regressie (stepwise) met de Eindtoets als afhankelijke variabele, alle proefpersonen, na vier stappen

(Constant) TAK1 RAKIT Thuistaal Opleiding ouders

Eindtoets Beta

t

Sig

Multiple R

.342 .235 .205 .141

140.079 4.725 3.618 3.236 2.288

.000 .000 .000 .001 .023

.432 .474 .497 .511

57

Tabel 59 Multiple regressie (stepwise) met de Eindtoets als afhankelijke variabele, autochtonen, na vier stappen

(Constant) TAK1 Opleiding ouders RAKIT Thuistaal

Eindtoets Beta

t

Sig

Multiple R

.211 .226 .228 .145

106.920 2.824 3.270 3.030 2.127

.000 .005 .001 .003 .035

.358 .434 .472 .493

Tabel 60 Multiple regressie (stepwise) met de Eindtoets als afhankelijke variabele, allochtonen, na twee stappen

(Constant) TAK1 Thuistaal

Eindtoets Beta

t

Sig

Multiple R

.364 .237

207.714 3.535 2.301

.000 .001 .024

.275 .352

We kunnen uit Tabel 60 aflezen dat voor de totale groep de TAK1, de RAKIT, de opleiding van de ouders en de thuistaal alle predictieve factoren zijn, waarbij de TAK1 de grootste voorspellende waarde heeft. Voor de autochtonen geldt dat de voorspellende waarde van de TAK, de opleiding ouders en de RAKIT nagenoeg even groot is. Ook bij de allochtonen afzonderlijk (Tabel 60) geldt dat de TAK als voornaamste voorspeller uit de bus komt, waarbij bij de autochtonen de opleiding van de ouders, de RAKIT en de thuistaal nog wat toevoegt. Bij de allochtonen voegt alleen de thuistaal nog wat toe aan de TAK. Bij hen zijn de andere als eerste ingevoerde factoren (opleiding ouders, gewicht, RAKIT) niet significant. Conclusie moet zijn dat voor allochtonen noch de in groep 1 afgenomen RAKIT, noch het leerlinggewicht of de opleiding van de ouders van de leerlingen, uit de regressieanalyses als sterke determinanten van schoolsucces naar voren komen. Analyses over de allochtone leerlingen bij wie in groep 1 ook de vaardigheid in het Turks of het Arabisch is onderzocht middels een drietal taken van de DTT, laat zien dat er een significante correlatie is (r = .35, p = .016) tussen de eerste-taalvaardigheid in groep 1 en de scores op de Eindtoets. Bij een regressie-analyse (stepwise) met de Eindtoetsscores als afhankelijke variabele, en de DTT, RAKIT, opleiding, TAK1 en thuistaal als predictoren, komt alleen de DTT als significant uit de bus (Multiple R = .390, t=2.682, Sig t = .011). Met andere woorden: toetsing in de eigen taal in groep 1 zou de beste predictor zijn voor schoolsucces in groep 8. Bedacht moet worden dat het in deze analyse om slechts 45 proefpersonen gaat. Op grond van deze resultaten kan men concluderen dat op kleuterleeftijd afgenomen toetsen in hoge mate hun scores op de Eindtoets Basisonderwijs voorspellen. Dat geldt in het bijzonder voor een taalvaardigheidstoets als de TAK, en, alleen bij autochtone kinderen, ook voor een intelligentietoets als de RAKIT. Conclusies en discussie Het huidige onderzoek laat in de eerste plaats zien dat er tussen autochtone en allochtone leerlingen sprake is van grote verschillen in cognitie en taalvaardigheid Nederlands. Binnen de autochtone groep blijkt ook het contrast tussen leerlinggewichten (1.0 vsd 1.25) een factor van betekenis. Ten aanzien van de verschillen in cognitie dient te worden opgemerkt dat de taken zijn afgenomen in groep 1 in de Nederlandse taal die op dat moment zeker niet voor alle kinderen als sterkste taal kan worden aangemerkt. Het lijdt geen twijfel dat de vaardigheid in de instructietaal Nederlands van invloed is op de geregistreerde RAKIT-scores, ook al wordt de test door de auteurs als cultuur-fair aangemerkt (Resing, Bleichrodt & Drenth, 1986). Wat de taalvaardigheid Nederlands betreft zijn de gevonden verschillen eenduidiger te interpreteren. Tussen de drie onderscheiden groepen blijkt sprake van 58

significante verschillen, kinderen in alle groepen boeken in de loop van de tijd significante vooruitgang en allochtone kinderen blijken in de loop van de tijd in te lopen op hun autochtone leeftijdgenoten. Belangrijk is echter de constatering dat ook op het eind van groep 4 tussen groepen nog altijd sprake is van significante verschillen in taalvaardigheid – met name tussen autochtone en allochtone leerlingen. Als we de samenhang tussen factoren bekijken valt op dat het verband tussen taalvaardigheid en schoolprestaties groter is dan tussen cognitieve capaciteit en schoolprestaties. De correlaties tussen schoolprestaties enerzijds en opleiding ouders, thuistaal en leerlinggewicht anderzijds blijkt gering. Opvallend is verder de hoge correlatie tussen de taalvaardigheid Nederlands van leerlingen gemeten aan het begin van groep 1 en die in hogere jaargroepen. Dit gegeven laat zien dat taalvaardigheid Nederlands in de schoolloopbaan als een stabiele factor kan worden aangemerkt. Waar het gaat om de predictie van schoolprestaties blijkt taalvaardigheid een betere voorspeller dan cognitieve capaciteit. Opmerkelijk is dat dit het geval is voor de totale groep leerlingen, maar ook voor de afzonderlijke groepen autochtone en allochtone leerlingen. Meervoudige regressieanalyse laat zien dat de predictie van schoolprestaties vanuit taalvaardigheid nauwelijks nog wordt verbeterd door cognitieve capaciteit gemeten aan het begin van de schoolloopbaan van leerlingen als predictor toe te voegen. Ook de toevoeging van factoren zoals thuistaal, opleiding ouders, of leerlinggewicht leidt nauwelijks tot een verbeterde predictie van schoolprestaties.

59

60

6

Algemene conclusies en discussie

De eerste conclusie die we op basis van het longitudinale onderzoek kunnen trekken, is dat de ontwikkeling van taalvaardigheid gedurende de gehele periode van het basisonderwijs substantieel genoemd kan worden. Tussen alle onderscheiden meetmomenten blijkt sprake van een significante toename in taalvaardigheid. Dit geldt voor alle onderscheiden deeltoetsen. Het scoreverloop op de fonologische taken benadert dat van de natuurlijke leercurve die wordt gekenmerkt door een langzame opstart, gevolgd door een sterke stijging met daarna weer een afvlakking. De opstart van de fonologische ontwikkeling heeft reeds op vroege leeftijd plaats. In het leeftijdbereik van 4 tot 8 jaar zien we de toename in fonologische vaardigheden en de afvlakking ervan. Met betrekking tot de taken op woord-, zinsen tekstniveau zien we veeleer een lineaire groei van vaardigheden gedurende het leeftijdbereik van de TAK. Er is duidelijke evidentie dat de ontwikkeling van deze vaardigheden mede wordt gestuurd vanuit het schoolse leren (vgl. Appel & Vermeer, 1997; Verhoeven, 1996). De spreiding op de scores van de deeltaken van de TAK blijkt eveneens groot. Daarbij zien we een opmerkelijk contrast tussen de scores van autochtone vs allochtone leerlingen. In de loop van de tijd blijven de verschillen tussen beide groepen op vrijwel alle toetstaken significant. Dit gegeven heeft ertoe geleid om naast de normatieve vergelijking met autochtone leerlingen in de handleiding van de toets ook vergelijkingsgegevens ten behoeve van allochtone leerlingen op te nemen. Daarbij is een onderscheid gemaakt tussen kinderen met een ruim taalaanbod Nederlands (Surinaamse en Antilliaanse herkomst) en kinderen met een beperkt taalaanbod Nederlands (Turkse en Marokkaanse herkomst). De onderzoeksresultaten laten zien dat de verschillen in taalvaardigheid Nederlands tussen de drie groepen in de leeftijdperiode van 4 tot 8 jaar inderdaad substantieel zijn. Op enkele taken worden de verschillen tussen groepen in de loop van de tijd kleiner. Dit is het geval bij de fonologische taken klankonderscheiding en klankarticulatie, bij Zinsbegriptaak 1 waarin het gaat om kennis van functiewoorden en bij de verteltaak. In alle gevallen gaat het om taalaspecten die min of meer afgebakend zijn wat betreft het inhoudelijk domein en die door oefening uiteindelijk tot beheersing kunnen leiden, mits er niet sprake is van een onderliggend taalleerprobleem. Daarentegen zien we dat op de onderdelen die naar het mentale lexicon verwijzen – de taken voor passieve woordenschat, woordomschrijving en woordvorming – sprake is van min of meer constante verschillen tussen de drie groepen over de leerjaren. Uit het normeringsonderzoek blijkt dat de deeltaken van de TAK een goede betrouwbaarheid te zien geven. Voor alle taken worden waarden van Cronbach’s alpha gevonden die hoger zijn dan ,80. Voor de Articulatietaak en Zinsbegriptaak 1 geldt dat tegen het eind van de dataverzameling een plafond wordt bereikt. Dit is het gevolg van de domeingerichte opbouw van de TAK. Het is algemeen bekend dat articulatorische vaardigheden en kennis van functiewoorden in de regel vroeg worden beheerst. Omwille van de diagnostische mogelijkheden ten behoeve van kinderen met taalachterstanden kan het toch zinvol zijn om deze taken ook bij kinderen in eind groep 4 af te nemen. Verder laat het onderzoek zien dat het onderscheid tussen de geoperationaliseerde deeltaken relevant te noemen is. Uiteraard is er sprake van een grote mate van samenhang tussen de scores op de deeltaken. Tegelijkertijd blijkt echter dat de afzonderlijke deeltoetsen unieke variantie te zien geven. De gangbare opvatting van taalvaardigheid als een systeem van onderling sterk gerelateerde fonologische, lexicale, zinsen tekstuele vaardigheden wordt daarmee empirisch onderbouwd (vgl. Levelt, 1989). Daarbij is de leidende gedachte dat fonologische vaardigheden aan de basis liggen van vaardigheden op woordniveau, woordvaardigheden aan de vaardigheden op zinsniveau, en zinsvaardigheden op hun beurt aan vaardigheden op tekstniveau. De scores op de TAK blijken een hoge mate van samenhang te vertonen met andere instrumenten die aspecten van taalvaardigheid meten, zoals spontane taaldata en leerkrachtoordelen. De mate van overeenstemming van de TAK-scores met oordelen van leerkrachten blijkt bovendien groter dan die van scores die op basis van analyse van spontane taaldata zijn verkregen. Dit gegeven kan worden gezien als een onderbouwing van de begripsvaliditeit van de TAK. Een en ander neemt niet weg dat spontane taaldata kunnen worden gezien als een belangrijke aanvulling in het proces van diagnosticering van taalleerproblemen (vgl. Bacchini, Kuiken & Schoonen, 1995).

61

Verder blijken kinderen uit het speciaal basisonderwijs lagere scores te behalen op alle onderdelen van de TAK. Het lijkt erop dat allochtone kinderen in het SBO zich voor een dubbele achterstand zien geplaatst: naast een achterstand ten opzichte van autochtone leeftijdgenoten hebben zij ook nog te maken met een achterstand ten opzichte van kinderen in het reguliere basisonderwijs. Een vergelijkbare trend zien we bij kinderen die geïndiceerd zijn als ESM (ernstige spraak-/taalmoeilijkheden). Deze kinderen blijken significant lager uit te komen op alle deeltaken van de TAK. En ook bij deze kinderen zien we dat allochtonen met een dubbele achterstand worden geconfronteerd ten opzichte van autochtone leeftijdgenoten zonder taalleerproblemen. Met het oog op begripsvaliditeit is de bevinding van belang dat voor kinderen van 4, 6 en 8 jaar met ESM kon worden aangetoond dat er vier onderliggende factoren ten grondslag kunnen liggen aan een dergelijk probleem: auditieve verwerkingsproblemen, spraakproductieproblemen, grammaticale problemen en lexicaal-semantische problemen. Dit resultaat komt overeen met de uitkomsten van recent onderzoek (vgl. Bishop, 2004). Ten slotte laat het onderzoek naar criteriumvaliditeit zien dat met de TAK niet alleen taalvaardigheidsscores op latere leeftijd kunnen worden voorspeld, maar ook schoolvorderingen op het terrein van het begrijpend lezen en schoolsucces op het eind van het basisonderwijs. Interessant daarbij is dat de voorspellende waarde van de TAK voor begrijpend lezen groter is dan die van intelligentie. Voor schoolsucces blijkt de voorspellende waarde voor autochtone leerlingen equivalent aan die van intelligentie en voor allochtone leerlingen zelfs groter dan intelligentie. Dit gegeven vraagt om een heroverweging van de toewijzing van middelen ten behoeve van leerlingen van uiteenlopende sociaalculturele herkomst in het onderwijs. Toetsen als de TAK kunnen voor de leerkracht een belangrijk hulpmiddel vormen bij de organisatie van het taalonderwijs en bij het signaleren en remediëren van taalleerproblemen. Gerichte aandacht voor taalstimulering is noodzakelijk, niet alleen in de kleuterperiode, maar ook in de daarop volgende leerjaren (vgl. Verhoeven, Litjens & Biemond, 2006). Het is van belang dat signaleringsinstrumenten als de TAK vanaf de beginfase van het basisonderwijs worden ingezet zodat taalachterstanden kunnen worden vastgesteld en taalleerproblemen kunnen worden gediagnosticeerd (vgl. Verhoeven & Van Balkom, 2004).

62

Literatuur

Appel, R. & A. Vermeer (1997). Woordenschat en taalonderwijs aan allochtone leerlingen. Tilburg: Tilburg University Press. Bacchini, S., F. Kuiken & R. Schoonen (1995). Generalizability of spontaneous speech data: the effect of occasion and place on the speech production of children. First Language 15, 44: 131-150. Bachman, L.F. & A. Palmer (1996). Language testing in practice. Designing and developing useful language tests. Oxford: OUP. Bachman, L.F. & A. Cohen (1998). Interfaces between second language acquisition and language testing research. Cambridge: Cambridge University Press. Bachman, L.F. (1990). Fundamental considerations in language testing. Oxford: University Press. Bauer, L. & I. Nation (1993). Word families, Int. Jl. of Lexicography 6: 253-279. Bishop, D.V.M. (2004). Diagnostic dilemmas in specific language impairment. In L. Verhoeven & H. van Balkom (Eds.) (2004). Developmental language disorders: Theoretical issues and clinical implications (pp. 309-326). Mahwah, NJ: Lawrence Erlbaum. Bleichrodt, N., Drenth, P., Zaal, J., & Resing, W. (1984). Revisie Amsterdamse Kinder Intelligentie Test. Lisse: Swets & Zeitlinger. Bleichrodt, N., Drenth, P., Zaal, J., & Resing, W. (1987). Revisie Amsterdamse Kinder Intelligentie Test: Handleiding. Lisse: Swets & Zeitlinger. Bleichrodt, N., P. Drenth, J. Zaal & W. Resing (1984). Revisie Amsterdamse Kinder Intelligentie Test. Lisse: Swets & Zeitlinger. Bleichrodt, N., P. Drenth, J. Zaal & W. Resing (1987). Revisie Amsterdamse Kinder Intelligentie Test: Handleiding. Lisse: Swets & Zeitlinger. Canale, M. & M. Swain (1980). Theoretical bases of communicative approaches to second language teaching and testing. Applied Linguistics 1: 1-47. Cazden, C. (1988). Classroom discourse: The language of teaching and learning. Portsmouth, NH: Heinemann. Chapelle, C. (1998). Construct definition and validity inquiry in SLA research. In L. Bachman & A. Cohen (eds.), Interfaces between second language acquisition and language testing research (pp. 32-70).Cambridge: CUP. Commissie Indicatiestelling Onderwijsachterstanden (1996). Zo onvoorspelbaar als het leven zelf. Zoetermeer: OCW. COTAN (1999). Beoordelingssysteem voor de kwaliteit van tests. Amsterdam: COTAN, Commissie Testaangelegenheden Nederland van het Nederlands Instituut van Psychologen, NIP. Driessen, G. (1996). De taalvaardigheid Nederlands van allochtone en autochtone leerlingen. De ontwikkeling in het basisonderwijs in kaart gebracht, Gramma/TTT 5, 1: 31-40. Erickson, J. & D. Omark (eds.) (1981). Communication assessment of the bilingual, bicultural child. Issues and guidelines. Baltimore: University Park Press. Keulen, D. van (1996). Woordenschat uitgediept (scriptie Taal & Minderheden). Tilburg: KUB, Letteren. Levelt, W.J.M. (1989). Speaking: From intention to articulation. London: Bradford. Resing, W., Bleichrodt, N., & Drenth, P. (1986). Het gebruik van de RAKIT bij allochtoon etnische groepen. Nederlands tijdschrift voor de psychologie 41: 179-188. Resing, W.C.M., A. Evers, H. Koomen, N. Pameijer, N. Bleichrodt, H. van Boxtel & E. de Greef (2002). Indicatiestelling: condities en instrumentarium. In het kader van een leerlinggebonden financiering, {z.p.] NDC-Boom, TCAI, NIP/COTAN, NVO. Schaerlaekens, A., Kohnstamm, D., & Lejaegere, M. (1999). Streeflijst woordenschat voor zesjarigen. Lisse: Swets & Zeitlinger. Schrooten, W. & Vermeer, A. (1994). Woorden in het basisonderwijs. 15.000 woorden aangeboden aan leerlingen Tilburg: Tilburg University Press. Slobin, D. & C.A. Welsh (1973). ‘Elicited imitation as a research tool in developmental psycholinguistics’. In: C. Ferguson & D. Slobin (eds.), Studies of child language development, 175-208. New York: Holt, Rinehart & Winston. Staphorsius, G., R.S.H. Krom en K. de Geus (1988). Frequenties van woordvormen en letterposities in jeugdlectuur. Arnhem: Cito. Steenge, J., Verhoeven, L., van Balkom, H., & van Weerdenburg, M. (2006). Second language achievement of language impaired children. Submitted for publication.

63

Van Daal, J.,Verhoeven, L, & van Balkom, H. (2004). Subtypes of severe speech and language impairments: psychometric evidence from four-year-old children in the Netherlands. Journal of Speech, Language and Hearing Research, 47 (6), 1-14. Van Weerdenburg, M., Verhoeven, L., & van Balkom, H. (2006). Towards a typology of specific language impairment. Journal of Child Psychology and Psychiatry,47, 176-189. Verhoeven, L. & A. Vermeer (1989). Diagnose van kindertaal. Nederlandse taalvaardigheid van autochtone en allochtone kinderen. Tilburg: Zwijsen. Verhoeven, L. & A. Vermeer (1996). Taalvaardigheid in de bovenbouw. Tilburg: TUP. Verhoeven, L. & A. Vermeer (2001). Taaltoets Alle Kinderen. Diagnostische toets voor de mondelinge vaardigheid Nederlands bij kinderen van groep 1 tot en met 4. Arnhem: Cito. Verhoeven, L. & Vermeer, A. (1996). Taalvaardigheid in de bovenbouw. Tilburg: Tilburg University Press. Verhoeven, L. (1996). Language in education. In F. Coulmas (Ed.), Handbook of Sociolinguistics. London: Basil Blackwell. Verhoeven, L., Litjens, P., & Biemond, H. (2006). Tussendoelen mondelinge communicatie. Nijmegen: Expertisecentrum Nederlands. Vermeer, A. (1997). Breedte en diepte van woordenschat in relatie tot toenemende taalverwerving en frequentie van aanbod, Gramma/TTT, tijdschrift voor taalwetenschap, 6, 3:169-187. Vermeer, A. (2002). Leerkrachten vinden meisjes taalvaardiger. (Voor)oordelen over de taalvaardigheid Nederlands van autochtone en allochtone jongens en meisjes in het Speciaal Basisonderwijs. Toegepaste TaalWetenschap in Artikelen 68, 85-94. Weerden, J. van, T. Bechger & B. Hemker (2002). Balans van het taalonderwijs in het speciaal basisonderwijs 2. Uitkomsten van de tweede peiling in 1999 (PPON), Arnhem: Citogroep. Wijnstra, J. (1988). Balans van het rekenonderwijs in de basisschool. PPON-reeks, 1. Arnhem: Cito.

64

Verantwoording Taaltoets Alle Kinderen (TAK) Ludo Verhoeven, Radboud Universiteit Nijmegen Anne Vermeer, Universiteit van Tilburg

Recommend Documents