De WISC-RN als presenteerblaadje? Een onderzoek naar het vaststellen van schoolproblemen bij kinderen op basis van het verschil tussen hun verbaal en performaal IQ
Doctoraalscriptie Opleiding Pedagogische Wetenschappen Afstudeerrichting Orthopedagogiek Universiteit Leiden, mei 2003 Geschreven door Judith Reuver onder begeleiding van Dr. W.A.M. Peters (Katholieke Universiteit Nijmegen) en Professor Dr. A.J.J.M. Ruijssenaars (Universiteit Leiden)
Experience without theory is blind, but theory without experience is mere intellectual play. Immanuel Kant
Voorwoord ‘De WISC-RN als presenteerblaadje’ is de titel van de scriptie, die ik in het kader van de afstudeerfase van mijn opleiding tot orthopedagoog aan de Universiteit Leiden heb geschreven. Het is een scriptie over een onderwerp dat mij al een aantal jaren bezig houdt; niet alleen als studente orthopedagogiek, maar ook als leerkracht. Na een aantal jaren voor de klas te hebben gestaan, had ik het geluk les te mogen geven aan kleinere groepjes (hoog)begaafde basisschoolleerlingen. In die tijd kwamen ouders en leerkrachten regelmatig naar me toe met de vraag of hun kind misschien een ‘V-P kloof’ had. En ook in een cursus hoogbegaafdheid, die werd aangeboden door de Hogeschool Haarlem en die ik indertijd naast mijn studie orthopedagogiek volgde, werd uitgebreid stil gestaan bij deze ‘kloof’. In deze cursus werd verteld, dat een kind een ‘V-P kloof’ heeft, wanneer er sprake is van een verschil van minimaal 12 punten tussen zijn verbale en performale WISC-RN testscores. Daarbij werd tevens vermeld, dat wanneer een kind zo’n verschil heeft, er een heel scala aan problemen is, dat het kind op school en/of thuis ervaart. Helaas echter werden deze uitspraken niet onderbouwd door empirisch onderzoek. Reden voor mij om, toen ik een eigen onderzoek op mocht zetten, dit onderwerp als uitgangspunt te nemen. Het onderzoek is verricht tijdens mijn stage bij het Centrum voor Begaafdheidsonderzoek te Nijmegen. In het onderzoek staat de vraag centraal of we de WISC-RN als presenteerblaadje kunnen hanteren, waarop ons behalve informatie over de intellectuele capaciteiten van een kind wellicht ook informatie over eventuele schoolproblemen wordt aangereikt. Met in mijn achterhoofd het praktisch belang dat aan dit onderzoek kleeft, hoop ik met deze studie vooral verheldering te kunnen scheppen en zo een bijdrage te leveren aan de momenteel (vast)lopende discussie omtrent dit vraagstuk. Mijn dank gaat uit naar Willy Peters en Professor Ruijssenaars, voor hun begeleiding en inhoudelijke commentaar. Daarnaast wil ik Hélène van Haren bedanken voor haar hulp bij het overzetten van de data vanuit de databank van het CBO naar SPSS. Ad van der Ven wil ik bedanken voor zijn hulp bij de statistische analyses. Marianne van Overbeek bedank ik voor het inzicht in de WISC-RN, dat ze mij gedurende mijn praktijkstage bij het CBO heeft gegeven. Tot slot bedank ik iedereen, die het - op welke wijze ook - mede mogelijk heeft gemaakt, dat ik nu het resultaat van mijn onderzoek kan aanbieden.
Judith Reuver mei 2003
Inhoud Samenvatting
1
Inleiding
2
1. Theoretische oriëntatie Inleiding 1.1. De WISC-RN 1.2. Analyse van de WISC-RN 1.2.1. Analyse op testniveau 1.2.2. Analyse op verbaal- en performaalniveau 1.2.3. Analyse op factorniveau 1.2.4. Analyse op subtestniveau 1.2.5. Analyse op itemniveau 1.3. Interpretatie van de WISC-RN 1.4. Interpretatie van V-P verschillen 1.4.1. Echte verschillen 1.4.2. Abnormale verschillen 1.4.3. Wijst een V-P verschil op een pathologische conditie? 1.5. Conclusies 1.6. Onderzoeksvragen en hypothesen
4 4 7 7 8 8 9 9 10 10 11 16 20 22 23
2. Opzet en uitvoering van het onderzoek Inleiding 2.1. Onderzoeksgroep 2.2. Meetinstrumenten 2.2.1. WISC-RN 2.2.2. CBO Gedragskenmerken Vragenlijst 2.3. Analyse technieken
25 25 25 26 26 27
3. Resultaten Inleiding 3.1. Zijn V-P verschillen echte verschillen? 3.2. Zijn significante V-P verschillen abnormale verschillen? 3.3. Wijst een V-P verschil op de aanwezigheid van schoolproblemen?
30 30 31 33
4. Discussie Inleiding 4.1. Conclusies 4.2. Beperkingen
36 36 37
Literatuur
40
Bijlage
44
Samenvatting In Nederland wordt veel belang gehecht aan het mogelijk vaststellen van stoornissen of problemen op basis van een V-P verschil (een verschil tussen de verbale en performale IQ scores van de WISC-RN) en wel met name bij kinderen met een intelligentie op minimaal begaafd niveau. Tot op heden ontbrak het helaas aan wetenschappelijk onderzoek op dit specifieke gebied. Om een antwoord te vinden op de vraag of de aanwezigheid van een V-P verschil duidt op de aanwezigheid van schoolproblemen (problemen die kinderen ondervinden bij of als gevolg van het verwerven van vaardigheden die ze op school nodig hebben), is daarom onderzoek verricht binnen een groep van 776 kinderen (in de leeftijd van 6 tot 16 jaar), die vanwege hun potentiële hoogbegaafdheid waren aangemeld bij en onderzocht door het Centrum voor Begaafdheidsonderzoek (CBO) te Nijmegen. Voor deze studie is gebruik gemaakt van bestaande gegevens uit de databank van het CBO, die tijdens het diagnostisch onderzoek met behulp van de WISC-RN en een door het CBO ontwikkelde Gedragskenmerken Vragenlijst verzameld waren. Uit deze studie blijkt ten eerste dat er geen evidentie is voor een onderscheid tussen slechts twee delen van de WISC-RN; de test blijkt namelijk vier factoren te bevatten. Daardoor is er ook geen evidentie voor het verschil tussen die twee delen. V-P verschillen zijn dus geen echte verschillen. Ten tweede blijkt, dat absolute V-P verschillen van minimaal 15 punten voorkomen bij 48% van de kinderen uit de CBO-groep met een Totaal IQ vanaf 121. Dat is significant vaker dan de frequentie van voorkomen bij kinderen uit de Nederlandse normgroep. Daarnaast blijkt er een verband te zijn tussen de hoogte van het TIQ en de grootte van het absolute V-P verschil. Er kan dus gesteld worden dat het voorkomen van significante V-P verschillen zeker bij kinderen met een meer dan gemiddelde intelligentie geen abnormale gebeurtenis is. Tot slot blijkt uit de onderzoeksresultaten, dat kinderen met een abnormaal absoluut V-P verschil niet meer schoolproblemen hebben, dan kinderen zonder V-P verschil. Ook blijkt er geen verband te zijn tussen V-P verschillen (waarbij rekening is gehouden met de richting van het verschil) en bepaalde schoolproblemen. Wel blijkt dat kinderen, die een groot V-P verschil hebben waarbij het Performaal IQ domineert, vaker creatief zijn en dat kinderen, die een groot V-P verschil hebben waarbij het Verbaal IQ domineert, vaker houden van activiteit en discussie en vaker opkomen voor hun eigen opvattingen. Op grond van de resultaten uit deze studie kan geconcludeerd worden, dat er enkel aan de aanwezigheid van V-P verschillen niet zomaar de conclusie kan worden verbonden dat er sprake is van schoolproblemen. Wel blijft het belangrijk na te gaan hoe een kind aan bepaalde scores (en dus ook aan een eventueel V-P verschil) gekomen is. Een V-P verschil kan in individuele gevallen en tezamen met andere informatie over het kind namelijk aanwijzingen geven over de capaciteiten van een kind en daarmee een indicatie geven voor verder onderzoek en/of mogelijkheden bieden om te handelen.
1
Inleiding “For V-P comparisons, I consider 12 points to be a difference that is worthy of explanation.” (Kaufman, 1979, p. 24). Het lijkt een eenvoudige uitspraak, maar het is er één met een enorme impact. Uit deze bewering concludeert een aantal clinici namelijk, dat wanneer na afname van de WISC-RN blijkt, dat een kind een verschil van 12 punten of meer heeft tussen de scores op het verbale en performale testgedeelte, dit wijst op een stoornis bij dat kind. In Nederland wordt ontzettend veel belang gehecht aan het mogelijk vaststellen van stoornissen en problemen op basis van een dergelijk verschil. Er is de laatste jaren herhaaldelijk over geschreven en er is zelfs een speciale term voor bedacht: de verbaalperformaalkloof. Zo viel in een tijdschrift voor ouders van hoogbegaafde kinderen bijvoorbeeld te lezen, dat ouders regelmatig de vraag stellen of er iets aan de verbaalperformaalkloof van hun kind te doen is, omdat zij deze kloof zien als oorzaak van onder andere leermoeilijkheden en emotionele problemen. ‘De kloof’ is zo langzamerhand een eigen leven gaan leiden als boosdoener en “suggereert een onoverbrugbare gespletenheid” (Burger-Veltmeijer, 2002, p. 18). En hoogbegaafde kinderen lijken bij uitstek degenen te zijn, waarbij het verschil tussen de verbale en de performale scores problemen oplevert (van Gerven, 2000). De groeiende belangstelling voor dit onderwerp is volgens van Gerven (2001) verklaarbaar vanuit het feit dat er onder deskundigen over dit onderwerp, de oorzaken van dit verschijnsel en het gewicht dat daaraan moet worden toegekend een groot verschil van inzicht bestaat. Zo zijn er enerzijds mensen, die van mening zijn, dat dit verschil in verbale en performale testscores een verschil in denkstructuren weergeeft (Brunia, 2000) en dat het feit, dat hoogbegaafde kinderen met zo’n verschil vele malen sneller denken dan ze ooit kunnen handelen, een ernstige belemmering is om tot goede prestaties te komen (Drent en van Gerven, 2002). Hoogbegaafde kinderen, die een verschil van 12 of meer punten hebben tussen hun verbale en performale testscores, zouden mondeling zeer vaardig zijn, maar hun schriftelijk werk zou in vergelijking daarmee van mindere kwaliteit zijn. Deze kinderen vinden het moeilijk om routinetaken goed uit te voeren, vinden het moeilijk structuur aan te brengen en overzicht te houden bij hun taken, zijn chaotisch en vergeetachtig, hebben moeite met concentreren en werken onder tijdsdruk, zijn boos, verdrietig, traag met het rekenen, kunnen moeilijk automatiseren, zijn motorisch onhandig, hebben last van angsten, nachtmerries en tics, ervaren een drempel bij nieuwe dingen en hebben een negatief zelfbeeld. (Brunia, 2000; Drent & van Gerven, 2002) Verder zouden kinderen, die performaal hoger scoren dan verbaal, goed passen in de groep omdat ze goed kunnen imiteren. Kinderen, die verbaal hoger scoren dan performaal, zouden een stoorzender in de groep zijn, aldus Brunia (2000). Het gevolg van al deze problemen is volgens Drent en van Gerven (2002), dat het kind steeds meer gefrustreerd raakt, omdat het niet aan de gestelde eisen en onze verwachtingen kan voldoen. Helaas echter worden deze uitspraken, ten aanzien van de problemen die hoogbegaafde kinderen met een verbaal-performaal discrepantie zowel thuis als op school ondervinden, niet onderbouwd met empirisch onderzoek. Anderzijds is er een groep mensen die juist geen uitspraken over dit verschijnsel willen doen, omdat er nog geen wetenschappelijk onderzoek verricht is. In het Tijdschrift
2
voor Orthopedagogiek (de Groot, Ghesquière, Hinzen-Hanssen, Mildenberg & van der Ploeg red., 2002), dat een themanummer aan de zorg voor hoogbegaafden in het onderwijs wijdt, valt dan ook niets te lezen over de problemen, die hoogbegaafde kinderen met een verschil tussen hun verbale en performale testscores zouden ondervinden. En Peters meldt, in een interview door van Gerven (2000), dat we ons te weinig bewust zijn van het feit dat scores op intelligentietests niet zo eenvoudig te interpreteren zijn. Voordat de scores geïnterpreteerd kunnen worden, moet eerst heel precies naar die scores gekeken worden en goed na worden gegaan hoe een kind deze scores heeft verkregen. Het zou bijvoorbeeld wel eens kunnen dat je heel iets anders hebt gemeten dan je oorspronkelijke doel was. Iedere onderzoeker dient zich volgens hem af te vragen of hij wel heeft gemeten wat hij wilde meten, voordat hij zijn meetresultaten interpreteert. En dat is ook wat Kaufman (1979) met zijn uitspraak bedoelde. Hoewel de discussie natuurlijk wat minder zwart-wit is, dan zo in enkele regels gesteld kan worden, is het een feit, dat er nogal tegenstrijdig gedacht en gesproken wordt over het verschil tussen verbale en performale testscores. Daarbij komt, dat er tot op heden in Nederland nog geen onderzoek naar de frequentie van voorkomen van die verschillen tussen de verbale en performale testscores bij hoogbegaafde kinderen en de eventuele relatie met bijvoorbeeld schoolsucces of een bepaalde problematiek blijkt te zijn gedaan. Volgens Busato (2000) kan dit eenvoudig gebeuren, omdat er inmiddels databestanden genoeg zijn, waarbinnen deze vraag met niet al te moeilijke statistische technieken onderzocht kan worden. Zolang deskundigen echter in discussie blijven zonder wetenschappelijk onderzoek te verrichten, leven ouders en leerkrachten in onzekerheid en gaan ze zelf op zoek naar informatie. En die informatie zal niet altijd van het vereiste wetenschappelijk niveau zijn, waardoor de discussie een discussie zonder basis dreigt te worden. En daar wordt niemand wijzer van. Het doel van deze scriptie is dan ook verheldering te scheppen in de lopende discussie, door te onderzoeken of we de WISC-RN inderdaad als presenteerblaadje kunnen gebruiken bij het vaststellen van schoolproblemen bij kinderen. Stap voor stap zal in deze scriptie de zoektocht naar een antwoord op deze vraag worden beschreven. In hoofdstuk 1 wordt begonnen met een theoretische oriëntatie, waarbij eerst wordt ingegaan op het ontstaan, de inhoud, de analyse en de interpretatie van de WISC-RN, de intelligentietest waarop de hele discussie is gebaseerd. Vervolgens wordt de interpretatie van V-P verschillen in het bijzonder beschreven, waarbij ook enkele relevante studies aan bod zullen komen. Het eerste hoofdstuk wordt afgesloten met het formuleren van een aantal conclusies, onderzoeksvragen en hypothesen, die in een eigen studie zijn onderzocht. De opzet en uitvoering van dit onderzoek worden in het tweede hoofdstuk besproken en de resultaten ervan in hoofdstuk 3. Hoofdstuk 4 vormt, met een discussie betreffende het onderzoek, de afsluiting van deze scriptie. Overigens wordt in deze scriptie niet gesproken over een ‘verbaalperformaalkloof’, of een ‘disharmonisch profiel’, maar over een ‘verbaal-performaal discrepantie’. De eerste term suggereert namelijk dat er meer aan de hand is dan alleen een verschil in testscores en de tweede term is daarentegen weer te ruim, omdat een disharmonisch profiel ook het gevolg kan zijn van andere afwijkende testscores. De term ‘verbaal-performaal discrepantie’ (ofwel V-P verschil) drukt als enige in verkorte vorm uit, waar het feitelijk om gaat: een discrepantie tussen de verbale en performale testscores van de WISC-RN.
3
1
Theoretische oriëntatie
Inleiding Intelligentieonderzoek vormt vaak een onderdeel van de diagnostiek bij kinderen met psychosociale problemen en leerproblemen en niet zonder reden. Het kan bijvoorbeeld uitsluitsel bieden, wanneer er vragen gerezen zijn omtrent het cognitief functioneren van een kind (Geelhoed, 1996). Maar hoewel de resultaten van intelligentieonderzoek vele antwoorden opleveren, roepen ze daarnaast vele vragen op. Eén van deze vele vragen zal in deze scriptie hopelijk worden beantwoord. Het betreft de vraag of een V-P verschil wijst op de aanwezigheid van schoolproblemen. Om een goed en ook goed onderbouwd antwoord te kunnen geven op deze vraag, zal in paragraaf 1.1. eerst een beschrijving worden gegeven van de WISC-RN en het ontstaan ervan, omdat de discussie over V-P verschillen in Nederland feitelijk gebaseerd is op deze ene intelligentietest. In paragraaf 1.2. wordt ingaan op de analyseprocedure van de WISC-RN en in paragraaf 1.3. wordt de interpretatie van de behaalde resultaten behandeld. Vervolgens wordt in paragraaf 1.4. op de interpretatie van V-P verschillen in het bijzonder ingegaan, waarbij ook een aantal relevante studies worden beschreven. In deze paragraaf zal overigens ook ingegaan worden op wat precies verstaan wordt onder ‘schoolproblemen’. In paragraaf 1.5. worden een aantal conclusies getrokken en in paragraaf 1.6. worden de onderzoeksvragen en bijbehorende hypothesen geformuleerd.
1.1. De WISC-RN De WISC (Wechsler Intelligence Test for Children) is een intelligentietest bestemd voor kinderen en kwam in 1949 op de markt. Hij is genoemd naar zijn ontwerper, David Wechsler. In 1974 werd de test geresiviseerd, waarna de naam veranderde in WISC-R (Wechsler Intelligence Test for Children-Revised). Deze gereviseerde test werd in 1976 vertaald in het Nederlands en in 1986 verscheen de normering voor Nederlandse kinderen in de leeftijd van 6 tot en met 16 jaar. (Geelhoed, 1996; Harinck & Schoorl, 1987; Kaufman en Lichtenberger, 2000). Deze laatste versie wordt aangeduid met WISC-RN (Wechsler Intelligence Test for Children-Revised, Nederlands genormeerd) en dit is, ondanks het feit dat in Nederland ondertussen ook de vertaling van de derde versie (WISC III NL) in gebruik is, de versie die in deze scriptie centraal staat. In deze scriptie wordt regelmatig verwezen naar studies met betrekking tot de WISC-R. De resultaten van deze studies gaan ook op voor de WISC-RN, omdat is aangetoond dat de onderliggende structuur van beide tests gelijk is (De Bruyn, Vander Steene & van Haassen, 1986b). De WISC-RN bestaat uit twaalf subtests, waarvan er zes het verbale gedeelte vormen, waarbij de input steeds verbaal is en het kind een actieve verbale respons moet geven. De andere zes subtests vormen het performale testgedeelte en daarbij moet (of mag) de respons ‘handelend’ gegeven worden (Geelhoed, 1996). Een korte beschrijving van de taak en de meetpretentie van de twaalf subtests is te vinden in tabel 1.
4
Tabel 1 Indeling van de subtests per testgedeelte met per subtest een korte beschrijving van de taak en de meetpretentie Verbale testgedeelte Subtestnaam
Taak
Meetpretentie
Informatie
Beantwoorden van vragen met betrekking tot algemene kennis Benoemen van overeenkomsten tussen woordparen Uit het hoofd uitrekenen van mondeling aangeboden verhaalsommen Benoemen van de betekenis van een aantal woorden Beantwoorden van vragen over allerlei sociale situaties
Bereik van algemene feitenkennis
Overeenkomsten Rekenopgaven
Woordenschat Begrijpen
Logisch abstract (categorisch) denken Rekenvaardigheid
Taalontwikkeling Woordenschat Demonstratie van praktische informatie Evaluatie en gebruik van vroegere ervaringen Korte-termijn-geheugen (auditief)
Cijferreeksen
Nazeggen van een toenemend aantal cijfers, eerst in dezelfde en daarna in omgekeerde volgorde
Subtestnaam
Taak
Meetpretentie
Onvolledige Tekeningen
Aanwijzen of zeggen welk detail van een getekend voorwerp ontbreekt
Plaatjes Ordenen
In de juiste volgorde leggen van series plaatjes zodat ze ‘een verhaaltje’ vormen Met blokken naleggen van patronen, die uit rode en witte vierkanten en driehoeken zijn opgebouwd
Visuele alertheid Visuele herkenning en identificatie (lange-termijn visueel geheugen) Anticipatie van consequenties Temporeel sequentiëren en tijdsconcepten Analyse van gehelen in samenstellende delen Niet-verbale conceptformatie Spatiële visualisatie Vaardigheid te profiteren van sensorisch-motorische feedback Anticipatie van relaties tussen delen Flexibiliteit Vaardigheid om richtingen te volgen Nauwkeurige snelheid en accuratesse Psychomotorische snelheid Korte-termijn-geheugen (visueel) Het volgen van een visueel patroon Anticiperen
Performale testgedeelte
Blokpatronen
Figuur Leggen
In elkaar zetten van legpuzzels zonder voorbeeld en kader
Substitutie
Combineren van figuren/cijfers met bepaalde symbolen aan de hand van een voorbeeld
Doolhoven
Tekenen in een doolhof van de weg naar buiten
Noot. Naar “Intelligentie-onderzoek binnen de klinische cyclus” (p. 133) door J.W. Geelhoed, 1996, in: Pedologisch Jaarboek door H.M. Pijnenburg, C.M. Van Rijswijk, A.J.J.M. Ruijssenaars en J.W. Veerman (red.), Delft: Eburon; Intelligent Testing with the WISC-R (pp. 102-109), door A.S. Kaufman, 1979, New York: John Wiley & Sons, Inc.; “Intelligentieonderzoek” (p. 294) door A.J.C. Struiksma en J.W. Geelhoed, 1998, in: Handboek psychodiagnostiek voor de hulpverlening aan kinderen door Th. Kievit, J. De Wit, J.H.A. Groenendaal en J.A. Tak (red.), Maarssen: Elsevier/De Tijdstroom.
5
Toen Wechsler in de jaren dertig van de vorige eeuw besloot zijn steentje bij te dragen aan de ontwikkeling van intelligentietests, was het niet gebruikelijk om zowel een verbaal als een performaal gedeelte in een test te stoppen. Destijds vond men het onzinnig een uitgebreide non-verbale test af te nemen, omdat men dacht dat een korte verbale test exact dezelfde informatie op zou leveren (Kaufman & Lichtenberger, 2000). Non-verbale tests werden in die tijd alleen gebruikt bij mensen die de vereiste mondelinge en schriftelijke taalvaardigheden misten. De reden dat Wechsler toch voor een verbaal en performaal gedeelte koos, was het gevolg van een combinatie van zijn sterke klinische vaardigheden, zijn statistische training (hij studeerde bij Charles Spearman en Karl Pearson in Engeland) en de uitgebreide ervaring in het afnemen van tests, die hij in de Eerste Wereldoorlog had opgedaan. Wechsler wilde, net als zijn voormalige leermeester Spearman, met zijn tests de ‘general intelligence’, ofwel de algemene intelligentie, van mensen met (ongeveer) gemiddelde intellectuele capaciteiten meten (De Bruyn e.a., 1986b; Kaufman, 1994; Kaufman & Lichtenberger, 2000). Hij koos daarom voor een brede benadering, waarbij hij zijn tests gedeeltelijk heeft gebaseerd op de intelligentietests die het Amerikaanse leger destijds gebruikte. Voor het verbale gedeelte baseerde hij zich op de Stanford-Binet en de Army Alpha en voor het performale gedeelte baseerde hij zich op de Performance Scale Examination en Army Beta (de non-verbale tegenhanger van de Army Alpha). (Kaufman & Lichtenberger, 2000; Moenaert & Vander Steene, 1993). Door het ontwikkelen van een intelligentietest met zowel een verbaal als een performaal deel, leverde David Wechsler een bijdrage aan de ontwikkeling van intelligentietests in het algemeen. En hoewel deze tweedelige test tegen de conventionele wijsheid van die tijd in ging, realiseert men zich tegenwoordig terdege dat juist deze onderverdeling een bijdrage zou kunnen leveren aan de klinische bruikbaarheid van intelligentietests (Kaufman & Lichtenberger, 2000). Sinds de ontwikkeling van Wechslers test, zijn er volgens Kaufman en Lichtenberger dan ook uitgebreide theoretische speculaties gedaan over de betekenis van deze test en zijn scores. Wechsler zelf zag intelligentie als de mogelijkheid van een persoon om doelgericht te handelen, rationeel te denken en effectief met zijn (of haar) omgeving om te gaan (Wechsler, in Kaufman & Lichtenberger, 2000) en deze visie vormde de basis voor zijn definitie van intelligentie: “Intelligence is the overall capacity of an individual to understand and cope with the world around him” (Wechsler, in Struiksma & Geelhoed, 1998, p. 291). Met zijn tests wilde Wechsler dan ook het algemeen niveau van functioneren van een kind meten (De Bruyn e.a., 1986b). Helaas is er geen sprake van een echte theoretische onderbouwing voor de wijze waarop hij dit algemeen functioneren dacht te meten; er ligt geen enkele duidelijke theorie ten grondslag aan de indeling van zijn test in een verbaal en performaal gedeelte (Kaufman & Lichtenberger, 2000; Rispens & Van Yperen, 1994). Ondanks het feit dat de WISC-RN zich vooral leent voor het bepalen van het algemene intelligentieniveau, hebben clinici altijd meer informatie willen halen uit een testafname dan ‘slechts een enkel getal’. Kaufmans visie (1979) op de meetpretentie van de test (zie tabel 1) is daar een voorbeeld van. Clinici streven er immers naar meer inzicht te krijgen in de cognitieve mogelijkheden en beperkingen van een kind (Struiksma & Geelhoed, 1998). De vraag is op welke wijze dat verantwoord kan gebeuren en welke vuistregels te geven zijn voor het analyseren van de WISC-RN. In de volgende paragraaf wordt daarom ingaan op een procedure waarmee de WISC-RN systematisch kan worden geanalyseerd. 6
1.2. Analyse van de WISC-RN Volgens Kaufman (1979) vereist de analyse van de WISC-R een gestructureerde aanpak, waarbij het volgens hem handig is met de meest globale score te beginnen en de analyse vervolgens op een steeds specifieker niveau uit te voeren, totdat alle betekenisvolle hypothesen omtrent de capaciteiten van het kind onthuld zijn. Geelhoed (1996) heeft deze hiërarchische analyseprocedure geactualiseerd voor de Nederlandse versie van de test. Volgens de procedure dient eerst een analyse op testniveau te worden uitgevoerd. Daarna dient een analyse op verbaal- en performaalniveau te worden uitgevoerd, vervolgens op factorniveau, dan op subtestniveau en tot slot dient een analyse op itemniveau te worden gedaan. In deze paragraaf wordt een beschrijving gegeven van de vijf stappen in de analyse van de WISC-RN.
1.2.1. Analyse op testniveau Bij een analyse op testniveau wordt de score, die een kind haalt, uitgedrukt in een Totaal IQ (in het vervolg TIQ). Het TIQ geeft een indicatie van de cognitieve mogelijkheden van een kind en wordt meestal beschreven in zowel kwantitatieve als kwalitatieve termen. Kwantitatief wordt het IQ eenduidig beschreven aan de hand van een schaal waarop het gemiddelde voor iedere leeftijdscategorie uit de normgroep per definitie 100 is en de standaardafwijking 15 (Geelhoed, 1996). Voor de kwalitatieve beschrijving bestaan echter verschillende indelingen. Omdat hiermee niet wordt voldaan aan het uitgangspunt van de Commissie Testaangelegenheden Nederland (COTAN), dat collega’s elkaars rapportage goed kunnen verstaan en beoordelen, hebben Resing en Blok (2002) recentelijk een voorstel gedaan voor een eenduidige verbale labeling van intelligentieklassen. In tabel 2 is de door hen voorgestelde indeling af te lezen. Tabel 2 Indeling en classificatie voor IQ-scores IQ-indeling > 130 121 – 130 111 – 120 90 – 110 80 – 89 70 – 79 50 – 69 35 – 49 20 – 34 < 20
Labeling / Classificatie Zeer begaafd Begaafd Boven gemiddeld Gemiddeld Beneden gemiddeld Laag begaafd / moeilijk lerend Licht zwakzinnig / lichte verstandelijke beperking Matig zwakzinnig / matige verstandelijke beperking Ernstig zwakzinnig / ernstige verstandelijke beperking Diep zwakzinnig / diepe verstandelijke beperking
Noot. Naar “De classificatie van intelligentiescores: voorstel voor een eenduidig systeem,” door W.C.M. Resing en J.B. Blok, 2002, De Psycholoog, 37, 5, p. 246.
7
Het TIQ geeft als het ware een samenvatting van de prestaties op de verschillende testonderdelen (subtests). Wanneer de onderdelen van de test in ongeveer gelijke mate bijdragen aan de totaalscore, vormt het TIQ volgens Geelhoed (1996) een goede beschrijving van het cognitief functioneren en is er sprake van een harmonisch profiel.
1.2.2. Analyse op verbaal- en performaalniveau Wanneer een kind zeer wisselend presteert op de verschillende subtests geeft het TIQ geen goede indruk van de cognitieve mogelijkheden van dat kind (Geelhoed, 1996). In dat geval dient volgens Geelhoed gebruik te worden gemaakt van de tweedeling in verbale en performale taken, die Wechsler in zijn test heeft aangebracht. Dit betekent dat de WISC-RN op verbaal- en performaalniveau moet worden geanalyseerd. Aan de hand van de verbale taken kan een Verbaal IQ (in het vervolg VIQ) en op grond van de performale taken kan een Performaal IQ (in het vervolg PIQ) worden berekend. Wanneer het VIQ en PIQ ver uit elkaar liggen, dan zijn de vaardigheden waarop de twee delen een beroep doen ongelijkmatig ontwikkeld en is het volgens Geelhoed beter het VIQ en PIQ afzonderlijk te beschrijven, omdat het TIQ in dat geval geen adequate weergave geeft van de cognitieve mogelijkheden van het kind.
1.2.3. Analyse op factorniveau Na een analyse op verbaal- en performaalniveau dient volgens Kaufman (1979) en Geelhoed (1996) een analyse op factorniveau te worden uitgevoerd. Deze analyse op factorniveau mag echter niet verward worden met een factoranalyse. Met behulp van een factoranalyse kan worden aangegeven hoeveel factoren een test bevat (Harinck, 2000). Kaufman (1975) liet deze techniek los op de WISC-R en uit zijn onderzoek blijkt de samenhang tussen de subtests van de WISC-R het best te worden beschreven door een drietal factoren: Verbaal Begrip, Perceptuele Organisatie en Vrijheid van Afleidbaarheid, waarbij de eerste twee factoren redelijk overeenkomen met Wechslers indeling. De derde factor komt in de literatuur overigens onder verschillende namen voor. Dit komt doordat het bij de subtests die onder deze factor vallen enerzijds gaat om aandacht, concentratie en afleidbaarheid en anderzijds om het vasthouden van sequentiële informatie. Het is daarom niet duidelijk om welke vaardigheden of cognitieve functies het bij deze factor precies gaat, waardoor de inhoudelijke duiding van de derde factor erg omstreden blijft. (Geelhoed, 1996; Moenaert & Vander Steene, 1993). Bij een analyse op factorniveau wordt bekeken in hoeverre de resultaten van een kind beschreven kunnen worden aan de hand van de door Kaufman (1975) gevonden drie factoren (Geelhoed, 1996). In dat geval worden alle subtests volgens de drie factoren gegroepeerd (zie tabel 3), met uitzondering van de subtest Plaatjes Ordenen. De subtests Plaatjes Ordenen blijkt namelijk onder geen enkele factor te vallen, omdat deze subtest ongeveer even sterk samenhangt met alle drie factoren (Kaufman, 1975). Na het groeperen van de subtests kan per factor een IQ berekend worden. Wanneer blijkt, dat de factor-IQ’s significant van elkaar verschillen, concludeert Geelhoed (1996), dat de cognitieve mogelijkheden van het kind door de factor-IQ’s beter worden beschreven dan
8
door het TIQ of het VIQ en PIQ, omdat nu beter duidelijk wordt wat de sterkere en zwakkere functies zijn. Tabel 3 De Kaufmanfactoren Verbaal Begrip Informatie Overeenkomsten Woordenschat Begrijpen
Perceptuele Organisatie Onvolledige Tekeningen Blokpatronen Figuurleggen Doolhoven
Vrijheid van Afleidbaarheid Rekenopgaven Cijferreeksen Substitutie
Noot. Naar “Factor Analysis of the WISC-R at 11 Age Levels Between 6½ and 16½ Years,” door A.S. Kaufman, 1975, Journal of Consulting and Clinical Psychology, 43, 2, p. 142.
1.2.4. Analyse op subtestniveau In een enkel geval is een analyse op subtestniveau noodzakelijk. Dit is bijvoorbeeld het geval wanneer een factor-IQ niet consistent is opgebouwd, doordat één of meerdere subtests te veel afwijken van het factorgemiddelde, waardoor er sprake is van een grote spreiding binnen het verbale en/of performale testgedeelte (Geelhoed, 1996; Kaufman, 1979). Een analyse op subtestniveau biedt mogelijkheden voor kwalitatieve interpretaties en het stellen van hypothesen (Geelhoed, 1996; Kaufman, 1979). Of dergelijke hypothesen houdbaar zijn, zal volgens Geelhoed aan de hand van een analyse van de subtests op itemniveau verder moeten worden onderzocht, voor men tot interpretatie mag overgaan.
1.2.5. Analyse op itemniveau Ook op itemniveau hebben we volgens Geelhoed (1996) te maken met mogelijke kwalitatieve interpretaties. Op itemniveau is niet de analyse van verschillen tussen scores van belang, maar de analyse omtrent de totstandkoming van de score op een bepaalde subtest. Wanneer bepaalde patronen ook terug worden gevonden bij andere subtests, zal daar bij de interpretatie van de IQ’s rekening mee moeten worden gehouden (Geelhoed, 1996). Geelhoed (1996) is net als Kaufman (1979) van mening dat een gestructureerde analyseprocedure zich goed leent als basis voor het doen van kwalitatieve interpretaties. Kaufman vermeldt daarnaast echter ook dat men de resultaten die naar voren komen bij de testanalyse niet zomaar mag interpreteren. Het gaat namelijk niet alleen om de geleverde prestatie, maar vooral om de reden waarom en de wijze waarop die prestatie tot stand is gekomen: “The key is to understand why the youngsters scored the way they did, not to stress how well they performed” (Kaufman, 1979, p. 3). Daarover gaat de volgende paragraaf.
9
1.3. Interpretatie van de WISC-RN Na het doorlopen van de analyseprocedure kan een diagnosticus niet zomaar overgaan op het interpreteren van de resultaten zoals deze uit de procedure naar voren zijn gekomen. Na het analyseren van de WISC-RN blijkt namelijk in een aantal gevallen, dat de resultaten, die een kind heeft behaald, geen uitsluitsel bieden omtrent het cognitief functioneren van dat kind, maar juist meer vragen oproepen. Hoewel de voorgestelde analyseprocedure is opgesteld op basis van factoranalytische en psychometrische overwegingen, en de diagnosticus de psychometrische richtlijnen natuurlijk moet begrijpen en opvolgen, moet de diagnosticus volgens Kaufman (1979) vooral ook afgaan op zijn logische verstand. De diagnosticus zal zich volgens hem als een echte onderzoeker moeten gedragen om alle betekenisvolle hypothesen omtrent de capaciteiten van het geteste kind te kunnen formuleren (Kaufman, 1979, 1994). Deze hypothesen over de relatief sterke en zwakke kanten in het functioneren van een kind kunnen ons helpen het kind beter te begrijpen (Sattler, 1988; Struiksma & Geelhoed, 1998), maar voor een diagnose gesteld kan worden, dienen de op de testanalyse gebaseerde hypothesen, gecontroleerd te worden aan de hand van andere informatie over het onderzochte kind. Sattler (1988) noemt als voorbeeld daarvan informatie die voortkomt uit andere tests. Kaufman en Lichtenberger (2000) noemen daarnaast onder andere de medische achtergrond van het kind, diens schoolverloop, ontwikkelingsgeschiedenis en familiegeschiedenis en gedragsobservaties. En ook Geelhoed (1996) is van mening dat een goede interpretatie van de testresultaten slechts mogelijk is in het licht van gedetailleerde informatie over de ontwikkeling van het kind, na een grondige analyse van het klachtgedrag en op grond van gedragsobservaties die in de testsituatie zijn verkregen. Een verbaal-performaal discrepantie is één van de vele mogelijke resultaten van de analyseprocedure en net als bij alle andere resultaten zal ook bij een V-P verschil niet zomaar mogen worden overgegaan op interpretatie van de scores. Ook bij deze verschilscore zal de diagnosticus als een echte onderzoeker op zoek moeten gaan naar alle mogelijke verklaringen voor het resultaat en zal hij zich bij het opstellen van de hypothesen niet alleen mogen laten leiden door de resultaten zoals deze uit de analyseprocedure naar voren komen. Tevens zullen de opgestelde hypothesen getoetst moeten worden, voor de diagnosticus kan overgaan tot het stellen van een diagnose. Waarmee bij de interpretatie van V-P verschillen daarnaast specifiek rekening gehouden dient te worden, staat beschreven in paragraaf 1.4.
1.4. Interpretatie van V-P verschillen Volgens Hsu (1996) kan bij het interpreteren van V-P verschillen aan deze discrepantie tussen een kinds VIQ en PIQ pas betekenis verleend worden, wanneer deze aan drie criteria voldoet. Ten eerste moet de discrepantie een ‘echt’ verschil weergeven. Alternatieve verklaringen voor dit testresultaat moeten dus worden uitgesloten, anders mag je het verschil niet interpreteren. Ten tweede moet het verschil ‘abnormaal’ zijn en ten derde moet het verschil duiden op de aanwezigheid van een pathologische conditie,
10
anders kun je op basis van het verschil alleen niets concluderen. In deze paragraaf worden de drie door Hsu genoemde criteria nader besproken.
1.4.1. Echte verschillen De discrepantie tussen iemands VIQ en PIQ is volgens Hsu (1996) pas van betekenis wanneer het verschil in testscore een werkelijk verschil tussen iemands verbale en performale intelligentie weergeeft. Een echt verschil is een verschil dat is vastgesteld zonder dat er sprake was van toevallige of systematische meetfouten. Het is dus respectievelijk zowel betrouwbaar als valide. Bij de betrouwbaarheid van de WISC-RN wordt uitgebreid stilgestaan in de verantwoording van deze test (De Bruyn e.a., 1986b). De betrouwbaarheid van de gehele test, ofwel van het TIQ, is berekend met behulp van de interne consistentie coëfficiënt en blijkt voor de totale Nederlandse normgroep .96 te zijn. De betrouwbaarheid van het VIQ is .95 en van het PIQ .90. (De Bruyn e.a., 1986b). De betrouwbaarheid van het verschil tussen het VIQ en het PIQ bedraagt .82 voor de totale groep (De Bruyn e.a., 1986b) en aangezien een waarde van .70 of hoger als redelijk wordt beschouwd (Harinck, 2000) kan ook de betrouwbaarheid van dit verschil als voldoende worden beoordeeld. De betrouwbaarheid van de verschilscore tussen het VIQ en PIQ verschilt overigens per leeftijdsgroep. In tabel 4 kan de betrouwbaarheid van het verschil tussen het VIQ en PIQ voor de verschillende leeftijdsgroepen en voor de totale Nederlandse normgroep afgelezen worden, tezamen met de standaardmeetfout. Wanneer het verschil groter is dan op grond van de meetfout te verwachten is, is het onwaarschijnlijk dat het voortgekomen is als gevolg van toeval en is het dus betrouwbaar (Geelhoed, 1996; Silverstein, 1981). Tabel 4 Betrouwbaarheid van het V-P verschil per leeftijdsgroep van de Nederlandse normgroep en voor alle leeftijden (6-16 jaar) tezamen Leeftijd 6 jaar 7 jaar 8 jaar 9 jaar 10 jaar 11 jaar 12 jaar 13 jaar 14 jaar 15 jaar 16 jaar 6-16 jaar
Betrouwbaarheid 0.86 0.80 0.82 0.83 0.79 0.85 0.79 0.81 0.81 0.81 0.81 0.82
Standaardmeetfout 6.20 6.10 5.54 5.83 5.86 5.85 5.94 5.77 5.78 5.81 5.72 5.80
Noot. Naar Wechsler Intelligence Scale for Children – Revised, Nederlandse Uitgave: verantwoording (p. 70), door E.E.J. De Bruyn, G. Vander Steene en P.P. van Haasen, 1986b, Lisse: Swets & Zeitlinger B.V.
11
In tabel 5 is af te lezen hoe groot het verschil moet zijn, voor we van een betrouwbaar verschil mogen spreken, waarbij wordt opgemerkt dat het om een tweezijdige toetsing gaat (De Bruyn e.a., 1986b). Dit betekent dat discrepanties die groter of gelijk aan deze waarden zijn, ongeacht hun richting (V>P of V
p < .05 12 12 11 11 12 12 12 11 11 11 11 11
p < .01 16 16 14 15 15 15 15 15 15 15 15 15
Noot. Naar Wechsler Intelligence Scale for Children – Revised, Nederlandse Uitgave: scoring en normen (p. 154), door E.E.J. De Bruyn, G. Vander Steene en P.P. van Haasen, 1986a, Lisse: Swets & Zeitlinger B.V.
De verschilscores van de Nederlandse normgroep (N=1959) verschillen overigens enigszins van de verschilscores van de Amerikaanse normgroep (N=2200). Voor de oorspronkelijke (Amerikaanse) normgroep, die bestond uit 100 jongens en 100 meisjes voor elk van de 11 leeftijdsgroepen tussen 6½ en 16½ jaar, werd door Wechsler (in Kaufman, 1976) gerapporteerd, dat een verschil van 12 punten significant is op het 5% niveau en een verschil van 15 punten statistisch significant is op het 1% niveau. Een fout die helaas door veel mensen wordt gemaakt, is dat men denkt, dat de kans dat het gevonden verschil op toeval berust, even groot is als de kans dat een bepaald verschil gehaald wordt. In paragraaf 1.4.2. zal ik ingaan op dit misverstand. Eerst wil ik echter nog ingaan op de validiteit van verschilscores, omdat deze een cruciale rol speelt in het interpretatieproces. Want hoewel de aanwezigheid van een betrouwbaar verschil een noodzakelijke voorwaarde is voor het toekennen van enige betekenis aan het verschil omdat een verschil dat het gevolg is van meetfouten klinisch geen enkele betekenis heeft (Berk, 1982; Hsu, 1996) - is deze aanwezigheid nog geen voldoende voorwaarde om het
12
verschil ook een ‘echt’ verschil te noemen (Hsu, 1996). Een test met een hoge betrouwbaarheid meet namelijk niet noodzakelijk wat men bedoelt te meten (Drenth & Sijtsma, 1990), waardoor de beslissing van een diagnosticus omtrent de ‘echtheid’ van een verschilscore niet alleen afhangt van de betrouwbaarheid van de score, maar daarnaast ook van de validiteit (Berk, 1982). Validiteit wordt door Drenth en Sijtsma (1990, p. 173) omschreven als “de mate waarin de test aan zijn doel beantwoordt”. Volgens hen ligt in principe aan alle doelen bij het testgebruik een gemeenschappelijk kenmerk ten grondslag: het gaat bij het testen nooit om het testgedrag zelf, omdat we het testgedrag willen ‘verlengen’ tot iets – een begrip of een te voorspellen gedrag of prestatie - dat buiten het testgedrag gelegen is. Het begrip validiteit heeft volgens Drenth en Sijtsma dan ook betrekking op de vraag of de sprong van testgedrag naar iets anders verantwoord is. En die sprong is afhankelijk van de hoeveelheid systematische fouten die een test bevat. Hoe minder systematische fouten, hoe beter we meten wat we veronderstellen te meten en hoe groter de validiteit dus is (van Peet, van den Wittenboer & Hox, 1995). Wanneer we ons afvragen wat we beogen te meten met de WISC-RN en of we ook daadwerkelijk meten wat we bedoelen te meten, dan vragen we naar de begripsvaliditeit van de WISC-RN (Drenth & Sijtsma, 1990). Nu is volgens Baarda en de Goede (2001) het vaststellen van de begripsvaliditeit met name een probleem, wanneer je een abstract en complex begrip als intelligentie wilt meten. Want hoewel velen een poging hebben gewaagd ‘intelligentie’ te omschrijven, is er nog steeds geen overeenstemming bereikt over de inhoud van het begrip. Er is tot op heden zelfs geen algemeen aanvaarde definitie van intelligentie, ondanks de vele boeken die er over dit onderwerp geschreven zijn (Struiksma & Geelhoed, 1998). En hoewel Wechsler wel een definitie van intelligentie heeft, en hij met zijn test in principe algemene intelligentie wenste te meten, heeft hij de indeling van zijn test in een verbaal en een performaal deel nooit formeel gespecificeerd in een structureel model (Haartmans, 2002). We moeten ons dus terdege afvragen of we wel weten wat we daarmee meten en omgekeerd, of we wel meten wat we bedoelen te meten! Gelukkig is naar de begripsvaliditeit van de WISC-RN uitgebreid onderzoek gedaan. Daartoe zijn factoranalyses uitgevoerd en diverse intercorrelaties berekend (De Bruyn e.a., 1986b). Met behulp van factoranalyses werd nagegaan met welke factoren de subtests samenhangen en met welke factoren niet. Op basis van de psychologische interpretatie van een dergelijk correlatiepatroon kan hiermee de betekenis van het testgedrag verduidelijkt worden (Drenth & Sijtsma, 1990). Uit de onderzoeksresultaten blijkt dat zowel voor de verdeling over een verbaal en performaal deel, als voor een indeling in drie factoren, aanwijzingen zijn, waarbij volgens de auteurs geen duidelijke bewijzen zijn gevonden waaruit blijkt dat voor de ene of de andere indeling gekozen zou moeten worden (De Bruyn e.a., 1986b). Met behulp van intercorrelaties tussen de subtests en tussen de subtests en hun combinaties werd bekeken in hoeverre deze met elkaar samenhangen. Uit deze berekeningen blijkt onder andere dat de correlaties binnen het verbale en performale gedeelte duidelijk hoger liggen dan de correlaties tussen deze delen (De Bruyn e.a., 1986b). De indeling in een verbaal en performaal deel lijkt dus enige betekenis te hebben.
13
Wanneer we er van uitgaan, dat door het verbale deel verbale intelligentie en door het performale deel performale intelligentie gemeten wordt, dan is de test valide wanneer er geen alternatieve verklaringen zijn voor de testresultaten. Volgens Kaufman (1979) echter zijn deze alternatieve verklaringen er wel degelijk. Volgens hem kunnen V-P verschillen, die qua grootte en richting identiek zijn, verschillende oorzaken hebben voor verschillende individuen. Het is volgens hem zelfs zo, dat sommige betrouwbare verschillen tussen een individu’s verbale en performale testscores niet indicatief zijn voor een verschil tussen diens verbale en performale intelligenties, omdat ze enkel gebaseerd zijn op de vaardigheden waarop de twee testgedeeltes een beroep doen. In zo’n geval wordt men bij de interpretatie van het verschil misleid door de scores. (Kaufman, 1979). Zo doen bijvoorbeeld de verbale subtests meer dan de performale subtests een beroep op taalvaardigheden en aangeleerde kennis (Geelhoed, 1996). Wanneer een kind een stoornis op het auditieve vlak heeft of thuis is opgegroeid met een dialect, een andere taal of cultuur, zal het relatief gezien dan ook minder goed presteren op het verbale deel (Geelhoed, 1996; Kaufman, 1979). Uiteraard zal het feit dat beide delen uitgebreide verbale uitleg vereisen, inhouden dat de scores op beide delen worden gedrukt, maar het performale gedeelte is wat minder kwetsbaar, omdat bij de performale subtests er voorbeelditems zijn met concrete stimuli (Kaufman, 1979). En ook wanneer een kind geheugenproblemen heeft, uit een weinig stimulerende gezinssituatie afkomstig is, een verbrokkelde schoolgang (met veel schoolwisselingen of schoolverzuim) heeft gehad of tijdelijk problemen met de opname van de leerstof (door bijvoorbeeld lichamelijke of emotionele problemen van voorbijgaande aard) heeft of heeft gehad, is de kans groot dat het relatief gezien minder goed presteert op het verbale deel, omdat het minder goed in staat is of was de voor dit deel vereiste aangeleerde kennis tot zich te nemen (Geelhoed, 1996; Kaufman, 1979). Kinderen die daarentegen uit een gezin komen met ouders die zelf goed geschoold zijn en die veel belang hechten aan schoolprestaties, blijken nogal eens geneigd te zijn beter te scoren op de verbale testonderdelen (Kaufman, 1976, 1979). In al deze gevallen worden wij dus misleid omdat het VIQ niet de werkelijke verbale intelligentie weer geeft. Evenzo is het mogelijk dat we worden misleid omdat het PIQ niet de werkelijke performale intelligentie weergeeft. Alle performale subtests hebben een tijdslimiet waarbij er bonuspunten verdiend kunnen worden door snel te werken. Van de verbale tests heeft alleen Rekenopgaven een tijdslimiet, waardoor kinderen die slecht presteren onder tijdsdruk met name op de performale taken gestraft zullen worden. (Geelhoed, 1996; Kaufman, 1979). Mogelijke oorzaken voor een slechte prestatie op getimede items zijn volgens Kaufman (1979) bijvoorbeeld het feit dat een kind nog jong is en daardoor geen besef heeft van tijd, (faal)angst, afleidbaarheid, een trage motoriek, perfectionisme en het feit dat hoogbegaafde kinderen veel tijd besteden aan metacognitieve zaken. In de laatste drie gevallen weet het kind de oplossing vaak wel, maar komt het tijd te kort bij de uitvoering ervan, terwijl bij de daarvoor genoemde oorzaken de tijd een te grote rol (of juist totaal geen rol speelt) en het kind daardoor zelfs niet tot een oplossing komt. Daarnaast moet bij nogal wat subtests van het performale deel steeds naar een bepaald resultaat (een patroon, een reeks, een concrete voorstelling) worden ‘toegewerkt’, waardoor kinderen met een zwakke planningsvaardigheid of een stoornis op het organisatorische vlak nogal eens beneden gemiddeld scoren op dit deel (Geelhoed, 1996; Kaufman, 1979). En omdat de performale testonderdelen een beroep doen op het
14
handelend vermogen van een kind, zullen ook kinderen met coördinatieproblemen of een stoornis op het motorische of visuele vlak relatief gezien minder goed scoren op deze taken, terwijl er van een verschil tussen de verbale en performale intelligentie van dat kind geen sprake hoeft te zijn (Kaufman, 1979). Er zijn echter ook gevallen waarin de grootte van het verschil niet alleen misleidend is, maar waarin het verschil tussen de verbale en performale scores volstrekt betekenisloos is en het dus zinloos is het verschil te interpreteren. Dit is volgens Kaufman (1979) bijvoorbeeld het geval wanneer een kind op één subtest een zo sterk afwijkende score behaalt, dat deze ene afwijkende score een significant verschil veroorzaakt. Daarnaast heeft het volgens Kaufman ook geen zin V-P verschillen te interpreteren, wanneer er sprake is van een grote spreiding binnen het verbale en/of het performale deel; een situatie die gekenmerkt wordt door één of meerdere subtests die significant afwijken van het verbaal- of performaalgemiddelde, aldus Geelhoed (1996). Verder is de gevonden score volgens Kaufman ook betekenisloos, wanneer een kind goed in staat is een gebrek te compenseren. Kinderen met bijvoorbeeld zeer goed ontwikkelde verbale vaardigheden, kunnen deze kwaliteit volgens hem inzetten om hun relatief lagere nonverbale vaardigheden te compenseren, waardoor het gevonden V>P verschil zelfs nog een onderschatting kan zijn van wat werkelijk het geval is. En tot slot zijn scores volgens Kaufman uiteraard betekenisloos wanneer een kind binnen korte tijd voor een tweede maal getest is. Uit onderzoek van Wechsler (in Kaufman, 1979) blijkt namelijk dat het TIQ van kinderen met 7 punten stijgt wanneer ze na een aantal maanden nog eens getest worden, maar dat deze punten niet eerlijk zijn verdeeld over het verbale en performale deel: de winst is 3½ punt op het verbale deel en 9½ punt op het performale deel. Hierdoor kan er een P>V verschil ontstaan terwijl er geen sprake is van een dominante performale intelligentie of kan een V>P verschil verdoezeld worden (Kaufman, 1979). Verbaal-performaal discrepanties kunnen dus door diverse andere zaken veroorzaakt worden, dan alleen door een werkelijk verschil in de verbale en performale intelligentie van dat kind; een probleem waarop ook in populaire tijdschriftartikelen (Burger-Veltmeijer, 2002; Busato, 2000) ingegaan wordt. Wanneer er een verschil gevonden wordt, is het daarom de taak van de diagnosticus eerst naar die andere oorzaken te kijken en zich niet te laten misleiden door de grootte van het verschil of een verschil te interpreteren dat totaal betekenisloos is. Op basis van de scores alleen kunnen geen uitspraken gedaan worden, aldus Kaufman (1979). Je moet volgens hem ook observeren tijdens de test en de achtergronden van een kind nazoeken. En ook Sattler (1988) wijst op de noodzaak om bij een significant V-P verschil te kijken naar het totale voorkomen van het kind en diens klinische geschiedenis, voor men vaststelt dat het kind een probleem heeft en verder onderzoek daartoe wordt aanbevolen. Uit deze paragraaf is gebleken, dat een verschil zowel betrouwbaar als valide moet zijn voor het een ‘echt verschil’ genoemd mag worden en je het mag interpreteren. Maar voor het interpreteren van een ‘echt verschil’ ook enig nut heeft, moet het volgens Hsu (1996) aan nog twee andere criteria voldoen; het verschil moet abnormaal zijn en wijzen op een pathologische conditie.
15
1.4.2. Abnormale verschillen In de vorige paragraaf werd gesteld, dat veel mensen denken, dat de kans dat een gevonden verschil op toeval berust, even groot is als de kans dat een bepaald verschil gehaald wordt. Volgens Berk (1982) is er, door het feit dat dit onderscheid tussen de betrouwbaarheid en de afwijking van een verschil vaak verkeerd begrepen wordt, een grote kans dat diagnostici V-P verschillen in veel gevallen misinterpreteren. Niet alleen Berk, maar ook Clampit, Adair en Strenio (1983), Kaufman (1979) en Silverstein (1981) zijn van mening dat de frequentie waarmee een bepaald verschil voorkomt, dan ook zeker moet worden meegenomen in de overwegingen van de diagnosticus, ter voorkoming van deze misinterpretaties. Hiermee komen we bij het tweede criterium van Hsu (1996). Een ‘echt’ verschil is pas relevant wanneer het door slechts een relatief klein percentage van de kinderen wordt verkregen (Berk, 1982; Hsu, 1996; Silverstein, 1981). Het verschil moet dus ‘abnormaal’ zijn (Silverstein, 1981). Uit onderzoek binnen de Nederlandse normgroep (zie tabel 6) blijkt dat bij de helft van de kinderen een verschil van 9 punten (in welke richting ook) gevonden wordt en dat bij een kwart van de kinderen een verschil van 15 punten (ongeacht de richting) gevonden wordt (De Bruyn e.a., 1986a). Het behalen van een significant verschil blijkt geen abnormale gebeurtenis te zijn en men kan zich dus afvragen in hoeverre het behalen van een dergelijk verschil echt zorgelijk is (Drent & van Gerven, 2002). Tabel 6 Frequentie van voorkomen van absolute V-P verschillen van een bepaald aantal punten (of meer) binnen de Nederlandse normgroep voor alle leeftijden (6-16 jaar) tezamen Percentage kinderen waarbij een even groot of groter verschil werd gevonden 1% 5% 10% 15% 20% 25% 32% 50%
Aantal punten verschil 34 26 22 19 17 15 14 9
Noot. Naar Wechsler Intelligence Scale for Children – Revised, Nederlandse Uitgave: scoring en normen (p. 155), door E.E.J. De Bruyn, G. Vander Steene en P.P. van Haasen, 1986a, Lisse: Swets & Zeitlinger B.V.
Uit onderzoek binnen de Amerikaanse normgroep (Kaufman, 1976) kwamen vergelijkbare resultaten naar voren en volgens Kaufman, die ook meent dat de betekenis van een verschil grotendeels afhangt van het aantal kinderen in de normgroep dat een dergelijk verschil behaalt, wijst het veelvuldig gebruik van significante V-P verschillen als bewijs voor de aanwezigheid van een leerstoornis op onwetendheid bij diagnostici omtrent de frequentie van voorkomen van deze significante verschillen in de normale
16
populatie. Want, zo zegt hij, “how can a difference of 15 points, which is normal in the sence that one out of four youngsters displays a difference at least as large, be used to help confirm an abnormal diagnosis?” (Kaufman, 1979, p. 50). Ook Kaufman (in Moffitt & Silva, 1987) adviseert clinici daarom naast het criterium van betrouwbaarheid een criterium van ‘statistical abnormality’ te gebruiken. Hij zelf stelt voor een V-P verschil van ongeveer 19 of 22 als criterium te gebruiken. Dat eerste komt in minder dan 15% van de gevallen voor en dat laatste in minder dan 10% van de gevallen (Kaufman, 1994). Toch schuift Kaufman (1976) het belang van statistische significantie zeer zeker niet onder de tafel. Weten dat een kind non-verbaal significant beter functioneert dan verbaal (of andersom) zegt volgens hem veel over de vaardigheden van een kind en is van groot praktisch en onderwijskundig belang (Kaufman, 1976). Op basis van zijn studie binnen de Amerikaanse normgroep (1975) doet Kaufman overigens ook uitspraken over de richting van de gevonden verschillen. Volgens hem komen binnen de Amerikaanse normgroep significante V>P verschillen even vaak voor als significante P>V verschillen. Een jaar later onderzoekt Kaufman (1976) nogmaals de richting van V-P verschillen en ditmaal neemt hij ook de relatie tussen V-P verschillen en andere variabelen mee in zijn onderzoek. Uit dat onderzoek blijkt, dat V-P verschillen geen significant verband vertonen met leeftijd, sekse of ras, maar wel met het beroep van de ouders (p<0.001) en de hoogte van het IQ (p<0.001). Voor wat betreft de hoogte van het IQ, blijkt uit de resultaten van Kaufmans onderzoek (zie tabel 7) dat een V-P verschil van 12 punten of meer vaker voorkomt bij intelligentere kinderen dan bij minder intelligente kinderen. Zo heeft 41% van de kinderen met een IQ>109 een verschil van 12 punten of meer, terwijl slechts 28% van de kinderen met een IQ<90 een verschil van die grootte heeft. Verder blijkt uit dit onderzoek van Kaufman (1976) dat - hoewel intelligentere kinderen grotere verschillen tussen hun verbale en performale scores vertonen dan minder intelligente kinderen - de verbale noch de performale IQ's domineren op welk IQ niveau dan ook. Uit een volgend onderzoek waaraan Kaufman meewerkte (Shiff, Kaufman & Kaufman, 1981), blijkt daarentegen dat hoogintelligente kinderen (TIQ>123) overwegend significante V>P verschillen van negen punten of meer hebben. Bij deze laatste groep kinderen was er echter niet alleen sprake van een hoge intelligentie, maar ook van een leerstoornis. Tabel 7 Percentage kinderen binnen de Amerikaanse standaardisatiegroep met een significant V-P verschil van een bepaald aantal punten (indeling op basis van IQ) IQ-indeling N > 120 110 – 119 90 – 109 80 – 89 < 79 Totaal
213 361 1089 355 182 2200
9 punten of meer V>P
P>V
27 28 22 22 18 23
24 25 27 23 19 25
12 punten of meer
15 punten of meer
totaal
V>P
P>V
totaal
V>P
P>V
51 53 49 45 37 48
19 23 15 16 10 16
19 19 19 15 13 18
38 42 34 31 23 34
16 16 11 10 7 12
15 14 14 10 8 13
totaal
31 30 25 20 15 25
Noot. Naar “Verbal-Performance IQ Discrepancies on the WISC-R,” door A.S. Kaufman, 1976, Journal of Consulting and Clinical Psychology, 44, 5, p. 741.
17
Naar aanleiding van Kaufmans resultaat, dat de grootte van het V-P verschil samenhangt met de hoogte van de intelligentie, zijn er verscheidene onderzoeken gedaan bij normaal en hoog intelligente kinderen (Patchett & Stansfield, 1992; Silver & Clampit, 1990; Wilkinson, 1993). Uit deze onderzoeken blijkt, net als uit Kaufmans onderzoek (1976), dat het voorkomen van significante V-P discrepanties geen abnormale gebeurtenis is. Ten aanzien van de samenhang van de grootte van het V-P verschil met de hoogte van de intelligentie verschillen de resultaten van Kaufman (1976) echter nogal met die van Patchett en Stansfield (1992) en Wilkinson (1993). Volgens die laatsten verschilt de grootte van het V-P verschil niet significant per IQ-groep. Patchett en Stansfield merken daarbij op, dat een kind, om een hoog TIQ te kunnen krijgen, op vrijwel alle subtests hoog moet scoren. Daardoor kan het V-P verschil niet groot zijn bij kinderen met een hoog TIQ. Silver en Clampit (1990) daarentegen concluderen net als Kaufman (1976), dat het percentage kinderen, dat een verschil van een bepaalde grootte heeft, toeneemt, naarmate het IQ stijgt. Zij wijzen ons er daarom op, dat we bij de interpretatie van V-P discrepanties van kinderen met een intelligentie op hoogbegaafd niveau niet de standaard frequentietabellen kunnen gebruiken. Hoewel deze tabellen volgens hen accuraat zijn voor het ‘gemiddelde’ kind (met een IQ rond de 100), overschatten ze in grote mate de abnormaliteit van V-P discrepanties bij kinderen met een hoog IQ, waardoor er bij diagnostici onnodig allerlei alarmbelletjes gaan rinkelen. Om de V-P verschillen van deze kinderen beter te kunnen interpreteren komen ze met een nieuwe tabel (zie tabel 8) waarin de frequentie van voorkomen van absolute V-P verschillen bij hoogintelligente kinderen kan worden afgelezen en kan worden vergeleken met de frequentie van voorkomen van datzelfde verschil bij kinderen uit de Amerikaanse normgroep. Tabel 8 Percentage kinderen dat een absoluut V-P verschil van een bepaalde grootte heeft Grootte van V-P verschil in Percentage hoogintelligente combinatie met aantal IQ-punten op het dominante testgedeelte kinderen dat minimaal dit verschil 124- 128- 132- 136- > 140 131 135 139 heeft 127 50% 25% 20% 15% 10% 5% 2% 1%
9 16 18 20 23 27 32 34
10 18 20 22 25 29 33 36
12 19 21 23 26 30 34 37
13 20 22 24 27 31 36 39
14 22 23 26 28 32 37 40
Percentage kinderen uit de Amerikaanse normgroep dat Grootte van minimaal V-P verschil dit verschil heeft 50% 25% 20% 15% 10% 5% 2% 1%
0,0 8,4 10,5 12,7 15,6 20,1 25,1 28,4
Noot. Naar “WISC-R Profiles of High Ability Children: Interpretation of Verbal-Performance Discrepancies,” door S.J. Silver en M.K. Clampit, 1990, Gifted Child Quarterly, 34, 2, p. 78.
18
Tabel 8 laat de minimale absolute V-P verschillen zien, die nodig zijn om een bepaald niveau van abnormaliteit te bereiken. Aan de linkerkant van de tabel kan worden afgelezen welk percentage hoogintelligente kinderen een absoluut V-P verschil van minimaal een bepaalde grootte heeft. Daartoe dient in de kolom, die correspondeert met het IQ van het dominante testgedeelte (het VIQ of het PIQ), gezocht te worden naar de cel, die overeenkomt met de grootte van het V-P verschil. Aan de rechterkant kan ter vergelijking worden afgelezen welk percentage kinderen uit de Amerikaanse normgroep een absoluut V-P verschil van minimaal een bepaalde grootte heeft. Uit deze tabel blijkt, dat een absoluut verschil van 15 punten bij 25 tot 50% van alle hoogintelligente kinderen voorkomt en dat het percentage toeneemt naarmate het IQ stijgt; bijna 50% van alle kinderen met een dominant IQ boven de 140 heeft een discrepantie van 15 punten. Daaruit blijkt volgens Silver en Clampit dat hoewel een discrepantie van 15 punten statistisch significant is en bij slechts 10% van de kinderen uit de Amerikaanse normgroep voorkomt, deze discrepantie niet abnormaal is voor hoogintelligente kinderen. Volgens Silver en Clampit kunnen V-P verschillen die typisch zijn voor een bepaalde groep (in dit geval hoogintelligente kinderen), binnen deze groep niet tegelijkertijd ‘verdacht’ zijn of vanzelfsprekend duiden op een pathologische achtergrond. Over de richting van het verschil doen Silver en Clampit geen uitspraken. Wilkinson (1993) doet dat wel. Zij concludeert dat het VIQ een dominante rol speelt bij kinderen met een TIQ van 120 en hoger. Als reden daarvoor haalt ze Kaufman (1979) aan, die suggereert dat slimme kinderen beter presteren op de verbale subtests omdat het moeilijker is extreem hoog te scoren op de performale subtests, omdat je bij deze testonderdelen bonuspunten moet verdienen voor snelheid. In Nederland is tot nu toe nog geen onderzoek gedaan naar het voorkomen van de grootte van V-P verschillen bij kinderen met een intelligentie op minimaal begaafd niveau en ook over de richting van het verschil zijn nog geen gegevens gepubliceerd in Nederland. Wel zijn er vermoedens geuit (Drent & Van Gerven, 2002) dat, hoewel V-P verschillen in beide richtingen voorkomen, een V-P verschil waarbij de verbale vaardigheden sterker ontwikkeld zijn dan de performale vaardigheden in Nederland relatief vaker voorkomt bij hoogbegaafde kinderen. Hoewel uit deze paragraaf blijkt, dat de meningen over de toename van de grootte van het verschil en de verandering van de richting van het verschil als gevolg van het stijgen van het IQ nogal uiteenlopen, is men het ondanks alle verschillen over één ding eens: het voorkomen van een significant V-P verschil is zowel binnen de normgroep als bij kinderen met een intelligentie op minimaal begaafd niveau geen abnormale gebeurtenis. Hsu (1996) is net als Kaufman (1979) en Silver en Clampit (1990) van mening, dat wanneer een ‘echt’ V-P verschil in grote aantallen voorkomt, het daardoor aan diagnostische significantie verliest. Volgens Hsu is het daarom zo, dat abnormale verschillen klinisch van grotere betekenis zijn dan betrouwbare verschillen, wanneer het gaat om het vaststellen van een pathologische conditie.
19
1.4.3. Wijst een V-P verschil op een pathologische conditie? Hsu’s derde criterium voor het betekenisvol interpreteren van V-P verschillen is dat het verschil moet duiden op de aanwezigheid van een pathologische conditie. De vraag is in dit geval dus of V-P verschillen duiden op de aanwezigheid van schoolproblemen. Volgens Verheij (1996) omvatten schoolproblemen niet alleen problemen met de leerstof, maar ook gedragsproblemen en leidt de discrepantie tussen hetgeen de leerkracht en de leerstof eisen en hetgeen het kind kan regelmatig tot gedrags- en/of emotionele problemen. Ook Ghesquière en Ruijssenaars (1998) pleiten ervoor leerproblemen niet los te zien van gedrags- en emotionele moeilijkheden. Ten aanzien van schoolproblemen wordt in deze scriptie derhalve de volgende definitie gehanteerd: schoolproblemen zijn problemen, die kinderen ondervinden bij of als gevolg van het verwerven van vaardigheden die ze op school nodig hebben. Schoolproblemen zijn dus niet alleen problemen bij het verwerven van zogenaamde schoolse vaardigheden, zoals lezen, schrijven en rekenen, die kinderen met primaire en secundaire leerproblemen ondervinden in onderwijsleersituaties (Ghesquière en Ruijssenaars, 1995), maar ook gedragsproblemen en emotionele problemen, zoals bijvoorbeeld gevoeligheid voor kritiek, perfectionisme, motivatieproblemen, problemen met het meedoen met, aanpassen aan of werken in de groep en/of problemen met klasgenoten, en soms zelfs lichamelijke klachten, zoals bijvoorbeeld buikpijn (Betts & Neihart, 1988; Wilkinson, 1993). Of een V-P verschil werkelijk indicatief is voor de aanwezigheid van schoolproblemen is volgens Hsu (1996) alleen te achterhalen met behulp van empirisch onderzoek. Nu zijn er diverse onderzoeken verricht naar de vraag of een leerstoornis leidt tot een V-P verschil, waarbij kinderen met een leerstoornis werden vergeleken met kinderen zonder leerstoornis (Bloom, Topinka, Goulet, Reese & Podruch, 1986; Moore & Wielan, 1981; Rispens in Rispens & van Yperen, 1994; Shiff, Kaufman & Kaufman, 1981; Smith, Smith, Matthews en Kennedy, 1993; Spafford, 1989). De resultaten van deze onderzoeken spreken elkaar echter tegen. Waar sommigen (Bloom e.a., 1996; Moore & Wielan, 1981; Smith e.a., 1993) tot de conclusie komen dat er een significant verschil is tussen beide groepen, waarbij kinderen met een leerstoornis een significant groter V-P verschil hebben en daarnaast ook nog eens significant hoger scoren op de performale tests dan op de verbale, vinden anderen (Rispens in Rispens & van Yperen, 1994; Spafford, 1989) geen statistisch significant verschil tussen kinderen met en kinderen zonder een leerstoornis ten aanzien van hun V-P discrepanties. Volgens Sattler (1988) is dat laatste helemaal niet verrassend, want “learning-disabled children represent a group that is too heterogeneous for one type of WISC-R profile to be typical of all or even most of its members” (Sattler, 1988, p. 610). Shiff, Kaufman en Kaufman (1981) zijn de enigen die resultaten presenteren, die niet tegengesproken worden door de andere onderzoeken. Zij vonden (zoals beschreven staat in paragraaf 1.4.2.) dat kinderen met een hoge intelligentie en een leerstoornis overwegend significante V>P verschillen hebben, terwijl uit onderzoek (Bloom, e.a., 1986; Moore & Wielan, 1981; Smith e.a., 1993) blijkt, dat kinderen met een leerstoornis juist significant hoger scoren op de performale tests indien er sprake is van een significant verschil. Daarnaast is het door Shiff e.a. gevonden gemiddelde V-P verschil van 18,6 punten verbazingwekkend groot in vergelijking met dat van de Amerikaanse
20
normgroep (Kaufman, 1976) en in vergelijking met dat van kinderen met een leerstoornis en een normale intelligentie (Bloom, e.a., 1996; Moore & Wielan, 1981). Hieruit kan dus geconcludeerd worden dat V-P verschillen naar alle waarschijnlijkheid (mede) veroorzaakt worden door de hoge intelligentie van kinderen. Dit komt ook naar voren in een overzicht waarin Kaufman (1981) de resultaten van diverse onderzoeken naar het verband tussen V-P verschillen en leer- en gedragsproblemen met elkaar vergelijkt en in de resultaten van een onderzoek door Waldron en Saphire (1990). Uit deze laatste studie, die werd uitgevoerd bij hoogbegaafde kinderen met en zonder leerstoornis, blijkt dat V-P verschillen veroorzaakt worden door de hoge intelligentie van een kind en niet door de leerstoornis. Blijkbaar kan men in de praktijk niet vertrouwen op een significant V-P verschil voor het vaststellen van een leer- en/of gedragsprobleem; veel kinderen hebben namelijk een even groot V-P verschil zonder deze problemen te hebben (Waldron & Saphire, 1990). De resultaten van onderzoeken, waarin V-P verschillen van kinderen met en zonder een leerstoornis vergeleken worden, spreken elkaar dus tegen. Daarnaast blijken ze ook nog eens niet relevant in het kader van de zoektocht naar een antwoord op de vraag of V-P verschillen wijzen op de aanwezigheid van schoolproblemen en wel vanwege het feit dat V-P verschillen door diverse andere factoren veroorzaakt kunnen worden (Kaufman, 1976, 1979; Waldron & Saphire, 1990). Een antwoord op de vraag of een groep kinderen met een specifieke leerstoornis een groter V-P verschil heeft dan een groep kinderen zonder leerstoornis, schept dus nog geen duidelijkheid inzake de vraag of een V-P verschil bij een individueel kind wijst op de aanwezigheid van schoolproblemen. Ter vergelijking: stel dat uit onderzoek blijkt, dat mensen die door de regen lopen nat worden. Dan betekent dit nog niet, dat iedereen die nat is geworden, door de regen heeft gelopen. Dat zou een ongeldige redenatie zijn; een bevestiging van de consequens (Schellens & Verhoeven, 1994). Iemand die nat is geworden, kan namelijk ook in de sloot zijn gevallen of bijvoorbeeld een emmer water over zich heen hebben gekregen. Wel relevant zijn onderzoeken waarin niet de leerstoornis maar het V-P verschil als uitgangspunt wordt genomen, zoals bijvoorbeeld het geval is in de studies van Moffitt en Silva (1987) en Wilkinson (1993). Moffitt en Silva onderzochten of een statistisch abnormaal V-P verschil wijst op een klinisch abnormale status voor een kind in de gewone populatie. Dat gebeurde middels het bestuderen van de relatie tussen significante abnormale V-P verschillen van 22 punten of meer en schoolresultaten en gedragsproblemen. Een verband blijkt er niet te zijn. Wel blijken P>V verschillen vaker voor te komen dan V>P verschillen en blijkt dat kinderen met een P>V verschil significant lagere schoolresultaten behalen dan kinderen met een V>P verschil. (Moffitt & Silva, 1987). Wilkinson (1993) heeft met haar onderzoek hetzelfde doel als Moffitt en Silva (1987). Zij richt zich in haar onderzoek echter niet op de gewone populatie, maar op kinderen met een intelligentie op minimaal begaafd niveau. In haar onderzoek bestudeert Wilkinson de relatie tussen significante V-P verschillen van 15 punten of meer in een bepaalde richting en de schoolprestaties van deze kinderen en leerkrachtobservaties ten aanzien van de schoolproblemen van deze kinderen. Uit haar onderzoek blijkt ten aanzien van de schoolprestaties, dat een significant dominant VIQ (waarbij het VIQ 15 punten hoger is dan het PIQ) positief en een significant dominant PIQ (waarbij het PIQ 15 punten hoger is dan het VIQ) negatief samenhangt met technische leesvaardigheden. De scores ten aanzien van het begrijpend lezen en de
21
taalexpressie zijn ook significant lager voor de performaal dominante groep in vergelijking met de scores van de verbaal dominante groep en de groep kinderen die geen significant V-P verschil hebben. Ten aanzien van de rekenresultaten is er statistisch gezien geen verschil tussen de drie groepen. Uit de informatie, die de leerkracht gaf ten aanzien van schoolproblemen met betrekking tot de schoolresultaten, werkgewoonten, sterke en zwakke punten, relaties met klasgenoten en andere gedragsproblemen van deze kinderen blijkt dat er volgens hen geen verband is tussen deze problemen en een dominant VIQ of PIQ. Wel rapporteren leerkrachten meer schoolproblemen bij jongens dan bij meisjes, maar dat komt niet tot uiting in de door Wilkinson waargenomen schoolresultaten. Uit deze paragraaf blijkt, dat het voor het beantwoorden van de vraag of een waargenomen V-P verschil indicatief is voor de aanwezigheid van schoolproblemen, geen enkele zin heeft om groepen kinderen met en zonder schoolproblemen met elkaar te vergelijken en te onderzoeken of er significante verschillen zijn ten aanzien van hun V-P discrepanties. Wel relevant zijn onderzoeken waarin niet de leerstoornis, maar het V-P verschil als uitgangspunt wordt genomen. Uit dergelijke onderzoeken blijkt dat abnormale V-P verschillen niet wijzen op schoolproblemen binnen de normale populatie (Moffitt & Silva, 1987) en dat bij hoogintelligente kinderen significante verschillen volgens leerkrachten niet wijzen op schoolproblemen, maar dat ze wanneer ze een bepaalde richting hebben wel een verband vertonen met de taal- en leesresultaten van deze kinderen (Wilkinson, 1993).
1.5. Conclusies Betreffende de drie criteria van Hsu (1996) omtrent de betekenis van V-P verschillen zijn een aantal conclusies te trekken. Ten aanzien van het eerste criterium blijkt, dat in Nederland een V-P verschil van 11 punten significant is op het 5% niveau en dat een verschil van 15 punten significant is op het 1% niveau, maar dat deze significante verschillen niet altijd een echt verschil weergeven. We moeten er rekening mee houden dat ook andere factoren – naast de verbale en performale intelligenties - hun invloed uitoefenen op het VIQ en PIQ (Kaufman, 1976, 1979) en daarmee op het V-P verschil, omdat Wechsler geen enkele theoretische onderbouwing of enig structureel model voor de indeling van zijn test heeft (Haartmans, 2002a; Kaufman & Lichtenberger, 2000; Rispens & Van Yperen, 1994). Ten aanzien van het tweede criterium is gebleken, dat significante V-P verschillen niet altijd abnormale verschillen zijn; niet in de normgroepen (Kaufman, 1975, 1976; De Bruyn e.a., 1986a, 1986b) en niet bij hoogintelligente kinderen (Patchett & Stansfield, 1992; Silver & Clampit, 1990; Wilkinson, 1993). Daarnaast is er waarschijnlijk een positief verband tussen de hoogte van een kinds TIQ en de grootte van een kinds V-P verschil (Kaufman, 1976; Silver & Clampit, 1990). Dat dit verband niet altijd naar voren komt, komt waarschijnlijk doordat kinderen om een hoog TIQ te krijgen op vrijwel alle subtests hoog moeten scoren, waardoor het V-P verschil niet groot kan zijn bij kinderen met een erg hoog TIQ (Patchett & Stansfield, 1992). Verder komen binnen de normale populatie V>P verschillen en P>V verschillen even vaak voor
22
(Kaufman, 1975) maar blijkt bij kinderen met een intelligentie op minimaal begaafd niveau het VIQ dominant te zijn (Wilkinson, 1993). Ten aanzien van het derde criterium is gebleken, dat het voor het beantwoorden van de vraag of een waargenomen V-P verschil indicatief is voor de aanwezigheid van schoolproblemen, geen zin heeft om groepen kinderen met en zonder schoolproblemen met elkaar te vergelijken en te onderzoeken of er significante verschillen zijn ten aanzien van hun V-P discrepanties. Wel relevant zijn onderzoeken waarin niet de leerstoornis, maar het V-P verschil als uitgangspunt wordt genomen. Uit onderzoeken met deze laatste opzet komt naar voren, dat abnormale verschillen niet wijzen op schoolproblemen binnen de normale populatie (Moffitt & Silva, 1987). En bij hoogintelligente kinderen wijzen significante verschillen volgens leerkrachten niet op schoolproblemen, maar vertonen ze wanneer ze een bepaalde richting hebben wel een verband met taal- en leesresultaten (Wilkinson, 1993).
1.6. Onderzoeksvragen en hypothesen “Wijst een V-P verschil op de aanwezigheid van schoolproblemen?”, is de vraag die centraal staat in deze scriptie. Een vraag die, zo blijkt uit dit eerste hoofdstuk, waarschijnlijk alleen de moeite van het beantwoorden waard is, mits het V-P verschil aan twee criteria voldoet: echtheid en abnormaliteit. Derhalve luiden de onderzoeksvragen als volgt: 1. Zijn V-P verschillen echte verschillen? Uitgaand van Kaufmans veronderstelling, dat een verschil tussen de verbale en performale testscores geen verschil tussen de verbale en performale intelligenties hoeft weer te geven, wordt verondersteld dat er meerdere factoren een rol spelen bij de totstandkoming van V-P verschillen. De vraag of een V-P verschil een werkelijk verschil weergeeft is dus een vraag naar evidentie voor de indeling van de WISC-RN in een verbaal en performaal testgedeelte. De bijbehorende hypothese luidt: Hypothese 1: De WISC-RN bevat meer dan twee factoren, waardoor er geen evidentie is voor de indeling van de WISC-RN in alleen een verbaal en performaal deel. 2. Zijn significante V-P verschillen abnormale verschillen? Uitgaand van het feit, dat het voorkomen van significante V-P verschillen zowel in de normgroepen (Kaufman, 1975, 1976; De Bruyn e.a., 1986a, 1986b) als bij hoogintelligente kinderen (Patchett & Stansfield, 1992; Silver & Clampit, 1990; Wilkinson, 1993) geen abnormale gebeurtenis is en het feit dat er waarschijnlijk een positief verband is tussen de hoogte van een kinds TIQ en de grootte van een kinds VP verschil (Kaufman, 1976; Silver & Clampit, 1990), wordt verondersteld dat significante V-P verschillen vaker voorkomen bij kinderen uit de CBOonderzoeksgroep met een intelligentie op minimaal begaafd niveau dan binnen de 23
Nederlandse normgroep. Tevens wordt verondersteld, dat er binnen de CBOonderzoeksgroep een verband gevonden wordt tussen de hoogte van het TIQ en de grootte van het V-P verschil. Maar omdat dit verband niet naar voren komt bij kinderen met een erg hoog TIQ (Patchett & Stansfield, 1992), wordt daarnaast verwacht dat dit verband niet wordt aangetroffen binnen de groep kinderen uit de CBO-onderzoeksgroep met een intelligentie op minimaal begaafd niveau. De bijbehorende hypothesen luiden: Hypothese 2a: Absolute V-P verschillen van minimaal 15 punten (p<.01) komen significant vaker voor binnen de kinderen uit de CBO-onderzoeksgroep met een TIQ vanaf 121 dan binnen de Nederlandse normgroep. Hypothese 2b: Binnen de gehele CBO-onderzoeksgroep wordt een correlatie gevonden tussen de hoogte van het TIQ en de grootte van het absolute V-P verschil. Hypothese 2c: Binnen de CBO-onderzoeksgroep wordt bij kinderen met een TIQ vanaf 121 geen correlatie gevonden tussen de hoogte van het TIQ en de grootte van het absolute V-P verschil. 3. Wijst een V-P verschil op de aanwezigheid van schoolproblemen? Uitgaand van de onderzoeksresultaten wordt verondersteld, dat kinderen met een abnormaal V-P verschil niet meer schoolproblemen hebben dan kinderen zonder een V-P verschil (Moffitt & Silva, 1987). Daarbij worden discrepanties van minimaal 22 punten gezien als abnormale verschillen (Kaufman, in Moffitt & Silva, 1987). Discrepanties van minder dan 9 punten, “which are not significant by any reasonable standard and thus reflect chance fluctuations” (Kaufman, 1979, p. 53) geven ‘geen verschil’ weer. De hoeveelheid schoolproblemen wordt weergegeven met behulp van een Totale Probleem Score (zie paragraaf 2.3.). Tevens wordt op basis van de onderzoeksresultaten verondersteld, dat er geen verband is tussen V-P verschillen (rekening houdend met de richting van het verschil) en schoolproblemen, maar dat deze V-P verschillen wel een verband vertonen met schoolresultaten (Wilkinson, 1993). De bijbehorende hypothesen luiden als volgt: Hypothese 3a: Binnen de CBO-onderzoeksgroep hebben kinderen met een absoluut V-P verschil van meer dan 21 punten geen hogere Totale Probleem Score dan kinderen met een verschil van minder dan 9 punten. Hypothese 3b: Er bestaat geen correlatie tussen V-P verschillen in een bepaalde richting en schoolproblemen aangegeven door de leerkrachten en ouders van het kind, met uitzondering van de geleverde schoolprestaties.
24
2
Opzet en uitvoering van het onderzoek
Inleiding In dit hoofdstuk wordt een beschrijving gegeven van de opzet en uitvoering van het onderzoek. In paragraaf 2.1. wordt daartoe een beschrijving gegeven van de onderzoeksgroep. Vervolgens wordt in paragraaf 2.2. ingegaan op de gebruikte meetinstrumenten. In paragraaf 2.3. wordt beschreven welke analysetechnieken gebruikt zijn.
2.1. Onderzoeksgroep De onderzoeksgroep bestond uit kinderen uit heel Nederland, die vanwege hun potentiële hoogbegaafdheid waren aangemeld bij en onderzocht door het Centrum voor Begaafdheidsonderzoek (CBO) te Nijmegen. Alleen die kinderen, waarbij destijds een volledige WISC-RN was afgenomen en van wie zowel de ouder(s) als de leerkracht de CBO Gedragskenmerken Vragenlijst volledig ingevuld hadden geretourneerd, namen deel aan het onderzoek. De totale onderzoeksgroep bestond derhalve uit 776 kinderen in de leeftijd van 6 tot 16 jaar, waarvan 539 jongens (69%) en 237 meisjes (31%); allen onderzocht door het CBO in de periode van 1992 tot en met 2002.
2.2. Meetinstrumenten In dit onderzoek werd gebruik gemaakt van bestaande gegevens uit de databank van het CBO, die met behulp van de WISC-RN en de door het CBO ontwikkelde Gedragskenmerken Vragenlijst verzameld waren. De keuze om gebruik te maken van bestaande gegevens werd ten aanzien van de WISC-RN gegevens gemaakt vanwege het feit dat er bij het CBO een zeer grote groep potentieel begaafde kinderen met de WISC-RN getest is. Vanwege de omvang van het databestand zijn tal van statistische berekeningen mogelijk, wordt de onbetrouwbaarheidsmarge kleiner en kunnen er meer algemene uitspraken gedaan worden. Het zou dus zonde zijn deze data niet te gebruiken. Ten aanzien van de overige data die noodzakelijk waren voor het onderzoek naar het verband tussen V-P verschillen en schoolproblemen werd besloten om gebruik te maken van de data die met behulp van de CBO Gedragskenmerken Vragenlijst reeds verzameld waren. Het had namelijk geen zin enige tijd (soms zelfs jaren) na de afname van de WISC-RN en de daarbij behorende advies- en eventuele vervolggesprekken een nieuwe vragenlijst af te nemen, omdat de school- en thuissituatie van het kind naar alle waarschijnlijkheid veranderd zijn als gevolg van het diagnostisch onderzoek. Zo kan een kind bijvoorbeeld versneld zijn als gevolg van het diagnostisch onderzoek of kan er bijvoorbeeld sprake zijn geweest van extra begeleiding. Dergelijke zaken kunnen onder andere invloed hebben op de eventuele schoolproblemen die een kind ondervindt.
25
Derhalve is in dit onderzoek gekozen voor gebruikmaking van de gegevens die tijdens het diagnostisch onderzoek verzameld zijn.
2.2.1. WISC-RN In paragraaf 1.1. en 1.2. werden het ontstaan, de inhoud en de analyse van de WISC-RN reeds besproken. Voor dit onderzoek werd gebruik gemaakt van het TIQ, het VIQ en het PIQ, die met behulp van deze intelligentietest bij de kinderen uit de onderzoeksgroep waren vastgesteld. Daarnaast werden, om uitspraken te kunnen doen aangaande de drie in paragraaf 1.6. gestelde onderzoeksvragen, ook de V-P verschillen berekend. Om het V-P verschil te berekenen, werd het PIQ van het VIQ afgetrokken. Een positief V-P verschil duidt derhalve op een dominant VIQ en een negatief V-P verschil op een dominant PIQ.
2.2.2. CBO Gedragskenmerken Vragenlijst Zoals in paragraaf 1.4.3. reeds werd aangegeven omvatten schoolproblemen problemen die kinderen ondervinden bij of als gevolg van het verwerven van vaardigheden die ze op school nodig hebben. Het gaat dan bijvoorbeeld om primaire en secundaire leerproblemen, gedragsproblemen, emotionele problemen en lichamelijke problemen. Vrijwel geen enkele bestaande vragenlijst informeert naar al deze problemen. In de CBO Gedragskenmerken Vragenlijst komen ze wel aan de orde. De CBO Gedragskenmerken Vragenlijst is ontwikkeld naar aanleiding van een artikel van Betts en Neihart (1988), waarin een model gepresenteerd wordt dat zes profielen omvat en dat ouders en leerkrachten inzicht kan verschaffen in het gedrag, het gevoel en de behoeften van begaafde kinderen. Het betreft geen diagnostisch model, maar een theoretisch concept, dat gericht is op de ontwikkeling van het totale begaafde kind (inclusief de interactie tussen de emotionele, sociale, cognitieve en lichamelijke factoren) en dat volgens de auteurs kan dienen als theoretische basis voor empirisch onderzoek. De vragenlijst (zie bijlage) kent één versie, die zowel door de ouder(s) als de leerkracht van het kind werd ingevuld. Nadat een kind aangemeld was bij het CBO en voordat het intakegesprek plaatsvond, werd de vragenlijst naar de ouders van het kind gestuurd. De ouders konden de CBO Gedragskenmerken Vragenlijst thuis invullen en waren er verantwoordelijk voor dat de leerkracht een exemplaar ontving en dat de vragenlijsten werden geretourneerd. De vragenlijst bevat 41 items en de respondenten gaven op een driepuntsschaal, middels het omcirkelen van een bepaalde mate (vaak, soms of nooit), aan in hoeverre uitspraken op het betreffende kind van toepassing waren. Op deze wijze werd informatie verkregen over: a. de schoolproblemen van het kind volgens de ouder(s) b. de schoolproblemen van het kind volgens de leerkracht Uit onderzoek (van Poppel, 2002) blijkt, dat de 41 items niet ingedeeld kunnen worden in een kleiner aantal clusters. Derhalve werd met behulp van de vragenlijst van het CBO op twee andere manieren informatie vergaard omtrent de aanwezigheid van
26
schoolproblemen volgens ouders en leerkrachten. Ten eerste werd een globale maat berekend ten aanzien van de hoeveelheid schoolproblemen. Ten tweede dienden ook de individuele items als bron van informatie. De gegevens die op deze beide wijzen werden vergaard, werden onderworpen aan een statistisch onderzoek, om uitspraken te kunnen doen met betrekking tot de derde onderzoeksvraag.
2.3. Analysetechnieken Om de eerste onderzoeksvraag – de vraag naar de evidentie voor de verdeling van de WISC-RN over een verbaal en performaal gedeelte - te kunnen beantwoorden, werd vanwege het grote aantal kinderen in de onderzoeksgroep en de capaciteitsproblemen die dit grote aantal oplevert, eerst een aselecte steekproef van exact 300 kinderen getrokken. Vervolgens werd een factoranalyse uitgevoerd. Een factoranalyse maakt het namelijk, in tegenstelling tot een componentanalyse, door middel van het analyseren van de gemeenschappelijkheid van de variabelen mogelijk, de psychologische betekenis van de onderliggende structuur van de variabelen bloot te leggen (De Bruyn e.a., 1986b). En omdat er reeds informatie beschikbaar was over het aantal onderliggende dimensies (De Bruyn e.a., 1986b), werd gekozen voor de procedure van de grootste aannemelijkheid (maximum likelihood). Vervolgens werd middels varimax-rotaties met respectievelijk een 1-, 2-, 3- en 4-factoroplossing de meest optimale factorstructuur bepaald, waarbij een p-waarde van .05 werd gebruikt voor het bepalen van de statistische significantie. Deze statistische analyses werden uitgevoerd in SPSS 10 (Statistical Package for Social Sciences, versie 10) en werden enkele keren herhaald en vervolgens vergeleken. De resultaten van deze analyses kwamen overeen. Naar aanleiding van de tweede onderzoeksvraag werden drie hypothesen gesteld. Aangaande de eerste hypothese, waarin gesteld werd dat V-P verschillen van minimaal 15 punten vaker voorkomen binnen de kinderen uit de CBO-groep met een TIQ vanaf 121 dan binnen de Nederlandse normgroep, werd gebruik gemaakt van de gegevens uit tabel 6 (paragraaf 1.4.2.). Met behulp van deze gegevens en de wetenschap dat de Nederlandse normgroep uit 1959 kinderen bestond (De Bruyn e.a., 1986b) werd het aantal kinderen uit de normgroep berekend dat minimaal een bepaald aantal punten verschil had behaald. Vervolgens werden uit de CBO-groep die kinderen geselecteerd met een TIQ vanaf 121 en werd ook binnen deze groep (N=398) bekeken hoeveel kinderen minimaal deze bepaalde aantallen punten verschil hadden behaald. Daarna werd per groep berekend hoeveel kinderen in een bepaald cluster V-P verschillen vielen. Om na te gaan of absolute V-P verschillen van minimaal 15 punten significant vaker voorkomen binnen de kinderen uit de CBO-onderzoeksgroep met een TIQ vanaf 121 dan binnen de Nederlandse normgroep, werd uiteindelijk een Chikwadraattoets uitgevoerd. Daarbij werden de berekeningen handmatig en op twee decimalen nauwkeurig uitgevoerd en werd een p-waarde van .05 gebruikt voor het bepalen van de statistische significantie. De tweede hypothese, waarin gesteld werd dat er een verband is tussen de hoogte van het TIQ en de grootte van het absolute V-P verschil binnen de CBO-onderzoeksgroep (N=776), werd evenals de derde hypothese, waarin gesteld werd dat er geen verband meer is tussen de hoogte van het TIQ en de grootte van het absolute V-P verschil binnen de geselecteerde groep kinderen met een TIQ vanaf 121 (N=398), onderzocht met behulp
27
van een Pearson Correlatie Toets. De analyses werden verricht in SPSS en omdat de richting van het eventuele verband bekend was, werd er éénzijdig getoetst. In beide gevallen werd een p-waarde van .05 gebruikt voor het bepalen van de statistische significantie. Ook de derde onderzoeksvraag omvatte meerdere hypothesen. Eerst werd onderzocht of kinderen met een absoluut V-P verschil van meer dan 21 punten een hogere Totale Probleem Score (T.P.S.) hadden dan kinderen met een absoluut V-P verschil van minder dan 9 punten. Daartoe diende eerst per item van de CBO Gedragskenmerken Vragenlijst de Probleem Score (P.S.) berekend te worden. Hoewel de respondenten op een driepuntsschaal aangaven in hoeverre de items van toepassing waren, werden hun antwoorden gescoord op een vijfpuntsschaal. Dit was nodig aangezien ouders en leerkrachten in veel gevallen meerdere antwoordmogelijkheden omcirkeld hadden. Op de vijfpuntsschaal representeerde het cijfer 1 ‘vaak’, 2 ‘vaak tot soms’, 3 ‘soms’, 4 ‘soms tot nooit’ en 5 ‘nooit’. Voor het berekenen van de P.S. was het noodzakelijk te bekijken of ‘vaak’ een positief of negatief gegeven was. Wanneer een kind bijvoorbeeld ‘vaak’ lichamelijke klachten heeft is dat negatief, terwijl wanneer een kind ‘vaak’ graag naar school gaat, dit duidelijk positief is. Om de P.S. te berekenen werden derhalve de cijfers 1 tot en met 5 gespiegeld bij de items waarbij ‘vaak’ duidde op een negatieve gebeurtenis. Een hoge P.S. wijst dus op meer problemen dan een lage P.S. Niet alle items kwamen overigens voor een P.S. in aanmerking. Alleen voor de items die op een probleem konden duiden werd de P.S. berekend. Dat gold voor de items 1, 2, 3, 4, 5, 6, 7, 12, 13, 15, 17, 18, 24, 30, 34, 36, 37, 38 en 41. De andere items duiden niet of niet overduidelijk op een probleem, omdat ze bijvoorbeeld op verschillende wijzen geïnterpreteerd kunnen worden. Zo is het bijvoorbeeld niet duidelijk of het positief of negatief is wanneer een kind van activiteit en discussie houdt (item 9). Dergelijke items kregen als P.S. ‘0’. Dit gold voor de items 8, 9, 10, 11, 14, 16, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 31, 32, 33, 35, 39 en 40. Voor de gehele vragenlijst was de P.S. per item dus minimaal 0 en maximaal 5. Met behulp van deze P.S.’s werd vervolgens de T.P.S. berekend. Daartoe werden per vragenlijst de P.S.’s van alle items bij elkaar opgeteld, waardoor zowel de T.P.S. volgens de ouder(s) als de T.P.S. volgens de leerkracht kon worden berekend, waarbij voor beide T.P.S.’s 19 de minimale en 95 de maximale score kon zijn. Vervolgens werden die kinderen uit de onderzoeksgroep geselecteerd, die een absoluut V-P verschil van meer dan 21 punten (N=198) of een absoluut V-P verschil van minder dan 9 punten hadden (N=270). Middels een Independent Samples T-test werd onderzocht of de groep kinderen met een abnormaal absoluut V-P verschil gemiddeld een hogere T.P.S. had dan de groep kinderen zonder V-P verschil. Dit gebeurde zowel voor de T.P.S.’s volgens de ouders als voor de T.P.S.’s volgens de leerkrachten. In beide gevallen werd eerst middels de Levene’s Test for Equality of Variances nagegaan of de varianties in beide populaties aan elkaar gelijk waren, waarbij een p-waarde van .05 werd gebruikt voor het bepalen van de statistische significantie. Ook voor de t-toetsen werd een p-waarde van .05 gebruikt voor het bepalen van de statistische significantie en omdat verwacht werd, dat kinderen met een abnormaal V-P verschil gemiddeld een hogere T.P.S. hebben dan kinderen zonder V-P verschil, werd er zowel voor het vergelijken van de gemiddelde T.P.S.’s volgens de ouders als voor het vergelijken van de gemiddelde T.P.S.’s volgens de leerkrachten éénzijdig getoetst. Tot slot werd de laatste hypothese, betreffende een eventuele samenhang tussen V-P verschillen in een bepaalde richting en
28
schoolproblemen, getoetst. Daartoe werd eerst met behulp van een Pearson Correlatie toets het verband berekend tussen het V-P verschil (waarbij rekening werd gehouden met de richting van het verschil) en elk van de 41 items van de vragenlijst ingevuld door de ouders. Datzelfde werd gedaan voor elk van de 41 items van de vragenlijst ingevuld door de leerkrachten. Vervolgens werd de betrouwbaarheid van elk van de items van de CBO Gedragskenmerken Vragenlijst berekend, door de correlatie tussen de itemscore volgens de ouders en de itemscore volgens de leerkrachten te berekenen. Daarbij werd een pwaarde van .05 gebruikt voor het bepalen van het significantieniveau. Daarna werd zowel voor de vragenlijst ingevuld door de ouders als door de leerkrachten een correctie voor attenuatie uitgevoerd om na te gaan hoe groot de correlaties tussen het V-P verschil en de itemscores zouden zijn als het mogelijk was beide variabelen perfect betrouwbaar te meten. Uiteindelijk werd met behulp van een Pearson Correlatie toets berekend hoe groot het verband was tussen de gecorrigeerde correlaties (tussen het V-P verschil en de verschillende items) volgens de ouders en de gecorrigeerde correlaties volgens de leerkrachten. Ook bij deze laatste statistische analyse werd een p-waarde van .05 gebruikt voor het vaststellen van het significantieniveau. De meeste van de voor deze laatste hypothese noodzakelijke bewerkingen werden verricht in SPSS.
29
3
Resultaten
Inleiding. In dit hoofdstuk worden de resultaten gepresenteerd van de statistische analyses, die naar aanleiding van de onderzoeksvragen zijn uitgevoerd. Voor de duidelijkheid zijn deze resultaten weergegeven per onderzoeksvraag.
3.1. Zijn V-P verschillen echte verschillen? Om er achter te komen of V-P verschillen echte verschillen weergeven, werd middels een factoranalyse onderzocht, of er evidentie is voor de indeling van de WISC-RN in een verbaal en performaal testgedeelte. Bij de varimax-rotaties met een 1-, 2-, en 3factoroplossing blijkt de Chikwadraat op het 5% niveau nog significant (p=0.000) te zijn. De WISC-RN bevat dus meer dan 3 factoren. Uit de varimax-rotatie met de 4factoroplossing blijkt, dat dit het aantal factoren is dat de WISC-RN bevat (p=0.099). Tabel 9 toont de resultaten van deze laatste factoranalyse. Tabel 9 Geroteerde factormatrix met de factorladingen op elk van de 4 gevonden factoren voor de 12 subtests van de WISC-RN (bij N=300)
Informatie Overeenkomsten Rekenopgaven Woordenschat Begrijpen Cijferreeksen Onvolledige Tekeningen Plaatjes Ordenen Blokpatronen Figuur Leggen Substitutie Doolhoven
1 .612 .653 .332 .710 .761 .151 .283 .355 .133 .100 .063 .070
2 .157 .194 .155 .116 .081 .071 .402 .270 .713 .730 .246 .460
3 .369 .240 .778 .205 .086 .448 .020 .201 .216 .060 .318 .401
4 -.419 -.063 -.016 -.080 .251 .013 .112 .026 -.048 .038 .325 .059
Noot: De onderstreepte cijfers geven weer welke subtests in een factor vertegenwoordigd zijn
Uit tabel 9 blijkt dat er evidentie is voor een verbale factor (Informatie, Overeenkomsten, Woordenschat en Begrijpen), een performale factor (Onvolledige Tekeningen, Blokpatronen, Figuur Leggen en Doolhoven), een concentratiefactor (Rekenopgaven en Cijferreeksen) en een vierde factor, waarin onder andere de subtesten Informatie en Substitutie vertegenwoordigd zijn. Aangezien deze subtests echter ongeveer even sterk of
30
zelfs sterker vertegenwoordigd zijn in één van de andere factoren, is het niet mogelijk de vierde factor te benoemen. Tot slot kan opgemerkt worden dat ook hier de subtest Plaatjes Ordenen onder geen enkele factor blijkt te vallen.
3.2. Zijn significante V-P verschillen abnormale verschillen? Binnen de CBO-groep (N=776) variëren de gevonden V-P verschillen van –46 (bij een dominant PIQ) tot +66 (bij een dominant VIQ). De meeste kinderen (69%) scoren beter op de verbale dan op de performale subtests en gemiddeld wordt een significant absoluut verschil van 15 punten (p=0.010) behaald. Binnen de (uit de CBO-groep) geselecteerde groep kinderen met een TIQ vanaf 121 (N=398) komen V-P verschillen voor van -44 tot +66. Ook hier wordt door het grootste deel van de kinderen (70%) verbaal beter gescoord dan performaal. Het gemiddelde absolute V-P verschil van de kinderen met een TIQ vanaf 121 telt 16 punten. Om te onderzoeken of absolute V-P verschillen van minimaal 15 punten vaker voorkomen binnen de kinderen uit de CBO-groep met een TIQ vanaf 121 (N=398) dan binnen de Nederlandse normgroep (N=1595), werd eerst berekend hoeveel kinderen uit de Nederlandse normgroep en hoeveel kinderen uit de CBO-groep (met een TIQ>120) minimaal een bepaald aantal punten verschil hebben gescoord. Deze aantallen zijn weergegeven in tabel 10, waarin vanwege het grote verschil tussen het aantal kinderen in de normgroep en de CBO-groep voor de duidelijkheid ook de relatieve frequentie is weergegeven. Tabel 10 Frequenties van voorkomen van absolute V-P verschillen van een bepaald aantal punten binnen de Nederlandse normgroep (N=1595) en binnen de groep kinderen uit de CBO-groep met een TIQ>120 (N=398) Aantal punten verschil 34 < 26 – 33 22 – 25 19 – 21 17 – 18 15 – 16
Normgroep 1% 20 5% 79 6% 98 6% 98 6% 98 6% 98
CBO-groep (TIQ>120) 9% 35 12% 48 7% 27 6% 25 6% 23 8% 33
Bij vergelijking van de beide groepen, met behulp van een Chikwadraattoets, blijkt dat absolute V-P verschillen van minimaal 15 punten op het 5% niveau significant vaker voorkomen (p=0.000) binnen de kinderen uit de CBO-onderzoeksgroep met een TIQ vanaf 121 dan binnen de Nederlandse normgroep.
31
De volgende hypothese, waarin gesteld werd dat er een verband is tussen de hoogte van het TIQ en de grootte van het absolute V-P verschil binnen de CBO-groep (N=776), werd onderzocht met behulp van een Pearson Correlatie Toets. In tabel 11 zijn de resultaten weergegeven. In deze tabel is te zien dat er op het 5% significantieniveau een verband (p=0.028) bestaat tussen de hoogte van het TIQ en de grootte van het absolute V-P verschil. Tabel 11 Correlatie tussen de hoogte van het TIQ en de grootte van het absolute V-P verschil binnen de CBO-groep (N=776) TIQ TIQ Absoluut V-P verschil
Pearson Correlatie Significantie (éénzijdig) Pearson Correlatie Significantie (éénzijdig)
1.000 .069 .028
Absoluut V-P verschil .069 .028 1.000
De laatste bij de tweede onderzoeksvraag behorende hypothese, waarin gesteld werd dat er geen verband is tussen de hoogte van het TIQ en de grootte van het absolute V-P verschil binnen de groep kinderen uit de CBO-groep met een TIQ vanaf 121 (N=398), werd ook onderzocht met behulp van een Pearson Correlatie Toets. In tabel 12 zijn de resultaten weergegeven. Uit de resultaten blijkt dat er binnen deze groep op het 5% significantieniveau zoals verwacht geen verband (p=0.118) is tussen de hoogte van het TIQ en de grootte van het absolute V-P verschil. Tabel 12 Correlatie tussen de hoogte van het TIQ en de grootte van het absolute V-P verschil binnen de groep kinderen uit de CBO-groep met een TIQ>120 (N=398) TIQ TIQ Absoluut V-P verschil
Pearson Correlatie Significantie (éénzijdig) Pearson Correlatie Significantie (éénzijdig)
1.000 .060 .118
Absoluut V-P verschil .060 .118 1.000
32
3.3. Wijst een V-P verschil op de aanwezigheid van schoolproblemen? Om er achter te komen of kinderen met een abnormaal absoluut V-P verschil een hogere T.P.S. hebben dan kinderen zonder V-P verschil, werd met behulp van t-toetsen onderzocht of de gemiddelde T.P.S.’s van beide groepen (zie tabel 13) aan elkaar gelijk zijn. De toetsen werden uitgevoerd binnen een geselecteerde groep kinderen (N=468), waarvan 198 kinderen abnormale absolute V-P verschillen (verschillen van meer dan 21 punten) en 270 kinderen geen V-P verschil (een verschil van minder dan 9 punten) hadden. Tabel 13 Gemiddelde T.P.S.’s van kinderen zonder V-P verschil en kinderen met een abnormaal absoluut V-P verschil, met tussen haakjes de bijbehorende standaarddeviaties (N=468)
Gemiddelde T.P.S. volgens de ouders Gemiddelde T.P.S. volgens de leerkrachten
abs. V-P < 9 48,11 (10,71) 43,10 (12,76)
abs. V-P > 21 49,10 (11,63) 43,62 (12,98)
Middels de Levene’s Test for Equality of Variances werd nagegaan of de varianties in beide populaties aan elkaar gelijk zijn en dat blijkt zowel bij de gemiddelde T.P.S. volgens de ouders als volgens de leerkrachten zo te zijn (respectievelijk p=0.234 en p=0.648). En uit de resultaten van de uitgevoerde t-toetsen blijkt, dat beide groepen op het 5% niveau niet significant van elkaar verschillen voor wat betreft zowel hun gemiddelde T.P.S. volgens de ouders (p=0.174) als hun gemiddelde T.P.S. volgens de leerkrachten (p=0.334). Voor de laatste bij de derde onderzoeksvraag behorende hypothese, waarin gesteld werd dat er geen correlatie bestaat tussen V-P verschillen in een bepaalde richting en schoolproblemen (met uitzondering van de geleverde schoolprestaties) werden een aantal Pearson Correlatie toetsen uitgevoerd. De resultaten van deze toetsen zijn af te lezen in tabel 14, waarbij de eerste twee kolommen de correlaties weergeven tussen het V-P verschil en de 41 items van de CBO Gedragskenmerken Vragenlijst ingevuld door ofwel de ouders ofwel de leerkrachten. De derde kolom geeft de met behulp van de resultaten uit de eerste en tweede kolom berekende ondergrensschatting van de betrouwbaarheid van de items weer. Deze bleek overigens voor alle items voldoende te zijn (p=0.000). In de laatste twee kolommen van tabel 14 zijn de na uitvoering van een correctie voor attenuatie gevonden gecorrigeerde correlaties tussen het V-P verschil en de 41 items af te lezen van de ouders en de leerkrachten.
33
Tabel 14 Overzicht van diverse correlaties tussen het V-P verschil (rekening houdend met de richting van het verschil) en elk van de 41 items van de CBO Gedragskenmerken Vragenlijst Items
Correlatie van het item met V-P volgens de ouders
Correlatie van het item met V-P volgens de leerkrachten
Ondergrensschatting van de betrouwbaarheid van het item
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41
-.012 .023 -.080 .006 .012 .060 -.029 .107 -.138 -.152 .034 -.059 .032 -.029 .034 -.037 -.002 .001 -.027 -.039 .044 .061 .079 .034 -.068 -.006 .106 .051 -.047 .021 .002 .008 -.009 -.081 -.067 -.002 -.026 -.023 .050 .059 .017
.074 .061 -.032 -.017 -.068 -.020 -.063 .159 -.120 -.099 .035 -.029 .040 -.011 .015 -.009 -.034 -.014 -.116 -.049 -.047 .063 .065 -.014 -.084 -.005 .051 -.021 -.054 -.016 .040 -.018 .018 -.097 -.056 -.016 -.054 -.082 .054 .018 .062
.243 .372 .259 .433 .206 .338 .331 .308 .246 .261 .348 .644 .332 .131 .484 .202 .383 .488 .258 .261 .258 .462 .427 .215 .336 .305 .296 .317 .486 .304 .246 .302 .340 .515 .237 .295 .217 .321 .560 .240 .384
Gecorrigeerde correlatie van het item met V-P volgens de ouders -.03 .04 -.17 .01 .03 .11 -.06 .21 -.31 -.33 .06 -.08 .06 -.09 .05 -.09 .00 .00 -.06 -.08 .10 .10 .13 .08 -.13 -.01 .22 .10 -.07 .04 .00 .02 -.02 -.12 -.15 .00 -.06 -.04 .07 .13 .03
Gecorrigeerde correlatie van het item met V-P volgens de leerkrachten .17 .11 -.07 -.03 -.17 -.04 -.12 .32 -.27 -.21 .07 -.04 .08 -.03 .02 -.02 -.06 -.02 -.25 -.11 -.10 .10 .11 -.03 -.16 -.01 .10 -.04 -.09 -.03 .09 -.04 .03 -.15 -.13 -.03 -.13 -.16 .08 .04 .11
34
Hoewel de in tabel 14 af te lezen gecorrigeerde correlaties laag zijn, blijken ze wel consistent te zijn. In grafiek 1 is namelijk te zien dat er een verband is tussen de gecorrigeerde correlaties volgens de ouders en de leerkrachten; ouders en leerkrachten denken wel degelijk in dezelfde richting over de schoolproblemen van de kinderen. Met behulp van een Pearson Correlatie toets werd geconstateerd, dat het gevonden verband 0.707 is (p=0.000), waarbij in dit geval de items met de meest extreme correlaties (item 8, 9 en 10) het vermelden waard zijn. In het geval van item 8 is er sprake van een positieve correlatie tussen ‘nooit’ creatief zijn en een positief V-P verschil (dominant VIQ). In het geval van de items 9 en 10 is er sprake van negatieve correlaties tussen respectievelijk ‘nooit’ houden van activiteit en discussie en een positief V-P verschil en tussen het ‘nooit’ opkomen voor eigen opvattingen en een positief V-P verschil. Een verband met geleverde schoolprestaties (vast te stellen met behulp van de items 12, 18 en 39) werd overigens niet gevonden. Grafiek 1 Verband tussen de gecorrigeerde correlaties (tussen het V-P verschil en de individuele items) volgens de ouders en de gecorrigeerde correlaties volgens de leerkrachten .4
8 .3
gecorrigeerde correlatie volgens leerkrachten
.2
.1
-.0
-.1
-.2
10 9
-.3
-.4 -.4
-.3
-.2
-.1
0.0
.1
.2
.3
.4
gecorrigeerde correlatie volgens ouders
35
4
Discussie
Inleiding Deze studie werd uitgevoerd naar aanleiding van de vraag of de aanwezigheid van V-P verschillen bij kinderen wijst op schoolproblemen. Naar aanleiding van de criteria die Hsu (1996) heeft gesteld, werden in hoofdstuk 1 drie onderzoeksvragen geformuleerd, waarvan de resultaten in het vorige hoofdstuk beschreven werden. In dit hoofdstuk zullen op basis van deze resultaten enkele conclusies getrokken worden ten aanzien van de onderzoeksvragen. Daarnaast zullen tevens enkele beperkingen van de studie worden aangegeven.
4.1. Conclusies Op basis van de resultaten kan ten aanzien van de eerste onderzoeksvraag geconcludeerd worden, dat er geen evidentie is voor een onderscheid tussen slechts twee delen van de WISC-RN; de test blijkt namelijk vier factoren te bevatten. De hypothese, waarin gesteld werd dat de WISC-RN meer dan 2 factoren bevat wordt aangenomen. Daarmee staat automatisch vast dat er ook geen evidentie is voor het verschil tussen het verbale en het performale deel van de WISC-RN: V-P verschillen zijn dus geen echte verschillen. Ten aanzien van de tweede onderzoeksvraag blijkt dat absolute V-P verschillen van minimaal 15 punten significant vaker voorkomen bij kinderen uit de CBOonderzoeksgroep met een TIQ vanaf 121 dan binnen de Nederlandse normgroep. Daarnaast blijkt uit de onderzoeksresultaten, dat er een verband is tussen de hoogte van het TIQ en de grootte van het absolute V-P verschil. Dit verband wordt echter, zoals verwacht, niet teruggevonden binnen de groep kinderen met een intelligentie op minimaal begaafd niveau. Dit kan waarschijnlijk verklaard worden door het feit, dat kinderen om een erg hoog TIQ te kunnen halen zowel op de verbale als de performale subtests hoog moeten scoren. Concluderend kan dus gesteld worden dat het voorkomen van significante V-P verschillen (zeker bij kinderen met een meer dan gemiddelde intelligentie) geen abnormale gebeurtenis is. Daardoor hebben deze V-P verschillen (hoewel statistisch significant) diagnostisch gezien weinig onderscheidingswaarde. Ten aanzien van de derde onderzoeksvraag kan geconcludeerd worden, dat kinderen met een abnormaal absoluut V-P verschil niet meer schoolproblemen hebben dan kinderen zonder V-P verschil. Wel blijken V-P verschillen (waarbij rekening is gehouden met de richting van het verschil) samen te hangen met een drietal items van de CBO Gedragskenmerken Vragenlijst. Deze items wijzen echter niet zoals verwacht op problemen met de geleverde schoolprestaties. En overigens ook niet overduidelijk op een ander schoolprobleem. Uit de positieve correlatie van item 8 met het V-P verschil blijkt wel, dat kinderen met een V-P verschil waarbij het VIQ sterk domineert minder creatief zijn dan kinderen waarbij dat niet het geval is. Uit de negatieve correlatie van item 9 met het V-P verschil blijkt, dat kinderen met een V-P verschil waarbij het VIQ sterk domineert vaker houden van activiteit en discussie dan kinderen die niet een dergelijk
36
verschil hebben. En uit de negatieve correlatie van item 10 met het V-P verschil blijkt dat kinderen met een V-P verschil waarbij het VIQ sterk domineert vaker opkomen voor hun eigen opvattingen dan kinderen, die zo’n verschil niet hebben. Uit het voorgaande blijkt dat V-P verschillen ten eerste geen echte en ten tweede geen abnormale verschillen zijn. Ten derde blijken ze ook niet op de aanwezigheid van schoolproblemen te duiden. Op grond van deze resultaten kan geconcludeerd worden, dat er niet is voldaan aan de drie criteria van Hsu (1996). Het is dus niet zinnig om op grond van enkel een significant of zelfs abnormaal V-P verschil vast te stellen, dat er sprake is van de aanwezigheid van een schoolprobleem of schoolproblemen. Toch mag de betekenis van V-P verschillen volgens Kaufman (1979) niet zomaar uitgevlakt worden. De WISC-RN is een individuele intelligentietest. En wanneer een test individueel afgenomen wordt, dient de interpretatie van de (verschil)scores ook voor elk getest kind afzonderlijk te geschieden (Kaufman, 1979). Want, zoals in hoofdstuk 1 al werd vermeld, “the key is to understand why the youngsters scored the way they did, not to stress how well they performed” (Kaufman, 1979, p.3). En een V-P verschil kan in individuele gevallen wel degelijk aanwijzingen geven over de capaciteiten van een kind en daarmee een indicatie geven voor verder onderzoek en/of mogelijkheden bieden om te handelen. Het is echter, zoals ook al werd gesteld in hoofdstuk 1, niet de bedoeling om op basis van enkel een V-P verschil kinderen te classificeren of te categoriseren; V-P verschillen mogen zonder de aanwezigheid van andere (overeenstemmende) informatie niet gebruikt worden om een differentiaal diagnose te stellen (Sattler, 1988). V-P verschillen kunnen dus niet als primair diagnostisch hulpmiddel worden gebruikt bij het nemen van diagnostische beslissingen. Deze conclusie geldt overigens niet alleen voor de WISC-RN, maar naar alle waarschijnlijkheid tevens voor de WISC-III NL. Deze derde uitgave van de WISC is namelijk ontwikkeld met het doel de onderliggende structuur van de test en de testinhoud te behouden en hoewel gedetailleerde psychometrische informatie nog niet beschreven is, wijzen de onderzoeksresultaten er op dat dit het geval is (Wechsler, 2002).
4.2. Beperkingen Zoals de meeste studies kent ook deze studie enkele beperkingen, die maken dat bij de interpretatie van de resultaten enige voorzichtigheid betracht dient te worden. De meeste van deze beperkingen komen voort uit het gegeven, dat de data die gebruikt werden voor deze studie, niet specifiek voor dit onderzoek verzameld zijn. Want ondanks de voordelen, die het gebruik van bestaande gegevens met zich meebrengt (zoals de vrij eenvoudige, snelle en goedkope wijze waarop er een grote hoeveelheid data kon worden verkregen), kleven er helaas ook een aantal nadelen aan het gebruik van deze gegevens. Een eerste beperking lijkt de onderzoeksgroep te betreffen. Het is namelijk denkbaar, dat bij het CBO aangemelde en onderzochte kinderen, ondanks dat ze afkomstig zijn uit heel Nederland, vanwege hun potentieel begaafde intelligentie geen representatieve afspiegeling zijn van alle 6- tot 16-jarigen in Nederland. Maar omdat uit het onderzoek gebleken is, dat een behoorlijk deel (49%) van het aantal onderzochte kinderen een intelligentie onder begaafd niveau heeft, zijn de resultaten, behalve representatief voor kinderen met een intelligentie op minimaal begaafd niveau, naar alle
37
waarschijnlijkheid ook representatief voor kinderen met een intelligentie op gemiddeld of bovengemiddeld niveau. Een andere (en ditmaal belangrijkere) beperking betreft de gebruikte vragenlijst. Helaas was het, in verband met het effect van het diagnostisch onderzoek op eventuele schoolproblemen (zie paragraaf 2.2.) niet mogelijk, gebruik te maken van een speciaal voor deze problemen nieuw ontwikkelde vragenlijst. De CBO Gedragskenmerken Vragenlijst is namelijk niet ontwikkeld om schoolproblemen vast te stellen. Van oorsprong heeft de CBO Gedragskenmerken Vragenlijst tot doel vast te stellen welk van de zes profielen (Betts en Neihart, 1988) betrekking hebben op het gedrag, het gevoel en de behoeften van een kind, om zijn of haar ouders en leerkrachten daarin meer inzicht te verschaffen. En hoewel deze lijst duidelijk en vrij specifiek informeert naar de aanwezigheid van een aantal gedragsproblemen, emotionele problemen en lichamelijk klachten, waren er onvoldoende mogelijkheden om, betreffende eventuele problemen met de schoolresultaten, aan te geven op welk vlak deze problemen lagen. Uit onderzoek van Wilkinson (1993) blijkt dat het, in het kader van het verband tussen V-P verschillen en schoolresultaten, verschil maakt of het taal- en leesresultaten of rekenresultaten betreft. In de CBO Gedragskenmerken Vragenlijst werd echter naar al deze schoolresultaten tegelijkertijd gevraagd, waardoor er geen informatie verzameld kon worden over de afzonderlijke schoolresultaten. In een volgend onderzoek is het van groot belang, dat dit onderscheid wel gemaakt kan worden. Dit zou bijvoorbeeld kunnen geschieden, door van de kinderen uit de onderzoeksgroep vast te stellen wat hun specifieke schoolresultaten ten tijde van het diagnostisch onderzoek waren. Een andere mogelijkheid is het aanpassen van de bestaande vragenlijst, zodat betreffende een toekomstige onderzoeksgroep meer informatie verzameld kan worden. Dit laatste lijkt een optie, temeer daar de huidige lijst slechts gedeeltelijk beantwoordt aan zijn doel. Want hoewel met behulp van de vragenlijst wel inzicht in het gedrag, het gevoel en de behoeften van het kind kan worden verschaft aan ouders en leerkrachten, blijkt uit eerder onderzoek (van Poppel, 2002), dat de zes profielen waarop de lijst zich richt, niet terug te vinden zijn aan de hand van de huidige 41 items. Wanneer de vragen, die informeren naar de schoolresultaten, zouden worden gespecificeerd of wanneer er extra vragen aan de lijst toegevoegd zouden worden, zou dat dus geen afbreuk doen aan het doel waarvoor de lijst gebruikt wordt. Tevens kan dan de driepuntsschaal vervangen worden door een vijfpuntsschaal. Ouders en leerkrachten hebben daar blijkbaar behoefte aan (zie paragraaf 2.3.) en het maakt de verwerking van de statistische gegevens eenvoudiger en betrouwbaarder. De laatste en tevens belangrijkste beperking betreft de WISC-RN. Zoals in paragraaf 1.1. al werd geschreven, wilde Wechsler met zijn test de algemene intelligentie meten van mensen met (ongeveer) gemiddelde capaciteiten. Dit onderzoek is echter met name gericht op kinderen met een intelligentie op minimaal begaafd niveau. En volgens Shiff, Kaufman en Kaufman (1981) en Wilkinson (1993) behalen kinderen met een intelligentie op dat niveau overwegend significante V>P verschillen. Dit zou komen doordat het voor slimme kinderen eenvoudiger is hoge scores te behalen op de verbale dan op de performale subtests, omdat bij de performale subtests bonuspunten verdiend moeten worden voor snelheid (Kaufman, 1979). De resultaten van dit onderzoek zeggen dus niet alleen iets over de frequentie van voorkomen van V-P verschillen en de eventuele aanwezigheid van schoolproblemen, maar vooral ook iets over de beperkingen van de WISC-RN. Wechsler zelf denkt daar echter anders over. Volgens Wechsler
38
betreffen de beperkingen niet zijn test, maar de gebruikers ervan, zo blijkt uit een herinnering van Kaufman aan een gesprek dat hij met Wechsler voerde en dat hij beschreef in het voorwoord van één van zijn boeken: “My scales are meant for people with average or near average intelligence, clinical patients who score between 70 and 130. They are clinical tests.” When I reminded him that psychologists commonly use his scales for the extremes, and want to make distinctions within the “below 70” and “above 130” groups, he answered, “Then that is their misfortune. It’s not what I tell them to do, and it’s not what a good clinician ought to do. They should know better.” (Kaufman, 1994, p. XIV) Iedere diagnosticus dient zich derhalve terdege bewust te zijn van de mogelijkheden en beperkingen van het door hem gebruikte materiaal. Voor wat betreft de WISC-RN betekent dat dus, dat het scoreformulier van deze intelligentietest niet gezien kan worden als een presenteerblaadje waarop alle antwoorden worden aangereikt. Vaak roepen de testresultaten namelijk even zovele vragen op. Wanneer na afname van de WISC-RN bijvoorbeeld blijkt, dat er sprake is van een V-P verschil, is het antwoord dus niet “Aha, daarom...”, maar is de belangrijkste vraag: “Waarom?”.
39
Literatuur Baarda, D.B., & Goede, M.P.M. de (2001). Basisboek methoden en technieken: handleiding voor het opzetten en uitvoeren van onderzoek. (3e herziene druk). Groningen: Wolters-Noordhoff. Berk, R.A. (1982). Verbal-Performance IQ Discrepancy Score: A Comment on Reliability, Abnormality, and Validity. Journal of Clinical Psychology, 38, 3, 638-641. Betts, G.T. & Neihart, M. (1988). Profiles of the Gifted and Talented. Gifted Child Quarterly, 32, 2, 248-253. Bloom, A.S., Topinka, C.W., Goulet, M., Reese, A., & Podruch, P.E. (1986). Implications of Large WISC/WISC-R Verbal-Performance IQ Discrepancies. Journal of Clinical Psychology, 42, 2, 353-357. Brunia, R.J. (2000). Werken met hoogbegaafde kinderen. Haarlem: Hogeschool Haarlem. Burger-Veltmeijer, A. (2002). Een disharmonisch intelligentieprofiel: fabels en feiten rond de verbaal-performaalkloof. Talent, 3, 18-20. Busato, V. (2000). Alleen constateren verbaal-performaalkloof is onvoldoende. Talent, 4, 9-11. Clampit, M.K., Adair, J., & Strenio, J. (1983). Frequency of Discrepancies Between Deviation Quotients on the WISC-R: A Table for Clinicians. Journal of Consulting and Clinical Psychology, 51, 5, 795-796. De Bruyn, E.E.J., Vander Steene, G., & Haasen, P.P. van (1986a). Wechsler Intelligence Scale for Children – Revised, Nederlandse Uitgave: scoring en normen. Lisse: Swets & Zeitlinger B.V. De Bruyn, E.E.J., Vander Steene, G., & Haasen, P.P. van (1986b). Wechsler Intelligence Scale for Children – Revised, Nederlandse Uitgave: verantwoording. Lisse: Swets & Zeitlinger B.V. Drent, S., & Gerven, E. van (2002). Professioneel omgaan met hoogbegaafde leerlingen in het basisonderwijs. Utrecht: Lemma. Drenth, P.J.D., & Sijtsma, K. (1990). Testtheorie: inleiding in de theorie van de psychologische test en zijn toepassingen. Houten/Diegem: Bohn Stafleu Van Loghum. Geelhoed, J.W. (1996). Intelligentie-onderzoek binnen de klinische cyclus. In: H.M. Pijnenburg, C.M. Van Rijswijk, A.J.J.M. Ruijssenaars & J.W. Veerman (red.) Pedologisch Jaarboek. (pp. 129-149). Delft: Eburon.
40
Gerven, E. van (2000). De triviale discussie: in gesprek met Willy Peters over de verbaalperformaalkloof. Talent, 4, 12-14. Gerven, E. van (2001). Zicht op hoogbegaafdheid: handboek voor leerkrachten in het basisonderwijs. Utrecht: Lemma. Ghesquière, P., & Ruijssenaars, W. (1995). Kinderen met een leerstoornis. In P. Ghesquière & B. Maes (red.) Kinderen met problemen (pp. 157-184). Apeldoorn: Garant. Groot, R. de, Ghesquière, P., Hinzen-Hanssen, E.H.M., Mildenberg, M. & van der Ploeg, J.D. (red.) (2002). Tijdschrift voor Orthopedagogiek, themanummer: de zorg voor hoogbegaafden in het onderwijs, 41, 5, 245-300. Haartmans, J. (2002). Intelligentie-onderzoek (1): de WISC-RN. Zorg Primair, 3, 2, 1718. Harinck, F.J.H. (2000). Testconstructie: werkboek diagnostiek II. Leiden: Auteur. Harinck, F., & Schoorl, P. (1987). Wast vernieuwde WISC-R werkelijk witter? Kind en adolescent, 8, 3, 109-118. Hsu, L.M. (1996). A Modification of the Payne-Jones Method of Identifying Abnormal Differences in WISC-R Performance and Verbal IQ’s. European Journal of Psychological Assessment, 12, 1, 27-32. Kaufman, A.S. (1975). Factor Analysis of the WISC-R at 11 Age Levels Between 6½ and 16½ Years. Journal of Consulting and Clinical Psychology, 43, 2, 135-147. Kaufman, A.S. (1976). Verbal-Performance IQ Discrepancies on the WISC-R. Journal of Consulting and Clinical Psychology, 44, 5, 739-744. Kaufman, A.S. (1979). Intelligent Testing with the WISC-R. New York: John Wiley & Sons, Inc. Kaufman, A.S. (1981). The WISC-R and Learning Disabilities Assessment: State of the Art. Journal of Learning Disabilities, 14, 9, 520-526. Kaufman, A.S. (1994). Intelligent Testing with the WISC-III. New York: John Wiley & Sons, Inc. Kaufman, A.S., & Lichtenberger, E.O. (2000). Essentials of WISC III and WPPSI-R Assessment. New York: John Wiley & Sons, Inc. Moenaert, H., & Vander Steene, G. (1993). De Nederlandstalige WISC-R en de Denk 23(4): factorstructuur en factorinterpretatie. Kind en adolescent, 14, 2, 67-80.
41
Moffitt, T.E., & Silva, P.A. (1987). WISC-R Verbal and Performance IQ Discrepancy in an Unselected Cohort: Clinical Significance and Longitudinal Stability. Journal of Consulting and Clinical Psychology, 55, 5, 768-774. Moore, D.W., & Wielan, O.P. (1981). WISC-R Scatter Indexes of Children Referred for Reading Diagnosis. Journal of Learning Disabilities, 14, 9, 511-514. Patchett, R.F., & Stansfield, M. (1992). Subtest Scatter on the WISC-R with Children of Superior Intelligence. Psychology in the Schools, 29, 5-11. Peet, A.A.J. van, Wittenboer, G.L.H. van den, & Hox, J.J. (1995). Toegepaste Statistiek: beschrijvende technieken. Groningen: Wolters-Noordhoff. Poppel, M. van. (2002). Haastige spoed zelden goed? Nijmegen: Auteur. Resing, W.C.M., & Blok, J.B. (2002). De classificatie van intelligentiescores: voorstel voor een eenduidig systeem. De Psycholoog, 37, 5, 244-248. Rispens, J., & Yperen, T.A. van (1994). Grenzen van de WISC: de WISC-RN en de diagnostiek bij opvoedings- en ontwikkelingsproblemen. Kind en Adolescent, 15, 4, 175190. Sattler, J.M. (1988). Assessment of Children. (3rd edition). San Diego: Author. Schellens, P.J. & Verhoeven, G. (1994). Argument en tegenargument: analyse en beoordeling van betogende teksten. (2e, herziene druk). Groningen: Martinus Nijhoff Uitgevers. Schiff, M.M., Kaufman, A.S., & Kaufman, N.L. (1981). Scatter Analysis of WISC-R Profiles for Learning Disabled Children with Superior Intelligence. Journal of Learning Disabilities, 14, 7, 400-404. Silver, S.J., & Clampit, M.K. (1990). WISC-R Profiles of High Ability Children: Interpretation of Verbal-Performance Discrepancies. Gifted Child Quarterly, 34, 2, 7679. Silverstein, A.B. (1981). Reliability and Abnormality of Test Score Differences. Journal of Clinical Psychology, 37, 2, 392-394. Smith, T., Smith, B., Matthews, N., & Kennedy, S. (1993). Subtest Scatter and Kaufman Regroupings on the WISC-R in Non-Learning-Disabled and Learning-Disabled Children. Psychology in the Schools, 30, 24-28. Spafford, C.S. (1989). Wechsler Digit Span Subtest: Diagnostic Usefullness with Dyslexic Children. Perceptual and Motor Skills, 69, 115-125.
42
Struiksma, A.J.C., & Geelhoed, J.W. (1998). Intelligentieonderzoek. In Th. Kievit, J. De Wit, J.H.A. Groenendaal & J.A. Tak (red.), Handboek psychodiagnostiek voor de hulpverlening aan kinderen (pp.291-326). (5e herziene druk). Maarssen: Elsevier/De Tijdstroom. Verheij, F. (1996). Leerproblemen en leerstoornissen. In J.A.R. Sanders-Woudstra, F.C. Verhulst & H.F.J. de Witte (red.), Kinder- en jeugdpsychiatrie: psychopathologie en behandeling I (pp. 434-453). (6e druk). Assen: Van Gorcum. Waldron, K.A., & Saphire, D.G. (1990). An Analysis of WISC-R Factors for Gifted Students with Learning Disabilities. Journal of Learning Disabilities, 23, 8, 491-498. Wechsler, D. (2002). Wechsler Intelligence Scale for Children Derde Editie NL: handleiding. Amsterdam: NDC. Wilkinson, S.C. (1993). WISC-R Profiles of Children with Superior Intellectual Ability. Gifted Child Quarterly, 37, 2, 84-91.
43
Bijlage
44
45
46