Universiteit van Amsterdam Faculteit der Maatschappij- en Gedragswetenschappen Afdeling Ontwikkelingspsychologie
De voorspellende waarde van vroege ontwikkelingstests en -vragenlijsten voor intelligentie en hoogbegaafdheid
Masterthese Sabine Westra Studentnummer: 5808065 Externe begeleider: Ger Ramakers Begeleider binnen programmagroep: Annemie Ploeger Datum: 19-8-2013 Masterthese Sabine Westra
1
Abstract In dit onderzoek werd onderzocht of het nonverbale IQ, taalbegrip en getalbegrip van kleuters op 48 maanden voorspeld kon worden door middel van de ontwikkelingstest BSID-II-NL en de ontwikkelingsvragenlijsten ASQ en CSBS op 12, 18 en 24 maanden, en de nonverbale intelligentietest SON-R op 30 maanden. Ook werd onderzocht of hoogbegaafdheid (IQ ≥ 130 op 48 maanden) en begaafdheid (IQ≥120 op 48 maanden) konden worden voorspeld met de BSID-II-NL en de ASQ op 1224 maanden en de SON-R op 30 maanden. De vragenlijsten ASQ en CSBS bleken geen goede voorspellers te zijn voor nonverbale intelligentie en getalbegrip op 48 maanden. Ook de BSID-II-NL was niet goed in staat latere nonverbale intelligentie en getalbegrip te voorspellen. De BSID-II-NL correleerde wel met taalbegriptests. De ASQ correleerde alleen met woordbegrip. Nonverbale intelligentie, hoogbegaafdheid en begaafdheid was goed te voorspellen op 30 maanden. Vervolgonderzoek naar diagnostiek en signalering van hoogbegaafde kinderen zou zich moeten richten op kinderen vanaf 30 maanden.
Masterthese Sabine Westra
2
Inhoudsopgave Abstract
2
Inhoudsopgave
3
1. Inleiding 1.1 Kenmerken hoogbegaafdheid 1.2 Stabiliteit van intelligentie 1.3 Voorspelbaarheid van intelligentie 1.3.1 Bayley Scales of Infant Development (Bayley, 1993) 1.3.2 Vragenlijsten 1.4 Vroege voorspelbaarheid van hoogbegaafdheid 1.5 Het huidige onderzoek
4 5 5 6 6 7 8 9
2. Methode 2.1 Proefpersonen 2.2 Materialen 2.3 Procedure 2.4 Statistische analyses
12 12 12 17 18
3. Resultaten 3.1 Proefpersonen 3.2 Psychometrische kwaliteit ASQ en CSBS DP 3.3 Resultaten nonverbaal IQ 3.4 Resultaten hoogbegaafdheid en begaafdheid 3.4.1 Voorspelbaarheid van hoogbegaafdheid 3.4.2 Voorspelbaarheid van begaafdheid 3.5 Resultaten taalbegrip 3.5.1 Voorspelbaarheid van het WBQ van de PPVT-III-NL 3.5.2 Voorspelbaarheid van de subtests ZB1 en ZB2 van de TAK 3.6 Resultaten getalbegrip 3.7 Correlaties tussen de SON48, de PPV48, de UGT48 en de subtests ZB1 en ZB2
19 19 20 21 23 23 26 30 30 31 34 35
4. Discussie 4.1 Voorspellen van nonverbaal IQ 4.2 Voorspellen van hoogbegaafdheid en begaafdheid 4.3 Voorspellen van taalbegrip 4.4 Voorspellen van getalbegrip 4.5 Voorspellende waarde van BSID-II-NL 4.6 Voorspellende waarde van ASQ, CSBS DP en Lexilijst 4.7 Beperkingen van het onderzoek en suggesties voor vervolgonderzoek 4.8 Conclusie
36 36 37 39 40 40 42 43 45
Literatuurlijst
46
Bijlage 1. Tabellen
53
Bijlage 2. ROC-curves
55
Masterthese Sabine Westra
3
1 Inleiding Hoogbegaafde kinderen hebben behoefte aan onderwijs op hun eigen niveau (Mooij, Hoogeveen, Driessen, Hell & Verhoeven, 2007). Als de omgeving niet aansluit bij de behoefte van hoogbegaafde kinderen dan hebben deze kinderen een hoger risico op emotionele, gedrags- en leerproblemen (Morawska en Sanders, 2009). Door het gebrek aan aanpassingen op school ondervinden hoogbegaafde kinderen problemen in de sociale en emotionele ontwikkeling (Van Gerven & Drent, 2004; Mooij, et al., 2007). Daarnaast raken deze kinderen doordat ze te weinig uitgedaagd worden, verveeld en gaan ze slechter presteren op school (Van Zanten, 1999; Van Gerven, 2002; Van Houten, Kuipers en Peters, 2010). Door perfectionisme, faalangst, onzekerheid en soms beperkte sociale aansluiting bij leeftijdgenoten kunnen hoogbegaafde kinderen zich ook al jong ongelukkig en geïsoleerd gaan voelen (van Zanten, 1999; Mooij et al., 2007; Van Houten et al., 2010). Daarnaast kunnen hoogbegaafde kinderen door problemen op school ook thuis problemen laten zien zoals: slecht slapen, slecht gehumeurd zijn, driftbuien of huilbuien krijgen en somatische problemen zoals buikpijn of hoofdpijn aangeven (van Gerven, 2002). Hoogbegaafde kinderen hebben er het meeste baat bij wanneer er in eerste instantie gefocust wordt op de talenten van het kind en er daarna pas wordt gekeken naar problemen (Neihart, 2008). Het herkennen van hoogbegaafde kinderen door de leerkracht kan moeilijk zijn doordat zij onderpresteren op school (Schwartz, 1999). De problemen die hoogbegaafde kinderen ondervinden, zoals onderpresteren beginnen voornamelijk in de eerste jaren van het basisonderwijs. Wanneer geen versneld programma was opgezet in groep 2, waren hoogbegaafde kinderen in groep 4 wat betreft taal- en rekenontwikkeling achteruit gegaan in vergelijking met andere kinderen (Mooij et al., 2007). Het is dus voor hoogbegaafde kinderen belangrijk dat zij zo jong mogelijk gesignaleerd worden, zodat zij van jongs af aan op hun eigen niveau kunnen leren. Om kinderen op hun eigen niveau te kunnen laten leren is vanuit school speciale begeleiding nodig (Van Gerven & Drent, 2004). Niet alle scholen kunnen hoogbegaafde kinderen bieden wat zij nodig hebben. Toch moeten ouders hier soms al vroeg rekening mee houden. Voor sommige basisscholen moeten ouders hun kind al op twee jarige leeftijd aanmelden omdat er wachtlijsten zijn (Een school voor uw kind, 2011). Vroege signalering van hoogbegaafdheid voor de schoolleeftijd heeft als voordeel dat ouders hier rekening mee kunnen houden bij het voorbereiden op school en de schoolkeuze. In deze studie werd daarom onderzocht of het cognitieve niveau van kleuters aan het begin van groep één (48 maanden) te voorspellen was. Er werd onderzocht of hoogbegaafdheid aan het begin van groep één te voorspellen was aan de hand van vragenlijsten en een ontwikkelingstest die waren afgenomen tussen 12 en 30 maanden. Daarnaast werd de voorspelbaarheid van de schoolse vaardigheden taal en rekenen onderzocht. Masterthese Sabine Westra
4
1.1 Kenmerken hoogbegaafdheid Wanneer hoogbegaafdheid gedefinieerd zou worden als hoogintelligent (IQ≥130) dan zou de prevalentie van hoogbegaafdheid op basis van een normaalverdeling van intelligentie, met een gemiddelde van 100 en een standaarddeviatie van 15, ongeveer 2,5 % moeten zijn. Dit is ongeveer 1 kind per twee schoolklassen. De prevalentie begaafde kinderen, met een IQ tussen 120 en 130 is dan 7,5% van de populatie, ongeveer 2 kinderen per schoolklas. Er zijn verschillende theorieën die hoogbegaafdheid definiëren, zoals het triadisch interpretatiemodel van hoogbegaafdheid (Boxtel & Mönks, 1992). Hierbij zijn een hoge intelligentie, creativiteit en motivatie voorwaarden voor hoogbegaafdheid. In het model van Heller en Hanny (Ziegler & Heller, 2000) wordt een hoge intelligentie gecombineerd met niet-cognitieve persoonlijkheidsfactoren (zoals stressbestendigheid). Volgens Van Houten et al. (2010) zijn hoogbegaafde kinderen creatiever en gedrevener en hebben zij een groter doorzettingsvermogen dan gemiddeld- en hoogintelligente kinderen. Daarbij hoeven kinderen volgens Van Houten et al. (2010) niet noodzakelijkerwijs een intelligentie boven 130 te hebben om hoogbegaafd te zijn. Het gaat erom dat zij op een kwalitatief andere manier leren dan gemiddeld en hoogintelligente kinderen. Hoogintelligente kinderen leren op eenzelfde manier als gemiddeld intelligente kinderen, maar onthouden dingen beter en snappen ideeën van anderen sneller (Van Houten et al., 2010). Hoogbegaafde kinderen stellen vooral vragen en bedenken zelf ideeën en theorieën (Van Houten et al., 2010). Omdat creativiteit, doorzettingsvermogen en de manier van leren lastiger te meten zijn dan het IQ, wordt er bij diagnostiek en onderzoek naar hoogbegaafdheid vrijwel altijd een intelligentiemeting als maatstaaf voor hoogbegaafdheid genomen (Van Houten et al., 2010; Gottfried, Gottfried & Guerin, 2009; Colombo, Shaddy, Blaga, Anderson en Kannas, 2009).
1.2 Stabiliteit van intelligentie Na het zevende jaar blijft intelligentie tot in de volwassenheid vrij stabiel. Onderzoekers vonden correlaties tussen .70 en .80 tussen intelligentiemetingen van 7 tot 18 jaar (Sternberg et al. 2001; Hoekstra, Bartels en Boomsma, 2007; Gottfried et al. 2009). Niet alleen correleert intelligentie goed met latere intelligentie, intelligentie correleert ook goed met latere schoolprestaties (Naglieri en Bornstein, 2003). Vergelijkingen tussen IQ en schoolprestatie vormen dan ook een van de belangrijkste methoden voor het diagnosticeren van leerproblemen (Yen, Konold & McDermott, 2004) en onderpresteren (Mooij et al., 2007). Deary, Strand, Smith en Fermandes (2007) vonden een correlatie van .81 tussen een intelligentiemeting op 11 jaar en schoolexamens (Engels, literatuur, wiskunde, natuurkunde, aardrijkskunde en Frans) op 16 jaar. Uit een meta-analyse van Naglieri & Bornstein (2003) blijkt dat correlaties tussen IQ en schoolprestaties bij basisschoolkinderen tussen .64 Masterthese Sabine Westra
5
en .74 liggen. De correlaties tussen IQ en schoolprestaties nemen over het algemeen toe met leeftijd (McGrew & Knopik, 1993; Hoekstra et al., 2007). Deze toename kan volgens Sternberg et al. (2001) te wijten zijn aan een grotere overlap aan inhoud tussen schoolprestatietests en IQ tests naarmate de moeilijkheidsgraad toeneemt, waardoor deze een grotere overlap aan vaardigheden meten. Een andere verklaring voor de grotere voorspellende waarde van intelligentie op schoolprestaties moet toenemende leeftijd, is dat omgevingsinvloeden minder worden en genetische factoren sterker worden. Hoekstra et al. (2007) heeft een verschuiving in de verklaring van de variantie van het IQ door genetische factoren gevonden, deze was 20% in de babytijd en 80% in de volwassenheid.
1.3 Voorspelbaarheid van intelligentie 1.3.1
Bayley Scales of Infant Development (Bayley, 1993)
Bij jonge kinderen is het niet mogelijk om een intelligentietest af te nemen zoals bij schoolkinderen en volwassenen mogelijk is (Wechsler, 1991). Om het niveau van een jong kind te meten zijn ontwikkelingstests ontwikkeld. De Bayley Scales of Infant Development zijn het meest populair (BSIDII, of Bayley, 1993; BSID-II Nederlandse versie, van der Meulen, Ruiter, Lutje Stelberg & Smrkovsky, 2002) omdat deze goede psychometrische kwaliteiten bezit (Colombo, 1993). Aan de ene kant heeft de BSID-II bewezen dat het een bruikbaar instrument is voor het schatten van de huidige ontwikkelingsstatus van het kind (Lipsit, 1992). Hierbij kan een ontwikkelingsachterstand en een ontwikkelingsvoorsprong worden geconstateerd (van der Meulen et al., 2002). De BSID-II is een goed instrument om kinderen met een ontwikkelingsachterstand te identificeren (Lipsit, 1992; Bayley, 1993). Aan de andere kant heeft volgens Sternberg et al. (2001) het testen van kinderen jonger dan 18 maanden met de BSID-II een lage voorspellende waarde wanneer men geïnteresseerd is in het voorspellen van latere intelligentie. Ook andere onderzoekers concluderen dat de testresultaten van jonge kinderen weinig tot geen voorspellende waarde hebben voor intelligentie op latere leeftijd (Bishop et al., 2003; Petril et al. 2004; Gottfried et al., 2009). Een verklaring voor de lage correlaties op 12 maanden met latere intelligentie is dat de BSID-II een bredere test is dan een intelligentie test. Behalve informatieverwerking wordt op 12 maanden ook voor een groot deel motorische en sensorische ontwikkeling gemeten (Bayley, 1992). Vanaf 24 maanden begint de BSID-II qua items meer op een intelligentietest te lijken (Bayley, 1993). De correlaties met latere intelligentie worden vanaf 24 dan ook hoger (Bishop et al., 2003; Petril et al. 2004; Gottfried et al., 2009). Hieronder (Tabel 1) zijn correlaties te zien tussen testscores op de BSID op 12 en 24 maanden en intelligentietests op verschillende leeftijden. Hoewel de correlaties van de BSID op 12 maanden met latere IQ-scores laag waren, waren deze wel significant (Bishop et al., 2003; Petril et al. 2004; Gottfried et al., 2009).
Masterthese Sabine Westra
6
Tabel 1. Correlaties tussen verschillende tests afgenomen op verschillende leeftijden Bishop et al. (2003)
12 maanden (BSID)
24 maanden (BSID)
4 jaar (Stanford Binet)
.26
.53
7 jaar WISC-R
.18
.37
4 jaar (Stanford-Binet)
.21
.46
7 jaar WISC
.23
.37
3.5 jaar (McCarthy SCA)
.37
.68
5 jaar (Kaufman ABC)
.18
.45
6 jaar WISC-R
.26
.60
12 jaar WISC-R
.17
.51
Petril et al. (2004)
Gottfried et al. (2009)
N=1241
N=605
N=107
1.3.2 Vragenlijsten Naast het meten van het ontwikkelingsniveau bij het kind zelf, is het ook mogelijk ouders te vragen naar het ontwikkelingsniveau van hun kind. Een vragenlijst kan zeer geschikt zijn als screeningsinstrument. Ouders zijn goed in staat het ontwikkelingsniveau van hun kind te beoordelen met behulp van een gestandaardiseerde vragenlijst (Long, 1992). Met een gestructureerde vragenlijst kan een hoge samenhang tussen ouder en professional gevonden worden (Mutlu, Kara, Gunel, Karahan & Livaneliogu, 2011). Een voorbeeld van een gestructureerde vragenlijst naar de ontwikkeling van jonge kinderen is de Ages and Stages Questionnaire (ASQ, Bricker & Squires, 1999). Bij deze vragenlijst worden ouders vragen gesteld over concrete vaardigheden van hun kind op het gebied van communicatie, motoriek, probleem oplossen en sociale ontwikkeling. Uit onderzoek naar de validiteit van de Engelstalige ASQ bij kinderen van 24 maanden (Gollenberg, Lynch, Jackson, McGuinness en Msall, 2009) bleek een specificiteit van 87% en een sensitiviteit van 100% in het voorspellen van een ontwikkelingsachterstand gemeten met de BSID-II. De onderzoekers (Gollenberg et al., 2009) concludeerden dat de ASQ voor onderzoekers een simpele, valide en kosteneffectieve methode is om een ontwikkelingsachterstand bij kinderen van 24 maanden te signaleren. Bij kinderen van 12 maanden werd met de ASQ een sensitiviteit van 85% en een specificiteit van 86% gevonden voor het voorspellen van een ontwikkelingsachterstand, gemeten met de BSID-II (Squires, Bricker & Potter, 1999). Bovenstaande onderzoeken impliceren dat bij het gebruik van gestandaardiseerde vragenlijsten als screeningsinstrument het afnemen van gestandaardiseerde tests, zoals de BSID-II, verminderd kan worden. Dit is gunstig, want een vragenlijst kost minder tijd en is goedkoper dan een
Masterthese Sabine Westra
7
gestandaardiseerde testafname. Bovendien worden ouders direct betrokken bij de diagnostiek van hun kind wanneer zij een vragenlijst over hun kind invullen. Ook heeft een door de ouders ingevulde vragenlijst als voordeel dat ouders een goed beeld kunnen geven van de vaardigheden van hun kind doordat zij hun kind dagelijks meemaken (Skellern, Rogers & O’Callaghan, 2001). Een afname met een ontwikkelingstest als de BSID-II-NL (van der Meulen et al., 2002) is een momentopname. Een momentopname kan een vertekend beeld geven door vermoeidheid, lichamelijke gesteldheid, motivatie of gebeurtenissen die voorafzijn gegaan (Duckworth, Puinn, Lynam, Loeber & StouthamerLoeber, 2011). Een nadeel aan ontwikkelingsvragenlijsten als de ASQ is dat sensitiviteit en specificiteit alleen onderzocht zijn voor het voorspellen van kinderen met een ontwikkelingsachterstand (Squires et al., 1997; Gollenberg et al., 2009, Sices, Stancin, Kirchner & Bauchner, 2009; Wetherby, Goldstein, Cleary, Allen& Kublin, 2003). De specificiteit en sensitiviteit voor kinderen met een ontwikkelingsvoorsprong is nog niet eerder onderzocht. Voor vroege detectie van hoogbegaafdheid zou een vragenlijst als screeningsinstrument zeer nuttig kunnen zijn (Mooij et al., 2007).
1.4 Vroege voorspelbaarheid van hoogbegaafdheid Uit eerder onderzoek naar de voorspelbaarheid van hoogbegaafdheid (IQ≥130) op jonge leeftijd werd gevonden dat hoogbegaafde kinderen (IQ≥130 op 8 jaar aan de hand van de WISC-R) (Gottfried, Gottfried en Guerin, 2006) beter hadden gescoord op de BSID op 2 jarige leeftijd dan normaalbegaafde kinderen. Colombo et al. (2009) vonden in hun onderzoek naar de voorspelbaarheid van hoogbegaafdheid (IQ ≥130 op 48 maanden aan de hand van de Stanford-Binet IV, SB-IV) dat hoogbegaafde kinderen een grotere woordproductie hadden op 12 en 24 maanden. In het onderzoek van Colombo et al. (2009) werd een interactie-effect gevonden tussen tijd en gemiddelde scores op de BSID-II en de SB-IV. De genormeerde scores op de BSID-II op 12 en 24 maanden en op de SB-IV op 30 maanden (M 100, SD 15) bleven voor de groep niet-hoogbegaafd gelijk over de tijd, terwijl de groep hoogbegaafd over de tijd steeds hoger had gescoord. Het verschil tussen de groepen niethoogbegaafd en hoogbegaafd was klein op 12 maanden, maar werd steeds groter over de tijd. De onderzoekers concludeerden dat hoogbegaafde kinderen op 12 maanden gedetecteerd konden worden, op 24 maanden was deze groep beter zichtbaar en op 30 maanden was de groep hoogbegaafd duidelijk te herkennen. Bij bovengenoemde onderzoeken is de voorspellende waarde van ontwikkelingsvragenlijsten niet onderzocht. De voorspelbaarheid van hoogbegaafdheid aan de hand van vragenlijsten is nog onbekend. Hoewel de ontwikkeling van de meeste kinderen in Nederland van 0 tot 4 jaar gevolgd wordt door het consultatiebureau, is het momenteel in Nederland niet gebruikelijk dat er gescreend wordt op
Masterthese Sabine Westra
8
potentiële hoogbegaafdheid. Bij de bezoeken aan het consultatiebureau (13 keer in totaal tot 4 jaar) wordt de groei en de ontwikkeling van het kind in de gaten gehouden aan de hand van het Van Wiegen ontwikkelingsonderzoek (VWO) (http://tinyurl.com/vanwiechen). Het VWO is sinds begin jaren tachtig het instrument dat standaard in Nederland gebruikt wordt om de ontwikkeling van jonge kinderen te meten op het gebied van fijne motoriek, adaptatie, persoonlijkheid en sociaal gedrag, grove motoriek en communicatie. Hierbij is een van de doelstellingen het vroegtijdig opsporen van ontwikkelingsproblemen en stoornissen (Databank effectieve jeugdinterventies, zj; Laurent de Angulo et al, 2005). Het VWO is echter geen gericht instrument om een ontwikkelingsvoorsprong of hoogbegaafdheid te detecteren (Laurent de Angulo & Brouwers de Jong, 2005). Het VWO is in 2005 door de COTAN (Commissie Testaangelegenheden Nederland) als onvoldoende beoordeeld op het gebied van normen, betrouwbaarheid, begrips- en criteriumvaliditeit wegens gebrek aan onderzoek (Databank effectieve jeugdinterventies). Sindsdien zijn er initiatieven om het signaleringsproces voor achterlopende kinderen op consultatiebureaus te verbeteren. Er is bijvoorbeeld een pilot gestart met screening aan de hand van een developmental score (D-Score) die werd berekend op basis van de uitkomst op het VWO. Bij een D-score boven een bepaalde waarde werden ouders gevraagd de ASQ in te vullen. Op basis van de D-score en de ASQ werden 3,5 keer zoveel kinderen met een ontwikkelingsachterstand gevonden dan alleen op basis van alleen het VWO (Hafkamp- de Groen et al., 2009). Wellicht zijn kinderen met een ontwikkelingsvoorsprong in de toekomst op een dergelijke manier ook beter te signaleren. Er zijn momenteel hoopvolle ontwikkelingen gaande wat betreft vroege signalering van hoogbegaafdheid (www.gripoptalent.nl). De expertgroep Excellentie van het Ministerie voor onderwijs, cultuur en wetenschap adviseert de staatssecretaris van onderwijs wat betreft het signaleren van excellente kinderen. Er wordt een addendum voor kinderen met een ontwikkelingsvoorsprong gerealiseerd voor het VWO bij consultatiebureaus, en er wordt een pilot opgestart op consultatiebureaus voor vroegtijdige signalering van potentieel hoogbegaafde kinderen (www.360grview.nl).
1.5 Het huidige onderzoek Samenvattend kunnen hoogbegaafde kinderen wanneer hun hoogbegaafdheid niet wordt herkend, problemen ondervinden doordat zij op school geremd worden in hun ontwikkeling. Momenteel is er geen protocol voor het signaleren van hoogbegaafdheid op jonge leeftijd. Het meten van intelligentie op jonge leeftijd is nog niet mogelijk. Het meten van de sensomotorische ontwikkeling lijkt bij normaalbegaafde kinderen zwak tot matig te correleren met latere intelligentie. Hoogbegaafdheid lijkt vanaf 24 maanden voorspeld te kunnen worden met een ontwikkelingstest. De voorspellende waarde
Masterthese Sabine Westra
9
van een ontwikkelingsvragenlijst voor hoogbegaafdheid is nog niet eerder onderzocht. Mogelijk is hoogbegaafdheid op jonge leeftijd te voorspellen met behulp van ontwikkelingstests en vragenlijsten. In dit onderzoek werd onderzocht of het cognitieve niveau (IQ) van kleuters aan het begin van groep één (48 maanden) voorspeld kon worden aan de hand van een ontwikkelingstest en vragenlijsten op 12, 18, 24 en 30 maanden. Tevens werd onderzocht of hoogbegaafdheid aan het begin van groep één op 12, 18, 24 en 30 maanden te voorspellen was aan de hand van vragenlijsten en ontwikkelingstests. Daarnaast werd de voorspelbaarheid van voorlopers in de schoolse vaardigheden taal en rekenen op 48 maanden bestudeerd. In dit onderzoek met longitudinale opzet zijn kinderen van 12 tot en met 48 maanden gevolgd. Op 12, 18 en 24 maanden werd bij de kinderen een ontwikkelingstest, de BSID-II-NL, afgenomen en hebben ouders de volgende vragenlijsten ingevuld: ASQ, CSBS DP (Communication and Symbolic Behavior Scales Developmental Profile, Wetherby & Prizant, 2002) en de Lexilijst-Nederlands (Schlichting & Spelberg, 2002). Op 30 en 48 maanden werd bij de kinderen een nonverbale intelligentietest; SON-R (Snijders-Oomen Niet-verbale intelligentietest- herziene versie, 2,5 tot 7 jaar, 1998), en een woordbegriptest; PPVT-III-NL (Peabody Picture Vocabulary Test- derde editie- Nederlandse versie, 2005) afgenomen. Bovendien werd er op 48 maanden een getalbegriptest; UGT-R (Utrechtse Getalbegripstoets herziene versie, van Luit en van de Rijt, 2009) afgenomen en werd zinsbegrip gemeten (subtests van de TAK, Taaltoets alle kinderen, verhoeven & vermeer, 2006). Er werd onderzocht of het nonverbale IQ van kinderen van 48 maanden voorspeld kon worden met testresultaten van dezelfde kinderen toen zij tussen de 12 en 30 maanden oud waren (hypothese 1). Op grond van informatie uit eerder onderzoek (Bishop et al., 2003; Petril et al. 2004; Gottfried et al., 2009) was de verwachting dat het ontwikkelingsniveau op de leeftijd van 12 maanden een matige voorspellende waarde had voor het nonverbale IQ op 48 maanden. Er werd verwacht dat het ontwikkelingsniveau op 24 maanden het nonverbale IQ op 48 maanden beter zou kunnen voorspellen. Ook werd verwacht dat de test op 30 maanden het nonverbaal IQ op 48 maanden het best zou voorspellen omdat de tijd tussen deze tests het kleinst was en omdat dit gemeten werd met hetzelfde instrument (SON-R). De vragenlijsten ASQ en CSBS DP zijn uit het Engels vertaald naar het Nederlands en deze vertalingen zijn nog niet genormeerd en gevalideerd. Eerder onderzoek in de groep van Ramakers heeft laten zien dat de ASQ redelijk goed correleert met de BSID op 12, 18 en 24 maanden (niet gepubliceerde data). De verwachting was dat de vragenlijsten het nonverbale IQ in dezelfde mate zou kunnen voorspellen als de BSID-II-NL. De mogelijkheid werd onderzocht om hoogbegaafdheid (nonverbaal IQ ≥ 130 op 48 maanden) te signaleren door middel van de testresultaten op 12, 18, 24 en 30 maanden (hypothese 2). Op grond van eerder onderzoek (Gottfried et al., 2006; Colombo et al., 2009) werd verwacht dat vanaf 24
Masterthese Sabine Westra
10
maanden hoogbegaafde kinderen hoger zouden scoren op de ontwikkelingstest (mentale ontwikkelingsindex van de BSID-II-NL) en -vragenlijsten (ASQ) dan niet-hoogbegaafde kinderen (hypothese 2a). Daarbij werd verwacht dat hoogbegaafde kinderen hoger zouden scoren op woordproductie (Lexilijst-Nederlands) op 18 en 24 maanden dan niet-hoogbegaafde kinderen (Colombo et al., 2009) (Hypothese 2b). Ook werd verwacht dat de test op 30 maanden hoogbegaafdheid het best zou voorspellen omdat de tijd tussen de test op 30 en 48 maanden het kleinst was en omdat deze tests met hetzelfde instrument gemeten zijn (SON-R) (hypothese 2c). Omdat het aantal hoogbegaafde kinderen in deze studie mogelijk te klein was voor een significant effect (p<.05), werd exploratief ook de voorspelbaarheid van begaafdheid (nonverbaal IQ ≥120) geanalyseerd. Tot slot werd de voorspellende waarde van de BSID-II-NL en de vragenlijsten op 12 - 24 maanden voor de voorlopers van schoolse vaardigheden taal en rekenen onderzocht (aan de hand van de PPVT-II-NL, Subtests van de TAK en de UGT-R) (hypothese 3). Intelligentietests blijken goede voorspellers voor schoolse vaardigheden (Parker & Benedict, 2002). De correlaties tussen IQ en schoolse vaardigheden bij basisschoolkinderen liggen tussen de .64 en .74 (Naglieri & Bornstein, 2003). In dit onderzoek werd onderzocht of schoolse vaardigheden bij kleuters aan het begin van groep één (48 maanden) te voorspellen waren uit de ontwikkelingstest en de vragenlijsten die ouders hadden ingevuld op 12, 18 en 24 maanden. Uit onderzoek van Blaga et al. (2009) bleek de BSID-II een stabiele voorspeller te zijn van taalniveau, gemeten met de PPVT. Verwacht werd dat de PPVT-III-NL voorspeld kon worden uit de scores van de mentale ontwikkelingsindex van de BSID-II-NL (hypothese 3a). Er is geen literatuur bekend over de voorspelbaarheid van de scores op subtests van de TAK. Uit verschillende onderzoeken (Bishop et al., 2003; Petril et al., 2004; Gottfried et al., 2009), bleek dat verbale intelligentie (gemeten met de WISC op 6 en 7 jaar) correleerde met de mentale ontwikkelingsindex van de BSID-II op 24 maanden. Op basis van deze gegevens werd verwacht dat taalvaardigheid gemeten met de TAK ook positief correleerde met de mentale ontwikkelingsindex van de BSID-II-NL (hypothese 3b). Naar de voorspelbaarheid van getalbegrip gemeten met de UGT-R is ook geen eerder onderzoek gedaan. Wel blijkt uit eerder onderzoek dat de correlatie tussen IQ en rekenen tussen de .70 en .77 ligt bij kinderen tussen 6 en 16 jaar (Deary et al., 2007; Dickerson Mayes & Calhoun, 2007). Daarom werd verondersteld dat getalbegrip ook voorspeld kon worden door de mentale ontwikkelingsindex van de BSID-II-NL (hypothese 3c). Ook werd de voorspellende waarde van de vragenlijsten voor de voorlopers in de schoolse vaardigheden taal en rekenen onderzocht.
Masterthese Sabine Westra
11
2. Methode 2.1
Proefpersonen
Voor dit onderzoek zijn 55 kinderen van 48 maanden getest, 29 meisjes en 25 jongens. De proefpersonen vormen onderdeel van een groter longitudinaal onderzoek naar de cognitieve ontwikkeling van jonge kinderen. De proefpersonen zijn geworven via een vereniging van hoogbegaafde mensen (MENSA) en via folders bij consultatiebureaus, kinderdagverblijven en wachtkamers van huisartsen. De proefpersonen voor het huidige onderzoek zijn willekeurig geselecteerd binnen de bestaande deelnemers uit het longitudinale onderzoek. Alle kinderen met uitzondering van risicogroepen (kinderen met Downsyndroom en andere syndromen) zijn meegenomen in dit onderzoek. De opzet van het overkoepelende onderzoek is longitudinaal met meetpunten op 12, 18, 24, 30, 36, 48 en 60 maanden (en mogelijk verder). De gegevens van 12, 18, 24 en 30 maanden van deze kinderen waren reeds beschikbaar en werden meegenomen in de analyses. De proefpersonen hebben na ieder halfjaarlijks meetmoment een cadeautje ontvangen, ouders konden eventuele reiskosten declareren. Voor de tweede hypothese, de voorspelbaarheid van hoogbegaafdheid, zijn de kinderen in twee groepen verdeeld. Zij die op 48 maanden 130 of hoger op de SON hebben gescoord en zij die lager dan 130 hebben gescoord. Ook is er bij de tweede hypothese de voorspelbaarheid van begaafdheid onderzocht. Hierbij waren de kinderen verdeeld in een groep die op 48 maanden 120 of hoger heeft gescoord op de SON en een groep die lager dan 120 heeft gescoord op de SON.
2.2
Materialen
BSID-II-NL Bayley Scales of Infant Development- Second Edition- Nederlandse versie De Bayley Scales of Infant Development (BSID-II-NL, Meulen, Ruiter, Lutje Spelberg & Smrkoský, 2002) is afgenomen bij de kinderen op 12, 18 en 24 maanden om de mentale en motorische ontwikkeling van het kind te meten. De test is door de COTAN als voldoende betrouwbaar en valide beoordeeld (behalve voor criteriumvaliditeit, hier is geen onderzoek naar gedaan). De BISD-II-NL is een bewerking van de BSID-II (Bayley, 1993), een Amerikaanse ontwikkelingstest bedoeld om het ontwikkelingsniveau te kunnen beoordelen bij kinderen van één tot 42 maanden. De BSID-II-NL is een ontwikkelingstest die individueel bij een kind wordt afgenomen door een getrainde onderzoeker. De duur van de afname is afhankelijk van de leeftijd 25-60 minuten. De test bestaat uit drie schalen, de mentale schaal, de
Masterthese Sabine Westra
12
motorische schaal en de gedragsobservatieschaal. In het huidige onderzoek is de mentale schaal gebruikt in de analyses. De mentale schaal beoogt vaardigheden te meten die betrekking hebben op de cognitie van het kind, zoals de visuele en auditieve opmerkzaamheid, oog-handcoördinatie, imitatie, taalontwikkeling, geheugen en probleemoplossend vermogen. Voorbeelden hiervan zijn item 69: kijkt naar plaatjes in een boek en item 72: zoekt naar inhoud van doos. Omdat de BSID een breed leeftijdsbereik heeft, zijn er items te moeilijk voor jonge kinderen en te makkelijk voor oudere kinderen. Om te voorkomen dat kinderen onnodig gefrustreerd raken door de lange duur en een grote hoeveelheid te makkelijke en te moeilijke items, is er gekozen om leeftijdsgroepen te vormen met een drempel en een plafondregel, wanneer een kind meer dan acht items positief had gescoord werd een leeftijdsgroep teruggegaan, en wanneer het minder dan vijf items negatief had gescoord werd een leeftijdsgroep verder afgenomen. De ruwe scores werden omgezet in ontwikkelingsindices. Deze zijn normaal verdeeld en hebben een gemiddelde van 100 en een standaarddeviatie van 15. Deze normaalverdeelde standaardscores zijn in dit onderzoek als maat gebruikt. In het huidige onderzoek is alleen de mentale ontwikkelingsindex (MOI) gebruikt. ASQ Ages and Stages Questionnaire Op het moment dat de kinderen 12, 18 en 24 maanden waren, werden de ouders gevraagd om de Ages and Stages Questionnaire (ASQ, Bricker & Squires, 1999) in te vullen. De ASQ bestaat uit verschillende leeftijdspecifieke vragenlijsten om het ontwikkelingsniveau van een kind te bepalen en te volgen. De vragenlijsten voor 12, 18 en 24 maanden zijn voor het overkoepelende ontwikkelingsonderzoek door Dr. G. Ramakers van het Engels naar het Nederlands vertaald. De Nederlandse vertaling heeft nog geen normgegevens en is niet gevalideerd. Aangenomen werd dat de uitkomsten overeen komen met de originele Engelstalige versie. Het invullen van de vragenlijst duurt ongeveer 10 minuten. De ASQ heeft een vrij goede sensitiviteit (.70-.90) en specificiteit (.76-.91)voor het vinden van kinderen met een ontwikkelingsachterstand (Sices, Stancin, Kircher & Bauchner, 2009). De ouder kan de vragen beantwoorden door op een driepuntsschaal het vakje aan te kruisen dat aangeeft of het kind een activiteit al regelmatig, soms of nog niet doet (ja, soms of nog niet). Voor deze antwoorden worden respectievelijk 10, 5 of 0 punten toegekend. De vragenlijst bestaat uit vijf schalen met zes vragen, 30 vragen in totaal. De schalen zijn: communicatie, grove motoriek, fijne motoriek, probleem oplossen en persoonlijk-sociaal, daarnaast is er nog een algemene schaal waar ouders acht vragen met ja of nee kunnen beantwoorden en eventueel een toelichting kunnen geven. De antwoorden worden op geteld tot een totaalscore per schaal, en deze bij elkaar opgeteld vormen Masterthese Sabine Westra
13
de totaalscore van de ASQ. De ruwe totaalscores van de ASQ zijn gebruikt in de analyses van het huidige onderzoek. In het huidige onderzoek is een aanzet gegeven tot validatie door de interne consistentie te berekenen aan de hand van Cronbach’s alpha. CSBS DP Communication and Symbolic Behavior Scales Developmental Profile De Communication and Symbolic Behavior Scales Developmental Profile (CSBS DP, Wetherby & Prizant, 2002) is door ouders ingevuld om de communicatieve vaardigheden van de kinderen te bepalen op 12, 18 en 24 maanden. De vragenlijst is bedoeld als sceeningsinstrument om het functionele communicatieniveau te meten bij kinderen tussen 6 maanden en 2 jaar. De hele CSBS DP bestaat uit drie onderdelen; een vragenlijst met 24 vragen over het kind, een follow-up oudervragenlijst en een ouder/kind observatie. Voor dit onderzoek is alleen de vragenlijst met 24 vragen over het kind gebruikt. De vragenlijst is voor het overkoepelende ontwikkelingsonderzoek door Dr. G. Ramakers van het Engels naar het Nederlands vertaald. De Nederlandse vertaling heeft nog geen normgegevens en is niet gevalideerd. Aangenomen werd dat de uitkomsten overeen komen met de originele Engelstalige versie. De vragenlijst bestaat uit vragen over de taalontwikkeling en nonverbale communicatie van het kind en deze zijn onderverdeeld in 7 schalen: Emoties en staren, communicatie, gebaren, geluiden, woorden, begrijpen en gebruik van objecten. Elke vraag kan beantwoord worden op een driepuntsschaal: nog niet, soms en vaak. Voor deze antwoorden worden respectievelijk 0, 1 of 2 punten toegekend. In totaal kunnen maximaal 48 punten behaald worden. In de analyses van dit onderzoek zijn de ruwe totaalscores van de CSBS gebruikt. In het huidige onderzoek is een aanzet gegeven tot validatie door de interne consistentie te berekenen aan de hand van Cronbach’s alpha. Lexilijst Nederlands De Lexilijst Nederlands (Schlichting & Spelberg, 2002) is door ouders ingevuld om vroege taalontwikkeling te meten op 18 en 24 maanden. De vragenlijst is bedoeld om de actieve woordenschat van kinderen van 15 tot 27 maanden te meten. Op de lijst vinken ouders aan welke woorden en zinnetjes hun kind zegt. De woorden zijn geordend in 15 categorieën. Voor de lijst zijn per maand normen ontwikkeld. De Lexilijst is door COTAN beoordeeld met een goede betrouwbaarheid, voldoende normen en voldoende begrips- en criteriumvaliditeit. De Lexilijst bestaat uit twee delen, deel A en deel B, van 263 woorden en 11 zinnetjes. Deze zijn gelijkwaardig aan elkaar, zodat een van de delen als hertest kan worden gebruikt. De ruwe score bestaat uit het aantal aangevinkte woorden en zinnen. De ruwe score wordt omgezet in het LQ, lexiquotiënt, deze heeft een normale verdeling
Masterthese Sabine Westra
14
met een gemiddelde van 100 en een standaarddeviatie van 15. In dit onderzoek zijn de ruwe scores gebruikt. SON-R 2,5-7 Snijders-Oomen Niet-verbale intelligentietest - herziene versie, 2,5 tot 7 jaar Om het cognitieve niveau te meten van de kinderen is op 48 maanden de SON-R 2,5-7 (SnijdersOomen Niet-verbale intelligentietest - herziene versie 2,5-7, 1998) afgenomen. De SON-R 2,5-7 is een nonverbale intelligentietest voor kinderen van 2,5 tot 7 jaar. De afname duurt ongeveer een uur. De SON-R 2,5-7 is door de COTAN beoordeeld als een test met een goede betrouwbaarheid en validiteit. De test is afgenomen door een getrainde onderzoeker. De test bestaat uit zes subtests die elk in moeilijkheidsgraad oplopende items bevatten. De zes subtests zijn opgedeeld in twee schalen; de redeneerschaal en de performale schaal. Er zijn drie redeneer subtests: Categorieën, Analogieën en Situaties, en er zijn drie performale subtets: Mozaïeken, Puzzels en Patronen. Gerelateerd aan de leeftijd van het kind worden instapregels gehanteerd, tevens zijn er afbreekregels zodat de afname zo effectief en snel mogelijk geschiedt. De ruwe scores worden per subtest omgezet in genormeerde scores met een gemiddelde van 10 en een standaarddeviatie van 3. Uit de normscores wordt een nonverbale IQ-score berekend, deze is normaal verdeeld, met een gemiddelde van 100 en een standaarddeviatie van 15. Er kunnen ook normscores berekend worden voor de redeneerschaal en de performale schaal. Deze hebben ook een gemiddelde van 100 en een standaarddeviatie van 15 en zijn normaal verdeeld. In het huidige onderzoek zijn de nonverbale IQ-scores gebruikt. PPVT-III-NL Peabody Picture Vocabulary Test- Third edition- Nederlandse versie. De Peabody Picture Vocabulary Test-III-NL (PPVT-III-NL, Schlichting, 2005) is gebruikt om de passieve woordenschat te meten op 48 maanden. De test is een bewerking van de PPVT-III van Dunn en Dunn (1997). De test meet receptieve kennis en woordenschat en wordt afgenomen in ongeveer 10 minuten. De test kan afgenomen worden van af 2 jaar en 3 maanden tot 90 jaar. De PPVT-III-NL is door de COTAN beoordeeld met een goede betrouwbaarheid en voldoende begripsvaliditeit, de criteriumvaliditeit werd als onvoldoende beoordeeld wegens gebrek aan onderzoek. Tijdens de test krijgt het kind telkens vier plaatjes te zien waarna het kind het goede plaatje moet kiezen na een uitgesproken woord. Dit zijn afwisselend werkwoorden, bijvoeglijk naamwoorden, zelfstandig naamwoorden en woordgroepen. De test bestaat uit verschillende sets van 12 items in oplopende moeilijkheidsgraad. Hierdoor wordt afhankelijk van leeftijd in verschillende sets ingestapt om aan te sluiten bij het niveau van het kind. Na meer dan 8 fouten in een set wordt de test afgebroken.
Masterthese Sabine Westra
15
Het aantal juist beantwoorde items wordt bij elkaar opgeteld. Met behulp van een normtabel wordt de totaalscore omgezet naar woordbegripquotiënt (WBQ), deze is normaal verdeeld, heeft een gemiddelde van 100 en een standaarddeviatie van 15. TAK Taaltoets Alle Kinderen Om de taalvaardigheid op 48 maanden te meten is een gedeelte van de Taaltoets Alle Kinderen (TAK, Verhoeven & Vermeer, 2006) afgenomen. De TAK is een taalvaardigheidtest voor kinderen van groep 1 t/m 4 van het basisonderwijs en bestaat uit tien onderdelen. De TAK is door de COTAN beoordeeld met een goede betrouwbaarheid, goede begripsvaliditeit en goede criteriumvaliditeit. De TAK bestaat uit 10 onderdelen. Per onderdeel zijn de toetsscores verdeeld in percentielscores ingedeeld in vijf groepen, A tot en met E zoals bij het leerlingvolgsysteem van CITO. – niveau A: goed tot zeer goed (25% hoogst scorende leerlingen); – niveau B: ruim voldoende tot goed (25% net boven het gemiddelde scorende leerlingen); – niveau C: matig tot voldoende (25% net onder het gemiddelde scorende leerlingen); – niveau D: zwak tot matig (15% ruim onder het gemiddelde scorende leerlingen); – niveau E: zwak tot zeer zwak (10% laagst scorende leerlingen). De onderdelen die afgenomen in dit onderzoek zijn: - Zinsbegrip 1 (42 items): meet zinsbegrip. De items bestaan uit zinnen waarin aanduidende woorden, ruimtelijke woorden, persoonsaanduidende woorden en voegwoorden centraal staan voor het begrip. Het kind heeft keuze uit drie plaatjes waarvan er één bij de aangeboden zin past. - Zinsbegrip 2 (42 items): meet kennis van relaties tussen woorden en woordgroepen in een zin. Het kind heeft keuze uit drie plaatjes waarvan er één bij de aangeboden zin past. Cronbach’s Alpha van Zinsbegrip 1 = .89 en van Zinsbegrip 2 = .90 voor begingroep 1 (Verhoeven & Vermeer, 2006). UGT-R Utrechtse Getalbegripstoets herziene versie De Utrechtse Getalbegriptoets-Revised (UGT-R, van Luit en van de Rijt, 2009) is afgenomen op 48 maanden om het getalbegrip te meten. De test meet voorbereidende rekenvaardigheid en kan afgenomen worden bij kinderen in groep 1 t/m 3 van het basisonderwijs. De afname duurt ongeveer 30 minuten. De UGT-R is door de COTAN als voldoende betrouwbaar, maar als onvoldoende valide beoordeeld wegens te weinig onderzoek.
Masterthese Sabine Westra
16
De opgaven van de test zijn verdeeld over negen schalen: vergelijken, hoeveelheden koppelen, één en één correspondentie, ordenen, telwoorden gebruiken, synchroon en verkort tellen, resultatief tellen, toepassen van kennis van getallen en schatten. Het aantal juist beantwoorde vragen vormt een ruwe score, deze wordt met behulp van een normtabel omgezet in een niveau (A t/m E), waarbij niveau A tot de 25% best scorenden behoort en waarbij niveau D en E respectievelijk tot de 25-10% en 10 % laagst scorenden behoren zoals bij het leerlingvolgsysteem van CITO.
2.3 Procedure Voor dit onderzoek is vooraf goedkeuring gekregen van de Commissie Ethiek van de afdeling Ontwikkelingspsychologie van de Universiteit van Amsterdam. Voor de gegevens van de kinderen van 12-24 maanden zijn de databestanden van de BSID-II-NL, de ASQ en de CSBS uit het overkoepelende longitudinale onderzoek naar de verstandelijke ontwikkeling van jonge kinderen gebruikt. Voor dit overkoepelende onderzoek kwamen ouders met hun kind op 12, 18, 24, 30, 36, 48 en 60 maanden naar het Centrum voor Ouder en Kind van de Universiteit van Amsterdam. Ouders konden zich aanmelden voor deelname aan het onderzoek, zij hebben een informed consent getekend en vervolgens kregen zij voor ieder meetmoment een uitnodiging om met hun kind naar het Centrum voor Ouder en Kind te komen. Vooraf aan elk bezoek werden de vragenlijsten per email naar de ouders gestuurd, met het verzoek de vragenlijsten in te vullen en te retourneren. Ouders hebben verschillende vragenlijsten ingevuld waarvan voor dit onderzoek de ASQ, de CSBS DP, en de Lexilijst Nederlands gebruikt zijn. Op de dag van de testafname werden ouders en kind ontvangen door de testleider in de ontvangstruimte. Dit is een op kinderen aangepaste ruimte met speelgoed waar het kind kan wennen aan de nieuwe omgeving. Naast de ontvangstruimte zijn twee testkamers. De testkamers zijn ruimtes met een oneway screen en camera’s zodat elke testafname geregistreerd kan worden. Elke testafname werd dan ook opgenomen op Dvd’s waarvan er één gebruikt werd om de testafname te scoren, en een ander werd meegegeven aan de ouders als herinnering. Voor het overkoepelende onderzoek zijn er op elke testleeftijd ook spelobservaties gedaan. Deze zijn niet meegenomen in het huidige onderzoek en worden daarom ook niet in de procedure besproken. Tijdens de afname was een ouder in de testruimte aanwezig zodat het kind zich op zijn gemak voelde. Ouders waren geïnstrueerd om zoveel mogelijk passief aanwezig te zijn om zo op geen enkele wijze de test te beïnvloeden. De ouder zat dan ook tijdens de testafname schuin achter het kind zodat zij wel veiligheid konden bieden aan het kind, maar zo weinig mogelijk afleiding veroorzaakten. Masterthese Sabine Westra
17
De tests werden volgens de instructie uit de desbetreffende handleiding uitgevoerd. Tijdens de testafname zat het kind aan een vierkante tafel tegenover de testleider. De verschillende tests werden afgenomen in een bepaalde volgorde waarbij de kinderen van 48 maanden de eerste ochtend begonnen met de SON-R 2,5-7 voor een optimale meting van het IQ. De testleider scoorde de test tijdens de afname zo zorgvuldig mogelijk, zodat afbreekregels in acht genomen konden worden en de DVD opname enkel gebruikt hoefde te worden ter controle. Het totale bezoek aan het Centrum voor Ouder en Kind was ongeveer twee uur per keer, afhankelijk van de motivatie, concentratie en leeftijd van het kind. Tijdens het testen werd een of meer keer pauze genomen (afhankelijk van de concentratieboog van het kind). In de pauze kon het kind iets eten en drinken in de ontvangstruimte. Ikzelf ben tijdens mijn onderzoek testleider geweest voor het overkoepelende onderzoek. Ik heb kinderen van 48 en 60 maanden en hun ouders ontvangen in de ontvangstruimte. Ik heb de kinderen vervolgens getest. Daarnaast heb ik spelobservaties gedaan.
2.4 Statistische Analyses Om de Nederlandse vertalingen van de ASQ en de CSBS DP te valideren is de interne consistentie onderzocht. Hierbij is met het statistiekprogramma SPSS Cronbach’s alpha berekend om de samenhang tussen de items te bepalen. Bivariate correlaties tussen de tests op 48 maanden (SON-R, PPVT-II-NL, TAK en UGT-R) en de tests op 12 - 30 maanden (BSID-II-NL, ASQ, CSBS DP, Lexilijst en SON-R) zijn bepaald met behulp van de Pearson correlatiecoëfficiënt wanneer de waarden normaal verdeeld waren en met de Spearman’s Rho wanneer de waarden niet normaal verdeeld waren. De analyse van de voorspellende waarde van de ASQ, CSBS DP en de mentale ontwikkelingsindex van de BSID-II is gedaan aan de hand van multipele regressieanalyse. Voorafgaand aan de analyses is steeds getest of de waarden voldeden aan de voorwaarden voor de test (normaliteit). Voor de analyse van de voorspelbaarheid van hoogbegaafdheid zijn Independent sample t-tests uitgevoerd voor het analyseren van verschillen tussen twee groepen (normaal, begaafd, hoogbegaafd of geslacht). Om het verschil tussen de groepen op 12 tot 24 maanden te analyseren zijn er herhaalde metingen ANOVA’S uitgevoerd met één between-subjects factor (hoogbegaafd of begaafd op 48 maanden) en één within-subjects factor (leeftijd; ASQ, CSBS of BSID op 12, 18 en 24 maanden). De sensitiviteit en specificiteit van de voorspellende variabelen is berekend voor hoogbegaafdheid of begaafdheid wanneer er met een independent sample t-test een verschil tussen de groepen werd gevonden. Dit werd gedaan aan de hand van ene ROC-curve (Receiver Operating Characteristic) met behulp van het programma MedCalc (http://www.medcalc.org).
Masterthese Sabine Westra
18
3 Resultaten 3.1 Proefpersonen Uit het overkoepelende onderzoek waren van 55 kinderen beschikbaar voor deze studie. Alleen van de ASQ op 12 maanden waren de data van al deze kinderen beschikbaar, bij de andere tests ontbraken van een of meer kinderen de gegevens (Tabel 2). Redenen voor de ontbrekende data zijn onder andere ziekte op het meetmoment en niet geretourneerde vragenlijsten. Voor ieder meetinstrument werd de gemiddelde score en de daarbij behorende standaardafwijking berekend (Tabel 2). Met independent samples t-tests werd onderzocht of er verschil was tussen het aantal jongens en meisjes per meetinstrument. Op geen enkel meetinstrument werd een verschil tussen het aantal jongens en meisjes gevonden, p > .05 (Tabel 11, Bijlage 1). Er was geen verschil in het aantal jongens en meisjes tussen de groepen hoogbegaafd (SON-IQ op 48 maanden ≥130) en niet-hoogbegaafd, χ²(1)=.67, p >.05. Ook was er geen verschil in het aantal jongens en meisjes tussen de groepen begaafd (SON-IQ op 48 maanden ≥120) en niet-begaafd, χ²(1)=.77, p >.05. Van de 55 proefpersonen was de meerderheid van de ouders hoogopgeleid (HBO of WO). Van de moeders was 74.5% hoogopgeleid, 9.1% had een MBO opleiding en 16.4% was onbekend. Van de vaders was 63.6% hoogopgeleid, 12.7% had een MBO of lagere opleiding, en 23.6% was onbekend. Met t-testen werd onderzocht of de leeftijd en opleiding van de ouders verschilde voor de groepen hoogbegaafd en niet-hoogbegaafd en voor de groepen begaafd en niet-begaafd. Er werd geen verschil gevonden in opleiding van de ouders (p>.05, Tabel 12 en 13, bijlage 1). Een independent samples ttest toonde aan dat de moeders van de kinderen in de groep niet-begaafd iets ouder waren (M = 34.78, SD = 3.80, N = 18) dan in de groep begaafd (M = 32.00, SD = 4.54, N = 27), t(43) = -2.14, p = .038. Er werd geen verschil gevonden in de leeftijd van de vaders tussen de groepen begaafd en nietbegaafd t(41) = -.164, p = .870. Ook de leeftijd van de ouders tussen de groepen hoogbegaafd en niethoogbegaafd verschilden niet van elkaar (p>.05, Tabel 14, bijlage 1). Tabel 2. Onderzoeksresultaten van de afgenomen tests en vragenlijsten
SON-R 48 PPVT-III-NL 48 TAK zinsbegrip 1 TAK zinsbegrip 2 UGT-R 48 SON-R 30 BSID-II-NL 12 BSID-II-NL 18
Leeftijd (maanden) Vermelde score 48 IQ 48 WBQ 48 Normscore 48 Normscore 48 Vaardigheidsscore 30 IQ 12 MOI 18 MOI
Masterthese Sabine Westra
N 51 52 45 39 45 46 52 48
M 122.18 115.06 66.69 64.85 37.67 120.96 99.40 99.71
SD 12.286 10.489 23.176 25.291 7.604 15.249 10.847 12.818 19
BSID-II-NL 24 ASQ 12 ASQ 18 ASQ 24 CSBS DP 12 CSBS DP 18 Lexilijst 18 Lexilijst 24
24 12 18 24 12 18 18 24
MOI Totaalscore Totaalscore Totaalscore Totaalscore Totaalscore Totaalscore Totaalscore
43 55 47 44 54 46 38 35
101.65 193.09 228.30 252.95 32.19 46.22 31.74 125.09
10.661 53.864 38.944 26.508 7.727 5.970 31.405 61.473
3.2 Psychometrische kwaliteit ASQ en CSBS DP De interne consistentie van de Nederlandse vertaling van de ASQ werd berekend met Cronbach’s alpha (Tabel 3). Waarden van boven .70 worden over het algemeen gezien als betrouwbaar (Field, 2005), en waarden boven .80 worden gezien als goed betrouwbaar. Voor alle schalen van de ASQ was Cronbach’s alpha groter dan .70, behalve de schaal persoonlijk-sociaal op 12 en 18 maanden. Alle schalen, behalve persoonlijk-sociaal hadden een voldoende tot goede interne consistentie. Opvallend was dat de Chronbach’s alpha op de schaal persoonlijk-sociaal voor de ASQ op 18 maanden lager is dan op 12 en 24 maanden. Tabel 3. Cronbach’s alpha voor de schalen van de ASQ Communicatie Cronbach’s α 12m Cronbach’s α 18m Cronbach’s α 24m
.77 .80 .89
Grove Motoriek .90 .87 .90
Fijne Motoriek .77 .75 .74
Probleem Oplossen .75 .73 .76
PersoonlijkSociaal .68 .39 .71
Voor de Nederlandse vertaling van de CSBS DP werd ook de interne consistentie berekend met Cronbach's alpha (Tabel 4). Slechts de subtest gebaren scoorde zowel op 12 maanden als op 18 maanden boven .70. Voor de overige schalen was de interne consistentie onvoldoende. De lage interne consistentie van de CSBS DP kan verklaard worden door het kleine aantal items per schaal. Tabel 4. Cronbach’s alpha voor de schalen van de CSBS DP
Cronbach’s α 12m Cronbach’s α 18m
Emoties en staren .11
Communicatie Gebaren
Geluiden Woorden
.57
.73
.70
.45
Begrijpen Object gebruiken .47 .63
.21
.67
.75
.32
.56
.28
Masterthese Sabine Westra
.70
20
De constructvaliditeit van Nederlandse vertalingen van de ASQ en de CSBS DP werd onderzocht door de uitkomsten met MOI (mentale ontwikkelingsindex) van de BSID-II-NL en met elkaar te vergelijken. Dit is gedaan aan de hand van correlaties (Tabel 5). De ASQ correleerde significant met de CSBS DP en de BSID-II-NL, p <.01, en de CSBS DP correleerde ook significant met de ASQ en de BSID-II-NL, p<.01. De laagste correlatie werd gevonden tussen de CSBS DP en de BSID-II-NL op 12 maanden, r = .406, p = .002. De hoogste correlatie werd gevonden tussen ASQ en BSID-II-NL op 12 maanden, r = .693, p<.001. Tabel 5. Pearson correlaties tussen de ASQ, de MOI van de BSID-II-NL en de CSBS DP op 12, 18 en 24 maanden 12 maanden 18 maanden 24 maanden
ASQ - BSID-II-NL .693** .462** .485**
CSBS DP - BSID-II-NL .406** .527**
ASQ – CSBS DP .473** .668**
*. Correlatie is significant bij p < .05 (2-zijdig). **. Correlatie is significant bij p< .01 (2-zijdig).
3.3 Resultaten nonverbaal IQ Nonverbaal IQ werd gemeten met het totaal-IQ van de SON-R op 48 maanden (hierna SON48 genoemd) . Correlaties tussen de SON48 en de variabelen gemeten tussen 12 en 30 maanden zijn berekend (Figuur 1). Ook zijn er regressieanalyses uitgevoerd per leeftijdscategorie. Voorspelbaarheid van de SON48 gemeten met variabelen op 12 maanden De MOI van de BSID-II-NL op 12 maanden (verder BSID12) correleerde significant met de SON48, r = .359, p = . 011. De correlaties van de totaalscores op de ASQ op 12 maanden (ASQ12) en de totaalscores op de CSBS DP op 12 maanden (CSBS12) met de SON48 waren niet significant, p > .05. Er is een regressieanalyse uitgevoerd met de SON48 als afhankelijke variabele en de BSID12, ASQ12 en de CSBS12 als voorspellende variabelen. Uit de regressieanalyse bleek dat alleen de BSID12 de SON48 significant voorspelde, β = .369, t(47) = 2.634, p = .011 (dit betekent dat wanneer er een standaarddeviatie hoger gescoord wordt op de BSID12, de score op de SON48 met .369 standaarddeviatie toeneemt). De score op de BSID 12 verklaarde ook een significant deel van de variantie van de SON48, R2 = .129, F(1,897) = 6.94, p = .011, dit is 13%.
Masterthese Sabine Westra
21
Voorspelbaarheid van de SON48 gemeten met variabelen op 18 maanden De correlaties tussen de SON48 met de MOI van de BSID-II-NL op 18 maanden (BSID18), de totaalscores op de ASQ op 18 maanden (ASQ18) en de totaalscores op de CSBS DP op 18 maanden (CSBS18) waren niet significant, p > .05. Ook uit de regressieanalyse met de SON48 als afhankelijke variabelen en de BSID18, de ASQ18 en de CSBS18 als voorspellende variabelen volgde geen voorspellend model, β = 297, t(36) = 1.1865, p = .070, ook was er geen significante verklaring van de variantie R2 = .088, F(1,511) = 3.477, p = .70). De SON48 kon niet goed voorspeld worden door de BSID18, de ASQ18 en CSBS18. Voorspelbaarheid van de SON48 gemeten met variabelen op 24 maanden Zowel de MOI van de BSID-II-NL op 24 maanden (BSID24), als de totaalscore op de ASQ op 24 maanden (ASQ24) correleerden niet significant met de SON48, p>.05. Er zijn geen gegevens van de CSBS DP op 24 maanden, deze is dus niet inbegrepen in de analyse. De resultaten uit de regressieanalyse met de SON48 als afhankelijke variabele en de BSID24 en de ASQ24 als voorspellende variabelen waren niet significant, β = 231, t(30) = 1.333, p = .193. De SON48 kon niet goed voorspeld worden door de tests op 24 maanden. Correlaties tussen de SON op 48 en op 30 maanden De correlatie tussen de SON48 en de IQ-score op de SON-R op 30 maanden (SON30) (N=43) is berekend. De correlatie bleek significant, r = .629, p < .001. Dit betekent dat (R2 = .40) 40% van de variantie op de SON48 werd verklaard door de SON30. Figuur 1. Correlaties tussen de SON-R op 48 maanden en de BSID, ASQ en CSBS DP op 12 – 24 maanden en de SON-R op 30 maanden 0,7
**
0,6 0,5 0,4
12 maanden (N=49)
*
18 maanden (N=38)
0,3
24 maanden (N=32)
0,2
30 maanden (N=43)
0,1 0 BSID-II-NL
ASQ
Masterthese Sabine Westra
CSBS
SON-R
22
3.4 Resultaten hoogbegaafdheid en begaafdheid 3.4.1 Voorspelbaarheid van hoogbegaafdheid Om te onderzoeken of hoogbegaafdheid op jonge leeftijd al voorspeld kon worden zijn de proefpersonen in twee groepen verdeeld: hoogbegaafd en niet-hoogbegaafd. Hierbij hadden de hoogbegaafde kinderen een totaal-IQ (ongecorrigeerd) van 130 of hoger op de SON48, en de niethoogbegaafde kinderen hadden een score lager dan 130 op de SON48. Voor beide groepen is de score die zij hadden behaald op de mentale ontwikkelingsindex van de BSID-II-NL (BSID) op 12, 18 en 24 maanden (Tabel 6) onderzocht. Om het verschil tussen de groepen hoogbegaafd en niet-hoogbegaafd op 12 tot 24 maanden te analyseren is er een herhaalde metingen ANOVA uitgevoerd met als between subjects factor hoogbegaafdheid (hoogbegaafd en niet-hoogbegaafd) en als within subjects factor tijd (12, 18 en 24 maanden). Tabel 6. Onderzoeksresultaten op 12, 18 en 24 maanden voor de groepen niet-hoogbegaafd en hoogbegaafd Niet-hoogbegaafd M
Hoogbegaafd
SD
N
M
SD
N
BSID12
99.29
11.953
28
102.11
6.918
9
BSID18
102.21
11.548
28
99.67
13.702
9
BSID24
101.18
11.521
28
103.11
8.521
9
ASQ12
187.59
56.778
27
223.33
49.937
9
ASQ18
222.41
42.048
27
245.56
36.180
9
ASQ24
249.07
27.423
27
266.67
19.039
9
CSBS12
30.68
6.848
31
35.70
8.693
10
CSBS18
45.65
6.606
31
48.20
3.967
10
Lexilijst 18
27.28
26.951
25
44.10
43.322
10
Lexilijst 24
125.48
63.455
25
142.25
51.258
8
De Mauchly’s test of sphericity is uitgevoerd om te kijken of er aan de assumptie voor sfericiteit is voldaan, deze score was significant, p = .050. Daarom is bij de ANOVA naar de epsiloncorrectie van Greenhouse-Geisser gekeken. Er was geen significant verschil in scores op BSID over de tijd, F(2,19) = .197, p = .790, dit was volgens de verwachtingen omdat er met normscores gewerkt werd. Er was ook geen interactie tussen scores op de BSID over de tijd en hoogbegaafdheid, F(2,65) = .679, p = .490). Dit betekent dat het verschil tussen hoogbegaafd en niet-hoogbegaafd niet significant groter of kleiner is geworden over de tijd. Tegen de verwachtingen in was er geen significant verschil in scores op de BSID tussen de groepen hoogbegaafd en niet-hoogbegaafd, F(1,11) = .051, p = .823. Er is dus tussen 12 en 24 maanden geen
Masterthese Sabine Westra
23
verschil gevonden in de scores op de BSID tussen hoogbegaafde en niet-hoogbegaafde kinderen (Figuur 2). Figuur 2. Gemiddelde score en standaardfout op de BSID-II-NL voor de groepen niet-hoogbegaafd en hoogbegaafd
108 106 104 102
niet hoogbegaafd
100
hoogbegaafd
98 96 94 BSID12
BSID18
BSID24
Om het verschil in de totaalscores op de vragenlijsten ASQ, CSBS en Lexilijst tussen de groepen hoogbegaafd en niet-hoogbegaafd op 12 tot 24 maanden te analyseren, is er per vragenlijst een herhaalde metingen ANOVA uitgevoerd met als between subjects factor hoogbegaafdheid (hoogbegaafd en niet-hoogbegaafd) en als within subjects factor tijd (12, 18 en 24 maanden voor de ASQ, 12 en 18 maanden voor de CSBS en 18 en 24 maanden voor de Lexilijst). Uit deze ANOVA’s volgde geen significant verschil tussen de groepen niet-hoogbegaafd en hoogbegaafd, p > .05. Er werd geen verschil gevonden tussen de groepen hoogbegaafd en niet-hoogbegaafd op de vragenlijsten ASQ, CSBS en Lexilijst. Omdat in de herhaalde metingen ANOVA veel proefpersonen wegvallen doordat niet van elk kind op elke leeftijd alle gegevens beschikbaar zijn, zijn er per meetinstrument tevens independent samples ttesten uitgevoerd om te onderzoeken of er per meetpunt op 12, 18 en 24 maanden verschil was tussen de groepen hoogbegaafd en niet-hoogbegaafd. In totaal zijn er tien t-testen uitgevoerd (de BSID en de ASQ op 12, 18 en 24 maanden, de CSBS op 12 en 18 maanden en de Lexilijst op 18 en 24 maanden). Er volgde een verschil tussen hoogbegaafd en niet-hoogbegaafd op de ASQ 24 wanneer er pairwise werd getoetst (N=40), t(38) = 2.03, p = .05. De groep hoogbegaafd scoorde hoger op de ASQ24 (M = 267.27, SD = 20.42, N = 11) dan de groep niet-hoogbegaafd (M = 249.31, SD = 26.45, N = 29). Uit de andere t-testen kwamen geen significante resultaten naar voren p > .05, mogelijk is het verschil op de ASQ 24 op toeval berust aangezien er een groot aantal t-testen is uitgevoerd. Masterthese Sabine Westra
24
Om de diagnostische waarde van de ASQ 24 bij hoogbegaafde kinderen te bepalen, zijn de optimale sensitiviteit en specificiteit berekend door middel van een ROC (Receiver Operating Characteristic) curve. De ROC-curve is berekend met behulp van het MedCalc programma (http://www.medcalc.org). Een ROC-curve is een grafiek waarbij per criterium de terecht positieven op de y-as worden uitgezet tegen de fout positieven op de x-as. Figuur 3. ROC-curve van de ASQ24 voor de groep hoogbegaafd
ASQ24 - hoogbegaafd 100
Sensitivity
80 Sensitivity: 72,7 Specificity: 65,5 Criterion : >255
60 40 20 0 0
20 40 60 80 100 100-Specificity
Naast de voorspelbaarheid van hoogbegaafdheid op grond van de BSID en de vragenlijsten ASQ, CSBS DP en Lexilijst op 12, 18 en 24 maanden, is ook de voorspelbaarheid van hoogbegaafdheid op 48 maanden onderzocht aan de hand van de SON30. Met een independent samples t-test is onderzocht of de groepen hoogbegaafd en niet-hoogbegaafd van elkaar verschilden. Er was een significant verschil tussen de groepen hoogbegaafd en niet-hoogbegaafd op de SON30, t(41) = 3.28, p = .002. De groep hoogbegaafd heeft significant hoger gescoord op de SON30 dan de groep niet-hoogbegaafd (Tabel 7). De diagnostische waarde van de SON30 voor de groep hoogbegaafd is berekend aan de hand van een ROC-curve (Figuur 4). Voor de groep hoogbegaafd lagen de optimale sensitiviteit en specificiteit bij een totaal-IQ van 123 op de SON30, hierbij was de sensitiviteit 83.3 en de specificiteit 83.9. Dit betekent dat 83.3% van de groep hoogbegaafd een totaal-IQ van 123 of hoger heeft gehaald op de SON30 en 83.9% van de groep niet-hoogbegaafd een totaal-IQ onder 123 heeft gehaald op de SON30.
Masterthese Sabine Westra
25
Tabel 7. Gemiddelden en standaarddeviaties op de SON30 voor de groepen niet-hoogbegaafd en hoogbegaafd M
SD
N
Niet-hoogbegaafd
116.26
13.723
31
hoogbegaafd
131.00
11.740
12
Figuur 4. ROC-curve van de SON30 voor de groep hoogbegaafd
Son 30 norm - hoogbegaafd 100
Sensitivity
80
Sensitivity: 83,3 Specificity: 83,9 Criterion : >123
60 40 20 0 0
20 40 60 80 100 100-Specificity
3.4.2 Voorspelbaarheid van begaafdheid Om te onderzoeken of begaafdheid op jonge leeftijd voorspeld kon worden, zijn de proefpersonen nog eens in twee groepen verdeeld: begaafd (SON48 ≥120) en niet-begaafd (SON48<120). Voor beide groepen is de score die zij hadden behaald op de BSID, de ASQ, de CSBS DP en de Lexilijst (Tabel 8) onderzocht. Om het verschil tussen de groepen begaafd en niet-begaafd op de BSID van 12 tot 24 maanden te analyseren, is er een herhaalde metingen ANOVA uitgevoerd met als between subjects factor begaafdheid (begaafd en niet-begaafd) en als within subjects factor tijd (12, 18 en 24 maanden).
Masterthese Sabine Westra
26
Tabel 8. Onderzoeksresultaten op 12, 18 en 24 maanden voor de groepen begaafd en niet-begaafd Niet-begaafd BSID12
M 95.93
Begaafd SD 11.943
N 15
M 102.73
SD 9.478
N 22
BSID18
101.00
11.832
15
102.00
12.302
22
BSID24
98.80
9.843
15
103.59
11.190
22
ASQ12
187.86
53.734
14
202.05
59.013
22
ASQ18
218.57
42.627
14
234.32
40.423
22
ASQ24
251.07
25.357
14
255.00
27.646
22
CSBS12
31.47
7.249
15
32.15
7.842
26
CSBS18
45.33
7.355
15
46.81
5.374
26
Lexilijst18
22.42
18.918
12
37.13
37.356
23
Lexilijst24
116.43
66.136
14
139.21
55.621
19
Zoals verwacht was er geen significant verschil in de scores op de BSID over de tijd, F(2,49) = .596, p = .554. Er was geen interactie tussen tijdstip van de meting en begaafdheid, F(2,77) = .935, p = .398. Er was ook geen significant effect tussen de twee groepen, F(1,471) = 2.281, p = .140. Dit betekent dat er geen verschil was in BSID-scores tussen de groepen begaafd en niet-begaafd tussen 12 en 24 maanden. Om het verschil tussen de groepen begaafd en niet-begaafd in de totaalscores op de ASQ, CSBS en de Lexilijst van 12 tot 24 maanden te analyseren, is er per vragenlijst een herhaalde metingen ANOVA uitgevoerd met als between subjects factor begaafdheid (begaafd en niet-begaafd) en als Within subjects factor tijd (12, 18 en 24 maanden voor de ASQ, 12 en 18 maanden voor de CSBS en 18 en 24 maanden voor de Lexilijst). Uit deze ANOVA’s werd geen significant verschil gevonden tussen de groepen niet-begaafd en begaafd, p > .05. Er werd geen verschil gevonden tussen de groepen begaafd en niet-begaafd op de vragenlijsten ASQ, CSBS en Lexilijst. Omdat in de herhaalde metingen ANOVA veel subjects wegvallen doordat niet van elk kind op elke leeftijd alle gegevens beschikbaar zijn, zijn er per meetinstrument tevens independent samples ttesten uitgevoerd om te onderzoeken of er per meetpunt op 12, 18 en 24 maanden verschil was tussen de groepen begaafd en niet-begaafd. Er was een significant verschil tussen begaafd en nietbegaafd op de BSID12 wanneer er pairwise getoetst werd (N=49), t(47) = 2.505, p = .016, en niet wanneer er listwise getoetst werd zoals bij de ANOVA gedaan werd (N= 38). De groep begaafd (M = 102.89, SD = 8.98, N = 28) heeft hoger gescoord op de BSID12 dan de groep niet-begaafd (M = 95.43, SD = 8.975, N = 21).
Masterthese Sabine Westra
27
Figuur 5. Gemiddelde score op de BSID-II-NL voor de groep niet-begaafd en begaafd met standaardfout 120 115 110 105 niet begaafd
100
begaafd
95 90 85 80 BSID12
BSID18
BSID24
Om de diagnostische waarde van de BSID12 bij begaafdheid te bepalen, zijn de optimale sensitiviteit en specificiteit berekend door middel van een ROC curve (Figuur 6). De optimale sensitiviteit was 67.9 en de specificiteit was 71.4 bij een score van 100 op de BSID12. Dit betekent dat bij een score van 100 op de BSID12, 67.9% van de groep begaafd terecht in de groep begaafd werd ingedeeld op 12 maanden, en 71.4% van de groep niet-begaafd terecht in de groep niet-begaafd werd ingedeeld op 12 maanden. In bijlage 2 staan de andere criteriumwaarden en bijbehorende sensitiviteit en specificiteit van de ROC-curves. Figuur 6. ROC-curve van de MOI van de BSID12 voor de groep begaafd BSID 12m - begaafd 100
Sensitivity
80 Sensitivity: 67,9 Specificity: 71,4 Criterion : >100
60 40 20 0 0
20
40 60 80 100-Specificity
100
Tevens is de voorspelbaarheid van begaafdheid op 48 maanden op basis van de SON30 onderzocht. Uit een independent samples t-test volgde een significant verschil tussen de groepen begaafd en nietbegaafd, t(41) = 4.13, p < .001. De groep begaafd scoorde significant hoger dan de groep niet-begaafd Masterthese Sabine Westra
28
(Tabel 9). De optimale sensitiviteit en specificiteit voor het voorspellen van begaafdheid aan de hand van de SON30 is berekend aan de hand van ROC-curves (Figuur 7). Voor de groep begaafd werd de optimale sensitiviteit en specificiteit bij een totaal-IQ score van 117 gevonden. Hierbij was de sensitiviteit 72.0 en de specificiteit 88.9. Dit betekent dat 72% van de kinderen uit de groep begaafd een totaal-IQ van 117 of hoger had op de SON30, en dat 88.9% van de kinderen uit de groep nietbegaafd een totaal-IQ lager dan 117 had op de SON30. Tabel 9. Gemiddelden en standaarddeviaties op de SON30 voor de groepen niet-begaafd en begaafd M
SD
N
niet-begaafd
111.11
7.806
18
begaafd
127.04
14.937
25
Figuur 7. ROC-curve van de SON30 voor de groep begaafd
Son 30 begaafd 100
Sensitivity
80 Sensitivity: 72,0 Specificity: 88,9 Criterion : >117
60 40 20 0 0
Masterthese Sabine Westra
20 40 60 80 100 100-Specificity
29
3.5 Resultaten Taalbegrip 3.5.1 Voorspelbaarheid van het WBQ van de PPVT-III-NL Taalbegrip is gemeten met het woordbegripquotiënt (WBQ) op de PPVT-III-NL op 48 maanden (PPVT48) en de subtests zinsbegrip 1 (ZB1) en zinsbegrip 2 (ZB2) van de TAK op 48 maanden. Correlaties tussen de PPVT48, ZB 1 en ZB 2 en de variabelen gemeten tussen 12 en 30 maanden zijn berekend
(Figuur 8, 9 en 10). Eerst worden resultaten van de PPVT48 besproken, daarna worden de resultaten van de subtests besproken. Voorspelbaarheid van de PPVT48 gemeten met variabelen op 12 maanden Zowel de resultaten van de BSID12 als die van de ASQ12 en de CSBS12, correleerden niet significant met de PPVT48, p>.05 (Tabel 10). Er volgde geen significant model uit de regressieanalyse met de PPVT48 als afhankelijke variabele en de BSID12, de ASQ12, en de CSBS12 als voorspellende variabele,
β = .278, t(47) = 2.006, p = .058. Ook was de bijbehorende variantie analyse niet significant, F(1,399) = 3.768, p = .058. De PPVT48 kon niet goed voorspeld worden op 12 maanden. Voorspelbaarheid van de PPVT48 gemeten met variabelen op 18 maanden Alleen de score op de ASQ 18 (r = .316, p = .05) correleerde significant met de PPVT48. Er is een regressieanalyse uitgevoerd met de PPVT48 als afhankelijke variabele en de scores op de BSID18, de ASQ18, de CSBS18 en de Lexilijst18 als voorspellende variabelen. Daaruit volgde een model met de Lexilijst18, β = .517, t(31) = 3.307, p = .002. De score op de Lexilijst18 verklaarde ook een significant deel van de variantie in de PPV48, F(1,901) = 10.936, p = .002, R2 = .267, dus 27% van de variantie werd verklaard door de score op de Lexilijst18. Deze resultaten moeten met voorzichtigheid geïnterpreteerd worden vanwege het schenden van de normale verdeling van de Lexilijst18. De Spearmans Rho (Tabel 10) correlatie tussen de Lexilijst18 en de PPVT48 maanden was niet significant, r = .187, p = .306. Zonder Lexilijst18 kwam de ASQ18 als beste voorspeller naar voren uit de regressie analyse, β = .316, t(37) = 2.027, p = .050. De ASQ18 verklaarde 10% van de variantie op de PPVT48, R2 = .10 (F(1,460) = 4.11, p = .050). Voorspelbaarheid van de PPVT48 gemeten met variabelen op 24 en 30 maanden Op 24 maanden correleerden BSID24 en de ASQ24 significant met de PPVT48, respectievelijk r = .492 (p = .011) en r = .490 (p = .011). Er is een regressie analyse gedaan met de PPVT48 als afhankelijke variabele en de BSID24, de ASQ24 en de Lexilijst 24 als voorspellende variabelen. Hieruit volgde het model met alleen de BSID24 als beste voorspeller voor de PPVT48, β = .492, t(25) = 2.766, p = .011. In dit model werd 24% van de variantie op de PPVT48 verklaard door de BSID24, R2 = .242 (F(1,622) = 7.651, p = .011). Masterthese Sabine Westra
30
De PPVT48 correleerde significant met de PPVT30, r = .362 p = .035. Uit de regressie met de PPVT48 als afhankelijke variabele en de PPV30 en de SON30 als voorspellende variabelen, volgde een model met de PPV30 als beste voorspeller β = .362, t(32) = 2.199, p = .035. De PPVT30 verklaarde 13% van de variantie op de PPVT48, R2 = .131 (F(1,352) = 4.834, p = .035). Figuur 8. Correlaties tussen de PPVT48 en variabelen gemeten op 12, 18 en 24 maanden 0,60 0,50
*
* *
0,40
12 maanden (N=50)
0,30
18 maanden (N=32)
0,20
24 maanden (N=26)
0,10 0,00 BSID
ASQ
CSBS
Lexilijst
3.5.2 Voorspelbaarheid van de subtests zinsbegrip 1 en zinsbegrip 2 van de TAK Voorspelbaarheid van de subtests ZB1 en ZB2 op 48 maanden gemeten met variabelen op 12 maanden De BSID12 correleerde significant met de subtests zinsbegrip 1 (ZB1) en zinsbegrip 2 (ZB2) op 48 maanden, respectievelijk r = .328, p = .032 en r = .426, p =.009. De ASQ12 correleerde met beide subtests van de TAK niet significant. De CSBS12 correleerde alleen met ZB2, R = .356, p = .031. Uit de regressieanalyse met ZB1 als afhankelijke variabele en de BSID12, de ASQ12 en de CSBS12 als voorspellende variabelen, bleek de BSID12 de beste voorspeller te zijn, β = .383, t(42) = 2.654, p = .011. De MOI BSID12 verklaarde 15% (R2 =.147) van de variantie voor ZB1 (F(1,3400) = 7.034, p = .011). Uit de regressieanalyse met ZB2 als afhankelijke variabele bleek ook de BSID12 de beste voorspeller te zijn te zijn, β = .435, t(32) = 2.857, p = .007. De BSID12 verklaarde 19% van de variantie voor ZB2 (F(1,4401) = p = .007). Voorspelbaarheid van de subtests ZB1 en ZB2 op 48 maanden gemeten met variabelen op 18 maanden De BSID18 correleerde met ZB1, r = .431, p = .022, en met ZB2, r = .505, p = .014. De Lexilijst18, de ASQ18 en de CSBS18 correleerden niet significant met de subtests van de TAK op 48 maanden. Uit de
Masterthese Sabine Westra
31
regressieanalyse met ZB1 als afhankelijke variabele en de BSID18, de ASQ18, de CSBS18 en de Lexilijst18, bleek de BSID 18 de beste voorspeller te zijn, β = .456, t(27) = 2.610, p = .015. De BSID18 verklaarde 21% van de variantie voor ZB1 (R2 = .208). Uit de regressieanalyse met ZB2 als afhankelijke variabele bleek ook de BSID18 de beste voorspeller te zijn, β = .501, t(22) = 2.652, p = .015. De BSID18 verklaarde 25% van de variantie voor ZB2 (R2 = .251). Voorspelbaarheid van de subtests ZB1 en ZB2 op 48 maanden gemeten met variabelen op 24 maanden ZB1 correleerde niet significant met de BSID24 en de Lexilijst24 en de ASQ24 (p>.05). Uit de regressieanalyse met ZB1 en de tests op 24 maanden kwamen dan ook geen significante voorspellers naar voren, F(1,246) = .633, p = .435. De BSID24 correleerde significant met ZB2 (r = .469 p = .043). Uit de regressieanalyse met ZB2 als afhankelijke variabele (N =19) volgde een verklaringsmodel met de BSID24, β = .457, t(18) = 2.120, p = .049. De BSID24 verklaarde 21% van de variantie ZB2, R2 = .209 (F(1,1623) = 4.495, p = .049). Wanneer de ASQ24 echter niet meegenomen werd in de regressieanalyse (N=21), kwam de Lexilijst24 als beste voorspeller naar voren, β = .520, t(20) = 2.655, p = .016, en verklaarde deze 27% van de variantie op ZB2, R2 = .271 (F(1,2480) = 7.048, p = .016). Voorspelbaarheid van de subtests ZB1 en ZB2 op 48 maanden gemeten met variabelen op 30 maanden De correlaties tussen ZB1 van de TAK op 48 maanden en SON 30 de PPVT30 zijn berekend. De SON30 correleerde significant met ZB1 van de TAK, r = .415, p = .025. Er is een regressieanalyse uitgevoerd met ZB1 als afhankelijke variabele en de SON30 en de als voorspellende variabelen, maar hier kwam geen significant resultaat uit, p>.05. ZB2 van de TAK correleerde hoog met de SON30, r = .786, p < .001. Uit de regressieanalyse met ZB2 als afhankelijke variabele en de SON30 en de PPVT30 als voorspellende variabelen volgde een verklaringsmodel met de SON30, β =.584, t(21) = 3.294, p = .003. Deze verklaarde 34% van de variantie op ZB2, R2 = .341 (F(1,2907) = 10.852, p = .003). Mogelijk is de β uit de regressieanalyse lager dan de berekende correlatie omdat de laatste met Pearson correlatie is berekend en niet met Spearman’s Rho.
Masterthese Sabine Westra
32
Figuur 9. Correlaties tussen ZB1 en variabelen gemeten tussen 12 en 30 maanden 0,50 0,40
*
*
*
0,30
12 maanden (N=43) 18 maanden (N=28) 24 maanden (N=23) 30 maanden (N=29)
0,20 0,10 0,00 -0,10
BSID-II-NL
ASQ
CSBS
Lexilijst
SON-R
PPVT
-0,20
Figuur 10. Correlaties tussen ZB2 van de TAK en variabelen gemeten tussen 12 en 30 maanden 0,90
***
0,80 0,70 0,60 0,50
* **
12 maanden (N=37)
*
18 maanden (N=23)
*
0,40
24 maanden (N=19)
0,30
30 maanden (N=23)
0,20 0,10 0,00 -0,10
BSID-II-NL
ASQ
Masterthese Sabine Westra
CSBS
Lexilijst
SON-R
PPVT
33
3.6 Resultaten Getalbegrip Getalbegrip is gemeten met de vaardigheidsscore op de UGT-R op 48 maanden (verder UGT48). Correlaties tussen de UGT48 en de variabelen gemeten tussen 12 en 30 maanden zijn berekend (Figuur 11). Ook zijn er regressieanalyses uitgevoerd om per leeftijdscategorie te kijken welke tests de beste voorspellers waren. Voorspelbaarheid van de UGT48 gemeten met variabelen op 12 maanden De BSID12 correleerde significant met de UGT48, r =.414, p = .006. Er is een regressieanalyse uitgevoerd met de UGT48 als afhankelijke variabele en de BSID12 en de ASQ12 als voorspellende variabelen. Het model met enkel de BSID12 voorspelde de UGT48 het beste, β = .414, t(42) = 2.913, p = .006. (Dit betekent dat wanneer er een standaarddeviatie hoger gescoord wordt op de BSID12, de score op de UGT48 met .414 standaarddeviatie toeneemt). De BSID12 verklaarde 17% van de variantie van de UGT48, R2 = .0171 (F(1,394) = 8.49, p = .006). Voorspelbaarheid van de UGT48 gemeten met variabelen op 18 maanden Op 18 maanden zijn er geen significante correlaties met de vaardigheidsscore op de UGT 48 gevonden (p>.05). Ook uit de regressieanalyse kwam geen significante voorspeller naar voren β = .164, t(32) =.927, p = .361. Voorspelbaarheid van de UGT48 gemeten met variabelen op 24 en 30 maanden Er was een significante correlatie tussen de UGT48 en de BSID24, r = .391, p = .033. De ASQ24 en de UGT48 correleerden niet met elkaar. Toch bleek uit een regressieanalyse dat de UGT48 het best kon worden voorspeld uit een model met de BSID24 en de ASQ24 samen. Voor de BSID24 gold: β = .610, t(28) = 3.173, p = .004, en voor de ASQ24: β = -.417, t(28) = -2.168, p = .039. De ASQ24 droeg echter bij door middel van een negatieve correlatie. Samen verklaarden de BSID24 en de ASQ 24 28% van de variantie op de UGT48, R2 = .278 (F(2,27) = 5.205, p = .012). Het model met enkel de BSID 24 was ook significant, p = .033, deze verklaarde slechts 15% van de variantie, R2 = .153. Exploratief is een regressie analyse gedaan met de BSID24 en de ruwe scores van de losse subcategorieën van de ASQ24 als voorspellende variabelen. Hieruit volgde een model met de BSID24 en de subcategorie communicatie. Voor de BSID24 gold: β = .608, t(28) = 3.737, p = .001 en voor de subcategorie communicatie: β = -.543, t(28) = -3.337, p = .002. Samen verklaarden deze 40% van de variantie op de vaardigheidsscore van de UGT48, R2 = .40 (F(2,679) = 9.00, p = .001). De schaal communicatie van de ASQ24 leek op een negatieve manier bij te dragen aan de voorspelbaarheid van de UGT48.
Masterthese Sabine Westra
34
De UGT48 correleerde significant met de SON 30 (N=36), R= .433, p<.001. Dit betekent dat R2 = .19, 19% van de variantie werd verklaard door de SON30. Figuur 11. Correlaties tussen de vaardigheidsscore op de UGT-R op 48 maanden en variabelen gemeten tussen 12 en 24 maanden
0,5
**
0,4
***
*
0,3
12 maanden (N=43)
0,2
18 maanden (N=33)
0,1
24 maanden (N=30)
0
30 maanden (N=36)
-0,1
BSID-II-NL
ASQ
SON-R
-,096
-0,2
3.5 Correlaties tussen de SON48, de PPV48, de UGT48 en de subtests ZB1 en ZB2 Exploratief zijn de correlaties tussen de tests die op 48 maanden zijn afgenomen (Tabel 10) onderzocht. De SON48 correleerde significant met de PPVT48, r = .405, p = .004, en met de UGT48, r = .343, p = .026. De SON48 correleerde niet significant met de TAK subtests ZB1 en ZB2. De PPVT48 correleerde enkel met de SON48 en niet met de andere subtests. De UGT48 correleerde naast de SON48 ook met de TAK subtest ZB1, r = .323, p = .042, en met de subtest ZB2, r = .524, p = .001. De TAK subtests ZB1 en ZB2 correleerden ook significant met elkaar, r = .480, p = .002. Tabel 10. Correlaties tussen de SON48, de PPVT48, de UGT48 en ZB1 en ZB2 PPVT48
SON48
UGT48
ZB1
ZB2
Pearson
sig.
N
Pearson
sig.
N
Spearman
sig.
N
Spearman
Sig.
N
.405**
.004
50
.343*
.026
42
.216
.169
42
.244
.145
37
.088
.571
44
.149
.341
43
.240
.147
38
.323*
.042
40
.524**
.001
38
.480**
.002
39
PPVT48 UGT48 ZB1
Masterthese Sabine Westra
35
4. Discussie In dit onderzoek werd de voorspelbaarheid van het nonverbaal IQ op 48 maanden onderzocht door middel van vragenlijsten en tests die tussen de 12 en 30 maanden zijn afgenomen. Er werd onderzocht of hoogbegaafdheid en begaafdheid op 48 maanden kon worden voorspeld op 12, 18, 24 en 30 maanden. Ook is de voorspelbaarheid van taalbegrip en getalbegrip, de voorlopers in de schoolse vaardigheden taal en rekenen, onderzocht. Er is in dit onderzoek een aanzet gegeven tot validatie van de Nederlandse vertalingen van de ASQ en de CSBS DP.
4.1 Voorspellen van Nonverbaal IQ Het nonverbaal IQ, gemeten met de SON48, correleerde alleen significant met de BSID12 en met de SON30. De totaalscores op de ASQ en de CSBS correleerden niet significant met de SON48. Ook de BSID op 18 en 24 maanden correleerde niet significant met de SON48. De correlatie tussen de BSID12 en de SON48 (r = .36) kwam overeen met de gevonden correlaties tussen de BSID en intelligentietests op 4 jaar uit eerder onderzoek (r = .21 - .37) (Bishop et al., 2003; Petril et al. 2004; Gottfried et al., 2009). De correlatie tussen de BSID24 en de SON48 (r=.20) kwam niet overeen met eerder onderzoek (r = .46 - .68). De correlatie die gevonden is tussen de SON30 en de SON48 (r = .63) kwam wel overeen met correlaties die gevonden zijn tussen metingen op 3 en 4 jaar (r = .60 - .64) (Bisschop et al., 2003; Petril et al., 2004). De verwachting dat de voorspellende waarde van de BSID, de ASQ en de CSBS voor de SON48 vanaf 12 maanden zou toenemen, is niet uitgekomen. Anders dan verwacht waren de BSID18, de ASQ18 en de CSBS18, en de BSID24 en de ASQ24 niet van voorspellende waarde voor de SON48. De voorspellende waarde van de BSID12 voor nonverbale intelligentie was volgens verwachting beperkt. Volgens verwachting was de correlatie tussen de SON30 en de SON48 hoger dan de andere correlaties met de SON48. Mogelijk hebben de BSID op 18 en 24 maanden en de ASQ op 12 -24 maanden meer talige componenten gemeten dan de SON48. Hierdoor bleven de correlaties met de nonverbale intelligentietest SON48 laag. Dit zou verklaren waarom er in eerder onderzoek wel significante correlaties tussen de BSID op 24 maanden en talige intelligentietests op 4 jaar zijn gevonden. Mogelijk is de lage voorspelbaarheid van de SON48 van 12 tot en met 24 maanden ook te wijten aan het feit dat een testafname een momentopname is. Winkel en Tellegen (2001) wijzen er op dat men bedacht moet zijn dat testuitkomsten een vertekend beeld kunnen geven van de capaciteiten van een kind. Winkel en Tellegen (2001) vonden bij jonge kinderen een wisselvalligheid in prestaties die zij moeilijk konden voorspellen. Factoren die hier in meespeelden waren volgens hen de houding van de testleider, lichamelijke conditie van het kind en gebeurtenissen voorafgaand aan de testafname. Daarbij lijken Intelligentiemetingen pas stabiel te worden vanaf 7 jaar (Sternberg et al. 2001; Hoekstra Masterthese Sabine Westra
36
et al., 2007; Gottfried et al. 2009). Echter, de correlatie tussen de SON48 en de SON30 is vrij hoog, dus de mate van afwijking door de momentopname bij de SON48 lijkt mee te vallen. Nonverbale intelligentie op 48 maanden gemeten met de SON-R is met de gebruikte instrumenten pas op 30 maanden goed te voorspellen.
4.2 Voorspellen van hoogbegaafdheid en begaafdheid Hoogbegaafdheid op 48 maanden werd niet voorspeld met de BSID op 12, 18 en 24 maanden. De ASQ en de CSBS op 12 en 18 maanden konden hoogbegaafdheid op 48 maanden ook niet voorspellen. Er werd een verschil gevonden in de totaalscores op de ASQ24 tussen de groepen niet-hoogbegaafd en hoogbegaafd. De groep hoogbegaafd had hoger gescoord op de ASQ24 dan de groep niethoogbegaafd. Dit verschil moet voorzichtig geïnterpreteerd worden. Het absolute verschil was erg klein en lag op de grens van significant (p = .05). Aangezien het grote aantal t-testen dat is uitgevoerd zou het significante resultaat mogelijk een toevalstreffer kunnen zijn. De voorspellende waarde van de totaalscores op de ASQ24 was dan ook matig, uit de ROC-curve volgde een optimum met een sensitiviteit van 73 procent en een specificiteit van 66 procent. De voorspellende waarde was niet genoeg om de ASQ op 24 maanden in de praktijk te gebruiken als screeningsinstrument voor hoogbegaafdheid. Hoogbegaafdheid op 48 maanden kon goed worden voorspeld met de SON30. Er werd een verschil gevonden in de scores op de SON30 tussen de groepen niet-hoogbegaafd en hoogbegaafd. De groep hoogbegaafd had hoger gescoord op de SON30 dan de groep niet-hoogbegaafd. De optimale sensitiviteit en de specificiteit waren redelijk hoog, respectievelijk 83 en 84 procent. De hypothese dat hoogbegaafdheid op 24 maanden voorspeld zou kunnen worden met de BSID en de ASQ is niet bevestigd. Ook de hypothese dat hoogbegaafde kinderen hoger zouden scoren op woordproductie gemeten met de Lexilijst op 18 en 24 maanden dan niet hoogbegaafde kinderen is niet bevestigd. Er was geen verschil in de scores op de Lexilijst op 18 en 24 maanden tussen de groepen hoogbegaafd en niet-hoogbegaafd. Exploratief werd de voorspelbaarheid van begaafdheid (SON IQ op 48m ≥120) onderzocht. Begaafdheid kon worden voorspeld met de BSID12. Er werd een verschil gevonden in de scores op de BSID12 tussen de groepen niet-begaafd en begaafd. De groep begaafd had hoger gescoord dan de groep niet-begaafd. De voorspellende waarde van de BSID12 voor begaafdheid was matig, de sensitiviteit was 68 procent en de specificiteit 71 procent. De totaalscores van de ASQ en de CSBS konden begaafdheid niet voorspellen.
Masterthese Sabine Westra
37
Begaafdheid kon wel worden voorspeld met de SON30. De groep begaafd had significant hoger gescoord op de SON30 dan de groep niet-begaafd. De voorspellende waarde was redelijk, de optimale sensitiviteit was 72 procent en de specificiteit 89 procent. Op basis van eerder onderzoek (Gottfried et al., 2006; Colombo et al., 2009) werd verwacht dat hoogbegaafde kinderen op 24 maanden hoger zouden scoren op de MOI van de BSID-II-NL. Dit werd in dit onderzoek niet gevonden. Mogelijk kan dit verklaard worden doordat hoogbegaafdheid in dit onderzoek is gemeten met een nonverbaal intelligentietest (SON-R), en niet met een verbale intelligentietest. In het onderzoek van Colombo et al. (2009) scoorden hoogbegaafde kinderen wel hoger op de BSID24 dan niet-hoogbegaafde kinderen. In dat onderzoek was de Standford-Binet 4 (SB) afgenomen om hoogbegaafdheid vast te stellen. In het onderzoek van Colombo et al. (2009) scoorden hoogbegaafde kinderen ook hoger op woordproductie dan niet-hoogbegaafde kinderen. Verwacht werd dan ook dat hoogbegaafde kinderen hoger zouden scoren op woordproductie op 18 en 24 maanden. Dit werd niet gevonden in dit onderzoek. Ook het niet gevonden verschil in woordproductie zou verklaard kunnen worden doordat hoogbegaafdheid in dit onderzoek is gemeten met de SON-R en niet met een verbale intelligentietest. Het lijkt echter onwaarschijnlijk dat de groep hoogbegaafde kinderen in dit onderzoek hoger zouden scoren op woordproductie wanneer hoogbegaafdheid was vastgesteld aan de hand van een verbale intelligentietest, omdat woordproductie op 18 en 24 maanden niet significant correleerde met de talige tests: PPVT48, ZB1 en ZB2. Een andere verklaring voor het feit dat hoogbegaafdheid niet op jonge leeftijd te voorspellen was, is dat de populatie te homogeen was om hoogbegaafdheid op jonge leeftijd te signaleren. Bijna alle kinderen hadden hoogopgeleide ouders en kwamen uit een hoger sociaaleconomisch milieu. De gemiddelde score op de SON48 was dan ook hoog. Hoogbegaafdheid is waarschijnlijk beter te voorspellen wanneer de onderzoekspopulatie wat betreft intelligentie van de proefpersonen een betere afspiegeling van de samenleving is. De scores van hoogbegaafde kinderen zouden dan vergeleken kunnen worden met de scores van kinderen met een gemiddelde of een ondergemiddelde intelligentie, en niet alleen met scores van kinderen met een bovengemiddelde intelligentie. Op dit moment lijkt hoogbegaafdheid tot en met twee jaar nog niet goed te voorspellen met een ontwikkelingstest als de BSID-II-NL. Ook de Nederlandse vertaling van de ASQ is niet in staat hoogbegaafdheid op 48 maanden te voorspellen. Hoogbegaafdheid en begaafdheid konden wel voorspeld worden op 30 maanden. Er zijn twee factoren die bijgedragen hebben aan de hogere voorspelbaarheid op 30 maanden dan op de andere meetmomenten. Ten eerste was de tijd tussen het moment waarop hoogbegaafdheid gemeten werd het kleinst voor de test op 30 maanden (18 maanden). Ten tweede was dat de test op 30 maanden met hetzelfde instrument gemeten als de meting waarop hoogbegaafdheid vastgesteld was (SON-R).
Masterthese Sabine Westra
38
Het lijkt er dus op dat het cognitieve niveau van kleuters op 48 maanden kan worden voorspeld op 30 maanden. Dit is nuttige informatie voor de praktijk. Als ouders hun kind vanaf 30 maanden kunnen laten testen op hoogbegaafdheid, dan kunnen zij rekening houden met bijvoorbeeld de schoolkeuze voor hun kind. Dit zou problemen, zoals onderpresteren, kunnen voorkomen.
4.3 Voorspellen van taalbegrip De PPVT48 correleerde significant met de ASQ18, de ASQ24 en met de BSID24. De PPVT48 correleerde niet significant met de BSID12 en de ASQ12. Er was hier echter wel een trend te zien, mogelijk waren deze resultaten wel significant wanneer er meer proefpersonen waren geweest. De ASQ18 was van de tests op 18 maanden de beste voorspeller voor de PPVT48, maar de verklaarde variantie was slechts 10 procent. Uit de regressieanalyse met de ASQ24 en de BSID24 als voorspellende variabelen volgde een verklaringsmodel met enkel de BSID24. De verklaarde variantie was 24 procent. De verwachting dat de voorspellende waarde van de BSID en de ASQ voor woordbegrip gemeten met de PPVT-III-NL, zou toenemen met leeftijd is uitgekomen. Zoals verwacht kon de PPVT48 ook voorspeld worden met de PPVT30, maar de verklaarde variantie was laag, 13 procent. De TAK subtests ZB1 en ZB2 op 48 maanden correleerden significant met de BSID op 12 en 18 maanden. ZB2 correleerde ook significant met de totaalscores op de CSBS12 en de BSID24. Uit de regressieanalyses met voorspellers op 12 en 18 maanden volgden verklaringsmodellen met de BSID voor zowel ZB1 als ZB2. De verklaarde variantie van de BSID12 was respectievelijk 15 en 19 procent voor ZB1 en ZB2. Van de BSID18 was deze 21 en 25 procent voor ZB1 en ZB2. Uit de regressieanalyse met voorspellers op 24 maanden volgde voor ZB1 geen model, voor ZB2 volgde een model met alleen de BSID24. Wanneer de ASQ24 niet meegenomen werd in de regressieanalyse voor ZB2, werden twee proefpersonen meer in de analyse meegenomen (van N=19 naar N=21). Hieruit volgde de Lexilijst als beste voorspeller. Geconcludeerd kan worden dat er te weinig proefpersonen waren om uitspraken te doen over welke test de beste voorspeller is voor ZB2 van de TAK. Zowel de BSID24 als de Lexilijst24 correleerden ongeveer even hoog met ZB2, de verklaarde variantie lag tussen 21 en 27 procent. De SON30 correleerde significant met ZB1 en ZB2, respectievelijk .42 en .79. Vooral de correlatie tussen de SON30 en ZB2 was erg hoog. Het lijkt erop dat ZB2 hetzelfde construct heeft gemeten als de SON30. De SON48 en ZB2 correleerden echter niet significant met elkaar. Er lijkt een construct te zijn gemeten bij de SON30 dat niet meer gemeten werd bij de SON48. De SON beoogt nonverbale intelligentie te meten. Zinsbegrip 2 beoogt het begrip van relaties tussen woorden en woordgroepen in een zin te meten. Mogelijk wordt er bij de SON30 een vorm van begrip van relaties gemeten terwijl de meeste kinderen dit bij de SON48 al onder de knie hebben. De relatie tussen de SON30 en ZB2 van
Masterthese Sabine Westra
39
de TAK op 48 maanden zou een onderwerp kunnen zijn voor verder onderzoek naar de ontwikkeling van intelligentie en taalbegrip. De verwachting dat zinsbegrip op 48 maanden beter zou worden voorspeld naarmate de kinderen ouder waren, is niet helemaal uitgekomen. De correlaties tussen de scores op de BSID op 12, 18 en 24 maanden en ZB2 waren significant en ongeveer gelijk. Bij ZB1 gold dit ook voor de BSID op 12 en 18 maanden. De correlatie tussen ZB1 en de BSID op 24 maanden was lager en niet significant. De vragenlijsten ASQ, de CSBS DP en de Lexilijst waren geen goede voorspellers voor zinsbegrip. De SON30 correleerde significant met ZB1 en ZB2. De correlatie van de SON30 was vooral met ZB2 hoog.
4.4 Voorspellen van getalbegrip De vaardigheidsscores op de UGT48 correleerden met de BSID op 12 en 24 maanden. De ASQ24 correleerde niet significant met de UGT48, maar droeg wel negatief bij aan het regressiemodel in combinatie met de BSID24. Na regressieanalyse met de BSID24 en de totaalscores op de losse subtests van de ASQ24 volgde een model met de BSID24 en de subtest communicatie van de ASQ (negatieve toevoeging aan het model). Mogelijk heeft de ASQ24 een corrigerend effect op de BSID24 waarbij talige componenten uit de BSID24 gefilterd worden. De hypothese, getalbegrip wordt beter voorspeld naarmate de kinderen ouder worden, is niet volledig bevestigd. Getalbegrip kon voorspeld worden op 12 en op 24 maanden met de BSID, maar niet op 18 maanden. Op 12 maanden kon 17 procent van de variantie op de UGT48 verklaard worden door de BSID12. Op 24 maanden werd 40% verklaard door de BSID24 en de subtest communicatie van de ASQ24. Zonder ASQ verklaarde de BSID24 15 procent van de variantie. Op 30 maanden kon 19% van de variantie verklaard worden door de totaal-IQ scores op de SON-R.
4.5 Voorspellende waarde van de BSID-II-NL Zoals verwacht werden er geen hoge correlaties gevonden tussen de BSID en de SON-R omdat verschillende constructen gemeten werden bij de verschillende tests. Met de BSID kan de hoogte van de intelligentie niet vastgesteld worden. Er kan alleen gezegd worden of een kind voor- of achterloopt in de ontwikkeling (van der Meulen et al., 2002). Bij de mentale ontwikkelingsindex van de BSID-II-NL wordt namelijk, ondanks dat er geprobeerd wordt meer mentale aspecten te meten dan bij de motorische ontwikkelingsindex (van der Meulen et al., 2002), ook een aanzienlijke motorische en sensorische component gemeten. Veel items zijn namelijk afhankelijk van de motorische en sensorische vaardigheid van het kind (Ruiter, Lutje Spelberg, Van der Meulen & Nakken, 2008). Tot 24 maanden kunnen met de BSID cognitieve vaardigheden die nodig zijn voor een goede score op een intelligentietest zoals aandacht, informatieverwerking, discriminatie, geheugen en symbolische Masterthese Sabine Westra
40
representatie, niet goed worden gemeten (Rose, Feldman & Jankowski, 2009). Vanaf 24 maanden kunnen cognitieve vaardigheden beter worden gemeten, maar tot en met vier jaar wordt ook bij een intelligentie test als de SON-R voor een deel motorische en sensorische ontwikkeling gemeten (Baron & Leonberger, 2012). Dit zou de voorspelbaarheid van de SON48 vanuit de BSID24 juist beter moeten maken. Dit werd niet gevonden in deze studie, dus waarschijnlijk spelen er andere factoren mee in de lage voorspellende waarde van de BSID. Zoals eerder genoemd zouden de lage correlaties tussen de BSID-II-NL en de SON-R aan de SON-R kunnen liggen als meetinstrument. De SON-R is een nonverbale test en neemt daarom in de IQ-score geen verbale intelligentie mee. In de literatuur is gebruikgemaakt van meer talige tests op 3.5 en 4 jarige leeftijd (Stanford Binet en McCarthy SCA, in Bishop et al., 2003; Petril et al., 2004; Gottfried et al., 2009), mogelijk is het verschil met eerdere onderzoeken daaraan te wijten. De BSID op 12, 18 en 24 maanden correleerde hoger met de PPVT48 en ZB2, dan met de SON48. De BSID correleerde met toenemende leeftijd meer met de talige tests. Mogelijk komt dit door een toenemende mate van talige items in de BSID. Opvallend was dat de BSID24 niet correleerde met ZB1 en wel met de twee andere talige tests: ZB2 en de PPVT48. Bij ZB1 wordt de kennis van functiewoorden gemeten. Bij ZB2 worden zinspatronen gemeten, hieronder wordt het begrijpen en correct vormen van zinnen verstaan (Verhoeven & Vermeer, 2001). Mogelijk zijn kennis van de betekenis van functiewoorden en het begrijpen van zinspatronen twee verschillende onderdelen binnen het taalbegrip, waarvan de laatste beter voorspeld kan worden door de BSID24 en de SON30. Voor een breder beeld van het taalniveau van de kinderen had de hele TAK afgenomen moeten worden. Aangezien het grote aantal tests dat is afgenomen bij de kinderen op 48 maanden zou het voor de kinderen niet haalbaar zijn geweest om al deze tests geconcentreerd te maken. Een verklaring voor de lage voorspellende waarde van de BSID op 18 en 24 maanden zou de kwaliteit van afname kunnen zijn. De afnames zijn echter door een groot aantal verschillende personen gedaan, dus de kans op beïnvloeding door de testleider is uitgemiddeld. Een andere verklaring voor de lage voorspellende waarde van de BSID op 18 en 24 maanden zou de peuterpuberteit kunnen zijn. De peuterpuberteit is een periode waarin de frustratiedrempel lager ligt (Leung & Fagan, 1991). Hierdoor is de volgehouden aandacht korter en raakt het kind sneller gefrustreerd als het niet gaat zoals het kind wil (Potegal, Kosorok & Davidson, 2003). Het kind wil autonomie nastreven en wordt snel gefrustreerd of verzet zich tegen aansturing. Het kind biedt weerstand en laat ‘dwars’ gedrag zien bij aansturing (Potegal & Davidson, 2003; Lewis, 2005). Vaak gaat deze weerstand gepaard met agressie of driftbuien (Hay, Castle & Davies, 2000). In een testsituatie wordt verwacht dat kinderen stil zitten en laten zien wat ze kunnen, kinderen hebben daar lang niet altijd zin in en kunnen hierdoor gefrustreerd raken. Deze frustratie, en
Masterthese Sabine Westra
41
bijbehorende agressie, verschilt per kind, maar stijgt over het algemeen vanaf 18 maanden en neemt tussen 2 en 3 jaar weer af (Côté, Vaillancourt, LeBlanc, Nagin & Tremblay, 2006; Hay et al., 2000). Daarbij kan motivatie een vertekenend beeld geven van een test (Duckworth et al., 2011). Bij een lage motivatie scoort een kind lager dan op basis van zijn of haar cognitieve capaciteiten verwacht zou worden, en wordt er geen ontwikkelingsniveau gemeten, maar motivatie. Mogelijk was een gedeelte van de kinderen in het onderzoek door frustratie en lage motivatie minder goed te testen, en zijn de testresultaten hierdoor minder betrouwbaar geworden. Dit blijkt ook uit het onderzoek. In het overkoepelende onderzoek waar deze studie een onderdeel van is, is het gedrag van de kinderen bij de afname van de MOI van de BSID op 12, 18 en 24 maanden geobserveerd (scriptie Scholten, 2011). Frustratie tijdens de testafname bleken te stijgen bij 18 maanden en weer te dalen bij 24 maanden. Oppositioneel gedrag nam toe bij 18 maanden en bleef gelijk bij 24 maanden. Vanaf 18 maanden werd er ook een daling van gedragingen van plezier waargenomen. Vanaf 24 maanden werden er meer sociale gedragingen en meer positieve anticipatie waargenomen. Op basis van deze gegevens lijkt een deel van de scores op de BSID 18 en BSID24 minder betrouwbaar door interfererend testgedrag. Doordat het interfererend testgedrag gradueel was bij de kinderen en bij een deel van de kinderen een deel van de items minder betrouwbaar zijn, is niet het niet duidelijk hoe groot het percentage kinderen is waarvan de scores minder betrouwbaar zijn.
4.6 Voorspellende waarde van de vragenlijsten ASQ, CSBS DP en de Lexilijst In deze studie is aanzet gegeven tot validatie van de Nederlandse vertalingen van de ASQ en de CSBS. De interne consistentie van de ASQ was voor de meeste categorieën voldoende tot goed, dit ligt in lijn met de interne consistentie van de Amerikaanse versies (Bricker & Squires, 1999). Opvallend was dat op 18 maanden de subschaal persoonlijk-sociaal een lage interne consistentie had, hier zou nader onderzoek naar gedaan moeten worden. De interne consistentie van de CSBS was voor de meeste subtests onvoldoende, slechts op één subtest (de subtest gebaren) werd op 12 en 18 maanden voldoende gescoord. Dit zou te wijten kunnen zijn aan het kleine aantal items per subtest. Bij de Amerikaanse versie was betrouwbaarheid en validiteit wel voldoende (Wetherby et al., 2002). Verder onderzoek is nodig voordat er iets gezegd kan worden over de voorspellende waarde van de CSBS. De constructvaliditeit van de Nederlandse vertalingen van de ASQ en de CSBS lijkt goed te zijn. Voor zowel de ASQ als de CSBS werden significante correlaties gevonden met de BSID-II-NL op dezelfde leeftijd (p < .01). Voor de ASQ lag de validiteit tussen de .462 en de .693. Dit kwam overeen met eerder onderzoek naar de validiteit van de ASQ en de CSBS (Squires et al, 1999; Gollenberg et al., 2009). Voor de CSBS waren de correlaties met de BSID iets lager, .406 op 12 maanden en .527 op 18
Masterthese Sabine Westra
42
maanden. Waarschijnlijk kwam dit doordat de CSBS een vragenlijst is over de communicatieve vaardigheden van kinderen (Wetherby, Allen, Deary, Kublin en Goldstein, 2002; Eadie et al., 2010), terwijl de BSID het algemene mentale ontwikkelingsniveau meet. De constructvaliditeit is mogelijk hoger als het getoetst wordt met een bredere populatie kinderen. In de huidige studie waren kinderen met een gemiddelde tot ondergemiddelde intelligentie ondervertegenwoordigd. Nader onderzoek naar de validiteit van de Nederlandse vertalingen van de ASQ en de CSBS DP is nodig. Voor de ruwe totaalscores op de ASQ werd een effect van leeftijd gevonden. Op 18 maanden scoorden kinderen hoger dan op 12 maanden en op 24 maanden werd er hoger gescoord dan op 18 maanden. Er lijkt sprake te zijn van een plafondeffect. De meeste kinderen scoorden hoog zodat er geen goed onderscheid gemaakt kon worden tussen kinderen met een ontwikkelingsvoorsprong en kinderen zonder ontwikkelingsvoorsprong. De voorspelbare waarde voor hoogbegaafde kinderen werd daarmee gering. De ASQ is ontwikkeld om kinderen met een ontwikkelingsachterstand op te sporen (Bricker & Squires, 1999) en is het meest gevoelig bij lagere ontwikkelingsniveaus. De voorspellende waarde van de ASQ beperkte zich tot de PPVT48, de andere tests op 48 maanden konden niet voorspeld worden door de ASQ. Het verband tussen de ASQ en de PPVT48 is nog niet duidelijk. Mogelijk wordt bij de ASQ meer taligheid gemeten dan nonverbale intelligentie. De CSBS was voor geen van de tests op 48 maanden een goede voorspeller. Er werd alleen een correlatie gevonden tussen de CSBS12 en ZB2 van de TAK. Ook de Lexilijst was geen goede voorspeller voor de tests op 48 maanden. De CSBS en de Lexilijst meten vooral expressieve taal, terwijl de talige tests op 48 maanden meer taalbegrip meten. Wellicht zijn de lage correlaties daaraan te wijten. Daarnaast is ook de CSBS ontwikkeld om een achterstand te signaleren (Wetherby et al., 2002). Dus ook deze test is gevoeliger bij lagere ontwikkelingsniveaus. De ASQ, CSBS en Lexilijst zijn in huidige vorm niet geschikt om een hoge intelligentie te voorspellen.
4.7 Beperkingen van het onderzoek en suggesties vervolgonderzoek Een beperking in dit onderzoek was het opleidingsniveau van de ouders. De meeste ouders waren hoogopgeleid. Het IQ wordt zowel door genetische als opvoedingsfactoren beïnvloed (Hoekstra et al., 2007). Bij hoogopgeleide ouders werken beide factoren mee in het voordeel van de kinderen (Petrill et al., 2004). De steekproef was hierdoor een relatief homogene groep van kinderen die bijna allemaal gemiddeld, bovengemiddeld en hoog scoorden op de tests op 48 maanden. De resultaten uit deze studie zijn hierdoor lastiger te generaliseren naar de hele populatie Nederlandse kinderen. Daarnaast werden door de homogene groep ook de correlaties en de voorspelbaarheid verkleind. In vervolgonderzoek zou de werving actiever naar ouders met een gemiddelde of lage opleiding gericht moeten worden.
Masterthese Sabine Westra
43
Een andere beperking van deze studie is dat de intelligentiemeting is gedaan met een nonverbale intelligentietest, de SON-R. Andere onderzoeken naar de voorspelbaarheid en stabiliteit van intelligentie zijn wel met verbale tests gemeten (Bishop et al., 2003; Petril et al. 2004; Gottfried et al., 2009; Gottfried et al., 2006; Colombo et al., 2009). Hierdoor zijn de resultaten uit deze studie minder goed te vergelijken met de andere onderzoeken. Mogelijk waren er met een verbale intelligentietest andere kinderen in de groep hoogbegaafd terecht gekomen. Intelligentie is in deze studie op 48 maanden getest. Een nadeel hiervan is dat de intelligentie van de kinderen nog niet stabiel genoeg is om iets over de voorspelbaarheid van de ontwikkelingstest en de vragenlijsten op latere leeftijd te zeggen. Vanaf 7 jaar worden intelligentie scores stabieler (Sternberg et al., 2001; Hoekstra et al., 2007; Gottfried et al., 2009). Mogelijk zou bij de kinderen uit deze studie op 7 of 8 jaar een verbale intelligentietest zoals de WISC-III-NL afgenomen kunnen worden. Dan kan er meer gezegd kunnen worden over de voorspellende waarde van latere intelligentie. Wanneer de vragenlijsten ASQ en CSBS DP dan ook zouden zijn gevalideerd, zou de voorspellende waarde van deze vragenlijsten opnieuw onderzocht kunnen worden voor latere intelligentie. Een beperking van dit onderzoek was dat niet alle jonge kinderen even gemakkelijk te testen waren. Dit heeft mogelijk een aantal testresultaten onbetrouwbaar gemaakt. Temperament kan een testscore negatief beïnvloeden (Kagan & Snidman, 2004). Het ene kind voelt zich snel op zijn gemak en het andere kind heeft meer tijd nodig om te wennen aan de testsituatie. Dit hoeft echter niets te maken te hebben met cognitieve capaciteiten (Kagan & Snidman, 2004). Ook een lage motivatie kan een testscore negatief beïnvloeden (Duckworth et al., 2011). Mogelijk kunnen kinderen met een lage testbetrouwbaarheid herkend worden aan hun motivatie of temperament. De testleider zou dan wel extra zijn best moeten doen om het kind op zijn gemak te stellen en te motiveren. Dit lukt echter niet altijd met bepaalde kinderen. Ook andere factoren zoals gebeurtenissen die vooraf zijn gegaan aan het testen, frustratiedrempel, volgehouden aandacht, oppositioneel gedrag en angst hebben de resultaten negatief kunnen beïnvloeden. Een andere beperking aan dit onderzoek was het aantal proefpersonen. Omdat niet van alle kinderen alle data was verzameld, bleven er in sommige analyses weinig proefpersonen over. Mogelijk waren hierdoor sommige correlaties, bijvoorbeeld tussen de Lexilijst en de TAK subtest ZB2, niet significant. De ASQ en de CSBS DP zijn door hun focus op een ontwikkelingsachterstand minder geschikt voor het voorspellen van hoogbegaafde kinderen. Door het plafondeffect zijn hoogbegaafde kinderen niet van gemiddelde kinderen te onderscheiden. Omdat juist vanaf 30 maanden intelligentie te voorspellen lijkt, zou er in vervolgonderzoek ook de voorspellende waarde van vragenlijsten vanaf 30 maanden onderzocht kunnen worden. Het zou praktisch zijn als er een ontwikkelingsvragenlijst ontwikkeld wordt waarmee hoogbegaafdheid voorspeld kan worden. Consultatiebureaus zouden dan op 30
Masterthese Sabine Westra
44
maanden standaard een vragenlijst kunnen laten invullen door de ouders als screening van mogelijk hoogbegaafdheid.
4.8 Conclusie De resultaten uit dit onderzoek laten zien dat het ontwikkelingsniveau op 12 maanden volgens verwachting matig correleert met nonverbale intelligentie en met voorlopers in de schoolse vaardigheden taal en rekenen bij kinderen aan het begin van de basisschool (48 maanden). Ook konden hoogbegaafdheid en begaafdheid op 48 maanden, nog niet goed voorspeld worden op 12 maanden. Tegen de verwachtingen in bleek het ontwikkelingsniveau op 18 en 24 maanden niet hoger te correleren met de nonverbale intelligentie op 48 maanden dan het ontwikkelingsniveau op 12 maanden. Ook konden hoogbegaafdheid en begaafdheid niet goed worden voorspeld op 18 en 24 maanden. Een verklaring hiervoor zou kunnen zijn dat de kinderen in deze studie op 18 en 24 maanden in een ontwikkelingsfase zaten waarbij zij moeilijker te testen zijn (peuterpuberteit). Een andere verklaring voor de tegenvallende voorspelbaarheid van de SON48 is dat de BSID met toenemende leeftijd meer taligheid lijkt te meten terwijl de SON een nonverbale intelligentie test is. De vragenlijsten ASQ en de CSBS waren niet van voorspellende waarde voor intelligentie, hoogbegaafdheid en getalbegrip. Een verklaring hiervoor is de focus op een ontwikkelingsachterstand bij de vragenlijsten en daarmee ongevoeligheid voor verschil in ontwikkelingsvoorsprong. Bij de ASQ leek er sprake te zijn van een plafondeffect. Toch correleerde de ASQ met woordbegrip. Verwacht werd dat de CSBS en de Lexilijst taalbegrip zouden kunnen voorspellen, maar dit bleek niet in deze studie. De CSBS en de Lexilijst meten vooral taalexpressie. Met taalexpressie wordt mogelijk een ander construct gemeten dan met woord- en zinsbegrip, welke op 48 maanden gemeten werden. Hoogbegaafdheid en begaafdheid konden met de gebruikte instrumenten niet goed voorspeld worden voor de leeftijd van 30 maanden. Het nonverbale IQ op 30 maanden was wel een goede voorspeller voor nonverbale intelligentie, hoogbegaafdheid en begaafdheid. Het nonverbale IQ op 30 maanden correleerde significant met zinsbegrip en getalbegrip op 48 maanden. Dit zou kunnen betekenen dat kinderen die hoog scoren op een intelligentietest op 30 maanden met een voorsprong op taal- en rekenvaardigheid aan de basisschool beginnen. Deze kinderen zouden dus baat kunnen hebben bij vroege signalering van hoogbegaafdheid zodat zij op een basisschool kunnen starten die aansluit op hun mogelijkheden. De resultaten uit dit onderzoek impliceren dat verder onderzoek naar de signalering van mogelijke hoogbegaafde kinderen zich vooral zou moeten richten op het ontwikkelingen van screeningsinstrumenten voor kinderen van af 30 maanden.
Masterthese Sabine Westra
45
Literatuurlijst: Baron, I. S., & Leonberger, K. A. (2012). Assessment of Intelligence in the Preschool Period. Neuropsychology Review, 22(4), 334-344. Bayley, N. (1993). Bayley Scales of Infant Development 2nd edition. San Antonio: The Psychological Corporation, Harcourt Brace. Bishop, E. G., Cherny, S. S., Corley, R., Plomin, R., DeFries, J. C., & Hewitt, J. K. (2003). Development genetic analysis of general cognitive ability from 1 to 12 years in a sample of adoptees, biological siblings, and twins. Intelligence, 31, 31-49. Blaga, O. M., Shaddy, D. J., Anderson, C. J., Kannass, K. N., Little, T. D., & Colombo, J. (2009). Structure and continuity of intellectual development in early childhood. Intelligence, 37(1), 106-113. Boxtel, van, H.W. & Mönks, F.J. (1992). General, social, and academic self-concepts of gifted adolescents. Journal of Youth and Adolescents, 21, 169-186. Bornstein, M. H., Hahn, C. H., Bell, C., Haynes, O. M., Slater, A., et al. (2006). Stability in cognition across early childhood. Psychological Science, 17(2), 151-158. Bricker, D., & Squires, J. (1999). The Ages & Stages Questionnaires: A parent-completed, child monitoring system, second edition. Baltimore, MD: Brooks Publishing. Colombo J., Shaddy D. J., Blaga O. M., Anderson C. J. & Kannass K. N. (2009). High cognitive ability in infancy and early childhood. In F. D. Horowitz, R. F. Subotnik, & D. J. Matthews (Eds). The development of giftedness and talent across the life span (pp. 23-42). Washington, DC, US: American Psychological Association. Côté, S., Vaillancourt, T., LeBlanc, J. C., Nagin, D. S., & Tremblay, R. E. (2006). The development of physical aggression from toddlerhood to pre-adolescence: A nationwide longitudinal study of Canadian children. Journal of Abnormal Child Psychology, 34(1), 68-82.
Masterthese Sabine Westra
46
Databank effectieve jeugdinterventies; Het Van Wiechen Onderzoek (VWO) (z.j.). Opgehaald 8 januari 2013, van: URL: http://tinyurl.com/vanwiechen. Deary, I. J., Strand, S., Smith, P., & Fermandes, C. (2007). Intelligence and educational achievement. Intelligence, 35, 13-21. Dickerson Mayes, S. & Calhoun, S.L. (2007). Wechsler Intelligence Scale for Children-Third and –Fourth Edition Predictors of Academic Achievement in Children With Attention-Deficit/ Hyperactivity Disorder. School Psychology Quarterly, 22(2), 234-249. Domsch, H., Lohaus, A., & Thomas, H. (2009). Prediction of childhood cognitive abilities from a set of early indicators of information processing capacities. Infant Behavior & Development, 32, 91-102. Duckworth, A. L., Quinn, P. D., Lynam, D. R., Loeber, R., & Stouthamer-Loeber, M. (2011). Role of test motivation in intelligence testing. Proceedings of the National Academy of Sciences, 108(19), 7716-7720. Eadie, P. A., Ukoumunne, O., Skeat, J., Prior, M. R., Bavin, E., Bretherton, L., & Reilly, S. (2010). Assessing early communication behaviours: structure and validity of the Communication and Symbolic Behaviour Scales—Developmental Profile (CSBS‐DP) in 12‐month‐old infants. International Journal of Language & Communication Disorders, 45(5), 572-585. Een school voor uw kind (2011). Opgehaald 15 juni 2013 van http://tinyurl.com/wachtlijst. Fagan J.F., Holland C.R., & Wheeler, K. (2007). The prediction from infancy of adult IQ and achievement. Intelligence, 35, 225-231. Field, A. (2005). Discovering statistics with SPSS. London, England: Sage, Last access: August, 27, 2012. Gerven van, E. (2002). Zicht op hoogbegaafdheid. Handboek voor leerkrachten in het basisonderwijs. Utrecht, The Netherlands: Lemma. Gerven van, E., & Drent, S. (2004). Attent op talent. Omgaan met hoogbegaafdheid in het
Masterthese Sabine Westra
47
basisonderwijs. Utrecht, The Netherlands: Lemma. Gollenberg, A. L., Lynch, C. D., Jackson, L. W., McGuinness, B. M, & Msall, M. E. (2009). Concurrent validity of the parent-completed ages and stages questionnaires, 2nd Ed. With the Bayley scales of infant development II in a low-risk sample. Child: Care, Health and Development, 36, 485-490. Gottfried, A.W., Gottfried, A. E., & Guerin, D. W. (2006). The Fullerton Longitudinal Study: a long-term investigation of intellectual and motivational giftedness. Journal for the Education of Gifted, 29, 430-450. Gottfried, A.W., Gottfried, A. E., & Guerin, D. W. (2009). Issues in early prediction and identification of intellectual giftedness. In F. D. Horowitz, R. F. Subotnik, & D. J. Matthews (Eds.), The Development of Giftedness and Talent Across the Lifespan. Washington: American Psychological Association. Hafkamp-de Groen, E., Dusseldorp, E., Boere-Boonekamp, M. M., Jacobusse, G. W., OudesluijsMurphy, A. M., & Verkerk, P. H. (2009). Relatie tussen het Van Wiechenonderzoek (D-score) op 2 jaar en het intelligentieniveau op 5 jaar. Tijdschrift voor Jeugdgezondheidszorg, 41(1), 10. Hay, D. F., Castle, J., & Davies, L. (2000). Toddlers' use of force against familiar peers: a precursor of serious aggression? Child Development, 71(2), 457-467. Hoekstra. R. A., Bartels, M. & Boomsma, D. I. (2007). Longitudinal genetic study of verbal and nonverbal IQ from early childhood to young adulthood. Learning and Individual Differences, 17, 97-114. Hoogeveen, L., & Van Hell, J. (2006). Self-concept of accelerated and non-accelerated students in their first, second and last year of secondary school in the Netherlands. Nijmegen, The Netherlands: Radboud University. Hoogeveen, L., van Hell, J. G., & Verhoeven, L. (2009). Self-concept and social status of accelerated and nonaccelerated students in the first 2 years of secondary school in the Netherlands. Gifted Child Quarterly, 53(1), 50-67.
Masterthese Sabine Westra
48
Houten-van den Bosch, E. J., Kuipers, J., & Peters, W. A. M. (2010). Hoogbegaafde kinderen. In Spraak, taal en leren (pp. 223-241). Houten: Bohn Stafleu van Loghum. Laurent de Angulo, M. S., Brouwers-de Jong, E. A., Bijlsma-Schlösser, J. F. M., Bulk-Bunschoten, A. M. W., Pauwels, J. H., & Steinbuch-Linstra, I. (2005). Ontwikkelings-onderzoek in de jeugdgezondheidszorg. Het Van Wiechenonderzoek - De Baecke Fassaert Motoriektest. Assen: Van Gorcum. Leung, A. K., & Fagan, J. E. (1991). Temper tantrums. American Family Physician, 44(2), 559-563. Lewis, M. D. (2005). Bridging emotion theory and neurobiology through dynamic systems modeling. Behavioral and Brain Sciences, 28(2), 169-193. Long, M. (1992). The use of parent report measures to assess infant development. Pediatric Physical Therapy, 4(2), 74–77. McGrew, K. S., & Knopik, S. N. (1993). The relationship between the WJ-R Gf-Gc cognitive clusters and writing achievement across the life-span. School Psychology Review, 22(4), 687–695. Meulen, B.F. van der, Ruiter, S.A.J., Lutje Spelberg, H.C., & Smrkovsky, M. (2002). BSID-II- NL., Bayley Ontwikkelings Schalen 1-42 maanden. Lisse: Swets & Zeitlinger. Mooij, T., Hoogeveen, L., Driessen, G., Hell, J. V., & Verhoeven, L. (2007). Succescondities voor onderwijs aan hoogbegaafde leerlingen. Eindverslag van drie deelonderzoeken. Nijmegen: Radboud Universiteit, CBO/ITS. Morawska, A., Sanders, M.R. (2009). An evaluation of a behavioural parenting intervention for parents of gifted children. Behaiour Research and Therapy, 47, 463–70. Mutlu A., Kara O.K., Gunel M.K., Karahan S., & Livanelioglu A. (2011). Agreement between parents and clinicians for the motor functional classification systems of children with cerebral palsy. Disability and Rehabilitation, 33, 927–932. Naglieri, J. A., & Bornstein, B. T. (2003). Intelligence and achievement: Just how correlated are they? Masterthese Sabine Westra
49
Journal of Psychoeducational Assessment, 21(3), 244-260. Neihart, M. (2008). Identifying and providing services to twice exceptional children. In Handbook of Giftedness in Children (pp. 115-137). Springer US. Parker, D. R., & Benedict, K. B. (2002). Assessment and intervention: Promoting successful transitions for college students with ADHD. Assessment for Effective Intervention, 27(3), 3−24. Petrill, S. A., Lipton, P. A., Hewitt, J. K., Plomin, R., Cherny, S. S., Corley, R. et al. (2004). Genetic and environmental contributions to general cognitive ability through the first 16 years of life. Developmental Psychology, 40, 805-812. Potegal, M., & Davidson, R. J. (2003). Temper tantrums in young children: 1. Behavioral composition. Journal of Developmental & Behavioral Pediatrics, 24(3), 140. Potegal, M., Kosorok, M. R., & Davidson, R. J. (2003). Temper tantrums in young children: 2. Tantrum duration and temporal organization. Journal of Developmental & Behavioral Pediatrics, 24(3), 148-154. Ruiter, S. A., Spelberg, H. C. L., van der Meulen, B. F., & Nakken, H. (2008). The BSID-II-NL: construction, standardisation, and instrumental utility. Netherlands Journal of Psychology, 64(1), 15-40. Rydz, D., Shevell, M. I., Majnemer, A., & Oskoui, M. (2005). Topical review: developmental screening. Journal of Child Neurology, 20, 4-20. Saigal, S., Rosenbaum, P., Stoskopf, B., Hoult, L., Furlong, W., Feeny, D., & Hagan, R. (2005). Development, reliability and validity of a new measure of overall health for pre-school children. Quality of Life Research, 14(1), 243-252. Schwartz, W. (1999). Strategies for Identifying the Talents of Diverse Students. New York: Eric Clearinghouse. Schlichting, L. (2005). Peabody Picture Vocabulary Test-III-NL. Handleiding. Amsterdam: Harcourt Test Publishers.
Masterthese Sabine Westra
50
Schlichting, J.E.P.T. & lutje Spelbroek, H.C. (2002). Lexilijst Nederlands, een instrument om de taalontwikkeling te onderzoeken bij Nederlandstalige kinderen van 15-27 maanden in het kader van vroegtijdige onderkenning. Lisse: Swets Test Publishers. Sices, L., Stancin, T., Kirchner, L., & Bauchner, H. (2009). PEDS and ASQ development screening test may not identify the same children. Pediatrics, 124(4), 640-647. Siegel, L.S. (2003). IQ-Discrepancy Definitions and the Diagnosis of LD: Introduction to the Special Issue. Journal of Learning Disabilities, 36(1), 2-3. Skellern, C. Y., Rogers, Y., & O'Callaghan, M. J. (2001). A parent‐completed developmental questionnaire: Follow up of ex‐premature infants. Journal of Paediatrics and Child Health, 37(2), 125-129. Squires, J., Bricker, D., & Potter, L. (1997). Revision of a parent-completed developmental screening tool: ages and stages questionnaires. Journal of Pediatric Psychology, 22, 313328. Squires, J., Potter, L., Bricker, D., & Lamorey, S. (1998). Parent-completed developmental questionnaires: effectiveness with low and middle income parents. Early Childhood Research Quarterly, 13, 345-354. Sternberg, R. J., Grigorenko, E. L., & Bundy D. A. (2001). The predictive value of IQ. MerrillPalmer Quarterly, 47(1), 1-41. Thorndike, R. L., Hagen, E. P., & Sattler, J. M. (1986). The Stanford-Binet intelligence scale: Fourth edition. Chicago: Riverside Publishing Company. Verhoeven, L., & Vermeer, A. (2001). Taaltoets Alle Kinderen, Handleiding. Citogroep. Arnhem. Verhoeven, L., & Vermeer, A. (2006). Verantwoording Taaltoets Alle Kinderen (TAK). Cito. Arnhem. Wechsler, D. (1991). WISC-III: Wechsler Intelligence Scale for Children. San Antonio, TX: Psychological Corporation. Masterthese Sabine Westra
51
Wetherby, A. M., Goldstein, H., Cleary, J., Allen, L., & Kublin, K. (2003). Early identification of children with communication disorders: Concurrent and predictive validity of the CSBS Developmental Profile. Infants & Young Children, 16(2), 161-174. Wetherby, A. M., Allen, L., Deary, J., Kublin, K., & Goldstein, H. (2002). Validity and reliability of the Communication and Symbolic Behavior Scales Developmental Profile with very young children. Journal of Speech, Language, and Hearing Research, 45, 1202-1218. Wetherby, A.M. & Prizant, B.M. (2002). CSBS DP Infant-Toddler Checklist and Easy-Score User’s Guide. Baltimore: Paul H. Brookes Publishing Co. Winkel, M., & Tellegen, P. J. (2001). Intelligentietests voor jonge kinderen: de SON-R 2½-7 en andere intelligentietests. Kind en Adolescent, 22(3), 93-99. Masterthese van medestudent: Scholten, L. (2011). Terrible two’s. Onderzoek naar kwalitatieve verschillen in temperament en ontwikkeling van het temperament van kinderen met Downsyndroom in vergelijking met normaal ontwikkelende kinderen. Programmagroep Ontwikkelingspsychologie, Universiteit van Amsterdam.
Masterthese Sabine Westra
52
Bijlage 1. Tabellen Tabel 11. Verschillen tussen jongens en meisjes per test geanalyseerd met independent samples t-tests. t SON48 PPVT48 UGT48 TAK48 ZB1 TAK48 ZB2 SON30 PPVT30 BSID12 BSID18 BSID24 ASQ12 ASQ18 ASQ24 CSBS12 CSBS18 Lexilijst18 Lexilijst24
DF
Sig.
1.245
49
.219
-.069
50
.946
-.812
43
.421
.389
43
.699
-1.171
37
.249
1.505
43
.140
.848
39
.402
1.344
50
.185
.237
46
.814
1.212
41
.233
.506
52
.615
1.114
44
.271
1.371
41
.178
.779
51
.440
1.728
32.370
.093
-.909
22.444
.373
1.001
33
.324
Tabel 12. Verschil in opleiding van ouders tussen de groepen niet-hoogbegaafd en hoogbegaafd. t df sig Moeder -.305 49 .762 vader .608 49 .546 Tabel 13. Verschil in opleiding van ouders tussen de groepen niet-begaafd en begaafd. t df sig Moeder 1.066 49 .292 vader .935 49 .354 Tabel 14. Verschil in leeftijd van ouders tussen de groepen niet-hoogbegaafd en hoogbegaafd. t df sig Moeder -1.491 43 .143 vader -1.346 41 .262 Tabel 15. Correlaties tussen de SON 48 en variabelen gemeten tussen 12 en 30 maanden. BSID-II-NL 12 m ASQ 12 m CSBS DP 12 m
Pearson correlatie .359* .187 .125
Masterthese Sabine Westra
sig .011 .199 .393
N 49 49 49 53
BSID-II-NL 18 m ASQ 18 m CSBS DP 18 m BSID-II-NL 24 m ASQ 24 m SON-R 30 msp
.105 .289 .297 .201 .236 .629**
.532 .079 .070 .269 .193 .000
38 38 38 32 32 43
*. Correlatie is significant bij p < .05 (2-tzijdig). **. Correlatie is significant bij p< .01 (2-zijdig). p ˢ SON-R 30 m is berekend met Spearman’s Rho.
Tabel 16. Correlaties tussen PPVT 48, ZB1 en ZB2 en variabelen gemeten tussen 12 en 24 maanden. PPVT 48 m Pearson sig BSID12 ASQ12 CSBS12 BSID18 ASQ 18 CSBS18 Lexilijst18 sp BSID24 ASQ24 Lexilijst 24 SON30 PPVT30
.278 .270 .200 .321 .362 .308 .187 .492 .490 .220 .218 .362*
.051 .058 .163 .074 .042* .087 .306 .011 .011 .281 .215 .035
ZB1 N
ZB2
Spearman’s Rho
50 50 50 32 32 32 32 26 26 26 34 34
.328* .146 .155 .431* -.111 .004 -.074 .152 .039 -.003 .415* .183
sig .032 .349 .321 .505* .574 .984 .709 .490 .858 .988 .025 .341
N 43 43 43 28 28 28 28 23 23 23 29 29
Spearman’s Rho sig .426** .263 .356* .505* .033 .138 .133 .469* -.024 .425 .786*** .257
.009 .115 .031 .014 .882 .530 .545 .043 .923 .070 .000 .236
N 37 37 37 23 23 23 23 19 19 19 23 23
Sp
Lexilijst op 18 maanden is berekend met Spearmans Rho *. Correlatie is significant bij p < .05 (2-tzijdig). **. Correlatie is significant bij p< .01 (2-zijdig).
Tabel 17. Correlaties tussen vaardigheidsscore van de UGT-R op 48 maanden en variabelen gemeten tussen 12 en 30 maanden.
BSID-II-NL 12 m ASQ 12 m BSID-II-NL 18 m ASQ 18 m BSID-II-NL 24 m ASQ 24 m SON-R 30 msp
Pearson correlatie .414** .135 .157 164 .391* -.096 .433***
sig .006 .387 .384 .361 .033 .614 .008
N 43 43 33 33 30 30 36
*. Correlatie is significant bij p < .05 (2-zijdig). **. Correlatie is significant bij p < .01 (2-zijdig).
Masterthese Sabine Westra
54
Bijlage 2. Criteriumwaarden en coördinaten van de ROC-curves ROC curve ASQ24 hoogbegaafd Variable Classification variable Sample size Positive group : Negative group :
ASQ24 hoogbegaafd 40 11 29
hoogbegaafd = 1 hoogbegaafd = 0
Disease prevalence (%)
unknown
Area under the ROC curve (AUC) Area under the ROC curve (AUC) a Standard Error b 95% Confidence interval z statistic Significance level P (Area=0.5) a b
0,694357 0,0910 0,528781 to 0,829877 2,137 0,0326
DeLong et al., 1988 Binomial exact
Youden index Youden index J Associated criterion
0,3824 >255
Criterion values and coordinates of the ROC curve Criterion ≥180 >225 >230 >240 >245 >250 >255 >260 >265 >270 >280 >285 >290 >295
Sensitivity 100,00 100,00 90,91 90,91 81,82 72,73 72,73 63,64 45,45 36,36 36,36 18,18 9,09 0,00
95% CI 71,5 - 100,0 71,5 - 100,0 58,7 - 99,8 58,7 - 99,8 48,2 - 97,7 39,0 - 94,0 39,0 - 94,0 30,8 - 89,1 16,7 - 76,6 10,9 - 69,2 10,9 - 69,2 2,3 - 51,8 0,2 - 41,3 0,0 - 28,5
Masterthese Sabine Westra
Specificity 0,00 17,24 24,14 37,93 48,28 55,17 65,52 65,52 68,97 79,31 89,66 89,66 100,00 100,00
95% CI 0,0 - 11,9 5,8 - 35,8 10,3 - 43,5 20,7 - 57,7 29,4 - 67,5 35,7 - 73,6 45,7 - 82,1 45,7 - 82,1 49,2 - 84,7 60,3 - 92,0 72,6 - 97,8 72,6 - 97,8 88,1 - 100,0 88,1 - 100,0
+LR 1,00 1,21 1,20 1,46 1,58 1,62 2,11 1,85 1,46 1,76 3,52 1,76
-LR 0,00 0,38 0,24 0,38 0,49 0,42 0,56 0,79 0,80 0,71 0,91 0,91 1,00
55
ROC curve SON30 hoogbegaafd Variable Classification variable Sample size Positive group : Negative group :
Son_30_norm Son 30 norm hoogbegaafd
hoogbegaafd = 1 hoogbegaafd = 0
Disease prevalence (%)
43 12 31
unknown
Area under the ROC curve (AUC) Area under the ROC curve (AUC) a Standard Error b 95% Confidence interval z statistic Significance level P (Area=0.5) a b
0,803763 0,0780 0,654345 to 0,908922 3,897 0,0001
DeLong et al., 1988 Binomial exact
Youden index Youden index J Associated criterion
0,6720 >123
Criterion values and coordinates of the ROC curve Criterion ≥99 >105 >106 >117 >118 >123 >130 >133 >135 >138 >139 >143 >147 >150
Sensitivity 100,00 100,00 91,67 91,67 83,33 83,33 50,00 41,67 33,33 25,00 16,67 16,67 0,00 0,00
95% CI 73,5 - 100,0 73,5 - 100,0 61,5 - 99,8 61,5 - 99,8 51,6 - 97,9 51,6 - 97,9 21,1 - 78,9 15,2 - 72,3 9,9 - 65,1 5,5 - 57,2 2,1 - 48,4 2,1 - 48,4 0,0 - 26,5 0,0 - 26,5
Masterthese Sabine Westra
Specificity 0,00 19,35 19,35 70,97 70,97 83,87 83,87 87,10 87,10 90,32 90,32 93,55 93,55 100,00
95% CI 0,0 - 11,2 7,5 - 37,5 7,5 - 37,5 52,0 - 85,8 52,0 - 85,8 66,3 - 94,5 66,3 - 94,5 70,2 - 96,4 70,2 - 96,4 74,2 - 98,0 74,2 - 98,0 78,6 - 99,2 78,6 - 99,2 88,8 - 100,0
+LR 1,00 1,24 1,14 3,16 2,87 5,17 3,10 3,23 2,58 2,58 1,72 2,58 0,00
-LR 0,00 0,43 0,12 0,23 0,20 0,60 0,67 0,77 0,83 0,92 0,89 1,07 1,00
56
ROC curve BSID12 begaafd Variable Classification variable Sample size Positive group : Negative group :
BSID_12m BSID 12m Begaafd 49 28 21
Begaafd = 1 Begaafd = 0
Disease prevalence (%)
unknown
Area under the ROC curve (AUC) Area under the ROC curve (AUC) a Standard Error b 95% Confidence interval z statistic Significance level P (Area=0.5) a b
0,712585 0,0798 0,565566 to 0,832780 2,665 0,0077
DeLong et al., 1988 Binomial exact
Youden index Youden index J Associated criterion
0,4167 >94
Criterion values and coordinates of the ROC curve Criterion ≥80 >80 >87 >88 >89 >94 >95 >96 >97 >98 >100 >102 >103 >104 >105 >110 >112 >113 >116 >117 >123
Sensitivity 100,00 96,43 96,43 92,86 89,29 89,29 75,00 75,00 71,43 67,86 67,86 57,14 50,00 50,00 42,86 14,29 14,29 10,71 7,14 0,00 0,00
95% CI 87,7 - 100,0 81,7 - 99,9 81,7 - 99,9 76,5 - 99,1 71,8 - 97,7 71,8 - 97,7 55,1 - 89,3 55,1 - 89,3 51,3 - 86,8 47,6 - 84,1 47,6 - 84,1 37,2 - 75,5 30,6 - 69,4 30,6 - 69,4 24,5 - 62,8 4,0 - 32,7 4,0 - 32,7 2,3 - 28,2 0,9 - 23,5 0,0 - 12,3 0,0 - 12,3
Masterthese Sabine Westra
Specificity 0,00 4,76 33,33 33,33 42,86 52,38 52,38 57,14 61,90 66,67 71,43 71,43 76,19 80,95 85,71 85,71 90,48 90,48 95,24 95,24 100,00
95% CI 0,0 - 16,1 0,1 - 23,8 14,6 - 57,0 14,6 - 57,0 21,8 - 66,0 29,8 - 74,3 29,8 - 74,3 34,0 - 78,2 38,4 - 81,9 43,0 - 85,4 47,8 - 88,7 47,8 - 88,7 52,8 - 91,8 58,1 - 94,6 63,7 - 97,0 63,7 - 97,0 69,6 - 98,8 69,6 - 98,8 76,2 - 99,9 76,2 - 99,9 83,9 - 100,0
+LR 1,00 1,01 1,45 1,39 1,56 1,88 1,58 1,75 1,88 2,04 2,38 2,00 2,10 2,62 3,00 1,00 1,50 1,12 1,50 0,00
-LR 0,75 0,11 0,21 0,25 0,20 0,48 0,44 0,46 0,48 0,45 0,60 0,66 0,62 0,67 1,00 0,95 0,99 0,98 1,05 1,00
57
ROC curve SON30 begaafd Variable Classification variable Sample size Positive group : Negative group :
Son_30_norm Son 30 norm Begaafd 43 25 18
Begaafd = 1 Begaafd = 0
Disease prevalence (%)
unknown
Area under the ROC curve (AUC) Area under the ROC curve (AUC) a Standard Error b 95% Confidence interval z statistic Significance level P (Area=0.5) a
DeLong et al., 1988
b
Binomial exact
0,824444 0,0675 0,678089 to 0,923331 4,807 <0,0001
Youden index Youden index J Associated criterion
0,6089 >117
Criterion values and coordinates of the ROC curve Criterion ≥99 >99 >100 >105 >106 >113 >114 >115 >116 >117 >119 >122 >130 >133 >150
Sensitivity 100,00 96,00 92,00 92,00 88,00 88,00 80,00 76,00 72,00 72,00 64,00 64,00 40,00 36,00 0,00
95% CI 86,3 - 100,0 79,6 - 99,9 74,0 - 99,0 74,0 - 99,0 68,8 - 97,5 68,8 - 97,5 59,3 - 93,2 54,9 - 90,6 50,6 - 87,9 50,6 - 87,9 42,5 - 82,0 42,5 - 82,0 21,1 - 61,3 18,0 - 57,5 0,0 - 13,7
Masterthese Sabine Westra
Specificity 0,00 0,00 5,56 22,22 22,22 66,67 72,22 77,78 83,33 88,89 88,89 94,44 94,44 100,00 100,00
95% CI 0,0 - 18,5 0,0 - 18,5 0,1 - 27,3 6,4 - 47,6 6,4 - 47,6 41,0 - 86,7 46,5 - 90,3 52,4 - 93,6 58,6 - 96,4 65,3 - 98,6 65,3 - 98,6 72,7 - 99,9 72,7 - 99,9 81,5 - 100,0 81,5 - 100,0
+LR 1,00 0,96 0,97 1,18 1,13 2,64 2,88 3,42 4,32 6,48 5,76 11,52 7,20
-LR
1,44 0,36 0,54 0,18 0,28 0,31 0,34 0,32 0,41 0,38 0,64 0,64 1,00
58