De productieve woordenschat van jonge Nederlandstalige kinderen Linda Horsels & Gerard Bol
Abstract The productive vocabulary of young typically developing Dutch children aged 1;08 to 3;04 has been investigated. In the lexicon of the children nine categories of word types and tokens are examined. For types, a noun bias can be reported in children up to 2;01 years of age. About one third of the lexicon consists of nouns. The number of verbs and function words increases with age. The number of onomatopoeic words decreases. Personal-social words decrease only in types, not in tokens.
•
1 Inleiding De meeste kinderen met een normale taalontwikkeling produceren hun eerste woorden rond de eerste verjaardag. Geleidelijk breidt de productieve woordenschat zich verder uit tot ongeveer 1000 woorden op driejarige leeftijd en 3000 woorden op vijfjarige leeftijd (Aitchison 1994). Over de samenstelling van de productieve woordenschat bij jonge kinderen bestaat geen overeenstemming. Sommige onderzoekers spreken van een noun-bias, die veronderstelt dat het aantal nomina overheerst binnen de vroege productieve woordenschat (onder andere Gentner 1982 en Au, Dapretto & Song 1994). Anderen, zoals Choi & Gopnik (1995) of Tardif (1996), hebben hiervoor geen bewijs gevonden. In de onderhavige studie wordt de samenstelling en de ontwikkeling van de productieve woordenschat bij jonge Nederlandstalige kinderen onderzocht.
•
2 De opbouw van het lexicon Longitudinale data aangaande de samenstelling van de productieve woordenschat geven inzicht in de ontwikkeling van het lexicon (Salerni, Assanelli, D’Odorico & Rossi 2007). Goorhuis en Schaerlaekens (2003) rapporteren dat kinderen in de eerste fase van de taalverwerving vooral inhoudswoorden produceren, waarbij nomina iets frequenter zijn dan verba. Deze woorden hebben betrekking op de eigen belevingswereld binnen het hier-ennu, zoals papa, slapen of groot. Nelson (1973) maakt een onderscheid tussen kinderen die een referentiële stijl hanteren en kinderen met een expressieve stijl. Kinderen met een 56 56
Nederlandse Taalkunde, jaargang 17, 2012-1
De productieve woordenschat van jonge Nederlandstalige kinderen
referentiële stijl hebben vooral objectnamen in de productieve woordenschat van de eerste vijftig woorden, terwijl kinderen met een expressieve stijl hoofdzakelijk persoonlijk-sociale woorden zoals hallo, bah, auw en andere niet naar objecten verwijzende termen gebruiken. Functiewoorden, zoals lidwoorden, voorzetsels, voornaamwoorden en voegwoorden zijn volgens Goorhuis en Schaerlaekens nagenoeg afwezig. Tussen de 2;06 en 5;0 jaar zouden laatstgenoemde woordsoorten, evenals telwoorden, geproduceerd worden. Het gebruik van bijwoorden en adjectieven neemt tussen de 3;0 en 5;0 jaar sterk toe, als teken dat het kind zich oriënteert op de wereld om zich heen en deze beoordeelt. Nomina vormen dan niet langer de grootste categorie. Kauschke en Hofmeister (2002) hebben de samenstelling van de productieve woordenschat onderzocht bij een groep Duitse kinderen in de leeftijd van 1;01 tot 3;0 jaar. Zij concluderen dat er sprake is van een dynamisch proces: de jongste kinderen gebruiken vooral relationele woorden, persoonlijk-sociale woorden en enkele onomatopeïsche termen. Op oudere leeftijd gebruiken kinderen daarnaast nomina, verba, functiewoorden en andere categorieën. De samenstelling van de productieve woordenschat van 3-jarigen is meer uitgebalanceerd, in die zin dat geen enkele categorie groter is dan 25% (zie tabel 1 voor de verschillende woordcategorieën).
•
3 De noun-biashypothese Kauschke en Hofmeister (2002) rapporteren niet alleen over de samenstelling van de productieve woordenschat bij een groep Duitse kinderen, maar zij hebben eveneens de noun-biashypothese getoetst. Zij noemen vier visies op de noun-biashypothese. In de eerste plaats zou de categorie ‘nomina’ de eerste woordklasse zijn die kinderen produceren (vergelijk onder andere Gentner 1982 en Bassano 2000). Ten tweede zou deze woordklasse het grootste onderdeel vormen van de productieve woordenschat bij jonge kinderen (zie Nelson, Hampson & Shaw 1993, Pine, Lieven & Rowland 1997). Ten derde bestaan de nomina in de vroege woordenschat hoofdzakelijk uit labels voor kleine en concrete objecten (Gentner 1982 en Nelson et al. 1993). Ten vierde zou de voorkeur voor nomina de linguïstische vermogens op latere leeftijd weerspiegelen (onder andere Bates, Bretherton & Snyder 1988, Pine et al. 1997). Op basis van spontane-taalanalyses van groepen kinderen van 1;01, 1;03, 1;09 en 3;0 jaar oud concluderen Kauschke en Hofmeister dat alleen het eerste aspect van de noun-biashypothese opgaat voor het Duits, namelijk dat nomina eerder worden verworven dan verba. Relationele woorden en persoonlijk-sociale woorden overheersen bij de jongste kinderen, hetgeen niet overeenkomt met de tweede visie van de noun-biashypothese, namelijk dat nomina het meest frequent zouden zijn binnen de productieve woordenschat van jonge kinderen. Nelson et al. (1993) hebben echter gevonden dat de woordklasse van nomina verreweg het grootst is bij jonge kinderen. Zij concluderen dat nomina voor 38% deel uit maken van de woorden die kinderen op de leeftijd van 1;08 jaar gebruiken. Een vergelijkbaar aantal (ongeveer 30%) is gevonden door Bloom, Tinker en Margulis (1993) bij een longitudinaal onderzoek waarbij de spontane taal van kinderen is bekeken die hun eerste woorden produceren of al een vocabulaire van 50 woorden hebben. Bornstein et al. (2004) hebben de woordenschat onderzocht van 269 kinderen in de leeftijd van 1;08 jaar die een Romaanse (Spaans, Frans of Italiaans), West-Germaanse 57
Linda Horsels & Gerard Bol
(Nederlands of Engels), Semitische (Hebreeuws) taal of het Koreaans als moedertaal hebben. Het onderzoek is uitgevoerd met behulp van een woordenschatchecklist die de moeders van de kinderen invullen. De onderzoekers hebben de kinderen in vier groepen verdeeld op basis van de omvang van de woordenschat. Zij concluderen dat in alle genoemde talen de kinderen meer nomina gebruiken dan andere woordklassen, zoals verba, vraagwoorden en voorzetsels. Alleen de groep kinderen met een vocabulaire tot 50 woorden laat geen verschil zien in de productie van het aantal nomina en verba. Uit het onderzoek blijkt dat de voorkeur voor nomina bij jonge kinderen een universeel verschijnsel is met uitzondering van de kinderen die zich in het vroegste stadium van taalproductie bevinden. Salerni et al. (2007) hebben bij een groep Italiaanse kinderen met een vocabulaire van 200 of 500 woorden, de verschillen tussen de proporties van woordklassen onderzocht. Zij hebben daarbij zowel een woordenschatchecklist gebruikt als een spontane-taalanalyse. Beide methoden laten zien dat de kinderen meer nomina gebruiken dan andere woordklassen. Zij concluderen daarom dat dit aanvullend bewijs vormt voor de hypothese dat kinderen een noun-bias vertonen in de vroege stadia van de taalverwerving. De noun-biashypothese is voor het Nederlands bevestigd door Verlinden en Gillis (1988). Deze onderzoekers geven twee verklaringen voor het overheersen van nomina in de vroege fase van de taalontwikkeling. In de eerste plaats komen nomina frequenter voor in het taalaanbod dan bijvoorbeeld hoofdwerkwoorden. Dit wordt bevestigd door onderzoeken van Au, Dapretto & Song (1994) en Gopnik & Choi (1995) voor het Koreaans. In de tweede plaats zijn de referenten van nomina vaak direct in de actuele situatie gegeven in tegenstelling tot de referenten van werkwoorden. Wanneer een kind bijvoorbeeld wordt gevraagd: ‘Wil je die jas eens pakken’ dan is de jas zichtbaar aanwezig, de activiteit van het pakken niet. Deze moet immers nog plaatsvinden. Tardif (1996), Tardif, Gelman & Xu (1999) en Choi & Gopnik (1995) vinden geen bewijs voor een noun-bias. Tardif (1996) analyseerde de spontane taal van kinderen die Mandarijn spreken. Uit deze analyse komt naar voren dat nomina niet de grootste woordklasse vormen. De auteur heeft verschillende definities van de term ‘nomen’ gehanteerd, maar de conclusie blijft in alle gevallen gelijk. Tardif et al. (1999) vergelijken de spontane taal van Engelstalige kinderen en kinderen die het Mandarijn spreken en gemiddeld 1;08 jaar oud zijn. De onderzoekers doen dit voor drie contexten, namelijk voorlezen, waarbij een context gecreëerd wordt waarin nomina bij het kind worden uitgelokt, het spelen met mechanisch speelgoed en niet-mechanisch speelgoed. Daarnaast hebben de moeders van de kinderen een woordenschatchecklist ingevuld en is genoteerd wat de eerste woorden van hun kind waren. Uit deze verschillende onderzoeksmethoden blijkt dat kinderen die het Mandarijn spreken minder nomina, maar meer verba produceren dan Engelstalige kinderen. De context is van invloed op de productie van nomina: deze worden frequenter geproduceerd tijdens de voorleesactiviteit. Salerni et al. (2007) wijzen op de diverse onderzoeksmethodes die gebruikt worden, omdat deze de verschillen van opvatting over de noun-biashypothese zouden kunnen verklaren. Zo zijn niet alleen spontane-taalanalyses, maar ook woordenschatchecklists en dagboekherinneringen gebruikt. De auteurs vinden een verschil van ongeveer 15% wanneer zij het aantal nomina op de woordenschatlijst vergelijken met het aantal nomina op de spontane-taalanalyse (respectievelijk meer dan 50% en tot 35%). Volgens Caselli et 58
De productieve woordenschat van jonge Nederlandstalige kinderen
al. (1995) is de analyse van de spontane taal niet geschikt om een noun-bias vast te stellen, omdat het gebruik van hoogfrequente woorden de verhoudingen tussen woordklassen beïnvloedt. Tardif (1996) noemt echter ook de voordelen van spontane-taalanalyses, namelijk dat deze een objectieve methode vormen. Daarnaast zijn onderzoekers dan niet afhankelijk van herinneringen van de personen die woordenschatchecklists invullen. Het herinneren van testonderdelen kan van invloed zijn op de testuitslag. De voordelen van een woordenschatchecklist zijn dat de ouders van het kind de taalproductie van verschillende contexten meenemen en dat de lijst een langere termijn beslaat. Pine et al. (1997) concluderen dat er hoge correlaties bestaan tussen de verschillende meetinstrumenten, maar dat deze desondanks verschillende proporties van woordklassen opleveren (vergelijk Salerni et al. 2007). Een spontane-taalanalyse geeft volgens hen het meest representatieve beeld. Een ander verschil in onderzoeksopzet betreft de selectie van proefpersonen. Sommige onderzoekers doen dit op basis van de leeftijd van de kinderen (onder andere Kauschke & Hofmeister 2002), terwijl anderen uitgaan van de omvang van de woordenschat van een kind (onder andere Pine et al. 1997 en Salerni et al. 2007). Volgens Pine en Lieven (1997) zijn onderzoeken gebaseerd op leeftijd niet geschikt, omdat de onderzoeksgegevens dan ook variaties in ontwikkelingsniveau weerspiegelen. Hoewel er voor het Nederlands onderzoek gedaan is naar de opbouw van de vroege woordenschat van kinderen, is niet eerder gekeken naar het verloop van de ontwikkeling van de verschillende woordklassen in hun taalproductie.
•
4 Onderzoeksvraag Onderzocht wordt hoe de productieve woordenschat van jonge, normaal ontwikkelende Nederlandstalige kinderen in de leeftijd van 1;08 tot 3;04 jaar samengesteld is en of er aanwijzingen zijn voor een noun-bias. De data zijn afkomstig van transcripten van spontane taal uit CHILDES (MacWhinney 1991). Daartoe zijn 48 taalsamples van acht leeftijdscategorieën geselecteerd en geanalyseerd. Zowel het aantal verschillende woorden (types) als het totale aantal woorden (tokens) is ingedeeld in negen categorieën, namelijk nomina, verba, adjectieven en modifiers, pronomina, persoonlijk-sociale woorden, relationele woorden, functiewoorden, onomatopeïsche termen en overige (de indeling is van Kauschke & Hofmeister 2002). Deze aantallen zijn omgezet in proporties van het totaal aantal types en het totaal aantal tokens. De verhoudingen van de categorieën binnen een leeftijdsgroep en tussen de leeftijdsgroepen zijn met elkaar vergeleken. Ook de samenstelling van de woordenschat van de individuele proefpersonen is onderzocht. Op deze wijze wordt inzicht verkregen in de ontwikkeling van de productieve woordenschat bij jonge Nederlandstalige kinderen van 1;08 tot 3;04 jaar.
59
Linda Horsels & Gerard Bol
•
5 Methode 5.1 Proefpersonen en dataverzameling Er zijn 48 taalsamples uit de CHILDES database (MacWhinney 1991) onderzocht. CHILDES staat voor Child Data Exchange System. Deze database bevat transcripten van kinderen met een normale en problematische taalontwikkeling en is vrij toegankelijk via internet. De data zijn afkomstig van 14 zich normaal ontwikkelende Nederlandstalige kinderen van 1;08, 1;10, 2;01, 2;04, 2;07, 2;10, 3;01 en 3;04 jaar (Bol & Kuiken 1987, Bol 1995, Van Kampen 1994). Het gaat om zeven meisjes en zeven jongens. Het interval tussen de eerste twee leeftijdsgroepen is twee maanden en voor de overige groepen drie maanden, omdat op deze leeftijden samples beschikbaar waren van minimaal drie jongens en drie meisje die het Nederlands als moedertaal hebben. Van een aantal kinderen zijn meerdere transcripten gebruikt. Het onderzoek is cross-sectioneel van opzet, dat wil zeggen dat de data van verschillende kinderen van verschillende leeftijden gebruikt zijn om de ontwikkeling te beschrijven. Longitudinale data zijn gebruikt, indien deze beschikbaar waren. De transcripten zijn gebaseerd op de spontane-taaluitingen die in een vrij-spelsituatie geproduceerd zijn. Tijdens deze situatie participeerde altijd een van de ouders van het kind en in enkele gevallen heeft ook de onderzoeker deelgenomen aan het gesprek. De taalsamples bestaan uit ten minste 100 uitingen. Een overzicht van de bestanden die geanalyseerd zijn voor dit onderzoek, is opgenomen in bijlage 1. 5.2 Procedure Per taalsample is voor de eerste 100 uitingen in kaart gebracht welke verschillende woorden (types) een kind produceert en hoe vaak deze voorkomen (tokens). Het programma Computerized Language Analysis (CLAN), dat deel uitmaakt van CHILDES, is voor de analyse gebruikt. Onverstaanbare uitingen en zelfherhalingen zijn niet meegenomen in dit onderzoek. De types en tokens van elk sample zijn vervolgens ingedeeld in negen categorieën, op dezelfde manier als Kauschke en Hofmeister (2002). Wanneer het niet duidelijk was in welke categorie een woord ingedeeld moest worden, is dit in de context bekeken. Een kind kan bijvoorbeeld het woord weg gebruiken als een nomen of een relationeel woord. De indeling van de categorieën is opgenomen in tabel 1 en per categorie zijn enkele voorbeelden gegeven uit de samples van het onderzoek. Bij het onderscheid tussen types en tokens is de volgende methode gehanteerd: wanneer een kind bijvoorbeeld de woorden auto, autootje en auto’s binnen één sample gebruikt, dan is dit geteld als één type en drie tokens. De uitspraak van een woord hoefde niet perfect te zijn om meegenomen te worden in de analyse. Eén meisje van 2;07 jaar sprak bijvoorbeeld het woord zwemmen uit als semme. 5.3 Analyse Per sample zijn de percentages berekend van de verdeling van het aantal categorieën voor zowel het aantal types als het aantal tokens. Dit voorkomt dat eventuele verschillen in aantallen worden veroorzaakt door mogelijke variaties in omvang van de woordenschat. 60
De productieve woordenschat van jonge Nederlandstalige kinderen
Op basis van deze gegevens ontstaat een beeld van de verdeling van de categorieën van de woordenschat van de groep kinderen in de leeftijd van 1;08 tot 3;04 jaar oud (n = 6 per leeftijdsgroep) voor zowel de types als de tokens. Daarbij is zowel gekeken naar de percentages per groep als per individu. Met behulp van de Kruskal-Wallistoets is getoetst of er variatie is tussen de diverse onafhankelijke steekproeven op de verschillende variabelen (bijvoorbeeld nomina, verba en functiewoorden). Een verschil is significant indien de p-waarde kleiner of gelijk is aan .05. Categorie
Categorieonderdelen
Voorbeelden
Nomina
Eigennamen, personen, levende en nietlevende objecten, abstracte nomina, nomina die gevoelens uitdrukken
Sarah, opa, koe, jasje, zomer, angst
Verba
Acties en activiteiten met of zonder objecten, Rijden, tekenen, gebeurtenissen, bewegingen, stellingen, helpen etcetera
Adjectieven en Modifiers
Adjectieven die kwaliteiten of eigenschappen aanduiden, wijziging van elementen, adjectieven die gevoelens uitdrukken
Kapot, vijf, heet, lekker, moe
Persoonlijksociale woorden
Interactieve woorden zoals beweringen, gesprekssignalen, aandacht vestigen op, persoonlijk expressieve uitingen en interjecties
Ja, hoi, kijk, auw, ehm
Relationele Woorden
Woorden voor relaties tussen acties en/ of objecten, woorden voor verschijnen/ verdwijnen, woorden voor functies van objecten, woorden voor temporele aspecten van acties en gebeurtenissen, plaatsbepalingen
Erin, weg, op, nu, weer, daar
Pronomina
Persoonlijke, aanwijzende, bezittelijke voornaamwoorden, etcetera
Ik, die, mijn
Functiewoorden
Preposities, hulpwerkwoorden, lidwoorden, conjuncties, vraagwoorden, etcetera
Naast, is, de, maar, waar
Onomatopeïsche termen
Onomatopeïsche uitingen
Waf, toetoet
Overig
Partikels, ambigue woorden
Zo
Tabel 1: Overzicht van de categorieën en categorieonderdelen (naar Kauschke & Hofmeister 2002).
61
Linda Horsels & Gerard Bol
•
6 Resultaten Eerst wordt de productie van de verschillende types verdeeld over de categorieën per leeftijdgroep en de individuele proefpersonen beschreven. Vervolgens worden van de tokens de groepsresultaten en resultaten per proefpersoon voor elke leeftijdscategorie besproken. 6.1 De productie van types 6.1.1 Groepsresultaten De woordklasse nomina heeft gemiddeld genomen het grootste aandeel voor alle leeftijdscategorieën. In de groep met kinderen van 1;08 tot en met 2;04 jaar beslaat dit ongeveer een derde. Het aantal nomina neemt vervolgens geleidelijk aan af tot nagenoeg een kwart op de leeftijd van 3;04 jaar (23,66%). De variaties binnen de groepen zijn tamelijk groot bij deze woordklasse, vooral in de leeftijdscategorieën 1;08 (sd 14,41%) en 2;04 (sd 12,18%). De op één na grootste categorie in de steekproef van kinderen van 1;08 en 1;10 jaar is de categorie met persoonlijk-sociale woorden met respectievelijk 22,17% (sd 7,28%) en 19,10% (sd 5,71%). De leeftijdscategorieën verschillen significant op dit punt (Kruskal-Wallistoets c² = 27,99; df = 7; p = ,00). Vanaf de leeftijdscategorie 1;10 jaar is de op één na grootste woordklasse de verba (12,15%). Deze vormt in de leeftijdscategorie 2;01 jaar 15,59% van de productieve woordenschat en daarna steeds ongeveer 20%. De variaties binnen de groep zijn hier minder groot (sd is minimaal 3,11% op de leeftijd van 2;04 jaar en maximaal 7,18% op de leeftijd van 1;08 jaar). Ook voor deze woordklasse zijn de verschillen tussen de groepen significant (Kruskal-Wallistoets c² = 19,40; df = 7; p = ,007). Het aantal verschillende adjectieven neemt toe met het stijgen van de leeftijd (van 3,94% op de leeftijd van 1;08 jaar tot 9,03% op de leeftijd van 3;01 jaar). Ook de diversiteit van de types van de functiewoorden is groter bij de oudere leeftijdscategorieën: een stijging van 1,48% op de leeftijd van 1;08 jaar naar 12,58% op de leeftijd van 3;04 jaar. De verschillen tussen de groepen zijn significant (Kruskal-Wallistoets c² = 35,49; df = 7; p = ,00). De omvang van het aantal relationele woorden blijft relatief constant, variërend van 5,18% tot 8,70%. Het aantal pronomina is op de leeftijd van 1;08 jaar 5,91%. Dit aantal stijgt bij de overige leeftijdscategorieën, variërend van 9,37% tot 10,76%. Het aantal onomatopeïsche termen neemt significant af met de leeftijd: de kinderen in de leeftijd van 1;08 jaar produceerden gemiddeld genomen 3,94% onomatopeïsche termen (sd 4,28%) binnen honderd uitingen, terwijl de oudste kinderen van 3;04 jaar 1,17% (sd 1,71%) van deze termen gebruikten (Kruskal-Wallistoets c² = 16,61; df = 7; p = ,02). Deze categorie vormt het kleinste aandeel binnen de productieve woordenschat (zie tabel 2).
62
De productieve woordenschat van jonge Nederlandstalige kinderen
Leeftijd → Categorie↓
1;08
1;10
37.93 30.21 (14.41) (10.19)
N
2;01
2;04
2;07
2;10
3;01
3;04
32.65 30.13 (7.07) (12.18)
28.32 (8.76)
25.72 (9.50)
24.79 (9.34)
23.66 (4.66)
V
9.36 (7.18)
12.15 (5.33)
15.59 (4.21)
19.75 (3.11)
18.30 (3.33)
21.50 (3.52)
19.70 (4.48)
20.47 (4.53)
A
3.94 (4.05)
5.21 (3.54)
7.94 (5.59)
6.08 (2.46)
6.54 (3.38)
9.40 (2.87)
9.03 (4.21)
7.72 (4.22)
PSW
22.17 (7.28)
19.10 (5.71)
12.06 (6.88)
10.63 (2.18)
8.71 (2.95)
9.21 (2.45)
7.72 (3.22)
7.72 (2.35)
RW
8.37 (3.83)
7.99 (4.33)
7.06 (3.57)
7.09 (1.72)
8.50 (2.88)
5.18 (2.01)
8.70 (2.21)
7.05 (2.47)
PRON
5.91 (3.69)
10.76 (2.37)
9.41 (3.12)
9.62 (4.07)
9.37 (5.13)
10.56 (4.97)
10.02 (3.61)
10.40 (2.92)
FW
1.48 (1.40)
1.39 (1.67)
4.41 (2.80)
7.85 (2.64)
9.59 (1.82)
10.36 (3.19)
10.34 (2.23)
12.58 (2.51)
OT
3.94 (4.28)
2.78 (3.05)
3.82 (1.97)
0.25 (0.80)
1.31 (1.82)
0.58 (1.01)
1.81 (3.03)
1.17 (1.71)
O
6.90 (6.75)
10.42 (3.40)
7.06 (2.87)
8.61 (2.69)
9.37 (2.20)
7.49 (2.50)
7.88 (2.61)
9.23 (1.01)
Tabel 2: Gemiddelde score in percentages en standaarddeviatie (sd, tussen haakjes) voor het aantal types per categorie en leeftijdscategorie (n = 6). N = nomina, V = verba, A = adjectieven en modifiers, PSW = persoonlijk-sociale woorden, RW = relationele woorden, PRON = pronomina, FW = functiewoorden, OT = onomatopeïsche termen, O = overig. De tendens is dat de standaarddeviaties van de verschillende leeftijdsgroepen kleiner worden naarmate de leeftijd stijgt. Dat betekent dat de individuele verschillen in de verdeling van de categorieën kleiner worden. Er zijn geen significante verschillen tussen de leeftijdsgroepen voor nomina, adjectieven en modifiers, relationele woorden, pronomina en overig (zie tabel 3).
Types
N
V
A
PSW
RW
PRON
FW
OT
O
Chi²
6,36
19,40
7,47
27,99
6,49
4,46
35,49
16,61
11,22
p
,50
,007*
0,38
,00*
,48
,73
,00*
0,02*
,13
* = p ≤ 0.05 Tabel 3: Kruskal-Wallis Chi-square (c²) en bijbehorende p-waarde (p) per categorie voor types. Voor legenda: zie tabel 2.
63
Linda Horsels & Gerard Bol
6.1.2 Individuele resultaten De afzonderlijke resultaten van de proefpersonen laten zien dat nomina bij vier van de zes kinderen de grootste woordklasse vormen. Een uitzondering hierop vormt de leeftijd van 3;01 jaar, waar slechts twee kinderen deze woordklasse het meest produceren. De op één na grootste categorie is tot en met 1;10 jaar de woordklasse van persoonlijk-sociale woorden. Na deze leeftijd zijn verba meestal de op één na meest geproduceerde categorie. Overigens is er wel een trend zichtbaar, die aangeeft dat het verschil tussen de grootste en op één na grootste woordklasse kleiner wordt. Vooral na de leeftijd van 2;10 jaar liggen de percentages van de twee grootste woordklassen vaak dicht bij elkaar: één meisje van 3;01 jaar produceert 21% nomina en 23% verba en een ander, even oud meisje respectievelijk 21% en 22%. 6.2 De productie van tokens 6.2.1 Groepsresultaten Nomina worden het meest geproduceerd tot en met de leeftijd van 2;10 jaar (zie tabel 4). Op de leeftijd van 1;08 jaar en 1;10 jaar beslaat het aantal geproduceerde nomina ongeveer een derde van alle tokens, hoewel er grote individuele verschillen zijn binnen de groep (respectievelijk sd 19,23% en 11,19%). Hoe ouder de kinderen worden, des te minder nomina ze naar verhouding produceren. Leeftijd → Categorie↓ N
1;08
1;10
34.76 30.06 (19.32) (11.19)
2;01
2;04
2;07
2;10
3;01
3;04
26.79 22.86 (7.59) (14.41)
19.22 (8.03)
19.00 14.45 (8.87) (12.48)
15.72 (2.84)
V
9.59 (9.92)
7.23 (4.13)
13.95 (2.91)
18.12 (5.30)
17.49 (4.37)
19.19 (3.15)
20.02 (3.61)
18.26 (3.83)
A
7.36 (9.70)
3.61 (2.90)
5.13 (4.20)
2.93 (1.28)
4.84 (2.82)
5.64 (3.21)
5.21 (2.78)
4.49 (2.77)
PSW
25.34 (11.89)
25.87 (5.77)
20.20 (9.67)
17.26 (6.11)
15.75 (6.19)
15.83 (5.17)
13.23 (7.14)
14.62 (5.31)
RW
6.85 (4.84)
8.67 (5.26)
6.70 (4.21)
6.38 (1.66)
10.69 (4.02)
6.71 (3.52)
6.86 (3.85)
6.43 (2.01)
PRON
8.22 (9.03)
10.98 (4.40)
10.38 (3.75)
12.51 (4.32)
12.86 (8.23)
14.19 (5.54)
18.31 (9.01)
13.77 (3.33)
FW
1.37 (1.55)
1.88 (2.29)
5.80 (4.70)
6.30 (2.62)
8.16 (1.83)
10.45 (3.49)
10.96 (3.95)
17.48 (5.01)
OT
1.71 (2.45)
1.73 (2.04)
3.13 (1.47)
0.09 (0.21)
0.65 (1.19)
0.57 (1.27)
0.92 (2.89)
0.97 (1.75)
O
4.79 (7.89)
9.97 (5.83)
7.92 (4.78)
13.55 (7.52)
10.33 (3.74)
8.42 (2.95)
10.04 (3.19)
8.25 (1.52)
Tabel 4: Gemiddelde score in percentages en standaarddeviatie (sd, tussen haakjes) voor het aantal tokens per categorie en leeftijdscategorie (n = 6). Voor legenda: zie tabel 2. Kader met dikke lijn = grootste categorie. Kader met dunne lijn = op één na grootste categorie. 64
De productieve woordenschat van jonge Nederlandstalige kinderen
De kinderen in de leeftijdscategorie van 3;01 en 3;04 jaar gebruiken gemiddeld minder dan 16% nomina. In de leeftijdscategorie 3;01 jaar is er één proefpersoon die 41% nomina produceert. Deze uitschieter veroorzaakt de relatief ruime standaarddeviatie (sd) van 12,48%. De verschillen tussen de groepen neigen naar significantie (Kruskal-Wallistoets c² = 13,04; df = 7; p = ,07). Op de leeftijd van 3;01 en 3;04 overheersen verba (respectievelijk 20,02%, sd 3,61% en 18,26%, sd 3,83%). Vanaf 2;01 jaar tot en met 2;10 jaar neemt de categorie verba de tweede plaats in (17,49% tot 19,19%). De verschillen binnen de groepen zijn voor deze woordklasse minder groot (sd 3,15% tot sd 5,30%). Het gemiddelde aantal werkwoorden stijgt relatief snel in de leeftijd van 1;08 tot 2;04 jaar (respectievelijk van 9,59% naar 18,12%). Daarna is de stijging minder sterk (maximaal 20,02% op de leeftijd van 3;01 jaar). De verschillen binnen deze woordklasse zijn significant (Kruskal-Wallistoets c² = 20,62; df = 7; p = ,004). De op één na grootste categorie tot en met 2;01 jaar is de categorie met persoonlijk-sociale woorden (minimaal 20,20% en maximaal 25,87%). Oudere kinderen produceren minder persoonlijk-sociale woorden. De verschillen tussen de leeftijdscategorieën van deze categorie neigen naar significantie (Kruskal-Wallistoets c² = 13,34; df = 7; p = ,06). Een significante toename vindt plaats bij de functiewoorden. Dit aantal stijgt van 1,37% naar 17,48% (Kruskal-Wallistoets c² = 32,06; df = 7; p = ,00) en is op de leeftijd van 3;04 jaar zelfs de op één na grootste categorie. Pronomina worden na de verba het meest geproduceerd door proefpersonen van 3;01. Het produceren van woorden uit deze woordklasse neemt toe met het stijgen van de leeftijd. Net als bij de types is het aandeel van de relationele woorden relatief constant. De verschillen tussen de leeftijdsgroepen met betrekking tot het aantal onomatopeïsche termen zijn significant (Kruskal-Wallistoets c² = 15,35; df = 7; p = ,03). Er is echter geen duidelijke trend zichtbaar. De minste onomatopeïsche termen werden geuit op de leeftijd van 2;04 jaar (0,09%, sd 0,21%) en 2;10 jaar (0,57%, sd 1,27%), terwijl de meeste onomatopeïsche termen op de leeftijd van 2;01 jaar (3,13%, sd 1,47%) geproduceerd werden. Opnieuw is dit de kleinste categorie. De verschillen tussen de leeftijdsgroepen van de categorieën adjectieven en modifiers, relationele woorden, pronomina en overig zijn niet significant (zie tabel 5).
Tokens
N
V
A
PSW
RW
PRON
FW
OT
O
Chi²
13,04
20,62
4,00
13,34
5,92
6,91
32,06
15,35
9,61
p
,07
,004*
,78
,06
,55
,44
,00*
,03*
,21
* = p ≤ 0.05
Tabel 5: Kruskal-Wallis Chi-square (c²) en bijbehorende p-waarde (p) per categorie voor tokens. Voor legenda: zie tabel 2. 6.2.2 Individuele resultaten Bij de tokens blijkt de woordklasse nomina de grootste groep te vormen. Tot 2;01 jaar produceren maximaal vier van de zes kinderen voornamelijk nomina en nemen de persoonlijksociale woorden ook een belangrijke plaats in. Na deze leeftijd nemen de individuele verschillen toe en vanaf 2:04 jaar wordt de rol van pronomina en functiewoorden steeds groter. De adjectieven, relationele woorden en onomatopeïsche uitingen vormen de kleinste groepen.
65
Linda Horsels & Gerard Bol
•
7 Discussie De groepsresultaten laten zien dat nomina gemiddeld genomen de grootste categorie vormen, gemeten in types bij de jongste kinderen van 1;08 en 1;10 jaar. De nomina worden gevolgd door de persoonlijk-sociale woorden. Met betrekking tot de individuele resultaten van de verschillende woorden (types), blijkt dat kinderen wellicht een minder breed repertoire aan persoonlijk-sociale woorden hebben, maar dat sommige kinderen tot 2;04 jaar deze wel vaker produceren dan nomina, vergeleken met het totaal aantal woorden (tokens). Nelson (1973) onderscheidde een referentiële stijl of een expressieve stijl voor de samenstelling van de woordenschat van de eerste 50 woorden. Deze tweedeling komt niet naar voren in het aantal verschillende woorden op de leeftijd van 1;08 jaar en ouder, maar wel in het totaal aantal woorden tot en met 2;04 jaar. Na 1;10 jaar vindt er een daling plaats van het aantal persoonlijk-sociale woorden (types) en neemt de categorie verba de tweede plaats in. De diversiteit van het aantal persoonlijk-sociale woorden neemt significant af, terwijl de afname in het gebruik van het totaal aantal persoonlijk-sociale woorden (tokens) slechts neigt naar significantie. Met het stijgen van de leeftijd neemt de woordenschatkennis van andere categorieën juist sterk toe, maar dat betekent niet dat persoonlijk-sociale woorden daardoor minder geproduceerd worden. De toename van de categorie verba is significant, zowel wat betreft types als tokens. Dit komt overeen met de resultaten van Bassano (2000) voor het Frans. Voor het eerder verschijnen van nomina geven Verlinden en Gillis (1988) als mogelijke verklaring dat de concreetheid van objecten van invloed is, terwijl dat bij verba niet het geval is. Misschien speelt voor het leren van nieuwe verba vanaf 2;01 jaar de concreetheid een minder grote rol, hetgeen de stijging in types zou kunnen verklaren. De significante stijging van de verba (in tokens) kan mogelijk verklaard worden door de syntactische ontwikkeling. Verba nemen een tweede plaats in vanaf 2;07 jaar. Goorhuis en Schaerlaekens (2003) geven aan dat vanaf ongeveer die leeftijd de differentiatiefase begint, waarin de meeste uitingen van een kind bestaan uit een subject-predicaatstructuur. Inderdaad liggen de gemiddelden van de nomina en verba (tokens) op de leeftijd van 2;07 jaar en ouder dichter bij elkaar dan bij de jongere leeftijdsgroepen. De resultaten laten een significant verschil zien in de ontwikkeling van functiewoorden: waar kinderen van 1;08 jaar nog slechts 1,37% functiewoorden gebruiken, stijgt dit tot 8,16% op de leeftijd van 2;07 jaar en in de leeftijdsgroep van 3;04 jaar is dit de grootste categorie met 17,48%. Ook Goorhuis en Schaerlaekens (2003) rapporteren dit, evenals Kauschke en Hofmeister (2002). Goorhuis en Schaerlaekens (2003) vermelden eveneens dat het gebruik van adjectieven en bijwoorden pas tussen de 3 en 5 jaar sterk toeneemt. De resultaten van het onderhavige onderzoek geven aan dat deze categorieën tot 3;04 jaar inderdaad relatief constant zijn. Hiervoor zijn dan ook geen significante verschillen gevonden. Het blijkt dat geen enkele categorie meer dan 25% van de woordenschat beslaat op de leeftijd van respectievelijk 3;01 en 3;04 jaar. Nomina vormen bij de 3-jarigen de grootste groep (in tokens), maar beslaan op die leeftijden respectievelijk 24,79% en 23,66%. Ook Kauschke en Hofmeister (2002) geven aan dat er sprake is van een evenwichtig verdeelde productieve woordenschat bij de leeftijdsgroep met kinderen van 3;0 jaar oud. Er is bij een enkeling een uitzondering hierop gevonden. Wel wordt zichtbaar dat de individuele 66
De productieve woordenschat van jonge Nederlandstalige kinderen
verschillen binnen de groep voor elke woordcategorie (in types) kleiner worden met het stijgen van de leeftijd, gezien de kleinere standaarddeviaties bij de oudere leeftijdsgroepen. Ook bij de productie van de categorieën (in tokens) is dit patroon zichtbaar, zij het in mindere mate. Onderzoekers rapporteren een noun-bias in de woordenschatontwikkeling van kinderen, voor bijvoorbeeld het Engels (Gentner 1982, Nelson et al. 1993), Frans (Bassano 2000) en Italiaans (Sarleni et al. 2007). Op basis van de resultaten van het onderhavige onderzoek kan slechts een voorlopige uitspraak gedaan worden over het al dan niet bestaan van een noun-bias bij jonge Nederlandstalige kinderen, gezien de kleine omvang van het aantal proefpersonen per leeftijdsgroep (n = 6). Hoewel de groepsresultaten aangeven dat nomina de grootste categorie vormen gemeten in types en tokens tot ten minste 2;10 jaar, laten de individuele resultaten zien dat dit niet voor elke proefpersoon opgaat. Tot en met 2;01 jaar produceren vrijwel alle kinderen nomina het meest frequent. Na de leeftijd van 2;10 jaar zijn de verschillen tussen de grootste en op één na grootste categorie minder groot. De resultaten van Nelson et al. (1993) geven aan dat de omvang van het aantal nomina bij kinderen op de leeftijd van 1;08 jaar ruim een derde deel (38%) van de samenstelling van de productieve woordenschat in beslag neemt. De resultaten van het onderhavige onderzoek komen hiermee vrijwel overeen, met een gemiddelde van 37,93% in termen van types en 34,76% in termen van tokens. De categorie nomina blijft een derde deel van de productieve woordenschat uitmaken tot en met de leeftijd van 2;04 jaar (in types) en tot en met 1;10 (in tokens). De afname van de proportie van het aantal gebruikte nomina (tokens) neigt naar significantie (p = 0,06). Hoewel alle categorieën al aanwezig zijn in de productieve woordenschat van alle proefpersonen, neemt het gebruik van diverse woordklassen (zoals functiewoorden) toe vanaf ongeveer 2;06 jaar (vergelijk Goorhuis & Schaerlaekens 2003). Door deze toename in variatie van woordklassen zal de productie van de woordklasse nomina verhoudingsgewijs afnemen. In het crosslinguïstisch onderzoek van Bornstein et al. (2004) wordt het overheersen van nomina in de woordenschat van onder andere Nederlandstalige kinderen in de leeftijd van 1;08 jaar eveneens vermeld, ondanks dat zij gebruik maakten van woordenschatchecklists in plaats van spontane-taalanalyses. Dit onderzoek geeft aan dat er bij jonge Nederlandse kinderen in de ontwikkeling van de woordenschat aanwijzingen zijn voor een noun-bias, gemeten in types, bij kinderen tot 2;01 jaar, in de zin dat ongeveer een derde deel van de productieve woordenschat tot die leeftijd uit nomina bestaat. De productie van verba en functiewoorden neemt toe in de leeftijd van 1;08 tot 3;04 jaar, terwijl het aantal onomatopeïsche termen afneemt. Voor de productie van persoonlijk-sociale woorden geldt een afname alleen in types.
•
Bibliografie Aitchison, J. (1994). Words in the mind: An introduction to the mental lexicon (2nd edition). Oxford: Basic Blackwell. Au, T. K., M. Dapretto & Y.K. Song (1994). Input versus constraints: Early word acquisition in Korean and English. Journal of Memory and Languages 33, 567-582.
67
Linda Horsels & Gerard Bol
Bassano, D. (2000). Early development of nouns and verbs in French: Exploring the interface between lexicon and grammar. Journal of Child Language 27, 521-559. Bates, E., I. Bretherton & L. Snyder(1988). From first words to grammar. Individual differences and dissociable mechanisms. Cambridge: CUP. Bloom, L., E. Tinker & C. Margulis (1993). The words children learn: Evidence against a noun bias in early vocabularies. Cognitive Development 8, 431-450. Bol, G. W. (1995). Implicational scaling in child language acquisition: the order of produc tion of Dutch verb constructions. In M. Verrips & F. Wijnen (Ed.), Papers from The Dutch-German Colloquium on Language Acquisition, Volume 3. Amsterdam Series in Child Language Development, 3, Amsterdam: Institute for General Linguistics, 1-14. Bol, G. W. & F. Kuiken (1990). Grammatical analysis of developmental language disor ders: A study of the morphosyntax of children with specific language disorders, with hearing impairment and with Down’s syndrome. Clinical Linguistics and Phonetics 4, 77-86. Bornstein, M., L.R. Cote, S. Maital, K. Painter, S. Park, L. Pascual, M. Pêcheux, J. Ruel, P. Venuti & A. Vyt (2004) . Cross-Linguistic Analysis of Vocabulary in Young Children: Spanish, Dutch, French, Hebrew, Italian, Korean, and American English. Child Development 75, 1115 - 1139. Caselli, M.C., E. Bates, P. Casadio, J. Fenson, L. Fenson, L. Sanderl & J. Weir (1995). A cross-linguistic study of early lexical development. Cognitive Development 10, 159200. CHILDES (Child Language Data Exchange System):
Choi, S. & A. Gopnik (1995). Early acquisition of verbs in Korean: A cross-linguistic study. Journal of Child Language 22, 497-529. Gentner, D. (1982). Why nouns are learned before verbs: Linguistic relativity versus natural partitioning. In S. A. Kuczay (Ed.), Language Development: Language, Thought and Culture, Volume 2, 301-334. Hillsdale: Lawrence Erlbaum Associates. Goorhuis, S.M. & A.M. Schaerlaekens (2003). Handboek taalontwikkeling, taalpathologie en taaltherapie bij Nederlandssprekende kinderen. Utrecht: De Tijdstroom. Gopnik, A. & S. Choi (1995). Names, relational words, and cognitive development in English and Korean speakers: Nouns are not always learned before verbs. In M. Tomasello & W. E. Merriman (Ed.), Beyond names for things: Young children’s acquisition of verbs, 63-80. Hillsdale: Lawrence Erlbaum Associates. Kampen, N. J. van (1994). The learnability of the left branch condition. In R. BokBennema & C. Cremers (Ed.), Linguistics in the Netherlands, 83-94. Amsterdam/ Philadelpha: John Benjamins. Kauschke, C. & C. Hofmeister (2002). Early lexical development in German: a study on vocabulary growth and vocabulary composition during the second and third year of life. Journal of Child Language 29, 735-757. MacWhinney, B. (1991). The CHILDES project: Tools for analyzing talk. Hillsdale: Lawrence Erlbaum Associates. Nelson, K. (1973). Structure and strategy in learning to talk. Monographs of the Society for Research in Child Development 58, 149.
68
De productieve woordenschat van jonge Nederlandstalige kinderen
Nelson, K., J. Hampson & L.K. Shaw(1993). Nouns in early lexicons: Evidence, explanations, and implications. Journal of Child Language 20, 61 - 84. Pine, J. M., E.V.M. Lieven & C. Rowland (1997). Stylistic variation at the ‘single-word’ stage: relations between maternal speech characteristics and children’s vocabulary composition and usage. Child Development 68, 807-819. Salerni, N., A. Assanelli, L. D’Odorico, & G. Rossi (2007). Qualitative aspects of productive vocabulary at the 200-and 500-word stages: A comparison between spontaneous speech and parental report data. First Language 27, 75-87. Schaerlaekens, A. M. (1973). The two-word sentence in child language. The Hague: Mouton. Tardif, T. (1996). Nouns are not always learned before verbs: Evidence from Mandarin speakers’ early vocabularies. Developmental Psychology 32, 492-504. Tardif, T., S.A. Gelman, & F. Xu (1999). Putting the “noun bias” in context: A comparison of English and Mandarin. Child Development 70, 620-635. Verlinden, A. & S. Gillis, (1988). Nouns and verbs in the input: Gentner (1982) reconsidered. In F. van Besien (Ed.), First Language Acquisition 12, Antwerp: ABLA-papers, 163-187.
69
70
Laura Laura06*
Sarah Sarah06*
Suzanne Suz11017**
Matthijs Mat11013***
Tomas Tom11011***
Daan Daa11001***
Sarah Sarah03*
Corine Cor10806**
Gea Gea10803**
Peter Pet10802***
Tomas Tom10803***
Daan Daa10821***
Daan Daa20121***
Marco Mar20122**
Matthijs Mat20107***
Iris Iri20101***
Sarah Sarah10*
Laura Laura10*
2;01
* Data Van Kampen.zip (Van Kampen, 1994) ** Data BolKuiken.zip (Bol & Kuiken, 1990) *** Data Groningen.zip (Bol, 1995)
1;10
1;08
Leeftijdscategorie
Daan Daa20400***
Tomas Tom20417***
Matthijs Mat20424***
Rianne Ria20420**
Sarah Sarah13*
Laura Laura17*
2;04
Daan Daa20715***
Tomas Tom20710***
Matthijs Mat20702***
Floor Flo20727**
Sarah Sarah21*
Laura Laura23*
2;07
Daan Daa21014***
Tomas Tom21010***
Matthijs Mat21008***
Iris Iri21001***
Sarah Sarah26*
Laura Laura28*
2;10
Daan Daa30100***
Tomas Tom30102***
Matthijs Mat30104***
Iris Iri30100***
Sarah Sarah30*
Laura Laura33*
3;01
Josse Jos30417***
Marcel Mar30416**
Matthijs Mat30409***
Iris Iri30406***
Sarah Sarah33*
Laura Laura38*
3;04
Linda Horsels & Gerard Bol
Bijlage 1: overzicht van de gebruikte files (n = 48) per leeftijdscategorie