1 MASTERTHESE KLINISCHE ONTWIKKELINGSPSYCHOLOGIE Universiteit van Amsterdam
Hoe denken kinderen? Het gebruik van denkregels bij logisch redeneren Katharina M. Visser
ABSTRACT:
Het gebruik van denkregels bij het oplossen van logische redeneertaken werd bij honderddrie basisschoolkinderen onderzocht. Logisch redeneren werd aan de hand van een zelfontwikkelde test gemeten die gebaseerd was op een uit de Rekentuin afkomstig spel “de Bloemencode”. Deze test, bestaande uit 20 items, zou de verschillende denkregels bij logisch redeneren naar voren brengen. Uit het onderzoek bleek dat de kinderen verschillende denkregels gebruikten bij het oplossen van de opgaven. De verschillen
hingen
samen
werkgeheugencapaciteit
met
het
gebruikten
werkgeheugen
complexere
van
denkregels
het
kind:
dan
kinderen
kinderen
met
met
een een
hoge lagere
werkgeheugencapaciteit. De samenhang tussen werkgeheugencapaciteit en het niveau van denkregels werd groter naarmate kinderen ouder worden.
Prof. Dr. Maartje Raijmakers Dr. Tessa van Schijndel Aantal woorden Aantal woorden Abstract
7982 123
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
2
Inhoudsopgave
Abstract
1
Logisch redeneren bij kinderen
3
Methode
11
Resultaten
18
Discussie
31
Literatuur
40
Appendix A
43
Appendix B
46
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
3
Logisch redeneren bij Kinderen Door de eeuwen heen, van Locke tot Freud en Piaget, werden baby's en jonge kinderen beschreven als irrationeel, egocentrisch en niet vaardig tot causaal denken. Er werd verondersteld dat zij veeleer gestuurd werden door sensatie en impulsen dan door rede en intenties (Gopnik, 2004). Nog steeds is er over de vraag of en op welke manier kinderen abstract denken grote onenigheid. Sommige onderzoekers beweren dat kinderen geen abstracte denkregels gebruiken en dus niet logisch redeneren, terwijl anderen weer zeggen dat kinderen wel abstracte denkregels gebruiken (Gopnik Glymour, Sobel, Danks, Schulz & Kushnir, 2004). Denkregels zijn strategieën die kinderen wel of niet hebben geleerd en dientengevolge wel of niet kunnen toepassen bij het oplossen van problemen (Goswami, 2007). Eerder onderzoek toont aan dat kinderen met een leeftijd van 5 jaar in staat zijn alledaagse fysica te begrijpen (Bullock, Gelman & Baillargeon, 1982; Leslie & Keeble, 1987; aangehaald in Gopnik et al., 2004). Ander onderzoek brengt naar voren dat zelfs twee jaar oude kinderen causale voorspellingen kunnen maken zonder daarbij concrete kennis van de wereld om hen heen te gebruiken (Harris, German & Mills, 1996; Wellman, Hickling & Schultz, 1997; aangehaald in Gopnik et al., 2004). Dát kinderen dus wel in staat zijn abstract te redeneren, lijkt uit genoemde onderzoeken naar voren te komen. Met abstract wordt in deze samenhang bedoelt, dat men voor het oplossen van een bepaald probleem geen gebruik hoeft te maken van de eigen kennis over de wereld. In deze studie zal worden onderzocht in hoeverre kinderen abstracte denkregels binnen het domein van logisch redeneren gebruiken. In het verleden hebben verschillende onderzoekers zich bezig gehouden met de vraag hoe kinderen denken en welke denkregels zij daarbij gebruiken. Voor het Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
4 beantwoorden van deze vraag werden verschillende testen gebruikt. Uit veel van de testen bleek echter dat kinderen de abstracte problemen niet of nauwelijks konden oplossen. Deze uitkomsten roepen vragen op: kunnen kinderen daadwerkelijk geen abstracte denkregels hanteren? Of is de manier waarop de testen zijn opgebouwd niet helemaal afgestemd op het denkniveau van de kinderen? De bekende psycholoog, de Zwitser Jean Piaget, was ervan overtuigd dat kinderen pas vanaf een bepaalde leeftijd (tussen de 11 en 12 jaar) in staat zijn abstracte denkregels te gebruiken om problemen op te lossen. Hij construeerde een theorie van cognitieve ontwikkeling en introduceerde een model waarin hij de vroege ontwikkeling van het kind indeelde in vier verschillende stadia. Een van deze stadia is de Formeel operationele fase, die kinderen met een leeftijd van 11 jaar en ouder zouden bereiken. Deze fase wordt gekarakteriseerd door de ontwikkeling van het ruimtelijk en abstract denken, logisch redeneren en conclusies trekken (Goswami, 2007). Om aan te kunnen tonen dat kinderen op een bepaalde leeftijd daadwerkelijk abstracte denkregels gebruiken vereiste Piaget een correcte justification: Hij gaf kinderen verschillende opdrachten en vroeg om een verbale uitleg. Piaget concludeerde dat jonge kinderen niet in staat zijn de goede uitleg te geven, dit zouden zij pas vanaf ongeveer 11 jaar kunnen (Goswami, 2007). Piaget kreeg echter kritiek op deze procedure, omdat de eisen die hij hanteerde te streng zouden zijn. Sommige kinderen wisten het goede antwoord maar waren vervolgens niet in staat deze antwoorden juist te verklaren. Piaget hield er geen rekening mee dat de ontwikkeling van de taalvaardigheid het geven van een goede uitleg zou belemmeren. De Amerikaanse psycholoog Robert Siegler trachtte de problemen van Piaget te omzeilen door een nieuwe methodologie te introduceren, de rule-assessment methodologie (1979), voor het detecteren van denkregels. Hij wilde laten zien dat Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
5 kinderen verschillende regels gebruiken om problemen op te lossen. Welke regel het kind daarbij gebruikt en of hij/zij dan ook in staat is het probleem op te lossen zou samen hangen met leeftijd. Het voordeel van deze rule-assessment methodologie is de grote betrouwbaarheid, zonder een verbale uitleg te vereisen. De kinderen moesten bij deze methodologie niet zelf uitleggen waarom zij een antwoord gaven: Siegler’s antwoordmodel, opgebouwd uit verschillende antwoordmogelijkheden, was bedoeld om inzicht te krijgen welke strategieën kinderen bij het oplossen van problemen zouden kiezen. Uit bovenstaande lijkt naar voren te komen dat de eigenschap van non-verbaliteit bij een test naar logisch redeneren bij kinderen van belang is. Een veel gebruikt paradigma om logisch redeneren te onderzoeken is een verbale test voor conditioneel redeneren (als...dan; Byrne, 1989). Een test die op conditioneel redeneren is gebaseerd, is de door Peter Wason (1968) ontwikkelde Wason Selection Task (WST). Hierbij krijgt de deelnemer vier verschillende kaarten te zien met daarop A, K, 4 en 7. Hij krijgt volgende regel te horen: “Als er een klinker op de ene kant van de kaart staat, dan staat er aan de andere kant een even getal.” Vervolgens wordt hij gevraagd welke kaart hij/zij moest omdraaien om te toetsen of de regel klopt (Stenning & v. Lambalgen, 2000). De test zou, gezien eerdere kritiek, geschikt moeten zijn voor kinderen: Behalve het juist begrijpen van de instructie, worden er weinig verbale vaardigheden vereist van de deelnemers. Een groot probleem bij de WST is echter dat zelfs volwassenen veel moeite hebben om de test juist te beantwoorden. Dit zou kunnen liggen aan het hoge abstractieniveau, waardoor deze test niet geschikt is voor afname bij kinderen: kinderen begrijpen wellicht niet wat van hen wordt verwacht. Gezien bovenstaande kan geconcludeerd worden dat een helder doel van een test naar logisch redeneren van belang lijkt te zijn: het kind moet dus precies weten waar het naartoe wil binnen het spel. Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
6 Stenning en van Lambalgen (2000) wezen erop dat de semantiek bij zulke testen een grote rol speelt. Deelnemers laten zich misleiden door de manier waarop de vragen zijn gesteld, aldus de onderzoekers. Maar, zodra de abstracte vragen door concrete vragen zouden worden vervangen (“Als het morgen regent, dan blijf ik thuis”), zouden de deelnemers te veel op de context letten en om die reden de vraag ineens wel juist kunnen beantwoorden (Markovits & Vachon, 1990). Een zulke test wordt context-afhankelijk genoemd. Dit betekend dat de eigen kennis over de wereld een rol kan spelen bij het wel of niet juist kunnen beantwoorden van de vragen. Dit is echter niet wat de test oogt te meten: het gaat immers niet om het achterhalen van kennis over de wereld, maar om logisch redeneren. Context-afhankelijkheid is dientengevolge een ongewenste eigenschap bij het maken van een valide test naar logisch redeneren. Een test waarbij de context-afhankelijkheid een minder grote rol speelt is het zogenaamde Stackelberg spel. Dit is een spel voor twee spelers waarin de ene speler, de leider, een actie uitvoert waarop een andere speler, de volger, moet reageren. Het doel van het spel is te voorspellen wat de andere speler gaat doen en daarop in te spelen (Hedden & Zang, 2002). Het Stackelberg spel is non-verbaal, niet te abstract met een helder doel, context-vrij en beweegt zich bovendien in een speelomgeving, waardoor het bijzonder geschikt zou zijn voor afname bij kinderen. Toch is er een nadeel: de test moet verbaal aan de deelnemers worden uitgelegd. Zij moeten begrijpen hoe het spel werkt, door middel van de gegeven instructie. Het leren van een dergelijke taak op basis van instructie, houdt in dat het kind de instructie moet verwerken en interpreteren. Dit zou een probleem kunnen opleveren voor kinderen die relatief veel moeite hebben met taal. Hieruit kan geconcludeerd worden dat een test naar logisch redeneren idealiter met minimale verbale instructie afgenomen moet kunnen worden. Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
7 Uit onderzoek blijkt dat kinderen na enkele oefenitems, zoals het gebruikelijk is bij de meeste testen, nog niet op een optimaal denkniveau zitten om de best mogelijke resultaten te behalen (Raijmakers, Mandell, v. Es & Counihan, in press). De genoemde problemen worden dientengevolge bij het Stackelberg spel slechts gedeeltelijk omzeild. Een meer intensieve training, voorafgaand aan de eigenlijke test, zou hiervoor een oplossing kunnen zijn. Training heeft echter niet alleen voordelen: het gevaar bestaat dat kinderen de oefenitems gedurende de training uit hun hoofd leren. Dat zou betekenen dat kinderen de achterliggende regels niet daadwerkelijk begrijpen maar de items alleen memoriseren (Klinkenberg, Straatemeier, van der Maas, 2011). Training lijkt wel een oplossing voor het probleem kinderen goede uitleg te geven, maar een controle voor het memoriseren van items is hierbij cruciaal. Gezien bovenstaande lijkt een intensieve training voorafgaand aan de test naar logisch redeneren belangrijk te zijn om het kind op een optimaal prestatieniveau te brengen. Samenvattend kan worden gesteld dat een valide test naar logisch redeneren aan volgende eisen zou moeten voldoen: Een zulke test 1) is non-verbaal 2) heeft een helder doel 3) is contextvrij 4) heeft geen uitgebreide verbale instructie en 5) gaat vooraf door een intensieve training. Eerder onderzoek heeft uitgewezen dat er bij het oplossen van complexere cognitieve taken grote individuele verschillen bestaan, met name in leertaken en nietschoolse vaardigheden (Schmittmann et al., 2006). Verder blijkt dat voornamelijk werkgeheugen en inhibitie een belangrijke rol kunnen spelen bij logisch redeneren en mogelijkerwijs ten grondslag liggen aan deze individuele verschillen (Moutier, Plagne-Cayeux, Melot & Houdé, 2006). Een mogelijke test naar logisch redeneren zou dus naast aan bovengenoemde eisen te voldoen, ook executieve functies, zoals werkgeheugencapaciteit en inhibitievermogen, kunnen meten om de besproken Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
8 individuele verschillen eventueel te kunnen verklaren (Raijmakers, Mandell, v. Es & Counihan, in press). Zoals besproken zijn er in het verleden verschillende onderzoeken uitgevoerd die aantonen dat kinderen wel degelijk in staat zijn abstracte denkregels te gebruiken. Desondanks zullen deze denkregels in complexiteit verschillen. Wat er ten grondslag ligt aan de gevonden verschillen en op welke manier kinderen de taken oplossen, ook als zij het juiste antwoord niet weten, is echter voor lang niet alle taken duidelijk. De vragen die in deze studie zullen worden onderzocht zijn: 1. gebruiken kinderen abstracte denkregels ook bij het oplossen van een specifieke logisch redeneertaak? 2. Wat doen kinderen wanneer zij het correcte antwoord niet geven? Om deze vragen te kunnen beantwoorden zal gebruik gemaakt worden van een test die aan volgende eisen voldoet: 1) non-verbaliteit 2) met een helder doel 3) contextvrijheid 4) zonder uitgebreide verbale instructie en 5) met voorafgaande training. Daarnaast zullen ook de werkgeheugencapaciteit en het inhibitievermogen van de kinderen worden meegenomen. In deze studie zullen basisschoolkinderen logische puzzels oplossen in de Rekentuin. De Rekentuin is een online game- en trainingsomgeving om op een speelse en adaptieve wijze de rekenvaardigheid te verbeteren (www.rekentuin.nl). Ieder kind kan zijn eigen tuin bijhouden door regelmatig rekensommen te maken. Voor elk rekendomein (aftrekken, optellen, breuken enz.) bestaat er een afzonderlijk spelletje. De Rekentuin werd opgezet door de Universiteit van Amsterdam en dient drie doeleinden: ten eerste krijgen scholieren de mogelijkheid om op een leuke en adaptieve manier rekenen te oefenen, ten tweede kunnen deze gegevens voor onderzoek gebruikt worden (alle rekendata komt automatisch op de server van de UvA terecht) en ten derde kunnen de leerkrachten de vooruitgang van de scholieren Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
9 bewaken (Klinkenberg, Straatemeier & van der Maas, 2009). Het voor dit onderzoek belangrijkste onderdeel van de Rekentuin is het spel de Bloemencode. De Bloemencode is gebaseerd op het bekende bordspel Mastermind. Hier moet het kind een code, bestaande uit gekleurde bloemen, proberen te kraken (zie Figuur 1). Het spel vereist deductief logisch redeneren. Deductief betekent dat de speler de gekregen informatie moet combineren om tot de juiste oplossing te komen (Goswami, 2007). Na een oefenperiode van enkele weken zullen de kinderen op school een pen-en-papier test maken, die twintig verschillende items uit de Bloemencode bevat. De test zal logisch redeneren meten en bovendien aan bovengenoemde zes eisen voldoen. Verder zal ter aanvulling van de pen-en-papier test een deel van de kinderen een tweede complexe redeneertaak en telkens een werkgeheugentaak en een taak die het inhibitievermogen meet uitvoeren. Wij verwachten binnen de Bloemencode data verschillende groepen kinderen te vinden, die te scheiden zijn aan de hand van de gebruikte denkregels. We verwachten meer en minder geavanceerde denkregels te vinden waarvan het gebruik samenhangt met leeftijd. Wij verwachten verder dat werkgeheugencapaciteit en inhibitievermogen zal samenhangen met het succesvol oplossen van de redeneertaken. Wat moeilijke denkstappen bij het oplossen van items uit de Bloemencode zijn kan op basis van eerder onderzoek nog nader gespecificeerd worden: Ten eerste blijkt dat met name jonge kinderen moeite hebben met het verwerken van negatieve informatie (van Duijvenvoorde, Zanolie, Rombouts, Raijmakers & Crone, 2008). Zij lijken negatieve informatie te negeren en zich met name te richten op de positieve informatie. Hierdoor zal het gegeven antwoord fout kunnen zijn. Ten tweede hebben Gierasimczuk, van der Maas en Raijmakers (accepted) in onderzoek naar de Bloemencode laten zien dat kinderen moeite Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
10 hebben met het erbij halen van externe informatie bij het genereren van het juiste antwoord (zie Figuur 1, in dit geval is de groene bloem een extern item). Deze twee bevindingen liggen ten grondslag aan de verwachte verschillen tussen de kinderen.
Figuur 1. Item uit de Bloemencode.
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
11
2. Methode
2.1. Deelnemers Aan dit onderzoek deden oorspronkelijk 191 kinderen tussen de 8 en de 12 jaar (M = 9,69) mee, waarvan 104 jongens en 87 meisjes. De deelnemers waren scholieren van de basisschool “de Crayenester” in Heemstede. Zij waren afkomstig uit zeven klassen: twee groepen 5, een groep 6 en twee groepen 7 en 8. Deelnemers die één of meer testitems niet hadden beantwoord werden van de analyses uitgesloten. Om te kunnen garanderen dat de kinderen voldoende oefening hebben gehad, werden in de analyses alléén deelnemers meegenomen die voorafgaand aan de eigenlijke test meer dan 15 items van de Bloemencode hadden gespeeld. In totaal werden 88 deelnemers niet meegenomen in de dataverwerking. Er bleven daarna 103 deelnemers over, waarvan 47 meisjes en 56 jongens met een gemiddelde leeftijd van 9,85 jaar (standaardafwijking = 1,15), zie Tabel 1. Het onderzoek was onderdeel van een groter project. De scholieren kregen geen beloning voor hun deelname. Degene die per klas het meest in de Bloemencode had gespeeld kon na afloop van het onderzoek een prijs winnen.
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
12 Tabel 1. Aantal Deelnemers per Leeftijdsgroep die werd meegenomen bij het Onderzoek Totaal, en het Aantal Deelnemers die daarvan ook werd meegenomen bij de BOFF, en bij de Flankertask.
BOFF
+inhibitie
totaal
____________________________________________________ 8
17 (15,5%)
14 (19,1%)
53 (27,2%)
9
17 (16,5%)
9 (13,2%)
25 (13,1%)
10
37 (35,9%)
23 (33,8%)
49 (25,7%)
11
27 (26,2%)
19 (27,9%)
56 (29,3%)
12
5 (4,9%)
3 (4,4%)
8 (4,2%)
Totaal
103 (100%) 68 (100%)
191 (100%)
2.2. Materialen Voorafgaand aan het onderzoek kregen de ouders van de kinderen brieven met nadere informatie over het onderzoek en er werd om een passieve toestemming voor deelname aan het onderzoek gevraagd (zie Appendix B). Er werd verteld wat de Rekentuin inhield en de ouders werden verzocht hun kinderen te stimuleren actief in de Rekentuin te spelen.
2.2.1. Rekentuin De Rekentuin meet rekenvaardigheid en kan individueel op de computer worden Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
13 gespeeld. De afnameduur is daarbij onbeperkt. De afzonderlijke spelletjes binnen de Rekentuin hebben een hoge betrouwbaarheid (alpha = 0.75). Om de validiteit van de Rekentuin vast te stellen werden de uitslagen van de scholieren met hun CITO scores vergeleken. De correlaties lagen tussen de .78 en de .84 (Klinkenberg, Straatemeier & van der Maas, 2009).
2.2.2. Werkgeheugen Om het visueel-spatiële werkgeheugen van de kinderen te meten, werd de data uit de Rekentuin van het spel “Mollen” gebruikt. In dit spel krijgt het kind een aantal mollenheuvels te zien waaruit in een bepaalde volgorde mollen verschijnen. De spelers moeten de volgorde onthouden en reproduceren. Naarmate het spel vordert, moeten meer mollen worden onthouden. Dit spel wordt individueel op de computer gespeeld. Betrouwbaarheid en validiteit van dit spel apart is niet bekend, maar werkgeheugen lijkt 10 - 40% van de variantie in rekenvaardigheid te verklaren (van der Ven, van der Maas, Straatemeier, Jansen, submitted)
2.2.3. Inhibitievermogen Om het inhibitievermogen van de kinderen te meten werd gebruik gemaakt van de Eriksen flankertask. Dit is een reactietijd-taak om het vermogen tot selectief richten van de visuele aandacht op een centrale locatie te meten (Ridderinkhof & van der Molen, 1995). De flankertask meet aandachtscontrole en is geschikt voor alle leeftijden. De test wordt individueel op de computer afgenomen en duurt ongeveer 5 minuten. Op het scherm verschijnen pijlen die naar links of naar rechts wijzen. De kinderen moeten afhankelijk van de richting van de pijlen op het toetsenboord links of rechts klikken. Het gaat erom zo weinig mogelijk fouten te maken en daarbij zo snel mogelijk te reageren. De betrouwbaarheid van de flankertask is voldoende (alpha = Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
14 0.60).
2.2.4. Complexe redeneervaardigheid Als index voor IQ werd gebruik gemaakt van een tweede complexe redeneertaak, het spel “Cijfers”. Cijfers is een inzichttaak waarbij het kind met een combinatie van cijfers en rekentekens tot een bepaalde som moet komen. Deze taak vereist complex redeneren en zal in dit onderzoek als een soort IQ-maat gebruikt worden. Dit spel wordt individueel op de computer gespeeld. Betrouwbaarheid en validiteit van dit spel apart is niet verkrijgbaar, maar de samenhang met het mollenspel is hoog, (r = 0,62). Cijfers maakt echter onderdeel uit van de Rekentuin, hiervan is de betrouwbaarheid en validiteit bekend (zie 2.2.1).
2.2.5. Bloemencode online test De voor dit onderzoek meest relevante taak was de Bloemencode. De Bloemencode is gebaseerd op het spel Mastermind en heeft het doel om deductief, logisch redeneren te trainen. Bij het klassieke spel, wat 1970 door Mordechai Meirovitz werd ontwikkeld, gaat het erom een geheime code, bestaande uit vier verschillende kleuren in een specifieke volgorde, te kraken. In de Bloemencode moeten kinderen ook een code kraken, bestaande uit gekleurde bloemen die geselecteerd en in de juiste volgorde moeten worden gezet. De computer geeft hierbij met rode (onjuiste bloem, onjuiste plek), oranje (juiste bloem, onjuiste plek) of groene (juiste bloem, juiste plek) stipjes aan of de code correct is of niet (Gierasimczuk et al., accepted). De Bloemencode wordt individueel op de computer gespeeld. Betrouwbaarheid en validiteit van dit spel apart is niet bekend. De Bloemencode maakt echter onderdeel uit van de Rekentuin, hiervan is de betrouwbaarheid en validiteit bekend (zie 2.2.1).
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
15 2.2.6. Bloemencode offline test Om te kunnen meten welke denkregels kinderen nu daadwerkelijk gebruiken werd een test ontwikkeld die zo veel mogelijk op de Bloemencode online test leek, deze test wordt vanaf nu Bloemencode offline test (BOFF) genoemd. Deze test bestond uit 20 diverse items met verschillende moeilijkheid. In deze test werden alleen 2-pin items meegenomen. Dit zijn items waarbij de gezochte code uit alleen twee bloemen bestaat (de online test bevat items waar de code uit 1 tot 5 bloemen bestaat). Voor het gebruiken van 2-pin items hebben wij gekozen omdat er een goede logische analyse van 2-pin items bestaat (Gierasimczuk et al., accepted). 2-pin items bestaan er zes verschillende feedback mogelijkheden: groen-groen (gg), oranje-oranje (oo), rood-rood (rr), groen-oranje (go), groen-rood (gr) en oranje-rood (or). Hiervan valt gg echter weg, deze feedback krijgt alleen een juist antwoord. Ook go valt weg, omdat er maar twee posities bestaan. Er blijven dan nog vier feedbackmogelijkheden over: oo, rr, gr en or. Om te kunnen garanderen dat de items in moeilijkheid verschilden, werden items gemaakt die in drie categorieën in te delen waren: makkelijk, moeilijk en complex. De Item moeilijkheid werd afgeleid aan de hand van itemratings uit de Rekentuin. Hieruit werd duidelijk dat redelijk makkelijke items de feedback rr en/of oo bevatten, maar geen or en gr. Uit de itemratings kon verder worden afgelezen dat moeilijke items oftewel or feedback bevatten oftewel gr en een externe bloem in de oplossing hebben. Complexe items bevatten voornamelijk de feedback or en or+gr. De BOFF bestond uit 8 makkelijke (rr, oo), 8 moeilijke (gr) en 4 complexe (or, or+gr) items. Afhankelijk van welke items de kinderen kunnen oplossen, worden zij vervolgens in verschillende groepen verdeeld. De groepen zullen op basis van de gebruikte denkregels van elkaar verschillen. De BOFF maakte gebruik van zogenaamde spiegelitems. Dit zijn twee items Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
16 die dezelfde denkregels vereisen maar er anders uit zien. Deze items zouden achterhalen of de kinderen de regels daadwerkelijk hadden begrepen of dat ze alleen het item en het bijhorende juiste antwoord hadden onthouden. In de test werden in totaal 10 spiegelitems gebruikt en 10 originele items uit de Rekentuin. Acht ervan werden gegenereerd door de kleur van de bloemen te veranderen, en bij de twee overige items werd telkens een item gespiegeld door gehele rijen te verwisselen en/of door de kolommen te verwisselen. De testafname was klassikaal. De kinderen kregen een gekleurd opgavenboekje, een zwart-wit antwoordenboekje en een pakje viltstiften. Er waren twee versies: A en B. Beide versies bestonden uit precies dezelfde opgaves maar waren in tegenovergestelde volgorde afgebeeld. Op elke pagina stond één opgave afgebeeld. De kinderen moesten de opgave in het opgavenboekje bekijken en met de viltstiften op de bijpassende pagina van het antwoordenboekje het juiste antwoord intekenen. Dit deden zij doormiddel van het witte stipje in te kleuren met de betreffende kleur van de gekozen bloem. Over de betrouwbaarheid en validiteit kan er nu nog geen uitspraak worden gemaakt, dit zal uit de resultaten blijken. De BOFF werd op een manier ontwikkeld zodat hij aan de in de inleiding genoemde eisen voldeed en daarmee op een valide en betrouwbare manier uitspraken over logisch redeneren bij kinderen kon maken. (1) Hij was non-verbaal: kinderen moesten geen uitleg geven voor het gegeven antwoord. (2) De test had een helder doel: kinderen speelden een spel om erachter te komen welke code juist was. (3) De BOFF was context-vrij: kinderen konden geen gebruik maken van eerdere ervaring uit hun eigen leven op het gebied van bloemen en kleuren. (4) Er werd geen verbale instructie gegeven: kinderen moesten bij het maken van de online versie zelf uitzoeken hoe de test werkte. Dit deden zij met name doormiddel van trial-and-error. (5) Voorafgaande training: kinderen kregen de mogelijkheid om drie weken zelf te Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
17 oefenen voordat zij de eigenlijke test moesten doen. Afhankelijk van het denkniveau van de kinderen, liep de moeilijkheid van de items langzaam op. Dit bracht hen op een optimaal prestatieniveau. En als aanvulling werd de test gecombineerd met informatie over werkgeheugencapaciteit en inhibitievermogen.
2.3. Procedure Via een passieve consentbrief werden de ouders en/of verzorgers van de scholieren ingelicht over het onderzoek. Verder werd in deze brief de Rekentuin nader toegelicht en werden de ouders verzocht hun kinderen te stimuleren om actief in de Rekentuin te spelen. Vervolgens kregen de scholieren de inloggegevens voor de Rekentuin op school uitgedeeld zodat zij zelfstandig thuis en op school aan de slag konden met spelen. Elk kind had een eigen account waarbij de resultaten werden opgeslagen. De kinderen konden verschillende spelletjes doen zodat ook informatie over complex redeneren (Cijfers) en het werkgeheugen (Mollen) kon worden verzameld. De data van de scholieren was meteen op de server van de Universiteit van Amsterdam beschikbaar en voor de onderzoekers op te roepen. Na een online spelperiode van drie weken werd de eigenlijke offline test (BOFF) afgenomen. De testafname duurde 20-30 minuten per klas. De onderzoekers gaven de kinderen een korte instructie en vervolgens konden de kinderen klassikaal aan de slag.
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
18
3. Resultaten 3.1. Manipulatiecontroles
Zoals al in de methode sectie genoemd, bleven er 103 deelnemers over, waarvan 47 meisjes en 56 jongens (gemiddelde leeftijd = 9,85; standaardafwijking = 1,15). Voor elk van de deelnemers werd de totaalscore van de BOFF berekend, zie figuur 2. Omdat de verdeling van de score bimodaal was, werd er een IndependentSample Mann-Whitney U toetsen uitgevoerd om te onderzoeken of er een verschil was gevonden in versie van de toets (A of B), leeftijd en sekse van de deelnemers ten opzichte van de behaalde totaalscore op de test. De versie van de test en sekse waren niet gerelateerd aan de testscores van de kinderen. Leeftijd hing wel samen met testscores, p < 0.05. Deze uitkomsten zijn conform onze verwachting.
Figuur 2. Verdeling van de Somscore op de BOFF
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
19 Uit een betrouwbaarheidsanalyse bleek dat de 20 samengestelde testitems een betrouwbare test vormden (Cronbach's α = .91). Deze betrouwbaarheid kon niet worden verhoogd door items weg te laten. Om te kunnen controleren dat deelnemers de items uit de Rekentuin niet zomaar hadden gememoriseerd, werden de eerder geïntroduceerde spiegelitems gebruikt. Om te onderzoeken of de originele items en spiegelitems op verschillende manieren werden beantwoord, werd een Independent-Sample Mann-Whitney U test uitgevoerd. De twee groepen van originele items en spiegelitems verschilden niet significant van elkaar met betrekking tot de gemiddelde behaalde score op de test. Dit betekent dat de bekende items uit de Rekentuin niet makkelijker op te lossen waren dan de nieuw gecreëerde items.
3.2. Latente Klassenanalyse
Om te onderzoeken of de kinderen op basis van hun antwoorden in verschillende groepen in te delen waren, werd een latente klassenanalyse uitgevoerd (LCA), zie Tabel 2.
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
20 Tabel 2. Goodness-of-Fit indicaties voor Latente Klassenmodellen van de Antwoorden op de BOFF. ___________________________________________________________________ Model
log Lik.
df
BIC
1
-762,97
12
1581,56
2
-473.68
25
1063,24
3
-437.25
38
1050,63
4
-425,51
51
1087,39
Zoals in de tabel te zien was het model met de laagste BIC index het model met drie klassen. Dit model werd vervolgens gekozen om de gevonden klassen te kunnen interpreteren op basis van de gegeven antwoorden per item, zie Tabel 3.
Tabel 3. Conditionele kansen en Latente Klassen kansen voor de drie Subgroepen matig (1), gemiddeld (2) en goed (3).
Subgroepen Items
P(corr)
matig
gemiddeld
goed
___________________________________________________________________ Item2
0,28
0,55
0,79
Item3
0,06
0,15
0,83
Item4
0,00
0,64
0,98
Item6
0,68
0,93
1
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
21 Item7
0,05
1
1
Item8
0,08
0,09
0,93
Item9
0,37
0,49
0,85
Item10
0,00
0,29
1
Item12
0,00
0,92
0,91
Item13
0,71
0,93
1
Item15
0,00
0,77
0,87
Item17
0,11
0,79
0,94
___________________________________________________________________ Latente Klassenkansen
0,33
0,14
0,52
___________________________________________________________________
Items 1, 5, 11, 14, 16, 18, 19 en 20 werden niet meegenomen in de LCA. Deze items waren niet gerelateerd aan klassenlidmaatschap. Deze analyse toont drie interpreteerbare subgroepen die significant verschilden op de testresultaten van de BOFF. De drie subgroepen konden worden geïnterpreteerd op basis van de denkregels van de kinderen, de eerste groep bestond voornamelijk uit kinderen die bijna alle items fout hadden gemaakt, de tweede groep bestond uit kinderen die de meeste items goed en alleen de complexe items fout hadden gemaakt en in de derde groep hadden de kinderen nagenoeg alle items goed gemaakt. We hebben deze groepen (1) matig, (2) gemiddeld en (3) goed genoemd. Deze uitkomsten lopen in lijn met de verwachting, dat er op basis van de gebruikte denkregels verschillende groepen naar voren zouden komen. Ter verduidelijking is het aantal kinderen per klasse met de bijhorende leeftijd en testresultaten op de BOFF is weergegeven in Figuur 3. Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
22
Figuur 3. Percentage Kinderen per Klas (matig, gemiddeld of goed) met bijhorende Leeftijd.
De drie subgroepen verschilden significant ten opzichte van leeftijd (KruskalWallis: H(2) = 30,43, p < 0.05). Verder werd met een Jonckhere-Terpstra test een significante trend gevonden: hoe hoger het behaalde testresultaat van een subgroep, hoe hoger ook de leeftijd van de kinderen binnen deze subgroep, (J = 2377, z = 5.47, r < 0.05). Deze uitkomsten lopen in lijn met de in de inleiding genoemde verwachtingen dat leeftijd gerelateerd zou zijn aan het juist kunnen beantwoorden van bepaalde items en zou steun geven aan de hypothese dat jongere kinderen minder complexe denkregels gebruiken dan oudere kinderen. Ter verduidelijking werd het aantal deelnemers met de bijhorende leeftijd en sekse van de drie gevonden subgroepen in een tabel geplaatst, zie Tabel 4.
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
23 Tabel 4. Aantal deelnemers (N), gemiddelde Leeftijd met bijhorende Standaardafwijking (SD) en Sekse (M/V) van de drie Subgroepen. ___________________________________________________________________ N
M
V
Gemiddelde leeftijd
SD
____________________________________________________ Matig
35
20
15
9.09
0.95
Gemiddeld
13
6
7
9.54
1.33
Goed
55
30
25
10.42
0.89
___________________________________________________________________
3.3. Logistische Regressieanalyse
Om te toetsen of er een specifieke samenhang bestond tussen logisch redeneren, werkgeheugencapaciteit en inhibitievermogen, werd een multinomiale logistische regressieanalyse uitgevoerd, hierbij werden ook leeftijd en IQ als mogelijke factoren van invloed meegenomen. Omdat de flankertask bij slechts 68 deelnemers van de gehele steekproef van de 103 werd afgenomen, werd een model gemaakt gebaseerd op alléén de 68 deelnemers. Het model met de voorspellers leeftijd, rating op het spel Cijfers (IQ) en rating op het spel Mollen (werkgeheugen) kon de grootste proportie variantie verklaren, X²(10) = 36.1, p < 0.05. Hier kon echter alleen een trend worden gevonden voor de interactie tussen leeftijd en werkgeheugen voor groep 2 (matig), ten opzichte van groep 3 (goed). Dit zou betekenen dat naarmate de kinderen ouder worden, werkgeheugencapaciteit een grotere voorspeller lijkt te zijn tot welke groep zij zullen behoren. Voor de rest van de mogelijke voorspellers konden geen significante effecten werden gevonden. Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
24 Omdat het aannemelijk lijkt dat door het weglaten van een groep deelnemers (omdat er geen gegevens van de flankertask waren) de resultaten minder veelzeggend zijn dan wanneer men de hele groep had geanalyseerd, werd vervolgens gekeken in hoeverre de resultaten veranderden bij een analyse van de gehele data. Dit werd gedaan zonder de variabele “inhibitievermogen” mee te nemen. Ook hier kon het model met de voorspellers leeftijd, rating op het spel Cijfers (IQ) en rating op het spel Mollen (werkgeheugen) de grootste proportie variantie verklaren, R² = .38, X²(10) =50,12, p < 0.05, zie Tabel 5.
Tabel 5. Verklaarde Variantie met bijhorende Standaardafwijking (SD), Significantieniveau en Odds-Ratio van het Model met de Voorspellers Werkgeheugen (rating.40), Leeftijd en IQ (rating.11).
95% Betrouwbaarheidsinterval voor Odds B
(SD)
Sig.
Odds Ratio
____________________________________________________ matig (1) Intercept
.17
(6.8)
.98
IQ
–.11
(.19)
.57
.894
Leeftijd
.074 (.69)
.91
1.07
Werkgeheugen
1.33 (.71)
.06
3.77
Leeftijd * Werkgeheugen –.15 (.07)
.04*
.861
IQ*Werkgeheugen
.84
1.00
.003 (.01)
____________________ Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
25 gemiddeld (2) Intercept
-10.6 (8.6)
.21
IQ
–.26 (.26)
.31
.767
.92 (.84)
.27
2.51
1.64 (.78)
.03*
5.15
Leeftijd * Werkgeheugen –.17 (.07)
.03*
.847
IQ*Werkgeheugen
.38
1.02
Leeftijd Werkgeheugen
.02 (.02)
(referentiegroep: goed) n = 103 R² = .38. Model X² (10) = 50,12, p < 0.05.
3.3.1 Werkgeheugen en Leeftijd Zoals uit de tabel af te lezen werd er een significant effect van werkgeheugen voor groep 2 (gemiddeld) ten opzichte van groep 3 (goed) gevonden. Dit betekend dat er significant meer kinderen met een hoog werkgeheugen (M = 2,45 SD = 0,84) in de goede groep zaten vergeleken met de kinderen met een laag werkgeheugen (M = 1,96 SD = 0,93). Verder werd er een significant interactie effect tussen leeftijd en werkgeheugen gevonden in groep 1 en 2 ten opzichte van groep 3. Het was lastig het gevonden interactie effect alleen op basis van bovenstaande tabel te interpreteren. Daarom werden er twee bar plots gemaakt van werkgeheugencapaciteit en leeftijd. Hiervoor werd het gemiddelde van de werkgeheugencapaciteit berekend van alle deelnemers (M = 10,31). Vervolgens werden er twee groepen gemaakt: kinderen die onder het gemiddelde scoorden met betrekking tot hun werkgeheugencapaciteit, zie Figuur 3; en kinderen die boven het gemiddelde scoorden met betrekking tot hun werkgeheugencapaciteit, zie Figuur 4.
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
26 Figuur 3 (boven) en Figuur 4 (beneden) Percentage Kinderen per Klas met bijhorende Leeftijd met een lager en hoger dan gemiddelde werkgeheugencapaciteit.
Vergelijkt men beide figuren met elkaar dan vallen volgende dingen op: 1. Kinderen die lager dan gemiddeld op werkgeheugencapaciteit scoren en bovendien jong zijn zitten voornamelijk in de matige groep. Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
27 2. Kinderen die lager dan gemiddeld op werkgeheugencapaciteit scoren en wat ouder zijn zitten in de goede groep. 3. In verhouding zitten er meer kinderen met een lager dan gemiddelde werkgeheugencapaciteit in de matige/ gemiddelde groep dan in de goede groep. 4. Kinderen die hoger dan gemiddeld scoren op werkgeheugencapaciteit en bovendien jonger zijn zitten voornamelijk in de matige en/of gemiddelde groep. 5. Kinderen die hoger dan gemiddeld scoren op werkgeheugencapaciteit en bovendien ouder zijn zitten voornamelijk in de goed groep. 6. In verhouding zitten er meer kinderen met een hoger dan gemiddelde werkgeheugencapaciteit in de goede groep dan in de matige/gemiddelde groep. Deze uitkomsten betekenen dat leeftijd alleen geen voorspeller is voor klassenlidmaatschap. Leeftijd samen met werkgeheugen heeft echter wel een significante effect: dit betekent dat het effect van leeftijd op klassenlidmaatschap afhankelijk is van het werkgeheugen: Oudere kinderen met een hoge werkgeheugencapaciteit zitten vaker in de goede groep dan jongere kinderen met een hoge werkgeheugencapaciteit en oudere en jongere kinderen met een lage werkgeheugencapaciteit. Met andere woorden: Werkgeheugen lijkt meer effect te hebben op het gebruiken van denkregels naarmate kinderen ouder worden. Leeftijd speelt dus alleen een specifieke rol bij een hoog werkgeheugen en niet bij een laag werkgeheugen. Deze bevindingen lopen gedeeltelijk in lijn met de verwachtingen. Verwacht werd dat zowel werkgeheugencapaciteit als inhibitievermogen samen zouden hangen met logisch redeneren. De resultaten bevestigen de verwachting over werkgeheugencapaciteit: uit de test kwam naar voren dat werkgeheugencapaciteit specifiek samenhangt met logisch redeneren. Door tekort aan data over inhibitievermogen kon over inhibitie als voorspeller geen uitspraak worden gedaan. Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
28
3.4. Alternatieve Antwoorden Om meer uitspraken te kunnen doen over wat kinderen doen ook wanneer zij het juiste antwoord niet wisten werd ook naar de meest gemaakte fouten van enkele items gekeken. Hierbij kwam vooral naar voren dat er telkens een of twee veelvoorkomende alternatieve foute antwoorden werden gemaakt. Deze foute antwoorden werden in alle drie de subgroepen, in verschillende verhoudingen, terug gevonden.
3.4.1.Externe bloem Kinderen vonden het daadwerkelijk lastig, zoals in de inleiding al genoemd, om een externe bloem (een niet in de opgave voorkomende bloem) in het antwoord op te nemen. Een veelgemaakte fout bij zo’n item was bijvoorbeeld “blauw-blauw” in plaats van “blauw-groen”, zie Figuur 5. Dit soort fouten werden in alle subgroepen terug gevonden. In de matige groep werd deze fout echter het meest aangetroffen.
Figuur 5.
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
29
3.4.2. Vergeten te wisselen Verder leken sommige kinderen te zijn vergeten dat zij twee bloemen met elkaar van plaats moesten verwisselen bij een item met het feedback oo terwijl ze de regel “goede bloem maar niet op de juiste plaats” wel hadden begrepen. Een veelvoorkomend alternatief antwoord bij dit item was “rood-groen” in plaats van “groen-rood”, zie Figuur 6. Figuur 6.
3.4.3. Eerste lamp hoort bij eerste bloem Met name jongere kinderen maakten de fout te denken dat het eerste lampje van het gegeven feedback ook hoorde bij de eerste bloem en het tweede lampje bij de tweede bloem. Hierdoor zouden de gemaakte fouten, zoals “blauw-geel” of “geelblauw” in plaats van “oranje-geel” (zie Figuur 7) tot stand kunnen zijn gekomen.
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
30
Figuur 7.
3.4.4. Regel fout toegepast Items die vooral in de gemiddelde groep fout gemaakt werden, waren complexe items. Dit waren items waar het kind de feedback gr moest interpreteren. De jongste kinderen (afkomstig uit de matige groep) en iets oudere kinderen (afkomstig uit de gemiddelde groep) bleken deze items nagenoeg allemaal fout te maken, zie Figuur 7. In de gemiddelde groep was echter te zien dat kinderen wel systematisch antwoorden, maar niet de correcte oplossing gaven. Er kwamen voornamelijk twee antwoordalternatieven voor, in het geval van Figuur 7 waren dat de antwoorden “blauw-blauw” en “blauw-geel”. Terwijl in de matige groep alle antwoordmogelijkheden vrijwel random werden gegeven. In de derde groep konden de meeste kinderen ook deze complexe opgaven juist oplossen. Kijken wij eerst naar het antwoord, “blauw-blauw”. Kinderen, die dit antwoord hebben gegeven, hebben de regel van dit item blijkbaar begrepen: er branden twee gele Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
31 lampjes als feedback, dus zijn twee van de vier bloemen juist maar staan op een verkeerde plek. De kinderen dachten dat de blauwe bloem juist was en van plek verwisseld moest worden. Hierbij hadden zij niet in de gaten dat het niet uitmaakt als men “blauw-blauw” van plek verwisseld, dat er dan namelijk nog steeds hetzelfde antwoord uit komt. De intentie van de kinderen was echter wel juist, alleen hebben zij de foute bloemen van plek verwisseld. Het tweede antwoord was “blauw-geel”. De kinderen hebben kennelijk gedacht dat de gele lampjes telkens bij de eerste bloem van elke rij hoorde. Ze hebben de bloemen daarna echter niet van plek verwisseld. Het lijkt erop dat deze groep de regel van de gele lamp niet goed had begrepen.
4. Discussie
Eerder onderzoek heeft aangetoond dat kinderen abstracte denkregels gebruiken (Gopnik Glymour, Sobel, Danks, Schulz & Kushnir, 2004). Het doel van deze studie was het te onderzoeken of kinderen denkregels ook hanteerden voor het oplossen van een logisch redeneertaak, in dit geval de deductieve versie van Mastermind. Verder was het de vraag op welke manier deze denkregels van elkaar verschilden. Daarom hebben we gekeken naar wat kinderen doen als zij het antwoord niet weten. De resultaten laten zien dat kinderen ook voor het oplossen van deze taak abstracte denkregels gebruiken. De per kind toegepaste denkregels hangen samen met de werkgeheugencapaciteit van het kind. Leeftijd alleen hangt niet samen met deze regels: alleen in combinatie met het werkgeheugen kan er een samenhang worden gevonden: Dit houdt in dat de complexiteit van de denkregels toeneemt met leeftijd, mits de werkgeheugencapaciteit toeneemt. Als werkgeheugen Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
32 laag is speelt leeftijd een minder grote rol. Wat betreft het niet geven van het juiste antwoord lijkt het zo te zijn dat een subgroep van de kinderen hun eigen logica ontwikkelt. Kinderen lijken daarom in gradaties te leren. Ter duidelijkheid zullen hieronder alle resultaten per onderdeel worden opgesomd.
4.1. Leeftijd Aan de hand van de gebruikte denkregels konden drie groepen worden onderscheiden. We noemden deze groepen (1) matig, (2) gemiddeld en (3) goed. Deze drie groepen verschilden verder ook in gemiddelde leeftijd: de jongste kinderen bevonden zich voornamelijk in groep 1 (matig), iets oudere kinderen in groep 2 (gemiddeld) en de oudste kinderen in groep 3 (goed). Leeftijd was echter geen directe voorspeller.
4.2. Werkgeheugen Werkgeheugencapaciteit verklaarde de samenhang met leeftijd: Hoe groter de capaciteit van het werkgeheugen was, hoe beter het kind kon logisch redeneren, dit gold vooral voor oudere kinderen. Verder leek werkgeheugen samen te hangen met leeftijd: naarmate kinderen ouder werden, leek de werkgeheugencapaciteit een grotere rol te spelen bij logisch redeneren.
4.3. Inhibitievermogen Gezien het gebrek aan voldoende data op de Eriksen Flankertask, werd deze variabele niet verder onderzocht. Voor de kleinere groep van 68 deelnemers, die wel de flankertask had gedaan, werd geen samenhang met logisch redeneren gevonden.
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
33 4.4. IQ De gevonden resultaten konden geen specifiek verband tussen IQ en logisch redeneren aantonen. Het gemiddelde IQ verschilde echter wel tussen de drie groepen.
De genoemde bevindingen ondersteunen de in de inleiding genoemde hypothesen, dat kinderen verschillende denkregels zullen gebruiken bij het oplossen van logische redeneertaken. Het gebruik van deze denkregels lijkt daarnaast niet gerelateerd te zijn aan de leeftijd van het kind. Dit is niet conform de verwachting. De laatste verwachting, een specifieke samenhang tussen logisch redeneren, werkgeheugen en inhibitie, kon alleen gedeeltelijk worden aangetoond. Werkgeheugen leek specifiek samen te hangen met logisch redeneren. De verwachting dat inhibitievermogen samen zou hangen met logisch redeneren, kon niet worden bevestigd. Een verklaring hiervoor zou kunnen zijn dat niet alle kinderen die in dit onderzoek zijn meegenomen de Eriksen flankertask hebben gedaan. De afname van de flankertask was onderdeel van een ander onderzoek wat gaande was op de basisschool de Crayenester. Wij konden gebruik maken van de beschikbare data. Deze data was echter niet volledig: bij 35 kinderen die deel uitmaakten van de beschreven steekproef van dit onderzoek werd geen flankertask afgenomen. Een te kleine steekproef zou een verklaring kunnen zijn dat in dit onderzoek de verwachte samenhang tussen inhibitie en logisch redeneren niet kon worden aangetoond. In vervolgonderzoek zou er rekening mee moeten worden gehouden dat er alle data van de gehele steekproef beschikbaar is. In de inleiding van dit onderzoeksverslag werden enkele onduidelijkheden genoemd met betrekking tot denkregels van kinderen. Onduidelijk was tot nog toe (1) wat er ten grondslag zou liggen aan eventuele verschillen van mogelijke denkregels Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
34 en op (2) welke manier kinderen de opgaven zouden oplossen, vooral als zij het juiste antwoord niet zouden weten. Deze vragen kunnen, met betrekking tot logisch redeneren, als volgt worden beantwoord: (1) de gevonden denkregels lijken in complexiteit van elkaar te verschillen. Complexiteit lijkt toe te nemen naarmate de leeftijd en werkgeheugencapaciteit van het kind vordert: met andere woorden jongere kinderen lijken minder complexe denkregels te gebruiken dan oudere kinderen, mits zij een hoge werkgeheugencapaciteit hebben. Ook werkgeheugencapaciteit lijkt samen te hangen met logisch redeneren. (2) De tweede vraag was iets lastiger te beantwoorden. Gezien de alternatieve antwoorden die werden gegeven wanneer kinderen geen correct antwoord gaven op een vraag kon er deels een structuur worden gevonden. Dit was voornamelijk het geval bij complexe items (met het feedback gr). Om deze bevinding te verduidelijken: Item 2 uit de BOFF behoort tot de complexe items, zie Figuur 7. Hier kwam naar voren dat nagenoeg alle kinderen uit de goede groep dit item juist konden beantwoorden. In de gemiddelde en matige groep werd dit item nagenoeg allemaal fout gemaakt. In de matige groep kon op basis van de gegeven foute antwoorden geen structuur worden gevonden, dit was wel het geval in de gemiddelde groep. Hier kwamen vooral twee antwoordalternatieven naar boven. Deze hebben we in de resultaten sectie al nader besproken en het kan geconcludeerd worden dat kinderen de regel die bij item 2 hoort wel hebben begrepen, maar niet juist konden toepassen. Deze bevinding lijkt erop te duiden dat kinderen in gradaties leren. Het is niet zo dat kinderen op een bepaalde leeftijd een opgave wel of niet kunnen oplossen, maar ze begrijpen naarmate zij ouder worden steeds meer en kunnen uiteindelijk wel het goede antwoord geven. Verder kon nieuwe en oude kennis met betrekking tot de Bloemencode worden vergaard en deels bevestigd: (1) met name jonge kinderen vonden het lastig Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
35 om een externe bloem erbij te halen. Dit werd al door Gierasimczuk et al. (accepted) geopperd en kon in deze studie eveneens worden aangetoond. (2) De verwachting dat kinderen negatieve feedback zouden negeren en alleen positief feedback zouden meenemen, hebben we niet goed kunnen bevestigen. Het was wel te zien dat complexe items moeilijk te beantwoorden zijn, maar op grond van de foute antwoorden kon niet eenduidig worden geconcludeerd dat de kinderen negatieve feedback hebben genegeerd. De items uit de BOFF waren op basis van hun moeilijkheidsratings uit de Rekentuin gehaald en dan telkens gespiegeld of veranderd. Het leek niet zo te zijn dat kinderen de “bekende” items uit de Rekentuin hadden gememoriseerd en bij de spiegels ervan hetzelfde, gememoriseerde, antwoord gaven. Ook beantwoordden vrijwel alle kinderen de controle items juist (rr/oo). Deze items hadden een makkelijke rating en zouden nagaan of het kind het spel bloemencode überhaupt had begrepen. Aangezien deze bevindingen kan voor de validiteit van de BOFF worden gewaarborgd. Dit onderzoek was een belangrijke toevoeging op het gebied van testen om logische redeneervaardigheid te toetsen. Geen van de in de inleiding genoemde bestaande testen (Siegler`s Balancetaak, WST, Stackelberg game) voldeed aan de eisen die ervoor zouden zorgen dat de test een valide en betrouwbaar construct werd. In dit onderzoek werd een test ontwikkeld die aan alle vijf de genoemde eisen voldeed: 1) non-verbaliteit 2) met een helder doel 3) contextvrijheid 4) zonder uitgebreide verbale instructie en 5) met voorafgaande training. Daarnaast werden ook de werkgeheugencapaciteit en het inhibitievermogen van de kinderen worden meegenomen. Aangezien dit onderzoek aan alle eisen voldoet zijn de gevonden uitkomsten relevante en waardevolle informatiebronnen die valide uitspraken kunnen maken over de logische redeneervaardigheid en het gebruik van abstracte Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
36 denkregels bij kinderen.
4.5. Kritiekpunten Desalniettemin zijn er enkele kritiekpunten die genoemd moeten worden: de BOFF werd in de klas afgenomen. In sommige klaslokalen was het behoorlijk druk en kinderen riepen antwoorden door de klas of hielpen elkaar. De testleiders hebben zo veel mogelijk geprobeerd rust te creëren om te voorkomen dat kinderen samen werkten. Helemaal voorkomen worden kon het echter niet. Dit kritiekpunt betekent echter geen serieus gevaar voor de validiteit van dit onderzoek: het werden namelijk alleen kinderen voor de BOFF geselecteerd die meer dan 15 keer in de Rekentuin hadden gespeeld voordat de test werd afgenomen. Het lijkt aannemelijk dat de kinderen die niet wisten wat zij moesten doen tijdens de test en die daarom de klas verstoorden, later op basis van de selectie uit de data zijn verwijdert en daarmee geen gevaar voor de betrouwbaarheid van de test zijn. Misschien zou men er in vervolgonderzoek toch erop kunnen letten dat de tafels in zogenaamde “toets-stand” staan zodat er zo min mogelijk afleiding is voor de kinderen. Een ander punt van kritiek is het niet afnemen van de flankertask bij de gehele steekproef. Dit kwam doordat de testleiders met twee onderzoeken tegelijkertijd bezig waren en er geen tijd meer was de overige 35 kinderen ook nog te testen. Het is jammer dat er nu niet van ieder kind data beschikbaar is en er daardoor geen (of weinig) uitspraak gedaan kan worden over het wel of niet bestaan van een samenhang tussen inhibitievermogen en logisch redeneren. In een vervolgonderzoek zou men erop moeten letten dat alleen kinderen meegenomen worden waarvan alle gegevens beschikbaar zijn. Een derde aanmerking is het gebruiken van een blauwe stip voor het antwoord: “witte bloem”, zie Figuur 8. Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
37
Figuur 8.
Sommige kinderen leken tijdens het maken van de test in de war te raken bij het geven van een antwoord. Zij hadden niet door dat de witte bloem bij een blauwe stip hoorde. Dit zou de gegeven antwoorden gedeeltelijk kunnen hebben vervalst. Bij een analyse van de meest genoemde alternatieve antwoorden bleek echter geen sprake te zijn van een massale verwarring. Voor vervolgonderzoek zou het desondanks veiliger zijn om alleen bloemen te gebruiken die met dezelfde gekleurde stip kunnen worden aangegeven. Dit was in dit geval niet mogelijk omdat er originele items uit de Rekentuin werden genomen. Hier hoort de witte bloem bij de standaarditems. Een laatste kritiekpunt is het niet meenemen van onvolledige data. Kinderen die minstens een item niet hadden gemaakt werden van de analyses uitgesloten. Met het uitsluiten van deze kinderen zou waardevolle informatie kwijtgeraakt kunnen zijn. Het is voor te stellen dat juist kinderen die de test niet hebben kunnen afmaken in de voorgeschreven tijd van 30 minuten bepaalde denkregels hanteerden die essentieel
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
38 verschilden van de denkregels van kinderen die wel alles op tijd hadden kunnen afronden. Het uitsluiten van de data is echter geen gevaar voor de gevonden resultaten. Deze zouden niet veranderen wanneer we de gehele data hadden gebruikt. Het includeren van de data had, naast enkele nadelen waaronder onoverzichtelijkheid, wel een voordeel kunnen hebben: wellicht hadden wij nog meer klassen gevonden. Voor een vervolgonderzoek is het dan ook aan te raden om alle data in de analyses te includeren.
Uit beschreven resultaten komt naar voren dat er duidelijke verschillen bestaan bij het toepassen van abstracte denkregels tussen kinderen in verschillende leeftijdscategorieën. Kinderen zijn aan de hand van de gebruikte denkregels in te delen in verschillende groepen. Het leren van het oplossen van logische redeneertaken verloopt verder in gradaties. Het is niet zo dat het ene kind het helemaal wel kan en het andere kind helemaal niet: het ene kind weet er meer over dan het andere en zal daardoor andere fouten maken. Bovendien komt naar voren dat kinderen met een hoge werkgeheugencapaciteit complexere denkregels toepassen dan kinderen met een lagere werkgeheugencapaciteit. De rol van werkgeheugencapaciteit op het niveau van denkregels wordt groter naarmate de kinderen ouder worden. Dit zijn belangrijke bevindingen die implicaties in het onderwijs met zich mee zouden kunnen brengen. Mogelijk kunnen trainingen van de werkgeheugencapaciteit de vaardigheid tot logisch redeneren verhogen: Leraren zouden ervoor kunnen zorgen dat er extra aandacht wordt besteed aan het trainen van het werkgeheugen. Dit kan op allerlei manieren, bijvoorbeeld met bepaalde computerspelletjes (Mollen) of spellen voor de smartphone. Verder lijkt kennis niet over nacht te ontstaan maar in gradaties te groeien over een bepaalde periode: dit werd duidelijk aan de hand van de gegeven antwoorden: bij sommige items wisten Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
39 kinderen wel dat zij een bepaalde regel moesten toepassen, maar niet hoe. Gezien het in de inleiding beschreven gebrek aan een valide en betrouwbaar meetinstrument voor logisch redeneren, was het van wetenschappelijk belang dit onderzoek uit te voeren en daarmee een manier te vinden om de door kinderen gebruikte denkregels op een specifieke logisch redeneertaak daadwerkelijk te kunnen achterhalen. Ook zouden op basis van de gevonden uitkomsten sommige theorieën moeten worden bijgesteld: Kinderen zijn al jonger dan11 jaar in staat tot logisch redeneren, Piaget’s theorie lijkt in dit punt niet juist te zijn. Om het onderwijs eventueel te kunnen aanpassen op de leerbehoeftes van kinderen, was het eveneens in maatschappelijke zin van belang te onderzoeken of kinderen denkregels toepassen bij logisch redeneren en wat zij doen als zij een antwoord niet zouden weten
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
40
5. Literatuur
Byrne, R.M.J. (1989). Suppressing valid inferences with conditionals. Cognition, 31, 61–83.
Flobbe, L., Verbrugge, R., Hendriks, P. & Krämer, I. (2008). Children's application of theory of mind in reasoning and language. Journal of Logic, Language and Information, 17, 417 – 442.
Gierasimczuk, N., van der Maas & H., Raijmakers, M. (in press). Logical and Psychological Analysis of Deductive Mastermind.
Gopnik, A. (2004). Finding our inner scientist. American Academy of Arts, 21 – 28.
Gopnik, A., Glymour, C., Sobel, D.M., Schulz, L.E., Kushnir, T. & Danks, D. (2004). A theory of causal learning in children: causal maps and bayes nets. Psychological Review, 1, 3-32.
Goswami, U. (2007). Cognitieve Development. Psychology Press.
Klinkenberg, S., Straatemeier, M. & van der Maas, H.L.J. (2011). Computer adaptive practice of Maths ability using a new item response model for on the fly ability and difficulty estimation. Computers & Education, 1 – 12.
Markovits, H. & Vachon, R. (1990). Conditional reasoning, representation and level of Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
41 abstraction. Developmental Psychology, 26, 942 – 951.
McCutcheon, A. L. (1987). Latent class analysis. Quantitative Applications in the Social Sciences Series, 64.
Moutier, S., Plagne-Cayeux, S., Melot, A.M. & Houdé, O. (2006). Syllogistic reasoning and belief-bias inhibition in school children: Evidence from a negative priming paradigm. Developmental Science, 9, 166–172.
Raijmakers, M. E. J., Jansen, B. R. J. & van der Maas, H. L. J. (2004). Rules and development in triad classification taks performance. Developmental Review, 24, 289 – 321.
Raijmakers, M. E. J., Mandell, D. J., van Es, S. E. & Counihan, M. (in press). Children's strategy use
when playing strategic games.
Ridderinkhof, K. R., & van der Molen, M. W. (1995). A psychophysiological analysis of developmental differences in the ability to resist interference. Child Development, 66,
1040–1056.
Schmittmann, V. D., van der Maas, H. L. J. & Raijmakers, M. E. J. (2012). Distinct discrimination learning strategies and their relation with spatial memory and attentional control in 4- to Psychology,
14-year olds. Journal of Experimental Child
111, 644 – 662.
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
42
Siegler, R. S. & Chen, Z. (2008). Differentiation and integration: guiding principles for analyzing cognitive change. Developmental Science, 11, 433 – 453.
Stenning, K. & van Lambalgen, M. (2000). Semantics as a foundation for psychology: a case study of Wason's selection task. Journal of Logic, Language and Information,
10, 273 – 317.
Straatemeijer, M., Van der Maas, H. & Klinkenberg, S. (2009). Werken in de rekentuin. Spelenderwijs oefenen en meten. Volgens Bartjens, 28, 4 – 6.
Van Duijvenvoorde, A. C. K., Zanolie, K., Rombouts, S. A. R. B., Raijmakers, M. E. J., & Crone, E. a. (2008). Evaluating the negative or valuing the positive? Neura mechanisms supporting feedback-based learning across development. The Journal of Neuroscience, 28, 9495–9503.
Van der Ven, S.H.G., van der Maas, H.J.L., Straatemeier, M., Jansen, B.R.J. (submitted). Visuo-spatial working memory and math ability throughout primary school.
Wason, P.C. (1960). On the failure to eliminate hypotheses in a conceptual task. Quarterly Journal of Experimental Psychology. 12, 129–140.
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
43
APPENDIX A
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
44
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
45
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
46 APPENDIX B
Beste ouder(s)/verzorger(s), De school van uw kind, Crayenester te Heemstede, verleent medewerking aan een onderzoek naar logisch redeneren bij kinderen, van de programmagroep Ontwikkelingspsychologie van de Universiteit van Amsterdam. Middels deze brief willen wij u informeren over dit specifieke onderzoek en u vriendelijk vragen uw toestemming te verlenen voor deelname van uw kind hieraan. De schoolleiding vindt medewerking aan het onderzoek nuttig en acht deelname van uw kind niet strijdig met het belang van het kind of de school. Het onderzoek vindt vanaf eind oktober 2012 tot en met januari 2013 plaats op school en wordt in overleg met de leerkrachten uitgevoerd. Doel van het onderzoek Dit onderzoek heeft als doel het bestuderen van logisch redeneren van kinderen met een leeftijd tussen de negen en 12 jaar. Er wordt gekeken welke denkregels kinderen gebruiken bij het oplossen van een logisch redeneertaak in de Rekentuin. De Rekentuin is een online tuin waarin rekenspelletjes gespeeld kunnen worden om de eigen rekenvaardigheden te verbeteren en werd ontwikkeld door de Universiteit van Amsterdam. De vraag waar we ons in dit onderzoek specifiek op richten is of kinderen vorderingen maken in logisch redeneren wanneer zij hun gebruikte strategieën verbaliseren en uitleggen aan een ander kind via een instructiefilmpje dat ze maken. Na afloop van het onderzoek wordt u op de hoogte gesteld van de algemene resultaten van het onderzoek. We zullen en kunnen geen uitspraken doen over individuele kinderen. Het onderzoek betreft de vergelijking van groepen kinderen. Deze vergelijking levert mogelijk informatie op over hoe het leren van logisch redeneren bij kinderen bevordert kan worden in het onderwijs. Procedure De kinderen krijgen de opdracht gedurende enkele weken regelmatig spelletjes te spelen in de Rekentuin. Dit zijn rekenspelletjes die op een leuke en speelse manier zijn vorm gegeven. Kinderen kunnen zowel thuis als op school oefenen in de Rekentuin. Naar een oefenperiode van enkele weken zal er een korte test worden afgenomen. Deze test bestaat uit dezelfde opgaves die de kinderen tijdens de training hebben kunnen oefenen en duurt ongeveer 15 – 20 minuten. De test dient ertoe erachter te komen welke denkregels de kinderen hebben gebruikt. Verder zullen er instructiefilmpjes worden afgenomen. Hiervoor zal een onderzoeker van de UvA de kinderen om de beurt uit de klas ophalen en meenemen naar een rustige ruimte binnen de school. Dit zal ongeveer 20 minuten per kind in beslag nemen. Sommige kinderen zullen uitleg over de strategieën van het spel ontvangen. Andere kinderen krijgen de opdracht zelf hun strategieën te verbaliseren en deze uit te leggen aan een docent. De uitleg zal als instructiefilm op kamera worden opgenomen. De kinderen krijgen de opdracht om samen met een begeleider deze instructiefilmpjes te maken. De kinderen wordt verteld dat deze filmpjes bedoeld zijn om andere kinderen het spel te leren. De kinderen worden gevraagd hier de strategieën die zij tijdens het rekenen in de Rekentuin gebruikten uitleggen. Vervolgens zullen de kinderen nog enkele weken op school en/of thuis in de Rekentuin spelen. De spelletjes zijn niet bijzonder moeilijk of vermoeiend. Uw kind krijgt voorafgaand een uitgebreide uitleg en voldoende oefening zodat zij/hij de taak goed zal begrijpen en kan uitvoeren. Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
47 Vrijwilligheid Wij volgen bij dit onderzoek de richtlijnen voor psychologisch onderzoek bij kinderen. Wanneer uw kind niet aan het onderzoek wil meedoen, wanneer u niet wilt dat uw kind aan het onderzoek deelneemt, of wanneer uw kind gaandeweg besluit dat zij/hij wil stoppen, dan kan dat op elk moment zonder opgaaf van redenen. Dit zal op geen enkele wijze gevolgen hebben voor uw kind. Tevens kunt u tot een week na afloop van het onderzoek uw toestemming intrekken. In dat geval zullen de gegevens van uw kind worden verwijderd uit onze bestanden en vernietigd.
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013
Vertrouwelijkheid onderzoeksgegevens De gegevens van dit onderzoek zullen door de onderzoekers alleen worden gebruikt voor nadere analyse en voor eventuele publicatie in wetenschappelijke tijdschriften. Hierbij wordt geen gebruik gemaakt van de persoonsgegevens van uw kind en blijft de anonimiteit van uw kind gewaarborgd. Ongemak, risico’s en verzekering Uit ervaring met voorgaande vergelijkbare onderzoeken is gebleken dat er van enig ongemak voor de deelnemers geen sprake is. Omdat dit onderzoek geen risico’s voor de gezondheid of veiligheid van uw kind met zich meebrengt, is er geen speciale verzekering afgesloten. Nadere inlichtingen Mocht u nog vragen hebben over dit onderzoek, vooraf, tijdens of achteraf, dan kunt u zich wenden tot de verantwoordelijke onderzoeker, prof. dr. Maartje Raijmakers (
[email protected], 0205257014). Voor eventuele klachten over dit onderzoek kunt u zich wenden tot het lid van de commissie Ethiek van de afdeling Psychologie van de Universiteit van Amsterdam, prof. dr. P.J.M. Prins (
[email protected], 020-5256821). Wij vragen u vriendelijk op het strookje op de volgende bladzijde aan te geven of u toestemming geeft voor deelname van uw kind aan het onderzoek en voor het gebruik van de instructiefilmpjes gemaakt door uw kind (alleen de stem) voor voorlichting- en educatieve doeleinden. Zou u het strookje uiterlijk voor donderdag 18 oktober in willen leveren bij de leerkracht van uw kind? Met vriendelijke groeten, Maartje Raijmakers, Katharina Visser en Martine Ooteman
49 Wilt u dit strookje invullen en voor donderdag 18 oktober inleveren bij de leerkracht van uw kind?
Ik heb kennis genomen van de inhoud en procedure van het onderzoek.(doorhalen wat niet van toepassing is) Ja, mijn kind mag deelnemen aan het onderzoek van de Universiteit van Amsterdam. Ik geef toestemming voor het maken van video-opnamen en het gebruik van deze opnamen voor wetenschappelijke publicaties en voorlichting- en educatieve doeleinden ten behoeve van TalentenKracht en/of Ontwikkelingspsychologie van de UvA. Dit houdt in dat de opnamen van mijn kind worden vertoond aan publiek en dat de anonimiteit van mijn kind niet gewaarborgd blijft. Ja, mijn kind mag deelnemen aan het onderzoek van de Universiteit van Amsterdam. Ik geef toestemming voor het maken van video-opnamen en het gebruik van deze opnamen voor wetenschappelijke publicaties. Dit houdt in dat de opnamen van mijn kind niet worden vertoond aan publiek en dat de anonimiteit van mijn kind gewaarborgd blijft. Nee, mijn kind mag niet deelnemen aan het onderzoek van de Universiteit van Amsterdam.
Naam ouder: …………………………………………………………………………… Datum van ondertekening:……………………………………………………………... Handtekening ouder:……………………………………………………………………
Naam kind:……………………………………………………………………………... Geboortedatum kind:…………………………………………………………………… Klas kind:……………………………………………………………………………….
Mastherthese K.M. Visser | Universiteit van Amsterdam | Februari 2013