IEDEREEN TAALT
Effectonderzoek naar implementatie van principes van krachtige taalleeromgeving door schoolinterne coaches
Jozefien Loman Pandora Versteden
Caroline Moons Promotor: Koen Van Gorp
1
IEDEREEN TAALT Effectonderzoek naar implementatie van principes van krachtige taalleeromgeving door schoolinterne coaches in scholengemeenschap De Speling - Genk Jozefien Loman Pandora Versteden Caroline Moons Koen Van Gorp (promotor)
januari 2015
Centrum voor Taal en Onderwijs, K.U.Leuven 2
3
HOOFDSTUK 3: METHODOLOGIE 3.1 ONDERZOEKSDESIGN Om de geformuleerde onderzoeksvragen te beantwoorden, werd een longitudinaal multimethod onderzoek opgezet. Het onderzoek is multimethod omdat het kwantitatieve en kwalitatieve onderzoeksmethoden en -technieken combineert. Het onderzoek is ook longitudinaal en dataverzameling nam vier jaar in beslag (1 januari 2010 – 31 december 2014). Daarnaast werd ook gebruik gemaakt van een eerder afgenomen toets in de tweede kleuterklas (december 2006). Het onderzoek bevat twee componenten: productevaluatie en procesevaluatie. De productevaluatie onderzoekt in de eerste plaats de output op leerlingniveau door middel van kwantitatieve effectmetingen. De andere actoren van het project (leerkrachten, coaches en school) vormden het voorwerp van zowel een productevaluatie als een procesevaluatie: bij de procesevaluatie werd gepeild naar mogelijke veranderingen in handelen en perceptie die door het project bij de genoemde actoren worden teweeggebracht. Productevaluatie houdt een vergelijking in tussen de eindsituatie en de beginsituatie bij dezelfde actoren. Met betrekking tot de kinderen volgt het onderzoek de prestaties van kinderen op drie luistertoetsen over de schooljaren heen. Daarnaast concentreerde het onderzoek zich op 6 cohorten. Cohorte 2(a), 4, 5 en 6 bestaan uit de kinderen die de toets in de tweede kleuterklas aflegden, alsook de toets in het eerste leerjaar. Cohorten 2(a) en 3 bestaan uit kinderen die de toets in het eerste leerjaar aflegden, alsook in het derde leerjaar. Cohorte 1 en 2(b) bestaan uit kinderen die de toets in de tweede kleuterklas en de toets in het derde leerjaar aflegden. De kinderen in cohorte 1 en 2(a) zaten niet of nauwelijks in klassen waar het project Iedereen Taalt al werd uitgevoerd. De kinderen in cohorten 4, 5 en 6 zaten wel in klassen waar het project Iedereen Taalt werd uitgevoerd. De kinderen van cohorten 3 en 2(b) zaten gedeeltelijk in het project. Dit stelt ons in staat om te kijken of de prestaties en vorderingen van kinderen beter worden naar gelang ze hun schoolloopbaan doormaakten in klassen waar het project Iedereen Taalt steeds meer werd uitgevoerd. Indien dit het geval zou zijn, zouden kinderen uit latere cohorten betere prestaties en vorderingen moeten vertonen dan in de eerste cohorte. In de uitwerking van het onderzoeksdesign werden alle kinderen, die op dat moment in de scholen zaten waar het project werd uitgevoerd, meegenomen. Enkel absolute anderstalige nieuwkomers (kinderen die nog geen onderwijs volgenden in het Nederlands en pas aankwamen op de nieuwe school) werden niet getest.
4
Tabel 1: Overzicht van de toetsafnamres van de leerlingen en de cohorten
K2
L1
L3
December 2006
Maart 2010
Oktober 2010
Maart 2011
Oktober 2011
Maart 2012
Oktober 2012
Maart 2013
Oktober 2013
Maart 2014
Cohorte1
Cohorte2
Cohorte3
Cohorte4
Cohorte5
Cohorte6
geen project
Onvolledig project
Onvolleidig project
Onvolledig project
Volledig project
Volledig project
KOBI-TV
KOBI-TV
KOBI-TV
KOBI-TV
KOBI-TV
KOBI-TV
geen project
project
project
project
project
project
Oktober 2014
Salto
Salto
Salto
Salto
Salto
onvolledig project
Onvolledig project
Onvolledig project
project
Project
Luistertoets L3
Luistertoets L3
Luistertoets L3
Luistertoets L3
geen project
Onvolledig project
Onvolledig project
Onvolledig project
5
3.2 ONDERZOEKSMETHODEN In wat volgt overlopen we de gehanteerde onderzoeksmethoden per groep van participanten in het onderzoek: Coaches (3.2.1) Leerkrachten (3.2.2) Leerlingen (3.2.3) 3.2.1 Coaches 3.2.1.1 STEEKPROEF Zestien coaches van de totale populatie van 27 werden geïnterviewd. De helft van deze coaches werken in het kleuteronderwijs, de helft in het lager onderwijs. De coaches kleuter zijn allemaal coaches die al meerdere jaren coach zijn op hun school. De coaches lager zijn pas in september 2014 echt als coach in hun school aan de slag gegaan (voorheen hadden enkelen wel al een introductie gekregen). De twee coaches van buitengewoon onderwijs werden geselecteerd omdat we de specifieke situatie van deze scholen zeker in het onderzoek wilden meenemen. We kozen ervoor om vijf coaches kleuter te interviewen uit de scholen waar ook leerkrachten werden geobserveerd (zie 3.2.2 Leerkrachten) om zo duidelijker de link tussen beide niveaus te kunnen leggen. De andere twee coaches werden random geselecteerd. De scholen waar geen coach kleuter werd geïnterviewd werden geselecteerd voor een interview van hun coach lager. Op die manier zijn alle scholen in het onderzoek vertegenwoordigd. De andere twee coaches lager werden random geselecteerd. 3.2.1.2 INSTRUMENTARIUM We maakten gebruik van semigestructureerde interviews. De interviewleidraad (zie bijlage 1) werd specifiek voor dit project ontwikkeld. Volgende onderwerpen kwamen aan bod: - inleidende vragen waarin praktische info over coaching werden bevraagd, - vragen over de invulling van de taak als coach, - vragen over de implementatie van het project Iedereen Taalt op de school, - vragen over de begeleiding en ondersteuning bij de implementatie van het project Iedereen Taalt. 3.2.1.3 DATA-ANALYSE De interviews werden in december 2013 en januari 2014 afgenomen door een medewerker van het CTO. De interviews duurden tussen één en anderhalf uur. Nadien werden de interviews uitgeschreven en verwerkt in NVivo. We werkten daarbij met een aanpak die zich situeert tussen de a-prioribenadering en de inductieve benadering: we bepaalden vooraf labels die zeker aan bod moesten komen, maar lieten ook ruimte voor het toevoegen van andere labels. In eerste instantie gebruikten we de structuur van Lofland (1971) om de labels te structureren. Nadien werd deze structuur verlaten en omgevormd tot een meer passende structuur die ontstond uit het werken met de data (zie model bij 4.1.1).
3.2.2 LEERKRACHTEN 3.2.2.1 SURVEY Populatie Kwantitatieve data werd verzameld door middel van een survey-onderzoek. Daarbij werden alle leerkrachten die in het project Iedereen Taalt betrokken zijn, beoogd. Dit gebeurde bij de leerkrachten kleuter zowel in december 2010 als in januari 2014, voor de leerkrachten lager onderwijs gebeurde dit enkel in 2014 aangezien zij in 2010 nog niet betrokken waren bij het project. Voor het kleuteronderwijs kunnen we dus longitudinale uitspraken doen door de gegevens op beide afnamemomenten met elkaar te vergelijken. Respons In 2010 kwamen 89 leerkrachten in aanmerking voor het invullen van de survey. Het gaat enkel om klasleerkrachten en niet om extra leerkrachten voor bijvoorbeeld bewegingsopvoeding. 85 leerkrachten vulden de survey ook effectief in. In 2014 vulden 58 (van de 60) leerkrachten van het lager onderwijs de survey in en 92 (van de 95) leerkrachten van het kleuteronderwijs deden dat ook. 70 leerkrachten kleuteronderwijs vulden zowel in 2010 als in 2014 de survey in. Instrumentarium De survey (zie bijlage 2) werd op maat van het project gemaakt, waarbij we ons baseerden op eerder vragenlijsten uit evaluatieonderzoek uitgevoerd door het CTO. De survey bestaat uit drie delen: (1) het project Iedereen Taalt, (2) taalbeleid en (3) krachtige leeromgeving. Het laatste onderdeel is het meest uitgebreide waarbij vragen worden gesteld over (a) het positief, veilig en rijk leerklimaat, (b) betekenisvolle taken en (3) ondersteuning door interactie. Bijna alle items worden bovendien op drie niveaus benaderd, namelijk het handelen van de leerkracht, het gevoel van bekwaamheid van de leerkracht en de mate waarin de leerkracht dit item belangrijk vindt. Alle antwoorden op de vragen bestaan uit vijfpuntenschalen. Voor de eerste twee onderdelen werd dit ook aangevuld met de antwoordmogelijkheid ‘weet niet’. De survey van 2014 is nagenoeg identiek aan de survey van 2010. De survey van het lager onderwijs is ook zeer gelijklopend met die van het kleuteronderwijs. Toch moesten we bij deze laatste enkele aanpassingen doen om alles toe te spitsen op de specifieke klassituatie van het lager onderwijs. (A) Taalbeleid Zowel coaches als leerkrachten functioneren binnen de context van een school. Deze context kan een bepalende factor zijn waarom bepaalde zaken wel of niet goed lopen. Daarnaast is het ook interessant na te gaan of een project als Iedereen Taalt invloed heeft op deze schoolcontext. Aangezien het project betrekking heeft op taal, kozen we ervoor om taalbeleid als uiting van schoolbreed beleid op te nemen in deze vragenlijst. We concretiseerden taalbeleid in vragen over:
-
School- en buurtkenmerken Pedagogisch project Taal in de klas Klasoverstijgend taalgebruik Professionalisering Evaluatie van taalvaardigheid
Deze inhoudelijke aspecten zijn gebaseerd op de zeven peilers van taalbeleid (Van Braak & Schrauwen, 2001), het Instrument voor de Beginsituatieanalyse Taalbeleid (Steunpunt GOK, 2001) en de Bevraging Taalbeleid (Nascholing Brussel, 2001). (B) Project Iedereen Taalt De vragen voor dit onderdeel werden specifiek voor dit onderzoek ontwikkeld en zijn gebaseerd op de uitgangspunten en doelstellingen van het project. De vragen peilen naar effecten van het project (op percepties van leerkrachten en op de school) en tevredenheid over het project (algemeen en specifiek over de coach). (C) Taalvaardigheidsonderwijs We baseerden ons voor het grootste deel op de vragenlijst die door het CTO werd ontwikkeld voor het onderzoek ‘Betere taalvaardigheid door intensieve begeleiding? Een effectonderzoek van het begeleidingstaject ‘Rand- en Taalgrensgemeenten en gemeenten uit de Brede Rand rond Brussel’. Enkele items werden aangepast of aangevuld omdat dit specifieke aandachtpunten waren die aan bod kwam bij de begeleiding van Iedereen Taalt, bijvoorbeeld rond het werken met boeken. Data-analyse Voor (A) en (B): We bekeken telkens of een meerderheid van de leerkrachten positief (score 4 of 5) antwoordde op een item. Als dit het geval was beschouwden we dit item als positief. Op dezelfde manier gingen we ook na of er verschillen bestaan tussen leerkrachten lager onderwijs en leerkrachten kleuter onderwijs. Voor het kleuteronderwijs bekeken we ook of er een positieve tendens is tegenover 2010. We koppelden deze bevindingen steeds aan resultaten van het kwalitatief luik. Voor onderdeel (C): Naast het inschatten of leerkrachten positief antwoorden op een item en het vergelijken van gemiddelden, gingen we nu ook na of er een correlatie is tussen handelen, bekwaamheid en belangrijkheid voor de verschillende items. We gingen ook het verband na tussen achtergrondkenmerken van leerkrachten en hun scores op de verschillende items. Aangezien het om kleine groepen leerkrachten gaat en de data niet normaal zijn verdeeld, gebruiken we daartoe een non-parametrische test namelijk Spearmans rangcorrelatiecoëfficiënt . Daarnaast gaan we ook de spreiding van de verdeling na. We gebruiken daarvoor de standaarddeviatie (SD). Wanneer er sprake is van een grote spreiding gaan we op zoek naar verklarende achtergrondvariabelen (beschrijving achtergrondvariabelen: zie bijlage 3). Omdat we met niet-bestaande gevalideerde schalen werken, zijn we door middel van factoranalyses op basis van het meetmoment 2014 nagegaan hoe de dimensionaliteit van de data is (zie bijlage 4). Deze factoranalyses leren ons dat de opsplitsing in drie cirkels niet helemaal overeenstemt met de
dimensionaliteit, maar wel in grote lijnen dezelfde patronen weergeeft. We gebruiken de dimensies die uit de factoranalyses komen om groei tussen meetmoment 1 en meetmoment 2 na te gaan. Daarbij gebruiken we de Crohnbach’s α om te bertrouwbaarheid van de schalen te berekenen. Leerkrachten krijgen ook een totaalscore toegekend, m.a.w. een score na het optellen van alle items rond een krachtige klaspraktijk. Deze totaalscore laat ons toe leerkrachten met elkaar te vergelijken alsook de groei van leerkrachten kleuteronderwijs tussen 2010 en 2014 te bepalen. Aangezien het om kleine groepen leerkrachten gaat en de data niet normaal zijn verdeeld, gebruiken we daartoe een non-parametrische test namelijk de Mann-Whitneytoets. De effectgroottes drukken we uit in r. Voor de interpretatie van de effectgrootte gebruiken we de richtlijnen van Cohen (Statistical Power Analysis for the Behavioral Sciences, Cohen (1988): ≥ .10 is een klein effect, ≥ .30 is een middelgroot effect en ≥ .50 is een groot effect. Ook voor het leggen van de link tussen leerkrachthandelen en resultaten van kinderen op de luistertoets, gebruiken we een non-parametrische test (Kurkas Wallis). Omdat r niet de meest aangewezen meting van effectgrootte is (Field, 2009), gebruiken we Carmer’s V om de effectgrootte weer te geven. 1
Tabel 2: Overzicht effectgroottes Carmer’s V df* = min(r – 1, c – 1)
klein
middelgroot
groot
1
.10
.30
.50
2
.07
.21
.35
3
.06
.17
.29
3.2.2.2 GERICHTE OBSERVATIES Steekproef Om het effect op leerkrachthandelen te onderzoeken, zijn er ook gefilmde observaties uitgevoerd in een aantal klassen, om na te gaan in welke mate leerkrachten een krachtige leeromgeving voor taalvaardigheidsonderwijs waarmaken. Het was niet mogelijk om observaties uit te voeren in alle kleuterklassen van de vijftien betrokken scholen. Omwille van de taakbelasting hebben we ons beperkt tot 18 video-opnames. We hebben dus moeten werken met een steekproef van een aantal scholen en klassen, waar telkens anderhalf uur geobserveerd is. Er zijn zeven kleuterleerkrachten geobserveerd van zes verschillende scholen. De geobserveerde leerkrachten staan bij 4- of 5-jarige kleuters of bij menggroepen. Er is voor de oudere leeftijden gekozen, omdat het gemakkelijker is om de link te leggen tussen 5-jarigen en de eerste graad van de lagere school. Er zijn 11 leerkrachten van de lagere school geobserveerd, waarvan zes van het eerste leerjaar en vijf van het tweede leerjaar. Alle scholen zijn op deze manier vertegenwoordigd bij de observaties. Het scoren van de observaties van de leerkrachten gebeurde aan de hand van een uitgebreide kijkwijzer die net als de survey is opgebouwd vanuit de drie cirkels voor een krachtige leeromgeving (zie bijlage 5). De observaties laten toe het gerapporteerde gedrag uit de survey te vergelijken met 1
Bron: http://www.real-statistics.com/chi-square-and-f-distributions/effect-size-chi-square/
het werkelijke leerkrachthandelen in de klas. De scores door drie observatoren zijn voldoende betrouwbaar (Krippendorff’s alpha coëfficiënt=.75) om tendensen te kunnen vaststellen. Instrumentarium De bedoeling van de observaties was om een zicht te krijgen op de natuurlijke, alledaagse werkelijkheid in de klas tijdens taal- en een andere activiteiten. Alle leerkrachten werden gedurende anderhalf uur gefilmd vanaf het binnenkomen van de kinderen in de klas ’s ochtends. Leerkrachten werden niet (lang) op voorhand verwittigd en er werd aan de betrokken leerkrachten gevraagd om geen speciale activiteiten te plannen. De leerkrachten waren ook niet op de hoogte van het gebruikte observatieschema. In het observatieschema zijn de kenmerken van een krachtige (taal)leeromgeving vertaald in concrete kenmerken met betrekking tot het leerkrachthandelen. In het theoretisch kader zijn deze kenmerken uitgebreid beschreven. Bij de observaties maakten we gebruik van het observatie-instrument van Devlieger en Goossens (2007), dat werd ingezet in een evaluatieonderzoek in de Brusselse scholen (VBB2). Het observatieinstrument van Devlieger en Goossens wordt inmiddels ook toegepast in andere evaluatieonderzoeken, zoals ‘Taalvaardigheid in de Rand- en taalgrensgemeenten’, ‘Thuistaal in het Gentse onderwijs’ en ‘Europaschool Genk’. Het observatie-instrument zelf is vooral gericht op het kleuteronderwijs en de eerste graad van het lager onderwijs (vooral wat betreft de concretiseringen) en werd lichtjes aangepast aan de specifieke context van dit project. Tijdens de observaties/filmopnames intervenieerde de persoon die de camera bediende niet in het klasgebeuren. De camera volgde hoofdzakelijk het leerkrachthandelen en de bijhorende leerkrachtleerling-interacties. Uiteraard werden ook de kinderen en de interacties tussen de kinderen geobserveerd, maar de focus lag in de eerste plaats op de manier waarop de leerkracht interageerde met de kinderen. Na de filmopname stelde de cameraman nog enkele bijkomende vragen aan de leerkrachten i.v.m. ‘doelen’ en ‘de samenstelling van de groepen’. Ook een kopie van de agenda wordt opgevraagd om de vooropgsetelde doelen te kunnen nagaan. Data-analyse De observaties werden vooral gebruikt om het gerapporteerde gedrag uit de survey af te toetsen aan de werkelijk klassituatie. Daarnaast zorgden de observaties voor een nog bredere kijk op het klasgebeuren. Ook bij de observaties kregen leerkrachten een totaalscore wat ons toelaat de gemiddelde scores op de survey en de observaties tegenover elkaar af te zetten. Bij de vergelijking tussen de items uit de survey en de observaties werden de scores 4 en 5 uit de survey geïnterpreteerd als score 4 in de observatiewijzer aangezien de schalen van elkaar verschillen (survey 1 t.e.m. 5 en observaties 1 t.e.m. 4). 3.2.3 LEERLINGEN 3.2.3.1 INSTRUMENTARIUM Vanaf schooljaar 2010 tot en met 2014 werden jaarlijks luistervaardigheidstoetsen afgenomen in tweede kleuterklas (KOBI-TV), in het eerste leerjaar (SALTO) en in het derde leerjaar (luistertoets L3). Daarnaast is er ook een KOBI-TV van 2006 beschikbaar. We verzamelden ook achtergrondkenmerken 2
Voorrangsbeleid Brussel
van de kinderen en scholen verzameld: geslacht, thuistaal, socio-economische situatie (SES), verloop schoolloopbaan en doelgroepleerlingen gelijke onderwijskansenbeleid (GOK). De variabele ‘thuistaal’ bevat twee categorieën: het kind gebruikt Nederlands in interactie met ouders, broers en zussen, en/of vriendjes; het kind gebruikt een andere taal in interactie met de ouders, met broers of zussen, en/of met vriendjes. De variabele ‘opleidingsniveau moeder’ bevat eveneens twee categorieën: de moeder heeft maximaal een diploma lager secundair onderwijs; de moeder heeft een diploma lager secundair onderwijs of hoger. De variabele ‘thuistaal’ en ‘opleidingsniveau’ kunnen worden gecombineerd waardoor 4 categorieën ontstaan: kinderen met een hoog opgeleide moeder en met Nederlands als thuistaal; kinderen met een laag opgeleide moeder en niet het Nederlands als thuistaal; kinderen met een hoog opgeleide moeder en met Nederlands als thuistaal; kinderen met een laag opgeleide moeder en niet het Nederlands als thuistaal. De laatste drie categorieën worden ook wel als GOK-leerlingen omschreven (m.a.w. kinderen voor wie het gelijke onderwijskansenbeleid is bedoeld); de eerste categorie wordt dan omschreven als niet-GOK. Wanneer we kinderen het label ‘normale schoolloopbaan’ toekennen, betekent dit dat het kind tijdens zijn schoolloopbaan niet van school veranderde en geen schoolse vertraging of voorsprong geeft. Het kind zit met andere woorden bij alle meetmomenten op dezelfde school bij zijn leeftijdsgenootjes. Alle toetsen werden afgenomen en verbeterd door externen (coaches van een andere school, studenten en zorgcoördinatoren). (A) LUISTERTOETS TWEEDE KLEUTERKLAS De KOBI-TV of het Kleuterobservatie-instrument Taalvaardigheid is een instrument om de taalvaardigheid van kleuters in de tweede kleuterklas te observeren en te vergelijken met de taalvaardigheid van leeftijdgenootjes. KOBI-TV bestaat uit een reeks van 27 opdrachten gerangschikt volgens moeilijkheidsgraad. Gaande van de gemakkelijkste naar de moeilijkste opdracht wordt van de kleuter een steeds grotere receptieve of productieve vaardigheid gevraagd. In 1999-2000 werd een grootschalig normeringsonderzoek gevoerd. Meer info: http://cteno.be/index.php?idMenu=116&id_materiaal=417 Op onderstaand histogram, waarop alle kinderen die de KOBI-TV aflegden tijdens dit onderzoek zijn weergegeven, kunnen we aflezen dat heel veel kinderen een maximale score halen op de toets. Niettemin zien we ook voldoende kinderen die de norm (24) niet halen en kinderen die zeer zwak scoren. Het gemiddelde (M=19,24) ligt ook onder norm. De standaarddeviatie (SD=7.066) is vrij groot. Er zijn dus voldoende mogelijkheden om verschillen tussen (de minder sterke) kinderen waar te nemen.
Figuur 4: Histogram KOBI-TV alle toetsresultaten Iedereen Taalt
(B) LUISTERTOETS EERSTE LEERJAAR SALTO is een screeningsinstrument dat de schoolse taalvaardigheid meet van kinderen die in het eerste leerjaar starten. Het instrument gaat na of kinderen voldoende taalvaardig in het Nederlands zijn om eenvoudige instructies, vragen en mededelingen over het schoolgebeuren te begrijpen. De toetstaken zijn opgebouwd rond realistische, concrete situaties waarin de kinderen de schooltaal moeten begrijpen. In 2007 werd een grootschalig onderzoek gevoerd om de cesuren voor de toets te bepalen. Meer info: http://www.cteno.be/?idMenu=121&id_materiaal=231 Op het histogram kunnen we aflezen dat het om een toets gaat waarop veel kinderen sterk scoren (M=32,153 op maximaal 39). De toets heeft dan ook tot doel de heel zwakke kinderen te detecteren, m.a.w. kinderen die onder de cesuur van 20 scoren. De standaarddeviatie (SD=5.476) is minder groot dan bij de KOBI-TV: de toets geeft dus iets minder verschillen tussen kinderen weer.
Figuur 5: Histogram SALTO alle toetsresultaten Iedereen Taalt
(C) LUISTERTOETS DERDE LEERJAAR Deze LUISTERTOETS L3 werd ontwikkeld op basis van een oude CITO-toets waaruit een aantal items werden geschrapt, en andere naar een meer hedendaagse en Vlaamse versie werden aangepast. Het gaat om een toets waarbij de kinderen meerkeuzevragen bij een luisterfragment moeten oplossen. Bij deze toets zijn geen normen of cesuren. Op het histogram hieronder zien we dat de scores op de toets vrij normaal verdeeld zijn. De standaarddeviatie is wel vrij klein (SD=3.760). In tegenstelling tot de toets van de tweede kleuterklas en het eerste leerjaar zien we hier geen ‘plafondeffect’: weinig kinderen halen zeer hoge scores op de toets. Figuur 6: Histogram luistertoets derde leerjaar alle toetsresultaten Iedereen Taalt
(D) VERBAND TUSSEN DE TOETSEN
Alle toetsen meten dezelfde vaardigheid, namelijk luistervaardigheid. Enkel in de toets voor de tweede kleuterklas zitten ook een paar spreekopdrachten. De correlaties tussen de toetsen zijn matig tot sterk en statistisch significant: -
De correlatie Luistertoets tweede kleuterklas en luistertoets eerste leerjaar is matig (Rs (1236)=.437 en p=.000). We zien op de scatterplot duidelijk wat ook Hattie (2009) aantoonde, namelijk dat de prestaties in de kleuterklas een samenhang vertonen met de prestaties van de eerste jaren van het lager onderwijs. Figuur 7: Correlatie luistertoets tweede kleuterklas en eerste leerjaar
-
De correlatie luistertoets eerste leerjaar en luistertoets derde leerjaar is sterk (Rs (660)=.511 en p=.000). Het verband tussen de toets eerste leerjaar en de toets derde leerjaar is dus iets groter dan tussen de toets tweede kleuterklas en de toets eerste leerjaar.
Figuur 8: Correlatie luistertoets eerste leerjaar en derde leerjaar
-
De correlatie luistertoets tweede kleuterklas en luistertoets derde leerjaar is matig (Rs (494)=.410 en p=.000). We stellen vast dat de groep kinderen die we kunnen volgen tussen beide toetsafnames vrij klein is wat wellicht te maken heeft met niet-normale schoolloopbanen van een grote groep kinderen (zie 4.3.4.2 Details 2014). Figuur 9: Correlatie luistertoets tweede kleuterklas en derde leerjaar
3.2.3.2 DATA-ANALYSE Enerzijds werden univariate analyses uitgevoerd in SPSS om de toetsresultaten over de jaren heen te kunnen vergelijken. Via ongepaarde t-toetsen vergelijken we de gemiddelden over de jaren heen. De effectgrootes worden uitgedruk in Cohen’s d. Voor de interpretatie van de effectgrootte gebruiken we de richtlijnen van Cohen (Statistical Power Analysis for the Behavioral Sciences, Cohen (1988): ≥ .20 is een klein effect, ≥ .50 is een middelgroot effect en ≥ .80 is een groot effect. Voor de
eindmeting in 2014 gaan we meer in detail in op achtergrondkenmerken van kinderen en scholen in relatie tot de resultaten. We stellen daarbij vooral tendenzen vast via grafische weergaves en vergelijkingen van gemiddelden (ongepaarde t-toetsen) tussen groepen. Anderzijds bouwden we via multilevel analyses in MLWin een model dat zoveel mogelijk rekening houdt met de afhankelijkheid van de observaties en de achtergrondvariabelen die een verklarende rol kunnen spelen bij de uitkomsten. De toetsen van tweede kleuterklas en eerste leerjaar worden daartoe in één model (pretest – posttest) gestopt. Hetzelfde gebeurt voor de toetsen eerste leerjaar en derde leerjaar, en de toetsen tweede kleuterklas en derde leerjaar. Door deze analyses krijgen we ook zicht op de verschillen in prestaties en op de vorderingen die kinderen maken op gebied van luistervaardigheid.
3.3 VERWIJZINGEN NAAR ANDER ONDERZOEK Waar mogelijk vergelijken we de resultaten met recent ander onderzoek of kaderen we de resultaten aan de hand van deze onderzoeken. De onderzoek die we daarbij vooral gebruiken zijn volgende reviewstudies: -
-
-
-
-
Bellens, K., Van Landeghem, G., & De Fraine, B. (2012). Review naar indicatoren voor het maximaliseren van leerprestaties, leerwinst en welbevinden op basisscholen. Centrum voor onderwijseffectiviteit en –evaluatie: KU Leuven. Alsook een aantal onderzoeken die in voorgaande review worden beschreven. Dennis, J. & Van Damme, J. (2010). De leraar: professioneel leren en ontwikkelen. Reviewonderzoek van Timperley et al. Leuven: ACCO. Alsook een aantal onderzoeken die in voorgaande review worden beschreven. Taelman, H. (2013). De effectiviteit van woordenschatinterventies in de kleuterklas. Leuven: Previews editorial board. Alsook een aantal onderzoeken die in voorgaande review worden beschreven. Timperley, H., Wilson, A., Barrah, H., & Fung, I. (2007). Teacher professional learning and development: Best evidencesynthesis iteration. Wellington, New Zealand: Ministerie of Education. Hattie, J. (2009). Visible Learning. A Synthesis of Over 800 Meta-Analysis Relating to Achievement. London: Routledge.