Cohortonderzoek COOL5-18 Technisch rapport bij het COOL5-18 bestandenproject voor het voortgezet onderwijs Anneke Timmermans | Djurre Zijsling
Colofon Het onderzoeksproject 'COOL 5-18: verkenning koppeling GION bij CBS', dossiernummer 411-20426, is uitgevoerd in opdracht van NRO-PROO.
Bronvermelding Publicatie van uitkomsten geschiedt door het onderzoeksbureau of de opdrachtgever op eigen titel. Verwijzing naar RUG GION en het CBS betreft uitsluitend het gebruik van de microdatabestanden. Dat wordt als volgt geformuleerd: “Eigen berekening [naam onderzoeksbureau, c.q. opdrachtgever] op basis van bij het CBS beschikbaar gestelde microdatabestand samengesteld door RUG GION betreffende COOL5-18”
Meer informatie Voor meer informatie over de betreffende bestanden kunt u contact opnemen met A.C. Timmermans (
[email protected] of
[email protected])
Toestemming voor gebruik Voor gebruik van deze microdatabestanden dient toestemming te worden gevraagd aan NRO, dit kan door contact op te nemen met Joris Voskuilen (
[email protected]).
ISBN
978-90-6690-546-7
© Maart 2014. GION, Gronings Instituut voor Onderzoek van het Onderwijs Niets van deze uitgave mag worden verveelvoudigd en/of openbaar gemaakt door middel van druk, fotokopie, microfilm of op welke andere wijze dan ook zonder voorafgaande schriftelijke toestemming van de Directeur van het Instituut.
INHOUDSOPGAVE
1
INLEIDING 1.1.
2
3
Leeswijzer
VERRIJKING VAN DE COOL5-18 VELDWERKBESTANDEN
1 2
3
2.1.
Procedure van koppeling van databestanden
3
2.2.
Systematiek van de koppelingen
4
2.3.
Structuur van de verrijkte databestanden
7
2.4.
Resultaat van de koppelingen binnen het bestandenproject
8
BESCHRIJVING VAN GEKOPPELDE VARIABELEN
11
3.1.
Onderwijsloopbaangegevens
11
3.2.
Variabelen onderwijsloopbaangegevens
12
3.3.
Examengegevens
16
3.4.
Variabelen examengegevens
17
3.5
Gemeentelijke basisadministratie
19
3.6.
Variabelen gemeentelijke basisadministratie
20
3.7
Ontbreken van gegevens omtrent opleidingsniveau
22
1
INLEIDING
In dit rapport wordt een technische beschrijving gegeven van het bestandenproject, waarin een koppeling is gemaakt tussen verschillende veldwerkbestanden zoals die verzameld zijn binnen het project COOL5-18 en aanvullende gegevens met betrekking tot onderwijsinschrijvingen van de leerlingen, examens en behaalde diploma’s en tenslotte de achtergrond. Deze koppeling wordt tot stand gebracht met als doel de veldwerkbestanden van COOL5-18 te verrijken. Het uitgangspunt bij de verrijking van de COOL5-18 veldwerkbestanden is om te komen tot een volledig, maar overzichtelijk databestand wat toepasbaar is voor wetenschappelijk onderzoek naar onderwijsloopbanen van leerlingen. De verrijkte bestanden zijn binnen de Remote Access (RA) omgeving van het CBS beschikbaar voor onderzoek. Het bestandenproject is uitgevoerd door het GION in samenwerking met het CBS. Binnen het bestandenproject zijn er drie bronnen van gegevens waaruit variabelen worden geconstrueerd die gekoppeld worden aan de veldwerkbestanden. In de eerste plaats betreft dit de inschrijvingsgegevens van leerlingen in het voortgezet en beroepsonderwijs waaruit de onderwijsposities van de leerlingen kunnen worden geconstrueerd. Ten tweede betreft het gegevens met betrekking tot de door de leerlingen behaalde diploma’s in het voortgezet en beroepsonderwijs. En tot slotte betreft het achtergrondgegevens van de leerlingen en hun ouders. Deze achtergrondgegevens zijn uit verschillende bronnen afkomstig zoals uit de gemeentelijke basisadministratie. De bestanden met achtergrondgegevens bevatten gedetailleerde gegevens met betrekking tot de socio-economische achtergrond en samenstelling van het gezin. In dit project zijn er drie veldwerkbestanden verrijkt die zijn gerelateerd aan COOL5-18. In de eerste plaats betreft dit de zesde meting van de groep 8 leerlingen uit het PRIMA cohort in het schooljaar 2004/2005. Hoewel dit niet direct onderdeel is van COOL5-18 zijn deze leerlingen wel de ‘targetleerlingen’ geweest voor de daaropvolgende dataverzameling van COOL5-18 in het voortgezet onderwijs. Het tweede veldwerkbestand binnen het project betreft de COOL5-18 meting van groep 8 in het schooljaar 2007/2008. Dit is de eerste dataverzameling in het primair onderwijs geweest binnen COOL5-18. Het derde veldwerkbestand dat is verrijkt, behoort tot de dataverzameling in de derde klas van het voortgezet onderwijs in het schooljaar 2007/2008. Dit is de eerste dataverzameling die binnen COOL5-18 in het voortgezet onderwijs heeft plaatsgevonden. Er is een kleine overlap van leerlingen tussen de zesde meting van de groep 8 leerlingen uit het PRIMA cohort in het schooljaar 2004/2005 en eerste dataverzameling van COOL5-18 in de derde klas van het voortgezet onderwijs. Binnen de RA omgeving kan voor deze beperkte groep leerlingen (857) een koppeling gemaakt worden tussen deze twee verrijkte veldwerkbestanden. Vanwege de beperkte overlap tussen de beide databestanden worden deze afzonderlijk beschreven. In COOL5-18 wordt passief toestemming gevraagd aan de ouders voor het koppelen van de data uit de veldwerkbestanden aan landelijk beschikbare databestanden. Dit betekent dat alle ouders per brief op de hoogte zijn gesteld van het onderzoek en het voornemen om de verzamelde gegevens van COOL5-18 te koppelen aan andere bestanden (zoals gegevens van CBS). In deze brief werden de ouders ook gewezen op de mogelijkheid voor het maken van bezwaar voor het maken van koppeling van de verzamelde gegevens. De leerlingen waarvan de ouders bezwaar hebben gemaakt tegen de koppeling zitten wel in het veldwerkbestand, maar voorafgaand aan het koppelen is reeds de herleidbare
1
informatie uit het bestand gehaald, waardoor er voor deze leerlingen geen koppeling heeft plaatsgevonden. In dit project zijn gegevens uit de onderwijsnummerbestanden, examengegevens en de gemeentelijke basisadministratie uit de jaren 2004/2005 tot en met 2011/2012 gekoppeld aan de veldwerkbestanden. Jaarlijks zullen er nieuwe gegevens bekend zijn over onderwijsposities en examens van de leerlingen. Om de onderwijsloopbanen van de leerlingen te kunnen blijven volgen, is het noodzakelijk een jaarlijkse update van het project te doen. Daarnaast zullen in de toekomst meerdere COOL5-18 veldwerkbestanden in de RA omgeving worden geplaatst die dan ook verrijkt kunnen worden door een koppeling aan deze drie typen bestanden. De beschrijvingen en documentatie in dit rapport zijn gebaseerd op de bewerkingen van de bestanden die voor dit project hebben plaatsgevonden en op de documentatie die bij de oorspronkelijke bestanden door CBS zijn aangeleverd. Dit betreft: CBS (2011). Documentatierapport COOL 2003-2009V1 CBS (2012). Documentatierapport COOL update 2009-2011V1
1.1. Leeswijzer In het tweede hoofdstuk van dit rapport wordt de algemene opzet van het bestandenproject beschreven. Dit betreft de stappen die gevolgd zijn voor het realiseren van de koppelingen tussen de veldwerkbestanden en de gegevens die bij CBS beschikbaar zijn, een beschrijving van de systematiek en keuzes van met betrekking tot de gekoppelde bestanden en ten slotte het resultaat van de gerealiseerde koppelingen. In het derde hoofdstuk wordt meer gedetailleerde informatie gegeven omtrent de bestanden waaruit de gegevens gedestilleerd zijn en de populatie van leerlingen waarvan informatie beschikbaar is. Eventuele opmerkingen omtrent betrouwbaarheid van gegevens en specifieke variabelen komt hier aan bod. Tevens wordt in dit hoofdstuk beschreven welke specifieke variabelen gekoppeld zijn aan de veldwerkbestanden, hoe deze zijn geconstrueerd, welke categorieën voorkomen en wat die betekenen.
2
2
2.1.
VERRIJKING VAN DE COOL5-18 VELDWERKBESTANDEN
Procedure van koppeling van databestanden
Het koppelen van de veldwerkbestanden aan de verschillende gegevens binnen de Remote Access (RA) omgeving kent een aantal stappen. In de eerste plaats zijn veldwerkbestanden geleverd aan het CBS met daarin onder andere de namen en de geboortedata van de leerlingen. Zoals eerder beschreven betreft dit drie veldwerkbestanden van COOL5-18. In de tweede stap is op basis van de namen en geboortedata van de leerlingen door het CBS een variabelen RINPERSOON en RINPERSOONS toegevoegd aan de veldwerkbestanden en zijn de herleidbare variabelen uit de veldwerkbestanden gehaald. Tezamen vormen dit de variabelen die unieke leerlingen identificeren. Vergelijkbaar worden ook eventuele brin-nummers van scholen vervangen door versleutelde nummers. Omdat er sprake is van een koppeling op naam en geboortedatum kunnen niet alle leerlingen een RINPERSOON nummer krijgen, waardoor het niet voor iedere leerling mogelijk is om aanvullende informatie te koppelen. De uiteindelijke resultaten van aantallen mogelijke en gerealiseerde koppelingen zullen besproken worden in paragraaf 2.4. Dit voorgaande proces leidt ertoe dat de beschikbare microdatabestanden zoals deze door CBS in de RA omgeving geplaatst zijn geen direct herleidbare informatie met betrekking tot leerlingen en scholen meer bevat. Deze variabele RINPERSOON en RINPERSOONS is ook beschikbaar in de databestanden die aan de veldwerkbestanden gekoppeld worden en kan derhalve dienen als koppelvariabele. Een derde stap is het construeren van de variabelen met betrekking tot de onderwijsloopbanen van de leerlingen op basis van de beschikbare gegevens binnen de onderwijsnummerbestanden, de examengegevens en de gemeentelijke basisadministratie. Dit betekent in sommige gevallen dat er nieuwe variabelen zijn aangemaakt die bestaan uit een combinatie van variabelen uit de bronbestanden in andere gevallen zijn de variabelen rechtstreeks overgenomen en heeft er geen verdere bewerking plaatsgevonden. Bij de constructie van de variabelen moet worden opgemerkt dat er geen opschoning van de data heeft plaatsgevonden, wat betekent dat we gebruik hebben gemaakt van de ruwe data zoals deze voor dit project zijn aangeleverd. Dit betekent ook dat in een zeer beperkt aantal gevallen opvallende onderwijsposities gevonden zijn, zoals leerlingen die in de vijfde klas van het VMBO lijken te zitten. Hoofdstuk 3 bevat een volledige beschrijving van de gekoppelde variabelen. Het uitgangspunt bij de constructie van de variabelen is te komen tot een volledig, maar overzichtelijk databestand dat toepasbaar is voor wetenschappelijk onderzoek naar onderwijsloopbanen van leerlingen. De volgende stap is dat de geconstrueerde variabelen gekoppeld worden aan de COOL 5-18 veldwerkbestanden. Dit is de stap waarin de daadwerkelijke verrijking van de bestanden plaatsvindt. Het resultaat van deze stap zijn de veldwerkbestanden waar achteraan achtereenvolgens gegevens over de achtergrond, onderwijsloopbanen en examengegevens zijn opgenomen. Deze bestanden bevatten alleen cases die in de oorspronkelijke veldwerkbestanden zijn opgenomen. Deze verrijkte bestanden worden tot slot beschikbaar gesteld binnen de RA omgeving voor onderzoek.
3
2.2. Systematiek van de koppelingen Binnen het bestandenproject is gekozen voor een bepaalde systematiek voor het maken van de koppelingen tussen de veldwerkbestanden en de overige informatiebronnen. In de onderstaande tabellen is schematisch weergegeven welke koppelingen er gemaakt zijn binnen het bestandenproject. Hierbij is een onderscheid gemaakt naar afnames van COOL5-18 in groep 8 van het primair onderwijs, de derde klas van het voortgezet onderwijs. Ook de systematiek voor het koppelen van de veldwerkbestanden in de examenklassen Havo 5 en Vwo 6 van het voortgezet onderwijs wordt beschreven, hoewel dat buiten het huidige bestanden project valt. In Tabel 2.1 wordt de systematiek beschreven van de koppeling van de gegevens verzameld in groep 8 van het primair onderwijs. In de tabel zijn de specifieke koppelingen weergegeven voor de zesde dataverzameling van PRIMA in 2004/2005 en de eerste meting van COOL5-18 in 2007/2008 in groep 8. Meer recente afnames van COOL5-18 kunnen op een vergelijkbare wijze verrijkt worden.
Tabel 2.1 Systematiek van de te koppelen bestanden aan de veldwerkbestanden in groep 8 Jaartallen van de te koppelen bestanden 2004/ 2005 PRIMA groep 8 Afname 2004/2005
2005/ 2006
2006/ 2007
2007/ 2008
2008/ 2009
2009/ 2010
2010/ 2011
Vmbo 4
Havo 5
Vwo 6
2011/ 2012
2012/ 2013
2013/ 2014
Vmbo 4
Havo 5
Vwo 6
2011/ 2012
Onderwijsposities Diplomagegevens Gemeentelijke basisadminsitratie 2007/ 2008
COOL5-18 groep 8
Onderwijsposities
Afname 2007/2008
Gemeentelijke basisadminsitratie
2008/ 2009
2009/ 2010
Diplomagegevens
2010/ 2011
2014/ 2015
Aan de veldwerkgegevens van PRIMA 2004/2005 worden onderwijsposities gekoppeld vanaf schooljaar 2005/2006. In dit jaar zitten de leerlingen in principe in de eerste klas van het voortgezet onderwijs. In alle opvolgende jaren zullen de koppelingen van onderwijsposities gemaakt blijven worden, zodat de onderwijsloopbaan in het voortgezet en beroepsonderwijs van de leerlingen kan worden gevolgd. Gegevens met betrekking tot de diplomaresultaten worden gekoppeld vanaf schooljaar 2007/2008. Bij een nominale onderwijsloopbaan zitten de leerlingen dan in de derde klas. Door al vanaf dit schooljaar ook examengegevens te koppelen kunnen we de diploma’s van eventueel versnelde leerlingen opvangen. Het meest belangrijk zullen de diplomagegevens zijn van de schooljaren 2008/2009 tot en met 2010/2011 wanneer de nominale leerlingen in de examenklassen zitten. Tot slot zijn de gegevens met betrekking tot de achtergrond van de leerlingen en ouders uit het
4
afnamejaar van het veldwerkbestand gebruikt voor de koppeling. Hierdoor zijn de aanvullende gegevens betreffende de achtergrond van de leerlingen ongeveer even recent als de gegevens uit de veldwerkbestanden. Op dezelfde manier is het veldwerkbestand van COOL5-18 in groep 8 in 2007/2008 verrijkt.
In Tabel 2.2 wordt de systematiek weergegeven van de koppeling van de bestanden binnen de RA omgeving met de veldwerkbestanden uit de derde klas van het voortgezet onderwijs. In de tabel staat weergegeven welke specifieke bestanden zijn gekoppeld aan het veldwerkbestand in de derde klas van het voortgezet onderwijs in 2007/2008. Op een vergelijkbare wijze kunnen ook de recentere veldwerkbestanden worden verrijkt, hoewel dat buiten het huidige project valt.
Tabel 2.2 Systematiek van de te koppelen bestanden aan de veldwerkbestanden in klas drie VO Jaartallen van de te koppelen bestanden 2004/ 2005 COOL VO3 Afname 2007/2008
2005/ 2006
2006/ 2007
2007/ 2008
2008/ 2009
2009/ 2010
2010/ 2011
VMBO 4
HAVO 5
VWO 6
2011/ 2012
Onderwijsposities Diplomagegevens Gemeentelijke basisadminstratie
Voor de veldwerkbestanden voor de derde klas geldt dat niet alleen gegevens uit de onderwijsnummerbestanden worden gekoppeld uit de jaren na de afname, maar dat ook gegevens worden gekoppeld uit de jaar van afname en drie jaar voor de afname. Dit betekent dat we de onderwijsloopbanen van de leerlingen in de onderbouw van het voortgezet onderwijs ook in kaart kunnen brengen. Door de drie jaar voor de afname van het COOL5-18 veldwerkbestand te beginnen met de koppeling kunnen ook de onderwijsloopbanen van de leerlingen worden gevolgd die vertraging hebben opgelopen in de onderbouw van het voortgezet onderwijs. Dit geldt niet voor de targetleerlingen vanuit het PRIMA cohort, maar wel voor de klasgenootjes van deze targetleerlingen die in de derde klas ook aan COOL5-18 mee hebben gedaan en daar als het ware instromen in het cohortonderzoek. Van alle leerlingen uit het veldwerkbestand van de derde klas die koppelbaar zijn (8.408), komen in totaal 857 leerlingen ook voor in het veldwerkbestand van PRIMA groep 8 2004/20051. Met betrekking tot de examengegevens worden koppelingen gemaakt vanaf het eerste schooljaar nadat de meting voor de veldwerkbestanden heeft plaatsgevonden. De leerlingen zitten dan, mits ze niet zijn blijven zitten, in de vierde klas en de leerlingen in het VMBO zullen in dat jaar in principe deelnemen aan het examen. Het meest belangrijk zullen de diplomagegevens zijn van de schooljaren 2008/2009 1
Dit is afwijkend van de aantallen die beschreven zijn in het technische rapport bij het veldwerkbestand van de meting van COOL5-18 in de derde klas van het voortgezet onderwijs in 2007/2008. Hiervoor kunnen verschillende redenen zijn, zoals het al dan niet kunnen toewijzen van een RINPERSOON nummer voor leerlingen.
5
tot en met 2010/2011 wanneer de nominale leerlingen in de examenklassen zitten. Ook in de jaren daarna zullen nog gegevens betreffende de examens aan de veldwerkbestanden worden gekoppeld. Deze latere examengegevens zijn vooral interessant voor leerlingen die doorstromen naar hogere onderwijstypen in het voortgezet onderwijs en leerlingen in het middelbaarberoepsonderwijs. Vergelijkbaar met de veldwerkbestanden van groep 8 zal ook voor de derde klas een koppeling gemaakt worden met de gemeentelijke basisadministratie van het schooljaar waarin de afname heeft plaatsgevonden. In Tabel 2.3 wordt de systematiek weergegeven van de koppeling van de bestanden binnen de RA omgeving met de veldwerkbestanden uit de examenklassen in het voortgezet onderwijs. Deze Veldwerkbestanden vallen niet binnen het huidige bestandenproject maar kunnen in de toekomst op eenzelfde wijze verrijkt worden. Als voorbeeld zijn in de tabel de eerste afnames van COOL 5-18 in de examenklassen havo (2009/2010) en vwo (2010/2011) beschreven.
Tabel 2.3 Systematiek van de te koppelen bestanden aan de veldwerkbestanden in Havo 5 en Vwo 6 Jaartallen van de te koppelen bestanden 2004/ 2005 COOL Havo 5 Afname 2009/2010
Afname 2010/2011
2006/ 2007
2007/ 2008
2008/ 2009
2009/ 2010
2010/ 2011
2011/ 2012
2010/ 2011
2011/ 2012
Onderwijsposities Diplomagegevens
Havo 5
Gemeentelijke basisadminstratie 2004/ 2005
COOL Vwo 6
2005/ 2006
2005/ 2006
2006/ 2007
2007/ 2008
2008/ 2009
2009/ 2010
Onderwijsposities
Diplomagegevens
Vwo 6
Gemeentelijke basisadministratie
Wederom kunnen de veldwerkbestanden van de examenklassen worden verrijkt met gegevens met betrekking tot de onderwijsloopbanen van de leerlingen uit de jaren voorafgaand en nadat de afname heeft plaatsgevonden. Door terug te gaan met het maken van koppelingen tot gegevens uit het schooljaar 2004/2005 kunnen ook de onderwijsloopbanen worden geconstrueerd van leerlingen die in het voortgezet onderwijs één jaar vertraging hebben opgelopen. Examengegevens kunnen aan de veldwerkbestanden worden gekoppeld vanaf het jaar van de afname. Aangezien de leerlingen in de examenklas zitten, verwachten we dat van veel van deze leerlingen gegevens in de examenbestanden aanwezig zullen zijn. Ook in de jaren na de examenklas kunnen examengegevens gekoppeld worden.
6
Hierdoor kan informatie worden verkregen over de examens van de leerlingen die in eerste instantie zijn gezakt voor het examen, maar ook voor havo-leerlingen die doorstromen naar het vwo. Vergelijkbaar met de voorgaande typen veldwerkbestanden kan ook hier een koppeling gemaakt worden met de gegevens uit de gemeentelijke basisadministratie van het jaar van de afname.
2.3. De verrijkte databestanden Het resultaat van dit project waarbij veldwerkbestanden van COOL5-18 zijn verrijkt met aanvullende gegevens zijn drie bestanden die beschikbaar zijn voor verdere analyse binnen de RA omgeving van CBS. De volgende bestanden zijn beschikbaar2: Verrijkt bestand PRIMA groep 8 2004/2005:
CohA_afn0405_PrimaGp8.sav
Verrijkt bestand COOL5-18 groep 8 2007/2008:
CohB_afn0708_PO8.sav
Verrijkt bestand COOL
5-18
klas 3 2007/2008:
CohA_afn0708_VO3.sav
Alle verrijkte veldwerkbestanden van COOL5-18 hebben dezelfde structuur met betrekking tot de variabelen die in de verrijkte bestanden zitten. 1. De variabele RINPERSOON en RINPERSOONS. Deze variabele is gebruikt om de veldwerkbestanden te koppelen aan de gegevens uit de inschrijvings-, examen- en gemeentelijke basisadministratie-bestanden. De variabele RINPERSOON identificeert unieke leerlingen. Deze variabele kan tevens worden gebruikt om de verrijkte COOL5-18 bestanden te koppelen aan andere microdatabestanden die beschikbaar zijn in de RA omgeving. 2. De variabele dum_kopp. Deze variabele geeft weer of de gegevens van leerlingen uit de veldwerkbestand gekoppeld konden worden aan de gegevens uit de aanvullende databestanden of waarom een eventuele koppeling niet mogelijk was. De records van sommige leerlingen konden niet worden gekoppeld vanwege het ontbreken van een waarde op de variabele RINPERSOON of een dubbele waarde op de variabele RINPERSOON. 3. De variabelen uit de COOL5-18 veldwerkbestanden. Het betreft (een deel van) de veldwerkbestanden zoals deze via DANS beschikbaar zijn. Voor de beschrijving van de variabelen uit de veldwerkbestanden verwijzen we naar de technische rapporten die behoren bij elk van de veldwerkbestanden. Zie tabel 2.4 voor een overzicht van de technische rapporten van de verrijkte COOL5-18 veldwerkbestanden uit dit project. 4. De variabelen die afkomstig zijn uit bestanden met achtergrondinformatie over leerlingen en hun ouders. Deze gegevens zijn alleen gekoppeld voor het schooljaar waarin ook de veldwerkbestanden zijn afgenomen. Een beschrijving van deze variabelen volgt in het volgende hoofdstuk van dit rapport.
2
De namen van de verrijkte COOL5-18 bestanden kennen de volgende structuur. 1) Indicator van het cohort 2) Schooljaar van afname 3) Groep of klas van de meting Hierbij kunnen de bestanden uit hetzelfde cohort zinvol aan elkaar worden gekoppeld.
7
5. De variabelen die geconstrueerd zijn op basis van de inschrijvingsgegevens. Deze variabelen zijn gekoppeld voor verschillende opeenvolgende leerjaren. De variabelen worden per schooljaar geclusterd. 6. De variabelen die geconstrueerd zijn op basis van de examengegevens. Vergelijkbaar met de variabelen die geconstrueerd zijn op basis van de inschrijvingsgegevens worden ook gegevens over de examens van leerlingen voor meerdere opeenvolgende leerjaren gekoppeld. Wederom worden de variabelen die aan de veldwerkbestanden worden toegevoegd geclusterd per schooljaar.
Tabel 2.4 Overzicht van de technische rapporten bij elk van de veldwerkbestanden. PRIMA groep 8 2004/2005
Driessen, G., Langen, A. van, & Vierke, H. (2006). Basisonderwijs: Veldwerkverslag, leerlinggegevens en oudervragenlijsten. Basisrapportage PRIMA-cohortonderzoek. Zesde meting 2004/05. Nijmegen: ITS.
COOL5-18 groep 8 2007/2008
Driessen, G., Mulder, L., Ledoux, G., Roeleveld, J., & Veen, I. van der (2009). Cohortonderzoek COOL5-18. Technisch rapport basisonderwijs, eerste meting 2007/08. Nijmegen: ITS/ Amsterdam: SCO-Kohnstamm Instituut.
COOL5-18 klas 3 2007/2008
Zijsling, D., Keuning, J., Kuyper, H., Batenburg, T.van, en Hemker, B. (2009). Cohortonderzoek COOL5-18: Technisch rapport eerste meting van COOL5-18 in het derde leerjaar van het voortgezet onderwijs. Groningen: GION.
2.4. Resultaat van de koppelingen binnen het bestandenproject Het koppelen van de veldwerkbestanden van COOL5-18 heeft plaatsgevonden in een aantal stappen. In verschillende van deze stappen konden zich zaken voordoen waardoor het niet mogelijk was om voor alle leerlingen de koppeling met de aanvullende databestanden te maken. Dit kan zijn, doordat het niet mogelijk was om een RINPERSOON nummer toe te kennen aan een leerling, omdat een leerling een dubbel RINPERSOON nummer heeft of omdat de leerling niet gevonden kon worden in de aanvullende databestanden. In de onderstaande tabellen is voor elk van de drie COOL 5-18 veldwerkbestanden weergegeven hoeveel gerealiseerde koppelingen gemaakt zijn. Er is zowel weergegeven voor hoeveel leerlingen een koppeling konden worden gemaakt ten opzichte van het volledige veldwerkbestand als ten opzichte van de leerlingen die waarvan gegevens koppelbaar zijn. De laatste groep zijn de leerlingen waarvoor een uniek RINPERSOON nummer beschikbaar is. De gerealiseerde koppelingen voor het veldwerkbestand van PRIMA groep 8 schooljaar 2004/2005 zijn beschreven in Tabel 2.5. Van het totale veldwerkbestand heeft 90,2% van de leerlingen een uniek RINPERSOON nummer gekregen. Dit zijn de leerlingen waarvan de gegevens uit het veldwerkbestand verrijkt kunnen worden met gegevens uit de andere bestanden. Gegevens met betrekking tot de onderwijsposities kunnen voor bijna alle koppelbare leerlingen worden toegevoegd. Het aantal koppelingen neemt in de loop van de tijd iets af. In het eerste leerjaar na de verzameling van de veldwerkbestanden (2005/2006), wanneer we verwachten dat de leerlingen in de eerste klas van het VO zitten, zijn gegevens over de onderwijsposities bekend van 98,5% van de koppelbare leerlingen. Dit neemt af tot 78,7% in schooljaar 2011/2012. De eerste gegevens rondom examens van leerlingen zijn beschikbaar in schooljaar 2007/2008, hoewel van de meeste leerlingen examen
8
gegevens bekend zijn in de drie schooljaren die daarop volgen. Wat betreft de gegevens uit de GBA bestanden blijkt dat voor alle koppelbare leerlingen een koppeling gerealiseerd kan worden. Dat betekent echter niet dat er geen missende waarden zijn in specifieke variabelen uit de GBA bestanden.
Tabel 2.5 Overzicht van gerealiseerde koppelingen voor het veldwerkbestand PRIMA groep 8 schooljaar 2004/2005 N 13.847 12.489 1.213 145 12.304 12.330 12.253 12.158 11.866 11.155 9.823 28 6.433 2.864 4.137 12.489
Totaal aantal leerlingen veldwerkbestand Leerlingen met RINPERSOON nummer Leerlingen zonder RINPERSOON nummer Leerlingen met dubbel RINPERSOON nummer Onderwijsloopbaan-gegevens 2005/2006 2006/2007 2007/2008 2008/2009 2009/2010 2010/2011 2011/2012 Examengegevens 2007/2008 2008/2009 2009/2010 2010/2011 Gemeentelijke basisadministratie (2004/2005)
% van totaal 100,0 90,2 8,8 1,0 88,9 89,0 88,5 87,8 85,7 80,6 70,9 0,2 46,5 20,7 29,9 90,2
% koppelbaar
98,5 98,7 98,1 97,3 95,0 89,3 78,7 0,3 51,1 23,0 33,2 100,0
Tabel 2.6 Overzicht van gerealiseerde koppelingen voor het veldwerkbestand COOL5-18 groep 8 schooljaar 2007/2008 Totaal aantal leerlingen veldwerkbestand Leerlingen met RINPERSOON nummer Leerlingen zonder RINPERSOON nummer Leerlingen met dubbel RINPERSOON nummer Onderwijsloopbaan-gegevens
Examengegevens Gemeentelijke basisadministratie (2007/2008)
2008/2009 2009/2010 2010/2011 2011/2012 2010/2011
9
N 11.609 10.907 702 0 10.903 10.843 10.759 10.642 26 10.907
% totaal 100 94,0 6,0 0,0 93,9 93,4 92,6 91,6 0,0 94,0
% koppelbaar
99,9 99,4 98,6 97,6 0,0 100,0
Tabel 2.7 Overzicht van gerealiseerde koppelingen voor het veldwerkbestand COOL5-18 derde klas voortgezet onderwijs schooljaar 2007/2008 Totaal aantal leerlingen veldwerkbestand Leerlingen met RINPERSOON nummer Leerlingen zonder RINPERSOON nummer Leerlingen met dubbel RINPERSOON nummer Onderwijsloopbaan-gegevens 2004/2005 2005/2006 2006/2007 2007/2008 2008/2009 2009/2010 2010/2011 2011/2012 Examengegevens 2008/2009 2009/2010 2010/2011 Gemeentelijke basisadministratie (2007/2008)
N 8.884 8.408 476 0 749 8.307 8.366 8.393 8.346 8.122 7.553 6.775 3.790 2.219 3.025 8.407
% totaal 100 94,6 5,4 0,0 8,4 93,5 94,2 94,5 93,9 91,4 85,0 76,2 42,7 25,0 34,0 94,6
% koppelbaar
8,9 98,7 99,5 99,8 99,3 96,6 89,8 80,6 45,1 26,4 36,0 100,0
De gerealiseerde koppelingen voor het veldwerkbestand van COOL 5-18 groep 8 schooljaar 2007/2008 zijn beschreven in Tabel 2.6. Voor dit veldwerkbestand zijn er nog maar een beperkt aantal aanvullende bestanden beschikbaar waarmee een koppeling kan worden gerealiseerd. Relatief kunnen er voor meer leerlingen uit dit veldwerkbestand koppelingen gemaakt worden. Voor 94,0% van de leerlingen is een uniek RINPERSOON nummer beschikbaar. Vanaf schooljaar 2008/2009 tot schooljaar 2011/2012 zijn koppelingen gerealiseerd. Daarbij konden voor bijna alle koppelbare leerlingen gegevens worden toegevoegd over de onderwijsposities (minimaal 97,6% in schooljaar 2011/2012). Gegevens met betrekking tot de diploma’s en examens levert 26 koppelingen op in schooljaar 2010/2011, dit betreft leerlingen die sneller dan nominaal aan het examen hebben meegedaan. Wederom kan voor alle koppelbare leerlingen gegevens worden toegevoegd uit de GBA bestanden, hoewel missende waarden voorkomen in sommige variabelen. De gerealiseerde koppelingen voor de gegevens uit het veldwerkbestand van COOL5-18 klas 3 schooljaar 2007/2008 zijn beschreven in Tabel 2.7. Voor dit veldwerkbestand zijn 94,6% van de leerlingen koppelbaar met andere aanvullende gegevens. Gegevens met betrekking tot de onderwijsposities zijn gekoppeld vanaf schooljaar 2004/2005 tot en met schooljaar 2011/2012. Met uitzondering van het eerste jaar (2004/2005) worden de gegevens van relatief veel leerlingen gekoppeld. Dit komt doordat 2004/2005 alleen gekoppeld kon worden voor de vertraagde leerlingen. Onvertraagde leerlingen zaten toen nog niet in het voortgezet onderwijs. Het hoogste percentage koppelingen (99,8%) wordt gerealiseerd in het schooljaar dat ook de gegevens uit de veldwerkbestanden zijn verzameld. Wat betreft de examengegevens zijn koppelingen gerealiseerd voor de schooljaren 2008/2009 tot en met schooljaar 2010/2011. Met uitzondering van één leerling kan voor alle koppelbare leerlingen gegevens worden toegevoegd uit de GBA bestanden, hoewel missende waarden voorkomen in sommige variabelen.
10
3
3.1.
BESCHRIJVING VAN GEKOPPELDE VARIABELEN
Onderwijsloopbaangegevens
Wat betreft de onderwijsloopbaangegevens worden voor elk schooljaar een aantal variabelen toegevoegd die te maken hebben met de school (brin) en de vestiging waar de leerlingen zijn ingeschreven, de algemene en meer specifieke onderwijspositie, de sectoren of profielen in het voortgezet onderwijs, de sectoren in het middelbaar beroepsonderwijs en tenslotte de typen opleidingen in het middelbaar-, hoger- of wetenschappelijk onderwijs. De inschrijvingsbestanden (microdatabestanden) waaruit de variabelen zijn gehaald voor de verrijking van de COOL veldwerkbestanden zijn: -
110502Inschrijvingen20041001 110502Inschrijvingen20051001 110502Inschrijvingen20061001 110502Inschrijvingen20071001 110502Inschrijvingen20081001 110531Inschrijvingen20091001 121210Inschrijvingen 2010v1 121210Inschrijvingen 2011v1
In de bestanden met onderwijsloopbaangegevens zijn gegevens beschikbaar rondom de inschrijving van leerlingen op de peildatum 1 oktober van het betreffende schooljaar. Gegevens zijn beschikbaar voor leerlingen die staan ingeschreven op een school die wordt bekostigd door het ministerie van Onderwijs, Cultuur en Wetenschap (OCW) of het ministerie van Economische Zaken (EZ). Dit laatste ministerie bekostigt VMBO-afdelingen en MBO-opleidingen van Agrarische opleidingscentra, agrarische hogescholen en Universiteit van Wageningen. Voor het middelbaarberoepsonderwijs (MBO) moet worden opgemerkt dat ook extraneï in de bestanden zijn opgenomen. Dit zijn leerlingen die wel staan ingeschreven bij de instellingen, maar alleen voor het maken van de examens, niet voor het volgen van onderwijs3. Voor de volgende groepen leerlingen zijn geen gegevens beschikbaar in deze databestanden:
Leerlingen in het voortgezet speciaal onderwijs Leerlingen in het particuliere voortgezet onderwijs of particulier middelbaarberoepsonderwijs Leerlingen in het voortgezet algemeen volwassenen onderwijs (Vavo) Studenten aan de open universiteit
Voor een aantal groepen leerlingen geldt dat hun onderwijsloopbaangegevens in de eerste inschrijvingsbestanden niet beschikbaar zijn, maar waarvoor in de loop van tijd wel gegevens beschikbaar komen. Dit betreffen:
3
In de meeste rapportages van CBS worden de Extraneï niet in opgenomen. In de gekoppelde bestanden zijn deze leerlingen wel aanwezig. Ze kunnen geselecteerd worden aan de hand van het type MBO opleiding (bijvoorbeeld: op_2005_mbo_typ).
11
Leerlingen die staan ingeschreven bij een school voor voortgezet onderwijs, maar die uitbesteed zijn aan het Vavo (vanaf schooljaar 2006/2007) Leerlingen in het praktijkonderwijs (vanaf schooljaar 2007/2008)
De namen van alle variabelen uit de inschrijvingsgegevens hebben dezelfde structuur. Het eerste deel van de naam (op) geeft aan dat het variabelen betreft die informatie over de onderwijsposities weergeven. Het tweede deel van de naam geeft aan uit welk jaar de gegevens afkomstig zijn. Bijvoorbeeld jaar 2005 betekent dat het gegevens betreft uit schooljaar 2005/2006. En het laatste deel van de naam geeft aan op welk aspect van de onderwijsloopbaan de variabele betrekking heeft. In het onderstaande overzicht worden de verschillende variabelen met betrekking tot de onderwijspositie- en examengegevens weergegeven. De volgorde van de variabelen in het verrijkte veldwerkbestand is identiek aan de volgorde waarin de variabelen in het onderstaande overzicht worden beschreven. In dit overzicht worden als voorbeeld namen gebruikt van de variabelen voor het schooljaar 2005/2006. De coderingen en de manier van construeren van de variabelen en de gebruikte coderingen voor de overige variabelen van de andere leerjaren zijn identiek aan de variabelen uit 2005/2006. Bij de constructie van de variabelen is gebruik gemaakt van de ruwe data zoals die voor dit project is aangeleverd. Er heeft geen verdere opschoning van de data plaatsgevonden. Dat betekent dat in een zeer beperkt aantal gevallen opvallende onderwijsposities of overgangen gevonden zijn.
3.2.
Variabelen onderwijsloopbaangegevens
op_2005
Dummy variabele die aangeeft of een leerling voorkomt in de inschrijvingsbestanden. Hierbij wordt een onderscheid gemaakt naar leerlingen die niet koppelbaar zijn vanwege het ontbreken of een dubbel RINPERSOON nummer, leerlingen die wel koppelbaar zijn maar die niet in de inschrijvingsbestanden gevonden worden en tenslotte leerlingen die wel koppelbaar zijn en tevens gevonden worden in de inschrijvingsbestanden. Values 0 “nee - niet koppelbare case” 1 “nee – niet in inschrijvingsbestand” 2 “ja”
op_2005_brin4
Versleuteld brin-nummer die de school weergeeft waar de leerling staat ingeschreven.
op_2005_vestn
Vestigingsnummer van de school voor voortgezet onderwijs waar de leerling staat ingeschreven.
op_2005_vorm
Vorm van vervolgonderwijs. Deze variabele geeft aan in welk type vervolgonderwijs de leerling staat ingeschreven. Deze variabele is geconstrueerd op basis van de door het CBS geleverde variabele: ONDERWIJSSOORT. Values
12
1 “VO” 2 “MBO” 3 “HBO” 4 “WO” 9 “Geen vervolgonderwijs” op_2005_alg
Onderwijspositie algemeen. Dit is een variabele die weergeeft in welk type onderwijs een leerling zit gecombineerd met het leerjaar. Deze variabele is geconstrueerd op basis van de volgende variabelen uit de bestanden die door het CBS geleverd zijn: ONDERWIJSSOORT. LEERJAARVO, AANTALJARENMBO, AANTALJARENHO. Values De values voor deze variabele bestaan allemaal uit 2 cijfers. Het eerste cijfer geeft weer in welk type vervolgonderwijs een leerling zit en corresponderen met de values van de variabele “op_2005_vorm”, namelijk: 1 “VO” 2 “MBO” 3 “HBO” 4 “WO” Het tweede cijfer geeft aan in welk leerjaar de leerling zit van het voortgezet onderwijs of het aantal jaren dat een leerling is ingeschreven in het MBO of HO. Voor het aantal jaren in het MBO of HO geldt dat waarden van 10 of hoger in het verrijkte bestand de waarde 9 hebben gekregen. In deze categorie vallen dan ook de studenten die 9 jaar of langer in het MBO of HO staan ingeschreven. De volgende coderingen gehanteerd: 0 “jaar??” 1 “jaar 1” 2 “jaar 2” 3 “jaar 3” 4 “jaar 4” 5 “jaar 5” 6 “jaar 6” 7 “jaar 7” 8 “jaar 8” 9 “jaar 9+”
Op deze wijze geeft bijvoorbeeld de codering 12 weer dat de leerling zit in de tweede jaar van het voort gezet onderwijs. 99 “Geen vervolgonderwijs” op_2005_vo_srt
Soort voortgezet onderwijs waar de leerling staat ingeschreven. Deze variabele geeft weer in welke van de onderwijs typen in het voortgezet onderwijs een leerling zit. Deze variabele is geconstrueerd op basis van de door CBS aangeleverde variabele: ONDERWIJSSOORTVO.
13
Values 0 “Prakt.ond” 1 “BBL” 2 “BBL/KBL” 3 “KBL” 4 “GTL” 5 “Vmbo/Havo/Vwo” 6 “TL/ Havo/Vwo” 7 “Havo” 8 “Havo/Vwo” 9 “Vwo” op_2005_vo
Specifieke onderwijspositie in het voortgezet onderwijs. Deze variabele is een combinatie van het leerjaar en de soort voortgezet onderwijs waar een leerling staat ingeschreven. Deze variabele is geconstrueerd op basis van de volgende variabelen uit de bestanden die door CBS geleverd zijn: ONDERWIJSSOORTVO en LEERJAARVO. Values De values voor deze variabelen bestaan allemaal uit 2 cijfers. Het eerste cijfer geeft het leerjaar weer. Het tweede cijfer geeft de onderwijssoort in het voortgezet onderwijs weer. Hierbij is eenzelfde codering gebruikt als voor de variabele “op_2005_vo_srt”, namelijk: 0 “Prakt.ond” 1 “BBL” 2 “BBL/KBL” 3 “KBL” 4 “GTL” 5 “Vmbo/Havo/Vwo” 6 “TL/ Havo/Vwo” 7 “Havo” 8 “Havo/Vwo” 9 “Vwo” Op deze wijze geeft bijvoorbeeld de codering 31 weer dat de leerling in de derde klas zit van de onderwijssoort BBL. 92 “Nvt – geen VO maar MBO” 93 “Nvt – geen VO maar HBO” 94 “Nvt – geen VO maar WO” 99 “Geen vervolonderwijs”
op_2005_vo_sect
Sector binnen het VMBO. Voor de leerlingen in de bovenbouw van het vmbo is beschikbaar in welke sector ze zitten. Voor de overige leerling is in de codering van missende waarden weergegeven waarom er voor deze leerling geen sector aanduiding is. Deze variabele is geconstrueerd op basis van: SECTORVO.
14
Values 1 “Techniek: 2 “Landbouw” 3 “Economie” 4 “Zorg&Welzijn” 5 “Combinatie” 95 “Nvt – VMBO klas 3/4 – TL” 96 “Nvt – geen VMBO klas 3/4" 97 “Nvt – geen VMBO” 98 “Nvt – geen VO maar MBO/HBO/WO” op_2005_vo_prof
Profielen binnen bovenbouw Havo/Vwo. Voor de leerlingen in de bovenbouw van Havo en Vwo is geregistreerd welk profiel ze volgen. Voor leerlingen in de Engelse stroom en International Baccalaureaat is een aparte categorie toegevoegd (11) aangezien deze leerlingen geen profiel kiezen. Vergelijkbaar met de sectoren is in de codering van de missende waarden weergegeven waarom leerlingen geen profiel indicatie beschikbaar is. Deze variabele is geconstrueerd op basis van: PROFIELVO. Values 1 “N&T” 2 “N&G” 3 “E&M” 4 “C&M” 5 “N&T/N&G” 6 “N&T/E&M” 7 “N&T/C&M” 8 “N&G/C&M” 9 “N&G/E&M” 10 “E&M/C&M” 11 “Int. Bacc./Eng.Stroom” 96 “Nvt – geen Havo/Vwo klas 4/5/6” 97 “Nvt – geen Havo/Vwo” 98 “Nvt – geen VO maar MBO/HBO/WO”
op_2005_mbo_sect Sector binnen het MBO. Vergelijkbaar met het voortgezet onderwijs is ook voor het MBO de sector indeling geregistreerd. In het geval een opleiding tot meerdere sectoren behoort is deze toegekend aan de categorie “Combinatie”. In de codering van de missende waarden is weergegeven waarom bepaalde groepen leerlingen geen sector aanduiding hebben. Values 1 “Techniek” 2 “Landbouw” 3 “Economie” 4 “Zorg&Welzijn” 5 “Combinatie” 91 “Nvt – geen MBO maar VO”
15
93 “Nvt – geen MBO maar HBO” 94 “Nvt – geen MBO maar WO” op_2005_mbo_typ
Type opleiding binnen het MBO. Deze variabele geeft weer of een leerling is ingeschreven in een voltijd of deeltijd opleiding in het MBO. Wederom is in de codering van de missende waarden weergegeven wat de reden is waarom leerlingen geen indicatie hebben van type MBO opleiding. Deze variabele is geconstrueerd op basis van: TYPEMBO. Values 1 “BOL voltijd” 2 “BOL deeltijd” 3 “BBL” 4 “Extranei” 91 “Nvt – geen MBO maar VO” 93 “Nvt – geen MBO maar HBO” 94 “Nvt – geen MBO maar WO”
op_2005_ho_typ
Type HBO/WO opleiding. Deze variabele geeft weer of een leerling is ingeschreven in een voltijd of deeltijd opleiding in het HBO of WO. Wederom is in de codering van de missende waarden weergegeven wat de reden is waarom leerlingen geen indicatie hebben van type HO opleiding. Deze variabele is geconstrueerd op basis van: ONDERWIJSSOORT en VORMOPLHO. Values 1 “voltijd HBO” 2 “deeltijd HBO” 3 “duaal HBO” 4 “voltijd WO” 5 “deeltijd WO” 6 “duaal WO” 91 “Nvt – geen HO maar VO” 92 “Nvt – geen HO maar MBO”
3.3.
Examengegevens
Wat betreft de gegevens uit de examenbestanden worden een aantal gegevens gekoppeld die te maken hebben met examens van leerlingen in het voortgezet onderwijs en behaalde diploma’s van leerlingen in het middelbaarberoepsonderwijs. Dit betreft inschrijving van de school en vestiging, resultaat van het examen, sector en profiel van het examen in het voortgezet onderwijs en gegevens over het niveau en de opleiding van het bepaalde MBO diploma. De examenbestanden (microdatabestanden) waaruit de variabelen zijn gehaald voor de verrijking van de COOL veldwerkbestanden zijn: -
110503ExamvoDiplmbo20072008
16
-
110503ExamvoDiplmbo20082009 110531ExamvoDiplmbo20092010 121210ExamVoDiplomaMBO 2010v1
De gegevens in de examenbestanden zijn gebaseerd op de data verzameld op basis van het onderwijsnummer vanaf het jaar 2005. Voor 2005 zijn de gegevens afkomstig uit het Examen Resultaten Register (ERR)4. Gegevens zijn alleen beschikbaar voor leerlingen die staan ingeschreven op een school of instelling die wordt bekostigd door het ministerie van Onderwijs, Cultuur en Wetenschap (OCW) of het ministerie van Economische Zaken (EZ). Voor de gegevens betreffende de examens in het voortgezet onderwijs geldt dat alleen leerlingen in de bestanden zijn opgenomen waarvoor een examenuitslag beschikbaar is. Betreffende het MBO zijn alleen gegevens beschikbaar van de leerlingen die in een bepaald schooljaar een diploma hebben behaald. Dit heeft te maken met de oorspronkelijk bestanden die gebruikt zijn voor het verrijken van de COOL-veldwerkbestanden en waarin alleen records zitten van leerlingen die aan het examen hebben meegedaan of een diploma hebben behaald in het MBO.
De namen van alle variabelen uit de examenbestanden hebben dezelfde structuur. Het eerste deel van de naam (ex) geeft aan dat het variabelen betreft die informatie over het afgelegde voortgezet onderwijs examen of het behaalde MBO-diploma weergeven. Het tweede deel van de naam geeft aan uit welk jaar de gegevens afkomstig zijn. Bijvoorbeeld jaar 2005 betekent dat het gegevens betreft uit schooljaar 2005/2006. En het laatste deel van de naam geeft aan op welk aspect van de examengegevens de variabele betrekking heeft. In het onderstaande overzicht worden de verschillende variabelen met betrekking tot de examengegevens weergegeven. De volgorde van de variabelen in het verrijkte veldwerkbestand is identiek aan de volgorde waarin de variabelen in het onderstaande overzicht worden beschreven. In dit overzicht worden als voorbeeld namen gebruikt van de variabelen voor het schooljaar 2005/2006. De coderingen en de manier van construeren van de variabelen en de gebruikte coderingen voor de overige variabelen van de andere leerjaren zijn identiek aan de variabelen uit 2005/2006.
3.4.
Variabelen examengegevens
ex_2005
Dummy variabele die aangeeft of een leerling voorkomt in de examenbestanden. Hierbij wordt een onderscheid gemaakt naar leerlingen die niet koppelbaar zijn vanwege het ontbreken of een dubbel RINPERSOON nummer, leerlingen die wel koppelbaar zijn maar die niet in de examenbestanden gevonden worden en tenslotte leerlingen die wel koppelbaar zijn en tevens gevonden worden in de examenbestanden. Values
4
Examengegevens uit het jaar 2003 zijn niet geheel betrouwbaar (Documentatierapport COOL 2003-2009), vanwege een aanzienlijk hoger aantal leerlingen binnen de theoretische leerweg van het vmbo met leerwegondersteuning (LWOO) dan in de volgende jaren. Echter, voor de verrijking van de veldwerkbestanden speelt dit geen rol aangezien de leerlingen toen nog niet in het voortgezet onderwijs zaten.
17
0 “nee - niet koppelbare case” 1 “nee – niet in examenbestand” 2 “ja – VO examen” 3 “ja – MBO diploma” ex_2004_brin4
Versleuteld brin-nummer die de school weergeeft op welke onderwijsinstelling de leerling het examen heeft afgelegd of het diploma heeft behaald.
ex_2005_vestn
Vestigingsnummer van de onderwijsinstelling voor voortgezet onderwijs waar de leerling het examen heeft afgelegd of het diploma heeft behaald.
ex_2005_vo_uitslag
Uitslag van het door de leerlingen afgelegde examen in het voortgezet onderwijs. Values 1 “geslaagd” 2 “gezakt” 3 “derde tijdvak” 4 “d – deelcertificaat” 5 “e – gespreid examen” 6 “t – teruggetrokken” 8 “onbekend” 9 “Nvt – geen VO-examen”
ex_2005_vo_sect
VMBO sector waarin het examen is afgelegd. Voor de leerlingen in VMBO is geregistreerd in welke sector zij hun examen hebben afgelegd. De coderingen van de sectoren komen overeen met de coderingen die ook gebruikt zijn bij de inschrijvingsgegevens. Dit is niet voor alle leerlingen van toepassing, daarom zijn verschillende coderingen voor missende waarden gehanteerd. Values 1 “Techniek” 2 “Landbouw” 3 “Economie” 4 “Zorg&Welzijn” 5 “Combinatie” 96 “Nvt – VMBO TL” 97 “Nvt – Havo/Vwo” 98 “Nvt – geen VO examen”
ex_2005_vo_prof
Profielen waarin het examen is afgelegd. Voor de leerlingen in Havo en Vwo is geregistreerd in welk profiel ze examen hebben afgelegd. Deze variabele is geconstrueerd op basis van de ILT-codes van de opleiding waarin de leerling examen heeft gedaan. De codering van deze profielen komt overeen met de coderingen die ook gebruikt zijn voor de inschrijvingsgegevens. Ook voor de profielen geldt dat dit niet voor alle leerlingen van toepassing is, waardoor gewerkt is met
18
verschillende coderingen voor missende waarden. Values 1 “N&T” 2 “N&G” 3 “E&M” 4 “C&M” 5 “N&T/N&G” 6 “N&T/E&M” 7 “N&T/C&M” 8 “N&G/C&M” 9 “N&G/E&M” 10 “E&M/C&M” 11 “Int.Bacc./Eng.Stroom” 97 “Nvt – VMBO” 98 “Nvt – geen VO examen” ex_2005_mbo_niveau Niveau van behaalde MBO diploma. Values 1 “assistentenopleiding” 2 “basisberoepsopleiding” 3 “vakopleiding” 4 “middenkader/specialistenopleiding” 9 “Nvt – geen MBO-diploma” ex_2005_mbo_crebo
Crebo code van de opleiding van het behaalde MBO-diploma.
3.5 Achtergrondinformatie Gegevens uit de gemeentelijke basisadministratie zijn alleen gekoppeld aan de veldwerkbestanden voor het jaar dat de veldwerkbestanden zijn verzameld. Er is gekozen om een beperkt deel van de gegevens uit de bestanden met achtergrondkenmerken te koppelen aan de COOL veldwerkbestanden. Een van de redenen hiervoor is dat een deel van de achtergrondkenmerken van leerlingen en ouders ook zijn meegenomen in de dataverzameling van de veldwerkbestanden, zoals de etnische achtergrond. Gekoppelde variabelen betreffen kenmerken die niet in de COOL dataverzameling zijn opgenomen, zoals het type huishouden waarin de leerling woont, de bron van inkomsten van de beide ouders van de leerlingen en het persoonlijk inkomen van de ouders van de leerlingen. De bestanden met gegevens uit de gemeentelijke basisadministratie (microdatabestanden) waaruit de variabelen zijn gehaald voor de verrijking van de COOL veldwerkbestanden zijn: -
110504Achtergrondgegevens personen 20040926 110504Achtergrondgegevens personen 20070928
Bij de gekoppelde gegevens uit de bestanden met achtergrondgegevens van leerlingen en ouders moet worden opgemerkt dat het gegevens betreffen van de juridische vader en moeder van de leerling. Niet in alle gevallen zal het kind daadwerkelijk woonachtig zijn bij zijn/haar juridische ouders.
19
In het onderstaande overzicht wordt een beschrijving gegeven van de variabelen uit het GBA bestand die aan de veldwerkbestanden zijn gekoppeld. Met uitzondering van het Type inkomen zijn alle variabelen overgenomen uit de bestanden met achtergrondgegevens, zonder daar verdere aanpassingen aan te doen. Dit betekent dat er in de verrijkte bestanden soms onwaarschijnlijke coderingen voorkomen, zoals “Type_huish” = 3, wat staat voor een gehuwd stel zonder kinderen. De volgorde van de variabelen in het verrijkte veldwerkbestand is identiek aan de volgorde waarin de variabelen in het onderstaande overzicht worden beschreven. De gebruikte coderingen zijn gelijk voor elk van de verrijkte veldwerkbestanden.
3.6.
Variabelen gemeentelijke basisadministratie
Type_huish
Type huishouding. Deze variabele geeft weer wat de samenstelling is van het huishouden waarin de leerling leeft. Values - “Onbekend” 1 “Eenpersoonshuishouden” 2 “Ongehuwd samenw. stel zonder kinderen” 3 “Gehuwd stel zonder kinderen” 4 “Ongehuwd samenwonend stel met kinderen” 5 “Gehuwd stel met kinderen” 6 “Eenouderhuishouden” 7 “Overig huishouden” 8 “Institutioneel huishouden” 9 “Onbekend”
Kinderen_huish
Aantal kinderen in het huishouden (inclusief andere leden van het huishouden jonger dan 17 jaar).
Gen_Allochtoon
Herkomst groeperingen in generaties. Bij deze variabele moet worden opgemerkt dat er een deels vergelijkbare variabele beschikbaar is in de COOL 5-18 veldwerkbestanden. Deze zijn afkomstig vanuit verschillende dataverzamelingen. Hierdoor kan het zijn dat er verschillen zijn tussen de indeling in generatie allochtoon van de veldwerkbestanden en de verrijkte variabele.
Values 0 “Autochtoon” 1 “1e generatie” 2 “2e gen. één ouder buitenl.” 3 “2e gen. beide ouders buitenl.” 4 “Onbekend” Type_Ink_Vader
Deze variabele geeft weer wat de bron is van het inkomen van de juridische vader van de leerling. De variabele staat ook wel bekend als de socio-
20
economische categorie. De sociaal-economische categorie waar een persoon toe behoord wordt bepaald op basis van een aantal aspecten, zoals leeftijd, maandinkomsten en bron van inkomsten5. Hiertoe worden de maandinkomsten van verschillende inkomsten bronnen vergeleken, waarbij het hoogste bedrag bepalend is voor de sociaal-economische categorie. Voor de bepaling van de sociaal-economische categorie gelden de volgende regels:
Personen onder de 4 jaar krijgen per definitie de sociaal-economische categorie “overige” toegekend. Personen van 4 t/m 15 jaar krijgen per definitie de sociaal-economische categorie “scholier/student” toegekend. Personen van 16 en 17 jaar krijgen de sociaal-economische categorie “scholier/student” toegekend als hun overige inkomsten kleiner zijn dan 70% van het minimumloon inclusief vakantie geld. In het geval de inkomsten gelijk aan of hoger dan 70% van het minimumloon zijn is de bron van inkomsten bepalend voor de sociaal-economische categorie. Personen van 18 jaar en ouder die studeren krijgen de sociaaleconomische categorie “scholier/student” toegekend als hun overige inkomsten kleiner zijn dan 70% van het minimumloon inclusief vakantie geld. In het geval de inkomsten gelijk aan of hoger dan 70% van het minimumloon zijn is de bron van inkomsten bepalend voor de sociaaleconomische categorie. Zelfstandigen krijgen de sociaal-economische categorie “zelfstandige” toegekend indien overige inkomsten gezamenlijk kleiner zijn dan 70% van het minimumloon. In het geval de inkomsten gelijk aan of hoger dan 70% van het minimumloon zijn is de bron van inkomsten bepalend voor de sociaal-economische categorie. Personen die geen enkele inkomsten hebben op het peilmoment krijgen de sociaal-economische categorie “overige” toegekend.
De gekoppelde variabele aan de veldwerkbestanden van COOL5-18 is geconstrueerd op basis van de volgende door CBS geleverde variabele: SECPA.
Values 1 “Werknemer” 2 “zelfstandige” 3 “uitkering” 4 “pensioen” 5 “scholier/student” 6 “overig” 9 “onbekend”
5
Niet alle bronnen van inkomsten kunnen worden meegenomen bij de bepaling van de sociaal-economische categorie, zoals alimentatie of inkomen uit vermogen.
21
Ink_Vader
Deze variabele geeft het persoonlijke inkomen weer van de juridische vader van de leerling. Dit inkomen is gemeten in euro’s, waarbij zowel positieve als negatieve waarde voor kunnen komen. Het inkomen is afgekapt op een totaal van +/- 1.000.000 euro6. Het persoonlijk inkomen is gelijk aan het persoonlijk bruto inkomen, minus de betaalde premies inkomensverzekeringen (exclusief premies volksverzekeringen). De vaststelling van het persoonlijk inkomen van de vader (of de moeder) is afwijkend van de manier van vaststellen van inkomen op niveau van huishoudens. De reden hiervoor is dat sommige inkomensbestandsdelen niet goed zijn toe te schrijven aan één persoon. Dit zijn inkomen uit vermogen, kinderbijslag, gebonden uitkeringen, betaalde overdrachten, betaalde belasting en de betaalde premie voor volksverzekeringen en ziektekosten (Documentatierapport COOL 2003-2009V1).
Type_Ink_Moeder Deze variabele geeft weer wat de bron is van het inkomen van de juridische moeder van de leerling. Het type inkomen van de moeder is op dezelfde manier bepaald als het type inkomen voor de juridische vader. De gekoppelde variabele aan de veldwerkbestanden van COOL5-18 is geconstrueerd op basis van de volgende door CBS geleverde variabele: SECMA.
Values 1 “Werknemer” 2 “zelfstandige” 3 “uitkering” 4 “pensioen” 5 “scholier/student” 6 “overig” 9 “onbekend” Ink_Moeder
Deze variabele geeft het persoonlijke inkomen weer van de juridische moeder van de leerling. Deze variabele is vergelijkbaar met de variabele die het persoonlijk inkomen van de juridische vader van de leerling. Het persoonlijk inkomen van de juridische moeder is gemeten in euro’s, waarbij zowel positieve als negatieve waarde voor kunnen komen. Het inkomen is afgekapt op een totaal van 1.000.000 euro.
3.7
Ontbreken van gegevens omtrent opleidingsniveau
Op basis van de geleverde gegevens van GBA bleek dat er geen zinvolle koppeling gemaakt kon worden met de variabelen die het opleidingsniveau van de juridische ouders van de leerlingen bevat. 6
Een negatief inkomen kan voorkomen en worden in de bestanden niet uitgesloten. Dit kan bijvoorbeeld voorkomen wanneer de ouder van de leerling zelfstandige is die verlies lijdt.
22
In de GBA bestanden zijn gegevens omtrent het opleidingsniveau van ouders in twee typen variabelen beschikbaar. Beide zijn gebaseerd op de niveau indeling van de SOI codes. Schattingen van het opleidingsniveau van de ouders van leerlingen in de bestanden met achtergrondgegevens zijn deels gebaseerd op steekproef data en deels op registerdata. Het betreft hier een selectieve groep ouders waarvoor opleidingsniveau gegevens beschikbaar zijn (vooral oudere personen). Deze gegevens kunnen niet zondermeer gebruikt worden voor analyse aangezien deze uit verschillende steekproeven afkomstig zijn en met verschillende ophoogwaarden. Voor meer informatie omtrent opleidingsniveau zie Documentatierapport COOL 2003-2009V1. Slechts voor een zeer beperkte groep leerlingen kan een koppeling met gegevens omtrent het opleidingsniveau van ouders tot stand worden gebracht. Bijvoorbeeld voor het veldwerkbestand PRIMA groep 8 schooljaar 2004/2005 leidt een koppeling tot missende waarden voor 87,9% van de leerlingen (10.972) wanneer het gaat om het opleidingsniveau van de juridische vader en tot 87,5% (10.930) missende waarden voor het opleidingsniveau van de moeder. Op basis van de zeer grote aantallen missende waarden is besloten geen koppelingen te maken met de opleidingsniveau variabelen. Het ontbreken van gegevens met betrekking tot het opleidingsniveau van de ouders is voor de drie verrijkte COOL5-18 bestanden binnen dit huidige project niet meteen een heel groot probleem, aangezien in de veldwerkbestanden een aanduiding van SES zit die gebaseerd is op het opleidingsniveau van ouders. Echter, de in de veldwerkbestanden aanwezige variabele voor opleidingsniveau is minder ver gespecificeerd. Het ontbreken van gegevens omtrent het opleidingsniveau van ouders is problematischer voor veldwerkbestanden van COOL5-18 voor de examenklassen Havo 5 en Vwo 6. Bij deze afnames is het opleidingsniveau niet bevraagd.
23