Stichting voor Economisch Onderzoek der Universiteit van Amsterdam
MOA 2005: weging en correctie voor allochtonen zonder Internet
Djoerd de Graaf
Onderzoek in opdracht van Intelligence Group
Amsterdam, juni 2005
Stichting voor Economisch Onderzoek der Universiteit van Amsterdam
MOA 2005: weging en correctie voor allochtonen zonder Internet
Djoerd de Graaf
Onderzoek in opdracht van Intelligence Group
Amsterdam, juni 2005
SEO-rapport nr. 811 ISSN 0926-2806
Copyright © 2005 SEO Amsterdam. Alle rechten voorbehouden. Het is geoorloofd gegevens uit dit rapport te gebruiken in artikelen en dergelijke, mits daarbij de bron duidelijk en nauwkeurig wordt vermeld.
Inhoud Inleiding................................................................................................................................................. 1 Correctie 1: representatief maken voor potentiële Nederlandse beroepsbevolking .................. 3 Correctie 2: representatief maken voor allochtonen met én zonder Internet............................. 5 Het effect van de correcties................................................................................................................ 9 Technische bijlage.............................................................................................................................. 11
1
Inleiding Ten behoeve van het Minderheden Onderzoek op de Arbeidsmarkt (MOA) zijn in 2005 opnieuw gegevens verzameld. Eind 2003, begin 2004 was de eerste meting. Destijds hebben 1343 allochtonen tussen de 15 en 64 jaar via Internet een vragenlijst ingevuld, waarbij de focus lag op jongeren tot en met 34 jaar. In 2005 zijn 1873 allochtonen tussen 15 en 35 jaar via Internet ondervraagd. Alleen de vier grootste groepen allochtonen in Nederland zijn ondervraagd: Turken, Marokkanen, Surinamers en Antillianen/Arubanen. Deze gegevens zijn niet zonder meer representatief voor alle allochtonen in Nederland tussen de 15 en 35 jaar in deze vier groepen. De verzamelde gegevens zijn, om representativiteit te bewerkstelligen, door middel van per respondent verschillende ‘weegfactoren’ gecorrigeerd. In dit rapport worden de toegepaste correcties beschreven. Het verzamelen van gegevens via Internet heeft twee gevolgen voor de representativiteit van de data. Ten eerste is het bekend dat vooral jongeren en hoger opgeleiden en - in mindere mate - mannen gebruik maken van Internet. Dat heeft tot gevolg dat ouderen, lager opgeleiden en vrouwen ondervertegenwoordigd zijn in een internetsteekproef. Om een dergelijke steekproef representatief te maken voor heel Nederland dienen alle gegevens hiervoor te worden gecorrigeerd. Dit gebeurt door middel van weging. Ten tweede zijn er verschillende vragen gesteld over mediakanalen die kunnen worden gebruikt bij de oriëntatie op een nieuwe baan. Uiteraard behoort ook Internet tot de mogelijke mediakanalen. Als de (gewogen) gegeven antwoorden op deze vraag als representatief voor de allochtone Nederlandse bevolking zouden worden beschouwd, wordt het gebruik van het mediakanaal Internet overschat. Bovendien zullen andere kanalen ten gevolge van substitutie zeer waarschijnlijk worden onderschat. Bij deze vragen is de eerstgenoemde correctie dus niet toereikend. Zowel de jongeren als de ouderen en zowel de hoger als de lager opgeleiden in de steekproef zullen meer dan gemiddeld gebruik maken van Internet. Hetzelfde geldt voor zowel mannen als vrouwen in de steekproef. In dit geval dient dus te worden gecorrigeerd voor het ontbreken van allochtonen die geen toegang hebben tot Internet. Ook deze correctie heeft plaatsgevonden. Kortom, de gegevens zijn op twee manieren gecorrigeerd. -
Correctie 1: representatief maken beroepsbevolking tussen 15 en 35 jaar.1
voor
allochtone
potentiële
- Correctie 2: representatief maken voor mensen met én zonder Internet. Beide correcties worden hieronder uitgebreid beschreven. 1
Op bladzijde 2 wordt de potentiële Nederlandse beroepsbevolking gedefinieerd.
Nederlandse
3
Correctie 1: representatief maken voor potentiële Nederlandse beroepsbevolking De enquête is afgenomen onder drie groepen allochtone Nederlanders tussen de 15 en 35 jaar: scholieren en studenten, werkzamen in loondienst, en niet-werkzamen die (in de toekomst) weer willen werken. Deze drie groepen hebben de potentie om - nu of in de toekomst - tot de beroepsbevolking te behoren, oftewel zich voor tenminste 12 uur aan te bieden op de arbeidsmarkt. Intelligence Group definieert de drie groepen samen daarom als de allochtone potentiële Nederlandse beroepsbevolking tussen 15 en 35 jaar. De geënquêteerden zijn niet zonder meer als representatief te beschouwen voor de totale allochtone potentiële Nederlandse beroepsbevolking tussen 15 en 35 jaar. Vandaar dat het bestand met de 1873 respondenten is gewogen op vier bekende gegevens van de totale populatie: leeftijd, hoogst voltooide opleiding, etniciteit en geslacht. Dit zijn de cruciale gegevens voor de weging. Door de bevraging via Internet kunnen - zoals eerder gemeld lager opgeleiden, ouderen en vrouwen ondervertegenwoordigd zijn in een steekproef. In Tabel 1 is per leeftijdscategorie, opleidingsniveau, etniciteit en geslacht het totaal aantal allochtonen in Nederland in 2002 weergegeven. Tabel 1
Totaal aantal allochtonen in opleidingsniveau (in duizendtallen)
Nederland
per
leeftijdscategorie
en
hoogst voltooide opleiding en geslacht basisonderwijs/ vbo/ mavo
mbo/havo/vwo
hbo/wo
leeftijd
etniciteit
man
vrouw
man
vrouw
man
vrouw
15 t/m 24
Turken
20
22
6
5
0
1
Marokkanen
18
16
6
10
0
1
Surinamers
15
17
7
10
0
1
Antillianen/ Arubanen 25 t/m 34
6
6
3
3
1
1
Turken
21
26
12
9
2
3
Marokkanen
17
18
6
6
3
3
Surinamers
14
8
13
11
3
7
Antillianen/ Arubanen
6
5
4
4
2
3
Bron: Enquête beroepsbevolking 2002, CBS (2004).
De gegevens in de bovenstaande tabel vormen de basis voor de wegingsprocedure. De respondenten krijgen een zodanige weegfactor, dat de gewogen Internetsteekproef dezelfde
4
Correctie 1
verdeling over de genoemde kenmerken heeft als de allochtone potentiële Nederlandse beroepsbevolking. Oudere respondenten met een laag opleidingsniveau, die in de Internetsteekproef ondervertegenwoordigd zijn, krijgen een relatief hoge weegfactor. Jongere respondenten met een hoog opleidingsniveau zijn wel goed vertegenwoordigd in de steekproef en krijgen een relatief lage weegfactor. Opvallend is dat ondanks de bevraging via Internet vrouwen juist oververtegenwoordigd zijn in de steekproef.2 Dit geldt voor alle groepen allochtonen, met uitzondering van de Turken. Voor elke combinatie van leeftijd en opleidingsniveau zijn er bij de Marokkanen, Surinamers en Antillianen en Arubanen meer vrouwelijke dan mannelijke respondenten. Om hiervoor te corrigeren krijgen vrouwen met een bepaalde combinatie van leeftijd en opleidingsniveau een lagere weegfactor dan mannen in dezelfde leeftijdsklasse en met hetzelfde opleidingsniveau. In een technische bijlage is de berekening van de weegfactoren in algebraïsche vorm opgenomen. Bij de bovenstaande weging dienen drie kanttekeningen te worden geplaatst. -
Het CBS houdt geen cijfers bij over de potentiële beroepsbevolking. De in Tabel 1 getoonde aantallen zijn CBS-cijfers over de gehele allochtone Nederlandse bevolking. Aangezien het hier cijfers over jongeren betreft, heeft het leeuwendeel de potentie om nu of in de toekomst tot de beroepsbevolking te behoren. De cijfers zijn daarom een goede benadering - kleine overschatting - van de allochtone potentiële Nederlandse beroepsbevolking.
-
De vragenlijst die de respondenten moesten invullen was in het Nederlands geschreven. De steekproef bestaat dus volledig uit allochtonen die de Nederlandse taal goed beheersen. Deze steekproef staat model voor de allochtone Nederlandse populatie, waarvan een deel de Nederlandse taal veel minder goed beheerst. Dat kan tot gevolg hebben dat bijvoorbeeld het percentage allochtonen dat via de krant op zoek gaat naar een nieuwe baan wordt overschat. Dit probleem wordt deels opgeheven, doordat in het MOA gekeken wordt naar jongeren tot en met 34 jaar. Van de allochtonen zijn deze jongeren de Nederlandse taal het beste machtig.
-
In de steekproef zijn ook respondenten aanwezig van 35 jaar. We veronderstellen dat deze allochtonen nauwelijks verschillen van 34-jarigen. Bij de correcties delen we deze respondenten daarom in bij de 34-jarigen.
2
Overigens is het bekend dat over het algemeen bij enquêtes meer vrouwen dan mannen responderen.
5
Correctie 2: representatief maken allochtonen met én zonder Internet
voor
Zoals vermeld, is Correctie 1 niet bij alle vragen toereikend. Bij enkele vragen over mediakanalen (waaronder Internet) is het gegeven dat alle respondenten toegang tot Internet hebben rechtstreeks van invloed op de gegeven antwoorden. Eind 2002 zijn voor het Arbeidsmarkt Gedragsonderzoek (AGO) ruim 17 duizend (vooral autochtone) Nederlanders via Internet nagenoeg dezelfde vragen over de mediakanalen gesteld als voor het MOA.3 Naast deze Internetenquête is destijds een telefonisch onderzoek uitgevoerd. Er zijn 1873 mensen ondervraagd, van wie 395 zowel zakelijk als privé niet beschikken over een Internetaansluiting. Ook aan deze mensen zijn de belangrijkste vragen over de mediakanalen gesteld. De respondenten zonder een Internetaansluiting (telefonisch geënquêteerden) zijn met de respondenten met een Internetaansluiting (geënquêteerden via Internet) gecombineerd tot één steekproef. Met behulp van deze gecombineerde steekproef kan worden berekend hoe de antwoorden van de Internet-geënquêteerden dienen te worden gecorrigeerd voor de afwezigheid van de respondenten zonder Internet. Uitgaande van de veronderstelling dat de correctie voor allochtonen hieraan identiek is, kunnen deze cijfers worden gebruikt om de MOA-data te corrigeren. Correctie 2 bestaat uit 2 stappen. Ten eerste het ‘gelijktrekken’ van de verhoudingen van beide steekproeven. Ten tweede het corrigeren voor vertekening in het mediakanaalgebruik. Stap 1 Bij het samenvoegen van de respondenten zonder en met een Internetaansluiting wordt
uiteraard rekening gehouden met de relatief kleine omvang van de telefonische enquête. Mensen zonder Internet zijn immers ondervertegenwoordigd in de gecombineerde steekproef. Om hiervoor te corrigeren heeft net als bij Correctie 1 een weging plaatsgevonden. Respondenten zonder Internet hebben een zodanige weegfactor gekregen, dat ze voor meer dan 1 persoon meetellen. De weegfactoren zijn met behulp van recente gegevens over het bezit van een Internettoegang – privé en/of op het werk of school – bepaald. In Tabel 2 is per leeftijdscategorie en per opleidingsniveau het percentage Nederlanders met een Internettoegang weergegeven.4 Zoals eerder beschreven zijn vooral 3
4
Het enige verschil is dat destijds in het AGO is gevraagd naar oriëntatie op de arbeidsmarkt via het mediakanaal Internet: anders dan via een vacaturesite/ bedrijvensite. In het MOA is dat mediakanaal vervangen door Internet: via e-mail service. Voor het onderzoek is gebruik gemaakt van gegevens van Interview-NSS uit 2004. Deze cijfers worden vermarkt en mogen niet openbaar worden gemaakt. Bij wijze van voorbeeld geeft Tabel 2 het percentage ondervraagden uit de telefonische enquête met – zakelijk of privé – een Internetaansluiting weer. Deze steekproef was volkomen aselect en derhalve representatief.
6
Correctie 2
deze twee kenmerken het meest onderscheidend met betrekking tot het bezit van een Internetaansluiting.5 Tabel 2
Percentage Nederlanders dat eind 2002 zakelijk of Internetaansluiting had per leeftijdscategorie en opleidingsniveau
n = 1873 leeftijd
privé
een
hoogst voltooide opleiding basisonderwijs
v(m)bo/mavo
mbo/havo/vwo
hbo/wo
15 t/m 29 jaar
88%
83%
86%
91%
30 t/m 39 jaar
75%
65%
82%
96%
40 t/m 49 jaar
62%
74%
83%
94%
50 t/m 64 jaar
44%
40%
72%
88%
Bron: telefonische enquête Intelligence Group (2003), bewerking SEO.
Dergelijke gegevens - maar dan die (niet openbare) uit 2004 - vormen de basis voor de weging van de gecombineerde steekproef om te corrigeren voor de ondervertegenwoordiging van respondenten zonder Internet. In de steekproef krijgen de respondenten zonder Internetaansluiting een zodanige weegfactor dat het percentage respondenten met Internetaansluiting voor elke combinatie van leeftijd en opleiding overeenkomt met het percentage in de tabel. Voor de berekening van de weegfactoren in wiskundige vorm wordt verwezen naar de technische bijlage. Stap 2 Met behulp van de antwoorden van deze gecombineerde AGO-steekproef op de vragen
over de mediakanalen is vervolgens berekend hoe de antwoorden van de respondenten van alleen de Internetenquête moeten worden gecorrigeerd. Ter illustratie van de berekening van Correctie 2 volgt nu de berekening voor één van de mediakanalen, namelijk dagblad/krant. In Tabel 3 is het percentage van de gecombineerde steekproef weergegeven dat aangeeft een dagblad/krant te gebruiken ter oriëntatie op een nieuwe baan. Opnieuw zijn de respondenten naar leeftijd en opleidingsniveau ingedeeld, aangezien ook bij deze vraag de antwoorden van leeftijd en opleiding kunnen afhangen. Op deze manier kan ook per leeftijdscategorie en opleidingsniveau een uitspraak worden gedaan over het gebruik van de verschillende mediakanalen. Hoger opgeleiden maken, zo blijkt uit Tabel 3, vaker dan gemiddeld gebruik van de krant in hun zoektocht naar een nieuwe baan en jongeren juist relatief weinig.
5
Het aantal waarnemingen liet niet toe om ook te wegen naar de (minst invloedrijke) factor geslacht. Voor de weging zijn overigens alleen de leeftijdscategorieën 15 t/m 29 en 30 t/m 39 jaar gebruikt. Aan de hand van de percentages in de laatstgenoemde categorie zijn de 30 t/m 35jarigen gewogen.
representatief maken voor allochtonen met én zonder Internet
Tabel 3
7
Percentage van gecombineerde steekproef (zowel respondenten met als zonder een Internetaansluiting) dat gebruik maakt van een dagblad/ krant ter oriëntatie op een nieuwe baan hoogst voltooide opleiding basisonderwijs/ vbo/mavo
mbo/havo/vwo
hbo/wo
15 t/m 29 jaar
47%
57%
59%
30 t/m 39 jaar
58%
65%
61%
leeftijd
Bron: Internet- en telefonische enquête AGO, Intelligence Group (2003); bewerking SEO (2005)
In Tabel 4 staan de percentages van alleen de Internetgeënquêteerden dat gebruik maakt van een dagblad/ krant ter oriëntatie op een nieuwe baan. Tabel 4
Percentage van Internetgeënquêteerden dat gebruik maakt van een dagblad/ krant ter oriëntatie op een nieuwe baan hoogst voltooide opleiding basisonderwijs/ vbo/mavo
mbo/havo/vwo
hbo/wo
15 t/m 29 jaar
43%
54%
59%
30 t/m 39 jaar
54%
62%
59%
leeftijd
Bron: Internetenquête AGO, Intelligence Group (2003); bewerking SEO (2005)
Uit Tabel 3 valt af te lezen dat volgens de gecombineerde steekproef ongeveer 47% van de allochtonen tussen de 15 en 29 jaar met als hoogste opleiding mavo gebruik maakt van een dagblad/krant ter oriëntatie op een nieuwe baan. Volgens de Internetenquête (Tabel 4) is dit percentage 43%. Om te corrigeren voor de afwezigheid van respondenten zonder Internetaansluiting zal het percentage zoals verkregen met alleen de Internetgeënquêteerden dus moeten worden vermenigvuldigd met een factor 47/43. Voor elke combinatie van opleiding en leeftijd en voor elk mediakanaal zijn op deze manier de factoren uitgerekend. Dezelfde correcties zijn vervolgens toegepast op de MOA-steekproef. De berekende factoren voor de leeftijdscategorie 30 t/m 39 jaar zijn gebruikt om de cijfers over de allochtonen tussen 30 en 35 jaar te corrigeren.
9
Het effect van de correcties Hierboven is beschreven welke correcties zijn doorgevoerd om de Internetsteekproef representatief te maken voor de allochtone populatie tussen 15 en 35 jaar. Hiervoor is de steekproef gewogen en bovendien is voor sommige vragen een factor uitgerekend om te corrigeren voor de afwezigheid van mensen die niet over een Internetaansluiting beschikken. In Tabel 5 wordt getoond welke gevolgen deze correcties hebben voor het percentage respondenten tussen 15 en 35 jaar dat aangeeft gebruik te maken van enkele mediakanalen ter oriëntatie op een nieuwe baan. Bij deze antwoorden zijn beide correcties toegepast. Tabel 5
Het effect van de correcties op de percentages hoeveel allochtonen gebruik maken van enkele mediakanalen ter oriëntatie op een nieuwe baan
Mediakanalen ter oriëntatie nieuwe baan
ongecorrigeerd
correctie 2
correctie 1 & 2
Advertentie in winkel/ etalage etc.
21%
23%
22%
Binnenlopen/ bellen naar een bedrijf
21%
22%
22%
Banenbeurs/ carrièrebeurs
23%
24%
19%
Bedrijfspresentatie/ open dagen
11%
13%
13%
Dagblad/ de krant
44%
46%
43%
7%
9%
10%
Gouden Gids/ telefoonboek CWI (arbeidsbureau)/ KLIQ (reïntegratiebedrijf)
25%
30%
34%
Het uitzendbureau
46%
45%
47%
Huis-aan-huisblad/ lokale weekkrant
28%
30%
28%
Interne vacature(s)
31%
35%
32%
Internet: vacaturesite
65%
62%
54%
Internet: bedrijvensite
42%
40%
35%
Internet: e-mail service
36%
34%
31%
Open sollicitatie
44%
45%
44%
School
22%
24%
23%
Teletekst
6%
7%
7%
Vakblad/ tijdschrift
17%
18%
13%
Bekenden/ netwerk
40%
42%
37%
Werving & Selectie bureau
19%
20%
18%
Bron: MOA, Intelligence Group (2005); bewerking SEO (2005)
Bij vergelijking van de tweede (‘ongecorrigeerd’) met de derde (‘correctie 2’) kolom van Tabel 5 is het verschil te zien tussen niet en wel corrigeren voor de afwezigheid van respondenten zonder Internetaansluiting. De percentages met de correctie zijn lager bij de drie vragen over het gebruik van Internet. In vrijwel alle andere gevallen zijn de percentages juist hoger. Precies wat verwacht kan worden. Degenen zonder Internetaansluiting zullen
10
Correctie 2
logischerwijs minder gebruik maken van Internetsites en dit compenseren door zich via andere mediakanalen te oriënteren op een nieuwe baan. Bij vergelijking van de vierde kolom met de derde kolom wordt duidelijk dat ook het representatief maken voor de allochtone potentiële Nederlandse beroepsbevolking de percentages corrigeert. Bij de vragen over Internet zien we nog een extra neerwaartse aanpassing in de percentages. Logisch, aangezien bijvoorbeeld de lager opgeleiden, die minder dan gemiddeld gebruik maken van Internet, een hoger gewicht hebben gekregen in de steekproef.
11
Technische bijlage In de hoofdtekst is beschreven hoe de weegfactoren van correctie 1 en correctie 2 zijn berekend. In deze bijlage zijn de berekeningen in algebraïsche vorm opgenomen. Correctie 1
s ijkl = aantal respondenten in steekproef met leeftijd i, opleiding j, etniciteit k en geslacht l p ijkl = aantal personen in populatie met leeftijd i, opleiding j, etniciteit k en geslacht l
wijkl = weegfactor voor respondent met leeftijd i, opleiding j, etniciteit k en geslacht l 1
i ∈ {1,2}, j ∈ {1,...,3}, k ∈ {1,...,4}, l ∈ {1,2}
1 ijkl
w
=
p ijkl s ijkl
∑∑∑∑s * ∑∑∑∑ p
ijkl
i
j
k
l
i
j
k
l
ijkl
Correctie 2: stap 1
offl ij = aantal offline respondenten in gecombineerde steekproef met leeftijd i en opleiding j
onl ij = aantal online respondenten in gecombineerde steekproef met leeftijd i en opleiding j percpopij = percentage online personen in populatie met leeftijd i en opleiding j 2 wij = weegfactor voor respondent met leeftijd i en opleiding j
i ∈ {1,2}, j ∈ {1,...,4}
2 wij = 1
wij = 2
onl ij (100 − percpopij ) * offl ij percpopij
als de respondent online is als de respondent offline is