Universiteit Gent
Faculteit Economie en Bedrijfskunde Academiejaar 2013–2014
De determinanten van investeringen in werknemersopleiding bij Vlaamse KMOs
Masterproef voorgedragen tot het bekomen van de graad van Master of Science in de Toegepaste Economische Wetenschappen
Ya¨el Claeys & Tatiana Mosselmans onder leiding van Prof. dr. Heidi Vander Bauwhede
Universiteit Gent
Faculteit Economie en Bedrijfskunde Academiejaar 2013–2014
De determinanten van investeringen in werknemersopleiding bij Vlaamse KMOs
Masterproef voorgedragen tot het bekomen van de graad van Master of Science in de Toegepaste Economische Wetenschappen
Ya¨el Claeys & Tatiana Mosselmans onder leiding van Prof. dr. Heidi Vander Bauwhede
Vertrouwelijkheidsclausule Ondergetekenden verklaren dat de inhoud van deze masterproef mag geraadpleegd en/of gereproduceerd worden, mits bronvermelding.
Ya¨el Claeys
Tatiana Mosselmans
WOORD VOORAF
I
Woord vooraf Met deze masterproef als kroon op het werk, be¨eindigen we onze opleiding Toegepaste Economische Wetenschappen aan de Universiteit Gent. Bij het schrijven van deze masterproef hadden wij de opportuniteit om ons te verdiepen in de determinanten van investeringen in werknemersopleiding bij Vlaamse Kleine en Middelgrote Ondernemingen (KMO’s). Met deze masterproef hebben we een leerrijke en interessante uitdaging achter de rug. Beiden zijn we ervan overtuigd dat het maken van een masterproef met twee een echte meerwaarde opleverde. Niet alleen vulden we elkaar op verschillende vlakken goed aan, ook de wederzijdse steun en motivatie waren aanwezig. In dit woord vooraf willen we graag een aantal personen expliciet bedanken voor hun bijdrage aan dit werkstuk. Vooreerst willen we onze promotor Prof. dr. Heidi Vander Bauwhede en begeleidende assistent Sebastiaan Laloo bedanken voor hun deskundig advies en begeleiding bij het realiseren van deze masterproef. Daarnaast krijgt Maxim Claeys een speciaal woord van dank. Niet alleen heeft hij ons leren werken met het programma LaTex, hij was tevens een grote hulp wanneer we problemen ondervonden bij gebruik ervan. Alsook heeft hij bijgedragen aan deze masterproef door de academische vormgeving naar een hoger niveau te tillen. Verder willen we onze ouders, broers en partners bedanken voor hun steun en bijdrage bij het nalezen van deze masterproef.
Ya¨el Claeys Tatiana Mosselmans Mei 2014
INHOUDSOPGAVE
III
Inhoudsopgave 1 Introductie
1
2 Literatuurstudie
7
2.1
Theoretisch kader . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.2
Formuleren van de te testen hypotheses . . . . . . . . . . . . . . . . . . . . .
10
2.2.1
Individuele kenmerken . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
2.2.2
Job- en bedrijfsgerelateerde kenmerken . . . . . . . . . . . . . . . . . .
12
3 Empirisch onderzoek
17
3.1
Dataselectie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
3.2
Regressiemodellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
3.3
Afhankelijke variabelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
3.3.1
Trainingsdummy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
3.3.2
Trainingsintensiteit . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
Onafhankelijke variabelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
3.4.1
Percentage mannelijke werknemers . . . . . . . . . . . . . . . . . . . .
25
3.4.2
Opleidingsniveaus . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
3.4.3
Percentage contracten van onbepaalde duur . . . . . . . . . . . . . . .
26
3.4.4
Percentage voltijdse werknemers . . . . . . . . . . . . . . . . . . . . .
27
3.4.5
Personeelsverloop . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
3.4.6
Ondernemingsgrootte . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
3.4.7
Aanwezigheid ondernemingsraad . . . . . . . . . . . . . . . . . . . . .
29
Controlevariabelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
3.5.1
30
3.4
3.5
Industrie dummies . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
INHOUDSOPGAVE
3.6
3.5.2
Winstgevendheid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
3.5.3
Ondernemingsleeftijd . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
3.5.4
Groei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
Data-opkuis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
4 Resultaten en interpretatie 4.1
4.2
IV
37
Beschrijvende statistieken . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
4.1.1
Correlaties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
4.1.2
Subgroep Trainingsdummy . . . . . . . . . . . . . . . . . . . . . . . .
42
4.1.3
Subgroep Trainingsintensiteit . . . . . . . . . . . . . . . . . . . . . . .
47
Regressieanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
52
4.2.1
Logit regressie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
52
4.2.2
OLS regressie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
5 Algemeen besluit
65
A Correlatiematrixen
A.1
B Beschrijvende statistieken gewinsorizede variabelen
B.1
C Voorwaarden OLS regressie
C.1
LIJST VAN AFKORTINGEN
Lijst van afkortingen ANOVA Analysis of Variance CRB Centrale Raad voor het Bedrijfsleven EBIT Earnings Before Interest and Taxes ESS Explained Sum of Squares FOD Federale Overheidsdienst GSOEP German Socio-Economic Panel HNUO Hoger Niet-Universitair Onderwijs IPA Interprofessioneel Akkoord KMO’s Kleine en Middelgrote Ondernemingen LFS Labour Force Survey LO Lager Onderwijs NBB Nationale Bank van Belgi¨e NTS National Training Survey OLS Ordinary Least Squares OR Ondernemingsraad ROA Return On Assets
V
LIJST VAN AFKORTINGEN
RSS Residual Sum of Squares SEPT95 Survey of Employer-Provided Training SO Secundair Onderwijs TSS Total Sum of Squares UO Universitair Onderwijs VTE Voltijds Equivalenten
VI
LIJST VAN TABELLEN
VII
Lijst van tabellen 1.1
Opleidingsinitiatieven van alle Belgische ondernemingen. . . . . . . . . . . . .
3
2.1
Overzicht van de hypotheses en hun verwacht teken. . . . . . . . . . . . . . .
16
3.1
Elementen ge¨exporteerd van Bel-First. . . . . . . . . . . . . . . . . . . . . . .
19
3.2
NACE-BEL 2008 secties in de activiteitennomenclatuur. . . . . . . . . . . . .
31
3.3
Data-opkuis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
4.1
Correlatiematrix van de variabelen die mogelijks het concept langetermijnrelatie meten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
4.2
Correlatiematrix van de onafhankelijke variabelen. . . . . . . . . . . . . . . .
41
4.3
Descriptieve statistieken (subgroep Trainingsdummy). . . . . . . . . . . . . .
42
4.4
Winsorizen van de onafhankelijke variabelen (subgroep Trainingsdummy). . .
45
4.5
Proportionele verdeling van de dataset volgens sectie (subgroep Trainingsdummy). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45
4.6
Winsorizen van de controlevariabelen (subgroep Trainingsdummy). . . . . . .
46
4.7
Descriptieve statistieken (subgroep Trainingsintensiteit). . . . . . . . . . . . .
47
4.8
Winsorizen van Intensity2011 (subgroep Trainingsintensiteit). . . . . . . . . .
48
4.9
Winsorizen van de onafhankelijke variabelen (subgroep Trainingsintensiteit). .
50
4.10 Proportionele verdeling van de dataset volgens sectie (subgroep Trainingsintensiteit). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.11 Winsorizen van de controlevariabelen (subgroep Trainingsintensiteit).
51
. . . .
52
4.12 Classificatietabel logit regressie met enkel controlevariabelen. . . . . . . . . .
53
4.13 Resultaten van de logit regressie met enkel controlevariabelen. . . . . . . . . .
54
4.14 Classificatietabel logit regressie. . . . . . . . . . . . . . . . . . . . . . . . . . .
55
LIJST VAN TABELLEN
VIII
4.15 Resultaten van de logit regressie. . . . . . . . . . . . . . . . . . . . . . . . . .
55
4.16 Model fit (ANOVA) voor OLS regressie met enkel controlevariabelen. . . . . .
59
4.17 Samenvatting OLS regressie met enkel controlevariabelen. . . . . . . . . . . .
59
4.18 Co¨effici¨enten OLS regressie met enkel controlevariabelen.
. . . . . . . . . . .
59
4.19 Model fit (ANOVA) voor OLS regressie. . . . . . . . . . . . . . . . . . . . . .
60
4.20 Samenvatting OLS regressie. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
4.21 Co¨effici¨enten OLS regressie. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
A.1 Kengetallen voor beide personeelskosten. . . . . . . . . . . . . . . . . . . . . . A.1 A.2 Correlatie tussen beide personeelskosten. . . . . . . . . . . . . . . . . . . . . . A.1 A.3 Kengetallen voor beide ROA’s. . . . . . . . . . . . . . . . . . . . . . . . . . . A.2 A.4 Correlatie tussen beide ROA’s. . . . . . . . . . . . . . . . . . . . . . . . . . . A.2 B.1 Descriptieve statistieken van de gewinsorizede variabelen (subgroep Trainingsdummy). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.1 B.2 Descriptieve statistieken van de gewinsorizede variabelen (subgroep Trainingsintensiteit). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.2 C.1 Normaliteitstest van de gestandaardiseerde residuen. . . . . . . . . . . . . . . C.3
LIJST VAN FIGUREN
IX
Lijst van figuren 2.1
Determinanten van investeringen in werknemersopleiding. . . . . . . . . . . .
10
3.1
Cumulatieve verdeling logit en probit . . . . . . . . . . . . . . . . . . . . . . .
21
C.1 Scatterplot standardized residual i.f.v. standardized predicted value. . . . . . C.2 C.2 Normaal verdeling residuen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.3
INTRODUCTIE
1
Hoofdstuk 1
Introductie De doelstelling van deze masterproef is om de determinanten van investeringen in werknemersopleiding bij Vlaamse KMO’s te bepalen. Concreet worden in deze studie individuele en job- en bedrijfsgerelateerde determinanten, die mogelijks de beslissing omtrent het aanbieden van opleiding be¨ınvloeden, geanalyseerd. Tevens wordt bepaald welke factoren een invloed hebben op de mate waarin dan effectief opleiding wordt aangeboden, meer bepaald met welke intensiteit. Aangezien er een overlapping bestaat tussen de definities van opleiding en training, worden deze benamingen doorheen deze masterproef door elkaar gebruikt. Training is in ruime zin de oefening, het machtig worden van vaardigheden en het aanleren, ” verbeteren of veranderen van sociale, cognitieve en psychomotorische vaardigheden”1 . In de context van deze masterproef is training eigenlijk alles wat een individu kan helpen om zijn job beter te kunnen uitvoeren. De focus ligt dus op het verwerven van vaardigheden en/of specifieke kennis met betrekking tot de job. Volgens de National Training Survey (NTS) zijn er twee soorten training, namelijk vocational en non-vocational training. We spreken enerzijds van vocational training, indien de training gevolgd wordt in relatie met de huidige of daaropvolgende job. Non-vocational training anderzijds, betekent algemeen volwassenenonderwijs en/of verder studeren tijdens de werklevenscyclus. Verder wordt er ook vaak een onderscheid gemaakt tussen bedrijfsspecifieke en algemene opleiding. Het belangrijkste verschil tussen een bedrijfsspecifieke en een algemene opleiding is dat bij deze laatste de opleiding overdraagbaar is naar andere bedrijven. Een bedrijfsspecifieke training daarentegen is, zoals 1
http://www.woorden-boek.nl/woord/training
INTRODUCTIE
2
de naam zelf zegt, enkel bruikbaar voor dit specifieke bedrijf. In deze masterproef wordt echter geen onderscheid gemaakt tussen beide soorten training. Vandaag de dag is het belang van training onmiskenbaar groot geworden. Zo is het de sleutel tot succes, een beter concurrentievermogen en een hogere kans op tewerkstelling. Ook wordt er steeds vaker vastgesteld dat de algemene kennis, meegegeven op school, ontoereikend is. Pas afgestudeerden worden als een leek beschouwd op de arbeidsmarkt. Hierdoor is een voortdurende opfrissing en aanpassing van werknemers’ human capital noodzakelijk. Training wordt gezien als een vorm van investering. Het is van groot belang dat bedrijven een budget voorzien voor investeringen in werknemersopleiding. Deze investeringen komen zowel werkgever als werknemer ten goede (Van de Wiele, 2010) [1]. Enerzijds is de werkgever beter in staat om trends op te volgen en competitief te blijven, anderzijds kan de werknemer zijn flexibiliteit en concurrentiepositie binnen het bedrijf verhogen. De Federale Overheidsdienst (FOD) erkent het belang van opleidingen en draagt zijn steentje bij om de globale opleidingsinspanningen van werkgevers te stimuleren. Zo werd er in het Interprofessioneel Akkoord (IPA) 2007-2008 een opleidingsnorm vastgelegd van 1,9%. Wanneer de globale opleidingsdoelstellingen van de werkgevers uit de priv´e-sector samen niet 1,9% van de totale Belgische loonmassa van die ondernemingen bedragen, moeten de werkgevers die behoren tot sectoren die onvoldoende opleidingsinspanningen realiseren, een bijkomende werkgeversbijdrage van 0,05% betalen ten behoeve van de financiering van het stelsel van het betaald educatief verlof2 . De globale opleidingsinspanningen worden beoordeeld door de Centrale Raad voor het Bedrijfsleven (CRB). Tabel 1.1 geeft informatie over de opleidingsinitiatieven van alle Belgische ondernemingen. Deze tabel werd opgesteld op basis van gegevens afkomstig van de Nationale Bank van Belgi¨e (NBB). Opmerkelijk is de stijgende trend in het aantal ondernemingen die opleiding voorzien. In 2012 investeerden 25,8% van alle bedrijven in opleidingen. Verder mocht gemiddeld 43,5% van de werknemers deelnemen aan een opleiding. Hiertoe spendeerden bedrijven gemiddeld een bedrag van 1 388 EUR per deelnemer. Er worden een aantal hypotheses ontwikkeld om de doelstelling van deze masterproef te onderzoeken. Deze worden opgesplitst in twee delen: in een eerste set van hypotheses wordt het onderzoek louter toegespitst op het al dan niet voorzien van training. Voor de tweede set 2
http://www.werk.belgie.be
INTRODUCTIE
3
van hypotheses wordt de intensiteit van de training geanalyseerd. Tabel 1.1: Opleidingsinitiatieven van alle Belgische ondernemingen.
2009
2010
2011
2012
20,9
22
23,3
25,8
38,2
41,5
41,3
43,5
- in % van totale loonkosten
1,63
1,71
1,67
1,84
- in e per deelnemer
1 381
1 387
1 414
1 388
Ondernemingen die opleiding voorzien - in % van totaal aantal ondernemingen Participatiegraad aan opleidingen - in % van totaal aantal werknemers Kosten van formele opleiding
Concreet worden bij de eerste set van hypotheses een hoger percentage mannen, een hoger percentage jonge werknemers, een hoger percentage hoogopgeleide werknemers, een hoger percentage contracten van onbepaalde duur, een hoger percentage voltijdse werknemers, een lager personeelsverloop, een grotere onderneming en de aanwezigheid van een ondernemingsraad verwacht bij ondernemingen die training voorzien. Voor het testen van deze hypotheses wordt gebruik gemaakt van een logistische regressie. In de tweede set van hypotheses veronderstellen wij een meer uitgesproken relatie tussen de onafhankelijke variabelen percentage mannelijke werknemers, percentage hoogopgeleide werknemers, percentage contracten van onbepaalde duur, percentage voltijdse werknemers, personeelsverloop, ondernemingsgrootte en aanwezigheid ondernemingsraad enerzijds en de afhankelijke variabele trainingsintensiteit anderzijds. Concreet verwachten wij de reeds omschreven relaties terug te vinden, maar nog explicieter. Hiervoor wordt gebruik gemaakt van de Ordinary Least Squares (OLS) regressie. Deze masterproef vormt in het bijzonder een bijdrage tot de bestaande literatuur doordat het onderzoek wordt uitgevoerd op basis van data uit Bel-First in plaats van data uit een enquˆete. Op deze manier kan gebruik worden gemaakt van zogenaamde hard data, die een pak betrouwbaarder is dan data die uit een enquˆete wordt gehaald. Jaarrekeningen worden namelijk gecontroleerd door auditors, terwijl respondenten van een enquˆete vaak de neiging hebben om in te vullen wat ze verwachten dat de enquˆeteur wenst te lezen. Verder willen we erop
INTRODUCTIE
4
wijzen dat dit onderzoek kan worden geleid vanuit een werkgevers- of werknemersstandpunt. Voor deze masterproef wordt geopteerd om te onderzoeken vanuit een werkgeversstandpunt, aangezien gebruik wordt gemaakt van cijfers uit de sociale balans. De sociale balans maakt immers deel uit van de resultatenrekening, die rechtstreeks afkomstig is van het bedrijf zelf. De beperking van dit onderzoek ligt onder meer in het feit dat, zoals eerder vermeld, geen onderscheid wordt gemaakt tussen bedrijfsspecifieke en algemene opleiding. Verder worden de determinanten in deze masterproef onderverdeeld in twee categorie¨en, namelijk individuele en job- en bedrijfsgerelateerde kenmerken. Let wel, de job- en bedrijfsgerelateerde kenmerken worden samengenomen als ´e´en categorie. Dit in tegenstelling tot de werken van Jacobs, Lukens & Useem (1996), Harris (1999), Sutherland (2004) en Tharenou (1997) [2, 3, 4, 5]. Zij beschouwen de job- en bedrijfsgerelateerde kenmerken immers als twee afzonderlijke categorie¨en. Voorts zijn er enkele suggesties voor toekomstig onderzoek. Zo zou het interessant kunnen zijn om te weten wat het effect is van training op de performantie. Presteren ondernemingen die voorzien in training wel degelijk beter dan hun tegenhangers die dit niet doen? Er wordt bewust gekozen om de gegevens voor de onafhankelijke en afhankelijke variabelen respectievelijk uit de jaren 2010 en 2011 te halen, om zo ruimte te cre¨eren voor het voortzetten van het onderzoek. Dit om de mogelijkheid te kunnen bieden de performantie te berekenen op basis van gegevens uit 2012. Aangezien bij de start van deze masterproef in september 2013 enkel de gegevens tot en met jaar 2012 beschikbaar waren in Bel-First, wordt bewust geopteerd voor deze jaartallen. Verder willen we erop wijzen dat enkel overeenkomsten voor onbepaalde en bepaalde tijd worden opgenomen als onafhankelijke variabelen. In de sociale balans worden er nog andere mogelijke onafhankelijke variabelen vermeld die in deze masterproef niet worden opgenomen, namelijk overeenkomsten voor een duidelijk omschreven werk en vervangingsovereenkomsten. Ook hier is dus ruimte voor verder onderzoek. Deze masterproef is opgedeeld in verschillende hoofdstukken. Het eerste hoofdstuk omvat de literatuurstudie omtrent het onderwerp. Er wordt in de literatuur gezocht naar specifieke individuele en job- en bedrijfsgerelateerde determinanten die bepalend zijn voor het aanbieden van opleiding. Het tweede hoofdstuk behandelt de gebruikte methode. Hierin wordt de dataset gedetailleerd besproken, de regressievergelijking voorgesteld, de gebruikte variabelen zorgvuldig gedefinieerd en de verwijderde data duidelijk verklaard. In een volgend hoofd-
INTRODUCTIE
5
stuk worden de resultaten gerapporteerd en ge¨ınterpreteerd. Eerst wordt de beschrijvende statistiek van de variabelen weergegeven om vervolgens over te gaan naar de effectieve regressieanalyse, meer bepaald het interpreteren van de verbanden tussen deze variabelen. In het laatste hoofdstuk worden de conclusies vermeld. De belangrijkste bevindingen en inzichten van het onderzoek worden samengevat.
LITERATUURSTUDIE
7
Hoofdstuk 2
Literatuurstudie In dit hoofdstuk wordt eerst het theoretisch kader rond het onderwerp van deze masterproef besproken. Ten tweede volgt een onderzoek van bestaande wetenschappelijke literatuur om de onderzoeksvraag te beantwoorden en de hypotheses op te bouwen.
2.1
Theoretisch kader
Een opleiding is niets meer dan de vorming tot een beroep1 . Vandaag de dag is het belang van opleiding onmiskenbaar groot geworden. De focus ligt op het verwerven van vaardigheden en/of specifieke kennis met betrekking tot de job. Blijvend bijscholen, ook continuous learning genoemd, blijkt een echte must te zijn. De technologie staat niet stil, waardoor innovatie onontbeerlijk is om competitief te blijven. Het is dus van groot belang dat bedrijven een budget voorzien voor investeringen in werknemersopleiding. Deze investeringen komen zowel werkgever als werknemer ten goede (Van de Wiele, 2010) [1]. Enerzijds is de werkgever beter in staat om trends op te volgen en competitief te blijven, anderzijds kan de werknemer zijn flexibiliteit en concurrentiepositie binnen het bedrijf verhogen. Het bestuderen van de determinanten van investeringen in werknemersopleiding kan gedaan worden aan de hand van het Human Capital Model. Volgens dit model wordt opleiding gezien als een investeringsbeslissing. Zo investeren ondernemingen enkel in opleiding indien de 1
http://www.vandale.be
2.1 Theoretisch kader
8
kosten meer dan voldoende gecompenseerd kunnen worden door de toekomstige baten. Het Human Capital Model stelt dat de werknemer betaalt voor een algemene opleiding en dat zowel werkgever als werknemer delen in de kosten van een bedrijfsspecifieke opleiding. Deze kostendeling werkt als een drijfveer om de relatie tussen werkgever en werknemer te behouden. Het belangrijkste verschil tussen een bedrijfsspecifieke en een algemene opleiding is dat bij deze laatste de opleiding overdraagbaar is naar andere bedrijven. Een bedrijfsspecifieke opleiding daarentegen is, zoals de naam zelf zegt, enkel bruikbaar voor dit specifieke bedrijf. De beslissing om te investeren in opleidingen kan, volgens het Human Capital Model, een strategie zijn om competitief sterker te staan. Traditionele massaproductie levert immers niet langer een productievoordeel op. Bedrijven moeten zich aanpassen aan een technologisch hoogstaand en innovatief productieproces. Dit betekent dat werknemers over de nodige vaardigheden moeten beschikken. Investeren in opleiding wordt hierdoor cruciaal. Een bijkomende veronderstelling van het Human Capital Model is dat ondernemingen die beslissen om te investeren in opleidingen, een beleid zullen nastreven dat het personeelsverloop doet dalen (Mincer, 1988) [6]. Bedrijven willen immers maximaal rendement halen uit de gemaakte investeringen. Er zijn verschillende manieren om het personeelsverloop te doen dalen. Ten eerste kan het aanbieden van extralegale voordelen, zoals gezondheidsverzekering en pensioensparen, werknemers motiveren om bij de onderneming te blijven. Ten tweede kunnen voordelen zoals familiaal verlof en kinderopvang de toewijding van werkgevers aantonen, waardoor werknemers ge¨engageerd blijven. Ten derde veronderstelt het Human Capital Model dat training gepaard gaat met een stijging in de lonen, wat een extra stimulans betekent voor de werknemer. Een ander belangrijk resultaat uit het Human Capital Model is dat investeren in opleiding enkel zinvol is bij jonge werknemers, aangezien er een langere termijn voor waardevermindering aanwezig is (Becker, 1962) [7]. Uit het Human Capital Model kan dus worden afgeleid dat hoe belangrijker de langetermijnrelatie tussen werkgever en werknemer wordt, hoe groter de kans op investering in opleidingen. De beslissing of een werknemer al dan niet deelneemt aan een opleiding, verloopt in twee fases (Grund & Martin, 2012) [8]. In de eerste fase beslist de werkgever aan wie opleiding moet worden geboden. De werkgever zal hiervoor de kosten en baten van training tegen elkaar afwegen. Mogelijke baten zijn bijvoorbeeld een productiviteitsstijging en een verbetering in de betrokkenheid bij de organisatie. Mogelijke kosten zijn bijvoorbeeld de aanwerving van
2.1 Theoretisch kader
9
een trainer en een blijvende loonsverhoging als gevolg van de opleiding. Een onderneming zal, zoals eerder vermeld, enkel een opleiding aanbieden aan de werknemer indien de verwachte baten hoger zijn dan de verwachte kosten. In de tweede fase beslist de werknemer, indien mogelijk, op zijn beurt of hij al dan niet deelneemt aan een opleiding. Ook de werknemer zal kosten en baten tegen elkaar afwegen en neemt enkel deel aan een opleiding als de verwachte baten hoger zijn dan de voor hem verwachte kosten. Mogelijke baten zijn bijvoorbeeld een aanzienlijke loonstijging en een grotere kans op promotie. Mogelijke kosten zijn bijvoorbeeld onbetaalde arbeidsuren indien de opleiding plaatsvindt buiten de werkuren. De meeste studies bestuderen de determinanten van investeringen in opleiding aan de hand van enquˆetes. Zo maakten Grund en Martin (2012) in hun onderzoek gebruik van de German Socio-Economic Panel (GSOEP) [8]. Ze stelden vast dat de nationaliteit, de status van de job en de grootte van de onderneming de beslissing tot opleiding het meest be¨ınvloeden. Ook Greenhalgh en Stewart (1987) baseerden zich voor dergelijk onderzoek op een enquˆete, namelijk de NTS [9]. Ze vonden empirisch bewijs dat vrouwen minder kansen op opleiding krijgen dan mannen en dat de kans op opleiding daalt met de leeftijd. Harris (1999) maakte voor zijn onderzoek dan weer gebruik van de Labour Force Survey (LFS) [3]. Enkele van zijn bevindingen waren enerzijds dat oudere werknemers minder kans krijgen op een opleiding en anderzijds dat zich syndiceren de kans op opleiding verhoogt. Verder bestudeerden Frazis, Gittleman en Joyce (1998) de determinanten van een opleidingsbeslissing via de Survey of Employer-Provided Training (SEPT95) [10]. Zij kwamen tot de conclusie dat de kans op opleiding hoger is bij ofwel grotere ondernemingen, ofwel ondernemingen die niet gesyndiceerd zijn, ofwel ondernemingen die hogere winsten realiseren, ofwel ondernemingen die een kleiner aantal deeltijdse werknemers hebben. Wij willen met deze masterproef bijdragen aan de bestaande literatuur door ons onderzoek te baseren op data uit Bel-First in plaats van data uit een enquˆete. Op deze manier kan gebruik gemaakt worden van zogenaamde hard data, die een pak betrouwbaarder is dan data die uit een enquˆete wordt gehaald. Jaarrekeningen worden namelijk gecontroleerd door auditors, terwijl respondenten van een enquˆete vaak de neiging hebben om in te vullen wat ze verwachten dat de enquˆeteur wenst te lezen.
2.2 Formuleren van de te testen hypotheses
10
Figuur 2.1: Determinanten van investeringen in werknemersopleiding.
2.2
Formuleren van de te testen hypotheses
In de literatuur is een veelheid aan determinanten van investeringen in werknemersopleiding terug te vinden. De determinanten kunnen worden onderverdeeld in twee categorie¨en. Enerzijds is er de categorie individuele kenmerken, anderzijds de categorie job- en bedrijfsgerelateerde kenmerken. Figuur 2.1 verduidelijkt deze onderverdeling. Op basis van het literatuuronderzoek kunnen vervolgens de hypotheses worden opgesteld. Deze worden opgesteld als alternatieve hypotheses, meer bepaald hypotheses die we wensen te aanvaarden. Elke hypothese bestaat uit twee deelhypotheses. Enerzijds is er de set van hypotheses die handelen over het al dan niet voorzien van een opleiding (a). Anderzijds is er de set van hypotheses die enkel de ondernemingen die effectief opleiding aanbieden betreft (b). Hierbij zal de hoeveelheid opleiding die wordt aangeboden, worden gemeten.
2.2.1
Individuele kenmerken
Individuele kenmerken zijn, zoals de naam zelf al vermeldt, kenmerken die eigen zijn aan werknemers. Als individuele kenmerken worden geslacht, leeftijd en opleidingsniveau beschouwd.
2.2 Formuleren van de te testen hypotheses
11
Geslacht
Het geslacht kan een relevante determinant zijn voor investeringen in werknemersopleidingen. Uit het Human Capital Model kan worden afgeleid dat hoe belangrijker de langetermijnrelatie tussen werkgever en werknemer wordt, hoe groter de kans op investering in opleiding. Doorgaans hebben vrouwen een kortere ambtstermijn, wat betekent dat er minder tijd is voor het bedrijf om de kosten af te schrijven (Auer, 2000) [11]. Werkgevers zijn bijgevolg minder bereid om opleiding aan te bieden aan vrouwen door de kortere afschrijvingsperiode voor de investeringen. Analoge bevindingen kunnen worden teruggevonden in de werken van Grund & Martin (2012), Frazis et al. (1998), Green (1993), Greenhalgh & Stewart (1987), Tharenou (1997) en Greenhalgh & Mavrotas (1994) [8, 10, 12, 9, 5, 13]. Dit in tegenstelling met het werk van Jacobs, Lukens & Useem (1996), waar geen significante relatie werd vastgesteld tussen opleiding en geslacht [2]. Hypothese 1a: Hoe hoger het percentage mannelijke werknemers in de onderneming, hoe hoger de kans op investering in opleiding. Hypothese 1b: Hoe hoger het percentage mannelijke werknemers in de onderneming, hoe meer de onderneming investeert in opleiding.
Leeftijd
De leeftijd van de werknemers kan ook een relevante determinant zijn omwille van uiteenlopende redenen. Een belangrijk resultaat uit het Human Capital Model is dat investeren in opleiding enkel zinvol is bij jonge werknemers, aangezien er een langere termijn voor waardeverminderingen aanwezig is (Becker, 1962) [7]. Verder is er nood aan opleiding voor jonge werknemers die net afgestudeerd zijn aan een universiteit of een stage voltooid hebben. Ook hebben werknemers van middelbare leeftijd opnieuw meer kans op opleiding, aangezien een update van beroepskennis en vaardigheden cruciaal is. In de werken van Grund & Martin (2012) en Tharenou (1997) is terug te vinden dat deelnemen aan een opleiding een omgekeerd U-vormig verband heeft met leeftijd [8, 5]. In de werken van Greenhalgh & Stewart (1987), Hansson (2007), Green (1993) en Frazis et al. (1998), gaat men dan weer uit van een volledig negatief verband tussen leeftijd en opleiding [9, 14, 12, 10].
2.2 Formuleren van de te testen hypotheses
12
Hypothese 2a: Hoe hoger het percentage jonge werknemers in de onderneming, hoe hoger de kans op investering in opleiding. Hypothese 2b: Hoe hoger het percentage jonge werknemers in de onderneming, hoe meer de onderneming investeert in opleiding. Wegens een gebrek aan data, kunnen de hypotheses 2a en 2b in deze masterproef echter niet worden getest.
Opleidingsniveau
De relatie tussen het opleidingsniveau van de werknemer en de kans op een opleiding ligt minder voor de hand. Enerzijds zijn beter opgeleide personen effici¨enter in het opnemen van kennis, zodat het verder opleiden van deze werknemers winstgevend is voor het bedrijf. Anderzijds kunnen opleidingen dienen als substituut voor scholing. In de werken van Hansson (2007), Grund & Martin (2012), Greenhalgh & Mavrotas (1994), Frazis et al. (1998), Sutherland (2004) en Tharenou (1997) is terug te vinden dat beter opgeleide werknemers meer kans krijgen op een opleiding [14, 8, 13, 10, 4, 5]. Hypothese 3a: Hoe hoger het percentage hoogopgeleide werknemers in de onderneming, hoe hoger de kans op investering in opleiding. Hypothese 3b: Hoe hoger het percentage hoogopgeleide werknemers in de onderneming, hoe meer de onderneming investeert in opleiding.
2.2.2
Job- en bedrijfsgerelateerde kenmerken
Job- en bedrijfsgerelateerde kenmerken zijn, zoals de naam zelf al vermeldt, kenmerken die eigen zijn aan de jobinhoud en de bedrijfsomgeving. Als job- en bedrijfsgerelateerde kenmerken worden anci¨enniteit, contracten voor onbepaalde en bepaalde duur, voltijdse en deeltijdse contracten, personeelsverloop, ondernemingsgrootte en ondernemingsraad beschouwd.
2.2 Formuleren van de te testen hypotheses
13
Anci¨ enniteit Met anci¨enniteit wordt het aantal jaren dat een werknemer in dienst is van het bedrijf bedoeld. Anci¨enniteit wordt verondersteld een relevante determinant te zijn. Enerzijds hebben werknemers bij aanwerving nood aan bedrijfsspecifieke opleiding en moeten ze worden betrokken bij de cultuur van de onderneming. Anderzijds wordt opleiding dan weer relevant voor die werknemers met een hogere anci¨enniteit vanwege proces- en productinnovaties. In hun werk spreken Grund & Martin (2012) van een U-vormig verband tussen anci¨enniteit en het deelnemen aan een opleiding [8]. Green (1993) en Tharenou (1997) vonden in hun onderzoek dat de kans op opleiding daalt met anci¨enniteit [12, 5]. Harris (1999) vindt in zijn studie dan weer een louter positief verband tussen opleiding en anci¨enniteit [3]. In het werk van Frazis et al. (1998) is er geen statistische relatie waarneembaar tussen opleiding en anci¨enniteit [10]. Hypothese 4a: Hoe hoger het percentage werknemers met een hoge anci¨enniteit in de onderneming, hoe hoger de kans op investering in opleiding. Hypothese 4b: Hoe hoger het percentage werknemers met een hoge anci¨enniteit in de onderneming, hoe meer de onderneming investeert in opleiding. Wegens een gebrek aan data, kunnen de hypotheses 4a en 4b in deze masterproef echter niet worden getest.
Contracten voor onbepaalde en bepaalde duur Het aantal contracten van onbepaalde en bepaalde duur kunnen eveneens relevante determinanten zijn. Uit het Human Capital Model kan worden afgeleid dat hoe belangrijker de langetermijnrelatie tussen werkgever en werknemer wordt, hoe groter de kans op investeringen in opleiding. Aangezien contracten van bepaalde duur een kortere relatie inhouden met het bedrijf dan contracten van onbepaalde duur, is de kans op opleiding groter voor werknemers met een contract van onbepaalde duur. Analoge bevindingen zijn terug te vinden in het werk van Grund & Martin (2012) [8]. Hypothese 5a: Hoe hoger het percentage contracten van onbepaalde duur in de onderneming, hoe hoger de kans op investering in opleiding.
2.2 Formuleren van de te testen hypotheses
14
Hypothese 5b: Hoe hoger het percentage contracten van onbepaalde duur in de onderneming, hoe meer de onderneming investeert in opleiding.
Voltijdse en deeltijdse contracten Eveneens kan het aantal voltijdse en deeltijdse werknemers van belang zijn. Uit het Human Capital Model kan worden afgeleid dat hoe belangrijker de langetermijnrelatie tussen werkgever en werknemer wordt, hoe groter de kans op investering in opleidingen. Immers hoe meer uren de opgeleide werknemer werkt, hoe meer voordeel de onderneming haalt uit de productiviteitsstijging veroorzaakt door de training. Het positief verband tussen het aantal gewerkte uren en de kans op opleiding is ook terug te vinden in de werken van Grund & Martin (2012), Harris (1999), Tharenou (1997) en Frazis et al. (1998) [8, 3, 5, 10]. Hypothese 6a: Hoe hoger het percentage voltijdse werknemers in de onderneming, hoe hoger de kans op investering in opleiding. Hypothese 6b: Hoe hoger het percentage voltijdse werknemers in de onderneming, hoe meer de onderneming investeert in opleiding.
Personeelsverloop Ook het personeelsverloop kan worden gezien als een belangrijke determinant. Opnieuw kan uit het Human Capital Model worden afgeleid dat hoe belangrijker de langetermijnrelatie tussen werkgever en werknemer wordt, hoe groter de kans op investering in opleidingen. Een bijkomende veronderstelling van het Human Capital Model is dat ondernemingen die beslissen om te investeren in opleidingen, een beleid zullen nastreven dat het personeelsverloop doet dalen. In bestaande literatuur is terug te vinden dat de kans op opleiding stijgt naarmate het personeelsverloop daalt (Frazis et al. (1998); Tharenou (1997); Mincer (1988); Hansson (2007)) [10, 5, 6, 14]. Hypothese 7a: Hoe hoger het personeelsverloop in de onderneming, hoe lager de kans op investering in opleiding. Hypothese 7b: Hoe hoger het personeelsverloop in de onderneming, hoe minder de onderneming investeert in opleiding.
2.2 Formuleren van de te testen hypotheses
15
Ondernemingsgrootte
Er wordt ook met de ondernemingsgrootte rekening gehouden als determinant voor investering in werknemersopleiding. Zo wordt beweerd dat opleidingen relevanter zijn in grotere bedrijven. De vaste kosten van de opleidingen kunnen dan immers over een groter aantal werknemers verspreid worden, wat leidt tot schaaleffecten. Ook zijn grotere ondernemingen beter in staat om de taken te herverdelen wanneer werknemers afwezig zijn door het volgen van een opleiding. Werken van Grund & Martin (2012), Frazis et al. (1998), Hansson (2007), Harris (1999), Green (1993) en Sutherland (2004) bevestigen deze beweringen [8, 10, 14, 3, 12, 4]. Hypothese 8a: Hoe groter de onderneming, hoe hoger de kans op investering in opleiding. Hypothese 8b: Hoe groter de onderneming, hoe meer de onderneming investeert in opleiding.
Ondernemingsraad
Ten slotte wordt ook de aanwezigheid van een ondernemingsraad als determinant gezien. Ondernemingsraden zijn verplicht van zodra een bedrijf de kaap van 100 werknemers bereikt. Ondernemingsraden zorgen voor betere voorwaarden en hogere eisen bij collectieve onderhandelingen. In de werken van Sutherland (2004), Booth, Francesconi & Zoega (2003) en Harris (1999) is terug te vinden dat de aanwezigheid van een vakbond de kans op opleiding verhoogt [4, 15, 3]. Dit in tegenstelling tot de werken van Hansson (2007), Frazis et al. (1998) en Grund & Martin (2012), die aantonen dat de aanwezigheid van een vakbond de kans op opleiding juist verlaagt [14, 10, 8]. Hypothese 9a: De aanwezigheid van een ondernemingsraad in de onderneming verhoogt de kans op investering in opleiding. Hypothese 9b: De aanwezigheid van een ondernemingsraad in de onderneming betekent dat de onderneming meer investeert in opleiding. In Tabel 2.1 worden de verwachte tekens nog eens samengevat. Onder het verwachte teken wordt het teken verstaan dat in de regressieanalyse moet worden gevonden om de vooropge-
2.2 Formuleren van de te testen hypotheses
16
stelde alternatieve hypotheses te kunnen aanvaarden.
Tabel 2.1: Overzicht van de hypotheses en hun verwacht teken.
Variabele
Verwacht teken
Percentage mannelijke werknemers
+
Percentage hoogopgeleide werknemers
+
Percentage contracten van onbepaalde duur
+
Percentage voltijdse werknemers
+
Personeelsverloop
-
Ondernemingsgrootte
+
Aanwezigheid ondernemingsraad
+
EMPIRISCH ONDERZOEK
17
Hoofdstuk 3
Empirisch onderzoek In het empirisch onderzoek wordt eerst de manier waarop data geselecteerd wordt, besproken. Verder komt ook het regressiemodel aan bod. Vervolgens worden de afhankelijke, onafhankelijke en controlevariabelen uiteengezet. Tot slot wordt ook de verwijderde data vermeld.
3.1
Dataselectie
In deze masterproef wordt gebruik gemaakt van de Bel-First database van Bureau van Dijk. Deze database bevat financi¨ele en economische informatie over bedrijven in Belgi¨e en Luxemburg. Er is toegang tot alle Belgische ondernemingen met neerleggingsplicht van rekeningen bij de balanscentrale van de NBB, andere economische entiteiten (zelfstandigen, kleine verenigingen zonder winstoogmerk, enz.) en eveneens de voornaamste Luxemburgse ondernemingen1 . Bij de selectie van de ondernemingen worden een aantal restricties opgelegd. Aangezien dit onderzoek enkel KMO’s betreft, vormt dit een eerste restrictie. Om KMO’s te defini¨eren wordt gebruik gemaakt van de Europese definitie voor KMO’s, zijnde ondernemingen waar minder dan 250 personen werkzaam zijn en waarvan de jaaromzet 50 miljoen EUR of het jaarlijks balanstotaal 43 miljoen EUR niet overschrijdt [16]. Een bijkomende restrictie omtrent het aantal werknemers bestaat eruit dat enkel ondernemingen worden geselecteerd die mini1
belfirst.bvdinfo.com
3.1 Dataselectie
18
mum ´e´en persoon tewerkstellen. Dit om zogenaamde ghost companies uit te sluiten2 . Een laatste restrictie is dat enkel de Vlaamse KMO’s geselecteerd worden. Alle zoekstrategie¨en betreffen de data van het laatst beschikbare jaar. Het toepassen van deze zoekstrategie¨en zorgt voor een totaal van 90 581 observaties. Voor elk van deze ondernemingen worden vervolgens de nodige gegevens geselecteerd. Hierbij wensen we er op te wijzen dat er, wat betreft data nodig voor de onafhankelijke variabelen en controlevariabelen, steeds gekozen wordt voor het jaartal 2010, waarbij voor de data voor de afhankelijke variabelen steeds geopteerd wordt voor het jaartal 2011. Dit alles om consistent te werken aangezien ‘laatst beschikbare jaar’ niet steeds over eenzelfde jaartal handelt, maar afhankelijk is van de geselecteerde onderneming. Zoals reeds vermeld is de toegevoegde waarde van dit onderzoek het feit dat er exacte en betrouwbare cijfers voor handen zijn en dat er niet hoeft gewerkt te worden met data verkregen via enquˆetes en vragenlijsten. Meer bepaald wordt er gewerkt met de gegevens uit de sociale balans, die een onderdeel uitmaakt van de jaarrekening. De elementen die van Bel-First worden ge¨exporteerd, zijn terug te vinden in Tabel 3.1. Een eerste set van elementen komt volledig uit de sociale balans. Een tweede set van elementen komt uit de resultatenrekening. In Bel-First zijn verschillende resultatenrekeningen terug te vinden. Voor deze elementen wordt geopteerd voor de resultatenrekening ‘Belgische ondernemingen niet geconsolideerd’. Een laatste set van elementen is een verzameling van identificatiegegevens, kencijfers en elementen uit de balansrekening. Merk op dat er naast voltijds en deeltijds ook wordt gewerkt met Voltijds Equivalenten (VTE). VTE is een rekeneenheid om de omvang van het personeelsbestand in kaart te brengen. E´en VTE komt overeen met ´e´en voltijdse werkkracht. Wanneer een persoon slechts halftijds werkt, komt deze dus overeen met
2
1 2
VTE.
Ghost companies zijn ondernemingen die niet break-even draaien wegens een te lage vraag naar het ge-
produceerde goed of dienst. Hierdoor kunnen ze de kosten niet dragen waardoor de overheid borg zal staan voor deze ondernemingen. Op die manier zullen ze bij het ontdoen van de onderneming niets verliezen, maar terugverdienen wat de overheid erin gestoken heeft om de onderneming draaiende te houden. Dit moedigt aan tot oprichting van ondernemingen die eigenlijk niet bestaan, m.a.w. geen werknemers hebben. Door een restrictie van minimum ´e´en werknemer op te leggen, kunnen deze ghost companies worden uitgesloten.
3.1 Dataselectie
19
Tabel 3.1: Elementen ge¨exporteerd van Bel-First.
Benaming
Code
SOCIALE BALANS (VERKORT SCHEMA) TIJDENS HET BOEKJAAR EN HET VORIGE BOEKJAAR Gemiddeld aantal werknemers VOLTIJDS
100.1
Gemiddeld aantal werknemers DEELTIJDS
100.2
Gemiddeld aantal werknemers totaal in VTE
100.3
Personeelskosten totaal in VTE
102.3
OP DE AFSLUITINGSDATUM VAN HET BOEKJAAR Overeenkomst voor een onbepaalde tijd totaal in VTE
110.3
Overeenkomst voor een bepaalde tijd totaal in VTE
111.3
Mannen totaal in VTE
120.3
Mannen lager onderwijs totaal in VTE
1200.3
Mannen secundair onderwijs totaal in VTE
1201.3
Mannen hoger niet-universitair onderwijs totaal in VTE
1202.3
Mannen universitair onderwijs totaal in VTE
1203.3
Vrouwen totaal in VTE
121.3
Vrouwen lager onderwijs totaal in VTE
1210.3
Vrouwen secundair onderwijs totaal in VTE
1211.3
Vrouwen hoger niet-universitair onderwijs totaal in VTE
1212.3
Vrouwen universitair onderwijs totaal in VTE
1213.3
Aantal werknemers met een in de DIMONA-verklaring aangegeven of een in
305.3
het algemeen personeelsregister opgetekende datum waarop hun overeenkomst tijdens het boekjaar een einde nam totaal in VTE Totaal van de formele voortgezette beroepsopleidingsinitiatieven ten laste van
5803
de werkgever: nettokosten voor de onderneming - mannen Totaal van de formele voortgezette beroepsopleidingsinitiatieven ten laste van
5813
de werkgever: nettokosten voor de onderneming - vrouwen Totaal van de minder formele en informele voortgezette beroepsopleidingsinitiatieven ten laste van de werkgever: nettokosten voor de onderneming - mannen
5823
3.2 Regressiemodellen
20
Totaal van de minder formele en informele voortgezette beroepsopleidingsiniti-
5833
atieven ten laste van de werkgever: nettokosten voor de onderneming - vrouwen Totaal van de initi¨ele beroepsopleidingsinitiatieven ten laste van de werkgever:
5843
nettokosten voor de onderneming - mannen Totaal van de initi¨ele beroepsopleidingsinitiatieven ten laste van de werkgever:
5853
nettokosten voor de onderneming - vrouwen RESULTATENREKENING
BELGISCHE
ONDERNEMINGEN
NIET GECONSOLIDEERD Winst/verlies van het boekjaar voor belastingen
9903
Opbrengsten uit vlottende activa
751
Andere financi¨ele opbrengsten Kosten van schulden Andere financi¨ele kosten
752/9 650 652/9
OVERIGE ELEMENTEN Naam BvD ID nummer NACE BEL 2008 - primaire code Datum van oprichting Return On Assets (ROA) Totaal der activa
3.2
20/28
Regressiemodellen
De eerste set van hypotheses, namelijk de a-hypotheses, betreffen de determinanten omtrent het al dan niet voorzien van training. Om deze hypotheses te testen, wordt in navolging van Grund & Martin (2012), Sutherland (2004) en Frazis et al. (1998), gebruik gemaakt van een binaire logistische regressie met een dummyvariabele als afhankelijke variabele (succes = 1; faling = 0) [8, 4, 10]. Echter, de keuze van deze regressievergelijking is niet volledig analoog aan deze van voorgaande werken. In bestaand onderzoek werd geopteerd voor de
3.2 Regressiemodellen
21
Figuur 3.1: Cumulatieve verdeling logit en probit
probit regressie, terwijl in dit onderzoek wordt geopteerd voor de logistische of logit regressie. Deze keuze vormt echter geen belemmering. Zowel de probit als de logit regressie zijn regressiemodellen voor binaire responsvariabelen. Het enige verschil tussen beiden is dat de logistische verdeling dikkere staarten heeft, wat verduidelijkt wordt in Figuur 3.1 [17]. Er is dus geen dwingende reden om ´e´en van beide modellen te prefereren boven de andere. Er wordt echter geopteerd voor de logit regressie vanwege de eenvoudigere interpretatie van de resultaten verkregen via het statistisch computerprogramma SPSS. Concreet is de logistische regressievergelijking die zal worden gebruikt voor de a-hypotheses de volgende: T raining = α + β ∗ x + δ ∗ y + γ ∗ z +
(3.1)
waarbij x en y vectoren zijn die respectievelijk de individuele en de job- en bedrijfsgerelateerde kenmerken voorstellen. De vector z vertegenwoordigt de controlevariabelen. De tweede set van hypotheses, namelijk de b-hypotheses, betreffen de determinanten van de relatieve hoeveelheid training die wordt aangeboden of de trainingsintensiteit. Om deze hypotheses te testen, zal gebruik gemaakt worden van een beperktere dataset die enkel de bedrijven bevat die effectief training aanbieden. Voor deze testen kan niet langer beroep wor-
3.3 Afhankelijke variabelen
22
den gedaan op de logistische regressie, aangezien de afhankelijke variabele geen dichotome variabele meer is. Daarom wordt geopteerd voor een lineaire regressie, namelijk de kleinste kwadraten methode of OLS. Gezien de afhankelijke variabele hier een percentage is en dus waarden heeft die gelegen zijn tussen 0 en 1, zijn we genoodzaakt eerst een logistische transformatie uit te voeren alvorens gebruik te kunnen maken van OLS. De transformatie houdt in dat ervoor gezorgd wordt dat de waarden voor de afhankelijke variabele niet langer tussen 0 en 1 liggen, maar tussen −∞ en +∞. Meer specifiek is de transformatie die wordt uitgetrainingsintensiteit voerd de volgende: ln( 1−trainingsintensiteit + 1) [18]. Na het doorvoeren van de desbetreffende
transformatie, werd het mogelijk om volgende regressie met behulp van OLS te testen: T rainingsintensiteit = α + β ∗ x + δ ∗ y + γ ∗ z +
(3.2)
waarbij x en y opnieuw vectoren zijn die respectievelijk de individuele en de job- en bedrijfsgerelateerde kenmerken voorstellen. De vector z vertegenwoordigt opnieuw de controlevariabelen.
3.3
Afhankelijke variabelen
In deze masterproef zullen twee zaken onderzocht worden. Enerzijds zullen de individuele en job- en bedrijfsspecifieke kenmerken, die het al dan niet voorkomen van training binnen een bedrijf be¨ınvloeden, ge¨ıdentificeerd worden. Anderzijds zal worden nagegaan welke factoren een invloed hebben op de hoeveelheid training die wordt aangeboden. Zoals reeds werd besproken in Secties 2.2 en 3.2, zullen deze twee zaken getest worden aan de hand van twee verschillende groepen hypotheses (a- en b-hypotheses) en twee verschillende regressiemethoden. Uit (3.1) en (3.2) blijkt dat ook twee verschillende afhankelijke variabelen nodig zijn. Beide afhankelijke variabelen zullen worden gemeten op tijdstip t, namelijk boekjaar 2011.
3.3.1
Trainingsdummy
De eerste afhankelijke variabele, die zal worden gebruikt bij het testen van de a-hypotheses, is de variabele trainingsdummy. De variabele meet het al dan niet voorzien van training. Aangezien deze variabele slechts twee mogelijke uitkomsten heeft, spreken we van een dichotome variabele. Bovendien zijn de twee mogelijke uitkomsten 0 en 1, waardoor we kunnen
3.3 Afhankelijke variabelen
23
spreken van een dummyvariabele. Deze krijgt de waarde 1 toegekend wanneer er sprake is van een succes en er dus effectief training plaatsvindt voor de werknemers van het bedrijf. Ze krijgt de waarde 0 wanneer we spreken van een faling en er dus geen training wordt aangeboden. Of er al dan niet training wordt aangeboden, wordt gemeten aan de hand van de trainingskosten die terug te vinden zijn in de sociale balans. In de sociale balans worden deze trainingskosten eerst opgesplitst in drie categorie¨en op basis van de training waar ze betrekking op hebben, namelijk formele voortgezette, minder formele of informele voortgezette en initi¨ele beroepsopleidingsinitiatieven. Onder informele training wordt bijvoorbeeld on the job training, peterschap, coaching en zelfstudie verstaan. Daarna worden deze nettokosten nog eens opgesplitst over mannen en vrouwen, wat in totaal zes onderdelen van trainingskosten oplevert. De volledige benamingen en codes van de desbetreffende items in de sociale balans zijn terug te vinden in Tabel 3.1. Om nu te weten of de variabele de waarde 0 of 1 moet worden toegekend, worden deze zes onderdelen gesommeerd. Is de som gelijk aan nul, betekent dit dat er geen kosten voor training zijn geboekt en gaan we er dus van uit dat er geen training werd aangeboden het afgelopen boekjaar. In dit geval krijgt de dummyvariabele de waarde 0. Wanneer de som een waarde oplevert groter dan nul, betekent dit dat er wel degelijk kosten voor training werden geboekt het afgelopen boekjaar en veronderstellen we dat er effectief training werd aangeboden. In dit geval krijgt de dummyvariabele training de waarde 1. Verder in deze masterproef zal naar deze variabele verwezen worden door middel van DummyTRAINING2011.
DummyTRAINING2011 =
1 :
Trainingskosten > 0
0 :
Trainingskosten = 0
(3.3)
Het al dan niet voorzien van training meten aan de hand van een dummyvariabele, is in navolging van Grund en Martin (2012) [8]. Bij hun onderzoek naar de determinanten van training in Duitsland, werkten ook zij met een dummyvariabele. Een cruciaal verschil tussen hun werkwijze en de werkwijze in deze masterproef is de manier waarop de waarden 0 en 1 worden toegekend. Zoals blijkt uit bovenstaande uiteenzetting, worden hier de waarden toegekend op basis van concrete cijfers die zijn terug te vinden in de sociale balans, terwijl Grund en Martin deze waarden toekenden op basis van informatie die individuen in de GSOEP enquˆete gaven betreffende hun participatie in training.
3.4 Onafhankelijke variabelen
3.3.2
24
Trainingsintensiteit
Een tweede afhankelijke variabele die zal worden gebruikt bij het testen van de b-hypotheses, is de variabele trainingsintensiteit. Deze variabele is een maatstaf voor de hoeveelheid training die wordt aangeboden, wat opnieuw zal worden berekend aan de hand van de in de sociale balans gerapporteerde trainingskosten. Absolute cijfers zijn hierbij echter onvoldoende. Het lijkt voor de hand liggend dat een bedrijf met bijvoorbeeld 15 werknemers, minder trainingskosten zal hebben dan een bedrijf met 200 werknemers. We achten het dan ook noodzakelijk te werken met relatieve cijfers. Om de trainingskosten relatief te maken, worden in navolging van Hansson (2007) de personeelskosten als schalingsfactor gebruikt [14]. Dit zorgt ervoor dat de variabele trainingsintensiteit, hierna benoemd als Intensity2011, er als volgt uitziet: Intensity2011 =
Trainingskosten Personeelskosten
(3.4)
Merk op dat personeelskosten zowel terug te vinden zijn in de sociale balans als in de resultatenrekening. Om na te gaan of beiden effectief ´e´enzelfde concept meten, wordt de collineariteit of correlatie getest aan de hand van de Pearson correlatieco¨effici¨ent. De hoge Pearson correlatieco¨effici¨ent van 0,957 tussen personeelskosten uit de sociale balans en deze uit de resultatenrekening wijst op een hoge similariteit, wat betekent dat ze ´e´enzelfde concept meten. Dit maakt het mogelijk te kiezen uit ´e´en van beiden. Aangezien de andere elementen, nodig voor dit onderzoek, ook uit de sociale balans worden gehaald, wordt er geopteerd voor deze uit de sociale balans om op die manier consistentie te garanderen. De correlatiematrix tussen beide personeelskosten is terug te vinden in Bijlage A.
3.4
Onafhankelijke variabelen
De onafhankelijke variabelen die nodig zijn om de hypotheses te testen, zullen worden gemeten op tijdstip t-1, namelijk boekjaar 2010. Dit doen we om rekening te houden met de causaliteit. Meer bepaald wensen we, door het invoegen van deze zogenaamde time lag, zeker te zijn dat de onafhankelijke variabelen de afhankelijke variabelen be¨ınvloeden en niet omgekeerd. Beide groepen van hypotheses (de a- en b-hypotheses) en dus beide regressies zullen gebruik maken van dezelfde onafhankelijke variabelen. De benodigde onafhankelijke
3.4 Onafhankelijke variabelen
25
variabelen worden besproken in de volgorde analoog aan deze van de hypotheses die werden ontwikkeld in Sectie 2.2.
3.4.1
Percentage mannelijke werknemers
Een eerste onafhankelijke variabele is het percentage mannelijke werknemers in de onderneming, hierna PercMan2010 genoemd. Er wordt in navolging van Grund en Martin (2012) gewerkt met een percentage, omdat we de verhouding tussen mannen en vrouwen in kaart wensen te brengen [8]. In de hypotheses werd gesteld dat hoe hoger het aantal mannen, hoe hoger de kans op investering in opleiding en hoe meer een onderneming investeert in opleiding. Om deze hypotheses te testen, is er dus het percentage mannen nodig. Concreet wordt deze variabele als volgt berekend: PercMan2010 =
=
Mannen totaal in VTE Mannen totaal in VTE + Vrouwen totaal in VTE 120.3 120.3 + 121.3
(3.5)
Merk op dat voor de berekening van PercMan2010 gebruik wordt gemaakt van de gegevens op afsluitingsdatum van het boekjaar. Ook het gemiddeld aantal werknemers, code 100.3, had in de noemer kunnen staan, maar dan worden gegevens op afsluitingsdatum van het boekjaar (in de teller) gemengd met gegevens tijdens het boekjaar en het vorige boekjaar (in de noemer). Bovendien wordt er gewerkt met VTE. Ook hier is het cruciale verschil tussen voorgaand onderzoek en deze masterproef de manier waarop de data wordt verkregen. Onder andere Grund en Martin (2012) verkregen het percentage mannen en vrouwen door middel van een dummyvariabele vrouw. Concreet werd er aan hun vragenlijst een item toegevoegd waar respondenten de mogelijkheid kregen hun geslacht aan te duiden. In deze masterproef daarentegen zijn we in staat de benodigde cijfers uit de sociale balans van de desbetreffende onderneming te halen.
3.4.2
Opleidingsniveaus
Om de hypotheses betreffende het opleidingsniveau te testen, worden er vier verschillende variabelen gecre¨eerd. Dit omdat er in de sociale balans vier verschillende studieniveaus zijn
3.4 Onafhankelijke variabelen
26
terug te vinden, namelijk Lager Onderwijs (LO), Secundair Onderwijs (SO), Hoger NietUniversitair Onderwijs (HNUO) en Universitair Onderwijs (UO). In lijn met de berekening voor het aantal mannen, wensen we ook hier te werken met percentages. Door de berekening van de vier percentages wordt de verdeling van de werknemers over deze verschillende niveaus goed in kaart gebracht. Om een lineaire combinatie te vermijden, worden slechts drie van de vier berekende percentages in de regressie opgenomen (de percentages sommeren tot 100%). Concreet worden enkel de percentages voor SO, HNUO en UO opgenomen. Deze variabelen worden verder respectievelijk benoemd als PercSO2010, PercHNUO2010 en PercUO2010. PercSO2010 =
=
PercHNUO2010 =
=
PercUO2010 =
=
Mannen SO in VTE + Vrouwen SO in VTE Mannen totaal in VTE + Vrouwen totaal in VTE 1201.3 + 1211.3 120.3 + 121.3
(3.6)
Mannen HNUO in VTE + Vrouwen HNUO in VTE Mannen totaal in VTE + Vrouwen totaal in VTE 1202.3 + 1212.3 120.3 + 121.3
(3.7)
Mannen UO in VTE + Vrouwen UO in VTE Mannen totaal in VTE + Vrouwen totaal in VTE 1203.3 + 1213.3 120.3 + 121.3
(3.8)
Bemerk dat ook voor de berekening van deze variabelen gebruik wordt gemaakt van gegevens op afsluitingsdatum van het boekjaar, weergegeven in VTE, om dezelfde redenen als deze vermeld bij (3.5).
3.4.3
Percentage contracten van onbepaalde duur
Hypotheses 5a en 5b handelen over het percentage contracten van onbepaalde duur. We wensen de verhouding contracten van onbepaalde duur en bepaalde duur in beeld te brengen.
3.4 Onafhankelijke variabelen
27
Aangezien de hypotheses gebaseerd zijn op het percentage contracten van onbepaalde duur, wordt enkel dit percentage opgenomen. De variabele voor contracten van onbepaalde duur wordt hierna benoemd als PercOnbep2010. PercOnbep2010 =
=
Overeenkomst onbep. tijd in VTE Overeenkomsten onbep. tijd VTE + Overeenkomsten bep. tijd VTE 110.3 110.3 + 111.3
(3.9)
Ook voor de berekening van de variabele PercOnbep2010 wordt geopteerd voor gegevens op afsluitingsdatum van het boekjaar, weergegeven in VTE. Dit om dezelfde redenen als deze vermeld bij (3.5).
3.4.4
Percentage voltijdse werknemers
De volgende hypotheses behandelen het relatieve aandeel voltijdse werknemers. Analoog aan voorgaande hypotheses, wordt ook hier een variabele ontwikkeld die een percentage weergeeft. Meer bepaald brengt PercVol2010 de verhouding tussen voltijdse en deeltijdse contracten in kaart. Om analoge redenen als deze in Secties 3.4.1 en 3.4.3, wordt slechts ´e´en variabele gecre¨eerd. PercVol2010 wordt berekend als volgt: PercVol2010 =
=
Gem. aantal werknemers VOL Gem. aantal werknemers VOL + Gem. aantal werknemers DEEL 100.1 100.1 + 100.2
(3.10)
Bemerk dat voor de berekening van PercVol2010 gebruik wordt gemaakt van gemiddelden, zijnde data tijdens het boekjaar en het vorige boekjaar.
3.4.5
Personeelsverloop
Beide deelhypotheses van hypothese 7 brengen het verband tussen personeelsverloop en training in kaart. Hiervoor wordt de variabele personeelsverloop aangemaakt, waarnaar in het vervolg van deze masterproef zal worden verwezen met behulp van GemPV2010. Voor deze
3.4 Onafhankelijke variabelen
28
variabele wordt volgende berekening gebruikt: GemPV2010 =
=
Aantal WN waarvan overeenkomst tijdens BJ een einde nam totaal VTE Gem. aantal werknemers totaal in VTE 305.3 100.3
(3.11)
Bij het berekenen van deze variabele worden gegevens op afsluitingsdatum van het boekjaar gecombineerd met gegevens tijdens het boekjaar en vorig boekjaar. Dit is noodzakelijk gezien personeelsverloop onmogelijk kan worden gerelateerd aan het aantal werknemers op het einde van het boekjaar. Graag wensen we te wijzen op het mogelijke verband tussen hypotheses 4 betreffende de anci¨enniteit en hypotheses 7 betreffende het personeelsverloop. Zoals reeds vermeld in Sectie 2.2 kunnen de hypotheses 4a en 4b niet worden getest wegens het ontbreken van data. In Bel-First is namelijk geen data terug te vinden over de gemiddelde anci¨enniteit binnen het bedrijf (of de ambtstermijn). Hypotheses 7a en 7b daarentegen kunnen wel worden getest, aangezien het personeelsverloop kan worden berekend op basis van gegevens uit de sociale balans. We wensen echter te benadrukken dat we via hypothese 7 ook meer kunnen te weten komen over hypothese 4. Personeelsverloop is immers gerelateerd aan ambtstermijn. Logischerwijs, hoe hoger het personeelsverloop, hoe meer mensen het bedrijf snel verlaten en dus des te lager de gemiddelde ambtstermijn van de werknemers.
3.4.6
Ondernemingsgrootte
Voor het testen van de volgende hypotheses is de ondernemingsgrootte nodig. In de literatuur wordt ondernemingsgrootte op verschillende manieren berekend. E´en van de meest voorkomende manieren, naast de totale activa, is het meten aan de hand van het aantal werknemers. In navolging van Frazis et al. (1998) wordt de variabele ondernemingsgrootte, hierna benoemd als GemGrootte2010, als volgt berekend [10]: GemGrootte2010 = ln(Gemiddeld aantal werknemers totaal in VTE) = ln(100.3)
(3.12)
In bestaande literatuur wordt vaak geopteerd voor ln(aantalwerknemers+1). Het toevoegen
3.4 Onafhankelijke variabelen
29
van deze extra term gebeurt met het oog op ondernemingen zonder werknemers, aangezien ln(0) ongedefinieerd is. Aangezien ´e´en van onze restricties, vermeld in Sectie 3.1, echter een minimum van ´e´en werknemer oplegt, bevinden zich in de dataset geen ondernemingen zonder werknemers. Dit betekent dat in deze masterproef gewoon kan worden gewerkt met de natuurlijke logaritme van het aantal werknemers, zonder toevoeging van de extra term. Zoals blijkt uit (3.12), wordt er gebruik gemaakt van gegevens tijdens het boekjaar en het vorige boekjaar. Dit omdat ondernemingen hun werknemersbestand, bij het afsluiten van het boekjaar, opzettelijk zouden kunnen aansterken of afzwakken om de cijfers te manipuleren om aan bepaalde normen al dan niet te voldoen.
3.4.7
Aanwezigheid ondernemingsraad
De laatste hypotheses brengen de mogelijke invloed van een Ondernemingsraad (OR) op training in kaart. In de literatuur behandelt men over het algemeen de invloed van een vakbond [10, 14]. Over het al dan niet gesyndiceerd zijn, is in de Bel-First database echter niets terug te vinden. Doorgaans ziet men een vakbond als een manier waarop de werknemers hun stem kunnen laten horen en hun eisen makkelijker kunnen doordrukken. Vanuit dit standpunt kan gebruik worden gemaakt van het al dan niet aanwezig zijn van een OR in plaats van het al dan niet gesyndiceerd zijn, gezien de OR in de eerste plaats een overlegorgaan is tussen de werkgever- en werknemersvertegenwoordigers en dus wordt gezien als een inspraak- en medezeggenschapsorgaan. Concreet wordt van de variabele ondernemingsraad (GemOR2010 ) een dummyvariabele gemaakt. We spreken van een succes wanneer er een OR aanwezig is. In dit geval krijgt GemOR2010 de waarde 1. We spreken van een faling wanneer er geen OR aanwezig is. In dit geval krijgt GemOR2010 de waarde 0 toegewezen. Gebruikmakend van het feit dat een OR moet worden opgericht binnen ondernemingen die gemiddeld ten minste 100 werknemers tewerkstellen, wordt deze laatste onafhankelijke variabele als volgt berekend:
GemOR2010 =
1 :
Gemiddeld aantal werknemers totaal in VTE ≥ 100
0 :
Gemiddeld aantal werknemers totaal in VTE < 100
(3.13)
Bemerk dat er in (3.13) om dezelfde reden als in (3.12) gebruik wordt gemaakt van gegevens tijdens het boekjaar en het vorige boekjaar.
3.5 Controlevariabelen
3.5
30
Controlevariabelen
Naast de afhankelijke en onafhankelijke variabelen worden er ook nog controlevariabelen toegevoegd aan de regressie. Controlevariabelen zijn variabelen die constant worden gehouden, om op die manier te controleren of ze de relatie tussen de afhankelijke en onafhankelijke variabele be¨ınvloeden of verduidelijken. Let wel, deze variabelen worden niet opgenomen in de onderzoeksvraag. Net zoals de onafhankelijke variabelen worden deze controlevariabelen berekend op basis van gegevens op tijdstip t-1, dus boekjaar 2010.
3.5.1
Industrie dummies
Een eerste groep van controlevariabelen die wordt toegevoegd, is de groep industrie dummies. We wensen namelijk te controleren voor het effect van de industrie waarin de onderneming zich bevindt. Hiervoor worden dummyvariabelen aangemaakt. E´en van de elementen die uit BelFirst worden ge¨exporteerd, is de NACE-BEL code die betrekking heeft op de hoofdactiviteit van het bedrijf. Op basis van deze NACE-BEL codes, meer bepaald op basis van de secties in de activiteitennomenclatuur, wordt een groep dummyvariabelen in het leven geroepen. Een overzicht van de NACE-BEL 2008 secties in de activiteitennomenclatuur kan worden teruggevonden in Tabel 3.2. Uit deze tabel blijkt dat de secties worden gevormd op basis van de eerste twee cijfers uit de NACE-BEL code. Er wordt voor iedere sectie een dummyvariabele aangemaakt. De waarden 0 en 1 worden dan als volgt toegewezen aan de dummies: liggen de eerste twee cijfers tussen 01 en 03, dan krijgt de dummyvariabele voor sectie A de waarde 1 toegewezen en alle andere industrie dummies de waarde 0. Liggen de eerste twee cijfers tussen 05 en 09, dan krijgt de dummyvariabele voor sectie B de waarde 1 toegewezen en alle andere industrie dummies de waarde 0 enzoverder. Om de zogenaamde dummy variable trap te vermijden, worden slechts 20 van de 21 aangemaakte dummyvariabelen opgenomen. De sectie die we niet opnemen in de regressie is de sectie Industrie. Deze zal worden beschouwd als de basiscategorie.
3.5 Controlevariabelen
31
Tabel 3.2: NACE-BEL 2008 secties in de activiteitennomenclatuur.
Sectie
Omschrijving
Afdeling
A
Landbouw, bosbouw en visserij
01–03
B
Winning van delfstoffen
05–09
C
Industrie
10–33
D
Productie en distributie van elektriciteit, gas, stoom en gekoelde lucht
E
Distributie van water; afval- en afvalwaterbeheer en sanering
36–39
F
Bouwnijverheid
41–43
G
Groot- en detailhandel; reparatie van auto’s en motorfietsen
45–47
H
Vervoer en opslag
49–53
I
Verschaffen van accommodatie en maaltijden
55–56
J
Informatie en communicatie
58–63
K
Financi¨ele activiteiten en verzekeringen
64–66
L
Exploitatie van en handel in onroerend goed
M
Vrije beroepen en wetenschappelijke en technische activiteiten
69–75
N
Administratieve en ondersteunende diensten
77–82
O
Openbaar bestuur en defensie; verplichte sociale verzekeringen
84
P
Onderwijs
85
Q
Menselijke gezondheidszorg en maatschappelijke dienstverlening
86–88
R
Kunst, amusement en recreatie
90–93
S
Overige diensten
94–96
T
Huishoudens als werkgever; niet-gedifferentieerde productie van goe-
97–98
35
68
deren en diensten door huishoudens voor eigen gebruik U
3.5.2
Extraterritoriale organisaties en lichamen
99
Winstgevendheid
Een tweede controlevariabele is de winstgevendheid van het bedrijf. Uit werk van Hansson (2007) blijkt dat de financi¨ele prestaties van de onderneming mogelijk een invloed kunnen heb-
3.5 Controlevariabelen
32
ben op het aanbieden van training [14]. Om deze reden wordt er in de regressie gecontroleerd voor de winstgevendheid. Meer bepaald wordt winstgevendheid weergegeven aan de hand van de Return On Assets (ROA). De variabele ROA, hierna weergegeven als ROA%2010, wordt op twee verschillende manieren bekomen. Enerzijds wordt dit financi¨ele kengetal rechtstreeks als element uit Bel-First ge¨exporteerd. Anderzijds wordt de ROA berekend aan de hand van volgende formule: ROA =
EBIT Totaal der activa
(3.14)
waarbij Earnings Before Interest and Taxes (EBIT) kan worden berekend als: EBIT = Winst/Verlies van het boekjaar voor belastingen (9903) − Opbrengsten uit vlottende activa (751) − Andere financi¨ele opbrengsten (752/9) + Kosten van schulden (650) + Andere financi¨ele kosten (652/9) (3.15)
Na het opstellen van een correlatiematrix wordt duidelijk dat beide variabelen sterk gecorreleerd zijn. We vinden namelijk een Pearson correlatieco¨effici¨ent van 0,894. Om consistentie te garanderen, wordt dan ook gekozen om de variabele ROA%2010 te meten aan de hand van het kengetal dat rechtstreeks uit Bel-First wordt ge¨exporteerd. Een bijkomende reden is dat er waarnemingen zouden sneuvelen uit onze dataset bij gebruik van (3.14) en (3.15), aangezien er niet voor iedere waarneming een ROA kan worden berekend. De correlatiematrix is terug te vinden in Bijlage A.
3.5.3
Ondernemingsleeftijd
Bovendien wordt in de regressie ook gecontroleerd voor de leeftijd van het bedrijf. Hoewel de leeftijd niet rechtstreeks uit de Bel-First database te halen is, kan deze wel worden berekend op basis van andere informatie uit de database. De oprichtingsdatum kan namelijk wel worden ge¨exporteerd, wat het mogelijk maakt de leeftijd van het bedrijf in 2010 zelf te berekenen. Voor bedrijven die werden opgericht v´ o´ or 2010, wordt de leeftijd naar beneden afgerond tot op ´e´en eenheid. Voor bedrijven die werden opgericht in 2010 daarentegen, wordt de leeftijd naar boven afgerond tot op ´e´en eenheid, zodat al deze bedrijven de leeftijd van 1 jaar toegewezen krijgen. Om dan tot de variabele leeftijd, verder aangeduid als Leeftijd2010, te komen wordt
3.6 Data-opkuis
33
de natuurlijke logaritme van de berekende leeftijd genomen. Leeftijd2010 = ln(leeftijd)
(3.16)
Merk op dat in bestaand onderzoek vaak geopteerd wordt voor ln(leef tijd + 1). Het toevoegen van de term +1 gebeurt omdat ln(0) ongedefinieerd is. Aangezien in de dataset door afrondingen geen waarnemingen met leeftijd 0 zitten, is het toevoegen van deze extra term overbodig.
3.5.4
Groei
Een laatste controlevariabele is de groei van de onderneming. Hiermee wordt de groei van het voorbije jaar bedoeld. Aangezien ook de variabele groei op basis van gegevens uit boekjaar 2010 zal worden berekend, wordt dus de groei die de onderneming heeft gerealiseerd ten opzichte van boekjaar 2009 bedoeld. Hieruit volgt dat de variabele Groei2010 kan worden berekend als: Groei2010 =
3.6
Totaal der activa 2010 − Totaal der activa 2009 Totaal der activa 2009
(3.17)
Data-opkuis
Na het berekenen van de variabelen wordt duidelijk dat de oorspronkelijke dataset met 90 581 waarnemingen nog moet worden ingekrompen. Een additionele restrictie die namelijk in deze masterproef wordt opgelegd, is het beschikbaar zijn van alle data voor iedere waarneming. Een groot aantal waarnemingen dient te worden verwijderd wegens het niet beschikbaar zijn van bepaalde data, wegens data die zich niet binnen de vooropgestelde restricties bevindt of wegens irrelevante data. Allereerst wordt data als niet beschikbaar beschouwd wanneer er zich waarden als ‘n.b’, ‘n.s’, ‘#value’ en ‘-’ voordoen. Ten tweede wordt, voor data die zich niet binnen de vooropgestelde restricties bevindt, vooral op de elementen gemiddeld aantal werknemers VOLTIJDS en gemiddeld aantal werknemers totaal in VTE (respectievelijk codes 100.1 en 100.3) gelet. In Sectie 3.1 werd uiteengezet dat enkel wordt gewerkt met KMO’s. Waarnemingen die voor ´e´en van beide elementen 100.1 of 100.3 waarden hebben hoger dan 250, moeten dan ook worden verwijderd uit de dataset. Dat deze waarnemingen ondanks
3.6 Data-opkuis
34
de restricties uit Sectie 3.1 toch worden opgenomen, wordt verklaard door het feit dat de zoekstrategie¨en worden uitgevoerd op basis van gegevens van het laatst beschikbare jaar. Dit terwijl de elementen die nodig zijn voor het berekenen van de onafhankelijke variabelen worden geselecteerd voor boekjaar 2010. Wanneer voor onderneming X het laatst beschikbare jaar bijvoorbeeld 2012 is, wordt deze onderneming geselecteerd indien het aantal werknemers in 2012 kleiner is dan of gelijk aan 250. Het is echter mogelijk dat diezelfde onderneming in boekjaar 2010 een gemiddeld aantal werknemers had dat hoger ligt dan 250. Ten slotte wordt irrelevante data buiten beschouwing gelaten. Wat betreft de personeelskosten totaal in VTE, code 102.3, worden waarnemingen met negatieve personeelskosten en personeelskosten gelijk aan 0 verwijderd. Enerzijds omdat deze waarden onrealistisch zijn, maar anderzijds ook omdat er bij de berekening van Intensity2011 moet worden gedeeld door deze personeelskosten. Bovendien worden verschillende secties (gegroepeerd op basis van de NACE-BEL-secties) uit de dataset geweerd, aangezien zij minder relevant zijn voor het onderzoek. Er wordt gepoogd voornamelijk de secties diensten, handel en industrie te behouden. Zo wordt sectie K (Financi¨ele activiteiten en verzekeringen) uitgesloten. De ondernemingen uit deze sectie kennen een te verschillend karakter om representatief te zijn. De ROA’s en de groeipercentages voor de ondernemingen uit sectie K wijken immers ver af van deze voor ondernemingen uit de overige secties. Sectie L (Exploitatie van en handel in onroerend goed) wordt eveneens uit de dataset geweerd aangezien de ondernemingen uit deze sectie beschikken over een totaal andere soort activa. Volgende secties worden eveneens buiten beschouwing gelaten: O (Openbaar bestuur en defensie; verplichte sociale verzekeringen) en P (Onderwijs). Het gaat hier immers over non-profit secties. Een overzicht van het aantal waarnemingen dat per variabele wordt verwijderd, is terug te vinden in Tabel 3.3. Bemerk dat de waarnemingen worden verwijderd in respectievelijke volgorde.
3.6 Data-opkuis
35
Tabel 3.3: Data-opkuis.
Element- of variabelennaam
Aantal
OORSPRONKELIJKE DATASET
90 581
NACE-BEL 2008 primaire code Trainingskosten (5803 t.e.m. 5853) Return On Assets (ROA)
- 353 - 2 483 -5
PercMan2010
- 1 018
PercBep2010
- 80
PercVol2010
- 47
Groei2010
- 2 765
Gem. aantal werknemers VOL (100.1)
- 7 178
Gem. aantal werknemers totaal VTE (100.3)
- 7 287
Personeelskosten totaal in VTE (102.3)
- 756
Sectie K
- 3 343
Sectie L
- 1 164
Sectie O
- 45
Sectie P
- 287
OPGEKUISTE DATASET
63 770
RESULTATEN EN INTERPRETATIE
37
Hoofdstuk 4
Resultaten en interpretatie Na het verzamelen van de benodigde data uit Bel-First, het berekenen en cre¨eren van de nodige variabelen en het opkuisen van de dataset, kan worden overgegaan tot de effectieve analyse. Eerst en vooral wordt de descriptieve statistiek van elke variabele en de correlatie tussen de variabelen onderling besproken. Daarna vindt de effectieve regressieanalyse plaats.
4.1
Beschrijvende statistieken
In deze sectie worden eerst en vooral een aantal correlaties tussen de verschillende onafhankelijke variabelen nagegaan. Vervolgens worden de descriptieve statistieken behandeld, alsook het winsorizen van de variabelen. Aangezien in deze masterproef twee regressies zullen worden getest, worden er in de opgekuiste dataset twee subgroepen gecre¨eerd die elk een verschillend aantal waarnemingen bevatten. Aan elk van deze subgroepen wordt een afzonderlijke sectie gewijd.
4.1.1
Correlaties
Om het mogelijk te maken verschillende variabelen tegelijk op te nemen in een regressie, is het noodzakelijk dat er zich geen multicollineariteit voordoet. Vooreerst wordt er getest of er bij de onafhankelijke variabelen PercOnbep2010, PercVol2010 en GemPV2010 sprake is van multicollineariteit. Daarna worden de correlaties tussen alle onafhankelijke variabelen onderling onder de loep genomen.
4.1 Beschrijvende statistieken
38
Het concept langetermijnrelatie Bij het formuleren van onze hypotheses merken we een consistentie op tussen de verklaringen voor de verbanden tussen de onafhankelijke variabelen PercOnbep2010 /PercBep2010, PercVol2010 /PercDeel2010 en GemPV2010 enerzijds en de afhankelijke variabelen anderzijds. Deze verbanden zijn immers gebaseerd op hetzelfde principe van het Human Capital Model. Dit principe stelt dat hoe belangrijker de langetermijnrelatie tussen werkgever en werknemer wordt, hoe groter de kans op investering in opleiding. Bijgevolg wordt er aan de hand van een correlatiematrix getest of deze variabelen niet allemaal ´e´enzelfde concept meten, namelijk het concept ‘langetermijnrelatie’. De desbetreffende correlatiematrix is terug te vinden in Tabel 4.1. Volgens Gujarati treedt het probleem van multicollineariteit, meer bepaald te sterk gecorreleerde variabelen, pas op wanneer de correlatieco¨effici¨ent tussen twee variabelen een waarde heeft die hoger is dan 0,8 [17]. Merk op dat de variabelen PercOnbep2010 en PercBep2010 alsook PercVol2010 en PercDeel2010 een perfect negatieve correlatie hebben. De logische verklaring hiervoor is dat beide deelpercentages ´e´enzelfde verhouding in kaart brengen en dus sommeren tot 100%. Verder nemen de Pearson correlatieco¨effici¨enten tussen de variabelen steeds waarden aan die kleiner zijn dan 0,8. Hieruit wordt geconcludeerd dat deze variabelen niet te sterk gecorreleerd zijn en dus niet ´e´enzelfde concept meten, waardoor alle drie de alternatieve hypotheses kunnen worden behouden.
GemPV2010
PercDeel2010
PercVol2010
PercBep2010
PercOnbep2010
0,000
Sig. (2-tailed)
0,000
0,162**
0,000
0,058**
0,000
-0,058**
1
0,000
-1,000**
PercBep2010
0,000
-0,033**
0,000
-1,000**
1
0,000
-0,058**
0,000
0,058**
PercVol2010
0,000
0,033**
1
0,000
-1,000**
0,000
0,058**
0,000
-0,058**
PercDeel2010
** Duidt op significantie op 1% (tweezijdig), m.a.w. p < 0,01.
-0,162**
0,000
Sig. (2-tailed)
Pearson Corr.
-0,058**
0,000
Sig. (2-tailed)
Pearson Corr.
0,058**
0,000
Sig. (2-tailed)
Pearson Corr.
-1,000**
1
Pearson Corr.
Sig. (2-tailed)
Pearson Corr.
PercOnbep2010
Tabel 4.1: Correlatiematrix van de variabelen die mogelijks het concept langetermijnrelatie meten.
1
0,000
0,033**
0,000
-0,033**
0,000
0,162**
0,000
-0,162**
GemPV2010
4.1 Beschrijvende statistieken 39
4.1 Beschrijvende statistieken
40
Correlatie tussen de onafhankelijke variabelen Er werd reeds duidelijk dat er zich tussen de variabelen PercOnbep2010, PercVol2010 en GemPV2010 onderling geen multicollineariteit voordoet. Tabel 4.2 geeft een overzicht van de Pearson correlatieco¨effici¨enten tussen de onafhankelijke variabelen. Elk van de correlatieco¨effici¨enten heeft een waarde kleiner dan 0,8. Dit betekent dat elk van deze variabelen mag worden opgenomen in de regressie. De variabele PercLO2010 wordt echter, zoals vermeld in Sectie 3.4.2, niet opgenomen in de regressie. De hoogste correlatieco¨effici¨enten, in absolute termen, die kunnen worden gevonden zijn 0,531 en -0,702. Deze eerste betreft de relatie tussen PercMan2010 en PercVol2010. De co¨effici¨ent -0,702 betreft dan weer de relatie tussen PercLO2010 en PercSO2010. Het is niet verwonderlijk dat voor deze laatste een hogere correlatie optreedt aangezien beide variabelen betrekking hebben op het opleidingsniveau.
1
0,080**
0,020**
-0,122**
-0,097**
0,019**
0,531**
-0,021**
0,149**
0,013**
PercMan
PercLO
PercSO
PercHNU
percUO
PercOnbep
PercVol
PV
Grootte
OR
PercMan
-0,007
-0,015**
0,012**
-0,019**
-0,029**
-0,197**
-0,358**
1
-0,702**
0,020**
PercSO
0,045**
0,056**
-0,040**
0,003
0,061**
0,070**
1
-0,358**
-0,244**
-0,122**
PercHNU
0,040**
0,042**
-0,025**
-0,002
0,028**
1
0,070**
-0,197**
-0,138**
-0,097**
PercUO
0,005
0,012**
-0,162**
0,058**
1
0,028**
0,061**
-0,029**
-0,020**
0,019**
PercOnbep
0,031**
0,216**
-0,033**
1
0,058**
-0,002
0,003
-0,019**
0,007
0,531**
PercVol
** Duidt op significantie op 1% (tweezijdig), m.a.w. p < 0,01.
-0,033**
-0,031**
0,018**
0,007
-0,020**
-0,138**
-0,244**
-0,702**
1
0,080**
PercLO
Tabel 4.2: Correlatiematrix van de onafhankelijke variabelen.
-0,009*
-0,037**
1
-0,033**
-0,162**
-0,025**
-0,040**
0,012**
0,018**
-0,021**
PV
0,352**
1
-0,037**
0,216**
0,012**
0,042**
0,056**
-0,015**
-0,031**
0,149**
Grootte
1
0,352**
-0,009*
0,031**
0,005
0,040**
0,045**
-0,007
-0,033**
0,013**
OR
4.1 Beschrijvende statistieken 41
4.1 Beschrijvende statistieken
4.1.2
42
Subgroep Trainingsdummy
Een eerste subgroep die wordt aangemaakt is de subgroep Trainingsdummy. Deze subgroep zal worden gebruikt voor het testen van de a-hypotheses en komt overeen met de opgekuiste dataset. Ze bevat dan ook alle 63 770 waarnemingen. Tabel 4.3 geeft een overzicht van de descriptieve statistieken voor deze subgroep.
Tabel 4.3: Descriptieve statistieken (subgroep Trainingsdummy).
Gem.
Med.
Std. Afw.
Min.
Max.
0,2100
0,0000
0,4070
0
1
PercMan2010
0,6168
0,7500
0,3854
0,0000
1,0000
PercLO2010
0,2823
0,0000
0,4271
0,0000
28,0000
PercSO2010
0,5657
0,7059
0,4392
0,0000
12,0000
PercHNUO2010
0,1158
0,0000
0,2621
0,0000
1,0000
PercUO2010
0,0317
0,0000
0,1344
0,0000
1,0000
PercOnbep2010
0,9592
1,0000
0,1390
0,0000
1,0000
PercVol2010
0,6886
0,8333
0,3524
0,0000
1,0000
GemPV2010
1,6700
0,1892
11,9601
0,0000
559,0000
GemGrootte2010
1,5047
1,3863
1,2232
0,0000
5,5200
GemOR2010
0,0200
0,0000
0,1220
0
1
Sectie A
0,0200
0,0000
0,1250
0
1
Sectie B
0,0000
0,0000
0,0210
0
1
Sectie C
0,1300
0,0000
0,3310
0
1
Sectie D
0,0000
0,0000
0,0210
0
1
Sectie E
0,0000
0,0000
0,0700
0
1
Sectie F
0,1700
0,0000
0,3780
0
1
Sectie G
0,3100
0,0000
0,4640
0
1
Sectie H
0,0600
0,0000
0,2320
0
1
Sectie I
0,0700
0,0000
0,2530
0
1
Afh. variabele DummyTRAINING2011 Onafh. variabelen
Controlevariabelen
4.1 Beschrijvende statistieken
43
Sectie J
0,0300
0,0000
0,1660
0
1
Sectie M
0,0900
0,0000
0,2840
0
1
Sectie N
0,0500
0,0000
0,2100
0
1
Sectie Q
0,0400
0,0000
0,2010
0
1
Sectie R
0,0100
0,0000
0,1080
0
1
Sectie S
0,0200
0,0000
0,1520
0
1
Sectie T
0,0000
0,0000
0,0040
0
1
Sectie U
0,0000
0,0000
0,0000
0
0
ROA%2010
7,0654
6,1200
21,7752
-991,1200
806,1700
Leeftijd2010
3,5882
0,0293
745,8368
-0,9933
187898,0000
Groei2010
2,5779
2,7081
0,8249
0,0000
4,9300
Afhankelijke variabele De afhankelijke variabele DummyTRAINING2011 heeft een gemiddelde van 0,21. Dit betekent dat slechts 21% van de bedrijven uit de dataset training aanbiedt. De mediaan bedraagt tevens 0,0000. Er kan dus worden geconcludeerd dat slechts een beperkt aantal ondernemingen in deze dataset training aanbieden.
Onafhankelijke variabelen De onafhankelijke variabele PercMan2010 heeft een gemiddelde van 0,6168. Dit betekent dat er gemiddeld gezien 61,68% mannelijke werknemers zijn. Ook de mediaan van 0,7500 bevestigt dat er in de meeste bedrijven een hoger aantal mannen dan vrouwen aanwezig zijn. Wat de verschillende opleidingsniveaus betreft, zijn er voornamelijk werknemers met een diploma SO aanwezig in de bedrijven. Met een gemiddelde van 56,57% scoort de onafhankelijke variabele PercSO2010 namelijk veel hoger dan de overige opleidingsniveaus. De variabelen PercLO2010 en PercSO2010 hebben respectievelijk een maximum van 2800% en 1200%. Deze vreemde maxima zijn hoogstwaarschijnlijk te wijten aan fout gerapporteerde data. Deze waarnemingen zullen dan ook behandeld worden als uitschieters. Opmerkelijk
4.1 Beschrijvende statistieken
44
is dat gemiddeld amper 3,17% van de werknemers een diploma UO in bezit heeft. Daar de mediaan 0,0000 is, kan hieruit worden afgeleid dat zeker de helft van de bedrijven zelfs geen werknemers met een diploma UO tewerkstelt. Met een gemiddelde van 0,9592 voor de onafhankelijke variabele PercOnbep2010, is het overduidelijk dat in de bedrijven uit deze dataset vooral contracten van onbepaalde duur aanwezig zijn. Ook de mediaan van 1,0000 bevestigt deze stelling. De onafhankelijke variabele PercVol2010 heeft een gemiddelde van 0,6886. Hieruit wordt geconcludeerd dat er gemiddeld gezien meer werknemers zijn die voltijds werken dan werknemers die deeltijds werken. De mediaan van 0,8333 duidt zelfs op een nog hoger overwicht. De onafhankelijke variabele GemPV2010 heeft een gemiddelde van 1,6700. Een gemiddeld personeelsverloop van 1,6700 betekent dat er een groter aantal uitgetreden werknemers zijn dan huidige werknemers. Deze situatie kan zich voordoen in bedrijven waar er bijvoorbeeld vooral met interimcontracten wordt gewerkt. Daar de mediaan slechts 0,1892 bedraagt, wordt vermoed dat het gemiddelde vertekend is door enkele bedrijven met een hoog personeelsverloop. Dit vermoeden wordt bevestigd door de maximumwaarde die 559,0000 bedraagt. Ten slotte volgt de onafhankelijke variabele GemOR2010. Uit het gemiddelde van 0,02 blijkt dat er slechts in 2% van de bedrijven een OR aanwezig is. Dit lage percentage kan deels verklaard worden door het feit dat vele KMO’s de minimumgrens van 100 werknemers, die nodig is voor een verplichte aanwezigheid van een OR, niet halen. Teneinde de invloed van uitschieters te vermijden, worden de onafhankelijke variabelen gewinsorized op het 5% en 95% percentiel. Dit betekent dat gegevens die zich buiten het 5% of 95% percentiel bevinden, herleid worden naar deze percentielen. De grenzen waarbinnen de gegevens zich moeten bevinden worden voor elk van de onafhankelijke variabelen bepaald. Hiervoor wordt gebruik gemaakt van de definitie van Van Dijk, namelijk gemiddelde + / − (3 ∗ standaarddeviatie) (Van Dijk, 1997) [19]. Tabel 4.4 geeft een overzicht. Merk op dat dummyvariabelen niet worden gewinsorized. Deze variabelen kunnen enkel de waarden 0 of 1 aannemen. Hierdoor is er geen sprake van uitschieters. Bijlage B geeft een overzicht van de descriptieve statistieken voor de gewinsorizede onafhankelijke variabelen in de subgroep Trainingsdummy.
4.1 Beschrijvende statistieken
45
Tabel 4.4: Winsorizen van de onafhankelijke variabelen (subgroep Trainingsdummy).
Gemiddelde
Std. Dev.
Minimum
Maximum
=Gem.-(3*stddev.)
=Gem.+(3*stddev.)
PercMan2010
0,6168
0,3854
-0,5394
1,7730
PercLO2010
0,2823
0,4271
-0,9990
1,5636
PercSO2010
0,5657
0,4392
-0,7519
1,8833
PercHNU2010
0,1158
0,2621
-0,6705
0,9021
PercUO2010
0,0317
0,1344
-0,3715
0,4349
PercOnbep2010
0,9592
0,1390
0,5422
1,3762
PercVol2010
0,6886
0,3524
-0,3686
1,7458
GemPV2010
1,6700
11,9601
-34,2103
37,5503
GemGrootte2010
1,5047
1,2232
-2,1649
5,1743
Controlevariabelen De secties, weergegeven aan de hand van industrie dummies, die het sterkst vertegenwoordigd zijn in deze dataset zijn: Industrie (12,55136%), Bouwnijverheid (17,29967%) en Grooten detailhandel; reparatie van auto’s en motorfietsen (31,39250%). Samen zijn deze drie secties goed voor maar liefst 61,24353% van de dataset. De sectie Extraterritoriale organisaties en lichamen (0%) is dan weer helemaal niet vertegenwoordigd. In Tabel 4.5 wordt de proportionele verdeling van de dataset volgens sectie verduidelijkt.
Tabel 4.5: Proportionele verdeling van de dataset volgens sectie (subgroep Trainingsdummy).
Sectie
Proportie in dataset Absoluut aantal
Percentage
A
1015
1,59167%
B
29
0,00045%
C
8004
12,55136%
D
28
0,00044%
4.1 Beschrijvende statistieken
46
E
315
0,49396%
F
11032
17,29967%
G
20019
31,39250%
H
3638
5,70488%
I
4368
6,84962%
J
1800
2,82264%
M
5621
8,81449%
N
2940
4,61031%
Q
2700
4,23397%
R
756
1,18551%
S
1504
2,35848%
T
1
0,00002%
U
0
0,00000%
63770
100%
Totaal
Verder worden ook de controlevariabelen ROA%2010, Leeftijd2010 en Groei2010 gewinsorized op het 5% en 95% percentiel om uitschieters te vermijden. Tabel 4.6 geeft een overzicht. Bijlage B geeft een overzicht van de descriptieve statistieken voor de gewinsorizede controlevariabelen van de subgroep Trainingsdummy.
Tabel 4.6: Winsorizen van de controlevariabelen (subgroep Trainingsdummy).
Gemiddelde
Std. Dev.
Minimum
Maximum
=Gem.-(3*stddev.)
=Gem.+(3*stddev.)
ROA%2010
7,0654
21,7752
-58,2602
72,3910
Leeftijd2010
3,5882
745,8368
-2233,9222
2241,0986
Groei2010
2,5779
0,8249
0,1032
5,0526
4.1 Beschrijvende statistieken
4.1.3
47
Subgroep Trainingsintensiteit
Een tweede subgroep is de subgroep Trainingsintensiteit. Deze bevat 13 339 ondernemingen. Voor het testen van de b-hypotheses worden immers enkel de ondernemingen opgenomen die training aanbieden. Concreet zijn dit enkel de ondernemingen waarbij de variabele DummyTRAINING2011 de waarde 1 heeft. Tabel 4.7 geeft een overzicht van de descriptieve statistieken voor de subgroep Trainingsintensiteit.
Tabel 4.7: Descriptieve statistieken (subgroep Trainingsintensiteit).
Gem.
Med.
Std. Afw.
Min.
Max.
0,0175
0,0043
0,4823
0,0000
55,5556
PercMan2010
0,6607
0,7681
0,3332
0,0000
1,0000
PercLO2010
0,2571
0,0000
0,3930
0,0000
1,5000
PercSO2010
0,5159
0,5506
0,4146
0,0000
1,0000
PercHNUO2010
0,1706
0,0000
0,2804
0,0000
1,0000
PercUO2010
0,0485
0,0000
0,1415
0,0000
1,0000
PercOnbep2010
0,9647
1,0000
0,1138
0,0000
1,0000
PercVol2010
0,7523
0,8571
0,2869
0,0000
1,0000
GemPV2010
1,1417
0,2000
8,0552
0,0000
217,17
GemGrootte2010
2,3674
2,3026
1,4283
0,0000
5,5200
GemOR2010
0,0700
0,0000
0,2470
0,0000
1,0000
Sectie A
0,0100
0,0000
0,0920
0
1
Sectie B
0,0000
0,0000
0,0300
0
1
Sectie C
0,1700
0,0000
0,3780
0
1
Sectie D
0,0000
0,0000
0,0290
0
1
Sectie E
0,0100
0,0000
0,0860
0
1
Sectie F
0,1700
0,0000
0,3740
0
1
Sectie G
0,2800
0,0000
0,4470
0
1
Sectie H
0,0700
0,0000
0,2550
0
1
Afh. variabele Intensity2011 Onafh. variabelen
Controlevariabelen
4.1 Beschrijvende statistieken
48
Sectie I
0,0300
0,0000
0,1810
0
1
Sectie J
0,0400
0,0000
0,1880
0
1
Sectie M
0,0800
0,0000
0,2730
0
1
Sectie N
0,0500
0,0000
0,2200
0
1
Sectie Q
0,0600
0,0000
0,2430
0
1
Sectie R
0,0100
0,0000
0,0890
0
1
Sectie S
0,0200
0,0000
0,1390
0
1
Sectie T
0,0000
0,0000
0,0000
0
0
Sectie U
0,0000
0,0000
0,0000
0
0
ROA%2010
7,3558
5,9100
16,8777
-478,8800
516,2200
Leeftijd2010
2,7533
2,9444
0,8289
0,0000
4,9300
Groei2010
0,4582
0,0425
21,2850
-0,9933
2201,7201
Afhankelijke variabele De afhankelijk variabele Intensity2011 heeft een gemiddelde van 0,0175. Dit betekent dat er gemiddeld gezien een bedrag aan training wordt gespendeerd dat 1,75% van de loonkosten bedraagt. Dit gemiddelde haalt het in het IPA 2007-2008 tussen de sociale partners vastgelegde target van 1,9% niet1 . Er zijn natuurlijk uitzonderingen zoals duidelijk te zien is aan het maximum dat 5555,56% bedraagt. Deze waarneming zal echter worden gezien als een uitschieter. Teneinde op een correcte manier om te gaan met dergelijke uitschieters, wordt ook de variabele Intensity2011 gewinsorized op analoge manier als deze vermeld in Sectie 4.1.2. Tabel 4.8 geeft een overzicht van de grenswaarden. Tabel 4.8: Winsorizen van Intensity2011 (subgroep Trainingsintensiteit).
Gemiddelde
Intensity2011 1
0,0175
http://www.werk.belgie.be
Std. Dev.
0,4823
Minimum
Maximum
=Gem.-(3*stddev.)
=Gem.+(3*stddev.)
-1,4294
1,4644
4.1 Beschrijvende statistieken
49
Onafhankelijke variabelen De onafhankelijke variabele PercMan2010 heeft een gemiddelde van 0,6607. Meer bepaald kan worden gezegd dat gemiddeld 66,07% van de werknemers mannen zijn. Deze cijfers zijn gelijklopend met deze van PercMan2010 in de subgroep Trainingsdummy. Wat de verschillende opleidingsniveaus betreft, worden opnieuw voornamelijk werknemers met een diploma SO tewerkgesteld. Met een gemiddelde van 51,59% scoort de onafhankelijke variabele PercSO2010 immers veel hoger dan de overige opleidingsniveaus. Opmerkelijk is opnieuw het gering aantal werknemers met een diploma UO, namelijk amper 4,85%. Daar de mediaan 0,0000 is, kan hieruit worden afgeleid dat minstens de helft van de bedrijven uit de steekproef geen personen met een diploma UO tewerkstelt. Met een gemiddelde van 0,9647 voor de onafhankelijke variabele PercOnbep2010, is het ook hier onmiskenbaar dat werknemers vooral worden aangeworven door middel van contracten van onbepaalde duur. Concreet is dus gemiddeld 96,47% van de contracten van onbepaalde duur. Er kan dan ook worden geconcludeerd dat er gemiddeld meer contracten van onbepaalde duur zijn dan van bepaalde duur. De mediaan van 1,0000 duidt zelfs op een nog groter overwicht. Voor de onafhankelijke variabele PercVol2010 geldt een gemiddelde van 0,7523. Ook in de bedrijven uit deze subgroep zijn voltijdse werknemers dus talrijk aanwezig. Er kan dan ook worden geconcludeerd dat er gemiddeld meer voltijdse dan deeltijdse werknemers aanwezig zijn. De mediaan van 0,8571 duidt zelfs op een nog groter overwicht. De onafhankelijke variabele GemPV2010 heeft een gemiddelde van 1,1417. Een gemiddeld personeelsverloop van 1,1417 betekent dat er een groter aantal uitgetreden werknemers zijn dan huidige werknemers. Daar de mediaan slechts 0,2000 bedraagt, wordt vermoed dat het gemiddelde ook hier vertekend is door enkele bedrijven met een hoog personeelsverloop. Voor de variabele GemGrootte2010 is er voor het eerst een duidelijk verschil met de descriptieve statistiek van de subgroep Trainingsdummy. Gemiddeld gezien zijn de ondernemingen in de subgroep Trainingsintensiteit groter. Voor GemGrootte2010 uit de subgroep Trainingsdummy en deze uit de subgroep Trainingsintensiteit gelden respectievelijk een gemiddelde van 1,5047 en 2,3674. Het zijn dus vooral de grotere ondernemingen die uiteindelijk effectief
4.1 Beschrijvende statistieken
50
training aanbieden. Tenslotte is er de onafhankelijke variabele GemOR2010. Gemiddeld gezien is slechts in 7% van de bedrijven een OR aanwezig. Hoewel 7% nog steeds laag is, is dit reeds een pak hoger dan het gemiddelde van 2% in de subgroep Trainingsdummy. De onafhankelijke variabelen zijn, analoog aan de onafhankelijke variabelen in de subgroep Trainingsdummy, gewinsorized op het 5% en 95% percentiel. Een overzicht van de grenswaarden per variabele wordt weergegeven in Tabel 4.9. Bijlage B geeft een overzicht van de descriptieve statistieken voor de gewinsorizede onafhankelijke variabelen van de subgroep Trainingsintensiteit.
Tabel 4.9: Winsorizen van de onafhankelijke variabelen (subgroep Trainingsintensiteit).
Gemiddelde
Std. Dev.
Minimum
Maximum
=Gem.-(3*stddev.)
=Gem.+(3*stddev.)
PercMan2010
0,6607
0,3332
-0,3389
1,6603
PercLO2010
0,2571
0,3930
-0,9219
1,4361
PercSO2010
0,5159
0,4146
-0,7279
1,7597
PercHNU2010
0,1706
0,2804
-0,6706
1,0118
PercUO2010
0,0485
0,1415
-0,3760
0,4370
PercOnbep2010
0,9647
0,1138
0,6233
1,3061
PercVol2010
0,7523
0,2869
-0,1084
1,613
GemPV2010
1,1417
8,0552
-23,0239
25,3073
GemGrootte2010
2,3674
1,4283
-1,9175
6,6523
Controlevariabelen De secties, weergegeven aan de hand van industrie dummies, die het sterkst vertegenwoordigd zijn in deze subgroep zijn opnieuw Industrie (17,30265%), Bouwnijverheid (16,86783%) en Groot- en detailhandel; reparatie van auto’s en motorfietsen (27,67074%). Samen zijn deze drie secties goed voor maar liefst 61,84122% van de dataset. De secties Huishoudens als
4.1 Beschrijvende statistieken
51
werkgever; niet-gedifferentieerde productie van goederen en diensten door huishoudens voor eigen gebruik (0%) en Extraterritoriale organisaties en lichamen (0%) zijn dan weer helemaal niet vertegenwoordigd. In Tabel 4.10 wordt de proportionele verdeling van de dataset volgens sectie verduidelijkt.
Tabel 4.10: Proportionele verdeling van de dataset volgens sectie (subgroep Trainingsintensiteit).
Sectie
Proportie in dataset Absoluut aantal
Percentage
A
114
0,85464%
B
12
0,00090%
C
2 308
17,30265%
D
11
0,00082%
E
100
0,74968%
F
2 250
16,86783%
G
3 691
27,67074%
H
934
7,00202%
I
453
3,39606%
J
491
3,68094%
M
1 086
8,14154%
N
678
5,08284%
Q
842
6,31232%
R
106
0,79466%
S
263
1,97166%
T
0
0,00000%
U
0
0,00000%
13 339
100%
Totaal
Ook de controlevariabelen worden, zoals vermeld in Sectie 4.1.2, gewinsorized op het 5% en 95% percentiel. Tabel 4.11 geeft een overzicht van de grenswaarden. Bijlage B geeft dan weer een overzicht van de descriptieve statistieken voor de gewinsorizede controlevariabelen van de subgroep Trainingsintensiteit.
4.2 Regressieanalyse
52
Tabel 4.11: Winsorizen van de controlevariabelen (subgroep Trainingsintensiteit).
Gemiddelde
Std. Dev.
Minimum
Maximum
=Gem.-(3*stddev.)
=Gem.+(3*stddev.)
ROA%2010
7,3558
16,8770
-43,2752
57,9868
Leeftijd2010
2,7533
0,8289
0,2666
5,2400
Groei2010
0,4852
21,285
-63,3968
64,3132
4.2
Regressieanalyse
Na het analyseren van de descriptieve statistieken kan worden overgegaan tot het testen van de hypotheses. Uit Sectie 3.2 werd reeds duidelijk dat zal worden gewerkt met twee regressies. Eerst wordt de logit regressie die zal worden uitgevoerd op de subgroep Trainingsdummy behandeld. Vervolgens wordt de OLS regressie op de subgroep Trainingsintensiteit besproken.
4.2.1
Logit regressie
Zoals reeds vermeld in Sectie 3.2, wordt voor het testen van de a-hypotheses gebruik gemaakt van een logit regressie. Op deze manier wordt gezocht naar de individuele en job- en bedrijfsgerelateerde kenmerken die de beslissing omtrent het al dan niet voorzien van training be¨ınvloeden. De variabelen die worden opgenomen in de regressie betreffen steeds, met uitzondering van de dummyvariabelen, de gewinsorizede variabelen. Een eerste regressie die wordt uitgevoerd bevat enkel de controlevariabelen. Bemerk dat de dummyvariabele voor sectie U niet wordt opgenomen. De reden hiervoor is dat de dataset geen waarnemingen bevat die tot sectie U behoren. Tabel 4.12 geeft weer hoeveel waarnemingen correct werden geclassificeerd. Het model met enkel de controlevariabelen is dus in staat om 79,10% van de ondernemingen correct te classificeren.
4.2 Regressieanalyse
53
Tabel 4.12: Classificatietabel logit regressie met enkel controlevariabelen.
Voorspeld Waargenomen
Totaal % Correct
0
1
% Correct
0
50 430
1
100,00
1
13 336
3
0,00 79,10
Tabel 4.13 geeft een overzicht van de resultaten van de regressie. In de kolom B kunnen de parameterschattingen worden teruggevonden. In de kolom S.E., wat staat voor Standard Error, vinden we de standaardfout van de co¨effici¨ent. De kolommen Wald en df geven respectievelijk de waarde van de teststatistiek en het aantal vrijheidsgraden. De teststatistiek is afkomstig van de Wald test, die de nulhypothese βi = 0 test. De p-waarde, die iets meer zegt over de significantie van de Wald test, is terug te vinden in de kolom Sig. De kolom Exp(B) bevat de exponent van de parameterschatting. Exp(B) wordt ook wel de odds ratio genoemd. De odds ratio maakt het mogelijk om de sterkte of de relatieve grootte van het verband in kaart te brengen. Het doel van deze regressie is echter niet om de co¨effici¨enten te gaan analyseren en interpreteren. Bij deze regressie zijn we vooral ge¨ınteresseerd in de determinatieco¨effici¨ent R2 . Deze R2 is een maat voor de variatie die wordt verklaard door het model. Hoe hoger de R2 van een model, hoe beter. Zowel de Cox & Snell R2 als de Nagelkerke R2 zijn pseudo-R2 ’s. Ze zijn vergelijkbaar met de R2 in een lineaire regressie. Voor de logit regressie met enkel controlevariabelen vinden we een Cox & Snell R2 van 0,028 en een Nagelkerke R2 van 0,043. Volgens deze pseudo-R2 ’s betekent dit dat respectievelijk 2,8% en 4,3% van de variatie in de afhankelijke variabele DummyTRAINING2011 wordt verklaard door de controlevariabelen.
4.2 Regressieanalyse
54
Tabel 4.13: Resultaten van de logit regressie met enkel controlevariabelen.
B
S.E.
Wald
df
Sig.
Exp. B
Intercept
-1,894**
0,047
1653,838
1
0,000
0,150
Sectie A
-1,049**
0,103
103,944
1
0,000
0,350
Sectie B
0,408
0,380
1,149
1
0,284
1,503
Sectie D
0,738
0,392
3,552
1
0,059
2,092
Sectie E
0,187
0,124
2,263
1
0,132
1,206
Sectie F
-0,368**
0,035
113,295
1
0,000
0,692
Sectie G
-0,551**
0,031
318,300
1
0,000
0,576
Sectie H
-0,134**
0,046
8,577
1
0,003
0,875
Sectie I
-1,094**
0,056
382,629
1
0,000
0,335
Sectie J
0,110
0,059
3,462
1
0,063
1,117
Sectie M
-0,383**
0,043
80,836
1
0,000
0,682
Sectie N
-0,193**
0,051
14,408
1
0,000
0,825
Sectie Q
0,214**
0,049
19,072
1
0,000
1,238
Sectie R
-0,850**
0,108
61,812
1
0,000
0,428
Sectie S
-0,556**
0,073
58,452
1
0,000
0,573
Sectie T
-20,294
40192,970
0,000
1
1,000
0,000
ROA%2010
0,001
0,001
3,346
1
0,067
1,001
Leeftijd2010
0,339**
0,013
665,534
1
0,000
1,403
Groei2010
0,075**
0,023
11,005
1
0,001
1,078
Aantal observaties
63 770
Cox & Snell R Square
0,028
Nagelkerke R Square
0,043
** Duidt op significantie op 1% (tweezijdig), m.a.w. p < 0,01.
In een tweede regressie worden ook de onafhankelijke variabelen toegevoegd. Er wordt beoogd om na het toevoegen van de onafhankelijke variabelen een hogere R2 te bekomen. De Cox & Snell R2 en de Nagelkerke R2 , terug te vinden in Tabel 4.15, bedragen respectievelijk 0,137 en 0,213. Deze tonen aan dat, door het toevoegen van de onafhankelijke variabelen, 13,7%
4.2 Regressieanalyse
55
en 21,3% van de variabiliteit in de afhankelijke variabele DummyTRAINING2011 verklaard wordt door het model. Het model is dus verbeterd door het toevoegen van de onafhankelijke variabelen, wat positief is voor dit onderzoek. Dat het model met de onafhankelijke variabelen een beter model is dan dat met enkel de controlevariabelen, blijkt ook uit de classificatietabel die wordt weergegeven in Tabel 4.14. In dit model wordt namelijk 82,3% van de ondernemingen correct geclassificeerd, wat een verbetering is ten opzichte van de 79,10% in het vorige model. Tabel 4.14: Classificatietabel logit regressie.
Voorspeld Waargenomen
0
1
% Correct
0
49 441
990
98,00
1
10 269
3 070
23,00
Totaal % Correct
82,30
Een overzicht van de resultaten van de regressie is terug te vinden in Tabel 4.15. Om na te gaan of de hypotheses al dan niet kunnen worden aanvaard, worden de parameterschattingen hier wel in detail bestudeerd. Om een beter overzicht te krijgen, wordt hier een extra kolom ingevoegd die het verwachte teken weergeeft. Bemerk dat de schattingen voor de controlevariabelen niet worden weergegeven. Ze worden echter wel in de regressie opgenomen. De dummyvariabele voor sectie U wordt echter niet opgenomen. De reden hiervoor is dat de dataset geen waarnemingen bevat die tot sectie U behoren.
Tabel 4.15: Resultaten van de logit regressie.
B
S.E.
Wald
df
Sig.
Exp(B)
Intercept
-2,874**
0,131
484,729
1
0,000
0,056
PercMan2010
0,226**
0,040
31,034
1
0,000
1,253
+
PercSO2010
-0,155**
0,028
31,476
1
0,000
0,856
-
PercHNUO2010
0,773**
0,047
270,176
1
0,000
2,167
+
PercUO2010
1,348**
0,121
124,873
1
0,000
3,851
+
0,020
0,120
0,028
1
0,868
1,020
+
PercOnbep2010
Verwacht
4.2 Regressieanalyse
56
PercVol2010
0,129**
0,045
8,182
1
0,004
1,138
+
GemPV2010
0,010**
0,003
10,734
1
0,001
1,010
-
GemGrootte2010
0,637**
0,010
4017,327
1
0,000
1,890
+
GemOR2010
1,324**
0,110
144,057
1
0,000
3,757
+
Aantal observaties
63 770
Cox & Snell R Square
0,137
Nagelkerke R Square
0,213
Controlevariabelen werden inbegrepen in de regressie. ** Duidt op significantie op 1% (tweezijdig), m.a.w. p < 0,01.
Wat betreft de variabele PercMan2010 is de parameterschatting 0,226. Gezien de Waldtest significant is op het 1% niveau en de parameterschatting positief is, kan worden besloten dat het percentage mannen positief gecorreleerd is met de kans op het voorzien van training. Om het mogelijk te maken de sterkte van het verband uit te drukken, moet worden gekeken naar de odds ratio. De odds ratio van 1,253 betekent dat een stijging van ´e´en eenheid in het percentage mannen, de kans op opleiding vergroot met 25,3%. Dit betekent dat er voldoende bewijs is om hypothese 1a te aanvaarden op 1% significantieniveau. De parameterschattingen voor de variabelen PercSO2010, PercHNUO2010 en PercUO2010 bedragen respectievelijk -0,155, 0,773 en 1,348. Alle drie de parameterschattingen zijn significant op het 1% niveau. Uit de tekens van de parameterschattingen kan worden afgeleid dat het percentage werknemers met een diploma SO negatief gecorreleerd is met de kans op het voorzien van training. De percentages werknemers met een diploma HNUO en werknemers met een diploma UO daarentegen, zijn positief gecorreleerd met de kans op het voorzien van training. Meer bepaald is de kans op het voorzien van training dus hoger in bedrijven die een hoger percentage hoogopgeleide werknemers tewerkstellen. Opnieuw geven de odds ratio’s de sterkte van de verbanden weer. Opmerkelijk zijn de hoge ratio’s voor de variabelen PercHNUO2010 en PercUO2010, die respectievelijk 2,167 en 3,851 bedragen. Uit dit alles kan worden afgeleid dat hypothese 3a kan worden aanvaard op 1% significantieniveau. In tegenstelling tot vorige parameterschattingen, is de parameterschatting voor de variabele PercOnbep2010 niet significant, noch op het 1% niveau, noch op het 5% niveau. Gezien
4.2 Regressieanalyse
57
de parameterschatting dicht bij nul ligt en de odds ratio op zijn beurt niet ver afwijkt van ´e´en, kan geen duidelijk verband worden aangetoond tussen het percentage contracten van onbepaalde duur en de kans op het voorzien van training. Bemerk dat deze resultaten niet significant zijn, waardoor geen besluit kan worden gevormd omtrent hypothese 4a. De variabele PercVol2010 heeft op zijn beurt een parameterschatting van 0,129 die wel opnieuw significant is op het 1% niveau. Uit de odds ratio van 1,138 blijkt dat de kans op het voorzien van training met 13,8% toeneemt wanneer het percentage voltijdse werknemers in de onderneming met ´e´en eenheid toeneemt. Deze resultaten vormen een ondersteuning voor het aanvaarden van hypothese 6a op 1% significantieniveau. Voor de variabele GemPV2010 wordt een parameterschatting van 0,010 gevonden en deze is significant op het 1% niveau. De parameterschatting is licht positief en de odds ratio bedraagt 1,010. Dit wijst op een positief verband tussen het gemiddelde personeelsverloop en de kans op het voorzien van training. De hypothese 7a wordt dan ook niet aanvaard op 1% significantieniveau. De parameterschatting voor de variabele GemGrootte2010 bedraagt 0,637. Ook deze schatting is significant op het 1% niveau. De odds ratio van 1,890 geeft weer dat de kans op het voorzien van training toeneemt met 89% per eenheidsstijging in de gemiddelde grootte. Er is dus een positief verband tussen de ondernemingsgrootte en de kans op het voorzien van training. Hierbij is er voldoende bewijs om hypothese 8a te aanvaarden op 1% significantieniveau. Een laatste variabele is de variabele GemOR2010. Voor GemOR2010 vinden we een parameterschatting van 1,324 die significant is op het 1% niveau. Aangezien de odds ratio 3,757 bedraagt, kan worden besloten dat in ondernemingen waar een OR aanwezig is, de kans op het voorzien van training bijna wordt verviervoudigd. Dit significant positief verband tussen de aanwezigheid van een OR en de kans op het voorzien van training, zorgt ervoor dat hypothese 9a kan worden aanvaard op 1% significantieniveau.
4.2 Regressieanalyse
4.2.2
58
OLS regressie
Zoals reeds vermeld in Sectie 3.2, wordt voor het testen van de b-hypotheses gebruik gemaakt van een OLS regressie. Op deze manier wordt gezocht naar de individuele en job- of bedrijfsgerelateerde kenmerken die de hoeveelheid training die wordt voorzien, be¨ınvloeden. De variabelen die worden opgenomen in de regressie betreffen steeds, met uitzondering van de dummyvariabelen, de gewinsorizede variabelen. De afhankelijke variabele waarmee wordt gewerkt is, zoals reeds uiteengezet in Sectie 3.2, de getransformeerde Intensity2011. Ook voor het transformeren wordt gewerkt met de gewinsorizede Intensity2011. Merk op dat door de transformatie vier waarnemingen verloren gaan. Meer bepaald zijn dit waarnemingen waarbij de gewinsorizede trainingsintensiteit gelijk is aan of groter dan 1. Een trainingsintensiteit gelijk aan 1 zorgt er immers voor dat moet worden gedeeld door nul. Een trainingsintensiteit groter dan 1 zorgt er dan weer voor dat de natuurlijke logaritme van een negatief getal moet worden genomen. Gezien beide acties wiskundig onmogelijk zijn, kan voor deze waarnemingen dan ook geen transformatie worden uitgevoerd. Net zoals bij de logit regressie uit Sectie 4.2.1, is de eerste regressie die wordt uitgevoerd een regressie die enkel de controlevariabelen bevat. Bemerk dat de dummyvariabelen voor secties T en U niet worden opgenomen in deze regressie. Deze secties bevatten immers geen waarnemingen, zoals reeds vermeld in Sectie 4.1.3. Tabellen 4.16, 4.17 en 4.18 geven een overzicht van de resultaten van deze regressie. Ook hier wordt de regressie met enkel controlevariabelen vooral uitgevoerd om een idee te hebben van de R2 die wordt bekomen. Om de R2 beter te kunnen interpreteren, kijken we eerst naar Tabel 4.16. Deze bevat de resultaten van de Analysis of Variance (ANOVA). De ANOVA geeft een indicatie van de zogenaamde model fit, die bepaalt hoe goed het model is. De Total Sum of Squares (TSS) staat voor de som van de kwadratische verschillen tussen de geobserveerde afhankelijke variabelen en het gemiddelde van de afhankelijke variabelen in de dataset. Het doel van de regressie is om deze verschillen te verklaren. De Explained Sum of Squares (ESS) is het deel van de TSS die door het model kan worden verklaard. De Residual Sum of Squares (RSS) is dan het deel van de TSS die niet kan worden verklaard door het opgestelde regressiemodel.
4.2 Regressieanalyse
59
Tabel 4.16: Model fit (ANOVA) voor OLS regressie met enkel controlevariabelen.
Sum of Squares
df
Mean Square
F
Sig.
Explained
0,112
17
0,007
2,470
0,001
Residual
35,657
13 317
0,003
Total
35,769
13 334
De R2 die kan worden teruggevonden in Tabel 4.17 is als volgt berekend: R2 =
ESS T SS .
Deze
regressie heeft een R2 van amper 0,003. Dit betekent dat slechts 0,3% van de variabiliteit in de afhankelijke variabele kan worden verklaard door de controlevariabelen. Tabel 4.17: Samenvatting OLS regressie met enkel controlevariabelen.
R
R Square
Adjusted R Square
Std. Error of the estimate
0,056
0,003
0,002
0,05175
Wat betreft de co¨effici¨enten, weergegeven in Tabel 4.18, merken we op dat slechts vijf co¨effici¨enten significant zijn op het 1% of 5% niveau. Aangezien het doel van deze regressie vooral is om de R2 te vinden, wordt niet verder ingegaan op de resultaten. Tabel 4.18: Co¨effici¨enten OLS regressie met enkel controlevariabelen.
Unstd. Coeff. B
S.E.
Intercept
0,019**
0,002
Sectie A
0,003
0,005
Sectie B
-0,002
Sectie D
Std. Coeff. Beta
t
Sig.
9,409
0,000
0,005
0,573
0,566
0,015
-0,001
-0,150
0,881
0,014
0,016
0,008
0,925
0,355
Sectie E
-0,004
0,005
-0,006
-0,728
0,466
Sectie F
-0,003*
0,002
-0,023
-2,027
0,043
Sectie G
-0,001
0,001
-0,009
-0,742
0,458
Sectie H
-0,005**
0,002
-0,027
-2,724
0,006
Sectie I
-0,003
0,003
-0,009
-0,940
0,347
4.2 Regressieanalyse
60
Sectie J
0,000
0,003
-0,001
-0,104
0,917
Sectie M
0,001
0,002
0,008
0,748
0,455
Sectie N
0,003
0,002
0,012
1,209
0,227
Sectie Q
-0,002
0,002
-0,009
-0,926
0,354
Sectie R
-0,006
0,005
-0,011
-1,226
0,220
Sectie S
0,009**
0,003
0,025
2,804
0,005
ROA%2010
1,519E-5
0,000
0,004
0,432
0,666
Leeftijd2010
-0,001*
0,001
-0,022
-2,501
0,012
0,000
0,000
0,009
1,077
0,281
Groei2010
** Duidt op significantie op 1% (tweezijdig), m.a.w. p < 0,01 * Duidt op significantie op 5% (tweezijdig), m.a.w. p < 0,05 In een tweede regressie worden ook de onafhankelijke variabelen toegevoegd. Een overzicht van de resultaten is terug te vinden in de Tabellen 4.19, 4.20 en 4.21. Er wordt beoogd om na het toevoegen van de onafhankelijke variabelen een hogere R2 te bekomen. Opnieuw wordt eerst gekeken naar de ANOVA. Dit model verklaart 0,935 van de 35,769 TSS. Dit betreft een verbetering ten opzichte van de 0,112 uit het model met enkel de controlevariabelen. Het model is dus verbeterd door het toevoegen van de onafhankelijke variabelen, wat positief is voor dit onderzoek. Tabel 4.19: Model fit (ANOVA) voor OLS regressie.
Sum of Squares
df
Mean Square
F
Sig.
Explained
0,935
26
0,036
13,739
0,000
Residual
34,834
13 308
0,003
Total
35,769
13 334
De R2 die op basis van deze ESS en TSS wordt berekend, bedraagt 0,026. Dit betekent dat in dit model 2,6% van de variatie in de afhankelijke variabele wordt verklaard door de onafhankelijke variabelen en de controlevariabelen. Ook uit de R2 is dus verbetering ten opzichte van het vorig model te merken. Een R2 van 0,026 is echter nog steeds aan de lage kant.
4.2 Regressieanalyse
61
Tabel 4.20: Samenvatting OLS regressie.
R
R2
Adjusted R2
Std. Error of the estimate
Durbin-Watson
0,162
0,026
0,024
0,05116
0,141
De resultaten met betrekking tot de co¨effici¨enten zijn terug te vinden in Tabel 4.21. In de kolom B vinden we de parameterschattingen terug. In de kolom S.E. is de bijhorende standaardfout te vinden. Beide betreffen niet-gestandaardiseerde co¨effici¨enten. De gestandaardiseerde co¨effici¨enten zijn terug te vinden in kolom Beta. Deze geven het effect van de variabelen op de afhankelijke variabele weer indien elke variabele op dezelfde schaal zou zijn gemeten. In tegenstelling tot de niet-gestandaardiseerde co¨effici¨enten, kunnen de gestandaardiseerde co¨effici¨enten met elkaar worden vergeleken. In de kolom t vinden we de teststatistiek van de t-test. Deze test de hypothese βi = 0. De p-waarde, die iets meer zegt over de significantie van de t-test, is terug te vinden in de kolom Sig. Een laatste kolom die wordt toegevoegd, geeft het verwachte teken nog eens weer. Bemerk dat de parameterschattingen voor de controlevariabelen niet worden weergegeven. Deze worden echter wel opgenomen in de regressie. De dummyvariabelen voor secties T en U worden echter niet opgenomen. De reden hiervoor is dat de dataset geen waarnemingen bevat die tot secties T en U behoren. Voor het uitvoeren van een OLS regressie dienen een aantal voorwaarden voldaan te zijn. Een overzicht van de controle van deze voorwaarden is terug te vinden in Bijlage C. Tabel 4.21: Co¨effici¨enten OLS regressie.
Unstd. Coeff. B
S.E.
0,095**
0,006
0,000
0,002
PercSO2010
0,009**
PercHNUO2010
Std. Coeff. t
Sig.
15,203
0,000
0,003
0,244
0,807
+
0,001
0,073
7,574
0,000
-
0,008**
0,002
0,044
4,296
0,000
+
PercUO2010
0,030**
0,005
0,061
6,437
0,000
+
PercOnbep2010
-0,084*
0,006
-0,128
-14,321
0,000
+
PercVol2010
0,003
0,002
0,019
1,611
0,107
+
GemPV2010
0,000*
0,000
-0,022
-2,303
0,021
-
Intercept PercMan2010
Beta
Verwacht
4.2 Regressieanalyse
GemGrootte2010 GemOR2010
62
-0,003**
0,000
-0,070
-6,236
0,000
+
0,006
0,002
0,027
2,732
0,006
+
Controlevariabelen werden inbegrepen in de regressie. ** Duidt op significantie op 1% (tweezijdig), m.a.w. p < 0,01 * Duidt op significantie op 5% (tweezijdig), m.a.w. p < 0,05 Wat betreft de variabele PercMan2010 is de parameterschatting die wordt gevonden gelijk aan 0,000. Dit zou betekenen dat er geen verband is tussen het percentage mannen en de hoeveelheid training die wordt aangeboden. Gezien de t-test echter niet significant is, kunnen geen conclusies worden getrokken. Er is dan ook onvoldoende bewijs om uitspraken te doen over hypothese 1b op 1% significantieniveau. De parameterschattingen voor de variabelen PercSO2010, PercHNUO2010 en PercUO2010 bedragen respectievelijk 0,009, 0,008 en 0,030. Deze parameterschattingen zijn bovendien significant op 1% niveau. Een parameterschatting van 0,009 betekent dat de trainingsintensiteit met 0,9 procentpunt stijgt wanneer het percentage werknemers met een diploma SO met ´e´en eenheid stijgt. Dit resultaat vormt bewijs voor een positief verband tussen het percentage laagopgeleide werknemers en de hoeveelheid training, waardoor hypothese 3b kan worden verworpen op 1% significantieniveau. Parameterschattingen van 0,008 en 0,030 betekenen dat de trainingsintensiteit respectievelijk met 0,8 procentpunt en 3 procentpunt stijgt wanneer het percentage werknemers met een diploma HNUO en diploma UO met ´e´en eenheid stijgt. Dit resultaat vormt bewijs voor een positief verband tussen het percentage hoogopgeleide werknemers en de hoeveelheid training, waardoor hypothese 3b kan worden aanvaard op 1% significantieniveau. Gezien alle drie de t-testen significant zijn, is er dus bewijs voor zowel het verwerpen als voor het aanvaarden van hypothese 3b op 1% significantieniveau. De variabele PercOnbep2010 heeft een parameterschatting van -0,084. Deze significante co¨effici¨ent duidt op een negatieve relatie tussen het percentage werknemers tewerkgesteld met een contract van onbepaalde duur en de trainingsintensiteit. Er is dan ook geen bewijs om hypothese 5b te aanvaarden op 1% significantieniveau. Volgens de gevonden parameterschatting van 0,003 heeft de variabele PercVol2010 een licht positief verband met Intensity2011, wat doet vermoeden dat hypothese 6b kan worden aan-
4.2 Regressieanalyse
63
vaard. Deze co¨effici¨ent is echter niet significant. Er is dan ook onvoldoende bewijs om een uitspraak te doen over hypothese 6b op 1% significantieniveau. De variabele GemPV2010 heeft een parameterschatting van 0,000. Deze is significant op het 5% niveau. Dit betekent dat het personeelsverloop in een onderneming geen invloed heeft op de hoeveelheid training die wordt aangeboden. Hypothese 7b kan dus niet worden aanvaard op 5% significantieniveau. De parameterschatting voor de variabele GemGrootte2010 bedraagt -0,003 en is significant op het 1% niveau. Concreet betekent deze parameterschatting dat de trainingsintensiteit daalt met 0,3 procentpunt wanneer de grootte met ´e´en eenheid toeneemt. Gezien het negatieve verband dat wordt gevonden, kan hypothese 8b niet worden aanvaard op 1% significantieniveau. Een laatste parameterschatting is deze voor de variabele GemOR2010 en bedraagt 0,006. Deze co¨effici¨ent is significant op het 1% niveau. De aanwezigheid van een OR verhoogt dus de hoeveelheid training die wordt aangeboden. Hypothese 9b kan dan ook worden aanvaard op 1% significantieniveau.
ALGEMEEN BESLUIT
65
Hoofdstuk 5
Algemeen besluit De doelstelling van deze masterproef was om de determinanten van investeringen in werknemersopleiding bij Vlaamse KMO’s te bepalen. Concreet werden in deze studie de individuele en job- en bedrijfsgerelateerde determinanten achterhaald die mogelijks de beslissing omtrent het aanbieden van opleiding be¨ınvloeden. Tevens werd bepaald welke factoren een invloed hebben op de mate waarin dan effectief opleiding wordt aangeboden, meer bepaald met welke intensiteit. Aan de hand van twee soorten hypotheses werd de doelstelling van deze masterproef nagestreefd. Op basis van het eerste gedeelte van de hypotheses, de a-hypotheses, werd achterhaald welke individuele en job- en bedrijfsgerelateerde kenmerken aan de basis liggen van de beslissing omtrent investering in opleiding. Op basis van het tweede gedeelte van de hypotheses, de b-hypotheses, werd achterhaald welke individuele en job- en bedrijfsgerelateerde kenmerken aan de basis liggen van de hoeveelheid training die wordt aangeboden. Voor het testen van de hypotheses werd gebruik gemaakt van de Bel-First database van Bureau van Dijk. Meer bepaald werden de gegevens uit de sociale balans gebruikt. De onderzoeksmethodes die werden gehanteerd voor het testen van de deelhypotheses zijn respectievelijk een logistisch regressie en een OLS regressie. Concreet vonden we dat de kans op investeringen in opleiding groter wordt naarmate een hoger percentage mannelijke werknemers aanwezig zijn in het bedrijf. Tevens zorgt een groter aandeel hoogopgeleide werknemers voor een stijging in de kans op investering. De kans op investering in opleiding stijgt ook naarmate het percentage voltijdse werknemers stijgt en de onderneming groter wordt. Ook de aanwezigheid van een ondernemingsraad heeft een positief
ALGEMEEN BESLUIT
66
effect op de kans op investering in opleiding. In tegenstelling tot de verwachtingen, is ook het personeelsverloop positief gerelateerd met de kans op opleiding. Een mogelijke verklaring voor dit onverwachte verband is het feit dat nieuwe werknemers bij aanwerving nood hebben aan bedrijfsspecifieke opleiding. Verder moeten ze betrokken worden bij de cultuur van de onderneming. Het tweede luik van deze masterproef onderzocht de verklarende factoren voor de mate waarin training effectief wordt voorzien. Zo vonden we, tegen de verwachtingen in, dat het percentage contracten van onbepaalde duur een negatieve invloed heeft op de trainingsintensiteit. Dit zou betekenen dat er dus meer training wordt aangeboden naarmate er proportioneel meer contracten van bepaalde duur zijn. Dit kan opnieuw worden verklaard door het feit dat nieuwe werknemers bij aanwerving nood hebben aan bedrijfsspecifieke opleiding en moeten worden betrokken bij de bedrijfscultuur. In tegenstelling tot de veronderstellingen vonden we tevens dat het personeelsverloop geen invloed heeft op de hoeveelheid training die wordt aangeboden. Ook dit onverwachte resultaat zou opnieuw kunnen worden verklaard door het feit dat nieuwe werknemers nood hebben aan bedrijfsspecifieke opleiding. De ondernemingsgrootte op zijn beurt, heeft een negatief verband met de trainingsintensiteit. Een mogelijke verklaring hiervoor is het feit dat er in kleinere ondernemingen minder werknemers zijn, waardoor er per werknemer een grotere hoeveelheid training kan worden aangeboden. Zoals verwacht heeft de aanwezigheid van een ondernemingsraad een positief effect op de trainingsintensiteit. Wat betreft de relatie tussen opleidingsniveau en de trainingsintensiteit, vonden we geen ´e´enduidige resultaten. Er wordt dus een bepaalde hoeveelheid training gegeven bij alle opleidingsniveaus, maar deze neemt niet toe naarmate de werknemers beter opgeleid zijn. Een mogelijke verklaring hiervoor kan zijn dat er heel wat bedrijven gewoonweg geen hoogopgeleide werknemers tewerkstellen, zodat logischerwijs opleiding enkel naar laaggeschoolden gaat. Deze masterproef vormt in het bijzonder een bijdrage tot de bestaande literatuur doordat het onderzoek werd uitgevoerd op basis van data uit Bel-First in plaats van data uit een enquˆete. Op deze manier kon gebruik worden gemaakt van zogenaamde hard data, die een pak betrouwbaarder is dan data die uit een enquˆete wordt gehaald. Jaarrekeningen worden namelijk gecontroleerd door auditors, terwijl respondenten van een enquˆete vaak de neiging hebben om in te vullen wat ze verwachten dat de enquˆeteur wenst te lezen.
ALGEMEEN BESLUIT
67
Als beperking voor dit onderzoek wordt enerzijds aangehaald dat er geen onderscheid werd gemaakt tussen bedrijfsspecifieke en algemene opleiding. Verder werden in deze masterproef de determinanten onderverdeeld in twee categorie¨en, namelijk individuele en job- en bedrijfsgerelateerde kenmerken. Let wel, de job- en bedrijfsgerelateerde kenmerken werden samengenomen als ´e´en categorie. Dit in tegenstelling tot de werken van Jacobs, Lukens & Useem (1996), Harris (1999), Sutherland (2004) en Tharenou (1997) [2, 3, 4, 5]. Zij beschouwen de job- en bedrijfsgerelateerde kenmerken immers als twee afzonderlijke categorie¨en. Voorts zijn er enkele suggesties voor toekomstig onderzoek. Zo zou het interessant kunnen zijn om te weten wat het effect is van training op de performantie. Presteren ondernemingen die voorzien in opleiding wel degelijk beter dan hun tegenhangers die dit niet doen? Er werd bewust gekozen om de gegevens voor de onafhankelijke en afhankelijke variabelen respectievelijk uit de jaren 2010 en 2011 te halen, om zo ruimte te cre¨eren voor het verder zetten van het onderzoek. Dit om de mogelijkheid te kunnen bieden de performantie te berekenen op basis van gegevens uit 2012. Aangezien bij de start van deze masterproef in september 2013 enkel de gegevens tot en met 2012 beschikbaar waren in Bel-First, werd bewust geopteerd voor de jaren 2010 en 2011. Verder willen we erop wijzen dat enkel overeenkomsten voor onbepaalde en bepaalde tijd werden opgenomen als onafhankelijke variabelen. In de sociale balans worden er nog andere mogelijke onafhankelijke variabelen vermeld die in deze masterproef niet werden opgenomen, namelijk overeenkomst voor een duidelijk omschreven werk en vervangingsovereenkomst. Ook hier is dus ruimte voor verder onderzoek.
BIBLIOGRAFIE
I
Bibliografie [1]
Van de Wiele P. The impact of training participation and training costs on firm pro” ductivity in Belgium”. In: The International Journal of Human Resource Management 21.4 (2010), p. 582–599.
[2]
Jacobs J. A., Lukens M. en Useem M. Organizational, job, and individual determinants ” of workplace training: evidence from the National Organizations Survey”. In: Social Science Quarterly 77.1 (1996), p. 159–176.
[3]
Harris R. ID. The determinants of work-related training in Britain in 1995 and the ” implications of employer size”. In: Applied Economics 31.4 (1999), p. 451–463.
[4]
Sutherland J. The Determinants Of Training : Evidence From The 1998 Workplace and ” Employee Relations Survey”. In: Economic Issues Journal Articles 9.1 (2004), p. 24–38.
[5]
Tharenou P. en Monash University. Department of Management. Determinants of Participation in Training and Development. Working paper series (Monash University. Dept. of Management). Monash University. Faculty of Business en Economics, 1997.
[6]
Mincer J. Job Training, Wage Growth, and Labor Turnover. Working Paper 2690. National Bureau of Economic Research, 1988.
[7]
Becker G. S. Investment in Human Capital: A Theoretical Analysis”. In: Journal of ” Political Economy 70 (1962), p. 9.
[8]
Grund C. en Martin J. Determinants of further training–evidence for Germany”. In: ” The International Journal of Human Resource Management 23.17 (2012), p. 3536–3558.
[9]
Greenhalgh C. en Stewart M. The effects and determinants of training*”. In: Oxford ” Bulletin of Economics and Statistics 49.2 (1987), p. 171–190.
BIBLIOGRAFIE
[10]
II
Frazis H., Gittleman M. en Joyce M. Determinants of training: An analysis using both ” employer and employee characteristics”. In: Key Bridge Marriott Hotel, Arlington VA, US Department of Commerce, Washington, DC. Citeseer. 1998.
[11]
Auer P. en Cazes S. The resilience of the long-term employment relationship: Evidence ” from the industrialized countries”. In: International Labour Review 139.4 (2000), p. 379– 408.
[12]
Green F. The determinants of training of male and female employees in Britain*”. In: ” Oxford Bulletin of Economics and Statistics 55.1 (1993), p. 103–122.
[13]
Greenhalgh C. en Mavrotas G. The Role of Career Aspirations and Financial Cons” traints in Individual Access to Vocational Training”. In: Oxford Economic Papers 46.4 (1994), p. 579–604.
[14]
Hansson B. Company-based determinants of training and the impact of training on ” company performance: Results from an international HRM survey”. In: Personnel Review 36.2 (2007), p. 311–331.
[15]
Booth A. L., Francesconi M. en Zoega G. Unions, Work-Related Training, and Wages: Evidence for British Men. IZA Discussion Papers 737. Institute for the Study of Labor (IZA), 2003.
[16] Aanbeveling van de commissie van 6 mei 2003 betreffende de definitie van kleine, middelgrote en micro-ondernemingen. Publicatieblad van de Europese Unie. 2003. [17] Basic Econometrics (Sie). McGraw-Hill Education (India) Pvt Limited, 2007. [18]
Klein A. Economic Determinants of Audit Committee Independence”. In: The Ac” counting Review 77.2 (2002), pp. 435–452. issn: 00014826.
[19]
Van Dijk R. Corporate finance policy and equity investment: panel data analyses”. ” Ph.D. dissertation. Erasmus Universiteit Amsterdam, 1997.
CORRELATIEMATRIXEN
A.1
Bijlage A
Correlatiematrixen Deze bijlage geeft een overzicht van de kengetallen en de correlatiematrixen voor beide personeelskosten en voor beide ROA’s. Tabel A.1: Kengetallen voor beide personeelskosten.
Gemiddelde
Std. Dev.
N
Personeelskosten 2011 SB
528 148,98
1 332 165,87
63 770
Personeelskosten 2011 RR
539 038,39
1 420 472,74
63 770
Tabel A.2: Correlatie tussen beide personeelskosten.
Pers.kosten 2011 SB
Pearson Corr.
Pers.kost 2011 SB
Pers.kost 2011 RR
1
0,957**
Sig. (2-tailed)
Pers.kosten 2011 RR
0,00
N
63 770
63 770
Pearson Corr.
0,957**
1
Sig. (2-tailed)
0,00
0
63 770
63 770
N
** Duidt op significantie op 1% niveau (tweezijdig), m.a.w. p < 0,01.
CORRELATIEMATRIXEN
A.2
Tabel A.3: Kengetallen voor beide ROA’s.
Gemiddelde
Std. Dev.
N
ROA%2010
5,95%
22,53%
63 770
ROA Bel-First 2010
7,25%
22,30%
63 770
Tabel A.4: Correlatie tussen beide ROA’s.
ROA 2010
Pearson Correlatie
ROA%2010
ROA Bel-First 2010
1
0,894**
Sig. (2-tailed)
ROA Bel-First 2010
0,000
N
63 770
63 770
Pearson Correlatie
0,894**
1
Sig. (2-tailed)
0,000
0
N
63 770
63 770
** Duidt op significantie op 1% niveau (tweezijdig), m.a.w. p < 0,01.
BESCHRIJVENDE STATISTIEKEN GEWINSORIZEDE VARIABELEN
B.1
Bijlage B
Beschrijvende statistieken gewinsorizede variabelen Deze bijlage geeft een overzicht van de descriptieve statistieken van de gewinsorizede variabelen voor de subgroep Trainingsdummy en de subgroep Trainingsintensiteit. Tabel B.1: Descriptieve statistieken van de gewinsorizede variabelen (subgroep Trainingsdummy).
Gem.
Med.
Std. Afw.
Min.
Max.
WinsorPercMan2010
0,6168
0,7500
0,3854
0,0000
1,0000
WinsorPercLO2010
0,2818
0,0000
0,4128
0,0000
1,5600
WinsorPercSO2010
0,5656
0,7059
0,4369
0,0000
1,8800
WinsorPercHNUO2010
0,1104
0,0000
0,2444
0,0000
0,9000
WinsorPercUO2010
0,0233
0,0000
0,0848
0,0000
0,4300
WinsorPercOnbep2010
0,9665
1,0000
0,1002
0,5400
1,0000
WinsorPercVol2010
0,6886
0,8333
0,3524
0,0000
1,0000
WinsorGemPV2010
1,0746
0,1892
4,4308
0,0000
37,5500
WinsorGemGrootte2010
1,5041
1,3863
1,2216
0,0000
5,1700
WinsorROA%2010
7,3832
6,1200
14,6944
-58,2600
72,3900
WinsorLeeftijd2010
2,5779
2,7081
0,8249
0,0000
4,9300
WinsorGroei2010
0,2249
0,1032
0,4375
0,1000
5,0500
Onafh. variabelen
Controlevariabelen
BESCHRIJVENDE STATISTIEKEN GEWINSORIZEDE VARIABELEN
B.2
Tabel B.2: Descriptieve statistieken van de gewinsorizede variabelen (subgroep Trainingsintensiteit).
Gem.
Med.
Std. Afw.
Min.
Max.
WinsorPercMan2010
0,6607
0,7681
0,3332
0,0000
1,0000
WinsorPercLO2010
0,2571
0,0000
0,3930
0,0000
1,5000
WinsorPercSO2010
0,5159
0,5506
0,4146
0,0000
1,0000
WinsorPercHNUO2010
0,1652
0,0000
0,2649
0,0000
0,9000
WinsorPercUO2010
0,0401
0,0000
0,1008
0,0000
0,4300
WinsorPercOnbep2010
0,9689
1,0000
0,0878
0,5400
1,0000
WinsorPercVol2010
0,7523
0,8571
0,2869
0,0000
1,0000
WinsorGemPV2010
0,8264
0,2000
3,6502
0,0000
37,5500
WinsorGemGrootte2010
2,3650
2,3026
1,4234
0,0000
5,1700
WinsorROA%2010
7,4769
5,9100
13,5398
-58,2600
72,3900
WinsorLeeftijd2010
2,7533
2,9444
0,8289
0,0000
4,9300
WinsorGroei2010
0,2225
0,1032
0,4299
0,1000
5,0500
Onafh. variabelen
Controlevariabelen
VOORWAARDEN OLS REGRESSIE
C.1
Bijlage C
Voorwaarden OLS regressie Voor kan worden overgegaan tot de interpretatie van de resultaten, dienen eerst de voorwaarden voor het uitvoeren van een OLS te worden gecontroleerd. Een eerste voorwaarde eist dat het model correct gespecificeerd is. Meer bepaald betekent dit dat de verwachte waarde van de storingsterm of residual gelijk is aan nul. In wiskundige symbolen wordt deze voorwaarde als volgt uitgedrukt: E[i ] = 0. Deze voorwaarde kan worden getest door de gestandaardiseerde storingstermen of residuen (standardized residuals) te plotten in functie van de gestandaardiseerde verwachte waarden voor de afhankelijke variabele (standardized predicted values). Deze plot wordt weergegeven in Figuur C.1. Uit deze scatterplot kan worden afgeleid dat de gestandaardiseerde storingstermen of residuen zich inderdaad rond nul bevinden. De eerste voorwaarde blijkt dus voldaan. Een tweede voorwaarde betreft homoscedasticiteit. Homoscedasticiteit betekent dat de variantie van de residuen onafhankelijk is van de afhankelijke variabele en dus constant is. In wiskundige symbolen wordt dat: σ 2 {i } = σ 2 . Ook het bestaan van homoscedasticiteit kan worden nagegaan op basis van de scatterplot in Figuur C.1. Indien de variantie constant is, zullen de waarnemingen ongeveer een gelijke spreiding hebben over de volledige scatterplot. We zien dat rond de waarden 0 en 4 voor de standardized predicted value, de dots verder uit elkaar liggen en dus een grotere spreiding hebben. Dit zou duiden op lichte heteroscedasticiteit. Aangezien de gebruikte dataset meer dan 13 000 waarnemingen bevat en die grotere spreiding slechts een paar dots betreft, wordt er geen probleem gezien in de mogelijke lichte heteroscedasticiteit. Een derde voorwaarde eist dat de residuen voor de verschillende waarnemingen onafhankelijk zijn (σ{i , j } = 0). Aangezien niet wordt
VOORWAARDEN OLS REGRESSIE
C.2
Figuur C.1: Scatterplot standardized residual i.f.v. standardized predicted value.
gewerkt met tijdreeksen (longitudinal data) of met verschillende groepen van ondernemingen, wordt verondersteld dat deze voorwaarde is voldaan. Om deze voorwaarde echter statistisch te testen, wordt gebruik gemaakt van de Durbin-Watson statistiek. Deze statistiek levert steeds waarden tussen 0 en 4. In dit regressiemodel vinden we een Durbin-Watson statistiek van 0,141. Aangezien deze dicht bij 0 ligt, zou dit betekenen dat de residuen in waarde dicht bij elkaar liggen en dus positief zouden gecorreleerd zijn. Een laatste voorwaarde voor het uitvoeren van een OLS regressie betreft de normale verdeling van de residuen. Het al dan niet normaal verdeeld zijn kan worden nagegaan in twee grafieken. Deze zijn terug te vinden in Figuren C.2(a) en C.2(b). Vooral Figuur C.2(a) roept vragen op. Wanneer de residuen normaal verdeeld zijn, volgt de dikke lijn de fijne lijn. Hier is dit absoluut niet het geval. Dit geeft aan dat de residuen mogelijks niet normaal verdeeld zijn. Een kijk naar de descriptieve statistieken leert ons dat de gestandaardiseerde residu een kurtosis en scheefheid heeft van respectievelijk 1 482,354 en 29,728. Voor een normaal verdeelde variabele zijn beide waarden (ongeveer) gelijk aan nul. Het vermoeden van niet normaal verdeeld zijn stijgt hierdoor. Om dit vermoeden statistisch te controleren, wordt gebruik gemaakt van de test of normality. Tabel C.1 geeft een overzicht
VOORWAARDEN OLS REGRESSIE
C.3
(a) Normal P-P plot van de residuen.
(b) Histogram van de residuen.
Figuur C.2: Normaal verdeling residuen.
van de resultaten. Gezien de test significant is, wordt het vermoeden van niet normaal verdeeld zijn bevestigd. Het feit dat deze voorwaarde niet voldaan is, levert in dit onderzoek echter geen grote problemen op. Het niet normaal verdeeld zijn van de residuen heeft namelijk geen invloed op de geschatte co¨effici¨enten of de variantie ervan. Het heeft wel een invloed op de verdeling van die co¨effici¨enten. Deze zullen namelijk niet normaal verdeeld zijn. Dit is op zijn beurt enkel van belang voor de hypothesetest in de OLS waarbij de hypothese βi = 0 wordt getest, meer bepaald de t-test. We wensen echter te benadrukken dat de verdeling van de co¨effici¨enten asymptotisch gezien neigt naar een normale verdeling. Gezien de dataset meer dan 13 000 waarnemingen bevat, kan worden gesteld dat dit asymptotisch gedrag opgaat. Tabel C.1: Normaliteitstest van de gestandaardiseerde residuen.
Kolmogorov-Smirnov
Standardized Residual
Statistic
df
Sig.
0,290
13 335
0,000