Naamsestraat 61 | bus 3550 B-3000 Leuven | BELGIUM Tel. 032 16 326661
[email protected]
VIVES
Briefings
2015 28 september
Dialecten en arbeidsmobiliteit Damiaan Persyn
[email protected]
Het Vlaams Instituut voor Economie en Samenleving, VIVES, is een economisch onderzoekscentrum dat via fundamenteel en toegepast onderzoek wil bijdragen tot het maatschappelijk debat inzake de economische en maatschappelijke ontwikkeling van regio’s, in het bijzonder van Vlaanderen. VIVES is als onderzoekscentrum wetenschappelijk en juridisch geïntegreerd binnen de KU Leuven en werkt ook samen met research fellows uit andere universiteiten.
Dialecten en arbeidsmobiliteit∗ Damiaan Persyn 28 September 2015
Samenvatting We bekijken dialectverschillen tussen Vlaamse gemeenten en het verband met pendelstromen. Er is minder pendel tussen gemeenten met sterke dialectverschillen, zelfs als we controleren voor pendeltijd en economische omgevingsfactoren. Dialectverschillen zijn waarschijnlijk indicatoren voor lokale cultuurverschillen of netwerkeffecten die arbeidsmobiliteit afremmen. De resultaten wijzen op een bovengrens aan hoeveel extra arbeidsmobiliteit kan verwacht worden van puur economische ingrepen zoals infrastructuurwerken.
1
Inleiding
Deze Vives Briefing bekijkt het verband tussen dialecten en het woon-werkverkeer in Vlaanderen. Vlaanderen kent relatief grote dialectverschillen op een klein grondgebied. Verschillen in uitspraak kunnen een extra kost of last betekenen op de werkvloer. We kunnen vermoeden dat zowel de werkgever als werknemer daarom soms zullen kiezen voor een beter verstaanbare partner. We vinden inderdaad in een statistische analyse dat tussen gemeenten met grote dialectverschillen minder pendel voorkomt, zelfs wanneer we zorgvuldig controleren voor transportkosten en economische omgevingsfactoren. Het is ∗ Ik ben Martijn Wieling dankbaar voor het ter beschikking stellen van zijn gegevensbank met dialectafstanden. Mijn dank gaat ook uit naar Jo Reynaerts en Martien Wieling voor nuttige opmerkingen en suggesties bij een eerdere versie van deze Briefing.
1
echter waarschijnlijk dat dit effect dieperliggende oorzaken heeft dan louter de praktische last van stroeve mondelinge communicatie. Dialecten vormen zich over vele honderden jaren onder invloed van bijvoorbeeld historische topologische kenmerken (rivieren, moeilijk doordringbare bossen), migratiebewegingen, handelsroutes, of geopolitieke factoren (denken we aan de verschillende hertogdommen en graafschappen). Deze factoren zijn echter ook bepalend voor het vormen van socio-economische verbanden, culturele uitwisseling, en dus ook het ontstaan van lokale culturen. De taal en ook het dialect van een persoon is dan ook ten dele een indicator voor het lidmaatschap van een bepaalde lokale cultuurgemeenschap of netwerk. Dat blijft het geval ook al is de onderliggende oorzaak voor het ontstaan van het lokale dialect of netwerk reeds lang verdwenen (bv door veranderde geopolitiek, transportinfrastructuur of handelspatronen). Er zijn verschillende redenen denkbaar waarom mensen weigerachtig staan om culturele barri`eres te doorkruisen, zelfs indien het oppervlakkig gezien slechts gaat om werken in een regio met een ander dialect (of iemand aanwerven uit een regio met een ander dialect). Buiten drijfveren als xenofobie zijn meer economische en rationele factoren bijvoorbeeld het probleem van beperkte kennisoverdracht over de netwerkgrenzen heen. Men komt misschien niet te weten dat een interessante job zich aanbiedt in een nabije gemeente indien het netwerk van de ge¨ınteresseerde persoon niet of weinig overlapt met het netwerk van de werknemers van het bedrijf dat een vacature aanbiedt. Ook reputatie is belangrijker binnen het eigen netwerk eerder dan erbuiten, waardoor er minder vertrouwen kan bestaan tussen partners uit verschillende netwerken, en economische relaties moeilijker tot stand komen. Cultuur en cultuurverschillen zijn in het algemeen belangrijke verklarende factoren van economische fenomenen. Zo voeren landen met een gemeenschappelijke taal of een gedeelde geschiedenis gemiddeld gezien merkelijk meer handel met elkaar. Een ander voorbeeld dat dichter aanleunt bij deze studie is de vaststelling dat historische dialecten (en de culturele factoren erachter) in
2
Duitsland vandaag nog migratiestromen be¨ınvloeden (zie Falck et al., 2012).
2 2.1
Dialectafstand De definitie en berekening van dialectafstand
De gegevens over verschillen in uitspraak die we in deze Vives Briefing gebruiken zijn ter beschikking gesteld door Martijn Wieling. De studie van Wieling et al. (2007) baseert zich op haar beurt op de gegevens van het Goeman-Taeldeman-Van Reenen-Project (zie Goeman and Taeldeman, 1996). Het GTRP bevat de fonetisch getranscribeerde uitspraak van 1876 woorden in 613 gemeenten in Vlaanderen en Nederland. In deze studie gebruiken we enkel de 189 Vlaamse locaties en uitspraken uit het GTRP, en een selectie van 562 woorden (zie Wieling et al., 2007). Om het verschil in uitspraak tussen 2 gebieden (de ‘dialectafstand’) te bepalen, gebruiken we de Levenshtein methode. Dit is een bewerkingsafstand tussen twee tekenreeksen waarbij het minimale aantal bewerkingen (toevoegingen/weglatingen/vervangingen) wordt opgeteld dat nodig is om de ene tekenreeks te veranderen in de andere. De Levenshtein-afstand wordt vaak gebruikt bij informaticatoepassingen zoals automatische spellingscorrectie. Nemen we als voorbeeld het woord aarde en de uitspraak in de GTRP gegevensbank voor de gemeentes Veurne in West-Vlaanderen (ærd@) en Wetteren in Oost-Vlaanderen (e@rd@): æ
e
@
r r
1
1
0
d @ d @ 0
0
Met 1 substitutiebewerking en 1 toevoeging geeft dit een Levenshtein-afstand van 2. Berekenen we de afstand tussen de uitspraak in Veurne (ærd@) en de uitspraak in het Limburgse Lauw (jat), dan krijgen we een afstand van 4. 3
In een aanpassing van het standaard Levenshtein-algoritme wijzen Wieling et al. (2007) meer ‘strafpunten’ toe voor de vervanging van een klinker door een medeklinker of omgekeerd, om zo bijvoorbeeld rekening te houden met het feit dat een ‘e’ meer aanleunt bij een ‘a’ dan bij pakweg een ‘p’. Wanneer toegepast over een grote verzameling woorden correleren deze Levenshteinafstanden sterk met gesofisticeerdere methodes die rekening houden met verschillende klankkarakteristieken. Om langere woorden niet te laten doorwegen in de resultaten worden de gebruikte Levenshtein-afstanden gedeeld door de lengte van het betreffende woord. De gemiddelde dialectafstand in onze dataset bedraagt 0.53. Dit weerspiegelt echter ook dialectverschillen tussen afgelegen landelijke gemeenten waartussen geen pendel bestaat. Wegen we de dialectverschillen met de hoeveelheid pendel, dan bedraagt het gemiddelde 0.23, met een standaardafwijking van 0.2. Vlaanderen bevat 308 gemeenten, en dus 308 × 308 = 94864 gemeenteparen. Het GTRP bevat dialectgegevens voor 189 gemeenten en laat dus slechts toe om de dialectafstand te berekenen tussen 189 × 189 = 35721 van deze gemeenteparen. Voor de ontbrekende gemeenteparen wordt daarom de Levenshteinafstand genomen van het meest nabijgelegen paar van gemeenten waarvoor de gegevens wel beschikbaar zijn. We verwachten geen grote vertekening van de resultaten door deze benadering, aangezien voor 75 percent van de gevallen de dichtstbijzijnde gemeente met taalinformatie zich op minder dan 5 kilometer bevindt. Voor geen van de gevallen is deze afstand groter dan 10km.
2.2
Dialectgrenzen en -clusters
De matrix met dialectafstanden waarover we beschikken vat alle verschillen in uitspraak tussen 2 gemeenten samen in 1 enkel getal. Daardoor kunnen de soms subtiele verschillen die typische dialecten herkenbaar maken gemaskeerd worden. Met behulp van de juiste methodes kunnen we desalniettemin aantonen dat de belangrijkste en bekende structuren van de Vlaamse dialecten 4
Figuur 1: Dialectgrenzen in Vlaanderen berekend met de GTRP gegevens. Linksboven: verdeling van het grondgebied eerst in twee dialectgroepen (donkerste dialectgrens), dan drie, etc. Rechtsboven: idem, maar 100 keer herhaald met ruis. Links- en rechtsonder: MDS analyse. duidelijk terug te vinden in zijn de gebruikte gegevens. De kaartjes in figuur 1 werden gemaakt aan de hand van eigen berekeningen met de RUGL04 software van Peter Kleiweg1 . Een eerste kaart (linksboven) deelt de verschillende dialectmetingen op in groepen (clusters)2 , zodanig dat de Levenshteinafstanden (uitspraakverschillen) tussen de groepen groot is, maar erbinnen klein. Indien we slechts 2 dialectgebieden toelaten, wordt ergens ten oosten van Gent een dialectgrens getrokken. Dit wijst erop dat sterkste verschillen in onze gegevensbank die tussen Vlaamse (Oost- en West-Vlaamse samen) dialecten enerzijds en Brabants (samen met Limburgs) anderzijds zijn.3 Als we onderverdelen in 3 groepen worden de sterke stadsdialecten van Gent en Ronse apart genomen. De dialectafstand tussen deze steden en hun 1
zie http://www.let.rug.nl/~kleiweg/L04/ Er zijn meer dialectgegevens beschikbaar in de GTRP dataset dan getoond op deze kaart. Aangezien pendelstromen slechts op het gemeenteniveau beschikbaar zijn namen we bij verschillende dialectmetingen in 1 gemeente het gemiddelde of de meting in de grootste kern. Hierdoor verliest de kaart wat aan detail, maar komt ze wel overeen met de gegevens zoals we ze uiteindelijk zullen gebruiken in de analyse van pendelstromen. 3 In het het oostelijk deel van Oost-Vlaanderen worden Brabantse dialecten gesproken. 2
5
directe omgeving is groot, eerder dan bv het verschil tussen Oost-Vlaams en West-Vlaams. Als we onderverdelen in 4 dialectgroepen worden Brabants en Limburgs gesplitst. Met 5 groepen wordt ook West-Vlaams een aparte dialectgroep. Later worden de West-Brabantse dialecten als aparte groep genomen, en ook dialecten in het noordoosten van de provincie Antwerpen en het noordwesten van de provincie Limburg. Het gaat hier om uitlopers van Noord-Brabantse dialecten (bv in Lommel), die door het algoritme echter worden samengenomen met het West-Limburgs in sommige Noord-Limburgse gemeenten (bv Overpelt). Als we een bepaalde dialectafstand licht zou veranderen, kan dit leiden tot een hele andere kaart. Dit is echter ook informatief, omdat het andere dialectgrenzen zichtbaar maakt. We herhalen daarom bovenstaande oefening 100 keer waarbij we telkens een beetje ruis toevoegen aan de data. Sommige van de dialectgrenzen zullen hierdoor nauwelijks wijzigen, wat aantoont dat het om een belangrijke grens gaat. Andere grenzen zullen echter verspringen, en wanneer dit herhaald voorkomt op dezelfde plek toont het aan dat daar ook een zekere dialectgrens bestaat. Het paneel rechtsboven toont het resultaat. Ondanks het feit dat de figuur op het eerste zicht nogal druk bezaaid lijkt met allerlei lijnen, zijn hieruit toch enige conclusies te trekken. Belangrijke dialectgrenzen blijven bijvoorbeeld de stadsdialecten van Gent en Ronse (en in mindere mate Brugge en Hasselt); de dialectgrens Oost-Vlaams vs Brabants; de grens Brabants versus Limburgs in het noorden van de provincie Limburg. Voor de zuidelijke grens tussen Limburgs en Brabants worden vele alternatieven gevonden. Kenners zullen hier nu echter dialectgebieden herkennen zoals het West-Getelands rond Tienen in het oosten van VlaamsBrabant, Oost-Getelands (rond Sint-Truiden). De dialecten van Ravels en Arendonk in het noordoosten van de provincie Antwerpen worden nu ook vaak apart genomen. De situatie in het noordwesten van Vlaams-Brabant en het ruimere grensgebied van de drie provincies daar is behoorlijk complex en de dialectgrenzen verlopen er grillig.
6
Multidimensional Scaling (MDS) is een alternatieve manier om naar de dialectgebieden te kijken aan de hand van kleuren.4 Het kaartje linksonder in figuur 1 gebruikt parameters die het grondgebied in minder er grotere dialectgroepen onderverdeeld, wat de drie belangrijkste dialectgroepen duidelijk zichtbaar maakt. Het rechtse paneel toont hoe de figuur verandert als we voor andere parameters kiezen. In deze figuur leunt Oost-Vlaams minder dicht aan bij West-Vlaams, en staat West-Brabants dichter bij het Oost-Vlaams. De verschillen tussen Limburgs en de afwijkende Noord- Brabantse dialecten in Noord-Limburg komen hier dan weer minder sterk naar voor. Tot slot van deze bespreking van de dialectgegevens is het belangrijk te herhalen dat er betere gegevens en methodes bestaan om dialecten in groepen te verdelen.5 De bovenstaande kaartjes illustreren echter dat zelfs in de gecondenseerde gegevens over dialectafstanden waarover we beschikken de belangrijkste dialecten kunnen herkend worden, en de belangrijkste dialectgrenzen aanwezig zijn. Voor het precies afbakenen van kleinere dialectverschillen zijn de gegevens minder geschikt. Wij gebruiken ze finaal echter niet om dialecten te groeperen of te benoemen, maar bekijken het verband met arbeidsmobiliteit.
2.3
Een voorbeeld: dialectafstanden voor Zwalm
Moesten dialectverschillen steeds op ongeveer dezelfde manier toenemen naarmate de afstand of reistijd tussen twee gemeenten groter wordt, dan zouden we 4
Bij MDS wordt elk punt met dialectwaarnemingen voorgesteld aan de hand van 3 co¨ ordinaten, zodanig dat een bepaalde afstandsmaat tussen de deze punten de originele matrix met dialectafstanden zo dicht mogelijk benadert. Daarna worden de 3 co¨ordinaten vertaald in een intensiteit van de basiskleuren rood, groen en blauw en op een kaart weergegeven. 5 De vraag is dan wel hoe relevant andere methodes zijn voor onze latere analyse van pendelstromen. Zo is het Antwerps stadsdialect zelfs voor een ongeoefend oor gemakkelijk te herkennen, maar kwam in onze analyse niet als afwijkend naar boven. Dit wijst er echter enkel op dat de overgang naar het stadsdialect geleidelijker verloopt dan in andere gevallen (Brugge, Gent, Ronse, Hasselt), wat voor onze analyse relevanter is dan de herkenbaarheid van het dialect op zich.
7
Figuur 2: Verschillende Levenshtein dialectafstanden tot de gemeente Zwalm onmogelijk het verband met pendelstromen kunnen meten. Wat ons toelaat het effect van dialecten apart te bepalen van reistijd of afstand zijn net die gevallen waar op korte afstand in een bepaalde richting sterke dialectverschillen optreden, terwijl de dialecten in een andere richting homogeen zijn. Dit is het geval aan de dialectgrenzen die we hierboven analyseerden. Figuur 2 bekijkt als voorbeeld de dialectafstanden van de gemeente Zwalm in Oost-Vlaanderen. We zien dat de dialectafstand tot het nabijgelegen Ronse bijzonder hoog is (0.62), in vergelijking met de andere gemeenten waarvoor dialectgegevens beschikbaar zijn in dezelfde Oost-Vlaamse dialectzonde (donkergroen). De dialectafstand binnen deze zone hangt ook niet direct samen met de afstand. Zo is de dialectafstand tot de verafgelegen landelijke gemeenten boven Gent klein. Als we de Brabantse dialectgrens ten oosten van Zwalm oversteken, nemen de dialectafstanden op korte afstand echter behoorlijk toe en gaan van rond de 0.3 naar rond de 0.45-0.5. Dit is ook het geval voor dialectafstanden tot West-Vlaamse gemeenten. Als we dialecten dichter bij 8
Brussel bekijken (Halle, Londerzeel) zijn de dialectafstanden nog groter. Dialectafstanden nemen dus zeker niet eenvoudigweg toe met afstand, maar nemen typisch sterk toe op korte afstand bij belangrijke dialectgrenzen. Het zijn deze afwijkingen tussen geografische afstand (of reistijd) en dialectafstand die ons toelaten het verband met pendel af te zonderen.
2.4
Het verband tussen taalafstanden en arbeidsmobiliteit
Verder in deze Vives Briefing voeren we een regressieanalyse uit om het verband tussen dialectafstand en pendel te kwantificeren. Het is belangrijk om eerst stil te staan bij de vraag wat dit verband kan betekenen. Voor een deel gaat het hierbij waarschijnlijk om het effect van dialectverschillen op mobiliteit. We kunnen ons bijvoorbeeld voorstellen dat dialectverschillen het moeilijk maken voor werknemer en werkgever om vlot met elkaar te communiceren op de werkvloer, en beide partijen er daarom eerder voor kiezen om deze extra kost en moeite uit te sparen door een andere job te zoeken of andere werknemer aan te nemen waar dit dialectverschil kleiner is. Maar het effect dat we meten is waarschijnlijk niet enkel toe te wijzen aan het dialect zelf. Een eerste reden om hieraan te twijfelen is het feit dat de GTRP gegevens over de uitspraakverschillen vooral in de jaren ’80 en ’90 werden verzameld bij oudere sprekers (om de oorspronkelijke streektaal zo goed mogelijk te meten). Het is in tijden van oprukkend ‘Verkavelingsvlaams’ niet duidelijk hoe relevant deze uitspraakverschillen zijn voor de huidige arbeidsmarktdeelnemer. Een belangrijke mogelijke verklaring die in de inleiding al werd besproken is dat het effect dat we meten wellicht meer te maken heeft met dialecten als indicator voor socio-culturele netwerken op een geografisch kleinschalig niveau. Falck et al. (2012) vinden een effect van historische Duitse dialecten op migratiestromen en schuiven de veronderstelde onderliggende culturele verschillen die worden opgepikt door dialecten als de voornaamste verklarende factor. 9
Een andere reden om voorzichtig te zijn bij een interpretatie van de resultaten als een causaal verband van dialecten naar mobiliteit, is het omgekeerde effect: het feit dat beperkte arbeidsmobiliteit kan leiden tot dialectverschillen. Dit kan geen belangrijke verklaring kan zijn voor onze resultaten. Het is namelijk niet aannemelijk dat de verouderde dialectgegevens die we gebruiken een sterke invloed ondervinden van de huidige patronen van arbeidsmobiliteit (na het controleren voor pendelkosten en de locatie van werknemers en jobs in de omgeving). De meeste sprekers van de gebruikte dialectgegevens groeiden bijvoorbeeld op in de periode v´o´or het uitbouwen van een netwerk van autostrades en de ondergang van de steenkoolindustrie. De mediaanspreker in de dataset was 63 in het jaar van de opname, en het mediaanjaar van de opname is 1987. Los daarvan liggen de ontstaansredenen van de dialecten in de meeste gevallen vele honderden jaren verder terug in de tijd, en staan los van hedendaagse factoren zoals pendelstromen.
3 3.1 3.1.1
Kwantitatieve Analyse Methodologie Een model voor woon-werkverkeer
De kwantitatieve analyse maakt gebruik van een zwaartekrachtmodel voor pendel, zoals besproken in Persyn and Torfs (2015). De pendelstroom tussen twee gemeenten wordt gemodelleerd als een functie van hun massa (voor de oorsprongsregio het aantal werknemers Wo , voor de bestemming het aantal jobs Jo ) en de afstand tussen beide gemeenten. Een voorbeeld van een eenvoudig model voor een pendelstroom Pob tussen een oorsprongsgemeente o en een bestemming b is de onderstaande vergelijking, die ge¨ınspireerd is door
10
Newtons zwaartekrachtwet:6 Pob =
Wo × Jb Afstandαob
(1)
Dit model heeft echter een belangrijke tekortkoming: de totale uitstroom van P pendelaars b Pob uit de gemeente o kan verschillen van het aantal werknemers Wo . Dit is niet logisch of wenselijk. Om hieraan tegemoet te komen wordt het model uitgebreid7 met termen Ao en Bb , die de totale uitgaande en inkomende pendelstromen beperken tot het aantal waargenomen werknemers en jobs. Pob =
Wo × Jb × Ao × Bb Kob
Ao =
X Jb × Bb b
Kob
Bb =
X Wo × Ao o
Kob
(2)
Het uitgebreide model komt dan neer op een onderzoek naar de invulling van een gegeven aantal jobs per gemeente door een gegeven aantal werknemers in elke gemeente, en laat toe te analyseren hoe veranderingen in de pendelkosten en de dialectafstanden hier geografische verschuivingen in teweegbrengen. De beperkingen die worden opgelegd door de factoren Ao en Bb brengen ook de economische omgeving van beide gemeenten in rekening: het maakt voor de pendelstroom tussen 2 gemeenten veel uit of er zich bijvoorbeeld een grote stad bevindt in de nabijheid. Als laatste aanpassing van het standaard zwaartekrachtmodel maken we gebruik van een veralgemeende factor Kob die bepaalt hoe kostelijk of aantrekkelijk pendel is tussen beide gemeenten, in plaats van de geografische afstand. We veronderstellen dat deze factor afhangt van de reistijden (per openbaar vervoer en auto) en de dialectafstand.8 6
Merk op dat we toelaten dat o en b dezelfde gemeente zijn, waarbij het dus niet om pendel gaat maar werken in de eigen gemeente. De afstand en reistijden tot de eigen gemeente worden berekend in functie van de oppervlakte. 7 Dit uitgebreide model is bekend als het ‘Wilson Doubly Constrained’ model, zie Wilson (2010). 8 We veronderstellen als functionele vorm Kob = exp[α0 log(reistijd per autoob ) + α1 log(reistijd per openbaar vervoerob )+α2 dialectafstandob ], waar α0 , α1 , α2 de parameters zijn die geschat worden in de statistische analyse.
11
3.1.2
Het schatten van het zwaartekrachtmodel
Tussen een aanzienlijk aantal (landelijke) gemeenteparen wordt helemaal niet gependeld. Dit stelt problemen voor eenvoudige methodes die vergelijking (2) schatten na ze te log-lineariseren. In deze studie worden worden de waarnemingen van pendel daarentegen erkend als een statistisch voorval, en geschat aan de hand van een Poisson regressie model. Voor details kan de ge¨ınteresseerde lezer terecht bij Silva and Tenreyro (2006) en Persyn and Torfs (2015).
3.2
Overige databronnen
Aangezien dialectverschillen vaak sterker zijn aan natuurlijke barri`eres zoals grote rivieren is het belangrijk om goed te controleren voor verschillen in reistijden. Voor alle 94864 gemeenteparen werd daarom de reistijd per auto en het openbaar vervoer berekend. Met behulp van Perl en Javascript werd de reistijd opgevraagd aan de Google Maps API en de NMBS website (inclusief vervoer per tram, bus, metro of fiets). De vertrek en aankomstpunten zijn de co¨ordinaten die voor elke gemeente bepaald werden door het Nationaal Instituut voor de Statistiek in de AdminVector gegevensbank. Meestal is dit het gemeentehuis of een ander centraal gelegen punt in de gemeente. De pendeldata op gemeenteniveau zijn afkomstig van de Rijksdienst voor Sociale Zekerheid en betreffen het jaar 2008. De gegevens bevatten enkel werknemers in loondienst (geen zelfstandigen).
3.3
Resultaten
De volgende tabel toont de resultaten van de regressieanalyse. De resultaten voor de reistijden kunnen voor kleine veranderingen ge¨ınterpreteerd worden als ‘elasticiteiten’. Zo toont de tabel dat een toename in de reistijd per auto met 1 percent een daling geeft van de hoeveelheid pendel tussen twee gemeenten met ongeveer 2.2 percent. Voor het openbaar vervoer is dit effect 12
veel kleiner.
Reistijd per auto
−2.206 (0.137)
Reistijd openbaar vervoer
−0.487 (0.103)
Dialectafstand
−0.439 (0.204)
# Waarnemingen
94864
Bootstrap standaardfouten tussen haakjes
Tabel 1: Het zwaartekrachtmodel voor woon-werkverkeer in Vlaanderen, met een effect voor reistijden en taalafstand. De reistijden werden in logaritmes opgenomen. De genormaliseerde dialectafstanden hebben een gemiddelde van 0.25,9 en een standaardafwijking van 0.2. Het resultaat van -0.44 voor dialectafstand betekent dat als de dialectafstand met 0.1 eenheid daalt, de voorspelde pendel met 4.4 percent toeneemt. Om deze resultaten bevattelijker te maken bekijken we de voorspelde verandering in pendelstromen tussen de 5 Vlaamse provincies in het hypothetisch geval waar de dialectafstanden tussen de provincies afgetopt worden op 0.2. De eerste tabel toont de voorspelde pendelstromen met de oorspronkelijke gegevens over dialectafstanden. Het model voorspelt dat 414018 van de 1808207 werknemers in de dataset in een andere provincie gaan werken, of 22.9 percent. De voorspelde pendelstromen voor het hypothetisch geval waar we de dialectafstanden tussen provincies aftoppen op 0.2 worden weergegeven in de tweede tabel. Zoals opgelegd blijft de totale instroom en uitstroom 9
Hierbij worden de dialectafstanden gewogen aan de hand van de hoeveelheid pendel tussen de gemeenteparen om het gemiddelde representatief te maken voor de typische pendelaar, en niet voor een typisch gemeentepaar. Het ongewogen gemiddelde (inclusief gemeenteparen waar geen pendel plaatsvindt) bedraagt 0.53.
13
Antwerpen Limburg
Oost-Vl.
Vl.-Brabant
West-Vl. Totaal (Wo )
Antwerpen Limburg Oost-Vlaanderen Vlaams-Brabant West-Vlaanderen
441508 27546 56549 35543 10582
19649 193041 3791 16052 1581
30054 5248 295278 18265 40119
36933 21828 33043 172502 7470
5441 1986 38582 3759 291860
533585 249649 427242 246120 351612
Totaal (Jb )
571727
234113
388964
271776
341627
1808207
Oost-Vl.
Vl.-Brabant
Antwerpen Limburg
West-Vl. Totaal (Wo )
Antwerpen Limburg Oost-Vlaanderen Vlaams-Brabant West-Vlaanderen
434245 28846 59882 36581 12173
21177 189296 4408 17325 1907
33509 6084 284747 20382 44243
37755 22934 35397 167083 8607
6898 2487 42809 4749 284684
533584 249647 427242 246120 351614
Totaal (Jb )
571727
234113
388964
271776
341627
1808207
aan werknemers in elke gemeente gelijk, en dus ook voor elke provincie, op afrondingsfouten na. Enkel de geografische indeling en dus de pendelstromen verschuiven. Het voorspelde aantal pendelaars dat een provinciegrens kruist stijgt van 414018 naar 448153, een toename met 8 percent. Het percentage van de werknemers dat in een andere provincie werkt stijgt daarmee van 22.9 naar 24.8. Als we deze oefening herhalen met 6 dialectzones in plaats van provincies, en een totale verwijdering van alle dialectverschillen tussen alle gemeenten veronderstellen, dan stijgt het voorspelde aantal pendelaars tussen de dialectzones van 394622 naar 432062, of 9.5 percent.
4
Conclusie
In deze studie werd het verband geschat tussen dialecten en woon-werkverkeer. Onze resultaten wijzen erop dat een sterke afname van de dialectafstand tussen de Vlaamse gemeenten met rond de 8 procent meer pendel gepaard zou gaan over de provinciegrenzen, waarbij we controleren voor reistijden en economische omgevingsfactoren. Deze resultaten moeten niet gezien worden als bewijs voor het effect 14
van dialecten op arbeidsmobiliteit zich. Het is eerder waarschijnlijk dat de gebruikte dialectgegevens een indicator zijn voor kleine cultuurverschillen en grenzen van interpersoonlijke netwerken die als rem werken op de arbeidsmarktmobiliteit. Het is als overheid wel belangrijk om stil te staan bij deze remmende effecten, aangezien zelfs bij zeer uitgebreide infrastructuurverbeteringen er blijvende remmingen zullen bestaan die maken dat mensen een voorkeur hebben voor lokale jobs en werknemers. Een interessante uitbreiding van deze studie zou erin kunnen bestaan om de resultaten te vergelijken met een cultureel of taalkundig meer homogene regio, waardoor zou kunnen bekeken worden in welke mate dit remmend effect kan teruggedrongen worden.
15
Referenties Falck, O., Heblich, S., Lameli, A. and S¨ udekum, J. (2012). Dialects, cultural identity, and economic exchange. Journal of Urban Economics, 72 (2), 225–239. Goeman, A. and Taeldeman, J. (1996). Fonologie en morfologie van de Nederlandse dialecten. een nieuwe materiaalverzameling en twee nieuwe atlasprojecten. Taal en Tongval, 48, 38–59. Persyn, D. and Torfs, W. (2015). A gravity equation for commuting with an application to estimating regional border effects in Belgium. Journal of Economic Geography. Silva, J. and Tenreyro, S. (2006). The log of gravity. The Review of Economics and Statistics, 88 (4), 641–658. Wieling, M., Heeringa, W. and Nerbonne, J. (2007). An aggregate analysis of pronunciation in the Goeman-Taeldeman-van Reenen-Project data. Taal en Tongval, 59 (1), 84–116. Wilson, A. (2010). Entropy in urban and regional modelling: Retrospect and prospect. Geographical Analysis, 42 (4), 364–394.
16