Faculteit Letteren & Wijsbegeerte Academiejaar 2014-2015
Vrije wil en determinisme Discours- en corpusanalyse naar de aanwezigheid van filosofische idealen in Amerikaans en Vlaams politiek taakgebruik
Masterproef voorgelegd tot het behalen van de graad van Master in de taal- en letterkunde: Nederlands – Engels Desiré De Waele
Promotors: Ludovic De Cuypere, Klaas Willems Vakgroep: algemene taalkunde
2
Voorwoord Deze masterproef heb ik graag geschreven. Het combineerde enkele aspecten die me interesseren. Ten eerste betreft het een onderzoek naar politiek taalgebruik. Ik raak steeds weer geïntrigeerd door hoe politici hun inhoudelijke boodschappen presenteerbaar maken. Zo onderzocht ik in mijn bachelorproef het gebruik van spreekwoorden door Amerikaanse presidenten. Naast een handig retorisch middel bleken die ook veelal een bepaalde ideologie in zich te dragen, in een zeer beknopte gedaante. In dezelfde lijn vond ik het interessant om na te gaan in welke mate politiek taalgebruik samenhangt met een bepaalde ideologie of filosofie. Ten tweede betreft het een onderzoek naar filosofie. Jaren geleden kwam ik toevallig in aanraking met het determinisme als filosofisch ideaal (in één zin: alles heeft oorzaken, inclusief het menselijk denken en handelen). Tot nu werkt dit ideaal door op mezelf. Niet in de zin dat ik er noodzakelijk in geloof, maar in de zin dat de tegenstelling tussen determinisme en vrije wil naar mijn gevoel fundamenteel aanwezig is in onze maatschappij. Op basis van deze tegenstelling zijn talloze politieke debatten inhoudelijk te verklaren. Ik vond het fijn om na te gaan of dit eventueel kwantitatief bevestigd kan worden. Ten derde betreft het een onderzoek binnen de corpuslinguïstiek met een vrij hoog wiskundig en statistisch gehalte. Allerlei factoren heb ik in rekening moeten brengen om bij de resultaten tot zinnige conclusies te komen. Het rekenblad Excel was daarbij mijn grote vriend. Op het middelbaar volgde ik acht uur wiskunde en ik meen dat ik zonder die achtergrond de bomen soms niet meer door het bos had kunnen onderscheiden. Ik heb geprobeerd om de nodige berekeningen zo helder en concreet mogelijk uit te leggen, iets wat ik niet altijd even gemakkelijk vond. Verder vond ik deze masterproef leerzaam. Ik leerde met corpora werken en ook dat het onuitputtelijke bronnen zijn voor linguïstisch onderzoek. Ik leerde dat een onderzoek betrouwbaarder wordt naarmate het zich onttrekt aan intuïtie en introspectie. Ik leerde talloze functies in Word en Excel waarvan ik het bestaan niet afwist. Maar bovenal leerde ik omgaan met de logistieke moeilijkheden die eigen waren aan dit onderzoek. Daartoe behoren het samenstellen van corpora en woordenlijsten, het organiseren van uitzichtloos lange zoekopdrachten, en het structureren en in tekstvorm gieten van de verhandeling die hieronder staat. Tot slot bedank ik graag enkele personen die mij rechtstreeks of onrechtstreeks geholpen hebben. Ludovic de Cuypere voor de begeleiding, Klaas Willems voor het mee initiëren, Kevin Van Meenen, Thomas Delveaux en Hanne Storms voor het nalezen en proofreaden, Andreas Strickaert, Marijn de Wit en Sarah Claeys voor het verlichten van het opzoekwerk in de corpora en Arthur Serck, Niels Van Damme en Toon Van Den Berghe voor hun gezelschap in de Gentse bibliotheken, alwaar de meeste van onderstaande 25.000 woorden tot stand kwamen.
3
Inhoudsopgave Voorwoord .........................................................................................................................................3 Inhoudsopgave ...................................................................................................................................4 Lijst van figuren ................................................................................................................................6 Lijst van tabellen ...............................................................................................................................6 Introductie .........................................................................................................................................7 1
Status quaestionis ......................................................................................................................9 1.1 George Lakoff - Morals Politics ...................................................................................9 1.2 Literatuur over politieke kennis, perceptie en stemgedrag ....................................10
2
Theoretische inbedding van begrippen .................................................................................12 2.1 Verschillen tussen vrije wil en determinisme ...........................................................12 Determinisme ................................................................................................13 Vrije wil ........................................................................................................14 2.2 Domeinen waar de tegenstelling een rol speelt .........................................................14 Volwassenwording ........................................................................................15 Justitie ...........................................................................................................15 Houding t.o.v. radicale organisaties ..............................................................16 2.3 Duiding veelgebruikte begrippen ..............................................................................16 De correlatie ..................................................................................................16 Het corpus .....................................................................................................17 Sleutelwoorden en collocaties .......................................................................17
3
Methodologie ...........................................................................................................................18 3.1 Verantwoording voor gekozen methodologie ...........................................................18 Corpuslinguïstiek: corpora ............................................................................19 Corpuslinguïstiek: sleutelwoorden ................................................................19 Corpuslinguïstiek: collocaties .......................................................................20 Besluitende opmerkingen ..............................................................................21 3.2 Datavergaring .............................................................................................................22 Samenstelling van corpora voor politieke partijen ........................................22 Sleutelwoorden voor politieke partijen .........................................................25 Sleutelwoorden voor filosofische idealen .....................................................28 3.3 Correlatie tussen politieke en filosofische data ........................................................30
4
Woordfrequentieonderzoek .......................................................................... 30 Collocatieonderzoek ..................................................................................... 33 4
Resultaten en interpretatie .................................................................................................... 39 4.1 Sleutelwoorden voor politieke partijen .................................................................... 39 Amerikaanse sleutelwoorden ....................................................................... 39 Vlaamse sleutelwoorden............................................................................... 40 4.2 Sleutelwoorden voor filosofische idealen ................................................................. 42 4.3 Correlatie tussen politieke en filosofische data ....................................................... 43 Woordfrequentieonderzoek .......................................................................... 43 Collocatieonderzoek ..................................................................................... 49
5
Conclusie ................................................................................................................................. 59
6
Bibliografie .............................................................................................................................. 62
7
Bijlagen .................................................................................................................................... 64 7.1 Begrippenlijst voor Amerikaanse partijen .............................................................. 64 7.2 Voorbeeld van word cloud ........................................................................................ 65
Word count, van introductie tot conclusie: 26 150 woorden
5
Lijst van figuren Figuur 1: schematisch overzicht voor vrije wil en determinisme ..................................................................... 13 Figuur 2: overzicht van de twee deelonderzoeken in de VS ............................................................................. 30 Figuur 3: situering van Vlaamse partijen op beide filosofische assen volgens woordfrequentieonderzoek .... 48 Figuur 4: situering van Vlaamse partijen op een enkele filosofische as volgens woordfrequentieonderzoek . 49 Figuur 5: situering van Amerikaanse partijen op een enkele filosofische as volgens beide deelonderzoeken 52 Figuur 6: situering van Vlaamse partijen op beide filosofische assen volgens collocatieonderzoek ............... 55 Figuur 7: situering van Vlaamse partijen op een enkele filosofische as volgens collocatieonderzoek ............ 55 Figuur 8: de verhoudingen uit woordfrequentie- en collocatieonderzoek gevisualiseerd ............................... 57 Figuur 9: situering van Vlaamse partijen op een enkele filosofische as volgens beide deelonderzoeken ....... 58 Figuur 10: situering van Vlaamse én Amerikaanse partijen op eenzelfde filosofische as volgens beide deelonderzoeken ............................................................................................................................................. 60
Lijst van tabellen Tabel 1: overzicht van samengestelde politieke corpora ................................................................................. 24 Tabel 2: sjabloon toegepast op elke partij, bij woordfrequentieonderzoek .................................................... 32 Tabel 3: sjabloon voor de collocatieaantallen tussen politieke en filosofische sleutelwoorden voor VS ......... 35 Tabel 4: sjabloon voor de totale collocatieaantallen tussen politieke en filosofische sleutelwoorden voor VS ......................................................................................................................................................................... 36 Tabel 5: sjabloon voor de totale collocatieaantallen tussen politieke en filosofische sleutelwoorden voor Vlaanderen ...................................................................................................................................................... 36 Tabel 6: Amerikaanse sleutelwoorden, met frequentie en keyness ................................................................ 39 Tabel 7: door Lakoff gegeven voorbeelden voor Amerikaanse sleutelwoorden .............................................. 40 Tabel 8: Vlaamse sleutelwoorden, met frequentie en keyness ........................................................................ 41 Tabel 9: filosofische sleutelwoorden, met frequentie, keyness en vertaling ................................................... 43 Tabel 10: republikeinse resultaten voor woordfrequentieonderzoek ter illustratie ........................................ 44 Tabel 11: filosofische verhoudingen voor VS in woordfrequentieonderzoek ................................................... 44 Tabel 12: resultaten voor SP.A in woordfrequentieonderzoek ter illustratie ................................................... 46 Tabel 13: filosofische verhoudingen voor Vlaanderen in woordfrequentieonderzoek .................................... 46 Tabel 14: resultaten van chikwadraattoets die 12,59 moeten overschrijden ................................................. 47 Tabel 15: collocatieaantallen tussen democratische en deterministische sleutelwoorden ter illustratie ....... 50 Tabel 16: totale collocatieaantallen voor Amerikaanse sleutelwoorden ........................................................ 50 Tabel 17: collocatieverhoudingen voor Amerikaanse sleutelwoorden ............................................................ 51 Tabel 18: collocatieaantallen tussen Groen- en deterministische sleutelwoorden ter illustratie .................... 53 Tabel 19: totale collocatieaantallen voor Vlaamse sleutelwoorden................................................................ 53 Tabel 20: collocatieverhoudingen voor Vlaamse sleutelwoorden ................................................................... 54 Tabel 21: filosofische verhoudingen bij woordfrequentieonderzoek, en collocatieverhoudingen bij collocatieonderzoek ......................................................................................................................................... 56
6
Introductie Politieke stromingen – zoals liberalisme, communisme, nationalisme, enzovoort – vormen voor velen de grondslag van het politieke handelen. Ze gelden dan als hoogste verantwoording voor politieke standpunten, en staan met andere woorden ‘op zich’. Iemand handelt op politiek vlak vanuit een overtuiging die liberaal, socialistisch, nationalistisch... is. Echter, waar relatief weinig onderzoek naar verricht wordt, is naar de meer fundamentele, filosofische, visies op mens en maatschappij, die de verschillen in die politieke idealen zouden kunnen verklaren. Een voorbeeld van dergelijk onderzoek is het werk van George Lakoff, Morals Politics: how liberals and conservatives think. Hij toonde aan wat de fundamentelere verschillen zijn tussen democraten en republikeinen in de Verenigde Staten, en nam dus geen vrede met beide begrippen als hoogste verantwoording voor hun politieke handelen. Democraten hebben het idee, zo stelt Lakoff, dat de overheid moet optreden zoals een Nurturing Parent doet in een gezin. Voor de republikeinen geldt dezelfde gezinsmetafoor, maar hier moet de staat de rol opnemen van een Strict Father. Lakoff beargumenteert dat elke politiek standpunt in beide gevallen terug te voeren is tot een van deze basismetaforen. (Lakoff, 1996) In de lijn van Lakoff wil dit onderzoek bijdragen tot beter inzicht in hoe politieke standpunten samenhangen onder een zekere filosofische noemer. Bepaalde standpunten in politieke kwesties zijn steeds terug te koppelen tot een bepaald wereldbeeld. Dat is wat George Lakoff doet met zijn modellen, en tegelijk wat dit onderzoek beoogt. Een mening in een bepaald politiek debat staat in wezen nooit op zich, maar kadert in een existentiële visie op mens en maatschappij. Het besef dat een ruimere filosofie aan de grondslag ligt van een bepaalde politieke strekking is van belang voor een dieper inzicht in de politiek. Daarenboven stelt het mensen in staat om onafhankelijker een politieke keuze te maken, los van bv. het eigen politiek gekleurde nest waarin men opgroeit. Deze masterproef wil toetsen in hoeverre de tegenstelling tussen determinisme en vrije wil – een aloud wijsgerig debat – niet alleen een rol speelt in de politiek maar ook correleert met traditionele politieke indelingen. Het is mijn overtuiging dat deze uitersten precies die filosofische noemers kunnen zijn waarvan sprake, waaronder politieke standpunten samenhangen. Concreet zal ik onderzoeken of de as tussen determinisme en vrije wil correleert met de traditionele politieke indelingen in de Amerikaanse en de Vlaamse politiek. De hypothese is dat er daadwerkelijk een verband is tussen dit aloude filosofische debat, en verschillen in de visie op het leiden van een samenleving (d.i. partijideologieën). Om die hypothese eventueel hard te maken zullen technieken uit de corpuslinguïstiek en de discoursanalyse gebruikt worden. Per onderzochte partij stel ik enerzijds corpora en woordenlijsten samen die de ideologie van die partij moet typeren, en anderzijds zullen woordenlijsten samengesteld worden voor determinisme en vrije wil als filosofische uitersten. De precieze methodologie wordt verder uitgelegd, maar het betreft kortweg een woordfrequentieonderzoek en collocatieonderzoek naar deze politieke en filosofische data. In het woordfrequentieonderzoek leg ik de politieke corpora en de filosofische woordenlijsten naast elkaar, in het collocatieonderzoek doe ik hetzelfde met de politieke
7
en filosofische woordenlijsten. Dit alles met als doel het bestaan van een eventuele correlatie tussen politiek en filosofie bloot te leggen. In het eerste hoofdstuk van deze masterproef, de status quaestionis, situeer ik het onderzoek in de bestaande literatuur. Het reeds vermelde werk van Lakoff is hierbij van belang, maar uiteraard zijn er nog (veelal kwalitatieve) pogingen ondernomen om politiek te herleiden tot een diepere ideologie. Het betreft daarbij vooral uiteenzettingen van politieke idealen apart. Ik zal toelichten waarom ik meen dat deze paper een bijdrage aan die literatuur levert. Het tweede hoofdstuk betreft een theoretische inbedding van de gebruikte begrippen. Vooral determinisme en vrije wil krijgen daarbij de nodige aandacht. Beide begrippen moeten voor een goed begrip afgebakend worden in hun betekenis. Om beide iets aanschouwelijker te maken voor de lezer, zal ik ook kort toelichten waar in onze samenleving de twee filosofische uitersten ontegensprekelijk een rol spelen. Ook over de termen correlaties, corpora, sleutelwoorden en collocaties verschaf ik iets meer uitleg. Hoofdstuk drie behandelt de methodologie, of met andere woorden, de manier waarop ik een correlatie zoek tussen politieke stromingen en de filosofische tegenstelling. Vooreerst zal ik ingaan op de methodologie zelf, en waarom de gekozen methode het meest geschikt bleek (1). Waar Lakoff in zijn werk vooral kwalitatief en introspectief tewerk ging om diepere motieven voor politieke stromingen bloot te leggen, wil ik dat kwantitatief en objectief doen. Hiervoor maak ik dus gebruik van de taal, en specifieker de discours analyse. Ik zal de datavergaring toelichten, met andere woorden hoe ik tot woordenlijsten gekomen ben voor determinisme en vrije wil als filosofische idealen, en anderzijds tot woordenlijsten én corpora voor de politieke stromingen in de Verenigde Staten en Vlaanderen (2). Vervolgens leg ik uit hoe ik een correlatie tussen de betreffende woordenlijsten en corpora heb proberen te zoeken (3). 1. Verantwoording van de gekozen methodologie 2. Datavergaring i. Woordenlijsten en corpora voor politieke partijen in de VS en Vlaanderen ii. Woordenlijsten voor filosofische idealen vrije wil en determinisme 3. Zoektocht naar een correlatie tussen 2i en 2ii
Ten slotte worden in hoofdstuk vier de resultaten behandeld, en voorzie ik die van een interpretatie. Achtereenvolgens komen daar de politieke sleutelwoorden, de filosofische sleutelwoorden en – het antwoord op de eigenlijke onderzoeksvraag – de eventuele correlatie tussen politiek en filosofie aan bod.
8
1 Status quaestionis De literatuur waarin deze paper ingebed is, is onder te verdelen in twee pijlers. Vooreerst is er het belangrijkste werk, Morals Politics: how liberals and conservatives think van George Lakoff. (Lakoff, 1996). Het werk bevat een grote analogie met deze paper wat onderzoeksvraag betreft, en het vormde er ook de concrete aanzet voor. Dat licht ik verder toe, nadat ik kort heb besproken wat het boek inhoudt. Dat laatste is nodig om de gelijkenissen én de verschillen met deze paper af te bakenen. Een tweede pijler zijn de bijdragen die handelen over onze kennis en perceptie van politiek, alsook over factoren die ons stemgedrag bepalen. Deze artikelen zouden moeten verantwoorden waarom ik op zoek ga naar een fundamentelere ideologie als verklaring. In elk deel probeer ik aan te tonen hoe deze paper precies bijdraagt. 1.1 George Lakoff – Moral Politics 1.2 Literatuur over politieke kennis, perceptie en stemgedrag.
1.1 George Lakoff - Morals Politics Zoals in de inleiding aangehaald, verklaart Lakoff de rudimentaire verschillen tussen democraten en republikeinen in de VS in zijn Morals Politics: how liberals and conservatives think. (Lakoff, 1996). Beiden, zo stelt hij, verschillen in hun visie op de rol van de staat in de samenleving. Wat die visies gemeen hebben is dat de overheid voor de samenleving moet zorgen zoals een ouder dat in een gezin doet. De invulling daarvan verschilt echter. Voor de democraten is die ouder een Nurturing Parent, voor de republikeinen is die ouder een Strict Father. Het is in essentie deze tegengestelde visie die volgens Lakoff de verschillende standpunten verklaart inzake allerhande onderwerpen als wapenbezit, abortus, visie op het kind, belastingen, enz. Een voorbeeld van hoe deze basismetaforen zich vertalen tot een maatschappelijk debat, is de visie op het kind. Voor de Nurturing parent is de morele ontwikkeling een levenslang proces: kinderen en volwassenen leren elke dag bij, en verschillen en dit opzicht niet van elkaar. Voor de Strict father stopt die ontwikkeling echter bij de volwassenwording. Een strenge opvoeding is hierbij des te belangrijker; een tweede kans is er immers niet. De visie op gerechtigheid is een ander voorbeeld. Voor de Nurturing parent is er onvoldoende gerechtigheid in de samenleving en moet men ijveren voor de verbetering van de condities voor iedereen. De Strict father meent echter dat men doorgaans wel krijgt wat het verdient: je hebt het lot immers in eigen hand. Begrip, en het helpen van de medemens zijn kernbegrippen voor het ene uiterste, zelfredzaamheid en zelfdiscipline zijn dat voor het andere. Kortom, de verschillen tussen democraten en republikeinen vloeien voort uit associaties van de basismetaforen. (Lakoff, 1996, pp. 65-107) Het werk van Lakoff is op twee manieren van belang voor deze paper. Ten eerste onderzoekt het eveneens een dieperliggende verklaring voor politieke verschillen. Men zou kunnen denken dat het liberalisme, socialisme, en nationalisme in verschillende domeinen steevast een bepaalde positie inneemt, zonder grote onderlinge samenhang. Echter, Lakoff toont aan hoe dergelijke standpunten toch kunnen samenhangen onder eenzelfde noemer. Bij Lakoff is die noemer een zelf bedachte metafoor voor zowel democraten (Nurturing Parent) en republikeinen (Strict Father). In deze paper is die 9
noemer het filosofisch onderscheid tussen vrije wil en determinisme. Maar het is vooral de analogie die hier belangrijk is: ogenschijnlijk heterogene politieke standpunten worden herleid tot een homogene, meer rudimentaire, verklaring. Een tweede manier waarom Lakoffs werk belangrijk is, is omdat het de aanzet heeft gegeven voor de noemer waarvan hier gebruikt wordt gemaakt (met name het onderscheid tussen determinisme en vrije wil). Om dit verder uit te leggen, geef ik nog één voorbeeld van hoe zijn metaforen zich concreet vertalen in de maatschappij. In hoofdstuk vier van Moral Politics, ‘The Hard Issues’ (Lakoff, 1996, pp. 176-281) heeft de auteur het over de verschillende attitude tegenover belastingen in de VS. De democraten verantwoorden belastingen omdat het een uiting is van het zorgende karakter van het Nurturing Parent model. De hulp die minder bedeelden nodig hebben, krijgen ze op deze manier van welgestelden. Voor de republikeinen echter, mag een succesvolle zelfredzaamheid en zelfdiscipline niet d.m.v. belastingen bestraft worden. Nu is het mijn persoonlijke overtuiging dat die verschillende attitude hoofdzakelijk haar verklaring vindt in volgend daarmee samenhangend idee: partijen dichten in verschillende mate krediet toe aan welgestelden. Democraten wijzen veelal op de omstandigheden (d.i. de context) waardoor iemand welgesteld kon worden, republikeinen hameren op het belang van het individu en zijn eigen aandeel in het succes. In die zin is het verschillende standpunt m.b.t. belastingen voor beide partijen goed te begrijpen. Hoe groter men het eigen aandeel in succes acht, hoe onrechtvaardiger men het vindt als men daar een deel van moet afstaan. En vice versa. Deze mogelijke verklaring voor de verschillende attitude m.b.t. belastingen, kan men zeer algemeen uitbreiden. Waar voor democraten de omstandigheden veelal bepalend zijn, ligt voor republikeinen de verantwoordelijkheid doorgaans bij het individu. En wie abstractie maakt van de nuances en enkel het kernidee overhoudt, komt vervolgens terecht bij de aloude filosofische tegenstelling tussen determinisme en vrije wil. Alles draait hierbij om de mate waarin de mens diens context bepaalt of waarin het omgekeerde geldt en de context de mens determineert. Wat is de grootste factor op ons levensverloop: omstandigheden of de eigen vrije wil? Het is een vraag die ik louter als mogelijke oorzaak zie voor politieke differentiatie.
1.2 Literatuur over politieke kennis, perceptie en stemgedrag Zoals in de inleiding is aangehaald, wil deze paper een mogelijke verklaring geven voor traditionele politieke indelingen in Amerika en Vlaanderen. Een van de beweegredenen daarvoor is dat een beter begrip van de politieke partijen – en dan vooral waar die partijen voor staan – geen evidentie meer is. Dat is natuurlijk een zeer algemene stelling die ik echter iets verder met literatuur onderbouw. Als dat zo is, dan loont het des te meer om het heterogene politieke landschap te herleiden tot haar rudimentaire kern. Het valt aan te nemen dat mensen die zich doorgaans minder bij politiek betrokken voelen, zich eventueel meer aangesproken zullen voelen door algemene ideologieën – ideologieën waar de politieke stromingen uit voortvloeien, maar die mogelijk wel eenvoudiger te begrijpen zijn. De stelling dat politieke betrokkenheid geen evidentie is, blijkt uit onder meer Aalberts (2004), Matyn (2014) en Peeters (2013). Zij onderzochten de politieke sensitiviteit, betrokkenheid en kennis bij Vlaamse jongeren. Abts (2014) stelt bijvoorbeeld vast dat "jongeren stemmen volgens de logica van de toeschouwersdemocratie. Ze wachten af en focussen op issues van de dag en houden rekening
10
met de stijl en het imago van de partij". Het zijn dus vooral heldere en beknopte boodschappen die de aandacht trekken, veel meer dan de ideologieën. Laat het mijn persoonlijke overtuiging zijn dat jongeren zich maar beter laten leiden door een rudimentaire ideologie waar een partij voor staat, dan door aanstekelijke oneliners die slechts op specifieke kwesties betrekking hebben. Men zou nog kunnen denken dat het enkel jongeren zijn die zich laten leiden door imago, stijl en heldere boodschappen. Abts, Swyngedouw en Billiet (2010) bewijzen echter het tegendeel. Zij onderzochten hij structurele en culturele factoren op het stemgedrag in Vlaanderen, een onderzoek dat Swyngedouw en Heerwegh al voordeden (2007). Uit beide onderzoeken blijkt dat de partijprogramma’s – en de ideologie die daarachter schuilt – lang niet de enige factor zijn in het stemgedrag van mensen. Meer zelfs, in het onderzoek van 2010 lezen we dat slechts 15% van de kiezers zich louter baseert op het partijprogramma bij het uitbrengen van zijn stem. De overgrote meerderheid laat zich daarbij ook nog overhalen door het partijstandpunt in specifieke kwesties.1 Verder zijn er veel andere factoren die blijkbaar correleren met partijkeuzes (geslacht, leeftijd, onderwijsniveau, beroepssituatie enzovoort). Deze literatuur toont aan dat het grote plaatje waar een partij voor ijvert een beperkte rol speelt in het stemgedrag. De onderzoekers menen dat we te ver verwijderd zijn van de centrale ideologie waarrond een partij zich situeert en waarnaar het doorgaans handelt. De voeling met die ideologie is beperkt. Volgens Swyngedouw en Heerwegh (2007) laat de kiezer zich leiden door een welbepaald thema, zonder oog te hebben voor de andere. Daar zijn volgens mij twee redenen voor: ten eerste is de kiezer te weinig op de hoogte van het bestaan van ideologieën die de onderlinge samenhang van standpunten in die thema’s verklaren. Ten tweede weet de kiezer te weinig wat die ideologieën dan concreet inhouden. Door eventueel de correlatie met filosofische tegenstelling tussen vrije wil en determinisme bloot te leggen, hoop ik op deze twee punten een bijdrage te kunnen leveren.
1
Zo ziet bijna een derde van de Vlaams Belang-stemmers de migrantenkwestie als voornaamste reden om voor die partij te stemmen. De Vlaamse kwestie overhaalt dan weer 24% van de N-VA-stemmers (Abts, Swyngedouw, & Billiet, 2010).
11
2 Theoretische inbedding van begrippen In dit deel ga ik nader in op determinisme en vrije wil. Beide begrippen kunnen in ruime én enge zin geïnterpreteerd worden, en moeten voor een goed begrip in hun betekenis afgebakend worden. Ik begin met een algemene beschrijving van beide. Erna geef ik enkele domeinen waarin beide concepten onmiskenbaar aanwezig zijn. Op die manier hoop ik om op een inhoudelijke manier te verantwoorden dat een kwantitatief onderzoek naar het belang ervan absoluut de moeite waard is. Ten slotte geef ik een korte duiding bij enkele begrippen die ik in deze masterproef frequent hanteer. Die begrippen zijn de correlatie, het corpus, sleutelwoorden en collocaties. 2.1 Verschillen tussen vrije wil en determinisme 2.2 Domeinen waar de tegenstelling een rol speelt 2.3 Duiding veelgebruikte begrippen
2.1 Verschillen tussen vrije wil en determinisme Van zowel het deterministische als niet-deterministische wereldbeeld bestaan vele varianten. Sommigen zijn gematigd, anderen zeggen dat determinisme wel betrekking heeft op de ons omringende materiële wereld maar niet op de mens, nog anderen hangen een compatibilisme aan, waarbij determinisme en vrije wil naast elkaar kunnen bestaan, enzovoort. In deze paper maak ik abstractie van deze varianten en beperk ik mij tot de meest klassieke, elementaire vormen van zowel determinisme als vrije wil. Veelal worden determinisme en vrije wil gezien als tegenpolen van elkaar, en dat is ook hoe ik ze in deze paper zal opvatten. Het bestaan van vrije wil impliceert dat de mens vrij kan handelen. Hij kan zich onttrekken aan externe factoren, en kan los daarvan vrije beslissingen nemen. Determinisme, zoals we de term hier zullen gebruiken, stelt dat geen enkele beslissing of handeling zich aan die externe factoren kan onttrekken. De mens is volgens deze visie niet ‘vrij’ maar veeleer gedetermineerd, door bv. opvoeding, omgeving of genetisch materiaal. Beide visies kunnen daarbij extreme vormen aannemen. De uiterste vorm van vrije wil stelt dat de mens te allen tijde vrij kan handelen, ongeacht de context. Het harde determinisme stelt dan weer dat vrije wil überhaupt niet bestaat. Naast de materiële wereld die ons omringt, zijn ook wij als mens in die optiek over de hele lijn gedetermineerd. Ter illustratie zou men de dichotomie schematisch kunnen voorstellen als in figuur 1. Ofwel bestaat vrije wil, en is het individu bepalend voor diens context, zie de afbeelding links. Ofwel is men gedetermineerd, en is de context (lees: opvoeding, omgeving en genen) bepalend voor het individu, zie de afbeelding rechts. Beide zijn de uitersten van een ideologische as. In 2.1.1 en 2.1.2 probeer ik voor beide concepten het nodige begrip op te wekken. Het gaat er allerminst om wie hier ‘gelijk’ heeft, maar het gaat erom dat beide ideeën hoe dan ook relevant zijn.
12
Figuur 1: schematisch overzicht voor vrije wil en determinisme
Determinisme Omdat determinisme iets moeilijker te rijmen valt met ons dagelijks handelen dan vrije wil, behoeft het vermoedelijk ook iets meer uitleg. Eenvoudig gezegd stelt het determinisme dat alles een oorzaak heeft. In wezen gebeurt niets ‘per toeval’. Toeval is enkel een naam die we geven aan de onwetendheid van oorzaken. Bijvoorbeeld: wanneer ik aankom in het station en meteen een trein heb, is dat niet toevallig als ik op de hoogte was van de dienstregeling. Echter, als ik daar niet op de hoogte van was, dan noem ik het feit dat ik net een trein had ‘toevallig’. Maar echt toevallig, in de zin van puur willekeurig, was dat dus niet. Kortom, alles heeft een oorzaak, ook al kennen we die niet altijd. De meest rigoureuze vorm van determinisme stelt dat ook menselijke handelingen en beslissingen oorzaken hebben. Het menselijk brein is in die zin niet verschillend van de materiële, causale wereld. Onze handelingen, tot de meest banale toe, zijn het resultaat van impulsen in onze hersenen, die op hun beurt onnoemelijk veel andere, vaak onbekende, oorzaken hebben. Mensen zijn in hun totaliteit louter een product van genen, opvoeding en omgeving, en hun handelingen zijn daar slechts een uiting van. Hun handelingen zijn dus niet het resultaat van vrije wil. Vrije wil zou immers op zichzelf moeten bestaan, wat volgens het determinisme niet kan omdat alles een oorzaak heeft. Vrije wil is in deze gedachtegang louter en alleen een illusie. Het accepteren hiervan is doorgaans het grootste struikelblok voor het determinisme. Men vindt het bv. evident om de verantwoordelijkheid van een beslissing bij zichzelf te leggen. De denkoefening die men echter moet maken, is dat ook de meest banale beslissingen oorzaken hebben. Oorzaken die zich afspelen in ons brein en die we (misschien maar gelukkig) nog niet doorgrond hebben. Zoals Oshitelu (2010) stelt: “in its simplest form, determinism merely says, every event has a cause. We may not know what the cause is and we may never find out, but it has one”. Een belangrijk gevolg van het harde determinisme is dat de toekomst in wezen niet minder vast ligt dan het verleden. Omdat alles, inclusief de mens, causaal op elkaar inwerkt, is alles gedetermineerd. Verhelderend in dit verband is de Demon van de Fransman Pierre-Simon Laplace. Mocht dit hypothetische wezen slim genoeg zijn om alle aangaande processen, tot in het oneindige, in kaart te brengen, en daarbij hun inwerkingen op elkaar te analyseren, dan zou de toekomst geen geheimen meer voor hem kennen. Of zoals Laplace het zelf in één zin stelt:
13
An intellect which at a certain moment would know all forces that set nature in motion, and all positions of all items of which nature is composed, if this intellect were also vast enough to submit these data to analysis, it would embrace in a single formula the movements of the greatest bodies of the universe and those of the tiniest atom; for such an intellect nothing would be uncertain and the future just like the past would be present before its eyes. (Truscott & Emory, 2007) Of Christian (2009): [Determinisme is] the assumption or doctrine that every event in the universe has a prior cause and that all effects are at least theoretically predictable if all the causes are known. Uiteraard heeft de mens niet de kracht van deze hypothetische Demon. De mens is beperkt. Door de wetenschap heeft de mens veel van die beperkingen weten te omzeilen, maar het spreekt voor zich dat hij nooit alle aangaande processen tot in het oneindige zal kunnen doorgronden, hoe geavanceerd de methodes ook. Als gevolg zal de toekomst altijd ten dele een mysterie blijven. Maar opnieuw, oorzaken zijn er altijd, ook al kent hij ze niet. Er is dus maar één reële toekomst, met name degene die uiteindelijk plaatsvindt. Een terugkerend voorbeeld is daarbij het voorspellen van het weer. Door geavanceerde apparatuur kunnen we veel oorzaken voor weerverschijnselen blootleggen en het weer tot op zekere hoogte voorspellen. Echter, na pakweg een week botst de mens op zijn beperkingen en kan het de talloze oorzaken die meespelen niet meer in kaart brengen of verwerken. Vrije wil Het harde determinisme is moeilijk te vatten omdat de mens in hoge mate verknocht is aan zijn vrije wil. Het bestaan ervan ervaren we als evident, waardoor deze kant van het filosofische spectrum vermoedelijk minder uitleg behoeft. Waar dit kamp wezenlijk verschilt van het determinisme, is dat de mens hier wel een vrije wil bezit, die zich onttrekt aan de causale wereld. Daarmee wordt bedoeld dat hij vrije beslissingen kan maken die volledig los staan van de opvoeding, de genen en de omgeving (kortom van externe factoren, of de context zoals afgebeeld in figuur 1). De extreme aanhangers van vrije wil menen dat men, ongeacht de context waarin het individu zich bevindt, te allen tijde vrij kan handelen. Dat heeft als gevolg dat verantwoordelijk inherent met vrije wil verbonden is. Mensen kunnen immers beslissingen maken waarvoor ze ten volle verantwoordelijk kunnen gesteld worden.
2.2 Domeinen waar de tegenstelling een rol speelt In het begin van vorig hoofdstuk heb ik onder meer toegelicht hoe Lakoffs basismetaforen zich in de maatschappij vertalen. In dit deel probeer ik hetzelfde te doen met de spanning tussen vrije wil en determinisme. Ik hoop dat eruit zal blijken hoe aanwezig die spanning is in onze samenleving, en dat het zo kan verantwoorden waarom het de moeite is om die aanwezigheid aan een kwantitatief onderzoek te onderwerpen. Vrije wil en determinisme spelen onmiskenbaar een rol in de domeinen volwassenwording (2.2.1), justitie (2.2.2) en de houding tegenover radicale organisaties als Islamitische staat (2.2.3). Het is dus niet enkel een discussie tussen filosofen, maar een maatschappelijk relevant debat dat eigenlijk overal aanwezig is.
14
2.2.1
Het belang van de tegenstelling in de volwassenwording
2.2.2
Het belang van de tegenstelling in justitie
2.2.3
Het belang van de tegenstelling in de houding t.o.v. radicale organisaties Volwassenwording
In veel landen wordt men meerderjarig op een bepaalde leeftijd – bij ons is dat bijvoorbeeld 18 jaar. Dat is een conventioneel gekozen grens die aangeeft vanaf wanneer iemand verantwoordelijk wordt geacht voor de eigen daden. Wanneer een kind iets ernstigs mispeutert, dan worden daarbij vaak omstandigheden ingeroepen, zoals een foute omgeving of een discutabele opvoeding. In de zeer ernstige gevallen zal men naar oorzaken blijven zoeken die tot de daden van het kind geleid hebben. Dat heeft een zeer deterministische aard. Wanneer een volwassene hetzelfde doet, gaat men eventueel ook naar bepaalde oorzaken zoeken, maar wordt hoe dan ook een bepaalde verantwoordelijkheid bij het individu gelegd. Dit berust in de overtuiging dat de mens vrij kan handelen, en dus vrije wil heeft. Men kan bij de volwassenwording dus spreken van een overgang van determinisme naar vrije wil. Het kind wordt in onze optiek nog door zijn context bepaald, maar de volwassene heeft die context in de hand en is er dus verantwoordelijk voor. De tegenstelling tussen determinisme en vrije wil is relevant omdat het debat over het tijdstip van die overgang nog steeds brandend is. Voor de wet ligt die pragmatisch vastgelegde grens misschien op de 18de verjaardag, maar het is aannemelijk dat die bruuske overgang niet altijd strookt met de realiteit. Aanhangers van de vrije wil zullen zeggen dat ook minderjarigen vrije wil hebben en dus een zekere verantwoordelijkheid dragen. Harde deterministen menen echter dat volwassenen, net als kinderen, bepaald zijn door hun context. In dit extreme uiterste zijn mensen dus in wezen nooit verantwoordelijk. Justitie Een belangrijke consequentie van de tegenstelling is de verschillende invalshoek op het strafrecht. We nemen hierbij als voorbeeld een moord die berecht moet worden. Voor zij die menen dat vrije wil bestaat, is het eenvoudig. De moordenaar bezit als mens vrije wil, kon er voor kiezen om de moord niet te plegen, maar heeft besloten het toch te toen. Hij is verantwoordelijk en dus moet hij gestraft worden bij wijze van boetedoening. Echter, de determinist zoekt naar oorzaken. Hij vraagt zich af of de dader een psychische aandoening had, ontoerekeningsvatbaar was, enzovoort. Hij blijft graven naar oorzaken die tot zijn daad geleid hebben. Ergens in zijn leven moet het immers fout gelopen zijn. De dader moet niet bij wijze van boetedoening gestraft worden, maar vanuit louter pragmatische overwegingen (voor het welzijn van anderen én als afschrikmiddel voor anderen). De strafmaat is dus mogelijk dezelfde, maar de invalshoek is duidelijk anders. Het kruispunt bij uitstek tussen vrije wil en determinisme is de discussie over toerekeningsvatbaarheid. Het is de discussie over de mate waarin het individu vrij kon handelen en de mate waarin externe factoren een rol speelden. Wordt een beschuldigde toerekeningsvatbaar geacht, dan weegt de vrije wil zwaarder door, in het andere geval primeert de gedetermineerdheid. Voor de uitersten van de filosofische tegenstelling is de discussie over toerekeningsvatbaarheid dan weer zinloos. Als
15
iedereen een vrije wil heeft, is men altijd toerekeningsvatbaar. Als mensen louter het product zijn van opvoeding, omgeving en genen, dan is men dat echter nooit. Houding t.o.v. radicale organisaties Een derde voorbeeld van de maatschappelijke relevantie van de tegenstelling, is de houding tegenover bv. Islamitische Staat en bij uitbreiding elke vorm van radicalisering. Voor wie vrije wil bestaat, ligt verantwoordelijkheid zoals gezegd bij het individu. Dat wil zeggen dat hij op een gegeven moment niet verder zal zoeken naar oorzaken voor iemands gedrag zoals een determinist dat doet. Externe oorzaken kunnen in die optiek nooit als volledige verantwoording gelden (iedereen bezit altijd vrije wil) en al helemaal niet voor de gruweldaden van IS-strijders. Het gevolg is een extreme vorm van distantiëring van deze ‘onmensen’. Echter, de determinist zoekt te allen tijde naar oorzaken. Hoe gruwelijk de daden van IS ook, hij zal altijd zoeken naar hoe zij tot die daden komen, welke processen daarbij een rol spelen, enzovoort. Zelfs in dit extreme geval van afschuwelijkheid ziet hij de daders als mensen, en bijgevolg als product van opvoeding, omgeving en genen. Hij stuurt met andere woorden niet aan op distantiëring, maar op begrip. Uiteraard niet op begrip van de gruweldaden zelf, maar op begrip van de mechanismen (de oorzaken) die tot die gruweldaden leiden. Kortom, de filosofische tegenstelling vertaalt zich hier in een discussie tussen distantiëring en toenadering. Kortom, ik hoop dat dit inhoudelijk pleidooi voor het bestaan van een determinisme-vrije wil-as kan verantwoorden waarom een kwantitatief onderzoek nuttig kan zijn. Alvorens de methodologie te behandelen, verschaf ik iets meer uitleg bij de begrippen die in deze masterproef frequent gehanteerd zullen worden.
2.3 Duiding veelgebruikte begrippen De correlatie Het is belangrijk om te wijzen op het verschil tussen een correlationeel en een causaal verband. Beide worden maar al te vaak met elkaar verward. Deze masterproef onderzoekt de aanwezigheid van een correlatie, wat echter nog geen causaal verband inhoudt. Het is niet omdat twee gegeven verschijnselen zich samen voordoen, dat het verband ertussen rechtstreeks causaal is. En van de meest gegeven voorbeelden is dat er een correlatie bestaat tussen de daling van het aantal piraten in de wereld en de stijging van de zeespiegel. Beiden doen zich inderdaad hand in hand voor, maar het behoeft geen uitleg dat een causaal verband weinig waarschijnlijk is. Toch is een correlatie zinvol in de zin dat ze de eerste stap is. Er kan pas causaliteit zijn als de correlatie er is, en vaak is net de correlatie veel eenvoudiger aan te tonen. Meer zelfs, het bewijzen van causaliteit is vaak schier onmogelijk en dan is het blootleggen van een correlatie het maximum haalbare. Het is mijn overtuiging dat deze masterproef onder deze laatste categorie valt. Aantonen dat een politiek discours rechtstreeks causaal verbonden zou zijn met de tegenstelling tussen vrije wil en determinisme zou bijzonder zwaar vallen. Het vinden van een correlatie zou op zich al frappant te noemen zijn. Bovendien kan een correlatie ook gewoon volstaan om bevestiging te geven aan een inhoudelijk, kwalitatief vermoeden.
16
Het corpus Over de precieze eigenschappen en voordelen van corpora zal ik het hebben in de verantwoording van de methodologie (3.1), maar een korte definitie kan handig zijn. Corpora zijn in essentie grote verzamelingen teksten die authentiek zijn, die dienen voor kwantitatief taalkundig onderzoek. Veelal voldoen corpusteksten aan bepaalde criteria om onderzoek te doen binnen een bepaald domein. Zo bevat het COCA uitsluitend hedendaags Amerikaans Engels, en vinden we in het CGN louter gesproken Nederlands terug. In deze masterproef neem ik de vrijheid om zelf corpora samen te stellen, met nog strengere criteria om nog gerichter taalkundig onderzoek uit te voeren. Zo zal ik een corpus samenstellen dat uitsluitend teksten bevat die opgesteld zijn door de zeven grootste Vlaamse politieke partijen, alsook door de twee Amerikaanse partijen. Het idee is dat op die manier een objectief en kwantitatief onderzoek naar het discours van partijen mogelijk wordt. Sleutelwoorden en collocaties Ook over deze begrippen zal ik verder nog uitweiden. Eenvoudig gesteld gaat het om twee manieren om objectief te ‘meten’ waar een tekst over gaat. Sleutelwoorden zijn die woorden die het meest frequent zijn in een tekst en een inhoudelijke betekenis hebben. Ze bieden een objectieve maatstaf op de vraag waar pakweg de laatste speech van Barack Obama over ging. Het idee is dat sleutelwoorden dezelfde functie kunnen vervullen voor gehele corpora, en bijvoorbeeld de partijcorpora kunnen samenvatten. Collocaties vervullen dezelfde functie – ze bieden een tweede inhoudelijke maatstaf voor de betekenis van teksten – maar kijken naar veeleer naar de omgeving van woorden, in plaats van naar de woorden zelf. In deze masterproef gebruik ik collocaties volgens hun ruime definitie. De enge definitie nemen – d.i. twee woorden die vaker naast elkaar voorkomen dan we zouden verwachten, bv. ‘blond haar’ – zou te strikt zijn om tot voldoende resultaten te bekomen. Corpora laten toe om collocaties te zoeken die tot negen woorden links of rechts van de zoekopdracht staan. Van deze mogelijkheid zal ik dan ook gebruik maken.
17
3 Methodologie Algemeen zal de methodologie erin bestaan om zowel voor het taalgebruik van politieke partijen, als voor de ideologische tegenstelling data te verzamelen (1), en tussen beide een correlatie te vinden (2). Op die manier kom ik mogelijk tot een politiek discours dat doordrongen is van vrijheid van handelen, en een politiek discours dat doordrongen is van determinisme (d.i. beide kanten van het ideologisch onderscheid). Ik zal de hypothese zoals vermeld toetsen in twee deelgebieden: de Amerikaanse en de Vlaamse politiek. Dit leidt tot twee analoge onderzoeken. Gelijkaardige resultaten bij beide zouden er op kunnen wijzen dat de genoemde tegenstelling universeel is. Verschillende resultaten zouden echter evenzeer interessant zijn. Ter herhaling: de hypothese is dat de as tussen determinisme en vrije wil correleert met de traditionele politieke indelingen in de Amerikaanse en de Vlaamse politiek. Concreet zal de methodologie hiervoor uit vier delen bestaan. Ten eerste zal ik het hebben over de methodologie zelf, en waarom de gekozen methode het meest geschikt bleek. Waar Lakoff in zijn werk vooral kwalitatief en introspectief tewerk ging om diepere motieven voor politieke stromingen bloot te leggen, wil ik dat kwantitatief en objectief doen. Hiervoor maak ik gebruik van de taal, en specifieker de discoursanalyse. Ten tweede zal ik toelichten hoe ik enerzijds tot corpora én woordenlijsten gekomen ben voor de politieke stromingen in de Verenigde Staten en Vlaanderen en anderzijds tot woordenlijsten gekomen ben voor determinisme en vrije wil als filosofische idealen. Ten derde leg ik uit hoe ik een correlatie tussen de betreffende woordenlijsten en corpora heb proberen te zoeken. Daarbij geef ik telkens mogelijke hypothesen en verwachtingen met betrekking tot de resultaten. 3.1 Verantwoording voor de gekozen methodologie 3.2 Datavergaring 3.3 Correlatie tussen politieke en filosofische data
3.1 Verantwoording voor gekozen methodologie Deze masterproef situeert zich in het domein van de discoursanalyse en de corpuslinguïstiek. Het eerste is de overkoepelende term voor het onderzoek naar vertogen: allerhande taaluitingen worden daarbij onderzocht op hun politieke lading. De corpuslinguïstiek duidt op de studie van taal met behulp van grote verzamelingen teksten. Het lijkt me gepast om de gebruikte methodologie van een verantwoording te voorzien. Binnen de corporalinguïstiek zal ik gebruik maken van sleutelwoorden (woordfrequentieonderzoek) en collocaties (collocatieonderzoek). In dit deel probeer ik toe te lichten wat de voordelen zijn van corpora, sleutelwoorden en collocaties en waarom ze net in deze masterproef zo nuttig zijn. 3.1.1
Corpuslinguïstiek: corpora
3.1.2
Corpuslinguïstiek: sleutelwoorden
3.1.3
Corpuslinguïstiek: collocaties
3.1.4
Besluitende opmerkingen
18
Corpuslinguïstiek: corpora Talloze auteurs hebben al verantwoord waarom corpora uitstekend onderzoekmateriaal zijn. Het is inmiddels duidelijk geworden dat corpora bijzonder rijke informatiebronnen kunnen zijn wat taalgebruik betreft. Bijvoorbeeld Hunston (2002) schrijft dat de toepassingen van corpora tegenwoordig veel breder zijn dan vroeger. Waar ze vroeger nog golden als een collectie van teksten, zoals een bibliotheek of een archief, hebben ze nu veel bredere toepassingen. Tegenwoordig hebben ze steeds tot doel om data open te stellen voor kwalitatief of kwantitatief onderzoek. De onderzoeker maakt een selectie van teksten binnen het taaldomein dat hij wil onderzoeken2, waarna software hem tot de uitvoering van zijn onderzoek in staat stelt. Vroegere voorbeelden van het geloof in corpuslinguïstiek als vruchtbare tak van de taalkunde vinden we in de jaren ’90 met Biber et al. en Sinclair. Die eerste meent dat corpora dankzij haar karakteristieke eigenschappen tot zeer betrouwbare analyses leiden. Ze stelt treffend dat corpora grote verzamelingen zijn van in eerste instantie authentieke teksten (Biber, 1998). Men kan dus stellen dat corpora als bron van informatie de complete tegenpool vormen van introspectie. De benadering is immers in zijn geheel kwantitatief en objectief. Zonder enig afbreuk te doen aan het vermelde werk van George Lakoff, is dit het voornaamste punt waar deze masterproef in verschilt.3 Een andere accurate bewoording over het belang van corpora vinden we bij Sinclair. De mogelijkheden van computertechnologie, zo stelt hij, laten ons toe om onderzoek aan onze intuïtie te laten onttrekken. Zo berust het louter nog op het reële taalgebruik (Sinclair, 1991). Kortom, de grote sterktes van corpora zijn hun objectiviteit en authenticiteit. Precies om die reden vormen ze zeer waardevol onderzoeksmateriaal in deze masterproef. In een onderzoek naar ideologie en taalgebruik in politiek is het van groot belang dat ik me als onderzoeker onttrek aan elke vooringenomenheid. Het gevaar dat er bij een kwalitatief onderzoek toch enige partijdigheid zou binnen sluipen, zelfs al is het dan onbewust, is reëel. Ik meen dat ik me door het samenstellen van objectieve corpora per partij ontdoe van elke vooringenomenheid die ik zou hebben. Corpuslinguïstiek: sleutelwoorden Een belangrijk concept waarop ik mij binnen de corpuslinguïstiek op zal beroepen, zijn keywords of sleutelwoorden. Zoals Paquot & Bestgen (2009) het omschrijven: “sleutelwoorden zijn items met een ongewone frequentie in vergelijking met een referentiecorpus.” Onder een referentiecorpus verstaan we een corpus dat zoveel mogelijk ‘de algemene taal’ bevat, en dus zo weinig mogelijk beperkt is tot een domein. Sleutelwoorden zijn dus eenvoudig gezegd woorden die opvallend vaak voorkomen in een bepaald analysecorpus. Iedereen kent de zogenaamde word clouds van pakweg Amerikaanse presidentiële toespraken waarin frequente woorden (sleutelwoorden) als pakweg God, America, people en freedom prominentere plaatsen innemen. Daarbij geldt dan: hoe hoger de frequentie,
2
Voor brede taaldomeinen, zoals een gehele taal, bestaan natuurlijk alreeds corpora waar de onderzoek gebruik van kan maken. Bv. Het Corpus of Contemporary American English (COCA) voor hedendaags Amerikaans Engels. 3 Zoals vermeld, beroept Lakoff zich immers op introspectie om bv. woordenlijsten voor democraten en republikeinen op te stellen.
19
hoe groter en dikker het lettertype. Men kan zich voorstellen hoe dergelijke word clouds sterk van elkaar verschillen en afhankelijk zijn van de auteur, het doel, het tijdstip, de plaats… van de betreffende tekst. Zie de bijlage voor een voorbeeld van een word cloud die deze masterproef. Echter, in eerste instantie verschaffen word clouds ons niet al te veel informatie. Interessant wordt het pas wanneer we het inzicht van Scott (2001) erbij betrekken. Hij bevestigt het te verwachten idee dat sleutelwoorden lexicale items zijn die mee bepalen waar een tekst over gaat (iets wat Scott de aboutness noemt). Met andere woorden, sleutelwoorden bieden ons een objectieve en kwantitatieve methode om in te schatten waar een tekst over gaat, of wat de aboutness is. Zodra we dit aanvaarden, worden sleutelwoorden en word clouds natuurlijk zeer interessant om kwantitatief te ‘meten’ waar een tekst over gaat. Ze stellen ons bijgevolg in staat om teksten en corpora op objectieve wijze te vergelijken op inhoud.4 Deze masterproef is kortom gestoeld op het idee dat woordfrequentie van corpora mee diens inhoud en ideologie bepaalt. Sleutelwoorden zijn dus bij uitstek een geschikte methode om objectief te onderzoeken of corpora al dan niet bij elkaar aansluiten wat inhoud en ideologie betreft. Concreter gesteld, sleutelwoorden laten mij toe om bijvoorbeeld partijcorpora te rangschikken volgens de mate dat ze met bepaalde filosofische sleutelwoorden overeen stemmen. Corpuslinguïstiek: collocaties Het is duidelijk dat objectieve, kwantitatieve methodes om inhoud en ideologie van teksten te achterhalen zeer waardevol zijn voor deze masterproef. Naast sleutelwoorden vormen zogenaamde collocaties een tweede dergelijke methode. Zoals Stubbs het stelt: collocaties zijn twee of meer woorden die statistisch vaker samen voorkomen dan we zouden verwachten. Ze kunnen m.a.w. aantonen welke associaties en connotaties een woord heeft (Stubbs, 1996). Men zou kunnen stellen dat collocaties in die zin aanvullend zijn bij een onderzoek naar sleutelwoorden. Een onderzoek dat louter naar woordfrequentie kijkt, heeft als zwakte dat het de woorden louter op zich bekijkt, los van hun omgeving. Hoewel aan te nemen valt dat we uit woordfrequentie een en ander kunnen afleiden wat inhoud betreft, is het niet moeilijk om tegenvoorbeelden te bedenken. Men kan zich bv. voorstellen dat republikeinse politici in de VS maar al te vaak het woord taxes in de mond nemen. De conclusie dat we daarom belastingen in een republikeinse ideologie zouden moeten situeren zou echter zeer voorbarig zijn. In gevallen als dit loont het om de omgeving van woorden in rekening te brengen. De verwachting bij het gegeven voorbeeld is dan dat we systematisch een negatieve context terugvinden, waarbij vermoedelijk ingespeeld wordt op de negatieve bijklank van belastingen. Een democraat zal in dat verband mogelijk sneller spreken van contributions.5
4
Zo zouden we gebaseerd op de word cloud in bijlage, objectief kunnen stellen dat deze masterproef handelt over politiek, filosofie, (sleutel)woorden, corpora, determinisme, vrije wil en determinisme. Het is vooral die objectiviteit die zo waardevol is. 5 Deze voorbeelden zijn niet speculatief, maar lopen vooruit op de gevonden woordenlijsten voor democraten en republikeinen in de VS. Zie 4.1.1.
20
Kortom, hoewel sleutelwoorden een zeer vruchtbare methode kunnen zijn om de inhoud van teksten te ‘meten’, is het gevaarlijk om zich tot deze methode te beperken, zo toont bovenstaand voorbeeld. Collocatieonderzoek is daarbij complementair omdat de omgeving (de context of cotext) van diezelfde sleutelwoorden ook in rekening wordt gebracht. Los daarvan wijzen ook genoeg auteurs op de sterkte van collocatieonderzoek op zich. Daarbij zijn de in de taalkunde beroemde woorden van Firth van toepassing: “you shall know a word by the company it keeps” (Firth, 1957). Met andere woorden, de omgeving bepaalt mee de tekstuele betekenis – de sensus – van woorden. Een voorbeeld van hoe zoiets in werking treedt, geeft Bertels (2008). Zij beargumenteert dat polyseme substantieven hun dubbelzinnigheid verliezen eens ze ingebed staan tussen determinanten, adjectieven of werkwoorden. Sinclair (1991) behandelt collocaties als een manier om de intenties en de houding van sprekers te achterhalen. Hij merkt op hoe woorden over andere woorden heen betekenis ‘uitstraalt’, iets wat hij semantische prosodie noemt. Betekenis van woorden heeft met andere woorden invloed op de omgeving. Ook hierbij bepaalt de context dus mee de betekenis. Samengevat zijn collocaties naast sleutelwoorden eveneens een geschikt methode voor deze masterproef. In de eerste plaats laten ze toe om op een andere manier inhoud en ideologie in teksten en corpora op objectieve wijze bloot te leggen. Ten tweede zijn ze complementair met het woordfrequentieonderzoek; niet alleen de woorden zelf, maar ook de cotext wordt in acht genomen. En ten derde leent het onderzoek zich goed voor deze methodologie. Zo kan er onderzocht worden of sleutelwoorden uit de politieke corpora vaak colloqueren met de filosofische woordenlijsten. Besluitende opmerkingen Voor het achterhalen en het vergelijken van ideologie in teksten lijkt een objectieve analyse met behulp van corpora, sleutelwoorden en collocatieonderzoek de juiste keuze. Op die manier is er geen plaats voor intuïtieve of subjectieve interpretaties van teksten. De kwantitatieve gegevens die ik met de besproken technieken probeer te bekomen, objectiveren immers in grote mate de tekst. Een bijkomend voordeel van corpora, sleutelwoorden en collocaties is dat software als Wordsmith Tools of AntConc het betrekkelijk eenvoudig maken om de data te analyseren.6 Het is in eerste instantie de datavergaring die tijdrovend is. Onder meer Mayaffre wijst op de geheel nieuwe wijze waarmee we met teksten kunnen omgaan, net dankzij die software. Corpora kunnen globaal en statistisch benaderd worden, maar een lokale, particuliere lezing van een attestatie blijft eveneens mogelijk (Mayaffre, 2002) Mayaffre wijst ons echter ook op gevaren van de computeranalyse in corpora. Een objectivering van teksten tot sleutelwoorden en collocaties geven natuurlijk nooit een sluitend beeld over de aboutness van een tekst. Het risico bestaat altijd dat het belang van die sleutelwoorden of collocaties overschat wordt, en dat zo lezingen ontstaan die niet stroken met de oorspronkelijke tekst. Omgekeerd kunnen bv. laagfrequente attestaties net zeer interessant zijn. Het komt erop neer dat “frequentie een gids moet zijn, geen obsessie” (Mayaffre, 2009). Hieruit valt op te maken dat corpora, sleutelwoorden en
6
Het precieze gebruik van Wordsmith Tools zal nog verder toegelicht worden als ik bij het eigenlijke onderzoek kom.
21
collocaties op zich wel objectieve gegevens zijn, maar dat de interpretatie ervan wel om enige verantwoording vraagt. Ik zal dan ook proberen om mijn interpretatie van die gegevens grondig te motiveren.
3.2 Datavergaring In dit deel wordt louter een overzicht gegeven van hoe de benodigde data voor het eigenlijke onderzoek verzameld werd. Het betreft dus enerzijds het samenstellen van corpora en woordenlijsten voor de politieke partijen in de VS en Vlaanderen, en anderzijds het opstellen van woordenlijsten voor de filosofische concepten vrije wil en determinisme. 3.2.1
Samenstelling van corpora voor politieke partijen
3.2.2
Sleutelwoorden voor politieke partijen
3.2.3
Sleutelwoorden voor filosofische idealen vrije wil en determinisme Samenstelling van corpora voor politieke partijen
Zoals Hunston (2002) stelt, worden corpora gedefinieerd op basis van hun vorm en doel. De vorm is zoals gezegd een grote verzameling teksten om bv. kwantitatief onderzoek op uit te voeren. Het doel van de corpora is in deze masterproef om conclusies te kunnen trekken op basis van het taalgebruik per politieke partij. Het spreekt dus voor zich dat wanneer we het taalgebruik van bijvoorbeeld de democraten in de VS willen analyseren, dat een dergelijk corpus dan ook uitsluitend democratische teksten bevat. Het doel bepaalt met andere woorden de selectie van de corpora. Met het oog op de onderzoeksvraag geldt een tweede restrictie voor de corpora die ik per politieke partij zal samenstellen. Het is niet alleen van belang dat ze uitsluitend teksten bevatten van de betreffende partij, even belangrijk is dat de samengestelde corpora ook een hoog ideologisch gehalte hebben. Ik wil immers dat de politieke corpora zich zoveel mogelijk van elkaar onderscheiden om in het verdere onderzoek karakteristieke sleutelwoorden en collocaties te bekomen. Hoe ideologischer de teksten in de corpora, hoe groter de kans op het vinden van een eventuele correlatie met de filosofische tegenstelling tussen vrije wil en determinisme. Het spreekt dus voor zich dat in de VS bijvoorbeeld de State of the Unions – een jaarlijkse toespraak waarin de democraten en republikeinen hun ideologie nog eens op een rijtje zetten – interessanter zijn dan pakweg de Weekly Addresses – wekelijkse verslagen van de partij over hoe tegen de actualiteit aangekeken wordt. 3.2.1.1
Amerikaanse partijen
Voor het Amerikaanse deel heb ik een corpus gemaakt voor zowel de democraten als de republikeinen. Elk corpus bevat the State of the Unions, de Inaugural Adresses en de Party Platforms sinds de Tweede Wereldoorlog. Deze toespraken zijn gekozen vanwege hun vermoedelijk hoog ideologisch gehalte; het tijdsbestek is zo gekozen vanwege de vrees voor teveel individueel gewicht van F. Roosevelt.7 Die toespraken zijn allen te vinden op The American Presidency Project, een website die alle
7
F. Roosevelt was president van 1933 tot 1945 en ziet dus een hoger aantal toespraken vertegenwoordigd in de databank.
22
publieke toespraken van Amerikaanse presidenten beschikbaar stelt voor het publiek.8 Het eenvoudigweg kopiëren van deze toespraken in Kladblok creëerde corpora van 539.732 en 561.375 woorden, klaar voor verder frequentie- en collocatieonderzoek. De verwachting is dus dat de gevonden data voor de partijen in de VS op een zekere manier zal correleren met de data die de filosofische tegenstelling typeert. 3.2.1.2
Vlaamse partijen
Voor de politiek in Vlaanderen ligt dat enigszins anders omdat er hier natuurlijk meer partijen zijn. Hier werd voor elke partij een corpus gecreëerd. Enkel de huidige, voornaamste partijen werden daarvoor in acht genomen, zijnde (volgens aantal stemmers in 2014) N-VA, CD&V, Open Vld, SP.A, Groen, VB en PVDA. Voor deze partijen bestaat in tegenstelling tot de politiek in de VS geen databank die alle toespraken documenteert. Voor het samenstellen van corpora moest ik daarom mijn toevlucht nemen tot andere teksten die zowel ideologisch geladen als toegankelijk zijn. Ten eerste zijn dat de partijprogramma’s die elke partij naar aanleiding van verkiezingen telkens publiceert. Steevast wordt daarin vanuit een algemene ideologie vertrokken die uiteindelijk leidt tot de concrete partijstandpunten. De grootste tekst die deel uitmaakt van de corpora per Vlaamse partij is de transcriptie van interviews met de partijvoorzitters in Reyers Politiek. Reyers Politiek is een variant van Reyers laat, een praatprogramma op Canvas, dat twee weken speelde in April 2014. Voorafgaand aan de verkiezingen in mei van dat jaar, werden de voorzitters van de zeven grootste partijen beurtelings uitgenodigd om hun ideologie te mogen verdedigen, vergezeld door een medepartijgenoot. Iedere keer werd gevraagd naar de ideologische situering en een omvattende quote, die het opstapje vormden naar een discussie over ideologie. Het spreekt voor zich dat een transcriptie van deze uitgebreide interviews goed corpusmateriaal zou zijn vanwege hun hoge ideologische lading. Echter, de grote moeilijkheid was precies die transcriptie. De totale gesprekstijd van de interviews was om en bij de zeven uur, waardoor het zelf uitpennen dan ook teveel tijd zou vergen. Hierom werd geopteerd voor spraakherkenningssoftware. De zeven interviews liet ik integraal en duidelijk hoorbaar afspelen op Deredactie.be waar ze nu nog steeds beschikbaar zijn. Terwijl liet ik het programma alles neerschrijven. Dergelijke programma’s hebben weinig tot geen moeite op alles wat gezegd wordt als woord te begrijpen. Waar ze wel nog achterop hinken is het herkennen van de zinnen als geheel. Waar een zin begint of eindigt herkent hij vaak fout, met leestekens op de vreemdste plaatsen als gevolg. Echter, voor de doeleinden die ik op het oog heb is dat geen obstakel: hier gaat het louter om woordfrequentie. Naast de partijprogramma’s, die telkens vooraf gingen aan de verkiezingen van de laatste tien jaar, en de transcripties van de interviews in Reyers Politiek, bevatten de Vlaamse corpora ook alle nieuwsstukken van de websites van de betreffende partijen, van het afgelopen jaar. Nu kan men twijfels hebben bij de ideologische lading van deze laatste bronnen: waar de partijprogramma’s en
8
Te raadplegen op http://www.presidency.ucsb.edu/, actueel met een vertraging van twee weken. Elke Amerikaanse toespraak is er te vinden – van G. Washington in 1789 tot B. Obama in 2015.
23
transcripties letterlijk de betreffende ideologie zullen verdedigen, is dat voor de nieuwsstukken minder evident. Echter, zoals (Stubbs, 1996) opmerkt, zijn teksten altijd intertekstueel en worden ze geschreven volgens bepaalde routines en conventies. Of zoals (Fairclough 1992) beargumenteert, worden teksten gekenmerkt door een 'onbewuste achtergrond', d.i. een geheel van verwachtingen en conventies. Met andere woorden, ook nieuwsstukken worden geschreven worden vanuit een ‘onbewuste achtergrond’. En dan rijst nog maar de vraag hoezeer die achtergrond ‘onbewust’ is op politieke websites. Gesteund door deze auteurs, baseer ik me op het idee dat ook nieuwsstukken op politieke websites systematisch de betreffende ideologie uiten en om die reden goed aanvullend corpusmateriaal zijn. Eerst kopiëerde ik de besproken teksten per partij in een Word-bestand. Dat liet me toe om eenvoudig het totale woordaantal te bepalen, én om nog een enkele aanpassing door te voeren. Het was me namelijk opgevallen dat veel van de partijprogramma’s en enkele nieuwsstukken telkens een hoofding per bladzijde hadden die steeds mee gekopiëerd werd. ‘Verandering voor vooruitgang’ is zo’n voorbeeld dat bovenaan elke bladzijde staat van het N-VA programma in 2014. Die hoofdingen geven natuurlijk een vertekend beeld voor de woordfrequentie en dus koos ik ervoor om die niet mee te rekenen. Enkel de vlakke tekst van de teksten werd overgehouden. De Word-bestanden kopiëerde ik vervolgens in een Kladblok-bestand, om zo zeven partijcorpora te bekomen die ik aan verder onderzoek kon onderwerpen in de concordancer AntConc. In tabel 1 staan de gegevens van de opgestelde Vlaamse, alsook de Amerikaanse corpora samengevat. Tabel 1: overzicht van samengestelde politieke corpora
Amerikaanse partijen Democraten Republikeinen
3.2.1.3
Totaal woordaantal 539 732 561 375
Soort teksten in het corpus State of the Unions, Inaugural Adresses en Party Platforms
Vlaamse partijen N-VA Open VLD SP.A Groen VB CD&V PVDA
Totaal woordaantal 330 764 328 847 321 709 298 780 325 104 310 899 290 203
Soort teksten in het corpus Partijprogramma’s, interviewtranscripties en websitedocumenten
Verschillende samenstelling als struikelblok?
Het is duidelijk dat de corpora voor de Vlaamse partijen veel heterogener zijn dan de corpora die ik voor de democraten en republikeinen in de VS opstelde. Die laatsten bestaan namelijk louter uit presidentiële toespraken, bovendien over een langere tijdspanne. De Vlaamse corpora zijn heterogener omdat het materiaal dat voorhanden is beperkter is en er geen databank bestaat die het verzamelt. Dat is een factor die ik niet kan negeren. Stel dat zou blijken dat ik voor de Vlaamse en Amerikaanse corpora verschillende resultaten vind, dan kan dat te wijten zijn aan hun verschillende samenstelling. Zo zouden bv. de Amerikaanse toespraken in de praktijk veel ideologischer geladen kunnen zijn dan de bronnen die ik in de Vlaamse corpora gebruikte, ook al had ik dan het voornemen om eveneens ideologische Vlaamse teksten te kiezen. De verschillende samenstelling van de Vlaamse en Amerikaanse corpora leidt er met andere woorden toe dat ik geen conclusies zal kunnen trekken over welk gebied nu meer of minder aansluit bij de
24
filosofische idealen. Gelukkig is dat ook helemaal niet wat deze masterproef beoogt. Het doel is om te kijken of de onderlinge politieke verschillen binnen elk gebied correleren met het filosofische onderscheid. Wat dus wel belangrijk is, is dat de corpora binnen de VS en binnen Vlaanderen onderling vergelijkbaar samengesteld zijn. En dat is wel het geval. Ten eerste zijn voor de twee Amerikaanse corpora dezelfde toespraken gekozen (met name de State of the Unions, de Inaugural Adresses en de Party Platforms) en ten tweede geldt dat beide partijen sinds WOII een gelijk (of quasi gelijk met een verschil van één jaar) aantal jaren de president afgeleverd hebben. Dat houdt in dat er voor elke toespraak een (quasi) gelijk aantal equivalente toespraken zijn voor de democraten en republikeinen. Daarnaast zijn ook de zeven Vlaamse corpora op vergelijkbare wijze samengesteld. De partijprogramma’s, de interviewtranscriptie en de nieuwsstukken hebben voor de zeven partijen telkens een (ongeveer) even groot aandeel in de corpora. Kortom, zowel de zeven Vlaamse corpora als de twee Amerikaanse corpora zijn onderling wél te vergelijken omdat de samenstelling als beïnvloedbare factor verbannen is. Wel is het zo dat de corpora in beide gevallen zoveel mogelijk ideologische teksten bevat; dat was immers een van de criteria. Dus hoewel ik de corpora voor Vlaanderen en de VS om bovenvermelde redenen niet zal vergelijken, loont het wel de moeite om de uiteindelijke conclusies voor beide deelgebieden naast elkaar te leggen. Mocht immers blijken dat zowel de politieke tegenstellingen hier als ginds correleren met de filosofische tegenstelling, dan zou het zonde zijn om daar niet op te wijzen. Vergelijkbare resultaten zouden namelijk doen vermoeden dat de correlatie met determinisme-vrije wil een universeel politiek verschijnsel is. En omgekeerd, verschillende resultaten zouden die universaliteit mogelijks ontkrachten. Kortom, de verschillende samenstelling van de corpora is een struikelblok voor het vergelijken van data, maar het verbiedt ons niet de uiteindelijke resultaten naast elkaar te leggen.9 Sleutelwoorden voor politieke partijen 3.2.2.1
Sleutelwoorden als woorden met een hoge keyness
Voor het opstellen van de politieke woordenlijsten gebruikte ik een concordancer. Dat is software die toelaat om corpora kwantitatief te onderzoeken. Zelf gebruikte ik het programma AntConc10 dat het onder meer mogelijk maakt om de woorden in ingegeven corpora op te lijsten op hun frequentie, en de cotext (de collocaties) van die woorden op te vragen. De meest interessante feature is echter het genereren van de keyness per woord. Om dit te gebruiken laad je twee corpora als Kladblokbestand in het programma: een referentiecorpus en het te onderzoeken corpus. Een woord heeft een hoge keyness als het verschil in frequentie tussen beide corpora hoog is in het voordeel van het te onderzoeken corpus (met andere woorden, als het vaak voorkomt in vergelijking met het referentiecorpus). Het vergelijken met een referentiecorpus is essentieel. Het louter bekijken van de absolute woordfrequentie volstaat niet omdat bepaalde lidwoorden, hulpwoorden… nu eenmaal in elke tekst
9
Waarbij de factor van de verschillende samenstelling van de corpora echter niet uit het oog verloren wordt. Dat is een variant van het bekendere WordSmith. Het is echter gratis te downloaden.
10
25
veel voorkomen. Woorden die zeer frequent voorkomen, hoeven dus niet per se typerend te zijn en een hoge keyness te bevatten. De wijze waarop de keyness van de woorden berekend wordt is niet zo eenvoudig als het louter aftrekken van beide frequenties (m.a.w. het verschil in absolute waarden). Daarmee zou voorbijgegaan worden aan de moeilijkheid dat de vergeleken corpora nooit identiek even groot zijn. Een gelijk aantal frequenties voor een woord zou immers toch een hoge keyness kunnen betekenen als het referentiecorpus bv. vele malen groter is. De precieze wijze hoe dit probleem verholpen wordt geef ik later met concrete voorbeelden, maar het is alvast duidelijk dat gebruik zal worden gemaakt van de relatieve frequenties en een corpuscoëfficiënt. 3.2.2.2
Referentiecorpora
De opzet is om de corpora die ik voor de partijen in de VS (twee) en Vlaanderen (zeven) heb opgesteld te vergelijken met een referentiecorpus. Voor dat referentiecorpus had ik verschillende mogelijkheden. Een mogelijkheid voor de Nederlandstalige corpora was het Stevin, een Nederlandstalig referentiecorpus van meer dan 500 miljoen woorden gecreëerd door SoNaR-project.11 En ongetwijfeld zijn er ook diverse Engelstalige corpora voorhanden. Met dergelijke corpora is echter een groot nadeel verbonden. Omdat de door mijzelf samengestelde corpora zich in de politieke sfeer situeren, zouden ongetwijfeld veel algemeen politiek getinte woorden hoog scoren op hun keyness. Het valt dan te verwachten dat veel sleutelwoorden bij verschillende van die politieke corpora zouden voorkomen, louter omdat ze met politiek te maken hebben en níet omdat ze typerend zijn voor de ideologie van de afzonderlijke partijen. Echter, dat laatste is precies wat ik zou willen bereiken. Een mogelijke oplossing daarvoor is het creëren van referentiecorpora per partij die telkens alle door mijzelf samengestelde corpora bevat, met uitzondering van de partij waarmee ik ze vergelijk. Bijvoorbeeld, als referentiecorpus voor de N-VA neem ik de corpora van de Open VLD, SP.A, Groen, VB, PVDA en CD&V samen onder één groot corpus. Voor het Amerikaanse deel is het eenvoudiger; daar kan het republikeinse corpus als referentie dienen voor het democratische en vice versa. Een dergelijke werkwijze heeft verschillende voordelen. Ten eerste zullen precies die woorden een hoge keyness genereren die typerend zijn voor de partij afzonderlijk (en niet voor politiek in het algemeen). Omdat algemeen politiek getinte woorden ook in de referentiecorpora voorkomen, zullen zij immers geen hoge keyness genereren. De partijen krijgen zo woordenlijsten die specifiek voor hun partij karakteristiek zijn en contrasteren met die van de andere partijen op basis van hun partijgebonden ideologie. Bovendien zijn de referentiecorpora in het Vlaamse deel door het samennemen zes maal groter en bijgevolg betrouwbaarder. Tot slot is het een efficiënte manier om om te springen met het materiaal dat ik al had. Ik hoef geen extra corpora samen te stellen maar ‘recycleer’ degenen die ik samengesteld had.
11
http://lands.let.ru.nl/projects/SoNaR/description.html
26
3.2.2.3
Uiteindelijke werkwijze
Nu geweten is wat de keyness is en hoe ik aan referentiecorpora kwam, kon ik de eigenlijke data vergaren. Ten eerste laadde ik het democratische en republikeinse corpus in AntConc, een als het te onderzoeken corpus en de ander als referentiecorpus, erna omgekeerd. Het resultaat waren twee (lange) lijsten van woorden, gerangschikt op hun keyness (ter herhaling, dus op de mate waarin ze het betreffende corpus karakteriseren). Deze lijsten werden naar het rekenblad Excel gekopieerd voor verdere analyse. Een eerste grote filtering die ik doorvoerde was op absolute frequentie: die moest minstens 100 zijn. Het is namelijk risicovol om conclusies te trekken uit een beperkt aantal voorkomens. Hoewel die voorkomens toch een hoge keyness-waarde kunnen hebben, bestond het risico dat een enkele tekst binnen het corpus voor hun aanwezigheid verantwoordelijk is. Door te filteren op een minimale frequentie, vermeed ik dit risico. Door 100 als grens te nemen kon ik er vanuit gaan dat de attestaties voldoende verspreid waren binnen het corpus. Op die manier hebben ze meer kans om vanwege een ideologische reden voor te komen, meer dan door een enkele tekst in het corpus. Anderzijds mocht ik de grens ook niet te hoog leggen. 100 als gekozen grens blijkt toch nog ‘tolerant’ genoeg om voldoende resultaten over te houden voor het verdere onderzoek. Een tweede filtering voerde ik door op de inhoudsloze woorden (veelal lid- en voegwoorden, maar ook hulpwerkwoorden, eigennamen enzovoort). Door de relatieve waarden in beschouwing te nemen had ik veel van deze woorden alreeds verbannen, maar toch blijken woorden als to, that, should, ought… soms een verrassend hoge keyness te bevatten, en dus toch meer gebruikt te worden door een van beide partijen. Het is duidelijk dat deze inhoudsloze woorden zich minder lenen voor dit onderzoek. Uiteindelijk legde ik de grens op het filteren van voegwoorden, voornaamwoorden, lidwoorden en hulpwerkwoorden. Zelfstandige naamwoorden, volle werkwoorden en adjectieven bleven over. Het resultaat waren twee Amerikaanse woordenlijsten beide rijp voor verder woordfrequentie- en collocatieonderzoek met de filosofische sleutelwoorden. Zie 4.1.1 voor een overzicht. Een derde aanpassing die ik had kunnen doorvoeren – maar die ik uiteindelijk niet deed – was het samennemen van afleidingen op hetzelfde grondwoord. Het viel namelijk op dat sommige woorden als verschillend aanzien werden terwijl ze dat inhoudelijk niet of nauwelijks zijn. Het is bv. niet onredelijk om de woordaantallen voor democracy, democracies, democrat, democrats en democratic per corpus op te tellen en als één woord te behandelen. Dit heb ik om verschillende redenen niet gedaan. Ten eerste rijst de moeilijkheid van de plaats waar ik de grens trek. Dat het verschil tussen republican en republicans louter grammaticaal is behoeft geen uitleg, maar minder evident is om bv. free en freedom onder een noemer te nemen. Hoewel verwant, dekken beide niet meer precies dezelfde ideologische lading. Daarnaast was deze aanpassing door de verdere werkwijze van het onderzoek ook gewoon niet nodig. Als de verwante woorden de filteringen doorstonden, dan zouden ze evenzeer hun gewicht in het verdere onderzoek uitoefenen. Ook zonder het samennemen van hun frequenties. Kortom, de gevonden woordenlijsten werden uiteindelijk alleen aangepast op basis van frequentie (minimum 100) en woordsoort (enkel inhoudelijke woorden). De werkwijze voor het vinden van sleutelwoorden voor de Vlaamse partijen was vrijwel analoog. Het enige verschil was zoals gezegd de samenstelling van de referentiecorpora. Zeven keer laadde ik
27
een van de partijcorpora in in AntConc, en nam ik telkens de zes andere corpora samen als referentiecorpus.12 Voor het overige werden de gevonden resultaten eveneens gekopiëerd naar het rekenblad Excel om dezelfde wijzingen door te voeren. De filtering op woordfrequentie gebeurde hier wel met een minimum van 50 in plaats van 100. De Vlaamse partijcorpora waren immers kleiner dan de Amerikaanse, en in het andere geval zou ik te weinig resultaten over houden voor het verdere onderzoek. Ten slotte werden ook hier de lid-, voeg-, voornaam- en hulpwerkwoorden buiten beschouwing gelaten. De zeven reeksen sleutelwoorden die overbleven zijn nu, net als de Amerikaanse, rijp voor verder woordfrequentie- en collocatieonderzoek met de filosofische sleutelwoorden. Zie 4.1.2 voor een overzicht. Ter verduidelijking geef ik tot slot één voorbeeld van hoe de keyness juist berekend werd. Normaal zou de keyness van een woord simpelweg het verschil in absolute frequentie zijn. Hoe groter dat verschil, hoe karakteristieker het is voor een van de corpora. Maar zoals gezegd zijn de absolute frequenties van de woorden niet geschikt om de corpora te vergelijken, omdat die laatsten nooit precies even groot zijn. In de plaats wordt dus de keyness berekend alsof de corpora even groot zouden zijn. Daarvoor wordt een van de waarden vermenigvuldigt met een bepaalde factor, een corpuscoëfficiënt, die het verschil in corpusgroottes opheft. Een concreet voorbeeld: het woord freedom komt in het republikeins corpus (dat 561375 woorden bevat) 855 keer voor. In het democratische corpus (van 539732 woorden) is dat slechts 393 keer. Echter, het democratische corpus is iets kleiner, waardoor diens frequenties met een corpuscoëfficiënt vermenigvuldigd moeten worden. Die factor is de verhouding van beide corpusgroottes: 561375 delen door 539732 geeft ~1,04009953 als corpuscoëfficiënt. Die factor maal de democratische frequentie 393 geeft 408,759.13 Het verschil hiervan met de republikeinse frequentie 855 bedraagt 446,24 als keyness. Zoals uit de resultaten zal blijken is dit overigens een betrekkelijk hoge waarde en zal freedom bijgevolg als republikeins sleutelwoord gelden. Sleutelwoorden voor filosofische idealen Het opstellen van woordenlijsten voor filosofische idealen als vrije wil en determinisme is een stuk minder evident dan hun politieke tegenhangers. Net als bij de politieke sleutelwoorden wil ik die – in de mate van het mogelijke – ook hier bereiken op een objectieve manier. Toch zal snel blijken dat een louter objectieve werkwijze hier veel moeilijker is. Aanvankelijk had ik twee mogelijkheden om deze filosofische woordenlijsten te objectiveren en dus te onttrekken aan mijn persoonlijke intuïtie. De eerste daarvan was het zoeken naar auteurs die zich bv. sterk in het deterministische of het vrije wil-ideaal situeren en zelf dergelijke woordenlijsten verschaffen. Zoals Lakoff politieke woordenlijsten had gegeven voor democraten en republikeinen in de VS hoopte ik ook een dergelijk vooraanstaand figuur te vinden in het filosofische debat. Ondanks veel opzoekwerk heb ik een dergelijke auteur echter niet gevonden en moest ik dus toevlucht
12
Voordien had ik telkens de zes andere onder elkaar gezet in een Kladblok-bestand, dat dus als referentiecorpus kon dienen voor de zevende partij. 13 Deze hypothetische waarde geeft weer hoeveel keer we freedom zouden verwachten in een democratisch corpus, mocht dat corpus even groot zijn als het republikeinse.
28
nemen tot een andere manier. Een tweede mogelijkheid was het zelf uitvoeren van een (beperkt) kwantitatief onderzoek naar sleutelwoorden. Net zoals ik door het opstellen van politieke corpora politieke sleutelwoorden heb achterhaald, was dat eventueel ook mogelijk voor dit filosofische deel. Het idee was dat ik voor zowel determinisme als vrije wil een corpus samenstelde, om op analoge wijze via AntConc sleutelwoorden te bepalen. In dit geval zouden de corpora ook enkel daarvoor dienen (de politieke corpora zal ik immers ook nog gebruiken voor het komende frequentieonderzoek met de filosofische sleutelwoorden). Het spreekt voor zich dat dergelijke filosofische corpora minder betrouwbaar zullen zijn dan hun politieke tegenhangers. Ten eerste zullen ze minder groot zijn, maar bovendien zijn de criteria voor de teksten minder duidelijk afgebakend. Bij de politieke corpora kon ik als voorwaarde stellen dat alle teksten telkens tenminste door de partijen gecreëerd zijn. Maar hier rijst meteen de vraag uit welke teksten een corpus bestaat dat determinisme en vrije wil moeten karakteriseren. Ik besloot om uiteindelijk te zoeken op essays in PDF-bestanden die handelen over determinisme en vrije wil apart. Uiteindelijk bleken er heel wat dergelijke essays op het internet te circuleren. Het gaat daarbij om veelal verdedigingen van de idealen apart, waarom we bv. niet kunnen leven zonder het accepteren van vrije wil, waarom een deterministische visie verrijkend kan zijn in het begrijpen van sociale processen, enzovoort. Het onder elkaar zetten van deze essays in Kladblok leverde corpora op van respectievelijk 140 594 en 126 309 woorden voor vrije wil en determinisme. Hoewel er vragen kunnen gesteld worden bij de representativiteit van deze corpora had ik op dit punt wel goede hoop op representatieve woordenlijsten. De opgestelde corpora waren overigens niet meer dan een middel om die woordenlijsten te bekomen.14 Op dezelfde wijze als in het politieke deel, laadde ik beide bestanden in AntConc, telkens één als het te onderzoeken corpus en één als referentiecorpus. Ook hier is het zo dat wanneer ik sleutelwoorden wil bekomen voor bv. determinisme, ik het betreffende corpus beter contrasteer met een corpus over vrije wil dan met een algemeen corpus. Op die manier hoop ik woorden te verkrijgen die echt karakteristiek zijn voor het deterministische ideeëngoed en vrije wil als tegenpool hebben. Het resultaat waren twee woordenlijsten, beide gerangschikt op hun keyness. Deze lijsten werden naar het rekenblad Excel gekopieerd voor verdere analyse. Daar maakte ik dezelfde aanpassingen als bij de politieke woordenlijsten: de woorden die minder dan 50 keer voorkwamen liet ik buiten beschouwing, alsook de lid-, voeg-, voornaam- en hulpwerkwoorden. De woordenlijsten zijn op dit punt klaar voor frequentieonderzoek in de politieke corpora en collocatieonderzoek met de politieke sleutelwoorden. Belangrijk te vermelden is dat de gevonden sleutelwoorden tot op dit punt Engelstalig waren. Dat is nodig voor het Amerikaanse deel van het onderzoek, maar wordt natuurlijk een probleem wanneer ik de Nederlandstalige corpora en sleutelwoorden erbij betrek. Simpelweg vertalen lijkt voor de hand liggend, maar men kan zich de vraag stellen of ik op die manier niet voorbij ga aan het feit dat vertalingen nooit exact dezelfde lading dekken. Waar de gevonden set woorden misschien in het Engels goed de idealen vrije wil en determinisme representeren, zou dat in het Nederlands misschien
14
Anders dan bij de politieke corpora, die ook de basis zullen vormen voor het verdere woordfrequentieonderzoek.
29
minder het geval kunnen zijn. Toch meen ik dat een eenvoudige vertaling in dit geval probleemloos kan. In het Nederlands typeren de woordenlijsten mijns inziens even goed de filosofische tegenstelling. Bovendien is de tegenstelling tussen vrije wil en determinisme allesbehalve cultuurgebonden, maar net zeer universeel: het wijsgerige debat is in Amerika net dezelfde als bij ons. Zie 4.2 voor een overzicht van de filosofische sleutelwoorden, in het Engels en het Nederlands.
3.3 Correlatie tussen politieke en filosofische data Op dit punt heb ik enerzijds data (corpora en woordenlijsten) voor de politieke partijen en anderzijds data (woordenlijsten) voor de filosofische idealen. In die gegevens ga ik op twee manieren opzoek naar een correlatie. Ten eerste zal ik de frequentie van de filosofische woorden nagaan in de politieke corpora. Ten tweede is het mogelijk om te onderzoeken in welke mate de gevonden filosofische en politieke woorden met elkaar colloqueren. Voor beide geldt: hoe hoger respectievelijk de frequentie en het aantal collocaties, hoe sterker de correlatie tussen de betreffende partij en het filosofisch ideaal. Figuur 2 kan verduidelijken welke data ik wil verzamelen en hoe ik een correlatie wil zoeken voor bv. het deelonderzoek in de VS. Zowel bij het woordfrequentie- als het collocatieonderzoek geef ik hypothesen en verwachtingen met betrekking tot de resultaten.
Figuur 2: overzicht van de twee deelonderzoeken in de VS
Woordfrequentieonderzoek In deze masterproef ben ik uitgegaan van het inzicht van (Scott, 2001) dat woordfrequentie een idee geeft van de inhoud van een tekst. Met die basis heb ik onder meer politieke woordenlijsten samengesteld die de ideologie moet weergeven van ideologische teksten die door de partijen geschreven zijn. Het is ditzelfde idee waarop ik me zal baseren voor dit woordfrequentieonderzoek. Belangrijk om op te merken is dat het hier om een continuüm gaat. Niet alleen geven de frequente woorden een idee waarover een tekst gaat, maar ook geven de niet-frequente woorden een idee waarover een tekst veel minder of net niet gaat, met alle gradaties daartussen. Althans, dat is het idee dat Scott verdedigt en waarop ik dit woordfrequentieonderzoek baseer. Ik heb al aangegeven dat een dergelijk onderzoek op zich niet volstaat omdat het bijvoorbeeld geen rekening houdt met negatief gebruik van woorden. Vandaar dat ik aanvullend ook collocatieonderzoek heb gedaan. De opzet van het woordfrequentieonderzoek is om de frequentie van de twee sets filosofische sleutelwoorden na te gaan in de politieke corpora, en die te vergelijken met de frequenties in de referentiecorpora. Het is namelijk belangrijk om steeds te vergelijken, en de relatieve cijfers in beschouwing
30
te nemen in plaats van de absolute. Bij de absolute cijfers zou het immers kunnen zijn dat bv. de deterministische set sleutelwoorden toevallig gewoon meer voorkomen. Het zou gevaarlijk zijn om conclusies te trekken als ‘dit corpora leunt meer aan bij determinisme dan bij vrije wil’ louter omdat die woorden vaker voorkomen in absoluut aantal. Dit risico vermijd ik door de frequentie van filosofische sleutelwoorden in de corpora te vergelijken met hun frequentie in de referentiecorpora. Concreet ging ik voor elk van de 20 sleutelwoorden, voor determinisme én vrije wil, de frequentie na in de partijcorpora, waarna ik deze aantallen voor de filosofische idealen apart optelde. Ik hield daarbij geen rekening met inflexie. Zo werd bij het aantal attestaties voor choice het aantal voor choices eenvoudigweg opgeteld. Voor de republikeinen in het Amerikaanse deel had ik bijvoorbeeld 4321 attestaties in totaal voor de (variaties op) sleutelwoorden bij vrije wil, en 713 attestaties voor de deterministische sleutelwoorden. Vervolgens deed ik juist hetzelfde met het referentiecorpus per partij – in dit geval het democratische corpus. Daarvoor waren de aantallen respectievelijk 2855 en 719. Meteen valt hier op dat de aantallen voor vrije wil veel hoger liggen dan die voor determinisme. Dat wil echter nog niet veel zeggen omdat de deterministische sleutelwoorden misschien gewoon aan zich minder gebruikt worden. Een vergelijking tussen corpus en referentiecorpus is dus nodig. Daarvoor vermenigvuldig ik de democratische aantallen met een corpuscoëfficiënt 1,0401 (zie 3.2.2) en deel ik beide aantallen door elkaar. In het voorbeeld geeft dat 4321 / (2855 x 1,0401…) = 1,455135 en 713 / (719 x 1,0401) = 0,953423. Deze uitkomsten geven weer wat de verhoudingen zijn tussen het republikeins en democratisch gebruik van de filosofische sleutelwoorden. Met andere woorden, de republikeinen gebruiken 4,7% minder deterministische sleutelwoorden en maar liefst 45,5% méér sleutelwoorden die vrije wil typeren. In tabel 2 hieronder staat ter verduidelijking nog eens het sjabloon dat ik op elke partij toepaste. De eerste kolom is de set sleutelwoorden voor vrije wil en determinisme, de tweede kolom bevat het aantal attestaties in een partijcorpus en de derde kolom bevat het aantal attestaties van het referentiecorpus voor het betreffende partijcorpus. Kolom vier bevat de verhoudingen van deze laatste twee. Merk op hoe ik de waarden voor de referentiecorpora telkens vermenigvuldig met een betreffende corpuscoëfficiënt.15 Dat is nodig om de waarden van beide corpora te vergelijken. Ik bekijk de referentiecorpora met andere woorden alsof ze even groot zijn als de partijcorpora. In de laatste rij staan tot slot de totale verhoudingen van het totale aantal gebruikte filosofische sleutelwoorden in het vet. Het zijn naar deze twee waarden (één voor de deterministische en één voor de vrije wil-sleutelwoorden) dat ik per partij op zoek ga. Ze geven weer in welke mate een partij de beide sets filosofische sleutelwoorden gebruikt, hetzij opvallend meer dan andere partijen, hetzij opvallende minder, hetzij ongeveer in dezelfde mate. Ik zal deze waarden de filosofische verhoudingen noemen.
15
De corpuscoëfficiënt is de verhouding tussen de totale grootte van de partijcorpora en hun referentiecorpora. Ze is dus voor elke partij anders.
31
Tabel 2: sjabloon toegepast op elke partij, bij woordfrequentieonderzoek
Free will woord 1 woord 2 woord 3 woord 4 woord 5 woord 6 woord 7 woord 8 woord 9 TOTAAL
Freq x1 x2 x3 x4 x5 x6 x7 x8 x9 xT
Freq REF y1 y2 y3 y4 y5 y6 y7 y8 y9 yT
Verhouding x1 / (y1 * cc) x2 / (y2 * cc) x3 / (y3 * cc) x4 / (y4 * cc) x5 / (y5 * cc) x6 / (y6 * cc) x7 / (y7 * cc) x8 / (y8 * cc) x9 / (y9 * cc) xT / (yT * cc)
Determinism woord 1 woord 2 woord 3 woord 4 woord 5 woord 6 woord 7 woord 8 woord 9 TOTAAL
Freq x1 x2 x3 x4 x5 x6 x7 x8 x9 xT
Freq REF y1 y2 y3 y4 y5 y6 y7 y8 y9 yT
Verhouding x1 / (y1 * cc) x2 / (y2 * cc) x3 / (y3 * cc) x4 / (y4 * cc) x5 / (y5 * cc) x6 / (y6 * cc) x7 / (y7 * cc) x8 / (y8 * cc) x9 / (y9 * cc) xT / (yT * cc)
In het gegeven Amerikaanse voorbeeld zagen we dat het aantal attestaties voor vrije wil een stuk hoger lag dan die voor determinisme. Dat was zowel het geval bij het republikeinse corpus als het referentiecorpus (d.i. het democratische corpus). Toch is dit zoals gezegd niet de reden voor een filosofische verhouding in het voordeel van vrije wil bij de republikeinen. Het is omdat zij relatief – dus in vergelijking met het referentiecorpus – meer vrije wil-sleutelwoorden gebruiken dat die verhouding zo hoog ligt, met name op 45,5%. Zie 4.3 voor de interpretatie van dit resultaat en die van de andere partijen, maar het mag alvast duidelijk zijn dat dit een significant cijfer is. De verhouding bij de deterministische sleutelwoorden, 4,7%, is dat waarschijnlijk niet. Kortom, de kans is groot dat republikeinen dichter aanleunen bij vrije wil als filosofisch ideaal, maar dat zowel republikeinen als democraten een deterministisch wereldbeeld niet bijzonder genegen zijn. Hypothesen woordfrequentieonderzoek Bij het woordfrequentieonderzoek is er sprake van een correlatie zodra de zogenoemde filosofische verhoudingen voor de partijen afwijken van 1. Die verhouding zou 1 zijn mochten partijen in dezelfde mate de filosofische sleutelwoorden gebruiken als de andere partijen. Toegepast op het onderzoek zou dat willen zeggen dat de partijcorpora en hun betreffende referentiecorpora in verhouding evenveel de filosofische sleutelwoorden bevatten. Mocht dit het geval zijn, dan valt te concluderen dat het filosofisch woordgebruik niet afhangt van de partij, en er dus geen correlatie is. Wanneer ik echter filosofische verhoudingen uitkom die met een bepaalde significantie afwijken van 1 – d.i. als er partijcorpora zijn die opvallend meer of minder filosofische sleutelwoorden bevatten dan hun referentiecorpora – dan is er mogelijk wél een correlatie. De verwachting is kortom dat ik de partijen zal kunnen rangschikken op hun filosofische verhouding voor zowel vrije wil als determinisme. De hoogste waarden zullen ergens boven 1 liggen, de laagste waarden ergens onder 1. Een belangrijk gevolg van de wijze waarop de filosofische verhoudingen berekend werden is dat hun product per deelgebied precies 1 zal zijn. Bijvoorbeeld voor Vlaanderen nam ik telkens de zes andere partijen als referentiecorpus. De filosofische verhoudingen die ik bereken zijn dus altijd relatief ten opzichte van de zes andere partijen. Als ik voor een partij een positieve verhouding uitkom voor pakweg determinisme (en zij dus meer deterministische sleutelwoorden gebruiken), dan is het een mathematische zekerheid dat ik minstens één ander partijcorpus zal vinden die minder deterministische sleutelwoorden bevat dan zijn referentiecorpus. Het is belangrijk om dit op te merken omdat ik hierdoor louter in relatieve termen zal kunnen praten. Ik zal nooit kunnen concluderen dat een partij
op zich sterk aanleunt bij een deterministisch ideeëngoed, enkel dat het dat eventueel doet in vergelijking met andere partijen. Dit is een onvermijdelijk gevolg van het feit dat de ene set filosofische sleutelwoorden misschien aan zich meer voorkomen dan de andere, los van hun ideologische inhoud. In het Amerikaanse deelgebied is bovenstaande mogelijk beter te vatten. Er zijn maar twee partijen waardoor het referentiecorpus telkens het corpus is van de andere partij. Ik gaf in de methodologie al een gevonden resultaat als voorbeeld, met name dat de republikeinen 50,2% meer vrije wil-sleutelwoorden gebruiken – de filosofische verhouding is met andere woorden ~1,502. Ter herhaling, daarvoor deelde ik de republikeinse frequentie voor deterministische sleutelwoorden door de democratische (na het vermenigvuldigen met een corpuscoëfficiënt). Als ik het omgekeerde doe, en de democratische frequentie deel door de republikeinse, dan bekom ik logischerwijze de democratische verhouding, namelijk ~0,6658. Dat is ~0,3342 minder dan 1, of 33,42% dat de democraten minder deterministische sleutelwoorden gebruiken.16 ~1,502 en ~0,6658 zijn niet toevallig omgekeerden van elkaar; hun product is dus 1 en zo zal dat ook bij de zeven filosofische verhoudingen uit het Vlaamse deel zijn. Het komt er dus op neer dat ik de mate waarin de filosofische sleutelwoorden gemiddeld gebruikt worden, als referentie neem. Met die referentie vergelijk ik dan de partijen apart. Een bijkomende verwachting bij het frequentieonderzoek is dat de twee gevonden verhoudingen per partij, voor vrije wil en determinisme, zich ook op een bepaalde manier tot elkaar verhouden. Als een partij relatief veel deterministische sleutelwoorden gebruikt – en als de sleutelwoorden inderdaad een representatief staal zijn voor hun ideologie, de corpora goed samengesteld zijn, enzovoort – dan is de verwachting dat die partij relatief weinig vrije wil-sleutelwoorden zal gebruiken. Zoals besproken zijn determinisme en vrije wil namelijk in vrij hoge mate tegenpolen van elkaar. Natuurlijk zou het kunnen dat die filosofische verhoudingen voor vrije wil en determinisme samen hoog of net laag liggen bij een partij, bv. door de aard van de corpora of de sets sleutelwoorden. Toch zou het een mooie bevestiging zijn van de gebruikte methoden mochten die verhoudingen per partij (ongeveer) elkaars omgekeerde zijn.17 Een partij leunt in dat geval steeds aan bij één van beide filosofische uitersten, wat het beeld van een as tussen beide zou bevestigen. Hoewel er vormen van compatibilisme bestaan (zie 2 Status quaestionis) zijn de beide kanten van het filosofisch debat in principe ook moeilijk te verzoenen. Althans inhoudelijk, want of dat kwantitatief bevestigd wordt, zal dus moeten blijken. Collocatieonderzoek In de verantwoording voor de methodologie heb ik het gehad over collocaties en hoe deze, net als sleutelwoorden, een objectieve maatstaf kunnen zijn voor betekenis. Met de woorden van (Firth, 1957) “You shall know a word by the company it keeps”. Op dit inzicht is dit deelonderzoek gebaseerd. Anders gesteld, hoe vaker woorden in elkaars buurt terug te vinden zijn, hoe meer die woorden in eenzelfde betekenissfeer zijn te situeren zijn. Net als bij het woordfrequentieonderzoek is hierbij
Het is verschil met 1 is steeds een percentage. Een verhouding 1,60 betekent ‘60% meer’, een verhouding 0,60 betekent ‘40% minder’. 17 Voor de duidelijkheid, het zou zomaar kunnen dat een partij laag scoort voor beide filosofische uitersten. In dat geval worden vrije wil en determinisme niet als tegengestelden van elkaar bevestigd. 16
33
sprake van een continuüm. De mate waarin woorden bij elkaar voorkomen verschilt van woord tot woord, en dus zal hun ideologische of inhoudelijke link ook gradueel verschillen. Het idee is dat ik verschillende woordenlijsten met elkaar kan vergelijken. Hoe meer de woorden van twee woordenlijsten in elkaars buurt staan, hoe meer die woorden ook een inhoudelijke verwantschap vertonen. Bij collocatieonderzoek wordt, net als bij woordfrequentieonderzoek, gebruik gemaakt van corpora. In het voorgaande deel was het belangrijk op zelf die corpora samen te stelen, om zo telkens representatieve stalen te bekomen voor het discours van die partij. Hier zit de partijideologie echter vervat – of zou het althans vervat moeten zitten – in de politieke sleutelwoorden die ik opstelde. Wanneer ik ga zoeken naar collocaties tussen de politieke en filosofische sleutelwoorden, heb ik nood aan een corpus dat niet een enkele partij typeert, maar de gehele taal. Hoe groter en uitgebreider het corpus, hoe zekerder ik immers kan zijn in welke mate twee woorden met elkaar colloqueren. Voor het Amerikaans deel gebruikte ik hiervoor het CoCA. Dat is een online beschikbaar corpus van hedendaags Amerikaans taalgebruik van 450 miljoen woorden, en is dus representatiever dan de door mezelf opgestelde corpora. Bovendien bevat het corpus alle benodigde zoekfuncties om een collocatieonderzoek uit te voeren.18 Concreet is de werkwijze als volgt. In een Excelbestand maakte ik een rij met de Amerikaanse, politieke sleutelwoorden, en een kolom met de filosofische sleutelwoorden. Samen vormen deze een tabel (hieronder staat een sjabloon ter illustratie). Telkens zocht ik het aantal collocaties tussen de kruisende woorden op in het CoCA, waarna ik dit aantal opgaf in de tabel. In het CoCA zijn er twee in te vullen tekstvakken: ‘word(s)’ en ‘collocates’. In het eerste gaf ik het politieke sleutelwoord in, in zijn precieze vorm. In het tweede kwam telkens het filosofische sleutelwoord. Daarbij liet ik inflexie buiten beschouwing door (een deel van) het grondwoord te laten volgen door een asterisk (*). Het CoCA laat toe om op die manier tegelijk te zoeken naar woorden die enkel verschillen door inflexie. Bijvoorbeeld, een van de gevonden filosofische sleutelwoorden (zie 4.2) was responsibility voor vrije wil. Door in het collocatieveld responsib* in te geven kreeg ik het aantal collocaties van responsibility, responsibilities, responsible en responsibly. Hetzelfde deed ik bv. met possib* voor de varianten van possible en possibility. Tot slot laat het CoCA ook nog toe om het bereik van de opgegeven collocatie te bepalen. Om zoveel mogelijk resultaten te behalen, stelde ik die in op negen voor en negen na. Dat wil zeggen dat zodra de collocatie (hier het filosofische sleutelwoord) zich voordeed binnen negen woorden van het politieke sleutelwoord, dit gold als een ‘collocatieattestatie’. Het totale aantal daarvan gaf ik zoals gezegd in op de juiste plaats in het Excelbestand, waarvan ik hier een voorbeeldsjabloon bijvoeg (tabel 3):
18
Wel is het zo dat er per IP-adres aanvankelijk slechts 50 zoekopdrachten per dag uit te voeren waren. Gelukkig verhielp een kleine donatie dit probleem; vanaf dan zijn 200 zoekopdrachten mogelijk wat voldoende was voor mijn noden.
34
Tabel 3: sjabloon voor de collocatieaantallen tussen politieke en filosofische sleutelwoorden voor VS
Filosofisch sleutelwoord 1 Filosofisch sleutelwoord 2 (…) Filosofisch sleutelwoord 9 TOTAAL
Politiek sleutelwoord x
Politiek sleutelwoord y
(…)
Politiek sleutelwoord z
x1
y1
n1
z1
x2
y2
n2
z2
xn
yn
nn
zn
x9
y9
n9
z9
xT
yT
nT
zT
TT
Als tabel 3 betrekking zouden hebben op de democratische en deterministische sleutelwoorden, dan tonen de totale aantallen onderaan hoeveel keer het democratische sleutelwoord telkens met de set deterministische sleutelwoorden colloqueert. Het totale aantal rechts zou dan het totale collocatieattestaties van de democratische sleutelwoorden samen zijn, ware het niet dat een bepaalde berekening bijkomend is ingevoerd. Zoals aangehaald, typeren de politieke sleutelwoorden in een verschillende mate hun corpora, aan de hand van hun keyness. Die keyness wil ik hier in rekening brengen. Dat doe ik door aan de totale aantallen per politiek sleutelwoord een verschillend gewicht toe te kennen op basis van die keyness. Dat houdt in dat ik die totale aantallen vermenigvuldig met wat ik een keynessfactor zou kunnen noemen: een verschillende factor per politiek sleutelwoord dat via een percentage aangeeft hoe de keyness zich verhoudt tot die van de andere politieke sleutelwoorden.19 Kortom, het totale aantal (TT, rechtsonder) is niet het totale aantal collocaties per politiek sleutelwoord opgeteld, maar het totale aantal collocaties per politiek sleutelwoord opgeteld na ze apart met hun keynessfactor vermenigvuldigd te hebben. Samengevat breng ik dus de keyness van de politieke sleutelwoorden in rekening. Voor de filosofische sleutelwoorden doe ik dat niet, vanwege redenen die ik bij de resultaten (4.2) zal aanhalen. De waarde TT in tabel 3 geeft dus weer in welke mate een set politieke sleutelwoorden met een set filosofische colloqueert (waarbij de keyness van die eerste in rekening is gebracht). Voor het Amerikaanse deel bekom ik zo vier waardes, die ik in onderstaand sjabloon (tabel 4) illustreer. Op dit punt wordt een vergelijking mogelijk tussen de republikeinse en democratische waarden. Welke politieke set sleutelwoorden colloqueert vaker met welke filosofische set? Het antwoord op die vraag ligt in de verhouding tussen de politieke waarden. De verhouding TT1 / TT2 zal ons leren welke politieke set woorden sterker colloqueert met de deterministische set. En hetzelfde geldt voor de verhouding TT3 / TT4 bij de vrije wil-sleutelwoorden. Beide verhoudingen zal ik de collocatieverhoudingen noemen.
19
Als de keyness van een democratisch sleutelwoord een vijfde is van de totale keyness bij de set democratische sleutelwoorden, dan is de keyness-factor – of het gewicht van dat woord t.o.v. de set democratische sleutelwoorden – 0,2 of 20%.
Tabel 4: sjabloon voor de totale collocatieaantallen tussen politieke en filosofische sleutelwoorden voor VS
Determ. sleutelwoorden Vrije wil-sleutelwoorden
Democratische sleutelwoorden TT1 TT3
Republikeinse sleutelwoorden TT2 TT4
Voor het Vlaamse deel is dit collocatieonderzoek grotendeels analoog, met enkele verschillen. Ten eerste gebeurt het zoeken naar collocaties met de filosofische sleutelwoorden met de Nederlandse vertalingen. Ten tweede gebeurt dat in een Nederlandstalig corpus. Daarvoor koos ik het Corpus Hedendaags Nederlands, dat online vrij toegankelijk is voor onder meer studenten.20 De zoekfunctie in dit corpus werkt met het zogenaamde Corpus Query Language, een programmeertaal die toelaat om allerhande taalverschijnselen in het corpus op te zoeken.21 Voor dit onderzoek gaf ik het volgende in: "filosofisch sleutelwoord" [ ] {1,9} "politiek sleutelwoord". Deze constructie laat toe om attestaties van beide woorden te vinden met maximaal negen woorden tussen. Zo hield ik dit deel analoog met het Amerikaanse deel. Net als in het Amerikaanse deel liet ik voor de filosofische woorden inflexie toe. Dat is mogelijk door varianten door een sluisteken | te scheiden. Bijvoorbeeld, om het aantal collocaties na te gaan tussen vrijheid – een filosofisch sleutelwoord voor vrije wil – en duurzaam – een politiek sleutelwoord voor Groen, gaf ik in: "vrijheid|vrijheden" [] {1,9} "duurzaam". Deze zoekopdracht moest ik telkens ook nog eens omkeren. Het totale aantal attestaties vulde ik vervolgens in op de juiste plaats in een van de tabellen. Ten derde was het Vlaamse collocatieonderzoek enkele malen extensiever. Niet twee sets politieke sleutelwoorden moesten voor een zoekopdracht ingegeven worden, maar zeven.22 Dat leidt uiteindelijk tot zeven politieke waarden per filosofische set sleutelwoorden (in plaats van twee) met een licht aangepast sjabloon als gevolg (zie tabel 5). Daar zal het dus een andere berekening vergen dan een simpele deling om de onderlinge verhouding tussen de waarden te weten te komen. De onderlinge verhouding tussen TT 1 t.e.m. 7 zal ons leren wiens sleutelwoorden het meest met de deterministische colloqueren. Hetzelfde geldt voor de onderlinge verhouding tussen TT 8 t.e.m. 14 bij de vrije wilsleutelwoorden. Tabel 5: sjabloon voor de totale collocatieaantallen tussen politieke en filosofische sleutelwoorden voor Vlaanderen
Determ. sleutelwoorden Vrije wil-sleutelwoorden
20
VLD TT1 TT8
N-VA TT2 TT9
VB TT3 TT10
SP.A TT4 TT11
Groen TT5 TT12
CD&V TT6 TT13
PVDA TT7 TT14
Beschikbaar via https://portal.clarin.inl.nl/search/page/about. De mogelijkheden zijn hierbij werkelijk eindeloos. Van allerlei collocaties, tot woorden met bepaalde clusters of klinkers, tot woordsoorten in een bepaalde volgorde, enzovoort. 22 In het Amerikaanse deel betekende dat 380 zoekopdrachten naar collocaties (20 politieke sleutelwoorden maal 18 filosofische). In het Vlaamse deel zijn dat 1260 zoekopdrachten (70 keer 18). Gelukkig laat het Corpus Hedendaags Nederlands een onbeperkt aantal zoekopdrachten toe. 21
Hypothesen collocatieonderzoek Ter herhaling, de waarden TT1, TT2, enzovoort geven weer in welke mate een set politieke sleutelwoorden met een filosofische set colloqueert. Als die waarden in een bepaalde, significante mate afwijken van elkaar, dan kunnen we spreken van een correlatie tussen de politieke en filosofische woordenlijsten. Dat doen we door de onderlinge verhouding van die waarden na te gaan. Hoe groter die verhouding, hoe significanter de afwijking, en hoe meer we van een correlatie kunnen spreken. Anderzijds, als de politieke waarden TT1, TT2… niet sterk van elkaar afwijken – dus als hun verhouding dicht bij 1 ligt – dan hebben de politieke sleutelwoorden blijkbaar niet veel invloed op het aantal collocaties. In dat geval is een correlatie niet aan de orde. Net als bij het woordfrequentieonderzoek is de verwachting dat ik de partijen zal kunnen rangschikken volgens de mate dat hun sleutelwoorden met de filosofische sleutelwoorden colloqueren. De hoogste collocatieverhoudingen zullen ergens boven 1 liggen, de laagste waarden ergens onder 1. Voor het Amerikaanse deel is de opzet als volgt. TT1 delen we door TT2. Respectievelijk geven deze waarden aan in welke mate de democratische en republikeinse sleutelwoorden met de deterministische set colloqueren. Uit die ‘collocatieverhouding’ valt het percentage af te lezen waarmee de democratische woorden meer of minder colloqueren dan de republikeinse. Is dat percentage hoog in positieve of negatieve zin, dan is het eventueel significant en is er sprake van een correlatie. Precies hetzelfde gebeurt met TT3 en TT4 om het percentage voor vrije wil te bekomen. Ook daar geldt: hoe sterker die collocatieverhouding afwijkt van 1, hoe meer de politieke en filosofische woorden blijkbaar correleren. Voor het Vlaamse deel is deze opzet vrij analoog, behalve dat er zeven politieke waarden zijn per filosofische set sleutelwoorden. De berekening om hun onderlinge verhouding na te gaan is dus licht anders. Hier worden de waarden per partij vergeleken met het gemiddelde van die van de andere partijen. Op die manier worden ook hier uitspraken mogelijk als: ‘sleutelwoorden van die partij staan zoveel procent meer gecolloqueerd met de deterministische set, dan de sleutelwoorden van de andere partijen’. Een aantal opmerkingen die ik in het woordfrequentieonderzoek maakte zijn ook hier van toepassing. Ten eerste geldt ook hier dat de resultaten uiteindelijk relatieve percentages zullen zijn. Een hoog percentage voor één partij betekent automatisch een laag percentage voor minstens één andere partij. Ik kan de mate waarin politieke sleutelwoorden colloqueren met de filosofische sleutelwoorden enkel vergelijken tussen de partijen onderling. Anders gesteld, een conclusie op basis van het resultaat van één partij is een conclusie op basis van absolute cijfers. En of die absolute cijfers veel of weinig zijn, valt daar niet uit op te maken, tenzij ik ze dus vergelijk met de collocatieaantallen bij de andere partijen. Uitspraken als ‘die politieke sleutelwoorden staan veel gecolloqueerd met die filosofische woorden’ moeten met andere woorden gevolgd worden door ‘in vergelijking met de andere politieke sleutelwoorden’. Ten tweede is ook hier de verwachting dat de gevonden collocatieverhoudingen per partij zich op een bepaalde manier gaan verhouden. Zoals besproken zijn determinisme en vrije wil in vrij hoge mate tegenpolen van elkaar. Dit schept de verwachting dat de resultaten voor beide tot op zekere hoogte tegengesteld zullen zijn. Concreter, als sleutelwoorden van een partij relatief vaak gecolloqueerd staan bij de deterministische sleutelwoorden, maar net weinig bij de vrije wil-sleutelwoorden,
dan bevestigt dat de tegenstelling. Het zou kortom logisch zijn mochten de twee filosofische waarden per partij telkens (ongeveer) elkaars omgekeerde zijn. Een laatste verwachting is dat dit collocatieonderzoek het woordfrequentieonderzoek qua resultaten zal bevestigen. Als beide methodes op z’n minst degelijk hun werk doen, dan zou dat moeten blijken in de vorm van gelijkaardige resultaten. Anderzijds, als de deelonderzoeken elkaar zouden tegenspreken, ondermijnt dit de methodologie. Inhoudelijke verwachtingen Dit is een kwantitatief onderzoek, en dus probeer ik de corpora en sleutelwoorden zoveel mogelijk als ‘nummertjes’ te zien. Daarmee bedoel ik dat ze onderling evenwaardig behandeld worden, objectief en zonder daarbij de inhoud of ideologie te laten meespelen. In het hoofdstuk over de resultaten zal ik bij de gevonden woordenlijsten weliswaar de vraag stellen of deze ook inhoudelijk bij de partij gesitueerd kunnen worden, maar die interpretatie zal geen rol spelen in het verdere kwantitatieve onderzoek. Het zijn veeleer tussentijdse ‘controlemomenten’ of de methodologie zijn werk doet. Op die manier zal ik ook hier kort een inhoudelijke verwachting geven naar de uiteindelijke resultaten. De hypothese van dit onderzoek – met name dat er een correlatie bestaat tussen politiek discours en de filosofische uitersten determinisme en vrije wil – toets ik weliswaar kwantitatief, maar is in oorsprong gestoeld op een kwalitatief vermoeden. Dat vermoeden omvat meer dan louter het bestaan van een correlatie. Het is mijn verwachting dat die correlatie een bepaald patroon zal bestrijken. Zoals ik in hoofdstuk 2 heb proberen te verantwoorden, is het onderscheid tussen vrije wil en determinisme te herleiden tot het al dan niet in de hand hebben van het eigen lot. Deterministen zien het individu louter als product van zijn context die hun lot veelal niet in eigen hand hebben. Het valt te verdedigen dat partijen die doorgaans als ‘links’ bestempeld worden graag wijzen op het belang van omstandigheden. Mensen zijn al dan niet succesvol, zijn rijk of arm door omstandigheden en daarom is een beleid dat gericht is op gelijkheid rechtvaardiger. Anderzijds, voor wie vrije wil bestaat, primeert het individu op diens omgeving als het gaat om wie of wat het lot van dat individu bepaalt. Een beleid dat gericht is op vrijheid is dan belangrijk om het individu zich ten volle te laten ontplooien. Deze eenvoudige gedachtegang schept de concrete verwachting dat de ‘linkse’ corpora – die van de democraten in de VS, en de PVDA, SP.A en Groen bij ons – meer deterministische sleutelwoorden zal bevatten. Dat, terwijl de veeleer ‘rechtse’ corpora – die van de republikeinen in de VS, en de Open VLD en N-VA – meer de vrije wil als filosofisch uiterste genegen zijn. Het zal moeten blijken of dit kwantitatief bevestigd wordt.
38
4 Resultaten en interpretatie In dit hoofdstuk bespreek ik de resultaten van de besproken methodologie. Achtereenvolgens komen de sleutelwoorden voor de politieke partijen en filosofische idealen aan bod. Daarna kom ik tot de eigenlijke onderzoeksvraag, met name of de gevonden politieke en filosofische data correleren. 4.1 Sleutelwoorden voor politieke partijen 4.2 Sleutelwoorden voor filosofische idealen 4.3 Correlatie tussen politieke en filosofische data
4.1 Sleutelwoorden voor politieke partijen Amerikaanse sleutelwoorden Door de werkwijze te volgen uit 3.3.2, werden de sleutelwoorden gevonden voor de Amerikaanse partijen in tabel 6. De getallen zijn respectievelijk hun aantal voorkomens in het betreffende corpus, en hun keyness-waarde. Het is op die laatste waarde dat de woorden gerangschikt staan en ze zijn dus in afnemende mate typerend voor het corpus. We beperken ons hier telkens tot de top tien, in bijlage is de gehele woordenlijst te vinden die in het collocatieonderzoek gebruikt wordt (d.i. de top vijftig). Tabel 6: Amerikaanse sleutelwoorden, met frequentie en keyness
DEM Woorden democratic class work college workers party companies invest investments democrats
Frequentie 1400 190 1221 220 586 915 159 155 123 405
Keyness 908.084 116.683 106.185 101.876 99.173 84.625 68.800 59.168 57.137 54.628
REP Woorden republicans republican freedom free federal spending applaud states individuals government
Frequentie 799 1014 855 922 1579 451 150 1357 212 1967
Keyness 427.243 287.971 157.485 111.099 107.935 106.636 84.868 83.294 82.575 82.044
Ten eerste hoeft het niet te verbazen dat democratic en republicans hun respectievelijke lijsten aanvoeren. En ook de meeste andere woorden bevestigen het idee dat de gebruikte kwantitatieve methode zijn werk doet, zoals enerzijds college en investments en anderzijds freedom en individuals. Toch vinden we ook woorden die inhoudelijk moeilijk te situeren zijn bij de ideologie van de partijen. Bv. companies en government waren misschien eerder net in het andere corpus te verwachten. Dit doet denken aan het gegeven voorbeeld van taxes, een vaak gebruikt woord door de republikeinen dat echter allerminst aansluit bij hun ideologie.23 De bedenking die ik hierbij maak is dat partijen hun woorden niet altijd kiezen op hun inhoud, maar soms gebruik maken van hun negatieve connotaties. Het is opvallend hoe weinig de democraten het woord taxes gebruiken terwijl het toch de partij is die
23
Hoewel niet in de top tien, staat taxes toch in de republikeinse top vijftig met een keyness van 36,926.
39
veelal wijst op het belang ervan. Mijn conclusie hieruit is dat de gevonden woorden misschien niet altijd inhoudelijk aansluiten bij de partijen, maar dat het wel deel van hun karakteristieke taalgebruik kan zijn, net door de connotaties ervan. In die zin zijn taxes en government mogelijk toch republikeinse sleutelwoorden omdat ze hun taalgebruik typeren. Lakoff geeft in zijn Morals Politics: how liberals and conservatives think (1996) voorbeelden van woorden die de democraten en republikeinen typeren. Aanvankelijk, voor dit kwantitatieve frequentieonderzoek, was er de mogelijkheid om eenvoudigweg die woordenlijsten over te nemen. Echter, als we de keyness van de door hem gegeven voorbeelden nagaan, zien we dat een kwantitatieve en objectieve methode voor het opstellen van die woordenlijst toch de moeite waard was. Ten eerste vinden we veel voorbeelden van typisch democratische, dan wel republikeinse woorden die Lakoff niet oppert. Ten tweede blijkt uit de kwantitatieve gevevens dat zijn voorbeelden niet altijd zo democratisch of republikeins getint zijn als hij zelf voorstelt. In tabel 7 staan enkele van de woorden opgelijst die Lakoff voorstelt, én die voldoende gebruikt zijn in de opgestelde corpora om conclusies uit te kunnen trekken. Opnieuw geven de getallen achtereenvolgens de frequentie en keyness. Er kan nog gesteld worden dat de voorbeelden help, freedom, traditional, enterprise en authority inderdaad bevestigd worden als zijnde deocratisch of republikeins woord. Voor de andere voorbeelden is de keyness echter te laag om ze als dusdanig te bestempelen. Het is zelfs zo dat zijn voorbeelden concern en reward – zogenaamd respectievelijk democratisch en republikeins – helemaal geen keyness bevatten, en dus in feite tegenvoorbeelden zijn. Ze werden in de praktijk immers meer door andere partij gebruikt. Kortom, de door Lakoff gegeven voorbeelden gaven een indicatie van welke woorden zoal karakterisitek konden zijn. Echter, de kwantitatieve gegevens tonen aan dat ze geen basis konden vormen voor het verdere onderzoek. Tabel 7: door Lakoff gegeven voorbeelden voor Amerikaanse sleutelwoorden
DEM Woorden Help Pollution Health Safety Diversity Care
Frequentie 778 80 952 207 51 733
Keyness 18,464 8,792 7,751 2,916 1,801 0,928
REP Woorden Freedom Enterprise Traditional Authority Dependency Competition
Frequentie 855 185 108 146 37 147
Keyness 157.485 29.075 28.658 27.886 13.865 2.339
Vlaamse sleutelwoorden Op vrijwel analoge wijze (zie 3.2.2) werden de sleutelwoorden in tabel 8 gevonden voor de Vlaamse partijen. Ook hier zijn de getallen respectievelijk hun aantal voorkomens in het betreffende corpus en hun keyness-waarde, de waarde die de rangschikking bepaalt. Het is telkens de top tien die afgebeeld staat ter illustratie. Het zijn deze tien die ik telkens gebruikt heb voor het collocatieonderzoek.
40
Tabel 8: Vlaamse sleutelwoorden, met frequentie en keyness
CD&V overleg onderwijs samenwerking federale zorg uitvoering versterken staatshervorming bijzondere partners
Freq 104 309 182 219 189 61 126 80 76 76
Keyness 95,206 84,027 82,645 75,411 74,981 66,764 63,137 61,182 55,669 47,645
Groen duurzame ecologische ruimte lokale natuur dieren stoffen milieu duurzaam producten
Freq 450 248 407 508 171 107 81 172 163 186
Keyness 466,771 447,283 268,995 259,744 243,441 203,193 167,747 152,094 138,300 137,041
N-VA beperking Vlaamse Vlaanderen verandering Brussel Vlaams Vlamingen deelstaten federale Nederlands
Freq 384 1145 1063 208 475 594 182 132 471 167
Keyness 645,387 382,513 295,305 262,797 236,974 152,058 117,241 115,535 102,991 102,083
Open VLD stad steden vrijheid liberalen burger mensen burgers overheid geëngageerde liberale
Freq 378 373 258 103 230 1072 325 809 54 63
Keyness 359,325 329,268 274,151 246,894 190,080 168,247 158,345 138,170 132,696 100,908
PVDA regering euro miljard miljoen lonen winst notionele interesten miljonairstaks dividenden
Freq 901 819 389 359 166 134 99 77 59 67
Keyness 1033,955 876,937 620,635 424,424 294,133 282,060 270,471 263,944 241,178 209,903
SP.A iedereen jongeren samen alleen ondernemers leven armoede gezinnen mensen ongelijkheid
Freq Keyness 435 313,409 342 186,812 294 121,574 361 95,971 116 93,480 234 84,368 172 70,898 162 62,315 663 55,263 57 52,175
VB Vlaanderen Wallonië Vlaamse vreemdelingen partij Vlamingen politieke zekerheid Belgische druk
Freq 403 110 368 58 77 73 89 98 94 58
Keyness 376,353 284,777 282,735 149,866 106,645 105,874 73,267 66,899 52,443 47,949
Ten eerste valt op te merken dat het woordfrequentieonderzoek de verwachtingen in vrij grote mate bevestigt. De gevonden resultaten sluiten vrij goed aan bij ons subjectief idee waar de partijen voor staan. Het is bijna karikaturaal hoezeer we de gevonden woorden in sommige gevallen typerend zouden noemen voor de partijen. Dan denk ik aan duurzaam, natuur, dieren en milieu voor Groen, vrijheid, geëngageerd, steden en liberaal voor Open VLD, iedereen, samen, armoede en ongelijkheid voor SP.A en overleg, samenwerking, zorg en onderwijs voor de CD&V. Deze voorbeelden hebben daarbij een ideologische inhoud. Het zijn precies dergelijke resultaten die ik op een objectieve manier aan de oppervlakte wou brengen en in die zin is de opzet tot op dit punt geslaagd te noemen. Echter, als we de woordenlijsten verder bekijken, zien we enkele potentiële problemen opduiken voor het verdere onderzoek. Waar de gegeven voorbeelden ideologisch goed aansluiten bij hun respectievelijke partijen, is dat zeker niet voor elk woord in de woordenlijsten het geval. We zien dat partijen op twee manieren woorden gebruiken die niet aansluiten bij hun ideologie. Ten eerste is er vermoedelijk een negatief gebruik van bepaalde woorden, zoals overheid voor de Open VLD, of alleen en ondernemers voor de SP.A. Dergelijke patronen vonden we ook bij het Amerikaanse deel
met onder meer taxes bij de republikeinen. Echter, als de woorden het taalgebruik karakteriseren, hoeft het niet noodzakelijk een probleem te zijn dat ze niet aansluiten bij hun ideologie. Een groter probleem is het focussen op kleinschalige thema’s. We merken dat bepaalde woorden sterk gebonden zijn aan thema’s die de Vlaamse of Belgische politiek typeren. Woorden als Vlaanderen, Nederlands en deelstaten voor de N-VA hebben aan zich weinig ideologische inhoud, maar zijn vooral verbonden met de kleinschaligere en praktische thema’s bij ons. Dit soort woorden typeren geen ideologie, maar louter wat hier bij ons aan de orde is. De voorbeelden voor de N-VA zijn dan nog positief gebruikt, maar bij bv. de PVDA zien we beide problemen tezamen opduiken. Woorden als miljonairstaks, notionele, dividenden en interesten zijn vermoedelijk te situeren in een discours over de nadelen van het kapitalisme. Naast het feit dat ze op een enkel thema focussen, zijn ze dus ook nog eens negatief gebruikt. Het is dus maar zeer de vraag of deze zogenaamde sleutelwoorden de algemene ideologie van de PVDA typeren. Kortom, de gevonden sleutelwoorden zijn in veel gevallen bemoedigend te noemen naar het verdere onderzoek toe, maar het is twijfelachtig of de resultaten voor onder meer N-VA en PVDA bevredigend zullen zijn. Echter, om de objectiviteit van het kwantitatieve onderzoek te bewaren zal ik de woorden op dit punt niet anders behandelen volgens hun inhoud. Ondanks de gemengde resultaten zal ik het verdere onderzoek uitvoeren als gepland. De sleutelwoorden voor N-VA en PVDA zijn dan misschien niet veelbelovend, maar die van onder meer Groen, Open VLD, SP.A en CD&V zijn dat wel. Bovendien is het nog altijd zo dat woorden die niet de ideologie, maar veeleer het taalgebruik typeren zeer waardevol kunnen blijken. In dat geval blijven de sleutelwoorden van N-VA en PVDA evenzeer relevant. Een laatste kanttekening is dat bij sommige van de sleutelwoorden louter de inflexie verschilt. Vlaams en Vlaamse bij N-VA en stad en steden bij Open VLD zijn daar voorbeelden van. Deze woorden gewoon samennemen lijkt hier voor de hand liggend. Echter, in 3.2.2.3 gaf ik twee redenen waarom ik dat niet deed voor de Amerikaanse woorden, en beide zijn ook hier van toepassing. Ten eerste is de grens tussen wat louter inflexie is, en wat inhoudelijk nieuwe betekenis krijgt, niet duidelijk afgebakend. Het probleem van waar ik de grens trek is dus een eerste obstakel. Ten tweede hebben de woorden – ook al zijn het dan bv. afleidingen van elkaar – hun eigen gewicht op basis van hun keyness. In het latere collocatieonderzoek dragen ze bij volgens dat gewicht, en dus is een dergelijke aanpassing gewoon niet nodig. Een bijkomende reden is dat het niet samennemen in de opzet past om de data zoveel mogelijk als ‘nummertjes’ te behandelen en de inhoud dus niet te laten meespelen.
4.2 Sleutelwoorden voor filosofische idealen Door de werkwijze te volgen uit 3.2.3 werden de sleutelwoorden in tabel 9 gevonden voor de filosofische idealen determinisme en vrije wil. De getallen zijn respectievelijk hun aantal voorkomens in het betreffende corpus en hun keyness-waarde, de waarde die de rangschikking bepaalt. Telkens is ook de Nederlandse vertaling bijgevoegd, die gebruikt wordt voor het onderzoek in de Vlaamse politiek.
42
Tabel 9: filosofische sleutelwoorden, met frequentie, keyness en vertaling
Determinisme causality predictability influences constraints circumstances context luck understanding chance
Freq 312 298 301 98 210 218 198 79 104
Keyness 154.988 128.209 126.592 111.721 101.449 95.980 86.215 86.048 80.242
Nederlandstalig oorzakelijkheid voorspelbaarheid invloeden beperkingen omstandigheden context geluk begrip kans
Vrije wil freedom choices possibilities undetermined self-determination decisions actions moral responsibility
Freq 249 214 322 87 72 177 169 151 186
Keyness 139.846 137.642 121.898 98.128 87.097 85.322 81.125 75.310 74.462
Nederlandstalig vrijheid keuze mogelijkheden onbepaald zelfbeschikking beslissingen daden moreel verantwoordelijkheid
Hoewel deze set woorden een verschillende keyness achter zich hebben, en ze dus in principe in verschillende mate typerend zijn voor de corpora, besloot ik om de woorden onderling als evenwaardig te beschouwen. Zoals uit het de methodologie van het woordfrequentieonderzoek (3.3.1) is gebleken, krijgen de woorden al een verschillend gewicht dat afhangt van hun aantal attestaties in de politieke corpora. Op die manier drijven de belangrijkste woorden automatisch boven. Als ik hiernaast ook nog eens de keyness van de filosofische sleutelwoorden in rekening wilde brengen, dan zouden de berekeningen vermoedelijk te ingewikkeld worden. Bovendien lijken de filosofische corpora mij niet betrouwbaar genoeg om de keyness echt als basis te gebruiken voor verdere berekeningen. Ik meen wel dat de werkwijze volstond om simpelweg twee sets sleutelwoorden te bekomen die de filosofische uitersten goed typeren. Net zoals bij het opstellen van de politieke woordenlijsten blijkt dat het kiezen van de ‘tegengestelde’ corpora als referentiecorpus een goeie methode is. Ze leidt tot resultaten die opvallend karakteristiek zijn en al bij al goed aansluiten bij eventuele verwachtingen.
4.3 Correlatie tussen politieke en filosofische data In dit deel behandel ik de resultaten die rechtstreeks betrekking hebben op de onderzoeksvraag. De bovenstaande resultaten – d.i. de politieke corpora, politieke sleutelwoorden en filosofische sleutelwoorden – vormen in feite slechts een opstap tot het vinden van een correlatie tussen politiek en filosofie. Daarvoor zijn het woordfrequentieonderzoek en het collocatieonderzoek nodig. Beide komen achtereenvolgens aan bod, waarna ik de resultaten interpreteer en vergelijk. 4.3.1
Woordfrequentieonderzoek
4.3.2
Collocatieonderzoek
4.3.3
Vergelijking tussen beide delen Woordfrequentieonderzoek
4.3.1.1
Amerikaans deel
Door de werkwijze te volgen uit 3.3.1 werd tabel 10 bekomen. Het betreft een ingevuld sjabloon zoals ik die in de methodologie opstelde. Ter illustratie geef ik eerst de resultaten voor de republikeinen in de VS. De eerste kolom is de set sleutelwoorden voor vrije wil en determinisme, de tweede kolom bevat het aantal attestaties in het partijcorpus en de derde kolom bevat het aantal attestaties van het referentiecorpus voor de republikeinen. Kolom vier bevat telkens de verhouding van deze 43
laatste twee, na het in rekening brengen van een corpuscoëfficiënt. In de laatste rij staan tot slot het totale aantal attestaties, alsook de totale verhoudingen van het totale aantal gebruikte filosofische sleutelwoorden. Voor een goed begrip, de totale verhouding is de verhouding van het totale aantal attestaties, en dus niet het gemiddelde van de verhoudingen per sleutelwoord o.i.d. Op die manier wegen de woorden die vaker voorkomen ook zwaarder door.24 Tabel 10: republikeinse resultaten voor woordfrequentieonderzoek ter illustratie
Free will freedom choice possibilities undetermined self-determination decisions actions moral responsibility TOTAAL
Freq 1799 222 285 75 50 245 943 138 564 4321
Freq REF 926 173 291 75 46 242 450 78 574 2855
Verhouding 1,86 1,23 0,94 0,96 1,04 0,97 2,01 1,70 0,94 1,455
Determinism causality predictability influences constraints circumstances context luck understanding chance TOTAAL
Freq 243 34 70 42 28 32 10 151 103 713
Freq REF 226 23 74 23 28 26 16 167 136 719
Verhouding 1,03 1,42 0,90 1,75 0,96 1,18 0,60 0,86 0,72 0,954
Uit deze verhoudingen blijkt dat het republikeinse corpus 45,5% meer sleutelwoorden bevat die vrije wil typeren dan het referentiecorpus. Anderzijds staan er 4,6% minder deterministische sleutelwoorden in. Natuurlijk is het zo dat, voor dit Amerikaanse deelgebied, het referentiecorpus precies het democratische corpus is. Als we de verhoudingen omkeren, verkrijgen we bijgevolg zeer eenvoudig ook de democratische percentages. In hun corpus staan bijgevolg 4,9% meer deterministische sleutelwoorden, maar 31,2% minder vrij wil-sleutelwoorden.25 Of samengevat in de verhoudingen, zie tabel 11 (waar de tweede kolom eenvoudigweg een omkering is van de eerste): Tabel 11: filosofische verhoudingen voor VS in woordfrequentieonderzoek
Vrije wil Determinisme
Republikeinen 1,455 0,954
Democraten 0,687 1,049
De eerste vraag die rijst is of deze resultaten nu een correlatie betekenen tussen de politieke corpora en de filosofische sleutelwoorden. Zoals in de methodologie is uitgelegd is het zo dat hoe meer de verhoudingen afwijken van 1, hoe sneller we van een correlatie kunnen spreken. Dan zijn de corpora immers bepalend voor de mate waarin we filosofische sleutelwoorden aantreffen. Een verhouding dicht bij één betekent dan weer dat het verschil tussen de politieke corpora niet groot is voor die set filosofische sleutelwoorden. In de gevonden resultaten zien we voor de vrije wil-sleutelwoorden een relatief sterk overhellende verhouding (45,5%). Dit deel correleert duidelijk. Dat betekent dat – als de gebruikte politieke corpora én de filosofische sleutelwoorden daadwerkelijk een representatief staal vormen – de republikeinen effectief dichter aanleunen bij het vrije wil-ideaal dan dat de democraten doen. Voor de deterministische sleutelwoorden helt de verhouding licht over in het voordeel
Ik achtte dit nodig omdat ik de keyness – dus de mate waarin ze de filosofische corpora typeren – al buiten beschouwing had gelaten, zie 3.3.1. 25 Het omgekeerde van 1,455 is 0,687 of 31,3% minder. Het omgekeerde van 0,954 is 1,049 of 4,9% meer. 24
44
van de democraten. Hier is de marge echter in die mate klein (4,9%) dat het moeilijk wordt om van een correlatie te spreken. Bovendien is een bepaalde toevalsfactor niet uit te sluiten. Dat de democraten het deterministische ideaal dus iets meer genegen zouden zijn, is een conclusie die niet te trekken valt. Beide conclusies zijn overigens te staven met een chikwadraattoets. Belangrijk is dat ik die niet toepas op de berekende percentages uit tabel 11, maar op de absolute frequentieaantallen uit tabel 10. De vraag is of de frequentieaantallen tussen de twee corpora significant afwijken van elkaar. De formule is de volgende: (𝑜𝑏𝑠𝑒𝑟𝑣𝑒𝑑 𝑣𝑎𝑙𝑢𝑒 − 𝑒𝑥𝑝𝑒𝑐𝑡𝑒𝑑 𝑣𝑎𝑙𝑢𝑒)2 = 𝜒2 𝑒𝑥𝑝𝑒𝑐𝑡𝑒𝑑 𝑣𝑎𝑙𝑢𝑒 De observed value is 4321 voor de vrije wil-sleutelwoorden, en 713 voor de deterministische sleutelwoorden.26 De expected value is telkens het gemiddelde tussen dit aantal en dat van het referentiecorpus, respectievelijk 3645 en 730. Dit is het aantal dat we immers zouden verwachten in een ander, even groot corpus. Het invullen van de formule geeft dan: (4321 − 3645)2 = 125,3 𝑒𝑛 3645
(713 − 730)2 = 0,4 730
Merk op hoe het invullen van de aantallen in de referentiecorpora tot dezelfde resultaten zou leiden. 𝜒 2 is dus 125,3 voor de vrije wil-sleutelwoorden en 0,4 voor deterministische sleutelwoorden. De degree of freedom (df) is telkens 1 en ik leg het significantieniveau α op 0,05. Een chikwadraat distributietabel leert ons dat chi-kwadraat dan minstens 3,841 moet zijn. Het eerste resultaat overschrijdt dit, het tweede niet. Met andere woorden, het verschil in aantal voor vrije wil-sleutelwoorden is duidelijk significant, het verschil bij deterministische sleutelwoorden is dat niet. Een tweede vraag is hoe deze resultaten zich verhouden tot de verwachtingen die ik poneerde in 3.3.1 (de hypothesen). Zo had ik de verwachting uitgedrukt dat de twee verhoudingen per partij ongeveer elkaars omgekeerde zouden zijn. Het zou logisch zijn dat een partij die veel deterministische woorden gebruikt net minder vrije wil-sleutelwoorden gaat gebruiken: vrije wil en determinisme zijn immers in hoge mate tegenpolen van elkaar. Hier valt dit echter niet te bevestigen. Bijvoorbeeld het democratische corpus bevat inderdaad (iets) meer deterministische sleutelwoorden en beduidend minder vrije wil-sleutelwoorden, maar zoals gezegd is die eerste verhouding te klein om harde conclusies te maken. Wat wel te verwachten viel is dat de verhoudingen per filosofische strekking elkaars omgekeerde zijn. Dat is evident omdat ze op die manier berekend werden, en heeft alles te maken met het feit dat het referentiecorpus telkens samenviel met het andere partijcorpus. Als het republikeinse corpus in een bepaalde verhouding meer sleutelwoorden bevat dan zijn referentiecorpus, dan bevat het democratische corpus minder sleutelwoorden volgens het omgekeerde van die verhouding. Zoals
26
Na het in rekening brengen van de corpuscoëfficiënt om de verschillende corpusgrootten als factor uit te sluiten.
45
gezegd zijn hierom enkel relatieve conclusies mogelijk. Dus niet zoiets als ‘de republikeinen gebruiken veel vrije wil-sleutelwoorden’, maar wel: de republikeinen gebruiken opvallend méér vrije wilsleutelwoorden dan de democraten. Een laatste verwachting die ik bij het deel over de hypothesen heb gegeven, was een inhoudelijke. Op basis van een inhoudelijk verband tussen de filosofische uitersten en de traditionele politieke links-rechts-as, zou het logisch zijn mocht het republikeinse corpus meer vrije wil- en het democratische corpus meer deterministische sleutelwoorden bevatten. Hierover kan ik kort concluderen dat dit bij de republikeinen ook significant blijkt (zonder enige statistische berekeningen ga ik ervan uit dat 45,5% een significant resultaat is), maar dat dit niet zo is bij de democraten. Daar is het verschil van 4,9% te weinig om bijvoorbeeld een toevalsfactor uit te sluiten. 4.3.1.2
Vlaams deel
Voor het Vlaamse deelgebied werd op volledig analoge wijze tabel 12 bekomen. Als voorbeeld geef ik de resultaten voor de SP.A. De eerste kolom is de set (Nederlandstalige) sleutelwoorden voor vrije wil en determinisme, de tweede kolom bevat het aantal attestaties in het partijcorpus en de derde kolom bevat het aantal attestaties van het referentiecorpus van de SP.A. Kolom vier bevat opnieuw de verhouding van deze laatste twee, na het in rekening brengen van een corpuscoëfficiënt. In de laatste rij staan tot slot het totale aantal attestaties, alsook de totale verhoudingen van het totale aantal gebruikte filosofische sleutelwoorden. Ook hier is dat de verhouding van het totale aantal attestaties. Tabel 12: resultaten voor SP.A in woordfrequentieonderzoek ter illustratie
Vrije wil vrijheid keuze mogelijkheid onbepaald zelfbeschikking beslissingen daden moreel verantwoordelijkheid TOTAAL
Freq 192 142 225 24 20 125 23 45 132 928
Freq REF 1463 1060 2521 126 265 871 126 201 1097 7730
Corpuscoëf. (cc) 0,77 0,78 0,52 1,12 0,44 0,84 1,08 1,31 0,71 0,703
Determinisme oorzakelijkheid voorspelbaarheid invloeden beperkingen omstandigheden context geluk begrip kans TOTAAL
Freq 153 55 26 356 75 72 143 174 596 1497
Freq REF 461 139 247 2557 409 380 337 460 1981 6508
Corpuscoëf. (cc) 1,95 2,31 0,63 0,82 1,08 1,11 2,50 2,21 1,76 1,348
De resultaten worden helemaal betekenisvol als ik de verhoudingen voor de andere partij erbij haal, maar interessant is alvast dat die voor de SP.A blijkbaar sterk overhellen in deterministisch voordeel. Hoe meer die verhoudingen ook voor de andere partijen in zekere mate afwijken van 1, hoe sterker het vermoeden op het bestaan van een correlatie. In tabel 13 staan de verhoudingen voor determinisme en vrije wil per partij opgelijst. Het betreft dus telkens het percentage dat de partijcorpora in verhouding meer of minder filosofische sleutelwoorden bevatten dan de andere zes. Tabel 13: filosofische verhoudingen voor Vlaanderen in woordfrequentieonderzoek
Determinisme Vrije wil
Open VLD 0,624 2,005
N-VA 1,516 1,057
CD&V 0,926 1,038
VB 0,877 1,029
Groen 1,221 0,732
SP.A 1,348 0,703
PVDA 0,570 0,546
46
Naast de reeds vermelde waarden voor de SP.A zien we verschillende andere waarden die eveneens significant te noemen zijn. Ook dit is te staven met een chikwadraattoets, die ik opnieuw moet toepassen op de absolute frequentieaantallen (zoals in tabel 12). De vraag is of de frequentieaantallen voor de twee sets filosofische sleutelwoorden tussen de twee corpora significant afwijken van elkaar. De observed value is telkens het bekomen frequentieaantal, de expected value is telkens het gemiddelde daarvan – respectievelijk 1237 en 1144 voor de vrije wil- en deterministische sleutelwoorden. Dit is het aantal dat we zouden verwachten in een ander, even groot corpus. Het invullen van de formule voor het voorbeeld van SP.A geeft: (928 − 1237)2 = 77,2 𝑒𝑛 1237
(1497 − 1144)2 = 109,2 1144
De degree of freedom (df) ligt hier telkens op 6 (als er zes waarden bekend zijn, ligt de zevende vast) en ik leg het significantieniveau α opnieuw io 0,05. Een chikwadraat distributietabel leert ons dat chi-kwadraat dan minstens 12,59 moet zijn. Het resultaat voor SP.A overschrijdt dit duidelijk tweemaal. Met andere woorden, het frequentieaantal binnen het SP.A-corpus is duidelijk significant verschillend met de aantallen in de andere corpora. Als we hetzelfde doen voor de andere partijen, dan bekomen we de 𝜒 2 waarden uit tabel 14. Tabel 14: resultaten van chikwadraattoets die 12,59 moeten overschrijden
Determinisme Vrije wil
Open VLD 110 831
N-VA 259,5 12,3
CD&V 6,712 0,43
VB 7,08 3,97
Groen 17,5 96,9
SP.A 109,2 77,2
PVDA 225 267
Op Chi waarden van CD&V, VB en N-VA (bij vrije wil) overschrijden de gegeven significantiewaarde van 12,59 niet en dus vallen hier weinig conclusies te trekken. Hun verhoudingen hellen weliswaar over in een bepaalde richting, maar niet in die mate dat een correlatie tussen de politieke corpora en de filosofische woordenlijsten duidelijk blijkt. Echter, op basis van de andere waarden vallen voorlopig toch de volgende vier conclusies te trekken. De percentages zijn af te lezen uit tabel 13. Het corpus van Open VLD bevat significant meer vrije wil-sleutelwoorden dan haar referentiecorpus. Wel 100,5% meer. De corpora van Groen, SP.A en PVDA bevatten significant minder vrije wil-sleutelwoorden dan hun referentiecorpus. Respectievelijk 26,8%, 29,7% en 45,4% minder. De corpora van N-VA, SP.A en Groen bevatten significant meer deterministische sleutelwoorden dan hun referentiecorpus. Respectievelijk 51,6%, 34,8% en 22,1% meer. De corpora van Open VLD en PVDA bevatten significant minder deterministische sleutelwoorden dan hun referentiecorpus. Respectievelijk 37,6% en 43,0% minder. Als we aannemen dat de politieke corpora een representatief staal zijn voor hun ideologie, en de filosofische sleutelwoorden hetzelfde zijn voor vrije wil en determinisme als filosofische uitersten, dan valt het volgende te besluiten. Enerzijds leunt Open VLD relatief dicht aan bij vrije wil als filosofisch ideaal terwijl PVDA, SP.A en Groen daar net verder van af staan. Anderzijds staan N-VA, SP.A en Groen dichter bij een deterministische visie dan dat Open VLD en PVDA doen. Nu is het 47
interessant om deze resultaten en conclusies te toetsen aan de hypothesen zoals die opgesteld zijn in 3.3.1. Ik zal kort overlopen op welke punten ze de verwachtingen bevestigen en waar ze daarvan afwijken. Ten eerste blijkt het dus inderdaad zo te zijn dat er een correlatie bestaat tussen de politieke corpora en de filosofische sleutelwoorden. Voor zowel vrije wil als determinisme zijn er partijen die in hoge mate, zowel minder als meer sleutelwoorden in hun corpus hebben zitten. Het hangt met andere woorden af van het politiek discours in welke mate we de filosofische sleutelwoorden terugvinden, en dus is er sprake van een correlatie. Uiteraard geldt niet voor elk partijcorpus dat een bepaalde set sleutelwoorden relatief veel of weinig gebruikt wordt. Dat heeft alles te maken met het feit dat het politieke landschap geen tweedeling is, zoals in de VS, maar een continuüm voorstelt. Er zijn naast partijen die relatief dicht bij een filosofisch uiterste aanleunen, ook partijen die dat niet doen. De filosofische verhoudingen van onder meer CD&V en VB liggen relatief dicht bij 1 en situeren zich dus hoe dan ook ‘centraler’ dan de andere partijen. Met dit in het achterhoofd kan men de resultaten als visualiseren op twee filosofische assen, een voor vrije wil en een voor determinisme, zoals in figuur 3.
Figuur 3: situering van Vlaamse partijen op beide filosofische assen volgens woordfrequentieonderzoek
Idealiter zouden we de partijen in plaats van op twee filosofische assen, op één as kunnen plaatsen met determinisme en vrije wil als tegenpolen van elkaar. Een van de verwachtingen was namelijk dat partijen die hoog scoren op één as, dat niet doen op de andere en vice versa.27 In het Amerikaanse deel werd dit niet meteen bevestigd door een deterministische verhoudingen die dichtbij één lag. Hier kunnen we wel verschillende opvallende resultaten vergelijken, wat tot gemengde resultaten leidt. Zo is de PVDA een sterk tegenvoorbeeld. Die laatste heeft een lage filosofische verhouding voor vrije wil, wat een hoge verhouding voor determinisme doet verwachten. Het tegendeel is echter waar: de PVDA scoort laag op beide assen. Verder zien we dat de N-VA gemiddeld scoort voor vrije wil, maar hoog voor determinisme. Ook niet meteen het ideale resultaat. Toch zijn er verschillende partijcorpora waar de filosofische verhoudingen voor vrije wil en determinisme (ongeveer) elkaars omgekeerde zijn. Open VLD gebruikt tegelijk meer vrije wil- en minder deterministische sleutelwoorden. Precies het omgekeerde geldt voor SP.A en Groen. Tot slot bevatten de corpora voor CD&V en VB blijkbaar een vrij gemiddeld aantal vrije wil- en deterministische
27
Of dat een partij die zich centraal situeert op een as, dat ook doet op de andere as.
48
sleutelwoorden. Deze vijf partijcorpora bevestigen met andere woorden dat determinisme en vrije wil tegenpolen zijn, en dat gebruik van de ene set sleutelwoorden mee het gebruik van de andere set bepaalt. Als we dwarsliggers PVDA en N-VA even buiten beschouwing laten, dan kunnen we de vijf andere partijen op een enkele as tussen vrije wil en determinisme visualiseren, zoals in figuur 4.
Figuur 4: situering van Vlaamse partijen op een enkele filosofische as volgens woordfrequentieonderzoek
Natuurlijk rijst meteen de vraag waarom de filosofische verhoudingen bij N-VA en PVDA afwijken van de vijf andere partijen (in die zin dat hun verhoudingen voor vrije wil en determinisme allerminst elkaars omgekeerde zijn). Het is vreemd dat N-VA meer deterministische, maar tegelijk niet minder vrije wil-sleutelwoorden gebruikt. En nog onverwachter is dat PVDA bij beide verhoudingen de laagst scorende partij is. Een mogelijke verklaring is dat hun corpora geen representatief staal zijn van hun ideologie, of überhaupt minder ideologisch materiaal bevatten. Merk op hoe ik bij de gevonden politieke sleutelwoorden (4.1.2) al opmerkte dat PVDA en N-VA partijen zijn die mogelijk vaker focussen op specifieke en iets kleinschaligere thema’s, meer dan de grote ideologieën. In tegenstelling tot de andere partijen kreeg je niet het idee dat hun politieke sleutelwoorden goed de partijideologie typeren. Dat laatste zou ook voor de gehele corpora kunnen gelden, waardoor ook dit woordfrequentieonderzoek voor die partijen afwijkt qua resultaten. Het collocatieonderzoek geeft mogelijk een ander beeld, maar ook dat is maar zeer de vraag. Tot slot stel ik ook voor dit Vlaamse deel vraag of de resultaten aansluiten bij de inhoudelijke verwachtingen. Vier partijen bevestigen die verwachtingen: SP.A, Groen, CD&V en Open VLD bevinden zich op dat deel van de as waar ze ook inhoudelijk bij de filosofische uitersten te situeren zijn. Dat is bepaald niet het geval voor VB, dat gematigd scoort wat zowel vrije wil als determinisme betreft. Net als voor N-VA en PVDA kan dat ook hier liggen aan een corpus dat meer focust op de lokale politiek, dan op grotere ideologieën. De gevonden sleutelwoorden voor VB, waaronder vreemdelingen, Vlaanderen en Wallonië, bevestigen dat vermoeden. Ik had het al over het feit dat de relatieve positie van PVDA en N-VA tussen vrije wil en determinisme niet te achterhalen was – de filosofische verhoudingen waar bij hen immers beide vrij hoog (N-VA), of vrij laag (PVDA). Ook PVDA en N-VA kunnen de inhoudelijke verwachtingen dus niet bevestigen Collocatieonderzoek 4.3.2.1
Amerikaans deel
Door de werkwijze te volgen uit 3.3.2 werd tabel 15 bekomen voor de democratische en deterministische sleutelwoorden. Het betreft een ingevuld sjabloon ter illustratie, zoals ik die in de methodologie opstelde. In de eerste rij staan de democratische sleutelwoorden, in de eerste kolom de deterministische. Op de kruising van beide lezen we telkens het aantal collocaties af tussen beide, in het CoCA. Onderaan vinden we de totale aantallen. Zo colloqueert college in totaal blijkbaar 1914 keer met de deterministische sleutelwoorden.
49
work
college
workers
party
companies
invest
investments
democrats
TOTAAL
class
causality predictability influences constraints circumstances context luck understanding chance
democratic
Tabel 15: collocatieaantallen tussen democratische en deterministische sleutelwoorden ter illustratie
154 80 159 34 37 85 8 240 172 969
172 99 160 33 48 128 46 405 150 1241
921 402 1030 135 208 696 537 2634 1124 7687
159 333 343 14 32 140 79 469 345 1914
265 90 165 23 38 56 24 325 84 1070
308 126 298 18 54 39 63 264 334 1504
234 163 129 22 27 23 29 257 134 1018
20 12 12 6 2 5 6 42 36 141
38 18 26 11 8 3 4 27 19 154
104 97 74 6 11 8 19 160 248 727
Als ik de totale aantallen per politiek sleutelwoord (onderaan) zou optellen, bekom ik het totale aantal collocaties tussen de democratische en filosofische set sleutelwoorden. Maar zoals ik in de methodologie uitvoerig toelichtte, wou ik de keyness van de politieke sleutelwoorden in rekening brengen. De totale waarden tel ik dus op, na ze met hun keyness-factor vermenigvuldigd te hebben. Voor deze tabel geeft dat afgerond 14467. Deze TT, zoals ik die in de methodologie noemde, geeft een indicatie hoe vaak beide sets met elkaar colloqueren. Voor het Amerikaanse deel bekom ik naast deze waarde nog drie andere TT’s die ik in tabel 16 samenvat: Tabel 16: totale collocatieaantallen voor Amerikaanse sleutelwoorden
Determ. sleutelwoorden Vrije wil-sleutelwoorden
Democratische sleutelwoorden TT1 14467 TT3 25269
Republikeinse sleutelwoorden TT2 11910 TT4 35905
Er rest me nog één struikelblok voor het vergelijken van deze waarden, die ik overigens niet in de methodologie toelichtte. Als ik de verhouding tussen TT1 en TT2 naga, leer ik in principe welke politieke sleutelwoorden vaker bij de deterministische set gecolloqueerd staat. Een factor die echter meespeelt, is dat de democratische en republikeinse woorden op zich in verschillende mate in het corpus voorkomen. Stel dat de tien democratische woorden aan zich vaker in het CoCA voorkomen dan de tien republikeinse, dan zou het niet verassend dat ze bv. meer collocaties opleveren. Dat blijkt ook. De democratische set komt in totaal 897232 keer voor, de republikeinse set 831901 keer, een verschil van 7,9% in het nadeel van de republikeinen. Wil ik TT1 en TT2 vergelijken, moet ik ook deze factor dus in rekening brengen. Deze berekening licht ik hier pas toe, omdat het in de methodologie zonder concrete resultaten vermoedelijk te abstract en verwarrend zou geworden zijn. Ik vat even kort samen welke factoren ik in rekening heb gebracht (en welke niet) bij het vergelijken van de TT’waarden. Ik heb ervoor gezorgd dat het verschil in voorkomen aan zich tussen de democratische en republikeinse woorden geen rol speelt (hetgeen ik zonet toelichtte). Daarvoor voegde ik een factor toe, gebaseerd op totale woordaantallen.
50
Merk op dat een dergelijke factor niet nodig is voor de filosofische sleutelwoorden. Ik vergelijk de politieke resultaten immers telkens per filosofische set, niet omgekeerd. De keyness van de politieke sleutelwoorden is in rekening gebracht. Woorden met een hogere keyness wegen naar behoren zwaarder door. De keyness van de filosofische sleutelwoorden is niet in rekening gebracht. Daarvoor waren die resultaten m.i. te weinig betrouwbaar om ze in verdere berekeningen te gebruiken (zie 4.2 voor meer verantwoording). Elk filosofisch sleutelwoord is dus even ‘belangrijk’. Elk woord weegt overigens maar zo zwaar door als het aantal attestaties dat ik ervoor vond. De collocatieaantallen werden immers eenvoudigweg opgeteld. Eens deze factoren in rekening gebracht zijn, zijn de TT-waarden finaal te vergelijken met elkaar. Bij de laatste tabel was het dus nog nodig om de republikeinse waarden TT2 en TT4 met de 7,9% van zonet te verhogen. Een vergelijking met hun democratische tegenhangers leidt dan tot de verhoudingen in tabel 17: Tabel 17: collocatieverhoudingen voor Amerikaanse sleutelwoorden
Determ. sleutelwoorden Vrije wil-sleutelwoorden
Democratische sleutelwoorden TT1 / TT2 = 1,126 TT3 / TT4 = 0,653
Republikeinse sleutelwoorden TT2 / TT1 = 0,888 TT4 / TT3 = 1,533
Volgende twee conclusies zijn daarmee verbonden: De democratische sleutelwoorden staan 12,6% vaker gecolloqueerd met deterministische sleutelwoorden dan de republikeinse set. Of de republikeinse set 11,2% minder, zo je wil. De republikeinse sleutelwoorden staan 53,3% vaker gecolloqueerd met vrije wil-sleutelwoorden dan de democratische set. Of de democratische set 34,7% minder, zo je wil. Wijzen deze resultaten op een correlatie tussen de politieke en filosofische sleutelwoorden? Geen correlatie zou betekenen dat de verhoudingen TT1 / TT2 en TT3 / TT4 (of de omgekeerden daarvan) dicht bij 1 liggen. In de gevonden resultaten zien we voor de vrije wil-sleutelwoorden een relatief sterk overhellende verhouding (53,3%). Dit deel correleert duidelijk. Dat betekent dat – als de politieke en filosofische sleutelwoorden daadwerkelijk een representatief staal vormen voor hun ideologie, én collocaties inderdaad een verband kunnen aantonen – de republikeinen effectief dichter aanleunen bij het vrije wil-ideaal dan dat de democraten doen. Voor de deterministische sleutelwoorden helt de verhouding licht over in het voordeel van de democraten. Hier is de marge echter in die mate klein (12,6%) dat het moeilijk wordt om van een correlatie te spreken. Bovendien is een bepaalde toevalsfactor niet uit te sluiten. Dat de democraten het deterministische ideaal dus iets meer genegen zouden zijn, is een conclusie die niet te trekken valt. Net als bij het woordfrequentieonderzoek toets ik de resultaten aan de verwachtingen die ik poneerde in de methodologie. Een eerste daarvan was dat de twee collocatieverhoudingen per partij ongeveer elkaars omgekeerde zijn. Het zou logisch zijn dat politieke sleutelwoorden die vaak met deterministische woorden gecolloqueerd staan, net minder met vrije wil-sleutelwoorden gecolloqueerd staan.
51
Vrije wil en determinisme zijn immers in hoge mate tegenpolen van elkaar. Hier valt dit echter moeilijk te bevestigen; de verhoudingen 1,126 en 0,653 zijn bezwaarlijk elkaars omgekeerde te noemen. Positief is dat het om een positief én negatief percentage gaat. De sleutelwoorden die vaker bij de ene filosofische set gecolloqueerd staan, staan dus inderdaad minder met de andere filosofische set gecolloqueerd. Maar niet in die mate dat vrije wil en determinisme hier bevestigd worden als duidelijke tegenpolen van elkaar. Merk verder op hoe het logisch is dat de collocatieverhoudingen per filosofisch uiterste wel exact elkaars omgekeerde zijn, louter als gevolg van de berekeningen. Als de democratische sleutelwoorden zoveel procent meer gecolloqueerd staan met deterministische sleutelwoorden, dan ligt logischerwijze vast hoeveel procent minder de republikeinse sleutelwoorden ermee gecolloqueerd staan. Die percentages zijn immers relatief ten opzichte van elkaar. De laatste verwachting die ik bij het deel over de hypothesen heb gegeven, was een inhoudelijke. Op basis van een inhoudelijk verband tussen de filosofische uitersten en de traditionele politieke linksrechts-as, zou het logisch zijn mocht de republikeinse set vaker gecolloqueerd staan met vrije wilsleutelwoorden, terwijl de democratische set vaker gecolloqueerd staan met de deterministische sleutelwoorden. Hierover kan ik kort concluderen dat dit bij de republikeinen ook opvallend blijkt, maar dat dit niet zo is bij de democraten. Daar is het verschil te weinig om bijvoorbeeld een toevalsfactor uit te sluiten. Bevestigen Amerikaanse resultaten van deelonderzoeken elkaar? Tot slot is er nog de vraag hoe de resultaten van dit collocatieonderzoek zich verhouden tot die van het woordfrequentieonderzoek. Het valt op dat de conclusies in bovenstaande alinea’s bijna identiek zijn met de conclusies bij het Amerikaanse deel in het woordfrequentieonderzoek. Daar bleken de vrije wil-sleutelwoorden 45,5% vaker in het republikeinse corpus voor te komen, terwijl de deterministische sleutelwoorden dat 4,6% vaker deden in het democratische corpus. Hoewel die percentages weliswaar licht afwijken van de percentages die ik hier vond, is er toch een duidelijk patroon waarneembaar: een duidelijke helling naar vrije wil voor de republikeinen en een lichte helling naar determinisme voor de democraten. Met andere woorden, het collocatieonderzoek bevestigt alvast voor dit Amerikaanse deel in grote mate het woordfrequentieonderzoek. De resultaten uit beide onderzoeken zijn in figuur 5 gevisualiseerd, met respectievelijk de percentages uit het collocatie- en woordfrequentieonderzoek.
Figuur 5: situering van Amerikaanse partijen op een enkele filosofische as volgens beide deelonderzoeken
In één zin vat ik de conclusie samen op basis van het woordfrequentie- en collocatieonderzoek voor het Amerikaanse deel. Als de opgestelde corpora en woordenlijsten representatief zijn voor de partijideologieën en filosofische idealen, en als woordfrequentie en collocaties goede indicaties zijn voor inhoudelijke ideologie, dan blijken republikeinen het vrije wil-ideaal vrij genegen, terwijl democraten zeer gematigd aanleunen bij het deterministische ideaal.
52
4.3.2.1
Vlaams deel
Zoals ik net de Amerikaanse resultaten heb overlopen voor het collocatieonderzoek kan ik dat vrij analoog doen voor de Vlaamse resultaten. Door de werkwijze te volgen uit 3.3.2 werden veertien tabellen bekomen zoals hieronder één als voorbeeld staat (tabel 18). Veertien was het resultaat van zeven politieke sets met twee filosofische sets sleutelwoorden te kruisen. Hieronder staan de collocatieaantallen tussen de Groen-sleutelwoorden en deterministische sleutelwoorden ter illustratie. In de eerste rij staan de politieke woorden, in de eerste kolom de deterministische. Op de kruising van beide lezen we telkens het aantal collocaties af tussen beide, in het Corpus Hedendaags Nederlands. Onderaan vinden we de totale aantallen. Zo colloqueert dieren in totaal blijkbaar 810 keer met de deterministische sleutelwoorden.
ruimte
lokale
natuur
dieren
stoffen
milieu
duurzaam
producten
TOTAAL
ecologische
oorzakelijkheid voorspelbaarheid invloeden beperkingen omstandigheden context geluk begrip kans
duurzame
Tabel 18: collocatieaantallen tussen Groen- en deterministische sleutelwoorden ter illustratie
8 11 24 61 18 7 32 10 118 289
6 3 13 39 4 1 7 5 20 98
45 31 109 607 89 52 171 58 328 1490
69 45 180 268 78 33 63 75 465 1276
42 24 129 121 47 15 133 93 188 792
50 15 83 150 123 13 134 89 153 810
33 6 70 119 40 3 28 12 44 355
41 28 151 185 48 10 50 42 135 690
3 3 10 42 9 7 13 3 60 150
32 38 64 240 48 12 62 78 133 707
Opnieuw geldt: als ik de totale aantallen per politiek sleutelwoord (onderaan) zou optellen, bekom ik het totale aantal collocaties tussen de democratische en filosofische set sleutelwoorden. Maar ik tel de totale waarden pas op, na ze met hun keyness-factor vermenigvuldigd te hebben. Voor deze tabel geeft dat afgerond 6240. Deze TT, zoals ik die in de methodologie noemde, geeft dus een indicatie hoe vaak beide sets met elkaar colloqueren. Voor het Vlaamse deel bekom ik naast deze waarde nog dertien andere TT’s die ik in onderstaande tabel samenvat. Het potentiële struikelblok dat ik in voorgaand Amerikaanse deel behandelde – namelijk dat de politieke woorden aan zich in verschillende mate voorkomen en zo de resultaten kunnen beïnvloeden – moet ik ook hier omzeilen. Eveneens wordt die factor dus in rekening gebracht, en bij uitbreiding geldt dat het samenvattende lijstje factoren bij het Amerikaanse deel ook hier van toepassing is. In tabel 19 staan de indicaties voor de collocatieaantallen opgelijst, met alle factoren reeds in rekening gebracht. Tabel 19: totale collocatieaantallen voor Vlaamse sleutelwoorden
Determ. sleutelwoorden Vrije wil-sleutelwoorden
Open VLD 36133 12222
N-VA 22903 15288
VB 24063 7577
SP.A 21986 18890
Groen 25503 18529
CD&V 28320 14346
PVDA 21087 10780
Merk op dat deze aantallen louter in de horizontale richting vergelijkbaar zijn met elkaar. De factor van de absolute aantallen per partij is immers in rekening gebracht, wat niet geldt voor de absolute
53
aantallen per filosofisch uiterste. Het gaat in eerste instantie immers om hoe de partijen zich verhouden tot elkaar voor determinisme en vrije wil apart. Nadien wordt het wel mogelijk om die relatieve cijfers te vergelijken en bv. de vraag te stellen hoe een partij scoort bij determinisme in vergelijking met vrije wil. Bovenstaande tabel is waardevol omdat ik de partijen kortom kan rangschikken volgens de mate dat hun sleutelwoorden met de filosofische colloqueren. Dat doe ik niet met de absolute cijfers, maar met de relatieve. Ik ga met andere woorden na wat de verhouding is van de waardes met het gemiddelde van de andere zes. Concreet deel ik TT1 door het gemiddelde van TT2 tot TT7 (en TT8 door het gemiddelde van TT9 tot TT14). Op die manier kan ik aflezen hoeveel procent bv. de Open VLD-sleutelwoorden meer of minder gecolloqueerd staan met de deterministische set, dan de sleutelwoorden van de andere partijen. In tabel 20 staan die verhoudingen weergegeven: Tabel 20: collocatieverhoudingen voor Vlaamse sleutelwoorden
Determ. sleutelwoorden Vrije wil-sleutelwoorden
Open VLD 0,859 1,507
N-VA 1,114 0,875
VB 0,505 0,926
SP.A 1,439 0,835
Groen 1,405 0,990
CD&V 1,034 1,120
PVDA 0,745 0,796
Om van een correlatie te kunnen spreken tussen de politieke en filosofische woordenlijsten, moeten verschillende van deze waardes in zekere mate afwijken van 1. Alleen dan zijn de politieke sleutelwoorden (en dus de partij) bepalend voor het aantal collocaties die ik vind met de filosofische sleutelwoorden. Wanneer we bij een chikwadraattoets dezelfde significantiegrens 12,59 gebruiken als in het woordfrequentieonderzoek dan lijkt ook dit collocatieonderzoek op een correlatie te wijzen. Immers, als we de absolute collocatieaantallen uit tabel 18 in dezelfde formule invullen als in 4.3.1.2, dan overschrijdt 𝜒 2 de significantiegrens voor SP.A, Groen, VB en PVDA bij de deterministische sleutelwoorden en Open VLD en PVDA bij de vrije wil-sleutelwoorden. Dat leidt tot volgende conclusies, waarbij de percentages uit tabel 19 af te lezen zijn. De sleutelwoorden van SP.A en Groen staan opvallend vaker gecolloqueerd met deterministische sleutelwoorden, dan de andere politieke sleutelwoorden. Respectievelijk 43,9% en 40,5% meer. De sleutelwoorden van VB en PVDA staan opvallend minder gecolloqueerd met deterministische sleutelwoorden, dan de andere politieke sleutelwoorden. Respectievelijk 49,5% en 25,5% minder. De sleutelwoorden van Open VLD staan opvallend vaker gecolloqueerd met vrije wil-sleutelwoorden, dan de andere politieke sleutelwoorden. Wel 50,7% vaker. De sleutelwoorden van PVDA staan opvallend minder gecolloqueerd met vrije wil-sleutelwoorden, dan de andere politieke sleutelwoorden. Wel 20,4% minder. Als we even aannemen dat de politieke en filosofische woordenlijsten daadwerkelijk een representatief staal zijn voor hun ideologie, en collocaties inderdaad een verband kunnen aantonen, dan valt het volgende te besluiten. Enerzijds staan SP.A en Groen dichter bij een deterministische visie dan dat VB en PVDA doen. Anderzijds leunt Open VLD relatief dicht aan bij vrije wil als filosofisch ideaal terwijl PVDA daar net verder van af staat. Interessant is nu om deze resultaten en conclusies te toetsen aan de hypothesen zoals die opgesteld zijn in 3.3.1. Ik zal kort overlopen op welke punten
54
ze de verwachtingen bevestigen en waar ze daarvan afwijken. De analogie met voorgaande delen is overigens vrij hoog. Ten eerste blijkt er dus (zoals gezegd) inderdaad een correlatie te bestaan tussen de politieke en filosofische sleutelwoorden. Voor zowel de deterministische als vrije wil-sleutelwoorden zijn er partijsleutelwoorden die in hoge mate meer of minder colloqueren. Uiteraard geldt dat niet voor elke politieke set sleutelwoorden, omdat het politieke landschap geen tweedeling, maar een continuüm voorstelt. Er zijn naast partijen die relatief dicht bij een filosofisch uiterste aanleunen, ook partijen die dat niet doen. De collocatieverhoudingen van onder meer N-VA liggen relatief dicht bij 1 en zij situeren zich dus hoe dan ook ‘centraler’ dan enkele andere partijen. Met dit in het achterhoofd kan men de gevonden verhoudingen visualiseren op twee filosofische assen, een voor vrije wil en een voor determinisme (zie figuur 7).
Figuur 6: situering van Vlaamse partijen op beide filosofische assen volgens collocatieonderzoek
Net zoals bij het woordfrequentieonderzoek is het zo dat ik de partijen idealiter op één as zou kunnen plaatsen, met determinisme en vrije wil als tegenpolen van elkaar. Een van de verwachtingen was namelijk dat politieke sleutelwoorden die sterk colloqueren met één set filosofische sleutelwoorden, dat niet doen met de andere set.28 Hier zien we opnieuw dat PVDA wat dat betreft een sterk tegenvoorbeeld is: hun sleutelwoorden scoren betrekkelijk laag op beide assen. Hetzelfde geldt voor VB, en ook bij Groen en CD&V zijn de posities op beide assen bezwaarlijk elkaars omgekeerde te noemen. Desalniettemin is bij meerdere partijen toch een bepaald patroon waar te nemen. Zo hellen Open VLD, SP.A, N-VA en ook Groen toch duidelijk over naar een van beide filosofische uitersten, terwijl CD&V zich op beide assen vrij centraal bevindt. De resultaten van PVDA en VB laat ik in deze samenvattende as even buiten beschouwing.
Figuur 7: situering van Vlaamse partijen op een enkele filosofische as volgens collocatieonderzoek
Uiteraard ben ik niet blind voor de resultaten van PVDA en VB die niet bevestigen dat determinisme en vrije wil tegenpolen zijn (net zoals PVDA en N-VA dat niet deden in het woordfrequentieonderzoek). Beide sets staan immers weinig gecolloqueerd met deterministische sleutelwoorden, maar
Of anders gezegd, dat ze dat in omgekeerde mate doen. ‘Centrale’ partijen zouden op die manier (ongeveer) evenveel moeten colloqueren met beide filosofische sets. 28
55
eveneens weinig met vrije wil-sleutelwoorden. Opnieuw roep ik als mogelijke verklaring in dat hun sleutelwoorden geen representatief staal vormen voor hun ideologie. Overigens, bij de PVDA lijkt dat intussen wel zeker. Een vergelijking tussen de twee deelonderzoeken volgt nog, maar zowel bij het woordfrequentieonderzoek als hier zijn de resultaten niet bevredigend. Zoals aangehaald in 4.1.2, gaf de PVDA-woordenlijst al geen bemoedigend vooruitzicht naar de resultaten toe, en dat blijkt nu ook. Hetzelfde kan in mindere mate gesteld worden bij VB en N-VA, waar de sleutelwoorden eveneens de meer specifieke en kleinschalige thema’s leken te typeren. Een laatste keer stel ik de vraag of de resultaten aansluiten bij de inhoudelijke verwachtingen. Dat is het geval voor Open VLD, SP.A, Groen en CD&V; zij bevinden zich op dat deel van de as waar we het op inhoudelijke grond zouden verwachten. Het tegenvoorbeeld is N-VA dat volgens dit resultaat eerder bij het determinisme zou aanleunen. PVDA en VB bevestigen de verwachtingen evenmin, evenwel om een andere reden. Hun sleutelwoorden stonden beide weinig gecolloqueerd met beide sets filosofische sleutelwoorden, waardoor überhaupt niet te zeggen valt of ze meer het deterministische of vrije wil-ideaal genegen zijn. Bevestigen Vlaamse resultaten van deelonderzoeken elkaar? Ten slotte is er uiteraard de belangrijke vraag hoe deze Vlaamse resultaten van dit collocatieonderzoek zich verhouden tot die van het woordfrequentieonderzoek. In het Amerikaanse deel bevestigden beide onderzoeken elkaar al bij al vrij goed. Hier volgt echter een nog grotere test, aangezien het woordfrequentieonderzoek meer resultaten en percentages verschafte die (ongeveer) bevestigd moeten worden. Het spreekt voor zich dat de percentages enigszins zullen verschillen – zoals dat in het Amerikaans deel ook minimaal het geval was – maar als beide methodes effectief zijn, zouden dezelfde patronen toch zichtbaar moeten bovendrijven. Om de resultaten van de deelonderzoeken te vergelijken haal ik hun belangrijkste resultaten erbij. Bovenaan tabel 21 staan de verhoudingen waarmee de politieke corpora meer of minder filosofische sleutelwoorden bevatten dan de andere zes. Onderaan staan de verhoudingen waarmee de politieke sets sleutelwoorden gecolloqueerd staan met de filosofische sets sleutelwoorden, eveneens in vergelijking met de andere zes. Tabel 21: filosofische verhoudingen bij woordfrequentieonderzoek, en collocatieverhoudingen bij collocatieonderzoek
Determinisme Vrije wil
Open VLD 0,624 2,005
N-VA 1,516 1,057
CD&V 0,926 1,038
VB 0,877 1,029
Groen 1,221 0,732
SP.A 1,348 0,703
PVDA 0,570 0,546
Determinisme Vrije wil
Open VLD 0,859 1,507
N-VA 1,114 0,875
CD&V 1,034 1,120
VB 0,505 0,926
Groen 1,405 0,990
SP.A 1,439 0,835
PVDA 0,745 0,796
Eigenlijk zijn er per partij twee voorwaarden die voldaan moeten worden om uiteindelijk tot een zinnige conclusie te komen. Omdat determinisme en vrije wil in principe tegengestelden zijn, zouden de verhoudingen per deelonderzoek per partij (ongeveer) elkaars omgekeerde moeten zijn. Dit is al uitvoerig besproken in voorgaande alinea’s – en geldt dus niet voor N-VA en PVDA in het woordfrequentieonderzoek, en VB en PVDA in het collocatieonderzoek. Hierdoor komen enkel Open VLD, CD&V, Groen en SP.A nog in aanmerking om aan de tweede voorwaarde te voldoen. Dat is
56
dat de resultaten van beide deelonderzoeken per partij een vergelijkbaar patroon kennen. Voor deze vier partijen bevestigen de deelonderzoeken elkaar. Immers, Open VLD helt bij beide onderzoeken duidelijk over naar vrije wil, SP.A en Groen doen hetzelfde in de richting van het determinisme, en CD&V nestelt zich tweemaal in het centrum. Visueel zijn de vrije abstracte percentages vermoedelijk eenvoudiger te vatten, en dus geef ik nogmaals de gevonden assen voor beide deelonderzoeken weer in figuur 8. De bovenste as was het resultaat van het woordfrequentieonderzoek, de onderste as van het collocatieonderzoek.
Figuur 8: de verhoudingen uit woordfrequentie- en collocatieonderzoek gevisualiseerd
Hier zien we nog duidelijker hoe voor Open VLD, CD&V, Groen en SP.A een vergelijkbaar resultaat gevonden werd. Voor de duidelijkheid, voor VB, N-VA en PVDA is dat niet het geval omdat zij in minstens één deelonderzoek niet eens op de as gesitueerd konden worden. Dat brengt me bij de vraag of de deelonderzoeken elkaar nu bevestigen, dan wel tegenspreken qua resultaten. Zoals ik bij de hypothesen van het collocatieonderzoek aangaf, zouden verschillende resultaten de methodologie toch sterk ondermijnen. En ik kan er niet onderuit: voor drie partijen zijn de resultaten allesbehalve bevredigend. Ik ga voor elk van hen kort na wat er spaak liep. Voor PVDA bevestigen de deelonderzoeken elkaar wel. Het corpus bevat weinig filosofische sleutelwoorden én de sleutelwoorden colloqueren weinig met de filosofische sets (voor zowel vrije wil, als determinisme). Ze zijn echter niet op de as te situeren om dat ze overal laag scoorden. Voor N-VA bevestigen de deelonderzoeken elkaar niet. Het collocatieonderzoek doet een licht deterministische voorkeur vermoeden, terwijl het woordfrequentieonderzoek geen conclusie toeliet (het scoorde bovengemiddeld voor zowel determinisme als vrije wil). Voor VB bevestigen de deelonderzoeken elkaar niet. Het woordfrequentieonderzoek wijst op een vrij centrale situering, terwijl het collocatieonderzoek geen conclusie toeliet (het scoorde onder het gemiddelde voor zowel determinisme als vrije wil). Echter, stellen dat de resultaten van deze partijen de gehele methodologie ondermijnen is meer dan een brug te ver. Het is naar mijn mening vrij duidelijk waar de precieze oorzaak ligt voor de afwijkende resultaten: bij de datavergaring. Ik heb al enkele malen gewezen op het feit dat de sleutelwoorden (en mogelijk dus ook de corpora) voor PVDA, N-VA en VB de partijideologie niet lijken te typeren. Woorden als Vlaamse, Brussel, Wallonië, miljard en dividenden doen vermoeden dat de focus bij de betreffende partijen meer gericht is op het praktische en pragmatische van politiek. Althans toch in de teksten die geselecteerd werden voor de corpora. Toch wil ik ook niet met de vinger wijzen naar de gehele datavergaring. De sleutelwoorden voor de vier andere partijen, alsook voor de
57
twee Amerikaanse, sloten net sterk aan bij de verwachtingen, in die mate dat ze soms bijna karikaturaal waren. Het is vermoedelijk niet toevallig dat de deelonderzoeken net voor die partijen elkaar wel bevestigen. In figuur 9 vat ik die partijen nog eens finaal samen; het zijn de assen van in figuur 8 die samengevoegd zijn. Het is mijn overtuiging dat, als ik ook waardevolle en typerende sleutelwoorden had gevonden voor PVDA, N-VA en VB, ook zij op onderstaande as geplaatst konden worden.
Figuur 9: situering van Vlaamse partijen op een enkele filosofische as volgens beide deelonderzoeken
Tot slot vat ik de conclusie samen op basis van het woordfrequentie- en collocatieonderzoek voor het Vlaamse deel. Als de opgestelde corpora en woordenlijsten representatief zijn voor de partijideologieën en filosofische idealen, en als woordfrequentie en collocaties daadwerkelijk goede indicaties zijn voor inhoudelijke ideologie, dan blijkt Open VLD het vrije wil-ideaal vrij genegen, terwijl SP.A en Groen veeleer aanleunen bij het deterministische ideaal. CD&V neemt een tussenpositie in.
58
5 Conclusie Moral politics: how liberals and conservatives think van George Lakoff (1996) vormde de aanzet voor deze masterproef. Net als Lakoff, heb ik geprobeerd om politieke verschillen te koppelen aan een meer rudimentaire, filosofische visie op mens en maatschappij. Ook voor Lakoff staat de politieke differentiatie immers niet op zich, maar komt die voort uit fundamentelere, filosofische noemers. Voor hem waren die noemers twee gezinsmetaforen: voor de democraten in de VS moet de regering optreden zoals een Nurturing Parent doet in het gezin, voor de republikeinen handelt de regering maar beter als een Strict Father. Ik noem het ‘noemers’ omdat hun politieke standpunten – althans volgens Lakoff – er steeds weer op terug te voeren zijn. Ze worden er met andere woorden door verklaard. In deze masterproef ben ik echter van twee andere noemers uitgegaan. In hoofdstuk twee heb ik een kort, inhoudelijk pleidooi gegeven voor determinisme en vrije wil als primordiale uitersten van elkaar, die naar mijn mening talloze politieke en maatschappelijke debatten verklaren. Het is mijn overtuiging dat deze aloude, wijsgerige tegenstelling precies die noemer kan zijn waaronder vele politieke standpunten samenhangen. In wezen diende het pleidooi eenvoudigweg als een verantwoording voor de uitvoering van een kwantitatief onderzoek. Ik verdedigde met andere woorden het nut van de kwantitatieve toets die volgde. Met behulp van technieken uit de discoursanalyse en de corpuslinguïstiek heb ik onderzocht of er een correlatie bestaat tussen de filosofische idealen vrije wil en determinisme enerzijds, en het discours van de politieke partijen in de VS en Vlaanderen anderzijds. De algemene hypothese was dat er daadwerkelijk een dergelijk verband bestaat. De aanwezigheid van een correlatie zou vrije wil en determinisme weliswaar nooit als fundamentele basisverklaring kunnen aanwijzen, maar het zou toch een goede bevestiging vormen van een bepaald inhoudelijk vermoeden. Samengevat heb ik voor zowel de politieke partijen als de filosofische idealen data vergaard, en tussen die gegevens naar een correlatie gezocht. De datavergaring bestond uit het opstellen van corpora en sleutelwoorden per politieke partij en filosofische ideaal. Gebaseerd op inzichten van onder meer Scott (2001) was het de bedoeling dat deze gegevens objectieve maatstaven vormden voor hetgeen de betreffende partijen en filosofische idealen inhoudelijk voor staan. Overigens, door de woordenlijsten op kwantitatieve wijze uit de corpora te destilleren, onttrok ik deze aan intuïtie en introspectie. Dit had voor- en nadelen. Het voordeel was de objectiviteit; bv. Lakoff oppert ook woordenlijsten voor de Amerikaanse partijen, die echter niet geheel bleken te stroken met de hier gevonden resultaten. Het nadeel is dat niet alle woordenlijsten even goed de ideologieën bleken te typeren, met gemengde resultaten tot gevolg. Concreet was het onderzoek tweeledig. In een woordfrequentieonderzoek ging ik de frequentie na van de filosofische sleutelwoorden in de partijcorpora. Op die manier kon ik nagaan hoe de partijen zich verhouden tot elkaar per filosofisch ideaal apart. Hoe meer die verhoudingen per partij in de richting van een van beide filosofisch idealen overhelden, hoe meer de partij in principe dat ideaal aanhing. In een collocatieonderzoek onderzocht ik de mate waarin de politieke en filosofische sleutelwoorden met elkaar colloqueren in het CoCA of het Corpus Hedendaags Nederlands. Ook hier kon ik de onderlinge verhouding van de partijen per filosofisch ideaal nagaan. En ook hier gold dat hoe meer die verhoudingen per partij in de richting van een van beide filosofisch idealen overhelden, 59
hoe meer de partij in principe dat ideaal aanhing. Het uitvoeren van twee deelonderzoeken was interessant omdat eventueel gelijkaardige resultaten de betrouwbaarheid zou doen toenemen. Tegelijk zouden verschillende resultaten een eventueel mankement in de methodologie kunnen blootleggen. Het resultaat van het beide onderzoeken staat in figuur 10 samengevat. Het betreft een visualisering van de percentages die ik in de deelonderzoeken bekwam, en die ik ook al gaf bij de resultaten voor de deelgebieden VS en Vlaanderen apart.
Figuur 10: situering van Vlaamse én Amerikaanse partijen op eenzelfde filosofische as volgens beide deelonderzoeken
Ter verduidelijking, bijvoorbeeld Open VLD staat waar het staat omdat: 1. 2. 3. 4.
Hun corpus relatief veel vrije wil-sleutelwoorden bevatte. Hun corpus relatief weinig deterministische sleutelwoorden bevatte. Hun sleutelwoorden relatief vaak met die voor vrije wil gecolloqueerd stonden. Hun sleutelwoorden relatief weinig met de deterministische gecolloqueerd stonden.
Om de partijen op een enkele as tussen determinisme en vrije wil te kunnen situeren, moesten de resultaten per partij eenzelfde patroon aannemen zoals dat Open VLD het geval was. Daarmee bedoel ik enerzijds dat de resultaten voor vrije wil en determinisme telkens (ongeveer) elkaars omgekeerde moesten zijn (vergelijk punt 1, 3 met punt 2, 4), en anderzijds dat de resultaten voor de deelonderzoeken elkaar moesten bevestigen (vergelijk punt 1, 2 met punt 3, 4). PVDA, N-VA en VB zijn niet in figuur 10 terug te vinden, omdat aan minstens één van die voorwaarden niet voldaan is. Zoals ik verdedigd heb, ligt de reden daarvoor vermoedelijk bij de woordenlijsten, die de partijideologie niet goed lijken te typeren. Dat is beslist wel het geval voor de woordenlijsten van de andere partijen en het lijkt mij dan ook niet toevallig dat de deelonderzoeken elkaar voor hun resultaten wel bevestigen. Op basis van de resultaten is er mijns inziens dus een verband tussen het politieke discours en de filosofische idealen vrije wil en determinisme. Mocht dat niet het geval zijn, dan zouden de partijen zich allen relatief centraal bevinden op bovenstaande as. De frequentie- en collocatieaantallen zouden dan tussen de partijen immers niet veel verschillen. Maar hier blijkt dat dus wel vrij significant het geval te zijn. Ik kan bijgevolg besluiten als volgt. Als de opgestelde corpora en woordenlijsten daadwerkelijk representatief zijn voor de partijideologieën en filosofische idealen – en als woordfrequentie en collocaties inderdaad goede maatstaven zijn voor inhoudelijke ideologie – dan blijken republikeinen in de VS en Open VLD in Vlaanderen het vrije wil-ideaal vrij genegen, terwijl democraten in de VS (hoewel gematigd) en SP.A en Groen in Vlaanderen veeleer aanleunen bij het deterministische ideaal. CD&V neemt daarbij een tussenpositie in.
60
Dit onderzoek wou niet de pretentie hebben om de tegenstelling determinisme en vrije wil als absolute grondslag te kunnen aanduiden voor politieke verschillen. Het aantonen van een rechtstreeks causaal verband zou voor een kwantitatief ook bijzonder zwaar vallen. Een correlationeel verband aan het licht te brengen was vermoedelijk het hoogst haalbare. Een kwalitatief onderzoek zou eventueel wel een causaal verband kunnen aantonen en biedt meteen een perspectief voor verder onderzoek. Natuurlijk is deze masterproef slechts een tussenstadium in het onderzoek naar fundamentele, politieke verschillen, en ook correlaties met eventuele andere filosofische ‘noemers’ kunnen evenzeer onderzocht worden. Het zou zo maar kunnen dat de correlatie tussen partijideologieën met bepaalde andere ‘axioma’s’ – om eens een ander woord te gebruiken – veel sterker zou blijken. Verder is ook dit onderzoek zelf nog voor verbetering vatbaar. Het is bijvoorbeeld falsifieerbaar in de zin dat de finale conclusie veel condities bevat – om de partijen op de filosofische as te situeren, moeten de opgestelde corpora en woordenlijsten representatief zijn voor de partijideologieën en filosofische idealen, én moeten woordfrequentie en collocaties objectieve maatstaven zijn voor inhoud. Hoewel ik meen dat die condities in voldoende mate vervuld zijn, kan dat in zeker vraag gesteld worden. Misschien zijn woordfrequentie en collocaties bijvoorbeeld niet die objectieve maatstaven, zoals de aangehaalde literatuur beweert. Een andere mogelijke kritiek is het gekozen bereik in het collocatieonderzoek, dat met negen woorden ontegensprekelijk ruim genomen is. Dit, ten gunste van het aantal resultaten. Echter, de gelijklopende resultaten van de twee deelonderzoeken doen deze bedenkingen wat mij betreft grotendeels teniet. De resultaten zijn voor twee Amerikaanse en vier Vlaamse partijen in die mate duidelijk, dat de correlatie met filosofische idealen vrije wil en determinisme alvast niet te negeren is.
61
6 Bibliografie Aalberts, C. (2004, Mei 28). Politieke betrokkenheid en politieke sensitiviteit onder jongeren. Opgehaald van Politologisch Instituut: http://www.politologischinstituut.be/PE2004/documents/11Aalberts.pdf Abts, K., Swyngedouw, M., & Billiet, J. (2010). De structurele en culturele kenmerken van het stemgedrag in Vlaanderen. Opgehaald van KU Leuven: https://soc.kuleuven.be/web/files/6/34/Structurele_en_culturele_determinanten_van _stemgedrag_in_Vlaanderen2010.pdf Bertels. (2008). Corpus, Concordance, Collocation. Cambridge: Cambridge University Press. Biber, D. &. (1998). Corpus Linguistics: Investigating Language Structure and Use. Cambridge: Cambridge University Press. Christian, J. L. (2009). Philosophy: An Introduction to the art of wondering. Canada: WADSWORTH CENGAGE Learning. Fairclough, N. (1992). Discourse and Social Change. Cambridge: Polity. Firth, J. (1957). A synopsis of linguistic theory, 1930-1955. Studies in Linguistic Analysis, Special Volume, Philological Society, 1-32. Hunston, S. (2002). Corpora in Applied Linguistics. Cambridge: Cambridge University Press. Lakoff, G. (1996). Morals Politics: how liberals and conservatives think. Chicago and London: The University of Chicago Press. Matyn, J. (2014, April 2). "Kennis en interesse in politiek zeer laag bij jongeren". Opgehaald van Deredactie: http://deredactie.be/cm/vrtnieuws/VK14-formatie/1.1928016 Mayaffre, D. (2002). L'Herméneutique numérique. Opgehaald van uottawa.ca: http://www.uottawa.ca/academic/arts/astrolabe/articles/art0031.htm/Hermeneutique .htm Mayaffre, D. (2009). L’analyse du discours assistée par ordinateur. Opgehaald van eprints.aidenlignefrancais-universite.auf.org: http://eprints.aidenligne-francais universite.auf.org/19/1/pdf_Formation_Mayaffre_Alexandrie_dec09_.pdf
62
Oshitelu, G. A. (2010). Religion, God and Evil: Issues in Philosophy and Religion. Ibadan: Hope Publications Ltd. Paquot, M., & Bestgen, Y. (2009). Distinctive words in academic writing: A comparison of three statistical tests for keyword extraction. In A. Jucker, D. Schreier, & M. Hundt, Corpora: Pragmatics and Discourse. (pp. 247-269). Amsterdam: Rodopi. Peeters, B. (2013). Politieke kennis bij jonge kinderen. Opgehaald van Scriptiebank: http://www.scriptiebank.be/sites/default/files/webform/scriptie/masterpaper_11.pdf Scott, M. (2001). Mapping the KeyWords to problem and solution. In M. In Hoey, M. Scott, & G. Thompson, Patterns of Text: in Honour of Michael Hoey. (pp. 109-127.). Amsterdam: Benjamins. Sinclair, J. M. (1991). Corpus, Concordance, Collocation. Oxford: Oxford University Press. Stubbs, M. (1996). Text and Corpus Analysis. Oxford: Blackwell Publishers Ltd. Swyngedouw, M., & Heerwegh, D. (2007). Wie stemt op welke partij? De structurele en culturele kenmerken van het stemgedrag in Vlaanderen. Opgehaald van KU Leuven: https://soc.kuleuven.be/web/files/6/34/wie_stemt_op_welke_partij_2007__def_.pdf Truscott, F., & Emory, F. (2007). A Philosophical Essay on Probabilities by Laplace, Pierre Simon. New York, Verenigde Staten: Cosimo Classics.
63
7 Bijlagen 7.1 Begrippenlijst voor Amerikaanse partijen De volledige lijst met sleutelwoorden voor democraten en republikeinen, met telkens hun frequentie en keyness. Die laatste waarde geeft weer in welke mate ze het betreffende corpus typeren. Het is op die waarde dat ze gerangschikt staan. democratic 1400 908.084 class 190 116.683 work 1221 106.185 college 220 101.876 workers 586 99.173 party 915 84.625 companies 159 68.800 invest 155 59.168 investments 123 57.137 democrats 405 54.628 police 127 49.628 working 453 47.728 poverty 235 45.109 cuts 162 43.350 community 451 41.351 committed 307 40.648 jobs 703 40.456 loans 118 39.337 fair 334 38.849 give 374 38.832 housing 434 38.768 every 892 37.620 last 502 37.133 employment 305 35.811 think 142 35.455 strengthen 309 34.706 new 1795 34.509 know 490 34.358 teachers 174 33.941 south 164 33.806 training 297 32.588 pay 343 32.144 cities 227 32.007 deficit 195 31.075 wage 165 30.950 hard 248 30.872 skills 146 30.393 want 335 30.273 take 417 29.527
republicans republican freedom free federal spending applaud states individuals government congressional current property liberty republic oppose individual against regulatory taxpayers defense terrorist terror role missile state taxes regulation amendment initiative religious personal terrorists reaffirm inflation reduced encourage enterprise traditional
799 1014 855 922 1579 451 150 1357 212 1967 192 273 148 220 128 237 315 731 146 141 622 111 141 255 127 657 335 100 156 185 151 195 147 116 309 149 397 185 108
427.243 287.971 157.485 111.099 107.935 106.636 84.868 83.294 82.575 82.044 60.707 58.198 55.459 51.247 51.175 50.104 49.463 45.158 41.622 40.423 40.276 40.097 39.211 38.846 38.842 37.977 36.926 35.582 35.116 35.000 34.937 34.721 33.346 31.997 31.902 30.656 30.105 29.075 28.658
64
7.2 Voorbeeld van word cloud Dit is ter illustratie de word cloud van deze masterproef. Hoe hoger de frequentie, hoe groter en dikker het lettertype van de woorden.
65