KU LEUVEN FACULTEIT LETTEREN BLIJDE INKOMSTSTRAAT 21 BUS 3301 3000 LEUVEN, BELGIË
Variopinto, cacofonico e multiforme: een attitudineel en semantisch onderzoek naar regionale variëteiten van het Italiaans
Stefano De Pascale Masterproef aangeboden binnen de opleiding master in de taalkunde Promotor prof. dr. Dirk Speelman Co-promotor prof. dr. Stefania Marzo Academiejaar 2013-2014. 267.899 tekens
English abstract The following dissertation aims to describe and explain the present language ristandardisation patterns in Italy. Drawing inspiration from the combined insights of the social psychology of language and variational sociolinguistics, we attach great importance to the study of the language attitudes towards regional varieties of Italian, called italiani regionali. Standard Italian has functioned for centuries as a formal and especially written code, spoken by an aristocratic minority. The everyday communication of the most was conducted in one of the numerous ItaloRomance dialects of the peninsula. After the Second World War the country underwent drastic socio-economical transformations and thanks to this evolution large sections of the population got access to this ‘elite language’. The regional varieties are in fact the consequence of the differentiation of this standard language under the influence of the dialects which characterize the different regio’s in Italy. Therefore the italiani regionali have been defined as locally marked varieties of Standard Italian, of which the most important are the Milanese, Florentine, Roman and Neapolitan variety. Those varieties are entering domains of social life which were once reserved only for the standard language, for example television programmes. This has got important repercussions on the status of Standard Italian, which seems now to be influenced by those varieties, by accepting largely imperceptible features from them. In other words, the centre of gravity of Standard Italian is shifting towards a more informal and regionally marked norm. A social psychology perspective on this issue entails the search for the driving social forces that lay behind this evolution, the alleged why-question of language change. By inspecting the social and psychological, so-called ‘subjective’ factors like feelings, opinions and attitudes, we should then be able to predict future changes. Language is a tool to position yourself on the social playground, to identify with a group or react against another one. The fundamental idea is that if the Italian speakers ascribe prestige to a social or regional group, which speaks one of the regional varieties, then they will accept more ‘peacefully’ linguistic influences from those varieties in the standard language. To investigate this we constructed a verbal guise experiment (VGE) and a free response experiment (FRE) and performed both on a sample of southern Italian speakers. The four attitudinal dimensions produced by the factor analysis of the VGE are Speech Status, Speaker Status, Speaker Solidarity and Speech Attractiveness. The results show that the middle-aged participants have the most favorable attitudes toward the Milanese variety on the Speech Status-dimension, a clear indication of the rising prestige of that variety. The youngest respondents often give very low scores to all varieties in all dimensions, with the exception of Standard Italian and Milanese Italian again for the status dimensions. It is very likely that the latter variety constitutes a good candidate to become accepted as the new standard. The output of the FRE has been investigated with the aid of distributional semantic methods and principles. This gave us the opportunity to reveal the semantic fields which the Italian speaker uses when conceptualizing and talking about variation, in order to supplement the relatively bare attitudinal profile obtained by the VGE with rich semantic data. We constructed a Semantic Vector Space Model and found that, once again, the Milanese variety has been treated differently from the Florentine, Roman and Neapolitan variety. The first is associated with semantic domains as style and dignity, whereas the last two are associated with larger-than-life themes, like geniality and exceptionality.
Dankwoord Umberto Eco besluit zijn no-nonsense-handleiding Come si scrive una tesi di laurea (“Hoe je een masterscriptie schrijft”) met de volgende vermaning: je promotoren bedanken getuigt van slechte smaak; als ze je geholpen hebben, dan hebben ze niets anders dan hun plicht vervult. Als u het ons vraagt: een mooi staaltje postmoderne ironie, dat ons niet bij de neus zal nemen! Hoe zou ik anders mijn appreciatie moeten tonen voor de boeiende lessen over de Italiaanse taal die professor Stefania Marzo mij doorheen de hele opleiding heeft aangebracht? Hoe zou ik anders mijn waardering moeten uiten voor de sessie waarin professor Dirk Speelman mij met een geduld heeft ingeleid in de wereld van de statistiek en de computationele linguïstiek? Bedankt hiervoor, en voor alle gesprekken, revisies, tips en hulp die de voorbije maanden onze samenwerking hebben gekenmerkt. Zoals elke meesterproef die fieldwork vereist, heeft ook deze heel veel mensen betrokken. Om te beginnen wil ik de leden van het toneelgezelschap ‘La Locandina’ bedanken, en in het bijzonder zio Carmine en zia Valeria, die mij de theaterzaal en haar publiek ter beschikking stelden. Voorts bedank ik zia Gabriella, die zo hulpvaardig is geweest om een belangrijk aantal kennissen op te trommelen voor de experimenten. Ten slotte gaat mij dank uit naar de professoren Siria Guzzo en Paola Attolino van de Universiteit van Salerno, die voor mij een aanzienlijk grote groep studenten hebben geregeld en die mij bovendien een geweldig onthaal hebben bezorgd. Grazie di cuore a tutti voi! Ten slotte mag ik de mensen niet vergeten die op eender welke manier mijn leef- en studieomgeving aangenamer hebben gemaakt. Daarom bedank ik mijn familie, mijn kotgenoten, mijn bibgezellen en alle andere vrienden die ooit interesse hebben getoond in deze meesterproef. En bedankt, Laura, voor die broodnodige referenties!
Inhoudstafel Introductie ............................................................................................................................................. 2 1.
Literatuurstudie ............................................................................................................................. 5 1.1.
1.1.1.
Het ontstaan van nieuwe standaardvariëteiten ........................................................... 5
1.1.2.
Attitudeonderzoek: concepten en methodes ................................................................ 8
1.2.
2.
3.
Algemeen-theoretische achtergronden ................................................................................ 5
De case study: Italiaanse regionale variëteiten.................................................................. 12
1.2.1.
De geschiedenis van het Italiaans en het ontstaan van de regiolecten ..................... 12
1.2.2.
Linguïstische aspecten van de convergentie tussen Standaarditaliaans en dialect. 14
1.2.3.
Andere variatiedimensies in het Italiaans .................................................................. 17
1.2.4.
Gedetaileerde uitwerking van de convergentie in het Italiaans taalrepertorium .... 20
1.2.5.
Prestige en stigma van de Italiaanse variëteiten: een overzicht ............................... 23
Experimenteel design en onderzoeksvragen ............................................................................. 26 2.1.
Design ................................................................................................................................... 26
2.2.
Onderzoeksvragen ............................................................................................................... 28
De verbal guise experiment ....................................................................................................... 30 3.1.
Opstellen van het verbal guise experiment ........................................................................ 30
3.1.1.
Keuze van de geluidsfragmenten ................................................................................ 30
3.1.2.
Keuze van de stellingen................................................................................................ 32
3.2.
Afnames VGE: pilootstudies en eigenlijk experiment ....................................................... 36
3.2.1.
Eerste pilootstudie ....................................................................................................... 36
3.2.2.
Tweede pilootstudie ..................................................................................................... 37
3.2.3.
Het uiteindelijke experiment: keuze doelpubliek en afnameplek ............................ 38
3.3.
Attitudedimensies aan het licht brengen: factoranalyse ................................................... 39
3.3.1.
Factoranalyse: beschrijving van de techniek .............................................................. 39
3.3.2.
Interpretatie van de factormatrix................................................................................ 41
3.4.
Resultaten van de statistische tests .................................................................................... 44
3.4.1. Verkennend onderzoek: beoordeling van de regionale variëteiten voor alle participanten................................................................................................................................ 44 3.4.2. 3.5.
Gedetailleerd onderzoek: analyse met mixed-effects model..................................... 48
Discussie van de resultaten ................................................................................................. 55
3.6. 4.
De free response experiment...................................................................................................... 61 4.1.
Bespreking van theoretische en methodologische kwesties van het FRE........................ 61
4.1.1.
Opnieuw over het onderscheid bewust en onbewust ................................................ 61
4.1.2.
Bewust gepresenteerde attitudestimuli: labels .......................................................... 63
4.1.3.
Kwalitatieve responsdata: keywords en adjectieven ................................................. 66
4.2.
Analyse associatiedata ......................................................................................................... 70
4.2.1.
De distributionele semantiek ...................................................................................... 70
4.2.2.
Opbouw van het Semantic Vector Space Model ........................................................ 74
4.3.
5.
Evaluatie van de verbal guise experiment ......................................................................... 57
Interpretatie, discussie en evaluatie van het SVS-model .................................................. 81
4.3.1.
Welke concepten gebruikt men om regionale variëteiten te beschrijven? ............... 81
4.3.2.
Evaluatie van het SVS-model ...................................................................................... 83
Synthese, concluderende opmerkingen en suggesties voor toekomstig onderzoek ............... 86
Bibliografie .......................................................................................................................................... 90 Bijlagen ................................................................................................................................................ 99 Clusters .............................................................................................................................................. 103
Introductie
Voor wie een warm hart heeft voor onderwerpen zoals taalvariatie en taalverandering, is het een fascinerend vooruitzicht om zelf een, hopelijk gefundeerde poging te wagen standaardiseringsdynamieken in kaart te brengen. Men kan evenwel geen antwoord vinden op de vraag “waar gaat het naartoe?” als men niet ook die andere fundamentele vraag stelt, namelijk “waarom gaat het daarnaartoe?”. Deze meesterproef onderzoekt hoe een sociaalpsychologisch perspectief op taalvariatie een waardevolle manier is om enigszins de richting van de ontwikkelingen te voorspellen, die de Italiaanse standaardtaal momenteel doormaakt. In het taalveranderingsonderzoek heeft recentelijk de idee vaste voet gekregen dat ‘objectieve’ factoren, zoals articulatiegewoontes en mentale analogiemechanismen, niet voldoende zijn om taalverandering te verklaren. De driving force moet echter gezocht worden in ‘subjectieve’ factoren, zoals percepties, overtuigingen, emoties, kortom vormen van identiteit en taalattitude. Taal is een instrument om de eigen positie in het sociale speelveld te bepalen, om zich afzetten tegen of aansluiting te zoeken bij groepen, in de zoektocht naar een positieve sociale identiteit. Taalverandering wordt in dat opzicht beschouwd als de uitkomst van enerzijds concurrerende sociale krachten en ideologieën en anderzijds de constructie van mentale beelden, percepties, stereotypen en meningen. Die dynamieken gaan dus steeds gepaard met vergelijkingen en beoordelingen. Als we toegang krijgen tot de waardesystemen waarop zulke beoordelingen gebaseerd zijn, dan opent dat een perspectief om veranderingen in het effectief taalgebruik te voorspellen. De Italiaanse sociolinguïstische situatie is een bijzonder interessant laboratorium om zulke studies uit te voeren. Eeuwenlang werd het Standaarditaliaans gesproken door een kleine elite en voornamelijk aangewend als schrijftaal, waardoor het lang immuun was voor veranderingen. De laatste decennia is de situatie volledig gekeerd: het Italiaans is de moedertaal geworden van de bijna volledige bevolking, terwijl de dialecten in verval zijn. Het Italiaans dat nu wordt gesproken is evenwel niet het Standaarditaliaans, maar een regionaal gekleurde variëteit ervan, veroorzaakt door de interferentie van het dialectale substratum van een regio. Daardoor is het taalpanorama in Italië gekenmerkt door een beperkt aantal op structureel vlak gelijkaardige variëteiten die toch elk specifieke linguïstische eigenschappen bezitten. Het sociaalpsychologische perspectief toegepast op de Italiaanse sociolinguïstische situatie doet de volgende vraag rijzen: kan een positieve of negatieve attitude die sprekers hebben tegenover regionale variëteiten van het Italiaans een barometer zijn voor concrete aanvaarding van invloeden van diezelfde regiolecten in de standaardtaal? Met een steriele goed- of afkeuring van variëteiten stellen we ons echter niet tevreden: we willen namelijk weten op welke grond men een positieve of negatieve attitude uitdraagt. Op welke concepten doen sprekers een beroep om überhaupt over taalvariëteiten te spreken? In het eerste deel van deze scriptie zullen we een uitgebreid overzicht geven van de inspirerende theoretische inzichten en de concrete studies die de onze zijn voorafgegaan. Twee zwaartepunten zullen daarbij aan bod komen. Aan de ene kant bespreken we de vigerende beschrijvingsmodellen in de Europese taalkunde waarmee standaardtaalontwikkelingen worden beschreven. Begrippen als convergentie, divergentie, demotisatie en destandardisatie zullen een invulling krijgen. Onze aanpak zal expliciet aansluiting zoeken bij wat in het zogenaamde SLICEproject (Standard Language Ideology in Contemporary Europe) wordt voorgedragen. Daarin beoogt men de eerder aangestipte synthese van twee taalkundige subdisciplines: de
variationistische sociolinguïstiek en de sociale taalpsychologie. We zullen daarom uitleg verschaffen over algemene concepten en methodologische strategieën in het attitudeonderzoek. Ten slotte introduceren we onze case study, namelijk de relatie tussen Standaarditaliaans, zijn regionale variëteiten en de dialecten. We overlopen de geschiedenis van deze linguïstische codes, enkele markante verschijnselen en de manier waarop ze werden onderzocht in de Italiaanse taalkunde. Het deel wordt afgesloten met een bespreking van de schaarse studies die de standaardiseringsdynamieken in Italië vanuit een attitudineel standpunt hebben benaderd. In een tweede, korte hoofdstuk zullen we eerst beknopt de twee experimentele designs presenteren, en vervolgens de zes onderzoeksvragen en –interesses die aan de basis liggen van deze meesterproef. Het derde en vierde deel betreft het experimentele tweeluik van de meesterproef. Er bestaat geen moeilijkere taak dan het verzamelen van attitudinele data, dan nog rond een zo delicaat onderwerp als taal. Daarom besteden we uitvoerig aandacht aan de twee experimenten van ons onderzoek: een verbal guise experiment (VGE) en een free response experiment (FRE). De reden dat we voor twee verschillende technieken kozen, ligt in de overtuiging dat beide benaderingen complementair zijn en is het gevolg van onze wens om een zo rijk mogelijk beeld te schetsen van de attitudemechanismen en –profielen van onze participanten. De data van de VGE zullen aan de hand van een factoranalyse en mixed-effects linear models geanalyseerd worden, terwijl de gegevens, c.q. adjectieven, van de FRE zullen gemodelleerd worden dankzij een semantic vector space model¸ daarbij steunend op de principes en methodes van de distributionele semantiek. We zullen gedetailleerd elke stap van de experimentele designs beschrijven, alsook telkens die stappen evalueren in het licht van voorgaand onderzoek. Ten slotte eindigt dit werk met een conclusie, waarin we onze bevindingen samenvatten in de hoop de antwoorden te hebben gevonden op onze onderzoeksvragen.
1. Literatuurstudie 1.1.
Algemeen-theoretische achtergronden
1.1.1. Het ontstaan van nieuwe standaardvariëteiten In heel Europa worden voorheen stabiele, zelfs monolithische nationale standaardtalen op dit bijzonder moment in de geschiedenis in grote mate permeabel voor intrasystemische vernieuwingen met zwaartepuntverschuivingen als gevolg. Ook in andere universitaire centra is de laatste jaren het debat aangewakkerd over de dynamieken die (de)standaardisering kenmerken (Auer & Hinskens 1996; Auer 2005; Auer, Hinskens & Kerswill 2005; Kristiansen & Coupland 2011; Kristiansen & Grondelaers 2013). Enkele sociolinguïsten van het oude continent hebben daarom de krachten gebundeld en een gezamenlijk project in het leven geroepen, het SLICE-onderzoeksprogramma (Standard Language Ideology in Contemporary Europe, onder leiding van Tore Kristiansen), dat een bijdrage wil leveren aan de studie van de aard en de rol van standaardisering in taal en van standaardtalen in de late moderniteit. De denkpiste en onderzoeksinteresse die in bovengenoemd kader ontwikkeld worden, stroken volledig met de opzet van deze meesterproef. We zullen daarom in de volgende paragrafen concepten en strategieën uitlijnen, die als inspiratiebron en leidraad hebben gediend voor onze studie. 1.1.1.1. Destandardisatie en demotisatie In de eerste plaats vestigt de onderzoeksgroep SLICE haar aandacht op de laatste stap die een standaardtaal ondergaat, namelijk de implementatie van de norm, die bijvoorbeeld vanuit een top-down perspectief kan plaatsvinden, aan de hand van “controlling activities by national governments and their agencies” (Coupland & Kristiansen 2011: 22). Wat zij evenwel belangrijker achten is de keerzijde van de medaille te bestuderen, namelijk de aanvaarding en de diffusie van die norm (zich afspelend “on-the-ground” en “primarly in virtue of unofficial social group perceptions and judgements” [ibid.: 28]). Daarbij wordt de focus, Josephs (1987) voorbeeld volgend, van standaardtalen naar taalnormen verschoven. Dankzij de dynamische aard van het begrip ‘taalnorm’ is het mogelijk twee ontwikkelingen te onderscheiden, die beide betrekking hebben op de verzwakking van de traditionele standaardtalen: destandaardisatie en demotisatie (demotizierung, [Mattheier 1997]). Destandaardisatie (Fairclough 1992, geciteerd in Coupland & Kristiansen 2011) grijpt plaats op het moment dat nationale standaardtalen hun prestige verliezen en in de publieke opinie niet meer aangevoeld worden als de “beste talen”. Bijgevolg, zouden in het publieke domein verschillende variëteiten toegang krijgen, zonder echte geprivilegieerde posities te bezetten. Coupland en Kristiansen suggereren dat dit fenomeen eerder voorkomt in landen die voordien sterke standaardtaalideologieën hadden – een belangrijke vaststelling waaraan echter geen verdere reflectie wordt gekoppeld. De visie van Fairclough impliceert in feite dat de taalgemeenschap geen nood meer heeft aan een taal die fungeert als model, maar zelf bijdraagt aan een vergevorderde democratisering van het taallandschap. We hebben evenwel enkele persoonlijke bedenkingen bij Faircloughs model. Ten eerste, dat “value levelling implies a situation with no valorisation of differential language use, a situation
where the idea of ‘best language no longer is an issue in the community” (Coupland & Kristiansen 2011: 29) is een te optimistische weergave die tamelijk contra-intuïtief is, gezien de alomtegenwoordigheid van evaluatie- en competitiefenomenen in onze westerse maatschappij. Ten tweede, als er toch vergedreven waardenivellering onder de verschillende variëteiten plaatsvindt, dan houdt dat in dat ook de perceptie van de grens vervaagt tussen hoge, normgevoelige domeinen (e.g. een panelgesprek op een nationale televisiezender) en lagere domeinen. Dat is mogelijk, maar lijkt ons onwaarschijnlijk. Wij achten het plausibeler dat tussen contigue domeinen de grenzen vervagen, en “lagere” taalnormen kunnen binnendringen in “hogere” domeinen. Maar duidelijke polen zijn steeds aan te wijzen, net zoals min of meer afgebakende situatiecategorieën in een hiërarchische configuratie. Wij denken daarom dat ‘demotisatie’ een geschikter concept is om de reële dynamieken te bespreken. In dat geval zou de idee van de “beste taal” behouden blijven, maar zou een andere variëteit die titel overnemen. Demotisatie zou voorkomen daar waar een opgelegde standaardtaalideologie geen al te groot draagvlak kent onder de bevolking, waardoor het ontstaan van een nieuwe taalnorm eerder een bottom-up proces is (usage-based standard ideology [Auer & Spiekermann 2011]), met promotie van een lage variëteit tot aanvaarde norm. Coupland en Kristiansen drukken hun twijfel uit of de Deense situatie al dan niet als een geval van demotisatie of destandaardisatie mag bestempeld worden. “If, within demotisation, there is the implication that ways of speaking come to be judged differently in relation to different social contexts or frames –‘best’ in relation to media versus ‘best’ in relation to established public institutions – then this starts to shade back into the more pluricentric normativity associated with destandardisation” (Coupland & Kristiansen 2011: 30)
Dat ze moeilijkheden ondervinden om een specifiek voorbeeld in de ene dan weer de andere categorie te passen, kan te maken hebben –zo suggereren Auer en Spiekermann (2011)– met het feit dat demotisatie en destandaardisatie niet noodzakelijk twee alternatieve en elkaar uitsluitende evoluties zijn. Demotisatie in de strikte zin (zoals Mattheier [1996] het had bedoeld) betekent ‘verspreiding van een hoge variëteit, c.q. de standaardtaal, onder grote bevolkingsgroepen en gebruik als omgangstaal’, zonder gewag te maken van statusveranderingen of “beste taal”-verschuivingen. Wat wel plaatsvindt, is de intrede van zo’n standaardtaal in domeinen van het dagelijkse leven die voordien waren voorbehouden aan andere variëteiten, zoals dialecten. Deze expansie zet die vroeger stabiele standaardtaal onder druk, met het gevolg dat “it develops an internal variability which is necessary to serve its manifold functions” (Auer & Spiekermann 2011: 162). Pas nadien kan een standaardiseringsfase optreden binnen dat variabel repertoire, naargelang de sterkte van de standaardtaalideologie in dat land. De constatatie van Coupland en Kristiansen, namelijk dat er twee “beste talen” zouden bestaan, is volgens ons dan ook niet in tegenspraak met het fenomeen van demotisatie. De intrinsieke functionele differentiatie die het gevolg is van dat fenomeen impliceert namelijk het gelijktijdig bestaan van meerdere “beste talen”. De veelheid aan normen opereren op hun beurt, zoals eerder gesteld, niet in een vacuüm maar verhouden zich steeds tot elkaar. De houding tegenover de domeinen waarin ze als norm fungeren, zoals media en publieke instituties, kan verschillen en dat bepaalt
of de ene “beste taal” eerder geaccepteerd en verspreid zal geraken dan de andere “beste taal”1, met andere woorden welke taal de kenmerken van een standaardtaal zal toegekend krijgen. 1.1.1.2.
Het sociaalpsychologische perspectief op taalverandering
In enkele publicaties (Kristiansen & Jørgensen 2005; Kristiansen, Garrett & Coupland 2005) die kunnen gelden als programmatische wegbereiders voor het SLICE-project dat jaren later zou starten, heeft men met overtuiging het belang van een sociaalpsychologisch perspectief in het onderzoek naar taalvariatie en taalverandering bepleit. Naast wat zij ‘objectieve’ factoren noemen, zoals die van fysiologische (fonetische assimilatie als het gevolg van de natuurlijke neiging tot moeiteloze articulatie) of mentale aard (het streven naar regelmatigheid dat leidt tot analogische formaties), achten de onderzoekers het noodzakelijk meer aandacht te schenken aan ‘subjectieve’ factoren, zoals percepties, overtuigingen, emoties, kortom vormen van taalattitude. Het is in de symbiose van sociaalpsychologische inzichten met methodes van de eerder linguïstisch-theoretisch georiënteerde sociolinguïstiek dat men tot een antwoord kan komen op de vraag waarom taalverandering plaatsvindt2. In het licht van die sociaalpsychologische invalshoek komt de wijze waarop sprekers een positieve sociale identiteit (Kristiansen et al. 2005, Kristiansen & Jørgensen 2005) proberen te creëren of te behouden, helemaal centraal te liggen in de reflectie: “the underlying cause of sociolinguistic differences, largely beneath consciousness, is the human instict to establish and maintain social identity” (Chambers 1995: 274). Bijgevolg kan taalverandering als de uitkomst beschouwd worden van de herwaardering van sociale groepen, de manier waarop zij zich van elkaar onderscheiden en hoe de sprekers zich daartegenover positioneren. Die dynamieken gaan dus steeds gepaard met vergelijkingen en beoordelingen. Als we toegang krijgen tot de waardesystemen waarop zulke beoordelingen zich baseren, dan opent dat een perspectief om veranderingen in het effectief taalgebruik te voorspellen. In feite zijn ‘identiteit’ en ‘attitudes’ centrale concepten ook in de traditionele variationistische studie naar taalvariatie en – verandering, maar slechts als geïnfereerde entiteiten uit de frequentieverdelingen in variatiepatronen (Coupland & Kristiansen 2011: 23-24). Onze werkwijze bestaat erin de verhoudingen om te keren: vanuit het onderzoek naar attitudes iets te weten komen over de potentiële evoluties in het taalgebruik.
1
In het algemeen blijft de behandeling van het begrip best language nogal vaag in de geraadpleegde literatuur. Eerst beschouwt men de term als glos voor standaardtaal, dan verlaat men de notie van ‘standaardtaal’ in het voordeel van ‘taalnorm’, om uiteindelijk toch opnieuw best language in het betoog te incorporeren. 2 In onze bewoording laten we uitschijnen dat een evenwichtig aandeel van beide perspectieven tot de vruchtbaarste resultaten leidt. Voor de auteurs is het echter duidelijk welk gezichtspunt de voorrang krijgt: “But it is our contention that only the sociopsychological, subjective factors can constitute the driving force behind such processes. In that sense, they alone are the sufficient factors.” (Kristiansen & Jørgensen 2005: 287)
1.1.2. Attitudeonderzoek: concepten en methodes 1.1.2.1.
Wat is een attitude?
Vooraleer we methodes inleiden die tot nu toe werden aangewend om attitudes te bestuderen, willen we eerst bespreken wat de wetenschappelijke literatuur verstaat onder de term ‘attitude’. Een valide definitie blijft die van Allport (1967: 8): “a mental and neural state of readiness, organized through experience exerting a directive and dynamic influence upon the individual's response to all objects and situations with which it is related”. De onbepaaldheid van het woord ‘ervaring’ drukt behoorlijk goed de veelheid aan situaties uit waarin een attitude vorm kan krijgen. We zijn ervan overtuigd dat slechts een kleine kennis van de variëteiten onder beschouwing vereist is om zich een attitude te vormen (cfr. Baroni 1983:107). In dat opzicht zijn we van mening dat het belang van interactie met de sprekers niet mag overschat worden, in tegenstelling tot de visie van Lasagabaster (2004) en Berruto (2011). Het valt te betwijfelen of de zuiderse informanten in onze bachelorproef (De Pascale 2013) voldoende intense contacten hebben met Italianen uit het noorden; nochtans lijkt het maar een kleine moeite om uiteenlopende etiketten te vinden om de Milanese variëteit te bestempelen. Daarenboven dient men een onderscheid te maken tussen twee soorten interacties: binnen de eigen groep of gemeenschap (ingroup) en die met de sprekers van de variëteit die men beoordeelt (outgroup). In het bijzonder voor de Italiaanse situatie, waarin de geografische configuratie eerder tot isolement dan tot contact leidt, is de relevantie van reëel contact in de attitudevorming een problematische zaak. Een rol lijkt eerder te zijn weggelegd voor de media, die daarentegen wel het dagelijks leven op het schiereiland scandeert (Antonelli 2011). Het moge in ieder geval duidelijk zijn dat onze predisposities tegenover sprekers aangeleerde gewoontes zijn, hetzij als resultaat van onze persoonlijke ervaring hetzij bepaald door onze sociale omgeving (Garrett 2010). Een attitude is een complexe mentale entiteit, die men doorgaans in drie componenten indeelt: een cognitieve, een affectieve en een conatieve of gedragscomponent. In de eerste component ligt de kennis vervat van het attitudineel object. Die kennis komt tot uiting in overtuigingen, meningen en het toekennen van sociale betekenis (social significance) aan taalvariëteiten (Vandermeeren 2005, Garrett 2010). Attitudeonderzoek heeft vastgesteld dat taalgebruikers vaak een vaste set van dimensies aanwendt om de relatie tussen taal, werkelijkheid en sprekers betekenisvol te maken: superioriteit en dynamisme enerzijds (onder de noemer ‘status’) en gezelligheid en vertrouwen anderzijds (te ressorteren onder ‘solidariteit’) (Kristiansen et al. 2005). De affectieve component wijst eenvoudig op het feit dat variëteiten positief of negatief worden beoordeeld. De bovenvermelde descriptieve dimensies kunnen op hun beurt ook onderworpen zijn aan evaluatie: ambitie, enthousiasme of familiariteit kunnen zowel een negatieve als positieve lading krijgen3. Attitudeonderzoek heeft uitgewezen dat variëteiten zelden geheel positief of negatief geëvalueerd worden, maar dat complementaire attitudinele profielen blootgelegd worden die de differentiatie in de realiteit weerspiegelen: standaardtalen en H-
3
Het zou bovendien interessant zijn –zoals Kristiansen et al (2005: 17) voorstellen– om na te gaan welk belang de participanten hechten aan de kenmerken waarvoor ze een oordeel uitdrukken. Een lage score op ‘vriendelijkheid’ en een hoge score op ‘prestige’ kunnen dan ten opzichte van elkaar geïnterpreteerd worden.
variëteiten scoren goed wat betreft statuskenmerken, maar slecht op solidariteitskenmerken terwijl dialecten en L-variëteiten net het omgekeerde patroon vertonen. De conatieve component, die het eigenlijke taalgedrag mogelijk maakt, “concerns the predisposition to act in certain ways, and perhaps in ways that are consistent with our cognitive and affective judgements” (Garrett 2010: 23). Men zou verwachten dat, als taalgebruikers anderen hoog waarderen op bepaalde sociale dimensies, ze ook geneigd zullen zijn taalkenmerken over te nemen van die personen. Vele studies (Hanson 1980, geciteerd in Garrett 2010; Johnstone & Kiesling 2008) bewijzen echter het tegendeel en in de literatuur lijkt nog geen consensus te zijn bereikt: uit attitudes is het niet steeds mogelijk om voorspellingen over het taalgebruik te maken, net zoals de beïnvloeding van iemands houding niet noodzakelijk leidt tot een gewenst gedrag. Niettemin neemt deze kwestie een sleutelpositie in ons betoog, zowel in theoretisch als methodologisch opzicht. Ten eerste zou het hoogst problematisch zijn voor ons om het verband tussen attitude en gedrag te verwerpen, aangezien onze visie op taalverandering steunt op het sociaalpsychologische mechanisme waarmee we taalvariatie verwerken. Op de hamvraag ‘Can we have diffusion without acceptance?’ (Coupland & Kristiansen 2011: 23) antwoorden we dan ook volmondig ‘Nee’, omdat we geloven dat attitudinele en ideologische overwegingen een fundamentele rol spelen in de manier waarop we dagelijks taal hanteren, zonder een kritische blik over deze relatie achterwege te laten. Een voorlopige oplossing lijkt de gedragscomponent te herdefiniëren als intentionaliteit om een bepaald gedrag te stellen, naar het voorbeeld van Ajzens en Fishbeins (1980) Theory of Reasoned Action. Zodoende houdt men rekening met de contextuele factoren die de uitkomst van een attitude kunnen sturen en stapt men af van een direct verband tussen attitude en gedrag, door te erkennen dat attitudes “[are] ‘resources’ available to speakers, who often have agentive control over their deployment in discourse. “ (Kristiansen et al. 2005: 18). Ten tweede zijn attitudes mentale constructies waartoe we slechts indirect toegang kunnen krijgen door allerlei vormen van gedrag te interpreteren, van face-to-facegesprekken tot brieven. Indien we niet de premisse maken dat attitudes te infereren zijn uit gedrag, zou elke experimentele opdracht zinloos zijn en deze meesterproef nutteloos. Dat belet ons niet om evenveel aandacht te schenken aan dataverzameling en experimenteel design als aan de interpretatie van de verkregen attitudes. 1.1.2.2.
Directe en indirecte methodes en de ‘consciousness issue’
In compendia over taalattitudes (Ryan, Giles & Hewstone 1988; Garrett 2005, 2010) onderscheidt men grosso modo drie grote families van methodes waarmee men attitudes kan bestuderen. De societal treatment approach, de eerste tak, rekent men tot de kwalitatieve methodes, in de zin dat ze voornamelijk de inhoud van het publieke discours analyseren. Ons onderzoek zal evenwel uitsluitend gebruik maken van de twee andere, eerder experimentele en kwantitatieve families, namelijk directe en indirecte methodes. Het voornaamste verschil tussen die laatste twee groepen ligt in de manier waarop het onderzoeksobject aan de participant gepresenteerd wordt: bij de directe methodes vraagt men expliciet naar een beoordeling van een specifieke taalvariëteit (“Wat vind je van het Italiaans gesproken in Napels?”, “Vind je het Milanese Italiaans een monotone taal?”), terwijl bij indirecte methodes de aandacht bewust gedevieerd wordt van het onderzoeksobject. In de matched guise technique (MGT), de meest succesvolle indirecte methode in attitudeonderzoek (Soukup 2013), laat men audiofragmenten
horen van steeds dezelfde spreker. De onderzoeker houdt alle kenmerken constant (tempo, spreektimbre, type tekst enz.), behalve datgene wat hij wil onderzoeken, zoals de regionale variatie. De participant wordt echter verteld dat hij naar verschillende sprekers zal luisteren. Voor elk fragment vult de participant dezelfde evaluatieschalen in4. Die peilen vooral naar de persoonskenmerken van wie men hoort (opleidingsniveau, tewerkstellingsgraad, morele waarden, sociale vaardigheden enz.). Vragen naar de taal van het fragment worden zo goed als mogelijk vermeden. Als een participant voor dezelfde schaal een andere beoordeling geeft aan het ene fragment dan wel aan het andere, leidt men daaruit af dat zijn beoordeling gebaseerd is op de taal van de spreker en bijgevolg op de hele sociale of geografische categorie waarvan die taal het uitdrukkingsmiddel is. Het verschil kan niet liggen in de individuele spreker die men hoort, omdat er feitelijk helemaal geen verschillende sprekers zijn. Voor deze meesterproef hebben we gekozen voor de verbal guise technique (VGT) (Cooper & Fishman 1974), een variant van de matched guise technique (Lambert, Hodgson, Gardner & Fillenbaum 1960; Lambert 1967). Het procedé blijkt hetzelfde maar verschilt op één punt, namelijk dat de stimuli niet afkomstig zijn van dezelfde spreker, maar van verschillende sprekers. De VGT blijkt een valide alternatief te zijn voor de MGT en maakt zelfs mogelijk enkele kleine gebreken van de MGT te omzeilen. Voor een matched guise experiment zou men in theorie een spreker moeten vinden die verschillende variëteiten quasi-perfect beheerst, maar in de praktijk is dat heel moeilijk, zeker in het geval van regionale variëteiten, zoals in ons experiment. Bijgevolg dreigt het gevaar dat die stimuli aan een gevoelig oor toch gekunsteld overkomen en de evaluatie negatief beïnvloeden. Een ander fundamenteel probleem is dat het streven naar volledige neutraliteit in prosodische of paralinguïstische kenmerken, voor bepaalde regionale variëteiten zelfs nefast is (Garrett 2005). Voor deze problemen biedt de VGT dus een waardig alternatief, mits men de grootste nauwlettendheid aan de dag legt bij de keuze van de audiofragmenten. Het succes van dergelijke indirecte technieken in het attitudeonderzoek is te danken aan de veronderstelling dat dieperliggende, ‘verborgen’ (covert) percepties waardevoller zijn in het geval men de ware psychologische motor voor taalvariatie en taalverandering wil blootleggen. Attitudes die door het publieke discours worden gedragen en daarin ‘openlijk’ (overt) circuleren zouden daarentegen oppervlakkigere attitudes zijn, een houding die de sprekers aannemen onder externe, sociale druk, maar die geenszins de echte gevoelens weerspiegelen of een krachtige motivatie kunnen zijn om taalgebruik aan te passen. Door de participanten bewust te maken dat men van hen oordelen over taal verwacht, loopt men het risico die stereotiepe, officiële attitudes te ontlokken, terwijl door hen onwetend te houden wel eens alternatieve waardesystemen (covert values) aan het licht zouden kunnen komen. Het centrale concept waar de hele redenering om draait, en waarop de hele laboviaanse sociolinguïstiek is gefundeerd, is het bewustzijnsniveau (of linguïstische bewustzijn, level of consciousness). Sommige veranderingen in taal kunnen heel bewust ervaren worden door de sprekers, voornamelijk 4
Deze meest gebruikte evaluatieschalen kunnen de vorm aannemen van semantische differentialen of zogenaamde Likert-schalen. De eerste soort, die verreweg de meeste toepassingen kent (Soukoup 2013), houdt in dat ze op de polen van de schaal bezet zijn door gegradueerde antoniemen, zoals ‘mooi’-‘lelijk’ of ‘niet ambitieus’‘zeer ambitieus’. Bij het tweede type schalen moeten participanten zich bij een bepaalde stelling oneens of eens verklaren, met daartussen een aantal intermediaire waarden (Vandermeeren 2005).
wanneer ze vanuit de dominante sociale groep worden gepropageerd of een officiële ideologie weerspiegelen. Het zou niet helemaal correct zijn om andere veranderingen, zo stelt Kristiansen (2011), die door covert values in een taalgemeenschap worden gestuurd, te classificeren als plaatshebbend onder het bewustzijnsniveau, i.e. niet-bewust. Beter zou het zijn om over onderbewuste attitudes te spreken, namelijk “an unconscious awareness of uses and values” (Kristiansen 2011: 272). Het betreft dat soort impliciet aanwezige attitudes waarvoor men in de taalgemeenschap geen lekendiscours, geen stigmatiserende of goedkeurende commentaren vindt. In het onderscheid tussen bewust en onderbewust, publieke en privé, open en verborgen moet men ook het onderscheid verstaan in de division of labour tussen directe en indirecte methodes om ideologieën aan het licht te brengen en bijgevolg de voorkeur van vele taalkundigen voor die laatste groep technieken. Recent hebben Grondelaers en Van Hout (2010) overtuigend de persistente assumptie weerlegd dat aan indirecte technieken het primaat verschaft om taalveranderingsdynamieken bloot te leggen. Enerzijds hebben de twee linguïsten aangetoond dat een experiment van het directe type, de Free Response Experiment (FRE), in staat is om dezelfde attitudinele architectuur aan het licht te brengen als in het geval van een verbal guise experiment (VGE). In hun experiment verkregen ze ook de traditionele status- en solidariteitsdimensies, bovendien betrekking hebbend op zowel sprekers- en taalkenmerken. Ze concluderen daaruit dat “both the SE [Speaker Evaluation] and the FR [Free Response] experiment tap into highly similar underlying attitudes.” (Grondelaers & Van Hout 2010: 97). Anderzijds hebben ze vastgesteld dat, door in een VGE stellingen te verwerken die ook verwijzen naar de variëteit zelf, men bijna exact dezelfde resultaten verkrijgt als een experiment waarin die speech-related schalen niet aanwezig zijn. Als een Speaker Evaluation Experiment waarin het attitudineel object kenbaar is voor de participant, tot dezelfde resultaten leidt als een experiment waarin dat onderzoeksobject verborgen blijft, dan is er geen reden om technieken te onderscheiden op basis van hun al dan niet bewust maken van het attitudineel object. Het gevolg daarvan is dat directe methodes wel een even groot verklarend potentieel bezitten om dynamische, onderbewuste taalattitudes bloot te leggen. Aangezien zulke FRE minder tijdrovend zijn in opstelling en uitvoering, kan men geneigd zijn de indirecte methodes grotendeels te verlaten in het voordeel van directe technieken, zeker wanneer er experimenteel bewijs is aangebracht over de validiteit van die laatste groep. Grondelaers en Van Hout zijn echter terughoudend tegenover die mogelijke ontwikkeling. Volgens de auteurs is het geen kwestie van partij kiezen voor de een of andere optie, maar, integendeel, is men gebaat bij de combinatie van beide methodes. Een FRE kan als preliminaire stap gelden voor de identificatie van de dimensies waarmee in tweede instantie de evaluatieschalen in een VGE geconstrueerd worden (Grondelaers & Van Hout 2010: 101). In deze meesterproef grijpen we de kans aan om de suggestie van de auteurs in de praktijk om te zetten. Ten eerste zullen we proberen om op basis van een FRE, uitgevoerd in het kader van mijn bachelorpaper, de nodige attitudinele dimensies te identificeren voor de VGE. Ten tweede trachten we ook verder het potentieel van de FRE verder uit te werken dan Grondelaers’ en Van Houts eerste verkennende behandeling, door gebruik te maken van geavanceerdere statistische technieken. Tot nu toe hebben we slechts een summiere introductie gegeven van de eigenlijke methodes, maar een
uitgebreidere bespreking, waarbij vooral de voor- en nadelen aan bod komen, zullen in de twee experimentele luiken van de meesterproef behandeld worden.
1.2.
De case study: Italiaanse regionale variëteiten
1.2.1. De geschiedenis van het Italiaans en het ontstaan van de regiolecten Om ten volle de structuur en de functie van de hedendaagse Italiaanse regionale variëteiten te begrijpen, dienen we eerst een korte bespreking in te lassen over de dichotomie standaardtaaldialect met betrekking tot de specifieke Italiaanse situatie. Concreet zullen we onze aandacht vestigen op twee tijdskaders, de vroege 16de eeuw en, uiteraard, onze tegenwoordige tijd. Een breed overzicht van de geschiedenis van de beide concepten valt echter buiten het bestek van deze meesterproef. Het vastleggen van een Italiaanse standaardtaal dateert uit de jaren ’20 en ’30 van de 16de eeuw. Men noemt het geheel aan beschouwingen dat in die tijd tot stand is gekomen ook wel de questione della lingua. In tegenstelling tot dezelfde ondernemingen in Engeland, Frankrijk of Spanje, waar motivaties betreffende politieke eenmaking hadden geleid tot de promotie van een min of meer specifieke lokale tongval als nationale standaardtaal, hebben op het Italiaanse schiereiland overwegingen van andere aard gespeeld (Tavoni 1994). Die keuzes hebben eeuwenlang voelbare repercussies gehad op het gebruik en de status van het Standaarditaliaans. Aanvankelijk groeide de noodzaak om een norm te bepalen niet in politieke kringen, maar in het literair-intellectuele milieu, met het gevolg dat de nieuwe taal eerder geschikt moest zijn om literatuur te beoefenen, dan alledaagse discussies te voeren. Modellen werden vervolgens gezocht in de volkstalige literaire traditie, meer bepaald in de gerenommeerde werken van de 14de-eeuwse auteurs Giovanni Boccaccio en Francesco Petrarca, die de referentiepunten werden respectievelijk voor het schrijven in proza en in verzen. Dat beide afkomstig waren uit Toscane, en in het Florentijns hadden geschreven, mag dan als toeval beschouwd worden. We constateren dus dat het project om een talige norm te formaliseren, voortkomend uit de noden van de intellectuele elite, een vrij beperkte draagwijdte heeft gehad. De versnipperde Italiaanse politieke realiteit had namelijk geen behoefte aan een opgelegde supraregionale taal. Vanuit de hoven kwamen dan ook diametraal tegengestelde visies op het soort taal dat voor schriftelijke einden moest aangewend worden (de zogenaamde lingua cortigiana (Tesi 2007)). We mogen concluderen dat het de facto vastgelegde Standaarditaliaans een archaïsche literaire variëteit is, bovendien afkomstig uit en identificeerbaar met een geografisch zeer gelimiteerd gebied, die gebaseerd is op esthetisch-culturele voorkeuren (Tavoni 1994, Marazzini 1994). Het moge duidelijk zijn dat de keuze voor het Florentijns inhoudt dat een hele reeks andere ‘hoftalen’ gedelegitimeerd werden in hun hoedanigheid van administratie- én cultuurtalen. Deze regionale scriptae (of koinai5), die een zeer sterke lokale component hadden, zagen zich al snel 5
De term koiné krijgt in de Italiaanse taalkunde een historische invulling en verwijst specifiek naar de taalsituatie in de vijftiende eeuw, vóór de eerste grote standaaridseringsgolf. Met de bloei , vooral in Noord-Italië, van rijkjes en hoven (zoals die van Milaan, Ferrara en Mantova), ontwikkelde elk centrum een eigen zeer composiete, schrijftalige norm waarin drie invloeden merkbaar zijn: het dialectale, het Latijns-humanistische en het Florentijns-literaire
gedegradeerd tot het gebruik in informele spreeksituaties (Cortelazzo 1994). Het spreekt voor zich dat niet alleen de voormalige officiële regiolecten, maar ook alle plaatselijke dialecten enige status werd ontzegd. Het welbekende onderscheid tussen taal en dialect was een feit. Het dialect bleef voor eeuwen de moedertaal van de overgrote meerderheid van de bevolking, terwijl het Italiaans enkel als tweede taal of als schooltaal aangeleerd kon worden. Enkele schattingen over de effectieve italofonen op het moment van Italiaanse eenmaking hebben uitgewezen dat in 1861 slechts 9,52% van de bevolking de nationale taal actief beheerste (Castellani 1982). Hoewel lange tijd, vanuit een puristische reflex en uit pedagogische preoccupatie, men de strikte dichotomie tussen het Standaarditaliaans en de lokale dialecten heeft willen volhouden, bestaat er tegenwoordig een consensus over het belang en de alomtegenwoordigheid van het contact dat zich tussen beide linguïstische codes van oudsher heeft voorgedaan (Bruni 1992, Avolio 1994)6. Men neemt aan dat een passieve kennis van het Italiaans weldegelijk aanwezig was ook bij de sprekers van eenvoudige afkomst, “in grotere mate dan wij gewend zijn toe te geven” (Bruni 1992: XXXI, zie ook Cortelazzo 1994). Tijdens het interbellum heeft de linguïstische centralisatiepolitiek van het fascisme, gecombineerd met de vijandige houding tegenover al wat niet Italiaans was, waaronder ook de inheemse dialecten, het aantal italofonen drastisch doen toenemen, in die mate dat men zelfs spreekt van het bereiken van een “kritische massa” sprekers om de geboorte van verschillende variëteiten van het Italiaans te verwezenlijken (Sobrero 1988). De actieve kennis van het Italiaans, met onvermijdelijke interferenties uit de dialecten, werd ten slotte bezegeld door de ingrijpende socio-economische verschuivingen in de jaren ’50 en ’60 (geboekstaafd als de miracolo economico italiano): de migratiestromen van het Zuiden naar het Noorden en van het platteland naar de steden; de daarbij gepaard gaande verstedelijking; een toegenomen basisscholingsgraad en de democratisering van het hoger onderwijs; en ten slotte de opkomst van de televisie en het succes van mass media in het algemeen (Mengaldo 1994, Britain 2010a7). Van een grotendeels diglottische taalsituatie evolueert Italië dus naar wat men noemt een verhouding gekenmerkt door dilalia (gevormd door di en laléô “babbelen” en nagenoeg identiek aan het concept ‘diaglossia’ van Auer [2005]): de prestigieuze, hoge variëteit, c.q. het Italiaans, wordt nu ook in informele contexten gebruikt naast en tezamen met de lage variëteit, c.q. het lokale dialect. Die laatste blijft echter geweerd uit meer formele spreeksituaties (Berruto 1987). Dat steeds meer domeinen in het dagelijkse leven beide registers toelaten, heeft de vorming van hybride, diatopisch gemarkeerde variëteiten versneld en de afbakening tussen het dialect en de standaardtaal irrelevant gemaakt (Ricca 2010, Poggi Salani 2010). De studie die het startschot zou vormen voor het onderzoek naar de variatie in het gesproken Italiaans, en naar het model. Men spreekt van koinais omdat in feite dezelfde tendenzen aanwezig zijn om een supraregionale omgangstaal te creëren als in de modernere betekenis van het begrip. 6 Waarschuwingen voor regionale invloeden in de correcte uitspraak treft men zelfs aan in 16de-eeuwse grammaticale werken (D’Achille 2002, geciteerd in Cerruti 2009) en de eerste editie van de Vocabolario degli Accademici della Crusca (Cortelazzo 1990, geciteerd in Cerruti 2009). 7 Ook in de rest van Europa merkt men een verband op tussen de opkomst van breed verspreide regionale variëteiten en een ongekende welvaartsopbloei als gevolg van vrijwel dezelfde bovengenoemde factoren. We zijn daarom geneigd om het interbellum als periode van doorbraak voor de italiani regionali enigszins te relativeren en hun stabiele verankering in de taalgemeenschap te postdateren.
linguïstische repertoire van de Italiaan in het algemeen, is Pellegrini (1960). Naast regionale en lokale dialecten maakt hij het onderscheid tussen ‘gemeenschappelijk Italiaans’ (italiano comune) en regionaal Italiaans (italiano regionale8). Volgens de taalkundige vormen deze ‘toetsen’ samen het linguïstische ‘klavier’ waaruit de spreker in dagelijkse gespreksituaties kan kiezen. Door zijn theoretische en descriptieve opzet stelde het artikel zich vernieuwend op tegenover het normatieve perspectief dat tot dan toe het debat had gedomineerd. Het was in dat opzicht een fundamenteel uitgangspunt voor het onderzoek rond regionale variatie in het Italiaans, dat een bloei kende in de jaren zeventig en tachtig (Cortellazzo 1974, Mioni & Trumper 1977, Sobrero 1988, Cortelazzo & Mioni 1990, Telmon 1990). Het is opportuun om nu een terugkoppeling te maken aan het begrippenpaar dat de standaardtaalontwikkelingen in kaart probeerde te brengen, namelijk demotisatie en destandaardisatie. Voor ons is het duidelijk dat het Standaarditaliaans een goed voorbeeld is van een demotiserende variëteit. Nadat het voor eeuwen de taal van het schrift is geweest, wordt het vandaag zonder aarzeling ingezet in de gesproken communicatie van miljoenen Italianen (72,8% spreekt uitsluitend Italiaans tegenover onbekenden, [ISTAT: 2007]). De interne variabiliteit is dan vooral te danken aan het dialectaal substratum, waardoor Italië bijna evenveel, min of meer stabiele regionale variëteiten van de standaardtaal kent als er dialectgroepen aanwezig zijn. De vraag is hoe de dynamiek zich zal verderzetten: zal de eigen regionaal gekleurde standaardtaal de enige target zijn van de Italiaanse spreker, met een geringe invloed van andere regionale standaarden, of ondergaat de eigen regionale variëteit de invloed van prestigieuzere variëteiten (en welke dan) en consolideert zich zo een nieuwe nationale standaardtaal, waarin regionale elementen verzwakt worden? Het zij opgemerkt dat het eerste scenario eerder naar de Faircloughiaanse ‘destandaardisatie’ wijst, terwijl het tweede scenario lijkt op de eerste versie van het concept ‘demotisatie’. 1.2.2. Linguïstische aspecten van de convergentie tussen Standaarditaliaans en dialect De Italiaanse academische wereld heeft tot de jaren vijftig afkeurende standpunten ingenomen tegenover de relatie standaardtaal-dialect, door het contact vrijwel steeds als contaminatie en verbastering van het Standaarditaliaans af te doen. De taalverandering was echter zo prominent dat een opwaardering van het fenomeen als volwaardig studieobject, vanuit een taalkundig matuurdere geest, niet langer kon uitblijven. Het wegvallen van een normatief-pedagogische houding tegenover de relatie standaardtaal-dialect is een aanzet geweest om het fenomeen vanuit variationistisch en sociolinguïstisch perspectief te bestuderen. Toch blijkt de dominantie van het structuralistische gedachtegoed in het Italiaans taalkundig discours nog steeds zichtbaar in de manier waarop het taalrepertoire van de Italiaan wordt beschreven9. Meer bepaald heeft de 8
Terwijl de term italiano regionale (“regionaal Italiaans”) wijst op het fenomeen op zich, worden etiketten als italiano regionale bergamasco (“regionaal Italiaans uit Bergamo”) of italiano regionale siciliano (“regionaal Italiaans uit Sicilië”) gebruikt voor de diverse concrete regiolecten. 9 Het is veelzeggend dat de Laboviaanse notie van continuum, de reeks van taalvormen die zich plaatsen tussen de extreme polen van zo’n variatieas, bijgestuurd wordt door termen als gradatum (Stehl 1995) en continuum con addensamenti (“continuum met verdichtingen”) te munten (Berruto 2012)
sociolinguïstische traditie zich sterk geïnspireerd op de theoretische inzichten van Eugenio Coseriu (1973, 1980). Een taal wordt in dat referentiekader beschreven als een diasysteem, wat op zijn beurt wordt gedefinieerd als een som van variëteiten, namelijk gelijkaardige subsystemen op structureel vlak. De variëteiten onderling bezitten dus veel gemeenschappelijke elementen, i.e. de kern van het diasysteem, maar evenzeer specifieke kenmerken die ze van elkaar onderscheiden. Welke elementen de kern of de periferie van het diasysteem vormen, wordt bepaald door een aantal sociocontextuele assen of dimensies, zoals het medium (diamesisch), de sociale klasse (diastratisch), de spreeksituatie (diafasisch) en de geografische ruimte (diatopisch). Als een variëteit zeer gemarkeerd is op zo’n as –ze wordt bijvoorbeeld gebruikt in zeer formele spreeksituaties door hooggeschoolden– zal die zich meer onderscheiden ten opzichte van andere variëteiten en bijgevolg weinig gedeelde kenmerken hebben. Omgekeerd, wanneer er geen extreme beïnvloeding is door die sociocontextuele factoren, zullen taalelementen naar voren komen die gemakkelijk tot vele variëteiten kunnen behoren (Berruto 1995, 2012). Het soort variëteiten waaraan deze meesterproef gewijd is, is verbonden met de diatopische variatiedimensie, wat betrekking heeft op de geografische differentiatie en distributie van het Italiaans. Er bestaat een consensus over het primaat dat deze dimensie houdt bij de variatie in het Italiaanse taallandschap10. Daarmee gaat vaak de bevinding gepaard dat elke vorm van gesproken Italiaans in de eerste plaats een lokaal of regionaal gekleurd Italiaans is (Berruto 1983, Mengaldo 1994). Men onderscheidt op het schiereiland een tiental primaire dialecten, namelijk talen die, net zoals het Italiaans, ontstaan zijn door fragmentatie en differentiatie van het Latijn. De naoorlogse factoren die we reeds in de vorige paragraaf hebben besproken, hebben moedertaalsprekers van het dialect in contact gebracht met het Italiaans aanwezig in de publieke administratie, het onderwijs en zowel de geschreven als de gesproken informatiekanalen. We definiëren daarom de regiolecten, die het studieobject vormen van deze scriptie en later geïntroduceerd zullen (§1.2.5) worden, als differentiaties van de nationale taal onder de impuls van een dialectaal substratum, waarbij talloze bidirectionele interferentiefenomenen optreden. De verschillende linguïstische analyseniveaus zijn niet allemaal even doordrongen van regionale gemarkeerdheid. De grootste dialectale invloed is vooral zichtbaar in de fonologie en de prosodie van deze Italiaanse regiolecten. Interferenties van de eerste soort gelden als de meest bestudeerde, wat te maken heeft met het relatief afgebakend aantal fonemen en hun populariteit in het taalkundig onderzoek. Hoewel intonatieverschijnselen lange tijd niet van dezelfde aandacht hebben genoten (Telmon 1993: 102), heeft zich in het laatste decennium een groeiend interesse gemanifesteerd die tot belangrijke inzichten heeft geleid (D’Imperio 2002, Bertinetto & Loporcaro 2005, Savino 2012)11. Omgekeerd heeft men lang gedacht dat de morfologie van het regionale Italiaans grotendeels samenvalt met de morfologie van het Standaarditaliaans (Telmon 10
“E si mette in rilievo che la prima fonte di diversificazione degli usi linguistici è quella legata alla distribuzione geografica, lungo l’asse diatopico” (Berruto 2012: 13), “[…] la dimensione geografica costituisce il prius di variazione nella situazione italiana” (Cerruti 2009: 35) 11 Die belangstelling voor prosodische en fonetische regionale variatie in het gesproken Italiaans heeft de vraag naar adequate methodes, instrumenten en corpora doen stijgen. Voorbeelden zijn de Archivio delle varietà di italiano parlato (AVIP, Bertinetto 2001), Archivio del parlato italiano (API, Crocco et al. 2003), en Corpora e lessici di ltaliano parlato e scritto (CLIPS, Albano Leoni 2006).
1993). Nader onderzoek heeft aangetoond dat regionale variatie wel degelijk op te merken is in zowel inflectionele (paradigmavariatie in woordgeslacht: scatolo ∼ scatola [“doos”]) als lexicale morfologie (diminutiefsuffixen: -uccio in het Zuiden, -ino in het Noordwesten en –etto in het Noordoosten [Cerruti 2009: 37]). Dat de graad van permeabiliteit toch relatief laag blijft, heeft waarschijnlijk alweer historische verklaringen. De morfologie van het Standaarditaliaans heeft altijd meer aandacht gekregen in grammatica’s en andere taalnormeringswerken, in die mate zelfs dat correct Italiaans schrijven neerkwam op de beheersing van de morfologische regels. Daartegenover staat dat uitspraak en intonatiepatronen nooit aan diezelfde strenge normatieve controle werden onderworpen, wat dan weer verband houdt met het bijna exclusieve schriftelijke karakter van het Italiaans in de loop van de eeuwen (Telmon 1993). Wat de syntaxis betreft, merkt men op dat het huidige Italiaans een vrij stabiele structuur bezit dat weinig onderhevig is aan diatopische variatie. Net zoals blijkt dat de dialecten op het schiereiland zelf geen radicaal verschillende syntactische patronen vertonen. De structuren waar men wel regionale gemarkeerdheid aantreft, worden in theoretisch opzicht dan weer interessant bevonden, zodanig dat de studie ervan “zeer abstracte en algemene eigenschappen van natuurlijke talen kan onthullen” (Benincà 1994: 159)12. Het is bijvoorbeeld zo dat in het Italiaans gesproken in de regio’s Veneto en Toscane een onderscheid wordt gemaakt tussen uitbreidende en beperkende betrekkelijke bijzinnen door middel van de herhaling van het antecedent met een proclitisch persoonlijk voornaamwoord, aanwezig bij de uitbreidende bijzinnen (Maria, che l’ho vista ieri “Maria, die ik gisteren heb gezien”) maar afwezig bij de beperkende bijzinnen (La persona che ho visto ieri “De persoon die ik gisteren heb gezien”). In andere regio’s bestaat er geen formeel verschil tussen beide soorten bijzinnen. Volgens Benincà zijn dat type microsyntactische verschijnselen voor een volwassene niet waarneembaar en hoeven die niet gecorrigeerd te worden wanneer men in contact komt met sprekers van andere variëteiten. Deze syntactische interferenties resulteren, ten slotte bij generatieoverdracht, in “latente”, maar bijzonder diepgeworteld en blijvende kenmerken van het regionale Italiaans. Op het raakvlak tussen lexicon en semantiek bevinden zich de regionale synoniemen (geosinonimi) en regionale homoniemen (geoomonimi). Het concurrentiële voordeel van zulke synoniemen wordt zowel bepaald door linguïstische als extralinguïstische factoren. Hoe groter de structurele afstand tussen het dialectaal substratum en het Italiaans, des te moeilijker zal het woord een verspreiding buiten de eigen regiogrenzen kennen. De aantrekkingskracht die een economisch sterke zone uitoefent op de andere regio’s speelt ook een rol, zoals blijkt uit het succes van het noordelijke formaggio (“kaas”) ten koste van het centraal-zuidelijke cacio (Telmon 1993: 132). Bij de regionale homoniemen is, naar onze mening, vooral interessant het geval waarin etymologisch verwante woorden semantische, zowel denotationele als nietdenotationele veranderingen hebben ondergaan13.
12
“[…] possa rivelare proprietà molto astratte e generali delle lingue naturali” (Benincà 1994:159) Het adjectief fregno betekent in de Abruzzen “handig”, maar in Rome “dwaas”. Het woord is verwant met het dialectale fregna “vagina”, waarbij in de twee gebieden andere metonymische extensies en tegengestelde veranderingen in gevoelswaarden zijn opgetreden. (Troncon-Canepari 1989, geciteerd in Telmon 1993: 137). 13
De fraseologie, i.e. het geheel van vaste uitdrukkingen, gezegdes enz., is dat niveau waarin het contact tussen de lokale taal en de standaardtaal in het verlengde ligt van een algemenere cultureel-pragmatische dimensie, die in feite al in de lexicale semantiek werd geïntroduceerd. Men is dan ook overtuigd dat de cultuurhistorische grenzen van een gebied in grote mate de verspreiding van een regionalisme bepalen (Telmon 1993, Cerruti 2009). En zo komt het dat heel wat uitingen van de in het dialect vastgelegde volkscultuur of andere streekgebonden gebruiken, “vertaald” worden naar een Italiaans equivalent. Doordat het vertalingsproces niet alleen linguïstisch is, maar evenzeer pragmatische, sociologische en zelfs semiologische dimensies betrekt, kan het, volgens ons, een interessant onderzoeksobject worden, zelfs met het oog op algemeen-taalkundige theorievorming. Om de betekenis van zulke getransponeerde woordverbindingen te ontcijferen, is het noodzakelijk dat spreker en hoorder ook kennis delen die eerder van encyclopedische aard is. De natuurlijkheid waarmee uitdrukkingen hun ingang vinden in het gesproken Italiaans is dan evenredig met de perceptie die de spreker heeft ten aanzien van de gesprekspartner, gecombineerd met de gepercipieerde afstand tussen de functie die zo’n uitdrukking vervult in het dialect en die in de standaardtaal (Cerruti 2009: 39). In dat opzicht wordt het belang duidelijk van de pragmatische of communicatieve competentie van de spreker in taalcontact en taalverandering: de doordringbaarheid van het dialectaal taalmateriaal in de Italiaanse target hangt af van de sociocontextuele interpretatie van de spreeksituatie en een soort metalinguïstische kennis van de twee taalsystemen. Wanneer men niet meer bewust is van de regionaliteit van een bepaald fraseem én wanneer men de transparantie ervan groot genoeg acht, zal zijn gebruik in normgevoelige domeinen niet als ongeschikt ervaren worden en wordt de kans groter dat de uitdrukking verspreid wordt buiten de regiogrenzen14. De aandacht voor functionele beschrijving van de convergentie tussen taal en dialect wordt overigens voornamelijk door Stehl (1995) verdedigd. Belangrijke peilers van zijn betoog zijn de begrippen pragmatica della variazione, waarin een taalhandeling het resultaat is van bepaalde keuzes op basis van hun competenza della variazione, namelijk wat de sprekers weten over hun eigen taalrepertoire. 1.2.3. Andere variatiedimensies in het Italiaans Dat de diatopische variatiedimensie als primair explanans aangeduid wordt voor de veranderingen die het hedendaagse Italiaans aan het ondergaan is, wordt evenwel niet in alle kringen eenvoudigweg aanvaard. Sommigen (Cortelazzo 1974; Sabatini 1985, 1990) stellen dat andere variatiedimensies een relevantere rol spelen, zoals –om in Coserius’ terminologie te blijven– de “diastratische”, i.e. de sociale groep waartoe men behoort (laag vs. hoog), en de “diamesische”, i.e. het medium waarmee men de boodschap uitbrengt (geschreven vs. gesproken). Etiketten als italiano dell’uso medio (“doorsneeitaliaans”, Sabatini 1985) en italiano neostandard (“Neo-Standaarditaliaans”, Berruto 2012) werden bedacht om de pangeografische gelijkenissen in de nieuwe tendensen in het gesproken Italiaans te benoemen. Sabatini (1985: 155) heeft er bijvoorbeeld op gewezen dat de regionale differentiatie niet voldoende is als 14
De Piëmontese uitdrukking mi è andata bene nei bigatti (“ik heb een goed jaar gehad”, letterlijk “ik heb geluk gehad in de zijderupsen”) kan niet begrepen worden als men niet weet dat de kweek van zijderupsen een belangrijke economische activiteit was in Piëmont. De kans is klein dat het gezegde de eigen regionale grenzen kan oversteken. Omgekeerd duikt een andere, even typische Piëmontese uitdrukking, da una parola in su (“wat men ook zegt”), wel vaak in kranten of in interviews op, waarschijnlijk omdat die geen kennis van extralinguïstische referenten veronderstelt (Grassi 2001, Telmon 2001).
verklaring voor de nieuwe kenmerken in de spreektaal die ook niet van de invloed van de geschreven standaardtaal afkomstig zijn. Bovendien merkt hij op dat het Italiaans van de hoogopgeleiden slechts minimale regionale gemarkeerdheid bevat, waardoor het weinig plausibel is dat het regionalismen zijn die in de norm geaccepteerd worden. Volgens de taalkundige hebben steeds meer elementen uit de gesproken taal ingang gevonden in de spreeken schrijftaal van middelhoge formaliteitsgraad. Deze verschijnselen zijn in feite geen vernieuwingen, maar “herwaarderingen” van bestaande vormen die weliswaar nooit in de standaardtaal waren opgenomen, terwijl hun zustervarianten volledig geïntegreerd zijn in de norm van andere Romaanse talen (cfr. D’Achille 1990)15. Vanuit dat perspectief wordt de regionale invloed secundair en ziet men de diamesische dimensie als fundamenteel in de standaardiseringsdynamiek. Het Italiaans dat over het hele schiereiland wordt gesproken, bevat inderdaad elementen die niet verklaard kunnen worden aan de hand van dialectale invloeden16. Echter, in de grote meerderheid van de gevallen mag het dialect wel degelijk als voornaamste bron voor variatie beschouwd worden. Ten eerste is het aantal kenmerken dat slechts een regionaal bereik heeft kwantitatief in de meerderheid tegenover de vormen die geattesteerd zijn over heel Italië. Ten tweede kennen vele van die panareale kenmerken niettemin specifieke distributies binnen de verschillende regio’s, waardoor sommige kenmerken in een gebied capillair verspreid zijn in alle sociale groepen en voor elke situatie, terwijl in andere regio’s diezelfde vormen beperkt zijn tot lagere klassen of informele spreeksituaties (Telmon 1994, Cerruti 2009). In sommige regio’s bevinden bepaalde gemeenschappelijk geachte constructies zich zelfs in een vergevorderd stadium van grammaticalisatie vergeleken met andere regio’s (D’Achille 2001, Cerruti & Regis 2014)17. Ten derde impliceert een nationale spreiding van een linguïstisch verschijnsel niet meteen dat substratumverschillen niet van kracht zijn. Gelijkenissen zijn te wijten aan het feit dat de interfererende structurenimmers een soortgelijke oorsprong hebben, want allen behorend tot de Romaanse sokkel. Ten slotte baseren studies over deze gemeenschappelijke vormen zich op geschreven taalmateriaal, waarin de convergentie naar het Italiaans standaardtaalmodel de diastratische en diatopische verschillen mogelijks afvlakt (Cerruti 2009). Tegenwoordig bestaat er een consensus over het feit dat elke vorm van gesproken Italiaans in meer of mindere mate de steeds aanwezige interferentie van het dialect laat uitschijnen 15
Een notoir voorbeeld betreft, bij dislocaties, het redundant voorkomen van hetzelfde meewerkend voorwerp in beklemtoonde en onbeklemtoonde vorm, zoals in a me mi piace (lett. “aan mij me bevalt”). Dergelijk gebruik wordt evenwel niet gestigmatiseerd in het Spaans en het Roemeens, waar constructies als a mí me gusta of mie îmi place helemaal geen overtreding van de norm inhouden (Cortelazzo 1984, Dufter & Stark 2008) 16 Dat, vice versa, het dialectaal substratum niet steeds de agens is voor regionale differentiatie, is naar onze mening een kwestie die tot nu toe te vaak onbelicht is gebleven. Nieuwe, regionaal gesitueerde betekenissen zijn bijvoorbeeld ontstaan van wijdverspreide Italiaanse woorden of uitdrukkingen (D’Achille 2001: 43). Hierbij vermelden we bijvoorbeeld regionaal verschillende termen voor referenten die deel uitmaken van een levens- en cultuurstijl die niet herleid kan worden tot de traditionele, dialectale realiteit. Espresso en caffè, pan-Italiaanse woorden, kennen ook diatopische differentiatie, bijvoorbeeld espressino in het zuiden, caffè alto in Toscane en caffè al vetro en caffè lungo te Rome (ibid.: 39) 17 De progressieve panitaliaanse perifrase ‘stare + gerundium’, (sto mangiando, “ik ben aan het eten”) is in sommige regionale variëteiten, zoals het Piëmontese Italiaans, van zijn puur progressief-duratieve aspect aan het evolueren naar een zuiver imperfectieve vorm, waarmee habituele acties worden beschreven.
(Mengaldo 1994, Telmon 1994, Cerruti 2009). Daaruit volgt de erkenning van de italiano regionale op zich als nieuw diasysteem waarbij de andere dimensies van variabiliteit in tweede instantie inwerken op de alomtegenwoordige regionale invloed. Zo’n diasysteem heeft, volgens Berruto (2012: 20), een prototypische structuur (zie figuur 1), met een stabiele kern waarin standaardiserende en gestandaardiseerde elementen clusteren en een eerder instabiele periferie waarin zich differentiaties van de norm bevinden. De vernieuwingstendensen in het hedendaagse Italiaans kunnen dan beschreven worden als de krachten die kernelementen en periferische elementen op elkaar uitoefenen. De positie van de italiano neostandard in het diagram maakt duidelijk dat de normveranderingen in het Standaarditaliaans voornamelijk toe te schrijven zijn aan “the progressive acceptance of nonstandard spoken informal features into the standard variety and in the reduction of social markedness of traditionally nonstandard, social marked Italian features, some of which now also occur in the spoken varieties of educated speakers” (Cerruti & Regis 2014: 86). Naast de impact van taalexterne factoren of dimensies, hebben we eerder ook aangehaald dat taalinterne factoren, zoals de semantiek van woordverbindingen en een daarmee verbonden metalinguïstisch bewustzijn, ook een rol kunnen spelen. Er is ook opgemerkt dat bij gevallen van zeer specifieke dialectale kenmerken die geen equivalent hebben in het Italiaans, de kans groter is dat die kenmerken onopgemerkt zelfs in geschreven Italiaanse teksten kunnen getransfereerd worden (ibid. 88). Het model van Berruto heeft veel overeenkomsten met dat van Sabatini (1985), met het verschil dat de afkomst van de spreker, en bijgevolg de invloed van zijn dialect, een fundamentele plaats krijgt. Dat houdt in dat in Italië meerdere, geografische verspreide parallelle standaardiseringsprocessen aan de gang zijn, met als resultaat regionale standaarden, namelijk de Italiaanse variëteiten, gesproken of geschreven door de hoge middenklasse in een bepaalde regio.
Figure 1: "Architectuur van het hedendaags Italiaans" (Berruto 2012: 24)
1.2.4. Gedetaileerde uitwerking van de convergentie in het Italiaans taalrepertorium Vooralsnog hebben we de verticale interactiefenomenen tussen dialect en standaardtaal besproken die hebben geleid tot de vorming van italiani regionali standard. In het begrippenapparaat van de contactlinguïstiek (Weinreich 1953, Trudgill 1986), waarbinnen de geschetste dynamieken doorgaans zijn geplaatst (Berruto 2005, 2010; Cerruti 2011), spreekt men van ‘convergentie’. Berruto (2005) merkt op dat deze term de specifieke interactie tussen een standaardtaal en een dialect niet adequaat vat, aangezien de klassieke notie van convergentie abstractie maakt van de sociolinguïstische status van de convergerende taalsystemen. In het kielzog van Mattheier (1996) gaat zijn voorkeur uit naar ‘advergentie’ (Advergenz), i.e. de eerder unilaterale convergentie tussen asymmetrische variëteiten wat betreft status en prestige. Deze voorstelling blijft evenwel oppervlakkig ten aanzien van de convergentiedynamieken die ook binnen de dialecten in een regio hebben plaatsgevonden en die de toenadering tot het Standaarditaliaans hebben teweeggebracht. In dat verband ontwaart men ontwikkelingen binnen het dialectale continuum in een regio die door dezelfde sociolinguïstische verhoudingen worden gekenmerkt als die tussen dialect en standaardtaal. Hierbij dient men rekening te houden met interdialectale nivellering (dialect levelling [Kerswill 2012], koineization [Sobrero
1996], supralocalisation [Britain 2010a, 2012]), gedefinieerd als het proces waarbij “variants which are “unmarked” – linguistically, socially and geographically – […] have begun to be eroded, leveled away in favor of forms fulfilling the need for greater geographical scope” (Britain 2010b: 209)18. In navolging van Cerruti & Regis (2014) stellen we het model voor dat, ook volgens ons, het best de dialect-standaardtaalconfiguratie in Italië uittekent.
Standard Italian
Regional standards
Dialettizzazione dell'italiano (dialectisation of Italian)
Italianizzazione dei dialetti (italinisation of dialects)
Regiolects
Dialect of a culturally and economically prestigious urban center
Dialect of small urban centers
Rural dialects
De twee continua van het dialect en het Italiaans worden gerepresenteerd in kegelvorm: door convergentie slinkt het aantal variëteiten en dat komt tot uiting in een zekere piramidale 18
Sobrero (1996) poneert het bestaan van twee modi, actief en passief, waarin nivellering zich voordoet. De eerste betreft het ontstaan van een “opgekuist” stadsdialect, in contrast met de rurale, archaïsche dorpsdialecten, en zijn regionale verspreiding ten koste van die laatsten. De tweede houdt in dat de nivellering niet het resultaat is van een hegemoniaal spreidingscentrum, maar van de algemene druk van het Italiaans, “tending to non-differentiated forms, generally Italianized and re-phonetized according to the phonetics of the area” (Sobrero 1996: 107).
structuur. Die hiërarchie weerspiegelt natuurlijk ook de verschillen in status tussen de niveaus. De auteurs maken een onderscheid tussen intralinguïstische convergentie, binnen enerzijds het dialectale continuum of het Italiaanse continuum, en interlinguïstische convergentie, tussen de twee continua. H-variëteiten bevinden zich dus steeds aan de top van elke kegel, terwijl Lvariëteiten de basis vormen. De neerwaartse pijl vertrekkende vanuit standard Italian duidt op de huidige tendensen om voorheen als substandaard beschouwde kenmerken in de standaardtaal op te nemen (downward interlinguistic convergence [Cerruti & Regis 2014: 86]). De pijl die de twee H-variëteiten verbindt, maakt duidelijk hoe het Standaarditaliaans in de loop der eeuwen steeds het model is geweest waaraan de bourgeoisie haar stedelijk dialect heeft gespiegeld. De meer dominante stadsdialecten, waarin de invloed van het Italiaans bijgevolg groter is, hebben dan op hun beurt eigen “geïtalianiseerde” kenmerken overgedragen aan de landelijke dialecten. De naar buiten gekeerde horizontale pijlen wijzen juist op de geografische diffusie van zulke dialecten-van-grotere-ordes. Het watervalsysteem dat hierdoor ontstaat, wordt ook urban hierarchy diffusion genoemd. We kunnen stellen dat het geschetste model erin slaagt een gedetailleerder beeld te geven van de structurele convergentie tussen dialect en standaardtaal, door rekening te houden met nivelleringsprocessen die een gunstige voedingsbodem zijn geweest voor het ontstaan van Italiaanse regionale variëteiten. Bovendien benadrukken de auteurs dat het resultaat van deze dynamieken geen verschraling van het linguïstische repertoire betekent, maar een differentiatie inhoudt, een rijker palet aan geografisch gemarkeerde variëteiten voor de spreker. We hebben tot nu toe met opzet de naar binnen gekeerde horizontale pijlen, i.e. de horizontale convergentie, onbesproken gelaten. De verhouding tussen deze regionale standaarden en hun wederzijdse beïnvloeding heeft echter ook pas de laatste jaren de interesse van onderzoekers gewekt. Men merkt vooral onder jongeren de tendens op om regionale kenmerken van andere regionale variëteiten over te nemen (Poletto 2009, geciteerd in Cerruti 2011; Berruto 2012). Dat impliceert dat de geografische verankering van een regiolect aan het verdwijnen is en dat bepaalde kenmerken hun regionale identiteit aan het verliezen zijn: “Italian speakers are often unaware that a given linguistic feature is regionally marked and, all the more so, that this is due to substratum interference. All things being equal, the older speakers are obviously more aware of substratum interference, while the younger speakers are less so” (Cerruti 2011: 20). Ter verklaring voor de verminderde perceptie van ‘regionaliteit’, kunnen we toevoegen dat de huidige jonge generatie wellicht de eerste is die niet het dialect, maar een regionale variëteit van het Italiaans als moedertaal heeft (Cerruti 2009), meer bepaald een “hybride” variëteit die slechts distinctief is op macroregionaal vlak19. Auer (2005: 23) drukt het succes van zulke variëteiten pregnant uit: “the intermediate forms often fulfil a sociolinguistic function by enabling their users to act out, in the appropriate contexts, an identity which could not be symbolised through the base dialects (which may have rural, backwardish or non-educated connotations) nor through the national standard (which may smack of formality and unnaturalness and/or be unable to express regional affiliation”.
19
Ten overvloede een fonosyntactisch voorbeeld: de raddoppiamento fonosintattico, i.e. de geminatie van een medeklinker aan het begin van een woord in bepaalde morfosyntactische contexten, is een kenmerk van centraalzuidelijke variëteiten, maar komt ook voor in het Italiaans gesproken in Turijn door jongeren wiens ouders niet afkomstig zijn uit Zuid-Italië (Cerruti 2011: 23).
1.2.5. Prestige en stigma van de Italiaanse variëteiten: een overzicht Over de Italiaanse regiolecten is in de academische literatuur veel geschreven, al heeft het debat zich in de eerste plaats gericht op hoe deze variëteiten zich structureel verhouden ten opzichte van het Standaarditaliaans en het lokale dialect. De aandacht voor de sociocognitieve aspecten van de zaak hebben ook een lange geschiedenis, maar een gevormd door sporadische indrukken. De Mauro is één van de eerste linguïsten geweest die in zijn baanbrekende Storia linguistica dell’Italia unita (1963) niet alleen de diatopische variatie in het Italiaans op de kaart zette, maar tegelijkertijd over het prestige en de stigma’s van de regiolecten heeft bericht. Vooraleer we ingaan op de statusverschillen tussen de Italiaanse regiolecten, moet men natuurlijk eerst weten waarop die classificaties en ongelijkheden precies inwerken en vooral op welke geografische schaal men een relevante onderverdeling kan maken voor onze doeleinden. De Mauro (1970) distingeert vier variëteiten die op macroregionaal niveau te situeren zijn: de noordelijke, de centraal-Toscaanse, de centraal-Romeinse (ook wel romanesco genoemd) en de zuidelijke variëteit. Het is duidelijk dat de gebieden die deze regiolecten bestrijken, niet samenvallen met de administratieve regio’s. Zijn indeling is dan ook gemotiveerd door sociologische criteria, namelijk het prestige van de variëteiten en het aantal individuen dat zich eraan conformeert. De rangschikking die De Mauro heeft aangebracht in het Italiaanse taallandschap heeft de meeste navolging gekend en ook wij zullen ons daarop baseren wat betreft het experimentele onderzoek. De verdienste van zo’n perspectief is ook de erkenning, volledig in lijn met het urban hierarchy model geschetst in de vorige paragrafen, van de uitstraling die grote urbanisaties uitoefenen ook buiten de regionale grenzen20. Een regionale variëteit mag dan ook beschouwd worden als het Italiaans waarvan de belangrijkste interferentie-elementen afkomstig zijn uit het “gekuiste” dialect van de belangrijkste Italiaanse verstedelijkte centra, namelijk Milaan, Rome en Napels. Tegelijkertijd houdt De Mauro ook rekening met het historische en taalkundige prestige waarvan een stad als Florence (maar ook Napels) eeuwenlang heeft genoten en die tot op vandaag als referentiepunt kan dienen voor velen in het standaardiseringsdebat. In zijn sociologisch getinte uiteenzetting laat De Mauro het niet na om de vier regiolecten op een prestigeschaal te plaatsen. Het romanesco bekleedt de hoogste trede, dankzij de grote populariteit die het heeft gekend door de televisie- en filmindustrie. Daarna volgen respectievelijk de Milanese variëteit en de Florentijnse, terwijl de Napolitaanse zich helemaal onderaan de ladder positioneert en zelfs blijkt misprezen door de zuiderlingen zelf. Sgroi’s visie (1981) komt ongeveer overeen met die van De Mauro, met het enige verschil dat hij de centrumToscaanse variëteit hoger acht dan de noordelijke. Het is pas met het onderzoek van Baroni (1983) en Galli de’ Paratesi (1984) dat men het terrein van de persoonlijke indrukken verlaat in het voordeel van een systematische attitudestudie om de effectieve statusverschillen te observeren. De resultaten van Galli de’ Paratesi brengen een andere realiteit aan het licht, die waarin de noordelijke variëteit de koppositie bestijgt en, volgens de linguïste, Milaan het nieuwe 20
“The koiné with a Neapolitan basis not only has a certain prestige within the southern area, but is also accepted beyond the regional boundaries […] Even for Calabria, Giuseppe Falcone points out the habit of Neapolitanizing, as a characteristic of the accultured urban lower middle class” (Sobrero 1996:109)
standaardiseringscentrum (polo standardizzante) wordt. Het is in dat opzicht belangrijk te vermelden dat het noordoosten van Italië, waarvan Milaan het representatieve centrum is, zich die functie kan eigenmaken juist doordat dat het meest gestandaardiseerde gebied is (polo standardizzato), i.e. waar de nationale taal de grootste verspreiding en succes heeft gekend. We kunnen als volgt de estafettewedstrijd beschrijven die de prestigeverschuivingen de laatste eeuw hebben gekend. Eerst bestond er een zeer sterke diglottische situatie tussen het literaire Italiaans, dat in grote mate overeenkwam met het gesproken Florentijns van de hoogste klasse, en de alle andere dialecten. Na de Tweede Wereldoorlog en dankzij de socio-economische vooruitgang is de eeuwenoude dominance configuration (Weinreich 1953) ontwricht en heeft die plaatsgemaakt voor een diversificatie van het Italiaans waarin elke variëteit op haar beurt een min of meer gunstige plaats kon innemen op een zogenaamde prestigeschaal. De meest recente evolutie lijkt de onttroning van de Romeinse variëteit ten voordele van de Milanese variëteit. Terwijl de eerste, die lang de mass media heeft gedomineerd, voornamelijk een cultureel prestige had opgebouwd, bezit de tweede variëteit een prestige gebaseerd op economische sterkte. Net zoals 500 jaar geleden het economisch sterke Toscane het laken naar zich toe heeft getrokken en het verloop van de standaardisering in Italië heeft bepaald, zo speelt de tegenwoordige economische welvaart ten noorden van de Po opnieuw een rol in wat Tabel 1: 'Populariteit van de variëteiten' (Sobrero 1988: 743, gegevens uit Galli de' Paratesi 1977) velen de nuova questione della lingua noemen (Parlangèli 1971). We kunnen ons evenwel inbeelden dat de vorige auteurs deze prestigeschalen niets anders beschouwden dan een eenvoudig plastisch hulpmiddel, zonder theoretische implicaties of pretenties. Deze voorstelling van de krachtverhoudingen tussen de Italiaanse variëteiten geeft immers niet ten volle weer welke verschillende dynamieken aan het prestige en de stigma van de regiolecten ten grondslag liggen. In eerste instantie neemt men stilzwijgend aan dat dit type classificaties een algemeen aanvaarde realiteit is, één state of the art. Wanneer men echter om te beginnen in de verzamelde attitudinele data van Galli de’ Paratesi een onderscheid maakt tussen oordelen tegenover de eigen variëteit en de andere, komen enkele specifieke patronen aan het licht. De Italiaanse sprekers staan over het algemeen negatiever tegenover vreemde variëteiten, terwijl het eigen regiolect positief beoordeel wordt, ongeacht het prestige of het stigma die de variëteiten in de collectieve verbeelding bezitten (Galli de’ Paratesi 1977). Deze observatie verwept meteen het unidimensionele perspectief waarin zulke prestigeschalen ons dwingen. Bovendien zijn prestige of stigma geen absolute categorieën die aan een variëteit in zijn geheel kunnen worden toegekend, maar ze zijn verbonden met specifieke dimensies, hetzij sociaal of functioneel, van een variëteit. Door de zelfevaluatie van sprekers te betrekken, komt men opnieuw in het delicate gebied waarin taalattitude en taalgedrag elkaar kunnen kruisen. In de traditionele sociolinguïstiek (Labov 1972, Trudgill 1974) heeft men de concepten covert prestige en linguistic insecurity geïntroduceerd om een genuanceerdere weergave van de dynamiek prestige-stigma te geven. Men spreekt van linguistic insecurity wanneer taalgebruikers, ondanks de negatieve
beoordeling, toch aanzienlijk veel substandaardvarianten of variëteiten spreken. Omgekeerd is covert prestige dat verschijnsel waarbij taalgebruikers een substandaardvariëteit positief beoordelen, waarbij in sommige gevallen men zelfs beweert meer de substandaardvarianten te gebruik dan men in feite doet. De gegevens uit tabel 1 sommen de antwoorden op bij de directe vragen “Bevalt het accent waarmee het Italiaans in Milaan/Rome/Florence wordt gesproken?” en bijgevolg zijn we geneigd deze manier van werken te ressorteren onder de directe technieken voor het verzamelen van attitudes. Het algemeen beeld dat hieruit voortkomt is a) het Milanese noch het Romeinse Italiaans geniet de volle goedkeuring door de respondenten en b) de variëteit gesproken door de ondervraagden blijkt steeds de beste. Men zou hieruit logisch kunnen afleiden dat in Italië het lokale chauvinisme hoogtij viert en dat naast een standaardideologie ook een sterke dialectideologie bestaat. Het spreekt voor zich dat men heel wat kanttekeningen kan maken bij bovenvermelde resultaten. Alle problemen die opduiken wanneer de onderzoeker zulke expliciete directe vraagstelling hanteert kunnen hierbij vernoemd worden. Het fundamentele obstakel blijft de druk om sociaal aanvaardbare antwoorden te geven die vaak niet de diepere, meer oprechte attitudes weerspiegelen (Garrett 2005). We hebben al beargumenteerd dat de aandacht bewust vestigen op de taal niet noodzakelijk leidt tot geforceerde attitudepatronen, maar volgens ons kan men binnen de familie van de directe methodes zeker wel nuances aanbrengen. Zo zijn we ervan overtuigd dat het invullen van een enquête over taal een andere aanpak is dan vragen om instinctief drie sleutelwoorden te bedenken om een bepaalde variëteit te karakteriseren. In beide gevallen wordt het attitudeobject kenbaar gemaakt voor de respondenten, maar hoogstwaarschijnlijk wordt niet in dezelfde mate geput uit een hele reeks van stereotiepen en officiële ideologieën. Van een volledige andere orde is het onderzoek van Baroni (1983), die voor het eerste in de Italiaanse sociolinguïstiek de verbal guise technique uitvoert, de indirecte techniek bij uitstek. Haar verrassende vaststelling is dat elke regionale variëteit slecht scoort zowel ten aanzien van de dialecten als van de standaardtaal en wordt beschouwd als “een hybride die door niemand wordt gewaardeerd en dat echt het enige ondubbelzinnige teken is van minderwaardigheid” (Baroni 1983: 114)21. De standaardtaal wordt dan weer positief beoordeel op dimensies die betrekking hebben op socio-economische status, terwijl dialectsprekers vriendelijk en betrouwbaar worden bevonden. De volgende secties van deze meesterproef zijn tot stand gekomen in de overtuiging dat het huidige attitudeonderzoek in Italië zeker een drietale wegen kent die een grondigere verkenning waard zijn. Ten eerste is er de nood om dertig jaar na dato een geactualiseerd overzicht te geven van de attitudes van de Italiaanse sprekers in het licht van het toegenomen gewicht van subjectieve factoren, zoals identiteit en perceptie, de studie van (standaard)taalverandering. Ten tweede proberen we de licht contradictorische bevindingen van Baroni en Galli de’ Paratesi aan te vullen in de hoop coherenter beeld te schetsen. Ten derde, we geloven dat de resultaten van een attitudeonderzoek in een dialectische relatie staan tot de manier waarop men die resultaten verkrijgt. We willen dan ook sterk de nadruk zeten op een sterke methodologische onderbouwing en de onontbeerlijke behoefte naar methodologische vernieuwing.
21
“un ibrido che non viene apprezzato da nessuno, e che resta veramente il solo segno inequivoco di inferiorità”
2. Experimenteel design en onderzoeksvragen 2.1.
Design
Het onderzoek van deze meesterproef splitst zich op in twee delen. Het eerstvolgende hoofdstuk zal gewijd worden aan de opbouw van een verbal guise experiment (VGE), de belangrijkste exponent van de familie van de indirecte methodes om attitudes uit te lokken. Het hoofdstuk nadien beschrijft in detail het tweede luik van het experiment, namelijk het free response experiment (FRE), een voorbeeld van een directe techniek. De verschillende stappen die tot beide designs hebben geleid en de specifieke theoretische en methodologische overwegingen die hebben meegespeeld zullen daar uitvoerig behandeld worden. Dit hoorfstuk is bedoeld om bondig het eindproduct voor te stellen van beide experimenten, zoals ze ook aan de proefpersonen werden geleverd. Nadat de designs zijn geïntroduceerd delen we mee, in de vorm van onderzoeksvragen, wat we uit de combinaties van beide methodes hopen te halen. De geluidsfragmenten voor het VGE werden gehaald uit een Italiaans corpus van gesproken taalgebruik (CLIPS [Albano Leoni 2006]). Het betreft telkens twee opnames per regio, ingesproken door twee verschillende stemmen, van mannen afkomstig uit Milaan, Florence, Rome en Napels. We voegden er ook een standaardtaalfragment aan toe, dat werd verkregen door een professionele spreker een transcriptie van een ander audiofragment te laten inspreken. In totaal kregen de participanten 9 fragmenten te horen. Hieronder zijn de 21 stellingen opgesomd waaraan de geluidsfragmenten getoetst moesten worden. De onderstaande volgorde is dezelfde als die aanwezig op de bundels die aan de helft van de participanten werden gegeven. De andere helft kreeg de omgekeerde volgorde. Voor elke stelling moesten de participanten een 7-punten-Likertschaal invullen: 1 betekent een totale afkeuring van de stelling voor de desbetreffende stem, 7 een volledige bevestiging van die stelling. De attitudinele dimensies die in gemengde volgorde vertegenwoordigd zijn in de lijst zijn Speaker Status, Speaker Integrity, Speaker Solidarity, Speech Norm, Speech Intelligibility.
1. Questa persona è educata “Deze persoon is welgemanierd” 2. Durante una riunione di lavoro parleresti come questa persone “Tijdens een werkvergadering zou je zoals deze persoon spreken” 3. Questa persona occupa un ruolo di prestigio “Deze persoon bekleedt een prestigieuze positie” 4. Diventerei amico di questa persona “Ik zou met deze persoon bevriend worden” 5. Questa persona si esprime in modo corretto “Deze persoon praat op een correcte manier” 6. Questa persona è innocua “Deze persoon is ongevaarlijk/goedaardig” 7. Questa persona ha una voce piacevole “Deze persoon heeft een aangename stem” 8. A questa persona sta a cuore l’onestà “Eerlijkheid gaat deze persoon ter harte”
9. Questa persona verrebbe compresa in tutta Italia “Deze persoon zou in heel Italië begrepen worden” 10. Questa persona ha un ingegno perspicace “Deze persoon is scherpzinnig/spitsvondig” 11. Questa persona ha un grado di istruzione elevato “Deze persoon heeft een hoge scholingsgraad” 12. Questa persona ha una mentalità aperta “Deze persoon heeft een open mentaliteit” 13. Questa persona parla in modo chiaro “Deze persoon spreekt duidelijk/helder” 14. Questa persona ama scherzare “Deze persoon grapt graag” 15. Sento molto spesso quest’accento sulle TV nazionali “Ik hoor vaak dit accent op de nationale tv-zenders” 16. Questa persona ci tiene al proprio aspetto “Deze persoon draagt zorg voor zijn uiterlijk” 17. Questa persona ha una cadenza “Deze persoon heeft een accent” 18. Su questa persona puoi contare “Je kunt op deze persoon rekenen” 19. Questa persona si comporta con modestia “Deze persoon gedraagt zich bescheiden” 20. Questa persona è adatta a fare il corrispondente estero della Rai “Deze persoon is geschikt als buitenlandse verslaggever van de Rai” 21. Questa persona trasmette simpatia “Deze persoon wekt sympathie op”
Nadat de proefpersonen de 9 fragmenten hadden beluisterd en geëvalueerd, werd hun gevraagd op een gegevensblad de volgende zaken op te schrijven: de sekse, de leeftijd, de provincie waarin ze woonachtig zijn, welke tv-zenders ze het vaakst bekeken, het veronderstelde doel van het experiment en hoe zeker ze zijn dat hun intuïtie correct is. Daarna vond het tweede luik van het experiment plaats, de FRE. We vroegen namelijk de participanten om zo snel mogelijk, zonder veel te na te denken, de drie eerste adjectieven te geven die in hen opkwamen en die volgens hen het best een bepaalde variëteit kenmerkten. Voor achtereenvolgens l’italiano parlato a Milano, a Firenze, a Roma e a Napoli (“het Italiaans gesproken in Milaan, in Firenze, in Rome en in Napels”) moesten ze drie verschillende adjectieven opschrijven, maar een eerder adjectief mocht wel herhaald worden bij een volgende variëteit. Ten slotte drukten we de aanwezigen op het hart dat er geen correcte of foute adjectieven bestonden en dat ze niet geremd moesten zijn in hun keuze. Het volledige experiment werd viermaal afgenomen. De eerste twee sessies vonden plaats in de lokale toneelzaal van het Zuid-Italiaanse dorp Pagani (SA). Het experiment werd telkens gepresenteerd voordat de voorstelling begon. De twee voornaamste redenen voor de keuze voor deze plaats waren de capaciteit van de zaal en het soort doelpubliek dat we konden bereiken. Statistische analyses kunnen in vele gevallen slechts zinvol ingezet worden als we erin slagen een aanzienlijke hoeveelheid data te verzamelen. Onze theaterzaal bood plaats aan 70 toeschouwers.
Het publiek dat zulke toneelvoorstellingen bijwoont, is bovendien bijzonder gevarieerd wat betreft sociale achtergrond en leeftijd. Het was een uitdaging om ook die groepen te betrekken die doorgaans op minder aandacht kunnen rekenen in experimenteel onderzoek. Bij het opstellen van het experimentele design hielden we steeds in het achterhoofd dat het geheel ook toegankelijk moest blijven voor categorieën die weinig vertrouwd zijn met het afleggen van enquêtes, of onderzoek in het algemeen, zoals 60-plussers of laaggeschoolden. De derde sessie vond plaats in een kleine groep van negentien proefpersonen, voornamelijk gepensioneerde leden van een lokale culturele vereniging. Deze groep is homogeen qua sociale achtergrond, maar alweer waren er velen die nog nooit aan een experiment hadden meegewerkt. De vierde en laatste ronde gebeurde tijdens een college aan de Università degli Studi di Salerno, waarbij 121 studenten van de faculteit sociale wetenschappen werden ingeschakeld.
2.2. Onderzoeksvragen Hoewel men in de literatuur hardnekkig het onderscheid volhoudt tussen indirecte, i.e. meer onbewuste, en directe, i.e. meer bewuste, presentatie van attitudestimuli, zijn we van mening dat enkel een onderzoek waarin beide methodes worden gecombineerd, een duidelijker licht kan werpen op de complexiteit van taalattitudes. De resultaten van het ene experiment zijn dus complementair aan de resultaten van het ander experiment, om zo tot een omvattend inzicht te komen. De twee experimenten belichten elk een ander facet van de taalattitude en geven bijgevolg ook antwoorden op verschillende onderzoeksvragen. Ons VGE beoogt in de eerste plaats een descriptief doel, namelijk een beeld verschaffen van de attitudes tegenover de standaardtaal en de belangrijkste regionale variëteiten van het Italiaans (het Milanese, Florentijnse, Romeinse, en het Napolitaanse regiolect). Daarmee willen we vooral een leemte opvullen in het huidige Italiaanse taalkundige onderzoek. Ten tweede zullen de verkregen attitudeprofielen ook in het licht gehouden worden van de recente ontwikkelingen in het taalvariatieonderzoek, besproken in de literatuurstudie. We kunnen daarom de volgende twee onderzoeksvragen formuleren: A. Hoe evalueren Zuid-Italianen de Italiaanse regionale variëteiten? Kunnen we aan de hand van de positieve en negatieve evaluaties van attitudedimensies een prestige- en stigmaconfiguratie schetsen? B. In welke mate weerspiegelen de verkregen attitudeprofielen de huidige standaardiseringsdynamieken? Komt uit zo’n beeld een mogelijke standaardtaalkandidaat naar voren waarnaar onze respondenten zich blijken te oriënteren? Het FRE biedt dan weer de kans om de algemene attitudedimensies verkregen in het VGE, aan te vullen door in de verzameling adjectieven de semantische velden te herkennen waarmee de participanten taalvariëteiten conceptualiseren. De verwerking en de analyse van de adjectieven gebeurt op een semi-automatische basis, steunend op de principes en de methodes van de distributionele semantiek. Het is voornamelijk in dat opzicht dat onze studie een vernieuwende bijdrage hoopt te leveren aan het attitudeonderzoek. Daarom zullen we het niet nalaten een
zorgvuldige evaluatie van zo’n distributioneel-semantisch model (Semantic Vector Space Model) te presenteren. Concreet worden deze twee taken vertaald in de volgende groepen onderzoeksvragen: C. BESCHRIJVING: Kunnen we, dankzij de woordenschat die taalgebruikers zelf inzetten om over taalvariatie te spreken, semantische domeinen onderscheiden die inzicht bieden in de manier waarop taalvariëteiten worden geconceptualiseerd? D. EVALUATIE: Waarin liggen de troeven en de zwaktes van een computioneel-semantische aanpak in het modelleren van taalattitudes, vergeleken met een VGE? Zijn de specifieke keuzes die we hebben gemaakt in de gevolgde computationeel-semantische aanpak, geschikt om tot transparante en intuïtieve, kortom interpreteerbare resultaten te komen? Welke verbeteringen kunnen of moeten aangebracht worden? Zoals we in het begin van deze paragraaf hebben aangehaald, zijn we ons terdege ervan bewust dat de input van de twee methodes van diametraal verschillende aard zijn. Bij de VGE betreft dat audiofragmenten waarvan men de taal onbewust evalueert, terwijl we in de FRE labels voor de taalvariëteiten presenteren, waarvoor de participant gevraagd wordt een bewuste attitude prijs te geven. Ook de finale vorm van de geanalyseerde output verschilt, namelijk geladen evaluaties in het VGE tegenover neutrale concepten in het FRE. Naast de identificatie van de overduidelijke verschillen beschouwen we het toch als onze afsluitende opdracht om op zoek te gaan naar eventuele gelijkenissen tussen de resultaten van de twee experimenten. We stellen ons deze laatste vraag: E. Is het hoe dan ook mogelijk om de resultaten van de twee experimenten te vergelijken? F. Zo ja, vertellen zulke bewust uitgelokte attitudes een volledig ander verhaal dan de onbewust uitgelokte attitudes? Of wordt het aloude onderscheid overschat?
3. De verbal guise experiment 3.1.
Opstellen van het verbal guise experiment
In deze sectie zullen we de stappen overlopen bij de verschillende fasen van het ontwerp van het experiment, waaraan een groot deel van het eerste semester werd gewijd. We zullen achtereenvolgens de keuze van de geluidsfragmenten (§3.1.1.) en het opstellen van de uitsprakenlijst (§3.1.2.) bespreken. 3.1.1. Keuze van de geluidsfragmenten We legden een aantal belangrijke voorwaarden op waaraan de fragmenten moesten voldoen. De eerste was een zo helder mogelijke klank nastreven opdat het geluid in niet optimale akoestische ruimtes toch duidelijk gehoord zou worden. De tweede voorwaarde betrof het evenwicht tussen voldoende regionale gemarkeerdheid en tegelijkertijd afwezigheid van te sterke regionale sjibbolets, voornamelijk van lexicale aard. We hebben dus geprobeerd om fragmenten te zoeken die de herkomst van de spreker duidelijk verraadden, maar die geen vanzelfsprekende stereotypen mochten opwekken. Het meest geschikte taalmateriaal dat we hebben kunnen opsporen, zijn de opnames uit het onderdeel gesproken Italiaans van het project CLIPS (Corpora e Lessici di Italiano Parlato e Scritto, Albano Leoni 2006). De criteria die het de makers van het CLIPS hanteren, rijmen ook met de noden van ons onderzoek: kwaliteitsvolle opnamemethodes omwille van prosodische en fonetische analyses en een representatieve weerspiegeling van zowel regionale als stilistische variatie in het gesproken Italiaans. Uit het 100-uur durend materiaal selecteerden we de geluidsopnames van de zogenaamde map tasks22 (Cutugno 2007). Dat zijn opdrachten waarin twee sprekers elkaar beurtelings de weg wijzen van punt A naar punt B aan de hand van een kaart waarop allerhande nonsensicale herkenningspunten zijn aangegeven. Zulke map tasks hebben het voordeel dat de sprekers in een gecontroleerde omgeving toch redelijk spontane dialogen genereren (Cerrato 2007). Door de “inhoud” constant te houden reduceren we bovendien het risico dat onderwerpverschillen de oordelen van onze respondenten sturen. Achtergrondgeluiden of fysieke verschuivingen van de participanten zelf worden tot een minimum beperkt, ten voordele van de kwaliteit van de opname. Bovendien ontstaat dankzij de ludieke opdracht een sfeer van gemeenzaamheid die gemakkelijk tot ontspannen, unmonitored speech23 leidt. Onze interesse ging uit naar opnames die waren vastgelegd in Milaan, Florence, Rome en Napels en die waren ingesproken door jonge mannelijke stemmen. De bewuste keuze voor mannelijke sprekers hangt samen met de vaststelling (Wilson & Bayard 1992: 51-53) dat vrouwelijke sprekers over het algemeen slechter worden beoordeeld. We knipten verschillende fragmenten uit waarin deze sprekers 20 seconden lang ononderbroken spraken, of waarin het 22
Het corpus gesproken Italiaans binnen het CLIPS bevat opnames van 15 (socio-economische en linguïstische gedefinieerde) meetpunten verspreid over het hele Italiaanse schiereiland. Voor elk meetpunt beschikt men over een gamma aan gesproken taalmateriaal gaande van talk shows tot telefoongesprekken. Het volledige corpus is vrij toegankelijk na inschrijving op de volgende site: http://www.clips.unina.it/it/index.jsp 23 “[T]he vernacular [is] the style in which the minimum attention is given to the monitoring of speech” (Labov 1972: 208); notie ook aangewend o.a. in Eckert & Rickford (2001) en Tagliamonte (2006).
mogelijk was stukjes ruis zonder problemen te verwijderen24. Daarbovenop werden deze fragmenten getoetst aan andere bijkomende voorwaarden om de uniformiteit van het taalmateriaal te vrijwaren, zoals gelijke gemiddelde toonhoogte, geen of weinig haperingen, vlotheid en een degelijk spreektempo en articulatie. We kwamen uit op drie goede kandidaten voor de regiolecten van Milaan, Rome en Florence en vier voor de variëteit van Napels. Voor de Milanese variëteit knipten we delen uit DGmtA01M, DGmtA04M en DGmtB01M. De Romeinse fragmenten kwamen van de opnames DGmtA02R, DGmtA04R en DGmtA04R. De Florentijnse stukken haalden we van DGmtA01F, DGmtA04F en DGmtB02F. Ten slotten knipten we voor de Napolitaanse variëteit twee keer uit DGmtB01N en twee keer uit DGmtB03N.
Figure 3: voorbeelden van kaarten (maps), gebruik voor de B-opnames
Om te testen of de gekozen fragmenten daadwerkelijk ook door de proefpersonen, i.e. moedertaalspreker van het Italiaans, correct zouden geïdentificeerd worden, voerden we een pilootstudie uit. We namen contact op met zes Italianen en hadden het geluk dat drie van hen uit Campanië kwamen, de regio waar het experiment zelf zou plaatsvinden. Er werd hun gevraagd de afkomst van de spreker te herkennen en hoe zeker ze waren van die herkenning (op een schaal van 1 tot 7). Opvallend genoeg konden de participanten steeds met een grote nauwkeurigheid de herkomst van alle fragmenten identificeren, met een precisie die nooit onder de 4 op 7 viel. De fragmenten die iets ruimer werden geïdentificeerd, bijvoorbeeld centraal-Italië in plaats van Rome, vielen af. Na deze laatste selectieronde hielden we de acht opnames over voor het eigenlijke experiment: DGmtA01M, DGmtA04M, DGmtA02R, DGmtA04R, DGmtA04F, DGmtB02F en telkens één uit DGmtB01N en DGmtB03N.
24
De manipulatie van de geluidsfragmenten gebeurde aan de hand van de digital audio editor Audacity.
Het geluidsfragment met Standaarditaliaans kon niet uit het corpus CLIPS gehaald worden. Het is in ieder geval geen sinecure om in gesproken corpora een variëteit te zoeken die, uitgezonderd enkele taalspecialisten zoals radio- en tv-presentatoren, niemand spreekt in alledaagse conversaties (Berruto 2010). Daarom vroegen we aan een Italiaanse toneelacteur, die ook dictielessen verzorgt, om een transcriptie van één van de afgekeurde opnames van de eerste piloostudie in te spreken. 3.1.2. Keuze van de stellingen De uitspraken- of stellingenlijst werd opgesteld na de bovenvermelde pilootstudie. Onderzoekers hebben uiteenlopende werkwijzen toegepast in deze delicate stap van de designopbouw. Lambert (1967) heeft benadrukt dat het lexicaal en discoursief repertoire dat taalgebruikers zelf inzetten om over attitudes te spreken een voldoende valide basis is, terwijl Zahn & Hopper (1985) pas op het niveau van de statistische analyse een dimensionele indeling opleggen aan hun data. Wij hebben getracht beide methodes te combineren door evaluatieve dimensies te identificeren vertrekkende vanuit een theoretische basis, gevolgd door een factoranalyse om te verifiëren of onze specifieke evaluatieschalen op een adequate manier de a-prioridimensie weerspiegelen. Eerlijkheid gebiedt ons te zeggen dat de theoretisch gemotiveerde stellingen de overhand krijgen op de intuïtief bedachte statements, wat volstrekt aanvaardbaar is vanuit een wetenschappelijke rigueur, maar wat misschien niet helemaal overeenkomt met het standpunt van de taalgebruiker zelf25. Uiteindelijk baseerden we ons hoofdzakelijk op drie soorten bronnen: mijn bachelorpaper (De Pascale 2013), artikels over soortgelijk onderzoek (Zahn & Hopper 1985, Van Bezooijen 2002, Grondelaers, Van Hout & Steegs 2010, Grondelaers & Van Hout 2010) en zelfgeformuleerde hypotheses over de standaardiseringsdynamieken in Italië. Als vertrekpunt werden de twee klassieke attitudinele dimensies genomen, Speaker Status en Speaker Attractiveness, waarin uitspraken werden ondergebracht die ook naar gedetailleerdere subdimensies verwijzen: Integrity en Solidarity voor de attractiviteitscomponent en Superiority, Competence en Dynamism voor de statuscomponent. In totaal bevat de lijst er 13 van. Afwijkend van het traditionele design, voegden we ook stellingen die betrekking hebben op de taalvariëteit zelf, namelijk Speech Status en Speech Attractiveness. In die eerste dimensie kan ook een onderscheid gemaakt worden tussen uitspraken met betrekking tot Speech Norm en een restgroep van uitspraken waar factoren als verstaanbaarheid, gelijkenis en herkenbaarheid samengenomen worden. In het vorige hoofdstuk (§1.1.2.2) hebben we beargumenteerd waarom de toevoeging van zulke stellingen gerechtvaardigd is. Er moet evenwel gezegd worden dat dat aantal lager ligt dan de persoongerelateerde uitspraken, namelijk 8 taalgerelateerde stellingen. De resulterende 21 uitspraken kunnen nu individueel besproken worden. Belangrijk is hierbij te vermelden dat dit niet de definitieve lijst is voor het experiment. Er werd namelijk een tweede 25
“too many studies even today could be improved due to the choice of rating scales without due recourse to the traits, language and judgemental dimensions utilized by the listeners themselves in everyday social life” (Ryan et al 1988: 1075); langs de andere kant uit men ook kritiek op het beperken van evaluatieschalen tot “those used in previous studies […] it may induce some circularity and hence also give a deceptive semblance of exhaustiveness” (Garrett 2005: 1256)
pilootstudie uitgevoerd om de relevantie en de geschiktheid van de stellingen te testen. In de volgende tabellen zijn in de eerste kolom de uitspraken ondergebracht, in de tweede kolom de bijbehorende frequentste adjectieven, indien die gegeven zijn, en ten slotte het concept (de variabele) waarnaar ze verwijzen. Zoals in de vorige alinea even aangestipt, zijn de meeste variabelen gemodelleerd naar de meest frequente adjectieven die in het Free Response Experiment (FRE) van mijn bachelorpaper voorkwamen (De Pascale 2013)26. We zullen onze aanpak aan de hand van enkele voorbeelden illustreren. Colto “erudiet” en ignorante “ongeletterd” treden met regelmaat op, wat aanleiding geeft om een variabele ISTRUZIONE “SCHOLINGSGRAAD” te construeren, dat op zijn beurt vertaald wordt in uitspraak (1). Voor stelling (3) maakten we gebruik van de zeer frequente adjectieven snob “snob” en elegante “stijlvol”, wat in feite twee tegengestelde perspectieven zijn op het concept ASPETTO “UITERLIJK”. Uitspraak (6) vindt geen bevestiging in de data van de FRE, maar werd hieraan toegevoegd om meer consistentie te geven aan de statusdimensie. Het zou niet alleen een goede indicator moeten zijn van algemeen dynamisch gedrag, maar ook een eigenschap waar belang aan gehecht wordt in de Italiaanse culturele traditie (cfr. Arguzia van Boccaccio, de Siciliaanse cultura degli sperti etc.). Adjectieftypes die onder die variabelen zouden kunnen vallen, omdat ze tot hetzelfde semantische veld behoren, maar die slechts in enkele tokens voorkwamen in onze dataset, worden hier niet weergegeven. Naast ISTRUZIONE en ASPETTO bevat de dimensie Speaker Status ook nog de volgende variabelen: A. Speaker Competence (1) Questa persona ha un grado di istruzione elevato. Deze persoon heeft een hoge scholingsgraad. (2) Questa persona conosce le buone maniere. Deze persoon is welgemanierd. (3) Questa persona ci tiene al proprio aspetto. Deze persoon draagt zorg voor zijn uiterlijk.
ignorante,colto ongeletterd, erudiet popolare, volgare, grezzo, rozzo volks, vulgair, ruw, lomp snob, elegante snob, stijlvol
ISTRUZIONE
B. Speaker Superiority (4) Questa persona occupa un ruolo di prestigio. Deze persoon bekleedt een prestigieuze positie.
superiore, aristocratico superieur, aristocratisch
PRESTIGIO
chiuso, aperto gesloten, open
MENTALITÀ
C. Speaker Dynamism (5) Questa persona ha una mentalità aperta. Deze persoon heeft een open mentaliteit. (6) Questa persona ha un ingegno perspicace. Deze persoon is scherpzinnig/spitsvondig.
EDUCAZIONE ASPETTO
INVENTIVITÀ
Tabel 2: Stellingen, adjectieven en variabelen voor Speaker Status
Het lag geenszins in onze plannen om deze drie attitudinele subdimensies ook op te nemen in onze analyse en bespreking en in die zin zijn de scheidingen die we hebben aangebracht louter 26
Dat experiment is bijna identiek aan het Free Response Experiment dat in het kader van deze meesterproef werd uitgevoerd. Ik vroeg namelijk aan een zeventigtal Italiaanse studenten uit Pavia om de drie eerste adjectieven te geven voor acht Italiaanse regiolecten, waaronder ook het Milanese, Florentijnse, Romeinse en Napolitaanse regiolect.
bedoeld om te laten zien dat er rekening is gehouden met alle –theoretisch mogelijke– dimensies. Het zou in ieder geval ook methodologisch niet helemaal verantwoord zijn om slechts een of twee variabelen per dimensies te postuleren. Een factor in een factoranalyse waarop niet meer dan twee variabelen hoog laden, kan bezwaarlijk als een volwaardige attitudinele dimensie beschouwd worden. Voor de tabel met de solidariteits- en integriteitdimensies werd dezelfde methode toegepast, met uitzondering van twee variabelen, namelijk statements (8) en (9). Ondanks de afwezigheid van echte overtuigende aanwijzingen in het adjectievencorpus, werd variabele (9) voornamelijk toegevoegd om het totaal aantal stellingen voor Speaker Integrity op een minimum van drie te brengen. Uit onderzoek blijkt dat integriteit van de spreker toch als vrij relevante en aparte factor opduikt bij de beoordeling van regionale accenten (Grondelaers & Van Hout 2010). Daarom hielden we ook rekening met de mogelijkheid dat Speaker Integrity ook bij onze proefpersonen als attitudedeterminerende factor zou fungeren. Variabele (8) werd ingebouwd op basis van Galli de’ Paratesi (1977). In haar onderzoek legt de linguïste de aandacht op openlijk geformuleerde positieve meningen over sprekers van regiolecten die echter het product zijn van een racistische ideologie waarvan men afstand wil nemen, uit vrees om zelf als racistisch bestempeld te worden. Zodoende wordt het bestaan van die discriminerende houding alleen maar bevestigd. Het beeld dat opgeroepen wordt is dat van de spontane, landelijke en authentieke levenswijze, maar die de participant nooit zelf zou willen kiezen als hij ook de mogelijkheid krijgt om in een rijke, competitieve en gecompliceerde maatschappij kan leven. D. Speaker Integrity (7) Su questa persona puoi contare. Je kunt op deze persoon rekenen.
mafioso, fighetto, truzzo, altruista maffioos, opschepperig, patserig, altruïstisch
(8) Questa persona è innocua. Deze persoon is ongevaarlijk/goedaardig. (9) A questa persona sta a cuore l’onestà. Eerlijkheid gaat deze persoon ter harte. E. Speaker Solidarity (10) Questa persona si comporta con modestia. Deze persoon gedraagt zich bescheiden. (11) Questa persona trasmette simpatia. Deze persoon wekt sympathie op. (12) Questa persona ama scherzare. Deze persoon grapt graag. (13) Diventerei amico di questa persona. Ik zou met deze persoon bevriend worden.
FIDUCIA
CONDISCENDENZA ONESTÀ
presuntuoso, altezzoso, spocchioso verwaand, hooghartig, zelfvoldaan antipatico, simpatico, allegro antipathiek, leuk, vrolijk divertente,spontaneo,coinvolgente grappig, spontaan, boeiend amichevole vriendelijk
MODESTIA SIMPATIA INTRATTENIMENTO AMICIZIA
Tabel 3: Stellingen, adjectieven en variabelen voor Speaker Attractiveness
De laatste tabel (Tabel 4) toont de statements voor alle talige subdimensies samen, die dus zowel status als attractiveness typeren. Wat opvalt, is de schaarste aan overeenkomstige adjectieven; enkel bij de dimensie Speech Attractiveness kan een vergelijking worden gemaakt. Bijgevolg creëerden we zelf stellingen die zo goed mogelijk bij één van de subdimensie konden ondergebracht worden. We deden een beroep op de hypotheses die in Van Bezooijen (2002) zijn
voorgesteld: de intelligibility driven hypothesis, de norm driven hypothesis, de similarity driven hypothesis en de familiarity driven hypothesis. Hoewel deze hypotheses vooral gelden voor de tegenstelling standaardtaal-regiolect, zijn we van mening dat deze verklaringen geëxtrapoleerd kunnen worden naar de vergelijking van regiolecten onderling. Aangezien een matched of verbal guise experiment in zijn standaardvorm geen statements duldt die de aandacht van de proefpersonen op het studieobject, c.q. de taalvariëteit, zou vestigen, waren we genoodzaakt dat soort statements beperkt te houden en meerdere subdimensies samen te voegen. De tegenovergestelde keuze werd gemaakt bij de dimensie Speech Attractiveness. Die werd apart beschouwd, niet met de bedoeling daarvoor een corresponderende factor uit de factoranalyse te halen, maar wel om bij een afzonderlijke onderzoeksvraag te gebruiken, namelijk te weten komen wat ervoor zorgt dat we een bepaalde variëteit mooi of aangenaam vinden. Voor de Speech Norm dimensie leek het ons gepast uitspraken toe te voegen rond correct taalgebruik (CORRETTEZZA), de gepastheid in een formele spreeksituatie (FORMALITÀ) en ten slotte de voorbeeldfunctie die de variëteit kan hebben in het buitenland (ESEMPLARITÀ), m.a.w. zou dat regiolect een goede “ambassadeur” zijn van “het Italiaans” in de ogen van een buitenlander? In de laatste (rest)groep werden dan een viertal variabelen gecreëerd die betrekking hebben op de verstaanbaarheid van de variëteit (DIFFUSIONE), waarbij we aannemen dat verstaanbaardere regiolecten dichter bij het Italiaans aanleunen dan de minder verstaanbare regiolecten. Een reden voor die verstaanbaarheid kan ook gevonden worden in het meer of minder frequent optreden van die variëteit in de media en daarom construeerden we variabele (18)27. Voor uitspraak (19) nemen we als premisse dat wie dictielessen heeft gevolgd, het gesproken Standaarditaliaans goed beheerst en die vaardigheid ook linguïstisch laat doorschijnen in zijn alledaagse omgangstaal, i.e. het regiolect. De laatste variabele (20) is dan in theorie omgekeerd gecorreleerd met de vorige: een kenmerkend en lokaal accent zal minder verstaanbaar en helder zijn, kortom minder “standaardachtig” zijn, maar dat hoeft niet per definitie zo te zijn. G. Speech Norm (14) Questa persona si esprime in modo corretto. Deze persoon praat op een correcte manier. (15) Durante un colloquio di lavoro parleresti come questa persona. Tijdens een sollicitatiegesprek zou je zoals deze persoon spreken. (16) Questa persona è adatta a fare il corrispondente estero della Rai. Deze persoon is geschikt als buitenlandse verslaggever van de Rai. F. Speech Familiarity/Similarity/Intelligibility (17) Questa persona verrebbe compresa in tutta Italia. Deze persoon zou in heel Italië verstaanbaar zijn. (18) Sento spesso quest’accento in TV. Ik hoor vaak dit accent op TV. 27
CORRETTEZZA FORMALITÀ ESEMPLARITÀ
DIFFUSIONE FAMILIARITÀ
De rol van de media is in dit geval tweevoudig: ze laat niet enkel toe dat de variëteit herkenbaarder en misschien ook wel toegankelijker wordt voor diegene die haar niet spreken, maar tegelijkertijd schenkt ze ook meer zichtbaarheid aan die sprekers, wat een impact kan hebben op het prestige van die variëteit.
(19) Questa persona ha seguito corsi di dizione. Deze persoon heeft dictielessen gevolgd. (20) Questa persona ha una cadenza tipica. Deze persoon heeft een typisch accent. H. Speech Attractiveness (21) Questa persona ha una voce piacevole. Deze persoon heeft een aangename stem.
CHIAREZZA TIPICITÀ
bello,musicale, caldo mooi,musicaal warm
PIACEVOLEZZA
Tabel 4: Stellingen, adjectieven en variabele voor Speech Status/Attractiveness
Ten slotte kan er iets gezegd worden over de puntenschalen die gebruikt zijn. De formulering van de stelling leidt automatisch tot het gebruik van Likertschalen (Likert 1932), terwijl de meeste matched en verbal guise experiments semantische differentialen aanwenden (Osgood et al. 1957)28. We hebben gekozen voor een 7-puntenschaal, zodat de participanten genoeg ruimte hebben om genuanceerd te oordelen (in vergelijking met een 5-puntenschaal) en tegelijkertijd niet gedwongen worden om een standpunt in te nemen, doordat ze het centrumcijfer kunnen aanvinken. Uit onderzoek blijkt dat informanten wel degelijk nood hebben aan een genuanceerde schaal met een middelste waarde. Er zijn echter evenveel studies bekend waaruit blijkt dat zo’n middenpositie een ambigue interpretatie toelaat: “they might reflect an uncertain response to an issue the respondent feels little involvement towards, or they might reflect a much-considered commitment to a mid-position.” (Garrett 2005: 1256). Het blijft dus een kwestie van knopen doorhakken, waarvoor geen zaligmakende oplossing bestaat.
3.2. Afnames VGE: pilootstudies en eigenlijk experiment Nadat we het volledig ontwerp van de VGE in detail hebben uiteengezet, zullen we in de volgende drie paragrafen eerst de maatregelen uiteenzetten die we hebben ondernomen om het design te verbeteren, namelijk de twee pilootstudies in België (§3.2.1 en §3.2.2). Daarna geven we een kort verslag van de uiteindelijke afname van de VGE in Italië, aangevuld met een bespreking van het doelpubliek (§3.2.3). 3.2.1. Eerste pilootstudie Opnieuw voerden we een pilootstudie uit op zes Italiaanse proefpersonen, waaronder twee uit Campanië. Ditmaal werd het volledige experiment afgenomen, op dezelfde manier als het zou afgenomen worden bij de proefpersonen in Italië. Eerst informeerden we hen over de opzet van de enquête. Het woord ‘experiment’ hebben we steeds geprobeerd te vermijden, zowel in de pilootstudies als in de definitieve uitvoering, omdat de term al argwaan zou kunnen wekken bij onze respondenten. We trachtten elke keer dezelfde informatie te geven, wat grotendeels overeenkomt met de volgende tekst:
28
Soukup (2013) biedt een zeer grondige en fundamentele kritiek op het gebruik van semantische differentialen, maar beargumenteert ook dat hun rol bijlange niet is uitgeteld.
“De Rai (Radiotelevisione italiana, de openbare omroep van Italië), in samenwerking met enkele Vlaamse universiteiten, is van plan een nieuw radioprogramma te lanceren vanuit haar buitenlandse radiostation in Brussel. Ze wil daarom systematisch te werk gaan en heeft een sociologisch profiel opgesteld waaraan de potentiële presentatoren moeten voldoen. Eerst wil ze controleren of dat profiel door het publiek wordt bevestigd of het misschien aanpassingen nodig heeft. Dat doet ze door een enquête uit te werken waarin de kenmerken van zo’n potentiële presentator getoetst worden aan een bepaalde stem, die jullie zullen horen. Iedereen heeft een bundel gekregen van negen identieke bladen en een tiende blad. Bij de eerste negen bladen horen negen verschillende opnames. Op elk blad staan 21 uitspraken met daarnaast evaluatieschalen die gaan van 1 tot 7. Het is de bedoeling dat je iedere uitspraak toetst aan de stem die je hebt gehoord. 1 betekent helemaal oneens zijn met de uitspraak, 7 helemaal eens, en de vakjes daartussen zijn tussenliggende evaluaties. Iedereen krijg ongeveer 1,5 minuut voor elke opname, wat betekent dat je niet te lang moet stilstaan bij elke uitspraak afzonderlijk.” Net zoals bij het definitieve experiment zou gebeuren, werden de uitspraken in twee verschillende volgordes geplaatst (de ene het spiegelbeeld van de andere), zodat sommige participanten volgorde 1 zouden krijgen en andere volgorde 2. Ook de opnames kenden twee volgordes, waarbij het standaardtaalfragment wel telkens op de eerste plaats kwam te staan. Volgorde 1 was: romaA02R, milanoA01M, napoliB03N, firenzeB02F, romaA04R, milanoA04M, napoliB01M en firenzeA04F. Volgorde 2 was opnieuw het spiegelbeeld van de eerste volgorde. Verschillende volgordes hanteren is een manier om priming-effecten29, vermoeidheids- of gewenningsverschijnselen bij de proefpersonen te neutraliseren op het moment dat alle data gezamenlijk geanalyseerd wordt. Het laatste blad van de experimentenbundel voorzag ruimte voor enkele demografische gegevens van de proefpersoon: geslacht, leeftijd en provincie. We vroegen bovendien naar welke zenders ze vooral keken (Rai of Mediaset), of ze een gok wilden wagen naar de bedoeling van de enquête en hoe zeker ze daarvan waren. Nadat ze die gegevens hadden ingevuld, werd de Free Response Task uitgevoerd. In tegenstelling tot het definitieve experiment werden de proefpersonen individueel ondervraagd, wat de mogelijkheid gaf om op het einde suggesties te vragen over eventuele verbeteringen of opmerkingen te maken over onduidelijkheden.
3.2.2. Tweede pilootstudie De tweede pilootstudie toonde aan dat enkele aanpassingen aan de statements geboden waren. Opdat de variabelen onderling vergelijkbaar zouden zijn, is het belangrijk dat ze ongeveer allemaal dezelfde, min of meer klokvormige frequentieverdeling vertonen. Door histogrammen voor deze variabelen te maken, konden we controleren welke variabelen een te ‘scheve’ verdeling hadden of verdelingen vertoonden waar te weinig variatie aanwezig is. De ene afwijking betekent dat de uitspraak voor de participanten te sterk is geformuleerd, wat aanleiding geeft tot extreme beoordelingen. Dat was het geval voor de statements (15), (19) en (20). Statement (15) veranderden we bijgevolg in “Durante una riunione di lavoro parleresti come questa” (Tijdens 29
Hiermee bedoelen we de invloed die vorige uitspraken en/of vorige fragmenten kunnen uitoefenen op de uitspraak en/of het fragment dat men moet beoordelen. Ironisch genoeg heeft priming recent een veel positievere invulling gekregen in het attitudeonderzoek zelf, namelijk als methodologische innovatie (Speelman et al. 2013)
een werkvergadering zou je zoals deze persoon spreken). Het zou niet mogen verbazen dat een sollicitatiegesprek misschien de enige situationele context is waar de standaardtaal nog steeds een onbetwiste voorkeurspositie krijgt en geen enkele andere regiolect dat prestigeniveau vooralsnog heeft bereikt. Door een iets minder formele setting voor te stellen, zoals een werkvergadering, hoopten we meer variatie te zien in die voorkeuren. Ook voor uitspraak (19) stelden we vast dat het volgen van dictielessen de respondenten te sterk naar een extreem laag oordeel had geleid. Daarom veranderden we die stelling in “Questa persona parla in modo chiaro.” (Deze persoon spreekt duidelijk/helder). Het omgekeerde zagen we bij uitspraak (20): daar kregen de meeste variëteiten een zeer hoge score, wat ons ertoe aanzette een zachtere formulering te geven, namelijk “Questa persona ha una cadenza.” (Deze persoon heeft een accent). De laatste twee resultaten bieden op zich stof tot nadenken: hoewel de regiolecten in kwestie duidelijk variëteiten zijn van het Italiaans, de nationale taal, en niet van de dialecten, de lokale talen, worden zij toch gepercipieerd als zeer lokaal én bijna immuun van standaardtalige invloed. De tweede afwijking betekent dat de uitspraak te ambigu is geformuleerd of dat het voor de proefpersonen lastig was om duidelijk stelling te nemen. Hier moesten de uitspraken dus ‘straffer’ geformuleerd worden. Variabele (2) werd waarschijnlijk te specifiek ervaren en daarom herfomuleerden we het als volgt: “Questa persona è educata.” (Deze persoon is welgemanierd.). Voor uitspraak (8) werd geen nieuwe uitdrukking bedacht en besloten we de oude te behouden, aangezien het al een hele moeilijkheid was om dat concept in eenvoudige woorden aan te duiden. Ten slotte veranderden we lichtjes statement (18). Om de onduidelijkheid tussen lokale omroepen en nationale omroepen te vermijden, specifieerden we het statement: “Sento molto spesso quest’accento sulle TV nazionali”. Lokale zenders zijn vrij populair onder onze oudere participanten in Italië; wij zijn echter op zoek naar het succes van de regiolecten op de nationale zenders.
3.2.3. Het uiteindelijke experiment: keuze doelpubliek en afnameplek Het experiment werd viermaal afgenomen. De eerste twee sessies vonden plaats in de lokale toneelzaal van het Zuid-Italiaanse dorp Pagani (SA). Het experiment werd telkens gepresenteerd voordat de voorstelling begon. De twee voornaamste redenen voor onze keuze voor deze plaats waren de capaciteit van de zaal en het soort doelpubliek dat we konden bereiken. Statistische analyses kunnen in vele gevallen slechts zinvol ingezet worden als we erin slagen een aanzienlijke hoeveelheid data te verzamelen. Factoren die dankzij een factoranalyse aan het licht gebracht worden, kunnen met voldoende zekerheid als zodanig geïnterpreteerd worden enkel als het aantal totale observaties groter is dan het aantal factoren maal 50. Indien we a priori vier factoren of attitudinele dimensies bepalen voor ons experiment, dan zouden we idealiter 200 proefpersonen moeten ondervragen. Wij postuleerden een vijftal dimensies (Speaker Status, Speaker Integrity, Speaker Solidarity, Speech Norm, Speech Intelligibility), wat in theorie verantwoord zou zijn door een steekproef te nemen van minstens 250 proefpersonen. Dat aantal gebood ons daarom de experimenten in grote groepen af te nemen. Onze theaterzaal bood plaats aan 70 toeschouwers. Er zijn ook methodologische voordelen verbonden aan groepsafnames. Door direct contact met de participanten te vermijden –de groep wordt immers in zijn geheel
aangesproken– verkleint men het risico op schadelijk beïnvloeding veroorzaakt door de onderzoeker zelf. Het is namelijk zo dat proefpersonen bij direct contact vaak geneigd zijn stereotiepe of sociaal aanvaarde oordelen te geven, om zich “well-adjusted, unprejudiced, rational, open-minded, and democratic” (Cook & Sellitz 1964: 19) te profileren. Toch is de collectieve afname geen panacee: een genivelleerde aanpak voor heel de groep zal sommigen benadelen, bijvoorbeeld de tragere, of anderen zullen geen vragen durven stellen, hoewel ze sommige stellingen niet begrijpen. Ook wanneer de anonimiteit van de respondenten niet gegarandeerd is, zoals in groepsafnames waar iedereen dichtbij elkaar zit, kunnen stereotypische oordelen gemakkelijker de kop opsteken (Garrett 2005). Hoe dank ook zullen de gebreken of de kwaliteiten van de afnemer, ongeacht of hij zich tot een groep of een persoon wendt, altijd een rol spelen. Het publiek dat zulke toneelvoorstellingen bijwoont, is bijzonder gevarieerd wat betreft sociale achtergrond en leeftijd. Het was een uitdaging om ook die groepen te betrekken die doorgaans op minder aandacht kunnen rekenen in experimenteel onderzoek. Bij het opstellen van het experimentele design hielden we steeds in het achterhoofd het geheel ook toegankelijk moest blijven voor categorieën die weinig vertrouwd zijn met het afleggen van enquêtes, of onderzoek in het algemeen, zoals 60-plussers of laaggeschoolden. Het merendeel van het Italiaanse attitudeonderzoek waarmee wij de vergelijking aangaan, heeft zich echter gefocust op dezelfde homogene leeftijdscategorieën en sociale groepen, namelijk “the safe haven of […] students or pen-prone, form-familiar, literate, middle class informants.” (Ryan et al 1988: 1076, recent ook aan de kaak gesteld door Davies & Benthahila (2013)) (voor het Italiaans zie Galli de’ Paratesi 1985, Calamai & Ricci 2005, Di Ferrante 2008, maar ook uitzonderingen zoals Baroni 1983). Bovendien valt het te betwijfelen of de attitudes van de studentenpopulatie ook representatief zijn voor andere sociale categorieën, hoezeer men dat ook stilzwijgend aanneemt. De derde sessie vond plaats in een kleine groep van negentien proefpersonen, voornamelijk gepensioneerde leden van een lokale culturele vereniging. Deze groep is homogeen qua sociale achtergrond, maar alweer waren er velen die nog nooit aan een experiment hadden meegewerkt. De vierde en laatste ronde gebeurde tijdens een college aan de Università degli Studi di Salerno, waarbij 121 studenten van de faculteit sociale wetenschappen werden ingeschakeld.
3.3. Attitudedimensies aan het licht brengen: factoranalyse Eenmaal de experimenten zijn afgelegd en de data verzameld, worden de numerische gegevens onderworpen aan statistische analyse. Daarom bevat deze sectie de technische beschrijving van de specifieke statistische methode, namelijk factoranalyse (§3.3.1.). Vervolgens bespreken we de output van de analyse (§3.3.2.) en houden we die tegen het licht van de indelingen en de voorspellingen beschreven in het eerste hoofdstuk. 3.3.1. Factoranalyse: beschrijving van de techniek Om de verzamelde data te interpreteren hebben we een factoranalyse uitgevoerd. Factoranalyse is een statistische techniek om patronen en structuren aan het licht te brengen in multivariate
datasets, i.e. bestanden waarin elke observatie aan de hand van meerdere variabele gekenmerkt wordt. Factoranalyse is een zeer geschikte techniek om in dat soort complexe gegevensverzamelingen te achterhalen welke variabelen op een of andere manier met elkaar verbonden zijn en bijgevolg te reduceren zijn tot een kleiner aantal relevante onderliggende dimensies, factoren genaamd. Die factoren proberen zo goed mogelijk de positie van alle observaties in die multidimensionale euclidische ruimte te verklaren door de assen in deze ruimte te laten roteren opdat de nieuwe assen zo veel mogelijk variatie in de data zouden vatten (Baayen 2008, Rietveld & Van Hout 1993, Speelman 2013). Vertaald in “attitudetermen” zal zo’n analyse de variabele die we hebben geconstrueerd (cfr. supra) idealiter groeperen per attitudinele dimensie. Sommige attitudestudies doen een beroep op principaalcomponentanalyse (Impe & Speelman 2007, Grondelaers et al 2009), een techniek die verwant is met factoranalyse. Wij verkiezen evenwel de laatste techniek omdat die een accuratere aanpak van de te verklaren variatie beoogt, namelijk door een onderscheid te maken tussen gemeenschappelijke variatie en unieke variatie. De gegenereerde factoren houden dan enkel rekening met de gemeenschappelijke variatie. Daaruit volgt dat, in tegenstelling tot de principaalcomponentanalyse, er niet een vast aantal componenten bestaat die de hele variatie probeert te vatten, maar dat de nodige factoren geïdentificeerd worden aan de hand van een tweede rotatietechniek, VARIMAX rotation. De assen van de ruimte waarin de factoren zich nu bevinden worden zo geroteerd dat de oorspronkelijke variabelen zeer hoog of zeer laag voor die respectievelijke factoren laden én dat variabelen slechts sterk laden op weinig factoren (Speelman 2013). Door de VARIMAX-techniek aan te wenden, veronderstellen we dat de factoren niet gecorreleerd zijn met elkaar, wat in de praktijk echter niet steeds het geval is. Deze methode biedt wel het voordeel de interpretatie van de hele factoranalyse te vergemakkelijken en daarom opteren finaal voor haar. De eerste stap in de factoranalyse is bepalen hoeveel factoren we moeten overhouden. Aangezien daarover geen waterdichte regels bestaan, werken wij met een reeks vuistregels die kunnen toegepast worden. Ten eerste weerhouden we de factoren met een eigenwaarde kleiner dan 1, ook wel bekend als de Kaiser-Guttmanregel 30. Deze regels is echter onvoldoende en zijn toepassing op factoranalyse controversieel (Wilson & Cooper 2008, Rietveld & Van Hout 1993). Daarom maken we ook gebruik van twee grafische test, de Cattell Scree Test en Horn’s Parallel Analysis (Wilson & Cooper 2008), waarvan de resultaten af te lezen zijn op onderstaand eigenwaardediagram (scree plot, Figuur 1). In de legende rechts bovenaan ziet men dat beide tests het voldoende aantal factoren op 3 schat. Het zijn bovendien ook de factoren die een eigenwaarde groter dan 1 hebben (zie Tabel 7).
30
Een eigenwaarde geeft de hoeveelheid door een factor verklaarde variatie aan. De redenering is dat een factor pas zinvol zal zijn als hij minstens evenveel variatie verklaart als één oorspronkelijke variabele. Aangezien de variabelen gestandaardiseerd zijn, is de variantie voor elke variabele 1 en zal een factor dus meer dan 1 moeten verklaren.
Figure 2: Eigenwaardediagram, Cattell's Scree Test, Horn's Parallel Analysis
Het ideale geval, waarin de a priori veronderstelde attitudinele dimensies netjes zouden samenvallen met de verkregen factoren, hebben we niet kunnen realiseren. De voor de hand liggende conclusie is dat de attitude van onze proefpersonen, misschien Italianen in het algemeen, tegenover regionale variëteiten en hun sprekers slechts uit drie basisdimensies bestaat; en op zich is daar niets mis mee. Hoewel in de literatuur enkele welbepaalde dimensies steevast terugkeren (social attractiveness, superiority, dynamism (Zahn & Hopper 1985)), betekent nog niet dat in alle categorieën of in alle landen men dezelfde impliciete criteria aanwendt om sprekers en talen te evalueren (Garrett 2005). 3.3.2. Interpretatie van de factormatrix Vervolgens bekijken we de factorladingen in Tabel 5. Dat zijn de correlatiecoëfficiënten tussen de waarden voor de oorspronkelijke, manifeste variabele en hun scores voor een bepaalde factor. Die scores zijn op hun beurt de afstanden tussen de observaties van die variabele en haar loodrechte projectie op de as van de factor (Speelman 2013). De factorladingen kunnen zowel positief als negatief zijn, maar steeds binnen het bereik [-1,1]. Manifeste variabelen die hoog laden voor een factor laten ons toe die factor te interpreteren en te benoemen. Concreet zullen we aan de hand van een set variabelen de drie attitudinele dimensies identificeren die in de vorige stap werden berekend.
F1: Speech Status
F2: Speaker Status
F3: Speaker Solidarity
Communalityscore
ISTRUZIONE
0.649
0.435
0.007
0.611
EDUCAZIONE
0.332
0.587
0.138
0.474
ASPETTO
0.337
0.457
0.189
0.387
MENTALITÀ
0.406
0.496
0.338
0.526
FIDUCIA
0.312
0.621
0.308
0.578
CONDISCENDENZA
0.155
0.582
0.226
0.414
ONESTA
0.281
0.666
0.245
0.583
MODESTIA
0.198
0.542
0.345
0.451
SIMPATIA
0.109
0.258
0.787
0.698
INTRATTENIMENTO
0.007
0.205
0.718
0.558
AMICIZIA
0.224
0.503
0.515
0.568
CORRETTEZZA
0.758
0.320
0.011
0.677
DIFFUSIONE
0.737
0.186
0.080
0.584
FAMILIARITÀ
0.516
0.162
0.218
0.340
CHIAREZZA
0.817
0.211
0.152
0.735
PIACEVOLEZZA
0.429
0.364
0.485
0.552
Tabel 5: Factorladingen per variabele per factor en communaliteitsscores per variabele; geel: >0.4, oranje: tussen 0.3 en 0.4; grijs (communality score): <0.5
Eigenwaarde Factor 1 (Speech Status) Factor 2 (Speaker Status) Factor 3 (Speaker Solidarity) Factor 4
Proportie verklaarde variatie
Cumulatieve proportie
8.9402827
0.211
0.211
2.2687596
0.197
0.408
1.1574069
0.138
0.546
0.8980228
Tabel 6: Eigenwaarden, en proporties verklaarde variaties door de factoren
Zoals uit de factormatrix in Tabel 5 al duidelijk blijkt, hebben we niet alle manifeste variabelen kunnen overhouden in ons model. Om de interpretatieve kracht van een factoranalyse te doen gelden is het vaak noodzakelijk de problematische variabele te verwijderen. In ons geval zijn dat de variabelen TIPICITÀ (KENMERKENDE), ESEMPLARITÀ ( VOORBEELDIGHEID), FORMALITÀ (FORMALITEIT), PRESTIGIO (PRESTIGE) en INVENTIVITÀ ( VINDINGRIJKHEID). De eerste werd geweigerd omdat de communaliteitsscore in een proefanalyse31 te laag bleef. Deze score is in feite de som van de kwadraten van de factorladingen per variabele voor de drie factoren onder beschouwing (Speelman 2013). Dat cijfer geeft de proportie variatie aan, in het totaal aantal observaties van de variabele, die door de drie factoren 31
We voerden een “zinloze” factoranalyse uit, in de zin dat een onrealistisch groot aantal factoren (9) werd gepostuleerd, enkel om te zien welke variabelen onvoldoende verklaard bleven.
verklaard is. Wij stellen een redelijk arbitraire doch vaak gebruikte score van 0.45 als grenswaarde om te bepalen of een variabele voldoende verklaard is. Scores tussen 0.40 en 0.45, in het donkergrijs, beschouwen als net voldoende hoog om te poneren dat de variabele behoorlijk verklaard wordt. De tweede en de derde variabelen werden weergehouden nadat bleek dat zij het hoogst aantal NA’s telden, i.e. hun Likertschalen werden respectievelijk 145 en 127 blanco gelaten. Variabelen vier en vijf werden ten slotte weggelaten vanwege hun hoge factorladingen op meerdere factoren. Om de interpretatie van een factor te vergemakkelijken is het immers aangewezen enkel factorladingen in beschouwing te nemen die telkens op maar één factor hoog laden. Van de 21 oorspronkelijke variabelen blijven er dus 16 over. Tussen donkerdere horizontale scheidingslijnen bevinden zich de variabelen die wij op voorhand in bepaalde attitudedimensies hadden geressorteerd, van hoog naar laag: Speaker Status, Speaker Integrity, Speaker Solidarity, Speech Status en Speech Attractiveness. Het zij opgemerkt dat door de verwijdering van de storende variabelen, het niet meer mogelijk werd om de twee subdimensies van Speech Status, namelijk Speech Norm en Speech Intelligibility, te onderscheiden. Omgekeerd heeft onze factoranalyse de dimensie Speaker Integrity op een vrij verrassende manier behandeld. Die wordt nu volledig samengenomen onder de tweede factor met de variabelen die we oorspronkelijk aan de dimensie Speaker Status hadden toegewezen. Onze veronderstelling dat we de integriteit van een spreker, de mate waarin we een persoon betrouwbaar en deugdzaam achten, grotendeels laten samenhangen met een vrolijk en grappig karakter (Speaker Solidarity), wordt niet gedeeld door de Italiaanse participanten. Waarden als eerlijkheid en trouw worden eerder als statuskenmerken gezien. Het gaat hoe dan ook om een serie persoonseigenschappen waarbij zowel status- als solidariteitsoverwegingen aan het werk zijn en dus geen eenzijdige toewijzing geforceerd kan worden. Aangezien de vier overblijvende talige statusvariabelen netjes voor de eerste factor hoog laden besluiten we die factor dan ook Speech Status te noemen. Voor ons onderzoek nemen we als cutoffwaarde 0.4 voor het bepalen of een variabele hoog laadt voor een factor (in het geel gemarkeerd) (Rietveld & Van Hout 1993). Behalve de vier bovenvermelde variabelen laden ook ISTRUZIONE (SCHOLINGSGRAAD), MENTALITÀ (MENTALITEIT) en PIACEVOLEZZA ( AANGENAAMHEID) hoog voor deze factor. De eerste twee variabelen laden echter ook hoog op de tweede factor. We hebben al vermeld dat variabelen die op meerdere factoren laden de interpretatie complexer maken en verwijderd dienen te worden. We maken hier evenwel twee uitzonderingen: de variabele ISTRUZIONE voegen we toe aan de Speech Status-factor vanwege de zeer hoge factorlading en de variabele MENTALITÀ brengen we onder bij de tweede factor, aangezien de factorlading voor de eerste factor, in feite redelijk arbitrair gekozen, slechts nipt de cutoffwaarde overstijgt. Voor de eerste variabele geldt bovendien dat zo’n classificatie verdedigbaar is in het licht van de overtuiging dat een correcte en klare uitspraak enkel verworven kan worden in het hoger onderwijs. Wat de variabele PIACEVOLEZZA betreft, kiezen we ervoor die apart te houden en bij geen enkele factor toe te voegen. Deze variabele laadt tamelijk hoog op de drie factoren, wat impliceert dat meerdere elementen een rol spelen om te bepalen of een regiolect mooi of aangenaam is en dat een eenduidige toewijzing aan één factor onrecht zou doen aan de interpretatie. Later zal duidelijk worden op welke manier we die terug opnemen in onze analyse.
De tweede factor die door de factoranalyse wordt verkregen noemen we Speaker Status. Zoals eerder gezegd is dit een dimensie waarin uiteenlopende variabelen clusteren, die wij in het aanvankelijke design als de fijnmazigere categorieën Speaker Competence en Speaker Integrity hadden geconstrueerd. Er zijn zelfs twee stellingen van de Solidarity-dimensie die hoog laden voor deze factor, namelijk MODESTIA ( BESCHEIDENHEID) en AMICIZIA ( VRIENDSCHAP). Achteraf gezien wijst de eerste variabele eerder op status dan op sociale aantrekkelijkheid en hadden we die niet als exponent van de solidariteitsdimensie mogen beschouwen. De verklaring voor de dubbele, quasi-identieke hoge factorladingen voor de tweede variabele is complexer. Voor het statement “Ik zou met deze persoon bevriend worden.” hebben de participanten bij hun evaluatie hoogstwaarschijnlijk twee verschillende motieven laten meespelen. Bevriend worden met een persoon kan immers zowel een op affectie als berekening gebaseerde actie zijn. Aangezien factoren enkel zinvol zijn wanneer minsten drie variabelen er hoog op laden, zijn we genoodzaakt AMICIZIA te scharen bij de derde factor. Die laatste dimensie valt samen met de variabelen, MODESTIA uitgezonderd, die ook wij eerst onder de naam Speaker Solidarity hadden gegroepeerd. Ten slotte bespreken we even kort de cijfers in Tabel 6. Naast de vermelding van de eigenwaardes, waarin we nogmaals onze keuze voor drie verklarende factoren bevestigd zien (de eigenwaarde van factor 4 duikt onder 1), beschrijft de tabel ook de afzonderlijke en cumulatieve proportie verklaarde variatie. Ons model slaagt erin 54,6% variatie te verklaren, wat een acceptabele score is. We verwijzen naar de bijlage voor grafische, en hopelijk verhelderende weergaven van de relaties tussen de factoren onderling.
3.4. Resultaten van de statistische tests In de vorige paragraaf heeft de factoranalyse ons zowel bevestigingen gegeven als verrassingen meegedeeld in verband met de attitudinele structuur van onze data. De koppeling moet nu gemaakt worden naar de regiolecten en de rest van de verklarende factoren, namelijk sekse, provincie, tv-zender en leeftijd. Dit deel kent een geleidelijke opbouw. Eerst maken we een verkennende analyse, vertrekkende vanuit rechtlijnige hypotheses en met behulp van redelijk eenvoudige statistische technieken (§3.4.1.), zodoende dat we een eerste grip krijgen op de attitudinele profielen van onze respondenten. Daarna zullen geavanceerdere technieken aangewend worden om het aanvankelijke beeld in detail te onderzoeken, in hoop nieuwe patronen te ontdekken. Daarbij doen we een beroep de bovengenoemde reeks verklarende factoren (§3.4.2.)
3.4.1. Verkennend onderzoek: beoordeling van de regionale variëteiten voor alle participanten Om te beginnen hebben we onderzocht hoe de verschillende regionale variëteiten zich verhouden ten opzichte van elkaar. Daarom voerden we enkele variantieanalyses uit met de respectievelijke gepaarde t-tests, telkens voor elke attitudinele dimensies. Variantieanalyse (analysis of variance, ANOVA) is een uiterst geschikte statistische test om de invloed te detecteren van een
categorische variabele bestaande uit meer dan twee waarden en om aan te geven of die beïnvloeding significant is. Wij maken daarenboven gebruik van een specifiek type variantieanalyse, namelijk one-way analysis of variance met within-subject factor (Rietveld & Van Hout 2005). Men spreekt ook van een repeated measure design, omdat op elke participant meerdere metingen worden uitgevoerd. De enige factor onder beschouwing is het regiolect, dat vier waarden telt, namelijk Florentijns, Milanees, Napolitaans en Romeins. Waar de verschillen tussen de attitudescores voor de regiolecten onderling zich precies bevinden, kan met een gepaarde t-test opgespoord worden. Het gebruik van boxplots, waarvoor we opnieuw naar de bijlages verwijzen, is een visuele verduidelijking van de manier waarop de regiolecten zich tegenover elkaar afzetten wat de specifieke dimensie betreft32. Het gebruikt significantieniveau is 0.05 en bijgevolg bespreken we de resultaten die een p-waarde lager dan 0.05 lieten optekenen of rond dat grenspunt liggen. Een belangrijke conditie waaraan voldaan moet worden, is dat de varianties tussen die scores per regiolect gelijk moeten zijn. Daarvoor maken we gebruik van een Bartlett-test. In deze eerste verkennende analyses wordt het fragment Standaarditaliaans weggelaten, omdat zulke variantieanalyses enkel zinvol zijn als de data gebalanceerd is, m.a.w. als het aantal observaties per waarde van de categorische variabele gelijk verdeeld is. Doordat we slechts één opname van de standaardtaal hebben laten horen, telt de waarde voor het Standaarditaliaans de helft minder observaties dan andere variëteiten, namelijk 208 in plaats van 416. Aan dat obstakel zal een mouw gepast worden door in de komende paragraaf regressieanalyses uit te voeren. In de literatuur rond taalattitudes tegenover dialecten en standaardtalen werd al meermaals aangetoond dat standaardtalen in het algemeen hoger scoren voor statusdimensies, maar laag voor solidariteitsdimensies, terwijl voor dialecten de situatie in spiegelbeeld is (Vandermeeren 2005). Dat de Italiaanse regionale tussentalen zich in het midden van het taalcontinuüm, staat ook buiten kijf (Berruto 1987, Cerruti 2009). Onze hypotheses volgen ook uit deze twee premissen. 1) De regiolecten waarvan de linguïstische afstand tot de standaardtaal als klein ervaren wordt, en waaraan door de sprekers ongeveer hetzelfde prestige wordt toegemeten als dat de standaardtaalsprekers, zullen hogere statusscores krijgen. Voor de Speaker Solidaritydimensie zullen die regiolecten wel een lagere score krijgen. Specifiek poneren we hierbij de stelling dat het Milanese Italiaans aan deze kenmerken zal voldoen (Galli de’ Paratesi 1977, 1985; Baroni 1983). 2) De regiolecten waarvan de linguïstische afstand tot de standaardtaal als groot ervaren wordt, en waaraan de sprekers niet hetzelfde prestige wordt toegemeten als dat van de standaardtaalsprekers, zullen lagere statusscores krijgen. Voor de Speaker Solidaritydimensie zullen die regiolecten wel een hogere score krijgen. Specifiek poneren we hierbij de stelling dat het Napolitaanse Italiaanse aan deze kenmerken zal voldoen (Galli de’ Paratesi 19711, 1985; Baroni 1983). 32
Boxplots worden opgebouwd aan de hand van mediaan en kwartielen. De statistische tests die wij zullen uitvoeren, gebruiken evenwel steeds het gemiddelde. Aangezien we hier te maken hebben met een grote steekproef en bovendien de dimensies een normale verdeling vertonen, vallen beide locatiematen grotendeels samen en hoeven we ons verder geen zorgen te maken.
Voor de dimensie Speech Status geeft de ANOVA-test aan dat de regionale afkomst van de spreker een zeer significante impact heeft op het prestige van zijn taalgebruik (p < 0.005). De gepaarde t-tests tonen echter aan dat het grootste verschil zich situeert tussen de beoordeling van het Romeinse Italiaans en het Napolitaanse Italiaans (p < 0.05). De eerste variëteit wordt significant lager beoordeeld voor deze attitudedimensie dan de tweede, terwijl tussen de andere regiolecten onderling geen noemenswaardige verschillen te bespeuren zijn. Het zij opgemerkt dat het Napolitaanse regiolect het hoogste gemiddelde scoort voor deze dimensie, wat in feite tegen onze verwachtingen ingaat. Eigenlijk valt het te betwijfelen of deze ANOVA toegepast mocht worden, aangezien de Bartlett-test een significante p-waarde laat optekenen (p < 0.01). Enige voorzichtigheid is dus gebaat bij de interpretatie van deze dimensie. We vinden een nog sterkere invloed van de regionale herkomst van de spreker wanneer de Speaker Status-dimensie in acht genomen wordt (p < 0.001). We merken twee significante verschillen op, aan de ene kant bij de beoordeling tussen het Florentijns en het Milanees(p <0.001) en aan de andere kant tussen het Romeins en het Milanees (p < 0.01). In beide gevallen wordt het Milanese Italiaans lager beoordeeld ten opzicht van die twee variëteiten. Het Napolitaanse Italiaans onderscheidt zich niet van de andere regiolecten en plaatst zich derdes op die schaal van sprekerstatus. Ditmaal geeft de Bartlett-test aan dat de varianties tussen de beoordeling per regiolect wel eens zouden verschillen (p < 0.1). Deze grenssignificante waarde verzwakt in zekere zin de geldigheid van onze interpretatie. De grootste verschillen tussen de variëteiten onderling merken we op wat betreft de dimensie Speaker Solidarity (p < 0.001). De Bartlett-test meldt ons geen significante verschillen op tussen de scores voor deze dimensie per regiolect, waardoor we kunnen overgaan tot een secure bespreking. In dit geval tekent zich een duidelijke tweedeling af tussen de centrumvariëteiten enerzijds, namelijk het Florentijns en het Romeins, die een significant positievere score krijgen en waarvan aangenomen wordt dat zij het sterkst aanleunen bij de standaard, en de twee eerder perifere regiolecten, het Milanees en het Napolitaans, waarin op het eerste zicht niet eenduidig is welke gemeenschappelijke kenmerken dezelfde attitude hebben uitgelokt. Het gaat bovendien om een significant negatievere beoordeling voor de laatste twee variëteiten. Het globale beeld dat hier naar voren komt (en waarvan Tabel 7 een samenvatting is), geeft aanleiding tot enkele beschouwingen die verrassend genoeg een heel andere richting wijzen dan wat we aanvankelijk als hypothese hadden gesteld. Speech Status Speaker Status Speaker Solidarity
Napolitaans >
Milanees
>
Florentijns
>
0.01986706
>
0.002632622
>
-0.03767616
>
Florentijns
>
0.05195511
>
Romeins
>
Romeins 0.02896151
Florentijns >
Romeins -0.1116892
>
Napolitaans
>
Milanees
>
-0.02477493
>
-0.1018232
Napolitaans >
Milanees
0.2977584 > 0.2235973 > -0.1027462 > -0.1845018 Tabel 7: attituderanglijsten per dimensie; in groen staan de regiolecten die significant hoger scoren in relatie tot de in het rood gemarkeerd regiolecten; per regiolect wordt de gemiddelde gestandardiseerde factorscore gegeven.
Ten eerste zien we dat onze proefpersonen niet de traditionele dichotomie tussen solidariteitsen statuskenmerken laten meespelen wanneer hun wordt gevraagd de sprekers van de desbetreffende regiolecten te evalueren: Florentijns en Romeins worden in beide gevallen hoger gewaardeerd dan het Napolitaans en het Milanees. Voor die speaker related perceptions volgt daaruit dat de traditionele complementaire attitudeprofielen, die wij in onze hypotheses uittekenden, niet langer volgehouden kunnen worden. In onze resultaten kunnen we namelijk niet stellen dat de minder prestigieuze variëteiten “can assume significant social capital in certain localized contexts” (Dragojevic, Giles & Watson 2013) en dat de prestigieuze variëteiten over het algemeen lager scoren voor de solidariteitsdimensie (Garrett 2010, Ryan et al. 1982). De functionele en affectieve differentiatie die de Italiaanse taalgebruikers normaliter instellen in hun zeer gevarieerd taallandschap, lijkt hier plaats te maken voor een gepolariseerde attitude. De Florentijnse en Romeinse sprekers worden over de hele lijn positief beoordeeld en de Milanese en Napolitaanse sprekers consequent negatief beoordeeld. Dat maakt de interpretatie van de resultaten des te complexer. Als we veronderstellen dat taalattitudes, zijnde cognitieve producten, ook een bepaalde reële stand van zaken weerspiegelen, welke “language preference patterns” (Ryan et al. 1982) kunnen dan een verklaring bieden voor de bovengeschetste situatie? Napolitanen (en Zuid-Italianen in het algemeen), die beschouwd kunnen worden als sprekers van een ondergeschikte taalvariëteit, lijken het eigen regiolect te stigmatiseren zowel als middel voor sociale cohesie als voor sociale mobiliteit. Daarmee positioneren onze respondenten zich in de prototypische situatie waarin “speakers […] acknowledge the superiority of the dominant group’s language variety with regard to social power as well for group solidarity values.” (Ryan et al. 1982: 9). Die verklaring wordt echter slechts aanvaardbaar als ook de vitaliteit van de eigen variëteit in het gedrang komt en er een language shift gaande is. De factoren die bepalend zijn voor de solidariteitswaarde van een regiolect, zijn precies die krachten die verantwoordelijk zijn voor de vitaliteit van dat regiolect en bijgevolg zal hun afwezigheid het gebruik van dat regiolect ernstig compromitteren. Dat lijkt ons, voor het geval van het Napolitaans, geenszins het geval te zijn. Volgens de laatste taaltellingen, uitgevoerd door het ISTAT (Istituto Nazionale di Statistica, Nationaal Instituut voor de Statistiek, 2007), spreekt 79,8% van de bewoners van Campanië uitsluitend Italiaans (36,5%) of zowel Italiaans als een lokaal dialect (43,3%). Binnen die eerste subgroep is het onwaarschijnlijk dat het Standaarditaliaans bedoeld wordt, aangezien die variëteit de facto door niemand wordt gesproken behalve professionele taalgebruikers (D’Achille 2010). Bij de andere groep bestaat de mogelijkheid dat die ogenschijnlijke tweetaligheid niet als een pure alternantie wordt ervaren – zoals de enquête ons suggereert33– maar als één complexe hybride entiteit, namelijk een regionaal gekleurd Italiaans. In beide gevallen kunnen we dus wel stellen dat bijna vier vijfde van de inwoners van Campanië een min of meer sterk gemarkeerde vorm van het Italiaans spreekt, wat incompatibel is met de vermeende agonie die aan deze variëteit zou toegeschreven worden vanuit het beschrijvingsmodel van Ryan et al. (1982). Het concept van ‘vitaliteit’ is op zich al
33
Het is in ieder geval riskant om het effectief taalgebruik te meten aan de hand van zelfgerapporteerd taalgedrag en vragen die polsen naar meningen en intenties, zeker als het gaat om ingrijpende taalveranderingen in wording. Ook Benincà (1994) komt tot dezelfde kritiek: “una percentuale di parlanti ritiene e dichiara di parlare italiano e invece quello che parla è un dialetto o una koinè dialettale regionale, altri d’altra parte pensano di parlare dialetto, [...] e invece parlano una varietà regionale di italiano del tutto accettabile (Benincà 1994: 157).
voorwerp geweest van kritiek, met als voornaamste bezwaar de hoogst subjectieve manier waarmee die bepaald zou worden (Gallois 2013). Ten tweede merken we op dat het prestige van de variëteiten niet overeenkomt met het prestige van hun sprekers, maar dat de verhoudingen bijna compleet gespiegeld zijn. Op het eerste zicht staat ook deze bevinding haaks op de gevestigde opvattingen over attitudes, namelijk dat prestigieuze variëteiten niet intrinsiek correcter of waardevoller zijn dan minder prestigieuze lecten, maar dat hun prestige een projectie is van de hogere sociale positie van de sprekers en de waarden die hen indiceren zoals dynamisme, competentie enz. (Giles & Niedzielsky 1998, Dragojevic et al. 2013, Ryan et al. 1982). Het lijkt alsof onze proefpersonen volledig in tegenstrijd met dat sociaal-psychologisch axioma te handelen, door een variëteit tot potentiële taalnorm te verheffen terwijl haar sprekers niet die hogere sociale positie bekleden die noodzakelijk is voor de legitimering van een dergelijke verandering. Aangezien er weinig reden is om te twijfelen aan de besproken stelling, vermoeden we dat er wellicht belangrijkere beïnvloedende factoren zijn die we op dit moment nog niet in kaart hebben gebracht34. Daarom wenden we ons tot een meer geavanceerde statistische techniek, namelijk linear mixed-effects models.
3.4.2. Gedetailleerd onderzoek: analyse met mixed-effects model Bij het afnemen van een matched guise experiment heeft de onderzoeker doorgaans geen volledige controle over de respondenten. In ons geval wordt die kwestie pertinenter omdat we grote groepen ondervroegen waarbij we de samenstelling niet op voorhand konden vastleggen en de voorkeuren niet op voorhand weten. Aangezien onze data enkele onevenwichtigheden bevat, kunnen variantieanalyses niet altijd toegepast worden. Daarom schakelen we over naar regressieanalyses, waarvoor een gebalanceerd design geen voorwaarde is. De regressieanalyse die wij zullen uitvoeren moet bovendien rekening houden met wat men fixed en random effects noemt. De eerste zijn de onafhankelijke variabelen die de attitudes zouden beïnvloeden, de tweede de individuele participanten. Ook bij de ANOVA’s maakten wij impliciet het onderscheid tussen deze twee categorieën. Het zou immers compleet nutteloos zijn om de afzonderlijke proefpersonen over één kam te scheren met de rest van de variabelen (Baayen 2008). Deze regressieanalyse, mixed-effects model genaamd, laat ook toe het Standaardtaalfragment toe te voegen aan de analyse, wat niet mogelijk was bij de variantieanalyse. We bouwen verschillende regressiemodellen per attitudedimensie, inclusief een model voor de variabele PIACEVOLEZZA ( AANGENAAMHEID), die wij aan geen enkele attitudedimensie hadden toegevoegd opdat een aparte analyse van de dimensie speech attractiveness uitgevoerd zou kunnen worden.
34
Hoewel de hiërarchische opstelling in Tabel 7 een duidelijke omkering doen vermoeden, merken we op dat de gemiddelde gestandaardiseerde scores niet erg ver van elkaar liggen. Nochtans geven gepaarde t-test op de twee statusscores voor elk regiolect, behalve het Napolitaans, significante verschillen aan.
3.4.2.1.
Regressiemodel ‘speech status’
Voordat het regressiemodel voor de speech status-dimensie werd gebouwd, werden alle nietsignificante factoren en interacties uit het model verwijderd. De variabele ‘geslacht’ werd daarbij weerhouden. De automatische backward elimination procedure vond wel twee significante interacties, zowel ‘REGIOLECT × GENERATIE’ en ‘TV-ZENDER × GENERATIE’. Omwille van ons onderzoek, zullen we het nalaten de tweede interactie te bespreken en ons concentreren op de eerste.
Figure 3: interactiegrafieken voor 'REGIOLECT × GENERATIE' (speech status)
GENERATIE REGIOLECT
oud [46-76] mid [24-45] jong [18-23]
Standaard
0.3248 (**)
0.3082 (*)
0.1204
Milanees
-0.1522
0.2562 (*)
-0.1057
Florentijns
0.0447
0.0656
-0.2000 (**)
Romeins
-0.0723
0.1108
-0.2881 (***)
Napolitaans
0.2256 (*)
0.1421
-0.2303 (***)
Tabel 1: least square means voor de dimensie speech status per *= significant; **= zeer significant; ***= extreem significant
REGIOLECT per GENERATIE;
Uit de bovenstaande tabel is het mogelijk al bepaalde tendensen waar te nemen. De opgelijste waarden zijn de least square means die we aan de hand van het regressiemodel hebben verkregen. Deze gemiddeldes zijn de door het model voorspelde populatiegemiddelden, rekening houdend met alle predictoren in het model (Lenth 2014). We zullen onze discussie beperken tot de resultaten die onder het significantieniveau α=0.05 vallen. De oudste leeftijdscategorie geeft bijvoorbeeld significant positieve scores aan zowel het Standaarditaliaans als het Napolitaans voor de attitudecomponent, terwijl de middelste groep het Milanees als regiolect beschouwd dat het dichtst in de buurt van de standaardtaal komt. Bij de studenten valt ten eerste op dat de beoordelingen veel lager zijn dan de andere groepen, en dat bovendien het Florentijns, Romeins en Napolitaans significant negatieve scores krijgen voor deze dimensie. Het feit dat het Milanese regiolect dan weer niet significant laag gewaardeerd wordt, kan ook een indicatie zijn van het stijgende prestige van deze variëteit ten opzichte van de anderen bij deze generatie. De significante interacties tussen de oudste en de middelste categorie zijn te zien bij de behandeling van het Milanees en het Napolitaans. De oudste proefpersonen beoordelen het Milanees significant lager dan de standaardtaal, het Napolitaans en ook het Florentijns, terwijl bij de middelste groep tussen die twee variëteiten geen verschil op te merken valt. Ook wordt het Napolitaans, volgens de oudste leeftijdscategorie, prestigieuzer beschouwd dan het Romeins. De vergelijking tussen de studenten en de oudsten levert significante interacties opnieuw wat betreft het Milanese en het Napolitaanse regiolect. Jongeren vinden namelijk het Milanees, in vergelijking met het Florentijns, Romeins en Napolitaans, prestigieuzer dan de oudste respondenten. Tot slot beoordelen de ouderen het Napolitaans significant hoger dan het Romeins, terwijl bij de studenten beide regiolecten gestigmatiseerd worden zonder onderscheid. We herhalen even de markantste feiten voor de dimensie speech status: ouderen hebben een veel positievere attitude tegenover het eigen regiolect, i.e. het Napolitaanse Italiaans, en stigmatiseren het Milanese Italiaans voor deze component. Jongere en respondenten van middelbare leeftijd vertonen een gelijkaardig hiërarchisch patroon, behalve dat de laatste groep het Milanees bijna gelijkstelt met de standaardtaal.
3.4.2.2.
Regressiemodel ‘speaker status’
Figure 4: interactiegrafiek 'REGIOLECT × GENERATIE' (speaker status)
GENERATIE REGIOLECT
oud [46-76] mid [24-45] jong [18-23]
Standaard
0.3517 (**)
Milanees
-0.0986
0.0355
Florentijns
0.0912
0.2765 (**)
-0.1638 (*)
Romeins
0.0414
0.2991 (**)
-0.1525 (*)
Napolitaans
0.2434 (*)
0.2369 (*)
0.1901
-0.1987 (*) -0.2617 (***)
-0.3792 (***)
Tabel 2: least square means voor de dimensie speaker status per per GENERATIE; *= significant; **= zeer significant; ***= extreem significant
REGIOLECT
Voor de dimensie speaker status werden dezelfde significante interacties overgehouden als in de vorige analyse, namelijk ‘REGIOLECT × GENERATIE’ en de weinig zinvolle ‘TV-ZENDER × GENERATIE’. Uit Tabel 9 blijkt dat de sprekers van het Standaarditaliaans significant positieve scores krijgt van de twee oudste categorieën, en –verrassend genoeg– een negatieve score van de jongste leeftijdsgroep. Een vergelijking met de vorige dimensie leidt tot een vreemde constatatie: terwijl het beoordelingspatroon van de oudste generatie in beide gevallen gelijkloopt, merken we voor de overige twee groepen dezelfde tegenstrijdige evaluaties als vastgesteld bij de ANOVAtests. Volgens de proefpersonen van middelbare leeftijd zijn het de Florentijnen en de Romeinen die prestige genieten, terwijl de Milanezen een veel lagere score krijgen dan wanneer de attitude gericht is naar hun regiolect. Ook de jongeren delen dat oordeel over de Milanese sprekersgroep,
met zelfs een significant negatieve attitude tegenover hen. Tussen de beoordeling van het Napolitaans en het Milanees is er een significant effect van de generatie: jongeren vinden de sprekers van beide regiolecten weinig aanzien waard (cfr. zeer significante negatieve scores), maar voor de Napolitaanse sprekers zijn ze nog strenger. Bij de oudste respondenten tekent zich een groter verschil af, in vergelijking met de middelste en de jongste groep, tussen het hogere prestige van de standaardtaalspreker en de Napolitaan enerzijds en het Florentijns en het Romeins anderzijds én zijn de hiërarchieën bijna volledige gespiegeld.
3.4.2.3.
Regressiemodel ‘speaker solidarity’
Figure 5: interactiegrafie 'REGIOLECT × GENERATIE' (speaker solidarity)
GENERATIE REGIOLECT
oud [46-76]
mid [24-45] jong [18-23]
Standaard
-0.1281
Milanees
-0.3583 (***)
Florentijns
0.2283 (*)
Romeins
0.1409
0.5453 (***)
0.2598 (***)
Napolitaans
0.1548
0.0785
-0.3607 (***)
-0.2496
-0.7609 (***)
-0.2845 (**)
-0.1645 (*)
0.2239 (*)
0.1662 (*)
Tabel 3: least square means voor de dimensie speaker solidarity per per GENERATIE; *= significant; **= zeer significant; ***= extreem significant
REGIOLECT
Het regressiemodel van de dimensie speaker solidarity weerhoudt niet alleen de interactie 'REGIOLECT × GENERATIE', maar ook ‘REGIOLECT × TV-ZENDER’. We beginnen met de bespreking
van de eerste interactie. Eerst en vooral constateren we dat de score voor het Standaarditaliaans in bijna alle gevallen keldert. Het is echter bij de jongeren dat het significant negatief beoordeeld wordt. De variëteit die als absoluut dieptepunt geldt voor zowel de oudste als middelste leeftijdscategorie is het Milanese regiolect, dat overigens ook bij de jongsten een negatieve score krijgt. Een significant positieve score op de solidariteitsdimensie wordt door de oudsten aan het Florentijns gegeven, terwijl de groep van middelbare leeftijd en de jongste proefpersonen zowel de Florentijnse als de Romeinse spreker sympathiek vinden. De Napolitaanse spreker krijgt een speciale behandeling: de oudste noch de middelste categorie beweren echt positief te staan tegenover die groep sprekers en de jongsten geven die zelfs een significant negatieve score. Op de interactiegrafiek ziet men dat het evaluatiepatroon van de twee jongste leeftijdscategorieën voor het Romeins, Napolitaans en Standaarditaliaans bijna gelijk is en dat het grootste verschil zich bevindt bij de beoordeling van het Milanees. De middelste groep verschilt dan voornamelijk van de oudste groep wat betreft de solidariteitsscore voor het Romeins en het Milanees: de eerste variëteit beoordeelt die groep hoger dan het Milanees, vergeleken met de scores van de oudste generatie.
Figure 6: interactiegrafiek 'TV-ZENDER × REGIOLECT' (speaker solidarity)
ZENDER REGIOLECT
Mediaset
Rai
Standaard
-0.3146 (***)
-0.4445 (***)
Milanees
-0.1466 (*)
-0.3916 (***)
Florentijns
0.1921 (**)
0.2201 (**)
Romeins
0.2936 (***)
0.3371 (***)
Napolitaans
-0.0604
-0.0245
Tabel 4: least square means voor de dimensie speaker solidarity per regiolect per zender; *= significant; **= zeer significant; ***= extreem significant
De interactie 'REGIOLECT × TV-ZENDER' heeft, met een p-waarde van 0.03895, op zich niet zo’n grote verklarende impact op het model en dus de attitudescores. Het verwondert dan ook niet dat er slechts vier significante interactietermen zijn. Wat interessanter is en wat de interactiegrafiek ook duidelijk laat zien, is de verschillende behandeling van het Milanese regiolect per opgegeven zender. De Milanese spreker wordt namelijk slechter beoordeeld op de solidariteitsdimensie dan de Romeinse, Florentijnse en Napolitaanse sprekers wanneer de proefpersoon beweert meer naar de nationale omroep te kijken dan naar de private zenders van Silvio Berlusconi. Bij de standaardtaal zien we ook een verschillende score, maar die is niet significant verschillend ten opzichte van de andere variëteiten. Aan deze resultaten zullen we in ieder geval later meer woorden wijden in een concluderende paragraaf. 3.4.2.4.
Regressiemodel ‘speech attractiveness’
Figure 7: interactiegrafiek 'REGIOLECT × GENERATIE' (speech attractiveness)
GENERATIE REGIOLECT
oud [46-76] mid [24-45] jong [18-23]
Standaard
0.2044
-0.0377
-0.3529 (***)
Milanees
-0.4129 (***)
-0.0751
-0.2072 (*)
Florentijns
0.0550
0.2467 (*)
0.1614
Romeins
0.0527
0.3521 (**)
-0.0301
Napolitaans
0.1118
0.0634
-0.4782 (***)
Tabel 5: least square means voor de dimensie speech attractiveness per *= significant; **= zeer significant; ***= extreem significant
REGIOLECT per GENERATIE;
Ook bij het regressiemodel voor de speech attractiveness-dimensie vinden we de significante interactie ‘regiolect × generatie' terug. We wijzen erop dat deze component gelijk is aan de variabele die de participanten moesten evalueren en dus niet samengesteld werd als de vorige attitudedimensies. Ten eerste merken we op dat er bijna geen tegenstrijdige attitudes zijn vergeleken met de solidariteitsscores voor de sprekers. Enkel de beoordeling van de jongste groep voor het Romeinse regiolect en de Romeinse spreker vertoont een opvallende contradictie, maar echt harde bewijzen zijn hier niet voor. Het Milanese accent blijkt opnieuw voor de oudste het minst aangename, terwijl de jongere groep zowel de standaardtaal, het Napolitaans en het Milanees significant laag beoordelen. De middelste groep is ook deze keer toleranter: er zijn enkel significant positieve scores en wel voor het Florentijnse en het Romeinse regiolect. De interactiegrafiek laat ons zien dat de waardering voor de standaardtaal en het Napolitaans stijgt met de leeftijd van onze proefpersonen en dat de twee regiolecten van de laagste posities in de hiërarchieën opklimmen tot de top.
3.5. Discussie van de resultaten Het is duidelijk gebleken dat de attitudes die wij vergaard hebben het best door verschillen in leeftijdscohorten verklaard kunnen worden. In het licht van de standaardiserings- en destandaardiseringstendensen in het Italiaanse taallandschap is het belang van dit explanans niet te onderschatten. Welke patronen zijn dus aan het licht gekomen? Onze oudste proefpersonen, i.e. ouder dan 46 (met een maximum van 76 jaar), hebben een uitgesproken mening over de standaardtaal, het eigen regiolect en het Milanees. De eerste twee variëteiten worden door hen significant hoog beoordeeld op de statusdimensie, terwijl de laatste significant laag scoort op de solidariteitsdimensie. Het Standaarditaliaans oefent op deze groep nog steeds een groot prestige uit, wat niet hoeft te verbazen, aangezien deze groep is opgegroeid in een periode (ruwweg de jaren ’60, ’70 en ’80) waarin lokale talen ondervertegenwoordigd waren in de media of zelfs nog openlijk gestigmatiseerd werden, telkens in het voordeel van de standaardtaal (cfr. literatuurstudie). De status van het Napolitaanse Italiaans en zijn sprekers
kan als volgt verklaard worden. Napels is decennialang het referentiepunt geweest, op alle vlakken, voor wie de grenzen niet verder reikten dan de eigen streek en heeft als dusdanig lange tijd een grote aantrekkingskracht uitgeoefend. Het verwondert ons dus niet dat voor de oudsten het Napolitaans gekleurde regiolect de praktisch hoogst haalbare norm is, in tegenstelling tot het Standaarditaliaans, dat nog steeds een virtuele realiteit is voor de overgrote meerderheid van de bevolking. De sterke gebondenheid aan de eigen regio vertaalt zich dan ook in een zeer negatieve solidariteitsscores voor de geografisch en linguïstische verste groep, namelijk de Milanezen: er is geen enkele nood en ook geen wil om zich te identificeren met een compleet vreemd geachte sociale identiteit. De middelste leeftijdscategorie, die proefpersonen tussen de 24 en 45 jaar verzamelt, vertoont zowel gelijkenissen als verschillen met de vorige groep. Het valt op hoe de twee centrumvariëteiten, het Florentijns en het Romeins, uitgesproken positief worden gewaardeerd op de solidariteitsdimensie. Het is niet gemakkelijk hiervoor een verklaring te geven, maar wij vermoeden dat deze houding het resultaat is van een compromis tussen loyauteit aan de eigen taalgemeenschap en de hoop om niet gestigmatiseerd te worden als zuiderling. Motieven van zuiver geografische aard zouden wel eens een niet onbelangrijke rol kunnen spelen in de perceptie van deze groep. Het is eveneens opvallend dat deze leeftijdsgroep de enige is die het Milanees en de Milanese spreker een positieve score geeft op de statusdimensie. Dat gedrag past volgens ons goed in die, misschien wel onuitgesproken wens om zich los te maken van gestigmatiseerde taalgemeenschap waartoe die groep behoort, aansluiting te zoeken bij de economisch sterkere groep en uiteindelijk haar taalnormen te accepteren. Ten slotte merken we ook op dat deze categorie het meest tolerant staat tegenover alle variëteiten en bovendien voor alle attitudedimensies. De jongste groep, die bijna volledig samenvalt met de groep universitaire studenten, beoordeelt dan weer de meerderheid van de regiolecten, zowel wat betreft status- als solidariteitskenmerken, significant negatief. Het Napolitaanse Italiaans krijgt bijvoorbeeld op beide dimensies zeer negatieve beoordelingen. Hierbij is het vooral zinvol om een vergelijking te maken met de attitude die de oudste groep tegenover dit regiolect had. Terwijl de ouderen de geluidsfragmenten beschouwden als voorbeelden van wat volgens hen het best de norm benaderde, wijzen de jongeren deze mogelijkheid compleet af. Het verschil in gepercipieerde regionale gemarkeerdheid zou daarbij een rol kunnen spelen: te groot voor de jongeren opdat het als aanvaardbare norm zou kunnen fungeren, laag genoeg voor de ouderen om dezelfde reden. Het valt op dat de enige variëteiten die niet significant laag scoren voor de statusdimensie het Standaarditaliaans en het Milanese Italiaans zijn. Dat is dan weer een betekenisvolle vaststelling, dat ons in de richting kan wijzen van een toegenomen aanvaarding van het Milanese regiolect als de nieuwe norm in de ogen van de jongste generatie. Aan de reflecties over de leeftijdsgebonden attitude tegenover het Milanees, kunnen we een tweede verklarende dimensie toevoegen, namelijk de rol van de media. Zowel in geval men naar de openbare omroep kijkt, waar voornamelijk centrale regionale accenten vertegenwoordigd zijn, als naar de privézenders, waarvan de opnamestudio’s zich grotendeels in de Milanese periferie bevinden, scoren de Milanese sprekers significant laag wat betreft solidariteitskenmerken. Toch merken we dat wie meer naar de Mediasetzenders kijkt en bijgevolg meer blootgesteld is aan dat
accent, een zachtere negatieve houding laat uitschijnen dan wie naar de Rai kijkt. Daarbij spelen waarschijnlijk motieven van ideologische en politieke aard, maar het is in ieder geval niet mogelijk om hierin een causaal verband te zien. Kijken we naar bepaalde zenders omdat ze meer zichtbaarheid geven aan sprekers waarmee wij ons willen identificeren of is die vereenzelviging een gevolg van het feit dat we geneigd zijn trouw te blijven aan zenders die onze waarden weerspiegelen?
3.6. Evaluatie van de verbal guise experiment We sluiten deze sectie af met een evaluatie van het experiment en we controleren of onze keuzes bij het ontwerp het gehoopte resultaat hebben voortgebracht. Enkele hindernissen vonden we bij de verschillende experimentafnames, die niet allemaal even succesvol kunnen beschouwd worden. De grootste moeilijkheden troffen we aan bij de eerste twee groepen in de theaterzaal. Van de ongeveer zestig uitgedeelde bundels per avond werd ongeveer de helft correct en volledig ingevuld. De hoogste responsgraad werd dan weer behaald bij de derde sessie en bij de studenten, waar slechts twee studenten de opdracht hebben verzuimd. Enkele belangrijke lessen kunnen getrokken worden uit deze vaststellingen. De betreurde, maar vaak voorkomende keuze om oudere respondenten niet op te nemen als proefpersonen kan in dit licht niet echt meer kwalijk genomen worden. Zich echter neerleggen bij deze hindernis mag dan weer geen oplossing zijn. Integendeel, het zou het startpunt moeten zijn van een reflectie op en een verbetering van de methodes om attitudes te onderzoeken bij hen waar een traditionele aanpak problemen oplevert (Ryan et al. 1988). Het grootste probleem wordt gevormd door de duur van het gehele experiment. Men neemt over het algemeen als vuistregel dat zo’n experiment niet meer dan twintig minuten de aandacht van de proefpersoon mag eisen. Ons experiment duurde exact twintig minuten, maar dat bleek voor velen al te lang te zijn, zeker als we bedenken dat het experiment uit twee delen bestond en het tweede deel pas in de laatste minuten werd uitgelegd. Het gevolg was dat zij die het verbal guise-deel hadden doorstaan, vaak niet de moeite meer konden opbrengen om ook de FRE uit te voeren, wat resulteerde in twee, soms één adjectief per variëteit, in plaats van de gevraagde drie. We hadden de lengte van het verbal guise-deel kunnen halveren door één stimulusfragment per variëteit te laten horen. Het gebruik van stimulusparen, waarbij twee fragmenten van dezelfde variëteit door twee personen wordt ingesproken, is echter een fundamentele controlemaatregel die in een VGE wordt ingebouwd. In tegenstelling tot een MGE is de uniformiteit van de fragmenten in een VGE niet verzekerd. Toonhoogte, spreektempo en nog andere storende beïnvloedende factoren die men juist dankzij de MGT vermijdt, heeft men in een VGE veel minder onder controle. Daarbij bestaat het risico dat die storende factoren een grotere rol zullen spelen bij de evaluatie door de proefpersonen dan de regionale variabiliteit die de onderzoeker wil bestuderen. Het voordeel dat de MGT biedt, vormt in feite het nadeel van de VGT. Dit obstakel kan op de volgende wijze opgelost worden. Door twee stimuli in plaats van één stimulus per variëteit te laten beluisteren kan men nagaan of de twee sprekers weldegelijk beoordeeld werden op basis van hun regionaal accent. Wanneer tijdens de analyse blijkt dat de oordelen voor de schalen van de twee fragmenten gelijk zijn, dan bewijst men dat die beïnvloedende factoren geen rol hebben gespeeld bij de evaluatie, of tenminste minder bepalend zijn geweest
dan de regionale gemarkeerdheid. Deze kleine ingreep maakt de VGT dan ook aantrekkelijker dan de MGT, dat bovendien om praktische redenen (cfr. supra) moeilijk te operationaliseren is. Een echt valabel alternatief voor het VGE, rekening houdend met de tijdsdruk en de bovenvermelde methodologische kwesties, was m.a.w. niet mogelijk voor ons onderzoek. Dat houdt natuurlijk ook in dat het succes van een VGE sterk afhankelijk is van de keuze van de fragmentenparen en bijgevolg de gelijkenissen tussen de stimuli van één variëteitenpaar. Zoals eerder vermeld, kunnen de scores voor de stimuliparen ons vertellen of we succesvol de aandacht van de respondenten hebben gericht op de regionale afkomst va de spreker en niet zijn idiosyncratische spreekstijl. De cijfers in Tabel 12 stellen de gemiddelde gestandaardiseerde scores voor voor alle variabelen die hoog laden voor de drie factoren, i.e. de attitudinele dimensies. In Tabel 12 staan de p-waardes die we verkregen hebben door t-tests voor gepaarde groepen uit te voeren op de scores uit Tabel 11. Daarmee kunnen we inderdaad bevestigen of ontkennen of de fragmenten gelijkwaardig werden beschouwd en bijgevolg of hun keuze gerechtvaardigd is.
Standard Milano 1 Milano 2 Firenze 1 Firenze 2 Roma 1 Roma 2 Napoli 1 Napoli 2
Speech Status Speaker Status
Speaker Solidarity
0.2614209
0.08319322
-0.4435005
0.1902717
0.006643987
-0.2993939
-0.1831758
-0.2092165
-0.07243955
-0.1309132
0.02563661
0.1768866
0.05601793
0.07814201
0.2696211
-0.2241437
0.05129329
0.5143466
0.0007653785
0.006741379
0.07681669
-0.1739195
-0.147567
-0.1709087
0.212713
0.09986829
-0.03558109
Tabel 11: Factorscores per geluidsfragment per attitudinele dimensie; een groene kleur wijst op hoge factorscores, een rode kleur wijst op lage factorscores
Milano 1 Milano 2 Firenze 1 Firenze 2 Roma 1 Roma 2 Napoli 1 Napoli 2
Speech Status Speaker Status
Speaker Solidarity
<0.001
<0.001
<0.001
<0.01
0.482
0.213
<0.001
0.4376
<0.001
<0.001
<0.001
<0.05
Tabel 12: P-waardes voor gepaarde t-test tussen de factorscores van fragmentenparen; gele p-waardes blijven significant na Bonferroni-correctie (α α =0.004), rode p-waardes zijn niet significant of grenssignificant na Bonferroni-correctie.
De enige sprekers die volledig gelijkwaardig worden beoordeeld (in technische termen: waarvan de gemiddeldes voor de verschillende factoren niet significant of slechts grenssignificant
verschillen) zijn de Florentijnse sprekers. De grootste en meest systematische discrepanties zien we bij het Milanese fragmentenpaar, dat de meeste significante p-waardes laat optekenen voor elke dimensie. De Napolitaanse sprekers worden op zich ook zeer verschillend geëvalueerd, ware het niet dat de Bonferroni-correctie de p-waarde voor de dimensie Speaker Solidarity nietsignificant maakt. Ten slotte worden de Romeinse sprekers enkel gelijk beoordeeld voor de dimensies Speaker Status. Ondanks onze inspanningen om gelijkwaardige fragmenten te selecteren voor ons onderzoek, wat een noodzakelijke voorwaarde is voor het succes van het hele VGE, blijkt uit de cijfers in Tabel 8 dat we niet geslaagd zijn in onze opzet. Blijkbaar hebben andere paralinguïstische, prosodische of linguïstische kenmerken van de opnames, die we over het hoofd hebben gezien, zwaarder meegeteld bij het invullen van de evaluatieschalen. Strikt genomen zou het niet helemaal correct zijn om statistische tests uit te voeren op stimulifragmenten die samengenomen worden op basis van hun regionale afkomst, aangezien het regionale accent in de meerderheid van de gevallen door de proefpersonen niet erkend wordt als belangrijkste gemene deler. De factorscores uit Tabel 11 vertellen ons dat er waarschijnlijk grotere gelijkenissen zijn tussen de beoordelingen van de geluidsopname “Milano 2” en “Napoli 1” dan binnen Napolitaanse of Milanese paren. Te weten komen welke elementen ervoor hebben gezorgd dat fragmenten “Milano 2” en “Napoli 1” ongeveer gelijk beoordeel werden, is nu bijzonder moeilijk achter te halen. Bij het herbeluisteren van de fragmenten valt ons op –maar dat is helaas een zeer subjectieve indruk– dat die twee rustiger en trager worden ingesproken, met hier en daar wat meer aarzelingen dan hun zusteropnames “Milano 1” en “Napoli 2”. In hun studie naar attitudes tegenover tussentaal in Vlaanderen creëerden Impe & Speelman (2007) een ‘vlotheidsindex’ 35 om een overzicht te houden van stemkwaliteit van de sprekers. We bouwden ook zo’n index op, maar kwamen tot de vaststelling dat de fragmenten die slechter werden beoordeeld de hoogste vlotheidsindexen hebben. Deze paradoxale bevinding strookt niet met talloze onderzoeken waarin geconstateerd wordt dat “speakers who are hesitant (Lay & Burron 1968), or whose speech contains a relatively high number of speech nonfluencies (such as repetitions and vocalized pauses) are perceived less favourably, particularly with regard to competence, than more fluent speakers (Miller & Hewgill 1964, Sereno & Hawkins 1967, McCroskey and Mehrley, 1969)” (Giles 1975: 5). De oorzaak van de divergerende beoordelingen blijft dus in nevelen gehuld. Misschien heeft de inleiding aan het experiment, waarin we de fictieve samenwerking met de Rai uitlegden, de participanten heel wat schadelijke vooroordelen losgeweekt. Door de enquête in verband te brengen met de keuze van een radiopresentator, is het mogelijk dat velen automatisch beter zijn gaan luisteren naar specifieke stemkwaliteiten van de sprekers, wat we ten allen tijde wilden vermijden. Deze opmerking houdt verband met een meer algemeen problematiek, namelijk dat men in zulk onderzoek te vaak de impact van de situationele context onderschat waarin het experiment wordt afgenomen. Hoewel de ervaring dat “listeners’responses are mediated by their attempts to attribute motives as to why speakers soundat that time as they do” (Ryan et al. 1988: 35
“[…] het verschil tussen het totale aantal woorden van het fragment en de som van alle “niet-vlotte” elementen. Uit dat resultaat werd tenslotte de percentuele verhouding met het totale aantal woorden van het fragment berekend.” (Impe & Speelman 2007: 117)
1075) natuurlijk en herkenbaar zijn voor de onderzoeker, toch is de omgang daarmee hoogst problematisch. Het is heel onwaarschijnlijk dat het probleem te wijten is aan het feit dat de participanten de regionale afkomst van de door ons geselecteerde geluidsopnames niet hebben herkend, aangezien onze eerste pilootstudie geruststellende resultaten gaf daaromtrent. Alle sprekers waren representatief voor de Italiaanse variëteit gesproken in de desbetreffende regio’s. Dat sluit echter niet uit dat andere kenmerken saillanter zijn geweest voor onze proefpersonen, wat niet in onze pilootstudie werd gepolst. Het moet bovendien gezegd worden dat er objectievere methodes zijn om de regionaliteit van een spreker te bepalen, die wij door tijdsgebrek niet hebben kunnen aanwenden. We hadden bijvoorbeeld een dialectgraad kunnen berekenen, waarmee in elk fragment het percentage typische dialectkenmerken bepaald kon worden (Impe & Speelman 2007). Adank, Van Hout, en Van de Velde (2007) gaan een stap verder en doen een beroep op klinkerformanten. Maximale controle kan men realiseren door manipulatie van de belangrijkste regionale fonetische kenmerken met behulp van een spraaksynthesizer, in het kielzog van Graff, Labov en Harris (1986). Deze verregaande maar minutieuze ingreep zou toelaten een volwaardig MGE te construeren, maar kon moeilijk bewerkstelligd worden voor ons onderzoek, alweer wegens tijdsdruk. De van oudsher geformuleerde om “not only detailed, linguistic and acoustic analyses of speech samples so as to relate specific language features to particular language attitudes, but also proper validation of authenticity by local dialectologists and independent samples of “naive” listeners” (Ryan et al. 1988) na te streven, kon slechts ten dele vervuld worden. Ondanks de kritieke punten in het onderzoekdesign, en voor het welslagen van de studie niet op het spel te zetten, hebben we er toch voor gekozen de a priori bepaalde fragmentenparen als effectieve stellen te beschouwen voor de verdere analyse. Daarbij moet men steeds alert zijn en dienen onze verklaringen en interpretaties met fluwelen handschoenen aangepakt te worden. Dat de regionale afkomst van de spreker niet als fundamentele variabele werd erkend, betekent niet dat de uitgelokte attitudes an sich automatisch hun waarde verliezen. Het komt erop aan te onderzoeken welke (para)linguïstische variabelen ervoor zorgen dat paren of clusters van fragmenten zichtbaar worden. Het perspectief zou in ieder geval omgekeerd zijn: niet de vraag hoe goed de attitudes van onze respondenten op onze a priori-variabele fitten, maar wel welke variabelen de variatie in onze data het best kunnen structureren36.
36
De oproep om niet slechts één of één type kenmerk te bestuderen, maar attitudeonderzoek te voeren op basis van multivariabele stimulifragmenten (“studies […] which vary orthogonally different speech characteristics” (Ryan et al. 1988)) kan in die zin als een aanmoediging beschouwd worden in die richting.
4. De free response experiment 4.1. Bespreking van theoretische en methodologische kwesties van het FRE In tegenstelling tot de nauwgezette en tijdrovende voorbereiding van een matched guise experiment, kan men bij een free response experiment (FRE) de planning tot een minimum beperken. Dit voordeel geeft ons ook de ruimte om meer aandacht te schenken aan de theoretische en methodologische implicaties van zo’n experiment. In de eerste plaats zullen we nogmaals het onderscheid tussen bewust en onbewust gepresenteerde attitudestimuli aankaarten (§4.1.1). Vervolgens besteden we uitgebreid aandacht aan de twee facetten van het FRE, namelijk het aanbieden van conceptuele attitudestimuli (§4.1.2) en de verzameling van kwalitatieve data die de concepten zou moeten kenmerken (§4.1.3). In de laatste paragraaf zullen eerdere vergelijkbare studies overlopen worden, waarbij we vooral stilstaan bij hun aanpak bij de verwerking van de verzamelde gegevens. Naast de concrete studies zullen we ook enkele verschillende theoretische invalshoeken voorstellen, namelijk een cognitief-linguïstisch en een sociaalpsychologisch perspectief. 4.1.1. Opnieuw over het onderscheid bewust en onbewust Een FRE behoort tot de tak van de directe technieken om taalattitudes uit te lokken. In klassieke overzichten (Ryan et al. 1988, Garrett 2005) laat men deze groep bijna-uitsluitend samenvallen met het afnemen van enquêtes en interviews. Het spreekt voor zich dat deze vormen van dataverzameling uitdrukkelijk de taak presenteren als een ‘beoordeling van taal’ en in dat opzicht is het niet verwonderlijk dat Kristiansen et al. (2005) en Kristiansen (2009) zich genoodzaakt voelen hun toevlucht te nemen tot indirecte methodes, als het enige alternatief waarbij het attitudeobject verborgen blijft. Het aanboren van diverse bewustzijnslagen bij een bepaalde cognitieve taak wordt in de recente sociaal-cognitieve literatuur rond information processing in verband gebracht met de aanwezigheid van twee verschillende mentale ‘systemen’ die we inzetten tijdens zulke taken. Het inzetten van Systeem 1 impliceert een manier van denken waarbij automatische, impliciete, onbewuste en holistische-perceptieve mentale processen worden geactiveerd. Denken met behulp van Systeem 2 betekent dan weer bewuste, tragere, gecontroleerde, expliciete en analytische mechanismen laten primeren (Campbell-Kibler 2013). Het feit dat sommige taken hetzij automatisch, hetzij gecontroleerd worden verwerkt en uitgevoerd, lijkt het aloude onderscheid tussen indirecte en directe methodes in het attitudeonderzoek te legitimeren. Het vormen van associaties en impressies en het aanwenden van stereotypes vallen in grote mate buiten onze bewuste controle en worden automatisch opgeroepen (Garrett, Williams & Evans 2005). Als daarbovenop uit talrijk onderzoek blijkt dat “implicit attitudes may be well as important if not more important than explicit attitudes in predicting or understanding behavior, including potentially linguistic behavior” (CampbellKibler 2013: 315), dan wordt de motivatie om indirecte technieken te gebruiken nog aanvaardbaarder. Het parallellisme tussen de wijze waarop de stimuli voor een bepaalde taak worden gepresenteerd, bewust dan wel onbewust, met het in werking treden van een van de twee
cognitieve systemen, respectievelijk gecontroleerde en automatische verwerking, vinden we echter problematisch. Het postuleren van zo’n duaal cognitief model is immers een gevolg van de experimentele controle en keuzes die vooraf worden gemaakt, en dus van een apriorionderscheid tussen onbewust en bewust voorgestelde stimuli. Naar onze mening schuilt er dan ook een vorm van circulariteit in de redenering dat directe en indirecte methodes betrekking hebben op het ene dan wel het andere systeem en dus zo goed mogelijk uit elkaar moeten worden gehouden. Zoals we echter in de inleidende sectie van de meesterproef beschreven (§1.2.5), is het niet onaannemelijk om het strikte onderscheid tussen bewuste en onbewust voorgestelde stimuli te laten varen, of tenminste een vorm van continuïteit in die binaire oppositie aan te brengen. De onderzoeker kan namelijk, in een experimentele setting, gradaties aanbrengen in de manier waarop hij het attitudeobject (on)bewust maakt voor de participant. Het is met andere woorden een kwestie van meer of minder de aandacht vestigen, en niet van wel of niet. Afleiding, tijdsbeperking en de relatie tussen onderzoeker en participant (waaronder men ook de ‘sociale wenselijkheid’ van de antwoorden kan onderbrengen) zijn allemaal factoren die bepalen of een taak automatisch of gecontroleerd wordt uitgevoerd en waarover de onderzoeker controle kan uitoefenen, maar veel vaker slechts gedeeltelijk zelf in de hand heeft (Garrett et al. 2005). Wij onderschrijven daarom ook de opmerking van Kristiansen et al. (2005: 19): “there is nothing inherently indirect about a method and […] if respondents at some stage in the process become aware of the purpose of the investigation, it by definition becomes direct”. De vraag is dan of een experimentele techniek die op dat continuüm balanceert van het onbewust of bewust presenteren van de stimuli, meer een beroep zal doen op Systeem 1 dan wel Systeem 2, of misschien eigenschappen van beide systemen activeert. We zijn ervan overtuigd dat onze FRE zich in het overgangsgebied bevindt tussen de twee bewustzijnspolen. De twee belangrijkste eigenschappen zijn het aanreiken van conceptuele stimuli, labels voor de Italiaanse regionale variëteiten, en het verzoek om respons in eenzelfde conceptuele vorm te verschaffen. We vroegen namelijk de participanten om zo snel mogelijk, zonder veel te na te denken, de drie eerste adjectieven te geven die in hen opkwamen en die volgens hen het best een bepaalde variëteit kenmerkten. Voor achtereenvolgens l’italiano parlato a Milano, a Firenze, a Roma e a Napoli (“het Italiaans gesproken in Milaan, in Firenze, in Rome en in Napels”) moesten ze drie verschillende adjectieven opschrijven, maar een eerder adjectief mocht wel herhaald worden bij een volgende variëteit. Ten slotte drukten we de aanwezigen op het hart dat er geen correcte of foute adjectieven bestonden en dat ze niet geremd moesten zijn in hun keuze. Een vergelijking met soortgelijke experimenten geeft treffend weer hoe de tweedeling indirect-direct geen recht doet aan de verscheidenheid aan designs die ingezet worden. Garrett, Coupland & Williams (2003) voerden bijvoorbeeld een zogenaamd keywordsexperiment uit, waarin eveneens de deelnemers gevraagd werd drie “impressies” neer te pennen, maar ditmaal naar aanleiding van enkele geluidsfragmenten. Bishop, Coupland & Garrett (2005) gebruikten net zoals ons vooraf bepaalde labels, maar die werden onderworpen aan beoordeling via open vragen en klassieke Likertachtige evaluatieschalen, zoals bij een MGE. Garrett, Williams & Evans (2005) vroegen dan weer hun informanten om eigen etiketten te geven voor de Engelse variëteiten die wereldwijd worden gesproken en om die daarna te beschrijven aan de hand van drie adjectieven. De eerste voorbeeldstudie neigt, naar onze mening, richting de onbewuste voorstelling van het attitudeobject, terwijl de laatste twee duidelijker de respondenten vragen om een overwogen oordeel uit te spreken over een talig object. Toch moet
men behoed zijn om het experiment van Bishop et al. (2005) en Garrett et al. (2005) over dezelfde kam te scheren; tenslotte verwacht men van de participanten twee zeer uiteenlopende taken, waarvoor men meer of minder cognitieve inspanning moet verrichten en zo meer of minder een beroep moet doen op controlled processing (Systeem 2). Onze aanpak kunnen we voorzichtigheidshalve situeren tussen deze twee laatste studies, en is nagenoeg identiek met wat in Grondelaers & Van Hout (2010) wordt voorgesteld. De twee onderzoekers vroegen namelijk aan een gediversifieerd publiek om zo snel mogelijk de eerste drie adjectieven op te schrijven voor acht variëtieten van het Nederlands-Nederlands en één van het Belgisch-Nederlands. Daarmee hebben we willen aantonen dat binnen de groep van de directe methodes nog heel wat niet te verwaarlozen variatie bestaat. 4.1.2. Bewust gepresenteerde attitudestimuli: labels Ons FRE vereist van de deelnemers dat ze de variëteiten onder beschouwing verbeelden of ‘conceptualiseren’, terwijl men van de indirecte methodes beweert dat de participanten de variëteiten ‘ervaren’ (Kristiansen et al. 2005). De termen lijken ons wat ongelukkig gekozen, aangezien een soort van conceptualisering en categorisatie onmisbaar is ook wanneer we de stimuli ‘ervaren’, en omgekeerd, begrijpen we niet goed hoe aan conceptualisering kan gedaan worden zonder te putten uit de ‘ervaring’ die men heeft met het attitudeobject. Vanuit perceptueel-dialectologische hoek is kritiek geuit op het gebrek aan aandacht die de conceptualiseringskwestie heeft gekregen in het kader van traditionele “matched guise”attitudeonderzoek. Het voornaamste heikele punt dat wordt aangehaald, is dat vrijwel nooit aan de participanten wordt gevraagd of ze de regionale of sociale afkomst van de sprekers in de geluidsfragmenten kunnen identificeren, m.a.w. er bestaat geen zekerheid dat de conceptualisering van de variëteit vanwege de onderzoeker overeenstemt met die van de participant, als die laatste überhaupt de herkomst kan raden. Daarmee is ook het probleem verbonden dat “respondents might not have a ‘cognitive speech area’ (i.e., a ‘linguistic mental map’) to which the voices samples might be readily assigned.” (Preston 2005: 1687). Wie voorstander is van een conceptuele aanpak stelt dat een gemeenschappelijk label afspreken die een variëteit benoemt, het risico op zulke incongruenties verkleint (ibid: 2005). Volgens ons is dat echter een pseudo-oplossing die de zaak enkel naar een ander niveau verschuift, omdat men niet kan uitsluiten dat de participant hoe dan ook een groter belang hecht aan bepaalde associaties, of er andere maakt, dan de onderzoeker op voorhand had bedoeld, ondanks het gedeelde etiket. Bovendien blijkt het een hachelijke zaak om taalvariëteiten van “robust and unambiguous labels” (Grondelaers & Van Hout 2010: 100) te voorzien, terwijl hun status als zelfstandige entiteiten vooralsnog niet door de taalgemeenschap erkend is of in een lekenrepresentatie van taalvariatie helemaal niet geconceptualiseerd wordt. In het kader va de bachelorproef hebben we een gelijkaardig FRE afgenomen waar op het einde de vraag werd gesteld welke soort taal of talen (parlate) ze thuis en onder vrienden spraken. Daaruit resulteerde dat niemand van de ondervraagden de term italiano regionale gebruikt om de eigen taal te benoemen en slechts 23% met een parafrase verklaart “iets” te spreken dat Italiaans noch dialect is. De meerderheid van de nochtans jonge respondenten houdt dus nog steeds vast aan de anachronistische dichotomie taal-dialect, in tegenstrijd met de huidige taalontwikkelingen op het schiereiland. Het is mogelijk
dat, geïnterpreteerd vanuit sociaalpsychologisch perspectief, taal en dialect voor de respondenten nog steeds niet aan relevantie hebben ingeboet als rigide complementaire houders van sociale waarden. De stereotypische functionele differentiatie, waarbij het nuttige en het aangename geassocieerd zijn met diametraal verschillend linguïstische codes, beantwoordt in feite aan een welbekende nood om aan onze ervaringswereld een structuur op te leggen die emotioneel zinvol én cognitief economisch is (Bourhis & Maass 2005). Hoewel het onmiskenbaar is dat de dagelijkse ervaringen gedomineerd worden door fuzzyness, is het niet verrassend dat de Italiaanse sprekers cognitieve shortcuts daartegenover plaatsen die al een ruime geschiedenis achter de rug hebben en hen in staat stellen vlot in het collectieve discours rond het onderwerp in te schrijven. Een Italiaans dat geïnterfereerd is door dialectale kenmerken betekent in feite voor hen een vervlechting van sociale sferen die als het ware mentaal een kortsluiting vormt, en dus te vermijden is. We zouden verwachten dat de beoordeling van “het Italiaans gesproken in X” voor onze respondenten een gecompliceerde opdracht is, met het risico dat men zich te zeer zou focussen op het stadsdialect. Langs de andere kant stellen de resultaten uit een ander attitudeonderzoek rond specifieke Italiaans dialecten ons wel gerust: “de indruk ontstaat dat er eigenlijk geen reële kennis van de dialecten is waarvoor men een beoordeling vraagt, maar dat de informanten hoogstwaarschijnlijk naar regionale variëteiten van het Italiaans verwijzen” (Canobbio, Cini & Regis 2006: 161)37. Een ander delicaat aspect dat gelinkt is aan de labelling-procedure en eerder de positie van de onderzoeker aanbelangt, is de vermeende neutraliteit van zulke etiketten. Bishop et al. (2005) merken terecht op dat de inspanning om de labels zo descriptief mogelijk te houden, slechts een illusie is, aangezien men “fails to address the political question of who gets to decide on adequacy or appropriacy of representation” (ibid.: 151). De onderzoeker maakt keuzes die hem onrechtstreeks zelf in het speelveld plaatsen van groeps- en identiteitsdynamieken in taalvariatie, en daardoor onmogelijk niet een bepaald standpunt naar voren kan schuiven. Door de regiolecten voor te stellen als variëteiten-met-een-epicentrum is het mogelijk dat een soort geladen polariteit tussen stad en periferie ontstaat waarnaar de participanten zich oriënteren. We kozen er bijvoorbeeld voor de zuidelijke variëteit voor te stellen als een “Italiaans gesproken in Napels”, hoewel de meerderheid van onze respondenten uit de rivaliserende provincie Salerno kwam en dat kan wel een niet te onderschatten impact hebben op de attitude. Metalinguïstische problemen rond categorisatie zijn nooit vrij van ideologie, of eender welke vorm van attitude. Daarin bevindt zich de grote, tweevoudige uitdaging van het attitudeonderzoek. Ten eerste mag men nooit de kritische heroverweging van de methodes achterwege laten, omdat de resultaten retrospectieve inzicht bieden in de opportuniteiten of zwakheden van een techniek; omgekeerd kan het aanbrengen van nuances in de methode gevoelig andere en rijkere resultaten geeft. Ten tweede , meer toegespitst op ons specifiek geval, kan zo’n conceptuele aanpak inzicht bieden in de sociale en sociolinguïstische categorieën die in werking treden bij taalideologische processen. De voordelen van de conceptuele methode worden vaak als de oplossingen beschouwd voor de problemen die kunnen rijzen bij een verbal guise experiment. Hiervoor hebben we al vermeld dat het aanbieden van labels voor regionale variëteiten het risico verkleint dat participanten 37
“nasce l’impressione che non ci sia una reale conoscenza delle varietà dialettali su cui si richiede un giudizio, ma che gli informatori facciano riferimento alla varietà di italiano regionale”
verkeerdelijk de speech areas identificeren waarvoor volgens de onderzoeker de taalvariëteit symbool staat. Over het algemeen mag men stellen dat, ondanks de nauwkeurige voorbereiding en keuze van de audiostimuli, heel wat potentiële valkuilen aan de controle van de afnemer ontsnappen. De voornaamste kritiek daarbij is dat het bijzonder moeilijk is om de proefpersonen te dwingen elke inferentie enkel en alleen te baseren op spraak en geluid (en niet de inhoud van het fragment) en tegelijkertijd hopen dat allerhande spraakkenmerken geen invloed hebben op de attitude (zoals tempo, toonhoogte, ritme, intonatie etc.). Door met een “helder” etiket zoals “het Italiaans van Napels” te werken, vermijdt men immers de contingente kenmerken van de audiostimuli die de participant te veel zouden leiden naar een fragmentgebonden attitude. De kans is veel groter dat zulke labels daarentegen direct een associatienetwerk activeren op een algemener niveau, op het vlak van sociale stereotypen en andere vormen van ideologie. Volgens Bishop et al. (2005) is inderdaad de grootste verdienste van zo’n conceptualisatieaanpak dat ze er juist in slaagt temporeel stabiele conceptualisaties van taalvariëteiten te genereren (een soort van attitudinele consistentie), puttend uit de meest abstracte en gestructureerde ideologieën, die niet vertekend worden door ad-hoc-contextualisaties en andere overwegingen, zoals dat bij een MGE het geval kan zijn. Men mag evenwel niet uitsluiten dat, voornamelijk bij minder gevestigde variëteiten, bij de participanten de neiging bestaat om een beroep te doen concrete, particuliere voorbeelden uit hun dagelijkse leven38. Men wekt vaak de indruk dat de methode niet geheel geschikt is voor het blootleggen van veranderende attitudinele profielen en het traceren van alternatieve waardesystemen die de configuratie in het taallandschap mogelijks herscheppen, kortom het gebied van de instabiliteit en vernieuwing. Galli de’ Paratesi (1984) heeft in haar onderzoek naar standaardiseringsdynamieken in Italië echter bewezen dat men ook tot zeer zinvolle conclusies kan komen omtrent zogenaamde verborgen attitudeverandering door de participant bewust te maken van de beoordeling op een talig object en daarvoor gebruik te maken van etiketten om de variëteiten te presenteren. De participanten uit Milaan, Florence en Rome moesten eerst bekend maken of ze achtereenvolgens de Milanese, Florentijnse, Romeinse en zuidelijke variëteit apprecieerden of afkeurden (Ti piace l’accento ‘x’? “Heb je accent ‘x’ graag?”), om daarna in eigen woorden hun mening te expliciteren. Op het eerste zicht lijken de Italianen in haar experiment een stereotypische, “officiële” attitude tentoon te spreiden: loyauteit tegenover het eigen regiolect, ontzag voor een nationale norm (het Standaarditaliaans) en de minachting voor andere regionale variëteiten van het Italiaans. Als men evenwel aandachtiger het materiaal uit de conversaties analyseert, dan ontdekt men dat Milaan door de Florentijnen minder minacht wordt dan Rome en dat de Milanezen het Florentijns minder tot voorbeeld nemen dan de Romeinen dat doen. Volgens de linguïste toont dit beeld aan dat het Milanese Italiaans zijn aantrekkingskracht nu uitoefent op een regio die van oudsher het prestigemodel naar het noorden exporteerde. Het interessantste aspect van haar studie, dat bovendien zeer toepasselijk is voor ons geval, betreft evenwel de aard van de evaluatieve respons waarmee de respondenten moeten reageren op de conceptuele input, namelijk kwalitatieve data.
38
In een vorig FRE uitgevoerd in het kader van de bachelorproef, hadden vooral de noordelijke studenten van een universiteitsresidentie moeite om de Italiaanse variëteit van een minder bekende zuiderse stad (Salerno) te karakteriseren. Zeer vaak baseerden ze hun keuzes, die ze luidop reflecteerden, op een student uit Salerno, die ook in de residentie verbleef, bij wijze van meest voor de hand liggend symbool voor die variëteit.
4.1.3. Kwalitatieve responsdata: keywords en adjectieven Tot nu toe hebben we voornamelijk de aard van de input van zo’n experiment besproken, maar nu zullen we ruimte wijden aan de output die verkregen wordt. De verzameling van zogenaamde keywords in attitude-experimenten is een methode die al langer wordt toegepast. Doorgedreven analyses van deze vrije associatiedata blijven echter vrijwel steeds uit, omdat ze vaak slechts als voorbereidende heuristieken dienen voor de identificatie van concepten die aan de basis staan van de semantische differentialen van de MGE (Garrett, Williams & Evans 2005; Grondelaers & Van Hout 2010). De ondergeschikte, verwaarloosde rol van deze gegevens doet geen recht aan de complexiteit en het potentieel dat dit materiaal bezit om toegang te krijgen tot cultureelcognitieve modellen en beelden, die in vele gevallen zelfs niet vertaald kunnen worden naar traditionele attitudedimensies. In tegenstellig tot de wat eenzijdige aandacht voor persoonlijkheidseigenschappen in Likertschalen voor MGE, krijgen we nu te maken met een verbreed palet aan kenmerken, gaande van uiterlijk tot interesses en gevoelens en zelfs synesthetische associaties, bijvoorbeeld in het domein van de kleuren (Galli de’ Paratesi 1984). Een ander onbetwistbaar groot voordeel van zo’n aanpak is dat ze een groter empirisch fundament ambieert, door de interpretatie volledig te steunen op de middelen die taalgebruikers zelf inzetten in plaats van vooraf bepaalde evaluatieschalen te gebruiken. We zijn er stellig van overtuigd dat om tot een groter inzicht te komen tot de gelaagde social meaning of language (Soukup 2013), onderzoek naar deze semantisch, en bijgevolg ook conceptueel zeer rijke gegevens onmisbaar is. Ook wat betreft ons FRE bestaat de taak die van de participanten verwacht wordt, in het noteren van drie sleutelwoorden waarmee ze denken de vier variëteiten (Milanees, Florentijns, Romeins en Napolitaans Italiaans) het best te kunnen karakteriseren. Eerst dient een woordje uitleg over het in de sociaalpsychologische literatuur gemaakt onderscheid tussen attitudes en meningen (opinions [Garrett 2010]). Terwijl attitudes latente entiteiten zijn die geïnfereerd moeten worden vanuit een bepaald gedrag, zoals het aanvinken van evaluatieschalen, zijn meningen wel vaak onmiddellijk in woorden uitgedrukt en analyseerbaar. Meningen worden daarom doorgaans niet beschouwd als de exteriorisatie van persoonlijke attitudes, maar van ideologische en stereotypische aspecten aanwezig in het collectieve discours, “a kind of generalized attitudinal climate that is reproducable (and reproduced) on various barometers” (Kristiansen et al. 2005: 13). Daarmee knopen we opnieuw aan bij het welbekend onderscheid tussen overt and covert values en de voorkeur voor de laatste in het attitudeonderzoek in taalverandering. We hebben reeds beargumenteerd dat men behoed moet zijn om openlijk gearticuleerde attitudes aan de kant te schuiven wanneer men taalveranderingsdynamieken in kaart wil brengen. Galli de’ Paratesi (1984), waarvan we kort het onderzoek hebben aangestipt aan het eind van de vorige paragraaf, verdedigt expliciet de verzameling en analyse van opinions om tot een omvattender inzicht te komen van de motivaties die achter verandering in het taalgebruik kunnen liggen. Dat het Italiaans gesproken in Milaan een voortrekkersrol speelt in de “nieuwe” standaardiseringsgolf, die al sinds de jaren tachtig redelijk onopgemerkt plaatsvindt kan volgens de linguïste door middel van discoursanalytische procedures ook afgeleid worden uit een hele verzameling aan adjectieven en andere evaluatieve verwoordingen. Daarin kan een onderverdeling in vier categorieën aangebracht worden: bewuste, pseudolinguïstische (of
sociolinguïstische), sociale en normatieve beoordelingen. Bij de eerste groep horen alle uitspraken waarin de participant bewust persoonlijke voorkeuren formuleert voor een bepaalde variëteit, zonder enige vorm van rationele verantwoording. De pseudolinguïstische oordelen zijn dan weer helemaal onbewust prijsgegeven, aangezien hier de stereotypische projectie plaatsvindt waarbij aan de variëteiten kenmerken worden toegedicht die in feite aan de sprekers toebehoren. De sociale vooroordelen tegenover de sprekers worden door de informant omgezet in esthetische of functionele kenmerken van de variëteit, zonder dat hij zelf bewust is van zo’n projectie. Dan is er de groep van de sociale beoordelingen, die de bewuste keerzijde van het vorige stereotypische proces vormen: de participanten menen dat gebreken of kwaliteiten van de variëteit onder beschouwing een direct gevolg zijn van de gebreken of kwaliteiten van hun sprekers. Ten slotte vinden we de normatieve oordelen; die zijn vaak esthetisch van aard, maar kunnen evenzeer betrekking hebben op overwegingen van gepastheid, correctheid enz. Hoewel we, in tegenstelling tot Galli de’ Paratesi’s introspectieve categorisatie, onze keyword-databank grotendeels automatisch zullen analyseren (cfr. infra), kan haar studie in ieder geval als een belangrijke voorloper en inspiratiebron beschouwd worden van het onderzoek in deze meesterproef. Garrett, Williams & Evans (2005) is, bij ons beste weten, de enige andere studie naast Grondelaers & Van Hout (2010) die taalattitudes aan het licht probeert te brengen dankzij de associaties die participanten maken, niet altijd in de vorm van adjectieven, en bovendien uitvoerig aandacht besteed aan de theoretische en methodologische kant van de zaak. Primair belang wordt gehecht aan de frequentie waarmee verwoordingen in hun corpus voorkomen. De basisassumptie is dat hoogfrequente tokens wijzen op thema’s die saillant zijn voor de beoordelaar van taalvariëteiten, zeker wanneer meerdere types die behoren tot hetzelfde semantische veld, elk een hoge frequentie vertonen. Tegelijkertijd maken ze gewag van het probleem dat een heel aantal laagfrequente woorden toch betekenisvolle relaties onderhouden en in thematische eenheden clusteren die wel een verhelderende blik kunnen werpen. Hun oplossing voor deze kwestie is vijf in plaats van drie sleutelwoorden te vragen, zodat aan de participant de kans wordt gegeven om uit een breder palet aan thema’s en domeinen te putten én hopelijk de frequentie van die thema’s-aan-lage-concentratie aanzienlijk te verhogen. Uit de ervaring met de bachelorproef weten we echter dat zelfs de vraag naar drie keywords, meer bepaald adjectieven in ons geval, al voor vele participanten geen eenvoudige opdracht is en in het algemeen heeft men ondervonden (Labov 1972, Calamai 2002) dat sprekers over een beperkte woordenschat beschikken wanneer ze hun mening moeten uitdrukken over talige aspecten. Het is dus niet vanzelfsprekend dat door de respondenten te dwingen om, onder tijdsrestricties, meer sleutelwoorden op te schrijven, men de minder vertegenwoordigde semantische velden consistenter kan maken. De proefpersonen kunnen evenzeer, uit inspiratienood of simpelweg door een of andere vorm van lexical priming, teruggrijpen naar de thema’s die wel direct toegankelijk waren, wat tot een nog grotere vertekening van de frequentie leidt. Het lijkt ons in ieder geval duidelijk dat wat eerst wordt opgeschreven, sneller oproepbaar was door de participant en bijgevolg saillantere thema’s weerspiegelt waarmee niet-specialisten over taal spreken. Saillantie kan dus voor de proefpersoon iets anders inhouden dan de interpretatie die de onderzoeker aan het verschijnsel geeft. Voor de eerste heeft het eerder te maken met de snelheid en de automatische toegang tot cognitieve domeinen, wat zich uit in de persoonlijke volgorde van de keywords, terwijl voor de laatste saillantie post hoc eerder door totale tokenfrequenties in de data en consistente semantische velden bepaald zal worden. In de
praktijk zullen beide perspectieven vaak wel overeenkomen, maar dat hoeft, naar onze mening, niet steeds zo te zijn. Ook in de cognitief-linguïstische literatuur, waaraan de auteurs van de vorige studie desondanks niet refereren, spelen frequentie- en saillantieverschijnselen een prominente rol. Entrenchment (Langacker 1987, geciteerd in Schmid 2007) wordt in dat verband meestal vernoemd als een gevolg van veelvuldig gebruik en hoge frequentie van linguïstische entiteiten op tokenniveau, die dus gefossiliseerd geraken in het geheugen als conceptuele eenheden of andere constructionele types. Omgekeerd houdt spreken in feite in dat men, als in een routine, constant en bijna volautomatisch deze verankerde eenheden activeert in het daarmee geconventionaliseerd taalmateriaal. Als we in contact komen met perceptuele input die daarentegen minder entrenched is, zullen we meer tijd en moeite besteden om die input te herkennen en te categoriseren, door daarbij de vreemde input in een reeks “verstaanbare” attributen te ontleden, om uiteindelijk een gepaste vorm in ons mentale lexicon te identificeren39. De hoogfrequente entiteiten bezitten een ontological salience: in onze omgeving hebben zij, door allerhande eigenschappen, meer kans om in ons bewust aandachtsveld te vallen. Daarbij zijn ze vaak ook cognitief saillant, omdat de mentale concepten verbonden met die reële entiteiten gemakkelijker en sneller geactiveerd zullen worden en andere concepten, die daarmee gerelateerd zijn, geprimed worden (ook spreading activation genoemd [Schmid 2007: 119]). De link tussen saillantie en verankering kan als volgt geformuleerd worden: ontologisch saillante entiteiten trekken frequenter onze aandacht, zullen frequenter cognitieve mechanismen activeren die uiteindelijk leiden tot dieper verankerde concepten, die dan op hun beurt sneller opgeroepen worden, m.a.w. ze worden ook cognitief saillant. Dat de taalgebruiker ertoe gemakkelijker toegang heeft, wordt verklaard doordat zulke concepten tot associatieve netwerken gaan behoren, waarin een targetconcept als in een kettingreactie andere deelconcepten activeert en zo het netwerk versterkt. Met enig voorbehoud kunnen we deze ideeën ook toepassen op het FRE van ons eigen onderzoek. Aan de basis van de taak om een bepaalde taalvariëteit van kenmerken te voorzien, liggen, naar onze mening, soortgelijk conceptualisatie- en categorisatiemechanismen. Ten eerste kan een regiolect niet van eigenschappen voorzien worden zonder dat voor die variëteit het respectievelijke mentale concept wordt opgehaald, dat naargelang zijn saillantie weinig of veel moeite kan vergen en men weinig of veel geschikte attributen moet zoeken teneinde een correcte categorisering. Het netwerk waartoe dat concept behoort, verschaft dan weer het nodige lexicale materiaal waarmee de karakterisering uitgevoerd wordt. Toch dient men ook belangrijke nuances ten opzichte van het cognitief-linguïstische verklaringsmodel te maken. Dat taalkundig referentiekader tracht een verklaring te geven van de verschijnselen die zich in natuurlijke, alledaagse omstandigheden afspelen, terwijl bij de experimentele setting waarin onze data werd 39
Entrenchment vindt bovendien niet enkel plaats bij de individuele spreker, maar ook op het vlak van de taalgemeenschap, waarbij een groep als collectief zichzelf blootstelt aan de hoge frequentie van een bepaalde linguïstische entiteit. In die zin kan het concept verzoend worden met een sociaalpsychologisch perspectief, ditmaal met een focus op de semantische systemen (stereotypes en vooroordelen) binnen en tussen gemeenschappen, of omgekeerd, hoe men een taalgemeenschap kan definiëren en afbakenen op basis van de vigerende semantische systemen.
verzameld, een zekere artificiële sturing allerminst uitgesloten is. Wij dwongen onze respondenten in een unieke, voor velen vreemde opdracht, waarbij de natuurlijke perceptie- en saillantiemechanismen even uitgezet werden. Regiolecten bezitten niet dezelfde ontologische saillantie als, bij wijze van spreken, een hond of een televisie, niet in het minst omdat de perceptuele stimuli voor talen eenzijdiger zijn, in vergelijking met de zintuiglijke variëteit waarmee we de laatstgenoemden percipiëren. Een niet te onderschatten specificiteit van ons experiment, was de vraag naar adjectieven, zodat de respondenten gestuurd zouden worden om algemenere evaluaties en attributen te geven en wat geremd zouden zijn in een te brede associatie van misschien te concrete referenten. Tijdens spontane categorisatie bestaat natuurlijk geen beperking of instructie om associaties uit te sluiten of te selecteren en in dit opzicht kan men de kritische noot maken dat waardevolle gegevens zo verloren gaan of, erger, proefpersonen de inspanning van zo’n specifieke opdracht niet volhouden en zonder criterium adjectieven opschrijven (want dat is een mogelijkheid die ook in rekening gebracht moet worden). Bewust van het feit dat niet iedereen in de zaal zou weten wat een adjectief is, gaven we dan ook enkele neutrale, prototypische voorbeelden. In een eerder sociaalpsychologisch referentiekader heeft men aangetoond dat abstractere termen, waaronder adjectieven, een relatief grote temporele stabiliteit vertonen en redelijk immuun zijn voor contextuele of situationele eigenaardigheden. Het linguistic intergroup bias model (Maass, Salvi, Arcuri & Semin 1989, geciteerd in Bourhis & Maass 2005) stelt dat sprekers het positieve gedrag van de eigen groep en het negatieve gedrag van de ander in abstracte termen beschrijven, “suggesting that the observed act reflects a stable characteristic or psychological state of the actor contributing to ‘psychological essentialism’” (Bourhis & Maass 2005: 1598). Voor afwijkende ervaringen, zoals het eigen negatieve gedrag en het positieve gedrag van de ander, hanteren ze echter concretere verwoordingen, zonder te veralgemenen, opdat het stereotype intact zou blijven. Volgens ons vat dit eerder statisch model niet helemaal de tegengestelde dynamieken die zich kunnen afspelen op het vlak groepsloyauteit en sociaal prestige. Wij stellen dan ook voor om het onderscheid outgroup-ingroup te vervangen door of te verbreden naar ‘groepen waartegen men zich afzet – groepen waartoe men wil behoren’. In de categorie van de adjectieven onderscheidt men ook een continuüm van concreet naar abstract, afhankelijk van het type derivatie, dat in de Italiaanse taal een bijzonder pregnant fenomeen is (Franco & Maass 1996, geciteerd in Bourhis & Maass 2005). Eigen negatieve eigenschappen of positieve eigenschappen van de outgroup worden beschreven aan de hand van adjectieven afgeleid van actiewerkwoorden (action verbs, bijvoorbeeld invadente of intraprendente) terwijl het omgekeerde plaatsvindt met adjectieven die van statieve werkwoorden of van geen enkel werkwoord afgeleid zijn (bijvoorbeeld adorabile of ostile). Daarom kan het interessant zijn te onderzoeken hoe negatieve en positieve oordelen worden gekruist met eerder abstracte of concrete adjectieven in de beoordeling van sprekers van Italiaanse regionale taalvariëteiten.
4.2. Analyse associatiedata In het vorige hoofdstuk heeft zich langzaamaan de denkpiste ontwikkeld dat de interpretatie van attitudes tegenover taalvariatie, zeker in het licht van de vrije associatiedata die we hebben verzameld, onvermijdelijk een puur linguïstische wending moet nemen, en in het bijzonder een kwestie van semantische analyse wordt. Dat het attitudeonderzoek dergelijke paden moet betreden, is recentelijk ook door Soukup (2013) verdedigd. De studie van taalattitudes door taalkundigen moet volgens haar ontvoogd worden van het sociaalpsychologische framework waartoe het vaak onkritisch de eigen bevindingen steeds heeft trachten in te kaderen. Experimentele designs (van het indirecte type) in de sociale psychologie meten in de regel slechts een gedecontextualiseerde graad van goed- of afkeuring, terwijl de taalkundige varianten allerlei contextafhankelijke elementen (zoals ‘ambitie’, ‘opleidingsniveau’, ‘dynamisme’) inbouwen waarvoor in feite de keuze voor een positieve of negatieve lading een beperkend perspectief oplegt. Wat taalattitude-experimenten werkelijk aan het licht hebben gebracht, is de social meaning of linguistic variation, namelijk hoe taalgebruikers zin (en betekenis) geven aan dagelijkse interacties in bepaalde contexten. De sociale werkelijkheid wordt dan benaderd als een semantische ruimte, waarin men op een betekenisvolle manier sprekers en hun taalproductie kan plaatsen. Deze onderzoeksinteresse, namelijk de meaning of variation, staat ook centraal in het programma van de Cognitieve Sociolinguïstiek (Kristiansen & Dirven 2008; Geeraerts, Kristiansen & Peirsman 2010). Die veronderstelt dat cognitieve fenomenen, zoals prototypiciteitseffecten, metaforen en metonymieën, een fundamentele rol spelen in de perceptie en conceptualisatie van taalvariëteiten (Geeraerts & Kristiansen 2014). De hamvraag die zich stelt is dan met behulp van welke methodes we het enorme semantische potentieel van onze gegevens het best tot zijn recht kunnen laten komen. Onze werkwijze vertrekt van de overtuiging dat een semiautomatische, computationele analyse van onze associatiedata inzichtelijke en betrouwbare resultaten zal opleveren. Net zoals we sterk de nadruk hebben willen leggen op de methodologische onderbouwing van de resultaten van het indirecte attitude-experiment, zo willen we onze empirische gedrevenheid ook hier voortzetten. Ook in de cognitief-linguïstische theorievorming heeft men in het laatste decennium sterk ingezet op de kwantitatief-statistische verwerking van natuurlijk taalgebruik, onder andere door gebruik te maken van grote geannoteerde corpora (Gries & Stefanowitsch 2006, Glynn & Fischer 2010). Deze sectie van de meesterproef probeert zich daarom aan te sluiten bij deze traditie. 4.2.1. De distributionele semantiek 4.2.1.1.
Geschiedenis, pro’s en contra’s
We hebben herhaaldelijk verwezen naar de Cognitieve Linguïstiek, als uitgelezen taalkundige stroming waarbinnen een usage-based benadering van betekenis een prominente plaats krijgt. Het theoretische uitgangspunt van onze analyse situeert zich evenwel in een taalkundige subdiscipline die schijnbaar tegenovergestelde opvattingen voorstaat, namelijk de distributionele semantiek. Over de status van de laatstgenoemde hetzij als volwaardige theorie, hetzij als verfijnde methode blijken in de literatuur verscheidene meningen te circuleren.
Het post-Bloomfeldiaanse structuralisme, waarvan Zellig Harris en Charles Hockett gezaghebbende exponenten zijn, tezamen met de Britse corpus-linguïstische school onder leiding van John Firth (en John Sinclair), zijn twee soliede tradities die de distributionele eigenschappen van het lexicon centraal stellen in taaltheoretisch opzicht, en bijgevolg een corpusgedreven benadering van taal uitdragen. Enkel wat in teksten concreet kan waargenomen worden, is het legitieme onderzoeksobject waaruit tegelijkertijd hypothese worden gevormd en bewijsmateriaal wordt gehaald. In feite betreft dit ook een usage-based benadering, zij het een extreme uitwerking ervan, waarin psychologische entiteiten of andere socio-contextuele elementen geenszins ter interpretatie mogen geleverd worden. Het kernbegrip in de distributionele theorie is semantische overeenkomst (semantic similarity), wat de sleutel vormt voor de manier waarop woorden verwerkt en gememoriseerd worden in het mentale lexicon (Lenci 2008). Daaruit komt dan de distributionele hypothese voort (distributional hypothesis [Harris 1954]): de graad van semantische overeenkomst tussen twee talige uitdrukkingen A en B is de functie van de overeenkomst van de talige contexten waarin A en B verschijnen40. Dat impliceert dat “by inspecting a significant number of linguistic contexts representative of the distributional and combinatorial behavior of a given word, we may find evidence about (some of) its semantic properties” (Lenci 2008: 3). Over het algemeen worden de distributionele principes in de vorm van innovatieve statistische en computationele technieken omgezet, ten dienste van taalkundige strekkingen die een andere herkomst kunnen hebben. Cognitief-semantische studies naar polysemie en categorisatie kennen een lange geschiedenis van corporagebruik (Geeraerts 2010). De groeiende interesse in de pragmatische en socio-contextuele aspecten van lexicale variatie, een zogenaamde pragmatische onomasiologie, heeft in methodologisch opzicht tot een kwantitatieve omslag geleid, waarbij de distributionele lexicale corpusanalyse snel geïdentificeerd werd als aantrekkelijke benadering. Ook in het psycholinguïstische onderzoek, dat onmiskenbaar raakvlakken vertoont met de cognitief-linguïstische standpunten, heeft men de distributionele methode geïntroduceerd (Miller & Charles 1991). Toch lijken deze huwelijken niet geheel vrij van kritiek, voornamelijk op het vlak van fundamentele theoretische uitgangspunten. Lenci (2008: 5) merkt op dat in de cognitieve linguïstiek de betekenis van een lexicale uitdrukking verstaan wordt als “a particular conceptualization of an entity or situation it is able to evoke”. De redenering van de distributionele semantici wordt in feite op zijn kop gezet: het zijn niet de distributionele eigenschappen die de betekenis bepalen, maar onze zintuiglijk gestuurde conceptualisaties die linguïstische patronen verklaren. De verankering van taal in de extralinguïstische werkelijkheid speelt een cruciale rol in de cognitieve linguïstiek, terwijl de distributionalisten van het eerste uur stellig dit perspectief hadden uitgesloten. Ook Geeraerts (2010), van zijn kant, drukt zijn twijfels uit. Ten eerste: kan de volledige kennis van een woord, die de taalgebruiker ter beschikking heeft, geëxtraheerd worden uit het distributionele gedrag van dat woord in tekstbestanden? De sterkte van een distributionele aanpak bevindt zich in het associërend en inferentieel verband dat het kan leggen tussen lexicale 40
Bijna gelijktijdig met Harris’ stelling formuleert Firth (1957: 11) zijn bekende aforisme: “You shall know a word by the company it keeps”.
uitdrukkingen, maar over de referentiële betekenis ervan schiet de theorie tekort. De cognitieve semantiek stelt daarentegen een interpretatie voorop waarin conceptuele representaties in de eerste plaats ontstaan dankzij perceptuele, extralinguïstische ervaringen. De waarheid zou wel eens in het midden kunnen liggen: onze woordenschat kent woorden, zoals 'kat' en 'lopen', waaraan ongetwijfeld een zintuigelijk-motorische ervaring ten grondslag moet liggen, maar evenzeer abstractere termen als 'beschaving' en 'overwegen', waarvan waarschijnlijk de betekenis aan de hand van talige ervaringen wordt aangeleerd (Lenci 2008)41. Ten tweede, hoewel het potentieel van distributionele technieken ongelofelijk groot is, staat de reflectie over de semantische informatie die zulke technieken aan het licht brengen nog in de kinderschoenen. Zijn in de familie van distributionele methodes alle technieken geschikt om tal van semantische fenomenen te onderzoeken, of vervult de ene techniek een bepaalde taak beter dan de andere? Semantic similarity blijft een vage houder van uiteenlopende fenomenen (synonymie, hyponymie, co-hyponymie, hyperonymie etc.)42. Een heleboel andere casussen lijken dan weer moeilijk onder de noemer van semantische gelijkenis te ressorteren –of in ieder geval niet door middel van de bovengenoemde strikte betekenisrelaties kunnen beschreven worden. Ze lijken echter eerder te maken te hebben met algemene, al dan niet figuratieve (contiguïteits)relaties (semantic relatedness [Peirsman 2008]). Hoewel distributionele modellen in staat zijn al die semantische verschijnselen op te sporen, kunnen diezelfde modellen geen verklaring geven waarom ze juist die verschijnselen selecteren en pogingen om technieken enkel een bepaald subtype te laten identificeren geven vaak teleurstellende resultaten (Lenci 2008).
4.2.1.2. Van theorie naar praktijk: contextdefinities en statistische verwerking Een belangrijke parameter, die een type distributioneel model onderscheidt, is de definitie en de mathematische implementering van de 'context': de distributionele hypothese volgend, bepaalt de omgeving waarin een lexicale uitdrukking zich bevindt (i.e. het geheel aan contextuele elementen), in grote mate de betekenis van de uitdrukking. In de literatuur onderscheidt men drie soorten modellen, naargelang de contextdefinitie waarbij wordt aangesloten. Documentbased modellen gebruiken een of andere tekstuele entiteit als contextkenmerk, bijvoorbeeld paragrafen of volledige teksten (Landauer & Dumais 1997, Sahlgren 2006). Syntax-based modellen bepalen de gelijkenis tussen woorden op basis van de syntactische functie die ze vervullen (Pado & Lapata 2007). Ten slotte zijn er ook de word-based modellen, die geen rekening houden met syntactische posities, maar eenvoudigweg een n-aantal woorden betrekken die zich tot een vooraf bepaalde afstand van het targetwoord (de node) bevinden, met uitzondering van een aantal 'lege' woorden, bijvoorbeeld lidwoorden. De laatste jaren is men 41
Hoewel de cognitieve linguïstiek de distributionele methode omarmd heeft om een empirische grondslag te geven aan semantische fenomenen als prototypiciteitseffecten en categorielidmaatschap, dan moet -ironisch genoeg- vastgesteld worden dat distributionele modellen enorme moeilijkheden ondervinden om, onder andere, prototypische attributen van een concept te extraheren (Baroni & Lenci 2008) 42 Vanuit een puur descriptieve houding, die niet a-prioristische semantische relaties tracht op te leggen, maar corpus-driven de mogelijke relaties blootlegt, is de notie van semantische overeenkomst perfect verdedigbaar. Psychologische tests hebben bovendien de psychologische realiteit van het concept semantic similarity aangetoond (Miller & Charles 1991, geciteerd in Sahlgren 2008).
begonnen de modellen onderling te vergelijken om de eigenheid, de pro's en de contra's van elk te ontdekken in de uitvoering van bepaalde taken. Sahlgren (2006) heeft aangetoond dat document-based models een voorkeur hebben voor het detecteren van syntagmatische relaties, i.e. woorden die frequent samen voorkomen, terwijl word-based models eerder paradigmatische associaties opsporen, i.e. woorden die frequent door dezelfde contexten omgeven worden. Peirsman, Heylen & Speelman (2007) constateerden dat syntax-based modellen beter presteerden in de zoektocht naar synoniemen dan word-based modellen. Wanneer semantisch gerelateerde woorden gevonden moeten worden, lijkt een variant op het laatste soort model tot betere resultaten te leiden dan syntax-based models (Peirsman 2007). Voor onze attitudestudie construeerden we een document-based model, waarvan de specifieke kenmerken in de volgende paragraaf besproken zullen worden. De statistische verwerking van de relevante contextkenmerken van het targetwoord is een bijzonder belangrijke stap om tot een zinvolle interpretatie van het distributionele gedrag van die targetuitdrukking te komen. Vectoren zijn op dit moment een zeer populair middel om semantische informatie in numerische datastructuur te formaliseren (Lenci 2008, Turney & Pantel 2010, Heylen & Ruette 2013). Het soort computationele modellen dat zich baseert op de principes van de distributionele semantiek en gebruik maakt van vectoren, wordt dan ook Semantic Vector Space Models (SVS-modellen) genoemd. Specifiek toegepast op het SVS-model dat in onze studie behandeld wordt, waarin documenten als contexteenheden fungeren, is het achterliggende idee dat de n-aantal coördinaten van zulke vectoren elk de frequentie weergeven waarmee de woorden in n-aantal documenten voorkomen. Wanneer het distributionele gedrag van meerdere woorden wordt onderzocht, opdat men hun semantische gelijkenis op het spoor zou komen, construeert men meerdere vectoren en wordt een zogenaamde term-by-document matrix opgesteld. De documenten vormen de kolommen van zo’n matrix, terwijl de woorden de rijpositie innemen en de woordfrequenties per document de cellen van de matrix vullen. Het aantal documenten kan beschouwd worden als het aantal dimensies die een 'distributionele ruimte' vormen, waarin de woorden punten zijn en hun frequentieverdeling de coördinaten. De volgende stap is de semantische gelijkenis of relaties tussen de lexicale uitdrukkingen berekenen in zo'n multidimensionele ruimte, want “if we adopt the DH [Distributional Hypothesis] […] we can interpret this distributional vector space as a semantic space, in which distances between points correspondto semantic distances between corresponding words” (Lenci 2008: 12).
Figure 8: term-by-document matrix [Sahlgren (2008)]
Onze opdracht bestaat erin de bovenbeschreven principes en uitwerkingstechnieken toe te passen op onze specifieke associatiedataset. We formuleren daarbij de volgende onderzoeksvraag: kunnen we, aan de hand van een document-based semantics vector space model, in onze verzameling adjectieven een beperkt aantal categorieën onderscheiden, waarmee taalgebruikers over taalvariëteiten spreken? Bestaat er een reeks semantische domeinen die sprekers inschakelen om taalvariatie te conceptualiseren en te beoordelen? Het spreekt voor zich dat de vorming van clusters van semantisch gerelateerde adjectieven het gevolg is van de iteratieve vergelijking van gelijklopende distributionele patronen per adjectievenpaar. Omdat de implementatie van een SVS-model vrij complex is, wordt de indeling van de volgende paragraaf gescandeerd volgens de afzonderlijke stappen die we hebben ondernomen. We bespreken daarbij eerst de constructie van de term-by-document matrix (§2.2.1), daarna leggen we uit hoe de dissimilariteitsmatrix verkregen wordt en we staan (§2.2.2) ten slotte stil bij de clustertechniek waarmee we de groepen adjectieven aanmaken (§2.2.3). Tijdens de clusteranalyse introduceren we een andere statistische techniek die ons in staat stelt de gegeven clusters te visualiseren, namelijk correspondentieanalyse (§2.2.4). De sectie wordt afgesloten met een dubbele discussie: enerzijds bespreken we de semantische domeinen in het licht van ons attitudineel onderzoek (§3.1), anderzijds maken we een retrospectieve evaluatie van onze keuzes bij de constructie van het SVS-model (§3.2).
4.2.2. Opbouw van het Semantic Vector Space Model 4.2.2.1. STAP 1: keuze van referentiecorpus en constructie van term-bydocument matrix De documenten waarmee de semantische relaties tussen de adjectieven worden bepaald, zijn afkomstig uit de omvangrijkste linguïstische geannoteerde collectie teksten in het Italiaans, het itWaC-corpus (Italian Web as Corpus; Baroni, Bernardini, Ferraresi & Zanchetta 2008), ontwikkeld tussen 2005 en 2007. Dat corpus maakt deel uit van het groter WaCky-project, opgestart door onderzoekers met een belangstelling voor het web als bron voor taalkundig relevant materiaal. Heel wat voorgaand distributioneel-semantisch onderzoek werd uitgevoerd aan de hand van traditionele corpora van geschreven taal, vaak samengesteld uit krantenmateriaal (Peirsman, Heylen & Speelman 2007; Peirsman 2008, Peirsman & Speelman 2009). Met het oog op een document-based model streven we echter naar een zo divers mogelijke collectie bronnen en daarom is het niet aangewezen ons te beperken tot corpora die slechts één genre bevatten (kranten) met een bovendien gelimiteerd aantal thematische rubrieken (zoals politiek, economie, weer enz.). Om die heikele punten te verhelpen, beogen de WaCky-corpora onder andere een betere en meer gevarieerde onderwerp- en genrerepresentativiteit. Zo vindt de verzameling van de webpagina's plaats door willekeurige woorden, opgeroepen in traditionele corpora te combineren met woorden uit het basisvocabolarium van een taal. Deze woordparen dienen op hun beurt om een aantal eerste URL's op te vragen en te verzamelen (seed URL's) waarin andere weblinken aanwezig zijn, die toegang geven tot andere webpagina's enz; de collectie van de webpagina's gebeurt bijgevolg op een recursieve manier (de zogenaamde web-crawling-techniek [Bernardini, Baroni & Evert 2006]). Voor het itWaC-corpus werden 1000 woordparen opgesteld, door gebruik te maken van
woorden met een gemiddelde frequentie in het la Repubblica-corpus én de volgende basiswoordenlijsten: http://www.bardito.com/language/italianenglishwordlist.html en http://mypage.bluewin.ch/a-z/cusipage/. Na enkele opschoonacties, zoals het verwijderen van (bijna-)identieke webpagina's en andere irrelevante mechanisch gegenereerde onderdelen, werden de woorden in het corpus grammaticaal geannoteerd en gelemmatiseerd. Het eindresultaat betreft een corpus van ongeveer 187.000 webpagina's, ter grootte van 30,6 GB, dat bijna 1,6 miljard tokens en circa 3,6 miljoen woordtypes telt. De volgende stap betreft de opbouw van de term-by-document matrix. De codering van de frequentie van de adjectieven in de documenten gebeurde op een binaire schaal, waarbij '0' en '1' respectievelijk afwezigheid en aanwezigheid in de webpagina onder beschouwing impliceren. Doordat we de frequentie van de adjectieven op deze relatief ongecompliceerde manier omzetten, omzeilen we de problemen die gepaard gaan bij de continue schaal van absolute frequentie van een adjectief per webpagina. Het meest bekende struikelblok, dat voortkomt uit Zipfs wet (1949), blijkt de relatie tussen hoogfrequente woorden (zoals divertente “leuk”, simpatico “aardig” en bello “mooi”) en laagfrequente woorden (zoals spensierato “onbezorgd”, variopinto “kleurrijk” of universale “universeel”) en hoe de eersten door hun gewicht het totale beeld kunnen vertekenen (Lowe 2001, Turney & Pantel 2010). We zullen later, bij de toelichting van de Jaccard-index, deze problematiek uitgebreider behandelen. Nu volstaat het nog te vermelden dat bij deze stap er geen verdere weging of transformatie plaatsvindt van de frequenties, in tegenstelling tot de praxis in andere SVS-designs (zie Turney & Pantel [2010] voor een overzicht). 4.2.2.2.
STAP 2: opbouw van de dissimilariteitsmatrix: de Jaccard-index
Nadat voor elk adjectief een corresponderende vector is opgesteld, dienen de adjectieven onderling vergeleken te worden. De mathematische operationalisering van deze vergelijking neemt de vorm aan van een symmetrische afstandsmatrix, ditmaal met dezelfde adjectieven zowel in rij- als in kolomposities. Er bestaat een verkennende multivariate statistische techniek, clusteranalyse genaamd, die de numerische informatie van zulke matrices aanwendt om een gepaste structuur te herkennen waarin bepaalde beschreven entiteiten, in ons geval de adjectieven, kunnen worden gegroepeerd (cfr. infra). Deze clustering gebeurt “in such a way that the similarity between two objects of the same group is maximal and the similarity between objects that belong to different groups is minimal” (Divjak & Fieller in publicatie). De keuze voor een binaire schaal voor de codering van de context moet ook geïnterpreteerd worden in het licht van de specifieke similariteitsmaat die wij gekozen hebben om de numerische samenstelling van de vectoren te herleiden naar afstands- of similariteitscoëfficiënten. Bijgevolg duiden deze coëfficiënten in de cellen van de afstandsmatrix dan de afstand aan –in taalkundige termen de grotere of kleinere gelijkenis– tussen de adjectieven onderling. We hebben proeven verricht met twee similariteitsmaten, namelijk de Jaccardcoëfficiënt en de cosinussimilariteit. Uiteindelijk bleek de Jaccard-similariteitsindex, waarop weliswaar een correctie werd toegepast, de best interpreteerbare resultaten op te leveren. Deze maat bezit enkele voordelen die bijzonder goed rijmen met de kenmerken van onze afstandsmatrix. De berekening van de semantische gelijkenis is relatief eenvoudig. Ten eerste betrekt het algoritme enkel de coördinaten van het
vectorenpaar waarvan geen van beide waarden niet negatief is. Anders gezegd, aangezien de coabsence van adjectieven in een webpagina weinig informatief is, i.e. de waarden in de kolom voor dat document zijn tweemaal 0, zal in de computatie geen rekening worden gehouden met die webpagina's waarin geen van beide adjectieven voorkomen. De Jaccardcoëfficiënt tussen twee vectoren berekent men vervolgens door het totale aantal positieve coördinatenparen te delen door de som van de kolommen waarin minstens één van de twee coördinaten van het paar positief is. De similariteitscoëfficiënt zelf zal steeds een maat zijn tussen 0 en 1. Die kan ook als een dissimilariteitsmaat geïnterpreteerd worden, door het bekomen cijfer af te trekken van 1. Deze dissimilariteitscoëfficiënt is de uiteindelijke index waarmee wij verder zullen werken, omdat de software voor de clusteranalyse zo'n dissimilariteitsmatrix als input vraagt. De Jaccard-dissimilariteitsindex biedt enkele voordelen ten opzichte van de cosinusmaat, in het bijzonder wat betreft het al aangehaalde probleem van de zipfiaanse distributie van het lexicon in corpora, en in het bijzonder van onze adjectieven. Door slechts de aanwezigheid van het adjectief in een webpagina in rekening te brengen, ongeacht het aantal voorkomens dat het adjectief in die webpagina telt, worden de specifieke frequentiekenmerken per webpagina van de adjectieven reeds in de codering deels geneutraliseerd. Hoogfrequente en laagfrequente adjectieven krijgen in feite dezelfde behandeling. Verder zorgt de specifieke samenstelling van de noemer voor een afvlakking van de verschillen tussen hoog- en laagfrequente adjectieven. Laagfrequente woorden en hun onderlinge associaties worden een relatief groter gewicht toegekend. Doordat men in de noemer de unie neemt van twee vectoren, en de zogenaamde gevallen van co-absence genegeerd worden, zal de afwezigheid van die laagfrequente woorden de totale som in de noemer niet doen toenemen, de Jaccard-index bijgevolg niet laten dalen en zo zal geen vermeende dissimilariteit tussen die woorden aantoond worden. Ook bij de associatie tussen hoog- en laagfrequente woorden zal de impact van die eersten getemperd worden doordat in de noemer het grote aantal ‘minstens één positieve coördinaat’ (grotendeels afkomstig uit de vector van die hoogfrequente woorden) de Jaccard-index zal doen dalen. De bovenbeschreven nivellering van de frequentieverschijnselen annuleert het probleem echter niet volledig, voornamelijk wat betreft de associaties tussen hoogfrequente woorden. Die vindt men waarschijnlijk in een groter aantal documenten, eenvoudigweg omdat ze typisch een flexibele, wat holle betekenis hebben die hen toelaat als passe-partoutwoorden in meerdere registers of onderwerpen gehanteerd te worden. Vanwege die eigenschappen zullen veelvoorkomende adjectieven dus vectoren vormen met veel positieve waarden. Het grote aantal positieve matches tussen twee adjectieven heeft een grote impact in de formule van de Jaccardcoëfficiënt: hoe groter de teller des te groter de similariteit tussen adjectieven. Dat resulteert in de overschatting van vele associaties door te veel belang te hechten aan adjectiefparen waarvan de korte afstand in feite niet of in slechts in lichte mate overeenstemt met een semantische gelijkenis. Het hoge totale aantal voorkomens (i.e. alle eentjes in een vector) van zulke frequente woorden kan het gevolg zijn van een verspreid en niet-specifiek gebruik van die woorden. Dat zou eerder als verklarend verband gelden, in tegenstelling tot een semantisch verband, dat er hoogstwaarschijnlijk niet is. Zoals eerder aangestipt, hebben we dan ook enkele bijsturingen doorgevoerd aan de beschreven similariteitsmaat. Het achterliggende idee is de herschaling van die afstanden zodat kleinere
afstanden, waarachter het risico op overassociatie schuilgaat, iets groter worden en grotere afstanden, die hoe dan ook in semantisch opzicht nietszeggend zijn, nog groter worden gemaakt. Aanvankelijk construeren we een matrix waarin per rij (en dus per adjectief) elke cel de rangorde weergeeft van het respectievelijke Jaccard-coëfficiënt die in dissimilariteitsmatrix berekend werd. De kleinste Jaccard-coëfficiënt voor een adjectief, die grootste gelijkenis representeert tussen twee adjectieven, krijgt rang 1, de volgende coëfficiënt rang 2 etc. De rangordes worden zelf binnen een rij niet geordend, maar nemen gewoon de plaats in van de coëfficiënten waarvan ze de rang uitdrukken. De verkregen matrix is in feite een item-by-feature matrix, aangezien in de rijen de items worden voorgesteld, i.e. de adjectieven, en in de kolommen de kenmerken voor dat item worden weergegeven, namelijk telkens de rang van de Jaccard-index van een bepaald adjectievenpaar. De volgende stap bestaat uit een dubbele log-transformatie: eerst berekent men de logaritme van de rang en vervolgens neemt men de logaritme van 1 plus dat eerste logaritme [log(1+log(rang))]43. Het verschil tussen de getransformeerde rangen is het grootste tussen de eerste rangen, maar naarmate de rang toeneemt, zullen de verschillen kleiner worden. Dat de verschillen kleiner worden tussen de laatste rangen beantwoordt eigenlijk aan onze intuïtie dat de kleinste gelijkenissen ook weinig doorslaggevend en het minst informatief zullen zijn voor de vorming van de clusters. De laatste stap betreft de omvorming van de item-by-feauture matrix naar een nieuwe afstandsmatrix, die ditmaal aan de hand van de euclidische afstandsfunctie berekent wordt. 4.2.2.3.
STAP 3: uitvoering van de clusteranalyse
Binnen de familie van de clustertechnieken maken wij gebruik van het subtype genaamd kmedoids clustering, een zusterstechniek van de, eveneens niet-hiërarchische (of partitioning) kmeans clustermethode (Baayen 2008, Gries 2008, Divjak & Fieller in publicatie). Een belangrijke eigenschap van deze groeperingstechniek is het vast aantal a priori-bepaalde clusters waarin de entiteiten moeten gegroepeerd worden. Het vastleggen van de clusters volgt de vuistregel die stelt dat elke cluster, opdat hij consistent zou zijn voor verdere berekening, minstens 25 entiteiten zou moeten bevatten. Aangezien ons experiment 544 types adjectieven heeft voortgebracht, stellen we de parameter van het aantal te vormen clusters op 20. Het tweede kenmerk, die k-medoids clustering onderscheidt van k-means clustering, is de identificatie van het centrum waaruit de clusters worden gecreëerd, i.e. het startpunt vanwaaruit de afstanden worden gemeten tot de andere punten. De k-medoids methode neemt een van de aanwezige punten in de datawolk als centrum, terwijl k-means clustering het startpunt creëert door berekening. Wanneer die centrumpunten of medoids niet op voorhand zijn geselecteerd, zoals in ons geval, zal het PAM-algoritme (Partitioning Around Medoid) zelf de meest representatieve centrumpunten zoeken voor het k-aantal clusters. In theorie zijn er ontelbare mogelijkheden om clusters te vormen, gegeven de objecten in onze dataset (n=544) en de clusters waarin we ze willen ressorteren (k=20). Daarom rust de techniek op een iteratieve procedure opdat de beste oplossing, zij die de structuur van de data het best kan vatten, gevonden wordt. Telkens worden de datapunten toegewezen aan een medoid waar ze het dichtstbij staan. Vervolgens wordt de 43
Aangezien een logaritmische functie het nulpunt bereikt bij x=1 [log(1)=0], is de logaritme van dat logaritme gelijk aan de logaritme van 0, wat op zijn beurt geen natuurlijk getal oplevert, maar een asymptoot naar min oneindig. Onze item-by-feature matrix bevat echter cellen met het getal één, i.e. de eerste rang. Daarom zijn we genoodzaakt die eerste logaritme te vermeerderen met één. Log(1+log(1)) geeft dan 0.
berekening opnieuw uitgevoerd en gaat het algoritme na of objecten bij een dichtere medoid toegewezen kunnen worden dan diegene waar ze daarvoor waren toegewezen. Het algoritme stopt op het moment dat tussen de voorlaatste en de laatste clustering geen verbetering meer gedetecteerd wordt. Bij 17 van de 20 clusters konden we een semantisch domein of dimensie vinden waartoe het merendeel van de adjectieven van een cluster herleid kon worden. In geval van twijfel, wanneer schijnbaar meerdere semantische velden in de cluster waren vertegenwoordigd, hielden we rekening met de adjectieven met de hoogste silhouettebreedte (cfr. infra). Vooraleer we de opsomming aanvangen, willen we nogmaals benadrukken dat de clusteranalyse erop gericht is ‘neutrale’ semantische velden op te sporen en niet positieve of negatieve groepen van evaluerende adjectieven. Als we in onze beschrijving positief of negatief geladen termen gebruiken om de clusters te benoemen, dan betekent dat slechts een arbitraire keuze die we hebben moeten maken. De richting van zo’n etiket verbergt evenwel zowel positieve als negatieve evaluaties, met soms een overwicht van een van beiden. De eerste cluster (C1) bevat naar onze mening woorden die te maken hebben met een vorm van moreel, artistiek en karakterieel overwicht (SUPERIORITÀ). De tweede groep adjectieven wijst ogenschijnlijk op de grillige persoonlijkheidseigenschappen van toneelspelers (TEATRALITÀ), terwijl in cluster 3 (C3) de bekende beschavingsclash stad-platteland aanwezig lijkt (CIVILTÀ). De vierde cluster (C4) bevat adjectieven die voornamelijk een stijf en onverbiddelijk karakter aanduiden (RIGIDITÀ). De vijfde cluster (C5) verzamelt woorden die men doorgaans associeert met communicatieve eigenschappen van de spreker of met taal tout court, in het bijzonder met al dan niet dynamische kwaliteiten (DINAMISMO). In de zesde groep (C6) ontwaren we dan weer adjectieven rond de typische jongerenpopcultuur (POP). In cluster (C7) troepen duidelijk de woorden samen die wijzen op allerhand vulgariteiten (VOLGARITÀ). Cluster 8 (C8) is de eerste van de drie clusters waaraan we geen semantisch etiket hebben kunnen plakken. De negende cluster (C9) introduceert het semantische domein van ruimte, beweging en de sociale aspecten die bij mobiliteit horen, niet erg verschillend van de zopas besproken antithese stad-platteland (MOBILITÀ). In de tiende groep (C10) verzamelen de adjectieven die te maken hebben met een al dan niet serieuze en waardige houding (COMPOSTEZZA), terwijl in cluster 11 (C11) adjectieven aanwezig zijn die naar onze mening gebruikt worden om overweldigende of charmerende ervaringen te beschrijven (FASCINO). Net zoals in C5, wijst cluster 12 (C12) op zeer diverse retorische of fonetische kwaliteiten, waardoor we geneigd zijn deze categorie eenvoudigweg met ‘stem’ (VOCE) te etiketteren. De dertiende groep (C13) bevat adjectieven die ondergebracht kunnen worden in het semantische veld van de verfijnde, maar hooghartige manieren, zowel in spreken als in handelen (ELEGANZA). Cluster 14 (C14) komt dicht in de buurt van cluster 7, met het, volgens ons, nuanceverschil dat in de veertiende cluster de arrogantie en de usurpatie in de verf worden gezet (ARROGANZA). De vijftiende cluster (C15) verzamelt woorden die enerzijds een lichtvoetig en onbezorgd gedrag indexeren en anderzijds ernst en plechtigheid (PESANTEZZA). In cluster 16 (C16) vinden we dan weer duidelijk adjectieven die een uitzonderlijk en buitengewone persoonlijkheid –of de tegenovergestelde karaktereigenschappen– beschrijven (GENIALITÀ). De voorlaatste cluster die we konden interpreteren is cluster 17 (C17), waarin de woorden ogenschijnlijk elk een soort van aanhoudendheid en zelfs hardnekkigheid impliceren (INSISTENZA) op uiteenlopende vlakken. De laatste groep adjectieven (C20) kan voornamelijk
met de beschrijving van exotische oorden geassocieerd worden (ESOTICITÀ). De overige twee redelijk grote clusters (C18 en C19) bevatten te veel ongerelateerde semantische velden, bestaande uit drie of vier adjectieven, waardoor het onmogelijk was om die één zinvolle overkoepelende benaming te verschaffen. In de appendix vindt men de volledige samenstelling van de clusters. 4.2.2.4. STAP 4: Visualisatie van de semantische velden: correspondentieanalyse Taalkundige toepassingen van de clustertechniek zowel in inleidende handboeken (Baayen 2008, Gries 2008) als in onderzoekspublicaties (Gries & Hilpert 2008, Divjak 2010) opteren vaak voor dendrogrammen als visuele representaties van de gevonden clusters. Daarnaast blijkt in taalkundige kringen de hiërarchische clusteranalyse te primeren op de niet-hiërarchische varianten. Dendrogrammen zijn een geschikt hulpmiddel wanneer men een beperkte hoeveelheid objecten moet weergeven, maar het is evident dat onze grote verzameling van adjectieven nooit overzichtelijk in een boomstructuur gemodelleerd kan worden. Bovendien zou een dergelijke visualisatie de uiteindelijke bedoeling van ons onderzoek net niet bereiken. De semantische domeinen, waaruit de taalgebruiker inspiratie haalt om over taalvariatie te spreken, mogen dan wel aan het licht gebracht zijn, we weten nog niet met welke specifieke regionale variëteiten ze geassocieerd worden. Binaire correspondentieanalyse is opnieuw een verkennende statistische techniek die precies de noden tegemoetkomt in de laatste stap van het Free Response Experiment, namelijk ontdekken welke clusters correleren met de Italiaanse regiolecten. Een corrispondentieanalyse ontvangt als input een contigentietabel, i.e. een tabel met de frequenties van bepaalde entiteiten (de rijelementen) voor enkele variabelen (de kolomelementen) (Glynn in publicatie). Daarna wordt een afstandsmatrix opgebouwd aan de hand van de Pearson chi-kwadraatstatistiek, en die chi-kwadraatscores worden geïnterpreteerde als Euclidische afstanden. Ten slotte wordt de verkregen multidimensionele Euclidische ruimte gereduceerd tot een twee- of driedimensionele grafische visualisatie (een biplot), waarin het mogelijk wordt het correlerend gedrag van de entiteiten onderling te inspecteren alsook de structurerende invloed van de variabelen op de positie van de entiteiten. Omdat we slechts één variabele in acht nemen, namelijk de regionale taalvariëteit waarvoor het adjectief wordt gegeven, is de specifieke naam binaire correspondentieanalyse. De elementen waarvan we de onderlinge relatie aan het licht willen brengen, zijn uiteraard de adjectievenclusters. Ons perspectief is echter lichtjes verschillend: wij zijn namelijk eerder op zoek naar hoe de elementen met de variabelen correleren, dan hoe de elementen onderling correleren. Het opstellen van de contigentietabel vindt plaats door de som te nemen van de frequenties van de adjectieven van een bepaalde cluster die aan een variëteit werden toegeschreven. Als rustico (“rustiek”) , paesano (“boers”) en moderno (“modern”) een hypothetische cluster vormen en in het experiment 12, 15 en 6 keer werden genoemd bij het Napolitaanse Italiaans, dan is 33 de celwaarde in de tabel voor die cluster en die taavariëteit. Onderstaande tabel geeft de frequenties weer van de semantische dimensies per regiolect.
DIMENSIE
REGIOLECT Milano Firenze Roma Napoli
Superiorità
23
34
42
36
Teatralità
5
6
26
27
Civiltà
21
19
33
15
Rigidità
12
45
21
26
Dinamismo
10
2
6
3
Pop
4
2
2
10
Volgarità
5
3
7
3
x
3
2
8
9
Mobilità
18
19
24
21
Compostezza
8
4
1
1
Fascino
27
146
116
97
Voce
3
9
6
9
Eleganza
25
4
0
3
Arroganza
7
5
8
5
Pesantezza
20
10
4
15
Genialità
12
9
27
25
Insistenza
49
5
5
6
y
13
3
8
8
z
4
10
8
9
Esoticità
15
18
8
19
Table 13: contingentietabel met rijen = semantische velden * kolommen = variëteiten
We constateren dat enkele dimensies, zoals SUPERIORITÀ, CIVILTÀ, RIGIDITÀ, MOBILITÀ en GENIALITÀ en de uitschieter FASCINO, bijzonder inspirerende bronnen zijn voor de karakterisering van de regionale variëteiten. Niettemin worden de meeste semantische velden zelden aangewend om over diezelfde variëteiten te spreken. Dataschaarste kan de interpretatie van het model negatief beïnvloeden en men stelt dat “cells of less than eight cells tend to cause distortion in the analysis” (Glynn in publicatie). De tabel bevat veelvuldig schaarsbevolkte cellen, maar wij kiezen ervoor die occasionele clusters niet vooraf te verwijderen en de impact in een post-hoc-kwaliteitsbepaling van de correspondentie-analyse te evalueren. Aangezien het aantal kolommen min één gelijk is aan het aantal dimensies van de ruimte waarin de data maximaal kan gemodelleerd worden, is het mogelijk de volledige structuur van de data in een driedimensionele grafiek te visualiseren. We opteren evenwel voor een klassieke visualisatie in twee dimensies. Ten eerste draagt de derde dimensie, in procentuele termen, in kleine mate bij tot de totale variatie (7,5%). Dat betekent ook dat we potentieel 7,5% van de variatie aanwezig in de data niet adequaat kunnen weergeven in een biplot. Ten tweede komt het interactieve
voordeel van zo’n representatie niet tot uiting op een statisch document zoals dit en dreigt zelfs de grote leesbaarheid van zulke grafieken geannuleerd te worden. De eerste dimensie verklaart grote porties van de variatie (75,7%), bijgestaan door het lager verklarend vermogen van de tweede dimensie (16,8%). De analyse van de grafische output kan in feite wel twee belangrijke tendensen aan het licht brengen: de positie van de regiolecten onderling en de semantische domeinen die geassocieerd worden met die regiolecten.
4.3. Interpretatie, discussie en evaluatie van het SVS-model 4.3.1. Welke concepten gebruikt men om regionale variëteiten te beschrijven?
De biplot lijkt een opvallend trouwe weerspiegeling te zijn van de op stereotypen gefundeerde houding van onze Zuid-Italiaanse informanten tegenover de regiolecten op het schiereiland. De ruimtelijke afstand die het Milanese Italiaans scheidt van de andere taalvariëteiten kan als een vertaling beschouwd worden van de verwachte attitudinele, bijna discriminerende afstand tegenover dat regiolect. De Napolitaanse en de Romeinse variëteiten blijken dan weer bijnaidentieke posities te bezetten, wat ons aanzet te veronderstellen dat de twee regiolecten worden gekenmerkt door vrijwel dezelfde semantische velden en gelijkaardige frequenties waarmee zij ingezet worden. Het Florentijnse Italiaans staat lichtjes geïsoleerd ten opzichte van de rest, maar nog steeds ver verwijderd van het Milanees. De relatieve naburigheid van het Napolitaans en het Romeins kunnen ook het gevolg zijn van de tweedimensionele vertekening van de driedimensionele ruimte. De numerische output van de correspondentieanalyse verschaft kwaliteitsscores waarmee de graad van precisie van de visualisatie per punt kan worden nagegaan. Het Florentijnse en het Milanese regiolect worden voor 100% correct gevisualiseerd
door de biplot, het Romeinse Italiaans krijgt een 75%-score, terwijl de Napolitaanse variëteit (55%) wel eens anders kan gepositioneerd worden dan de tweedimensionele dimensiereductie ons doet vermoeden. Grote voorzichtigheid is dus gebaat bij de interpretatie van vooral dat laatste regiolect. De onnauwkeurige visualisatie even terzijde, merken we dezelfde tendensen op die Cortelazzo (1974) veertig jaar geleden voorspelde, namelijk dat de puristische as FlorenceRome die in de fascistische periode werd verheerlijkt, verzwakt is en dat Rome haar antieke zuiderse roeping teruggevonden heeft en doet herleven in een aantal fonetische veranderingen.Het is mogelijk dat die veranderde oriëntatie ook gepercipieerd wordt door onze participanten en dat die talige toenadering heeft geleid tot gelijkaardige conceptualisaties van de twee variëteiten. Deze interpretatie moet eveneens met fluwelen handschoenen behandeld worden. Het oproepen van dezelfde concepten om twee variëteiten te beschrijven is een taak die onafhankelijk moet beschouwd worden van de negatieve of positieve evaluatie van die variëteiten, waarin de echte oorzaak van de vermeende toenadering moet gezocht worden. Ook de semantische domeinen die de variëteiten helpen karakteriseren, kunnen verschillende kwaliteitsscores krijgen naargelang hun accurate visualisatie in de biplot. Lage tot zeer lage, problematische scores (onder de 50%) worden gegeven aan de velden CIVILTÀ (16,9%), POP (19,8%), ESOTICITÀ (32,8%) en VOLGARITÀ (41,4%). We zullen bijgevolg speciale aandacht schenken aan sommige van deze dimensies, door occasioneel een beroep te doen op een driedimensionele grafiek. Daartegenover staat dat de grote meerderheid van de andere velden met grote precisie weergegeven worden, met een score boven de 80%, met uitzondering van ARROGANZA (60%), VOCE (67,2%), PESANTEZZA (75,5%). • De semantische dimensies die het sterkst geassocieerd worden met het Milanese Italiaans zijn DINAMISMO, INSISTENZA, ELEGANZA, COMPOSTEZZA en PESANTEZZA. Wanneer aan proefpersonen gevraagd wordt een beeld te vormen van de Milanees en zijn taal dan zullen zij waarschijnlijk verbanden leggen met de zorg voor (positief) of de verwaarlozing (negatief) van het uiterlijk en de goede manieren, maar ook met een vaak saaie communicatieve stijl die, al dan niet, gelinkt kan worden aan het stereotype van de Milanees als harde werker maar ook nietsontziende homo economicus. • Met het Italiaans gesproken in Florence worden voornamelijk twee domeinen geassocieerd, namelijk FASCINO en RIGIDITÀ, en in mindere mate ook VOCE. De adjectieven in deze drie clusters zijn opvallend bijna allemaal positief, waardoor we kunnen stellen dat het overwegend positieve stereotype van de Florentijn en het Florentijns beschreven worden in termen van bewondering en ontzag, als het ware een taalkundig referentiepunt waarvan de respondenten nog zeer bewust zijn, gezien het feit dat ze veel adjectieven putten uit semantische veld van de retorische en fonetische kwaliteiten. De aanhoudende gewoonte om Florence nog steeds als het prestigieuze talige centrum van het land te beschouwen, lijkt in geen geval te zijn verdwenen. • De beschrijving van het Romeinse en het Napolitaanse regiolect kan, zoals eerder gezegd, niet rechtstreeks akritisch uit de biplot gehaald worden. De meest kenmerkende domeinen voor het Napolitaanse Italiaans, die dankzij de voorstelling in drie dimensies blootgelegd worden, zijn TEATRALITÀ, POP en GENIALITÀ. Die laatste wordt overigens gedeeld met het Romeinse Italiaans. Onze Zuid-Italiaanse participanten beschrijven hun eigen regiolect aan de hand van dezelfde concepten waarvoor ze zelf vaak gestigmatiseerd worden, namelijk alles
•
wat met theatraal en overdreven gedrag te maken heeft. Tegelijkertijd putten ze hun inspiratie uit het domein van het unieke (positief, waarschijnlijk) of het dagelijkse (negatief, weinig waarschijnlijk), en het universum van de populaire jongerencultuur. Het algemeen zelfbeeld dat hier uitkomt, lijkt dat van energieke en melodramatische held. Dat dit regiolect ook deels geassocieerd wordt met stemkwaliteit (VOCE) kan een indicatie zijn dat de grotere kennis van en het vertrouwen in de eigen taalvariëteiten de poorten opent tot een meer gespecialiseerd woordenschat om over taal variatie te spreken. GENIALITÀ en SUPERIORITÀ zijn, ten slotte, de twee semantische velden die het sterkst correleren met het Romeinse regiolect. Ook CIVILITÀ bevindt zich dicht in de buurt, maar de interpretatie daarvan is moeilijker vanwege de lage kwaliteitsscore. We kunnen ons evenwel inbeelden dat de conceptualisatie van de stad-plattelandtegenstellingen een rol kan spelen in de grotere of kleinere aantrekkingskracht die een taalvariëteit en zijn sprekers kunnen uitoefenen. De sterkere associatie van deze dimensie met het Romeins is dan ook niet verwonderlijk, gezien de plausibele oriëntatie van de zuiderlingen naar deze variëteit. De overwegend positieve adjectieven in deze twee clusters doen vermoeden dat het Italiaans in Rome en de Romeinen voor onze respondenten dat overwicht bezitten om taalkundig gezag in te boezemen op de Zuid-Italianen en als norm en normdragers geaccepteerd te worden, al kan die superioriteit op zich ook negatief ervaren worden. De andere dimensie, GENIALITÀ, kan in dat opzicht nog geen definitief uitsluitsel geven daarover, aangezien in die cluster zich zowel positieve (van het uitzonderlijke type) als negatieve (van het banale type) adjectieven bevinden.
4.3.2. Evaluatie van het SVS-model Wie dit afsluitende deel leest, kan de indruk krijgen dat wijzelf niet volledig overtuigd zijn door onze computationeel-semantische benadering, omdat we niet over de gehele lijn een stevige ‘positieve’ beoordeling kunnen geven. Meer nog, de kritische punten zullen in de meerderheid zijn. We willen echter vanaf het begin geen enkel misverstand daarover laten bestaan. Het vermelden van nog evidente tekortkomingen die aan het licht zijn gekomen en andere kleine hindernissen die we hebben ondervonden, is juist een taak die dient om een diepere theoretische reflectie op gang te brengen en de technieken te perfectioneren. De combinatie van sociaalpsychologisch attitudeonderzoek en distributioneel semantische methodes opent nieuwe en bijzonder interessante perspectieven. Wat we zullen aankaarten zijn dan eerder kinderkwaaltjes, eigen aan zulk vernieuwend onderzoek, die geenszins de discussie in de kiem willen smoren. In het taalkundige onderzoek dat een steeds groter empirisch fundament beoogt, zijn grote webcorpora een meer dan welkom instrument om dat doel te bereiken. De immense verzameling taalkundig materiaal dat het web ter beschikking stelt en constant aanvult, biedt de kans om problemen rond dataschaarste te tackelen, relevant bij statistische analyses, en om tegelijkertijd de meest recente taalkundige tendensen weer te geven (Baroni & Ueyama 2006, Ferraresi 2007). De kwestie die ons het meest aanbelang is evenwel die van de representativiteit (Kilgarriff & Grefenstette 2003): welk taalgebruik wordt gerepresenteerd door het ItWac-corpus? Bij de introductie van het corpus hebben we de procedure beschreven waarmee de teksten werden verzameld. Het voordeel van die aanpak is dat het corpus een veel gediversifieerde palet aan
genres en argumenten bestrijkt, waaronder “nieuwe” genres, zoals blogs en chatfora, maar evenzeer journalistieke en academische teksten. Het negatieve aspect van zo’n gretige verzameling is dat “the researcher often does not have full control over what ends up in the corpus, and can only estimate the composition of the corpus with post-hoc methods” (Baroni & Ueyama 2006: 2). Bijgevolg is het waarschijnlijk dat men in zo’n corpus ook een grote verscheidenheid aan registers aantreft, van formele schrijftaal naar quasi-gesproken taalgebruik, waardoor men zelfs van compleet verschillende communicatieve acties kan spreken. De veelheid impliceert dus ook een bijna onhandelbare heterogeniteit, die tot uiting komt in de vorming van de clusters. We gingen op voorhand ervan uit dat ons SVS-model woorden zou samenbrengen die semantisch gerelateerd of gelijkwaardig zijn (semantic similarity, relatedness), omdat woorden die dezelfde teksten voorkomen, tot eenzelfde argument of, algemener, semantische veld kunnen herleid worden. Zoals Sahlgren (2008) echter terecht opmerkt is het impliciete idee dat een tekst een coherente topiceenheid is, een artificiële notie die men in werkelijkheid nergens aantreft, maar is een simplificatie uit het universum van de information retrieval . Als men zulke brede contextdefinities aanhangt, dan zal men heel wat semantisch incompatibele woorden tegen het lijf lopen en bijna elke term kan co-occurreren met een eender welke andere term. Door de gevonden clusters te bestuderen, zijn we tot de vaststelling gekomen dat relatie tussen de woorden, naast de semantische gelijkenis, ook een andere vorm aanneemt, namelijk een soort registersimilariteit. Een markant voorbeeld is dat van de adjectieven bello en bellissimo, respectievelijk de stellende trap en de superlatief van “mooi”. De twee adjectieven kunnen niet anders dan tot hetzelfde semantische veld behoren, ‘schoonheid’ bijvoorbeeld. Niettemin wordt de ene in cluster 11 ingedeeld en de andere in cluster 6. Zo komt bellissimo in dezelfde groep te zitten als truzzo, strafico, casinaro en discotecaro, namelijk de cluster waarin wij termen uit de populaire jongerencultuur hebben ontwaard. Het zou misschien correcter zijn om te stellen dat niet alle adjectieven dat “coole” universum beschrijven, maar sommige, zoals bellissimo, in dat universum eerder gebruikt worden. De identificatie van de clusters was daarom een redelijk hachelijke zaak. De k-medoids variant vereist dat op voorhand het aantal clusters vastgelegd wordt, waardoor men het risico loopt te veel of te weinig categorieën te creëren. In het ene geval worden clusters onderscheiden die eigenlijk minimale verschillen vertonen in hun samenstelling, en in het andere geval worden clusters gevormd die zo groot zijn dat hun interpretatie een zeer moeilijke kwestie wordt, omdat elke cluster meerdere thema’s bevat. Zo blijkt, naar onze mening, slechts een nuanceverschil te bestaan tussen clusters 7 en 14: beiden bevatten namelijk veel termen die verwijzen naar ‘arrogantie’. Hetzelfde probleem troffen we aan bij clusters 5 en 10, die allebei aan taal- en stemspecifieke kenmerken refereren. Bovendien kon voor enkele clusters (C8, C18 en C19) geen gemeenschappelijke noemer gevonden worden. Over het algemeen moeten we toegeven dat ondanks, of misschien juist vanwege, de statistische fundering van onze methodologie, er weinig strikte, te gehoorzamen richtlijnen voorhanden zijn waarmee de clusteranalysis moet uitgevoerd worden. De verschillende procedures worden grotendeels gestuurd door een set aan vuistregels en intuïtieve keuzes. De techniek is nog steeds onderworpen aan verbetering en er bestaan vooralsnog weinig controlemaatregelen, zoals de die de kwaliteit van de clusters kunnen beoordelen.
Het is evenwel mogelijk om de kwaliteit van het lidmaatschap van een entiteit tot een cluster te evalueren, en zo de coherentie van een hele cluster te bepalen, dankzij de berekening van de silhouettebreedte (silhouette-width) van zo'n entiteit (Rousseeuw 1987). Men berekent eerst de gemiddelde afstand van de entiteit i, ondergebracht in een cluster A, tot alle andere entiteiten die behoren tot diezelfde cluster A. Daarna voert men dezelfde berekening uit voor elke andere cluster. Uiteindelijk selecteert men tussen alle clusters de meest dichtstbijzijnde cluster B, en men berekent opnieuw de gemiddelde afstand van i tot de andere entiteiten van cluster B. De silhouette is het verschil tussen die twee gemiddelde afstanden gedeeld door de grootste gemiddelde afstand onder beide. Een negatieve clusterkwaliteit impliceert een niet-adequate lidmaatschap van entiteit i tot de initiële cluster A, een positief getal betekent dat die entiteit waarschijnlijk correct tot die cluster A is ingedeeld. De initiële clusters bevatten dus zowel elementen met negatieve als positieve silhouettebreedte, maar, vanwege hun ongeschiktheid, verwijderden we de eersten zodat we enkel bleven werken met de correct ingedeelde adjectieven. De clusteranalyse werd uitgevoerd aan de hand van een gecorrigeerde Jaccard-index, omdat daarmee de gegenereerde clusters voldoende entiteiten bevatten en bovendien redelijk intuïtief interpretabel waren. Pogingen met een niet-gecorrigeerde Jaccard-index of de zowel gecorrigeerde als niet-gecorrigereerde cosinussimilariteit bleken dus slechtere resultaten te geven. Het criterium dat wij gehanteerd hebben bij onze keuze is gebaseerd op de zojuist beschreven silhouettebreedte. Het komt erop neer dat de clusteranalyse uitgevoerd met de gecorrigeerde Jaccard-index, in totaal de meeste adjectieven overhield met een positieve silhouette, i.e. de meest bruikbare adjectieven die het best geassocieerd waren met de cluster waarin ze waren ingedeeld. Onderstaande tabel geeft per similariteitsmaat het aantal adjectieftypes die een positieve silhouette kregen en dus werden overgehouden voor de interpretatie. Similariteitsmaat Cosinu Jaccard Cosinus (gecorrigeerd) Jaccard (gecorrigeerd)
Goede associaties adjectieftypes) 264 (48,5%) 175 (32,2%) 327 (60,1%) 332 (61,0%)
(uit
544
Het valt meteen op dat het grote kwaliteitsverschil te danken is aan de doorgevoerde correcties, die het clusteralgoritme toelaten een consistentere structuur in de data aan te brengen. De nietgecorrigeerde maten scoren ondermaats: minder dan de helft van alle adjectieven kregen een negatieve silhouettebreedte, wat betekent dat de meerderheid van de adjectieven in een andere cluster kon worden geressorteerd. De herschaling van de afstanden, door middel van de rang van de afstanden en vervolgens de euclidische afstand van die rangen, heeft dus een significant positieve impact gehad op het clusteralgoritme. Dat we uiteindelijk toch voor de gecorrigeerde Jaccard-index hebben geopteerd, ondanks het minieme kwantitatieve verschil met de gecorrigeerde cosinusmaat, is te danken aan de iets doorzichtere samenstelling van de door de Jaccard-index gegenereerde clusters.
5. Synthese, concluderende opmerkingen en suggesties voor toekomstig onderzoek Deze meesterproef heeft zich ten doel gesteld om een bewijs te leveren van de standaardiseringsdynamieken die het taalkundige panorama van het Italiaanse schiereiland de laatste decennia grondig aan het schudden zijn. Om veranderingen in het taalgebruik en de creatie van een nieuwe taalnorm te verklaren, hebben we expliciet een sociaalpsychologische benadering bepleit. Onze overtuiging is dat de motor van taalverandering gezocht moet worden in de manier waarop taalvariatie door sprekers aangewend wordt om een sociale identiteit te construeren. Het fundamentele idee is dat als we ons willen identificeren met een groep, of, meer in het algemeen, als we goedgunstig staan tegenover een groep, dat we dan de taalkenmerken van die groep zullen overnemen. De Italiaanse situatie leek ons een bijzonder geschikt geval om zulke dynamieken aan het werk te zien. Het taalpanorama wordt immers gekenmerkt door een aantal regionaal variëteiten van het Italiaans, die allemaal een bepaalde status bezitten, en waaraan specifieke stereotypen toegewezen worden. De redenering kan dus als volgt samengevat worden: als de Italiaanse sprekers prestige zullen toekennen aan een sociale groep in een geografisch gebied, die een bepaald regiolect spreekt, dan zullen ze gemakkelijker aanvaarden dat de taalnorm geïdentificeerd moet worden met het regiolect uit dat gebied. Het delicate onderzoek naar de verandering van psychologische en ideologische waarden, kortom de social meaning die men hecht aan regionale varianten en variëteiten, heeft in de eerste plaats een grondige methodologische voorbereiding en reflectie vereist, opdat zulke waardevolle maar bijzonder volatiele attitudes ten volle aan het licht zouden komen. We kozen voor een tweeledige experimentele aanpak: we geloven immers dat het inzetten van verschillende technieken, die specifieke troeven bezitten en elkaars tekortkomingen aanvullen, een ruimere visie biedt op de attitudes van onze participanten. Attitudes werden dus op twee manieren verzameld: enerzijds aan de hand van een verbal guise experiment (VGE), waarin de aandacht van het attitudineel object, i.e. de Italiaanse regiolecten, gedevieerd werd; anderzijds door middel van een free response experiment (FRE), waarin de proefpersonen werd gevraagd rechtstreeks de attitudinele objecten te kenmerken. Voor het eerste experiment maakten we dus gebruik van een typisch instrument van de sociale taalpsychologie (social psychology of language), die een lange traditie kent in het attitudeonderzoek; voor het tweede experiment pasten we de principes van het computationeel-semantische onderzoek toe, wat in feite het vernieuwende aspect is van deze scriptie. De volgende alinea’s maken een terugkoppeling naar de onderzoeksvragen uit het tweede hoofdstuk en behandelen zo de voornaamste resultaten van onze studie. Onderzoek A Het indirecte experiment (de VGE) toont een zeer gevarieerd beeld, waarin voornamelijk homogene attitudeprofielen per leeftijdscohorte kunnen ontwaard worden. Er waren hoofdzakelijk drie dimensies die de factoranalyse aan het licht kon brengen: Speaker Status, Speech Status en Speaker Solidarity. Wij bestudeerden ook de Speech Attractiveness-dimensie, die evenwel anders was samengesteld dan de vorige drie factoren. De attractiviteitsdimensie viel immers samen met precies één stelling. Een eerste opvallende vaststelling betreft de grote
gelijkenis tussen de solidariteitsdimensie, die betrekking heeft op de sprekers, en de ‘schoonheid’-dimensie, die gelinkt is aan de variëteit op zicht. De esthetische waardering van een variëteit correleert m.a.w. goed met de sociale vaardigheden en het persoonlijke karakter van die persoon. De oudste respondenten lijken, qua attitudeprofiel, het meest gehecht te zijn aan de ‘oude’ configuratie: de standaardtaal en zijn sprekers genieten nog enorm veel status, net zoals het Napolitaanse Italiaans, dat zij waarschijnlijk de hoogst haalbare vorm van Italiaans beschouwen. Het Milanese Italiaans wordt dan weer significant negatief beoordeeld op de solidariteitsdimensie: voor hen lijkt er geen reden te zijn om goedgunstig te staan tegenover deze geografisch, linguïstisch en cultuureel zeer verre groep. De middelste categorie beoordeelt de sociale vaardigheden van de Florentijnse en Romeinse sprekers bijzonder hoog en geeft significant positieve statusscores aan het Milanese Italiaans en zijn sprekers. Over het algemeen spreekt de jongste groep zich negatief uit tegenover de meeste variëteiten in de vier dimensies; in de schaarse gevallen dat ze dat niet doet, is het waard die niet-negatieve beoordeling onder de loep te nemen, wat in de volgende alinea onderzocht wordt. Zo zijn het Milanese Italiaans en het Standaarditaliaans de enige variëteiten die geen significant negatieve beoordeling krijgen op de Speech Status-dimensie. Onderzoek B Tussen de Speech Status- en de Speaker Status-dimensie zijn wat verschillende scores op te merken, die een interessant licht kunnen werpen op de huidige standaardiseringstendensen. Het bovengeschetste profiel van de jongste groep is daarbij interessant. Dat kan namelijk wijzen op een toegenomen aanvaarding, of tenminste geen stellige afkeuring, van het Milanese accent als prestigedragend regiolect en bijgevolg als kandidaat om kenmerken ervan als oriëntatiepunten voor een nieuwe norm te beschouwen. Bij de middelste leeftijdscategorie zijn het Standaarditaliaans en het Milanese Italiaans zelfs de enige twee variëteiten die een significant positieve beoordeling krijgen op de dimensies Speech Status, wat een bijkomend bewijs is voor onze interpretatie. We mogen immers veronderstellen dat deze groep, die de ruggengraat vormt van een maatschappij, het meest gevoelig is voor statuskwesties en daartegenover een pragmatische houding aanneemt. Uit ons attitude-experiment lijkt dus een aannemelijke voorspelling dat de twee jongste groepen, die een grotere impact zullen hebben op de standaardtaalveranderingen, onmerkbare kenmerken zullen overnemen van het Milanese of algemeen noordelijke Italiaans. Het is dus mogelijk dat Italië naar een ‘demotisatie’-scenario stevent, zoals Kristiansen en Coupland het concept interpreteren. Onderzoek C Hoe hebben de adjectieven, verzameld met de FRE, het bovenstaande beeld verrijkt? De correspondentie-analyse toont een duidelijke tweedeling aan: het Napolitaanse, Romeinse en (in mindere mate) Florentijnse regiolect worden door andere semantische domeinen gekenmerkt dan het Milanese Italiaans. De eerste twee regiolecten associeert men vooral met larger-than-life gedrag, door adjectieven te kiezen uit de sfeer van het theatrale en het exceptionele. Het enige semantische domein dat specifiek in verband wordt gebracht met het Florentijnse Italiaans is dat van de rigueur en de strengheid, wat kan wijzen op de nog steeds levendige perceptie van het Florentijns als “beste en mooiste” taal. De velden die bijna uitsluitend kunnen worden
geassocieerd met de Milanese variëteit hebben te maken met dynamische taaleigenschappen, waardigheid, stijl, maar ook met aanhoudendheid en wijdlopigheid. Wat niet impliceert dat het Milanese regiolect en zijn sprekers onmiddellijk ook dynamisch, waardig, stijlvol, aanhoudend en wijdlopig zijn. De tegengestelde concepten, zoals statisch en frivool, kunnen namelijk ook in de respectievelijke categorieën ondergebracht zijn. Wat de FRE vooral aantoont is dat tijdens het schetsen van die noordelijke variëteit de zuidelijke participant uit een repertoire van conceptuele dimensies put, die niet van toepassing zijn voor de karakterisering van de andere drie variëteiten. De verklaring hiervoor kan zijn dat de beelden en de associaties omtrent het Milanees waaraan de zuiderlingen blootgesteld worden, van een andere aard kunnen zijn dan die van de andere variëteiten. Dat leidt tot verschillende associatienetwerken en anders geconstrueerde stereotypen. Onderzoek D De statistische verwerking van VGE’s is zodanig geperfectioneerd dat men precieze, betrouwbare en dus goed veralgemeenbare resultaten kan voorleggen met betrekking tot de relatieve configuratie van variëteiten in het waardesysteem van de sprekers. Tegelijkertijd lijkt zo’n experiment een misschien te oppervlakkig en te algemeen beeld te verschaffen, door op een wel zeer schematische manier attitudes weer te geven langs enkele status- en solidariteitsdimensies. De computationeel-semantische aanpak heeft in dat geval een oplossing geboden, omdat het, op basis van de gegevens van het FRE, de specifieke semantische domeinen kan creëren waarmee taalgebruikers spreken en denken over taalvariatie, wat resulteert in een zeer interessante en rijke kwalitatieve aanvulling. Spijtig genoeg staat de technische implementatie van zulke modellen nog in de kinderschoenen (cfr. infra), waardoor nog veel onzekerheden over de verkregen resultaten heersen en de interpretatie enigszins minder betrouwbaar is. Met andere woorden, de voordelen van de ene benadering zijn de nadelen van de andere: een combinatie van de twee was dus onontbeerlijk. Onderzoek E Tegelijkertijd mogen we niet vergeten dat de attitudes, en dus de input voor de analyses, fundamenteel anders zijn verkregen, namelijk op een onbewuste en bewuste manier. Aanvankelijk hoopten we dat de twee standpunten een synthetische visie mogelijk zouden maken, tegelijkertijd benadrukkend dat we evenzeer met problematische verschillen moesten rekening houden. Kan de correlatie tussen semantische velden en de regionale variëteiten de door het VGE geschetste attitudeprofielen bevestigen of ontkennen? In het algemeen kunnen we stellen dat de verkregen semantische domeinen niet gemakkelijk te vertalen en te groeperen zijn in status- of solidariteitsdimensies. Enerzijds vormt dat een positief argument, omdat zo wordt aangetoond dat de klassieke dimensies niet exhaustief een attitude beschrijven. Anderzijds verhindert dat het alomvattend inzicht waartoe we hoopten te komen door de combinatie van de attitude-experimenten. Feitelijk kunnen we geen vergelijking tussen bewust of onbewust gepresenteerde attitudestimuli voorstellen, omdat de verschillende verwerking van de attitudes eenvoudigweg een vergelijking onmogelijk maakt. Wij kunnen niet anders dan tot de conclusie komen dat het oproepen van concepten om variëteiten te beschrijven een taak is die, in onze context, onafhankelijk moet beschouwd worden van de negatieve of positieve evaluatie van die variëteiten. Aangezien men in die evaluatie de echte oorzaak van taalverandering moet zoeken, zullen computationele technieken ook met dat aspect rekening moeten houden. Het zal de
opdracht worden van toekomstig onderzoek om de methodes meer op elkaar af te stemmen en toch beide perspectieven te verzoenen. Onze studie geeft in feite een voorsmaakje van de talloze mogelijkheden die semantisch-conceptuele aanpak in het attitudeonderzoek kan bieden. Niettemin proberen we voorzichtig de enige kleine merkbare brug te slaan tussen de resultaten. De uitzonderlijke positie die het Milanese Italiaans bekleedt, komt in beide experimenten uit de verf: in de VGE waren de participanten milder of zelfs positief in hun oordeel wat betreft de Speech Status-dimensie; in de FRE kunnen we minstens twee velden aanwijzen die eerder statuskenmerken kan dragen, namelijk ELEGANZA (“stijl”) en COMPOSTEZZA (“waardigheid”). De moeilijkheden die we ondervonden hebben, zouden een oplossing kunnen vinden in komend onderzoek. Wat betreft het VGE hebben we vastgesteld dat, ondanks een minutieuze voorbereiding, het experiment nog niet volledig is verlopen zoals we hadden gehoopt. Wetende dat tijdens een experiment onvermijdelijk storingen optreden, die een al dan niet grote impact hebben op de resultaten, is het verstandig het design tot in de puntjes uit te werken. Voornamelijk in de keuze van de fragmenten zou men bijzondere aandacht moeten besteden. In het tijdsbestek dat wij wijdden aan de opstelling van het VGE, was geen tijd om linguïstische variabelen te isoleren, het tempo en de toonhoogte te normaliseren enz. Het is daarom juist aangewezen om een uitgebreide technische analyse van de speech samples uit te voeren en niet op een intuïtieve basis de fragmenten te kiezen. Wat betreft het FRE zijn we erin geslaagd om de meaning of variation te achterhalen,d.w.z. hoe taalvariatie wordt gepercipieerd, geconceptualiseerd en gecategoriseerd door de taalgebruiker. Door tijdsgebrek hebben we echter geen gebruik kunnen maken, hoewel ze werden verzameld, van allerlei typische sociale variabelen, zoals sekse, leeftijd en afkomst, die een nog gedetailleerde beeld konden verschaffen van die sociale inbedding van taalvariatie. Daarenboven mag men echter niet vergeten dat de social meaning van taalvarianten en –variëteiten ook tot uiting komt in gesprekken en andere ‘dynamische’ communicatieve situaties. Het is echter noodzakelijk dat men eerst verbetering aanbrengt in de constructie van de semantic vector space models, waarover onze studie hier en daar toch fundamentele problemen heeft aangekaart. In de toekomst zal bijvoorbeeld met de syntax-based en word-based modellen gewerkt kunnen worden. Of is het zeker zinvol in plaats van een niet-hiërarchische clusteranalyse ook te experimenteren met een hiërarchische variant, omdat k-medoids clustering het clusteraantal oplegt, wat de interpretatie van de clusters redelijk heeft beperkt. Ten slotte hopen we dat men ook de nodige kwaliteitsinstrumenten bij een clusteranalyse ontwikkeld, zodat de structuur van zulke clusters beter onderzocht kunnen worden.
Bibliografie (ISTAT), Istituto Nazionale di Statistica. 2006. La lingua italiana, i dialetti e le lingue straniere. Adank, Patti, Roeland Van Hout, and Hans Van de Velde. 2007. "An acoustic description of the vowels of Northern and Southern Standard Dutch II: Regional Varieties." Journal of the Acoustical Society of America 121:1130-1141. Ajzen, Icek, and Martin Fishbein. 1980. Understanding attitudes and predicting social behavior. Englewood Cliffs: Prentice Hall. Albano Leoni, Federico. 2006. "Il corpus CLIPS, presentazione del progetto." Allport, Gordon W. 1967. "Attitudes." In Readings in attitude theory and measurement, edited by Martin Fishbein, 1-13. New York: Academic Press. Antonelli, Giuseppe. 2011. "Lingua." In Modernità italiana. Cultura, lingua e letteratura dagli anni Settanta a oggi, edited by Andrea Afribo and Emanuele Zinato, 15-52. Roma: Carocci. Auer, Peter. 2005. "Europe’s sociolinguistic unity, or: A typology of European dialect/standard constellations." In Perspectives on variation: Sociolinguistic, historical, comparative, edited by Nicole Delbecque, Johan Van der Auwera and Dirk Geeraerts, 7-42. Berlin: Mouton de Gruyter. Auer, Peter, and Frans Hinskens. 1996. "The convergence and divergence of dialects in Europe. New and not so new developments in an old area." Sociolinguistica 10:1-30. Auer, Peter, Frans Hinskens, and Paul Kerswill. 2005. Dialect change: convergence and divergence in European languages. Cambridge: Cambrigde University Press. Auer, Peter, and Helmut Spiekermann. 2011. "Demotisation of the standard variety or destandardisation? The changing status of German in late modernity (with special reference to south-western Germany)." In Standard Languages and Language Standards in a Changing Europe, edited by Tore Kristiansen and Nikolas Coupland, 161176. Oslo: Novus Press. Avolio, Francesco. 1994. "I dialettismi dell'italiano." In Storia della lingua italiana III. Le altre lingue, edited by Alberto Asor Rosa, 561-598. Torino: Einaudi editore. Baayen, Harald. 2008. Analyzing linguistic data: a practical introduction to statistics using R. Cambridge: Cambridge University Press. Baroni, Marco, Silvia Bernardini, Adriano Ferraresi, and Eros Zanchetta. 2009. "The WaCky Wide Web: A collection of very large linguistically processed Web-crawled corpora." Journal of Language Resources and Evaluation 43 (3):209-226. Baroni, Marco, and Alessandro Lenci. 2008. "Concepts and Properties in Word Spaces." Italian Journal of Linguistics 20 (1):55-88. Baroni, Marco, and Motomo Ueyama. 2006. "Building general- and special-purpose corpora by Web-crawling." Proceedings of the 13th NIJL International Symposium, Language Corpora: Their Compilation and Application. Baroni, Maria R. 1983. Il linguaggio trasparente. Indagini psicolinguistica su chi parla e chi ascolta. Bologna: Il Mulino. Benincà, Paola. 1994. "Che cosa ci può dire l'italiano regionale." In Come parlano gli italiani,
edited by Tullio De Mauro, 157-166. Firenze: La Nuova Italia. Bernardini, Silvia, Marco Baroni, and Stefan Evert. 2006. "A WaCky introduction." In WaCky! Working papers on the Web as Corpus, edited by Marco Baroni and Silvia Bernardini, 127-158. Bologna: Gedit. Berruto, Gaetano. 1983. "La natura linguistica dell'italiano popolare." In Varietätenlinguistik des Italienischen, edited by Günter Holtus and Edgar Radtke, 86-106. Tübingen: Narr. Berruto, Gaetano. 1987. Sociolinguistica dell'italiano contemporaneo. Roma: La Nuova Italia. Berruto, Gaetano. 2005. "Dialect/standard convergence, mixing, and models of language contact: the case of Italy." In Dialect Change, edited by Peter Auer, Frans Hinskens and Paul Kerswill, 81-95. Cambridge: Cambridge University Press. Berruto, Gaetano. 2010. Contatto linguistico. In Enciclopedia dell'italiano, edited by Raffaele Simone. Roma: Treccani. Berruto, Gaetano. 2011. Fondamenti di sociolinguistica. Bari: Laterza. Bertinetto, Pier Marco. 2001. AVIP: Archivio delle varietà dell'italiano parlato. Pisa: Ufficio Pubblicazioni della Classe di Lettere Scuola Normale Superiore. Bertinetto, Pier Marco, and Michele Loporcaro. 2005. "The sound pattern of Standard Italian, as compared with the varieties spoken in Florence, Milan and Rome." Journal of the Internationl Phonetic Association 35 (2):131-151. Bishop, Hywel, Nikolas Coupland, and Peter Garrett. 2005. "Conceptual accent evaluation: Thirty years of accent prejudice in the UK." Acta Linguistica Hafniensia 37 (1):131-154. Bourhis, Richard, and Anne Maass. 2005. "Linguistic Prejudice and Stereotypes." In Sociolinguistics/Soziolinguistik, edited by Ulrich Ammon, Norbert Dittmar, Klaus Mattheier and Peter Trudgill, 1587-1601. Berlin: Walter de Gruyter. Britain, David. 2010a. "Contact and Dialectology." In Handbook of Language Contact, edited by Raymond Hickey, 208-229. Oxford: Blackwell. Britain, David. 2010b. "Supralocal Regional Dialect Levelling." In Language and Identities, edited by Carmen Llamas and Dominic Watt, 193-204. Edinburgh: Edinburgh University Press. Bruni, Francesco, ed. 1992. L'italiano nelle regioni: lingua nazionale e identità regionali. Torino: UTET. Calamai, Silvia. 2002. "La percezione al quadrato in Toscana: pisani e livornesi." In Che cosa ne pensa oggi Chiaffredo Roux? Percorsi della dialettologia percezionale all'alba del nuovo millennio, edited by Monica Cini and Riccardo Regis, 139-171. Alessandria: Edizioni dell'Orso. Calamai, Silvia, and Irene Ricci. 2005. "Un esperimento di matched-guise in Toscana." Studi Linguistici e Filologici on line 3 (1):63-105. Campbell-Kibler, Kathryn. 2013. "Connecting attitudes and language behavior via implicit sociolinguistic cognition." In Language (de)standardisation in Late Modern Europe: Experimental Studies, edited by Tore Kristiansen and Stefan Grondelaers, 307-329. Oslo: Novus Press. Canobbio, Sabina, Monica Cini, and Riccardo Regis. 2006. "Atteggiamenti linguistici e valutazioni dei parlanti in Piemonte." In Lingua e dialetto nell'Italia del Duemila, edited by Annarita Miglietta and Alberto A. Sobrero, 151-161. Galatina: Congedo. Castellanni, Arrigo. 1982. "Quanti erano gli italofoni nel 1861?" Studi linguistici italiani 1:3-26. Cerrato, Loredana. 2007. "Sulle tecniche di elicitazione di dialoghi di parlato semi-spontaneo."
Cerruti, Massimo. 2009. Strutture dell'italiano regionale. Morfosintassi di una varietà diatopica in prospettiva sociolinguistica. Frankfurt am Main: Lang. Cerruti, Massimo. 2011. "Regional varieties of Italian in the linguistic repertoire." International Journal of the Sociology of Language 210:9-28. Cerruti, Massimo, and Riccardo Regis. 2014. "Standardization patterns and dialect/standard convergence: A northwestern Italian perspective." Language in Society 43:83-111. Chambers, Jack. 1995a. Sociolinguistic theory: linguistic variation and its social significance. Oxford: Blackwell. Chambers, Jack K. 1995b. Sociolinguistic Theory. Cambridge (US)-Oxford (UK): Blackwell. Cook, Stuart, and Claire Sellitz. 1964. "A multiple-indicator approach to attitude measurement." Psychological Bulletin 62:36-55. Cooper, Colin, and Paul Wilson. 2008. "Finding the magic number." The Psychologist 21 (10):866-868. Cooper, Robert, and Joshua Fishman. 1974. "The Study of Language Attitudes." International Journal of the Sociology of Language 3:5-20. Cortelazzo, Manlio. 1974. "Prospettive di studio dell'italiano regionale." In Italiano d’oggi. Lingua non letteraria e lingue speciali, edited by Mario Wandruszka, Manlio Cortelazzo and Maurizio Dardano, 19-33. Torino: LINT. Cortelazzo, Manlio. 1984. "Perché 'a mi me gusta' sì e 'a me mi piace' no?" In Umgangssprache in der Iberoromania. Festschrift für Heinz Kroll, edited by Günter Holtus and Edgar Radtke, 25-28. Tübingen: Narr. Cortelazzo, Manlio. 1990. "Regionalismi nel vocabolario della Crusca." In L'italiano regionale, edited by Michele Cortelazzo and Alberto Mioni, 355-362. Roma: Bulzoni. Cortelazzo, Manlio. 1994. "I dialetti dal Cinquecento ad oggi: usi non letterari." In Storia della lingua italiana III. Le altre lingue, edited by Alberto Asor Rosa, 541-560. Torino: Einaudi editore. Cortelazzo, Michele A., and Alberto M. Mioni, eds. 1990. L'italiano regionale. Roma: Bulzoni. Coseriu, Eugenio. 1973. Lezioni di linguistica generale. Torino: Boringhieri. Coseriu, Eugenio. 1980. ""Historische Sprache" und "Dialekt"." In Dialekt und Dialektologie, edited by Joachim Göschel, Pavle Ivic and Kurt Kehr. Wiesbaden: Steiner. Coupland, Nikolas, and Tore Kristiansen. 2011. "SLICE: Critical perspectives on language (de)standardisation." In Standard Languages and Language Standards in a Changing Europe, edited by Tore Kristianse and Nikolas Coupland, 11-35. Oslo: Novus Press. Crocco, Claudia, Renata Savy, and Francesco Cutugno. 2003. API: Archivio del parlato italiano. In www.parlareitaliano.it/parlare. Cutugno, Francesco. 2007. "Criteri per la definizione delle mappe, esempi di mappe e di vignette per il gioco delle differenze." Accessed May 20, 2014. D'Achille, Paolo. 1990. Sintassi del parlato e tradizioni scritta della lingua italiana: analisi di testi dalle origini al secolo XVIII. Roma: Bonacci. D'Achille, Paolo. 2002. "L'italiano regionale." In I dialetti italiani, Storia, struttura, uso, edited by Manlio Cortelazzo, Carla Marcato, Nicola De Blasi and Gianrenzo P. Clivio, 26-42. Torino: UTET. D'Achille, Paolo. 2010. L'italiano contemporaneo. Bologna: Il Mulino. D'Imperio, Mariapaola. 2002. "Italian intonation: an overview and some questions." Probus 14:37-69.
Davies, Eirlys, and Abdelali Benthahila. 2013. "Language Attitudes in the Maghreb Countries." In The Social Meanings of Language, Dialec and Accent, edited by Howard Giles and Bernadette Watson, 84-104. New York: Peter Lang. De Mauro, Tullio. 1963. Storia linguistica dell'Italia unita. 2nd [1963] ed. Bari: Laterza. Di Ferrante, Laura. 2008. "Spazi linguistici in cambiamento. Una nuova inchiesta di matched guise a Milano, Napoli e Roma." PhD, Università per Stranieri di Siena. Divjak, Dagmar. 2010. Structuring the lexicon: a clustered model for near-synonymy. Berlin: Mouton de Gruyter. Divjak, Dagmar, and Nick Fieller. (in press). "Cluster analysis: Finding structure in linguistic data." In Corpus Methods for Semantics: Quantitative Studies in Polysemy and Synonymy, edited by Justyna Robinson and Dylan Glynn, 405-441. Amsterdam: Benjamins. Dragojevic, Marko, Howard Giles, and Bernadette Watson. 2013. "Language Ideologies and Language Attitudes: a Foundational Framework." In The Social Meanings of Language, Dialects and Accent, edited by Howard Giles and Bernadette Watson. New York: Peter Lang. Dufter Andreas, and Elizabeth Stark. 2008. "Double indirect object marking in Spanish and Italian" In Theoretical and empirical issues in grammaticalization, edited by Elena Seoane and María José López-Couso. 111-129. Amsterdam: Benjamins Eckert, Penelope, and John Rickford. 2001. Style and sociolinguistic variation. Cambridge: Cambridge University Press. Fairclough, Norman. 1992. Discourse and Social Change. Cambridge: Polity Press. Ferraresi, Adriano. 2007. "Building a very large corpus of English obtained by web crawling: ukWaC." Master, University of Bologna. Firth, John. 1957. Paper in Linguistics 1934-1951. Oxford: Oxford University Press. Franco, Francesca, and Anne Maass. 1996. "The linguistic intergroup bias: Is it under intentional control?" Conference of the European Association of Experimental Social Psychology, Gmunden, Austria. Galli de' Paratesi, Nora. 1977. "Opinioni linguistiche e prestigio delle principali varietà regionali di italiano." In Italiano d'oggi. Lingua nazionale e varietà regionali, edited by Theodor Ebneter, Mario Alinei and Zarko Muljacic, 143-197. Triest: LINT. Galli de' Paratesi, Nora. 1984. Lingua toscana in bocca ambrosiana. Tendenze verso l'italiano standard: un'inchiesta sociolinguistica. Bologna: Il Mulino. Gallois, Cindy. 2013. "Language Attitudes in Context." In The Social Meanings of Language, Dialect and Accent, edited by Howard Giles and Bernadette Watson, 170-179. New York: Peter Lang. Garrett, Peter. 2005. "Attitude Measurements." In Sociolinguistics/Soziolinguistik, edited by Ulrich Ammon, Norbert Dittmar, Klaus J. Mattheier and Peter Trudgill, 1251-1260. Berlin: Walter de Gruyter. Garrett, Peter. 2010. Attitudes to Language. Cambridge: Cambridge University Press. Garrett, Peter, Nikolas Coupland, and Angie Williams. 2003. Investigating Language Attitudes: Social Meanings of Dialect, Ethnicity and Performance. Cardiff: University of Wales Press. Garrett, Peter, Angie Williams, and Betsy Evans. 2005. "Accessing social meanings: Values of keywords, values in keywords." Acta Linguistica Hafniensia 37 (1):37-54.
Geeraerts, Dirk. 2010. Theories of Lexical Semantics. Oxford: Oxford University Press. Geeraerts, Dirk, and Gitte Kristiansen. 2014. "Cognitive linguistics and linguistic variation." In Cognitive Linguistics Companion, edited by John Taylor and Jeannette Littlemore. London: Continuum Publishing. Geeraerts, Dirk, Gitte Kristiansen, and Yves Peirsman, eds. 2010. Advances in Cognitive Sociolinguistics. Berlin: Mouton de Gruyter. Giles, Howard, and Nancy Niedzielsky. 1998. "Italian is beautiful, German is ugly." In Language Myths, edited by Laurie Bauer and Peter Trudgill, 85-93. London: Penguin. Giles, Howard, and Peter Powesland. 1975. Speech Style and Social Evaluation. London: London Academic Press. Glynn, Dylan. (in press). "Correspondance analysis: Exploring data and identifying patterns." In Corpus Methods for Semantics: Quantitative Studies in Polysemy and Synonymy, edited by Justyna Robinson and Dylan Glynn, 133-179. Amsterdam: Benjamins. Glynn, Dylan, and Kerstin Fischer, eds. 2010. Quantitative methods in cognitive semantics: corpus-drive approaches. Berlin: Mouton de Gruyter. Graff, David, William Labov, and Wendell Harris. 1986. "Testing Listeners' Reactions to Phonological Markers of Ethnic Identity: A New Method for Sociolinguistic Research." In Diversity and Diachrony, edited by David Sankoff, 45-58. Amsterdam: Benjamins. Grassi, Corrado. 2001. "Note sull'italiano regionale." In L'italiano e le regioni, edited by Fabiana Fusco and Carla Marcato, 21-28. Udine: Forum. Gries, Stefan. 2009. Statistics for linguistics in R: a practical introduction. Berlin: Mouton de Gruyter. Gries, Stefan, and Martin Hilpert. 2008. "The identification of stages in diachronic data: variability-based neighbor clustering." Corpora 3 (1):59-81. Gries, Stefan, and Anatol Stefanowitsch, eds. 2006. Corpus-based Approaches to Metaphor and Metonymy. Berlin: Mouton de Gruyter. Grondelaers, Stefan, and Roeland Van Hout. 2010. "Do Speech Evaluation Scales in a Speaker Evaluation Experiment Trigger Conscious or Unconscious Attitudes?" University of Pennsylvania Working Papers in Linguistics (PWPL) 16 (2):92-102. Grondelaers, Stefan, Roeland Van Hout, and Mieke Steegs. 2010. "Evaluating Regional Accent Variation in Standard Dutch." Journal of Language and Social Psychology 29 (1):101116. Hanson, David. 1980. "Relationship between methods and findings in attitude-behavior research." Psychology: A Journal of Human Behavior 17 (3):11-13. Harris, Zellig. 1954. "Distributional Structure." Word 10 (2/3):146-162. Heylen, Kris, and Tom Ruette. 2013. "Degrees of semantic control in measuring aggregated lexical distances." In Approaches to Measuring Linguistic Differences, edited by Lars Borin and Anju Saxena, 353-374. Berlin: Mouton de Gruyter. Impe, Leen, and Dirk Speelman. 2007. "Vlamingen en hun (tussen)taal. Een attitudineel mixed guise onderzoek." In Handelingen van de Koninklijke Maatschappij voor Taal-en Letterkunde en Geschiedenis, 109-128. Brussel. Johnstone, Barbara, and Scott Kiesling. 2008. "Indexicality and experience: Exploring the meanings of /aw/-monophthongization in Pittsburgh." Journal of Sociolinguistics 12 (1):5-33. Joseph, John Earl. 1987. Eloquence and Power: The Rise of Standard Languages and
Language Standards. London: Frances Printer. Kerswill, Paul. 2010. "Contact and New Varieties." In Handbook of Language Contact, edited by Raymond Hickey, 230-251. Oxford: Blackwell. Kilgarriff, Adam, and Gregory Grefenstette. 2003. "Introduction to the Special Issue on Web as Corpus." Computational Linguistics 29 (3):1-15. Kristiansen, Gitte, and René Dirven, eds. 2008. Cognitive Sociolinguistics: Language Variation, Cultural Models, Social Systems. Berlin: Mouton de Gruyter. Kristiansen, Tore. 2009. "The macro-level social meanings of late-modern Danish accents." Acta Linguistica Hafniensia 41:67-92. Kristiansen, Tore. 2011. "Attitudes, Ideology and Awareness." In The SAGE Handbook of Sociolinguistics, edited by Ruth Wodak, Barbara Johnstone and Paul Kerswill, 265-278. Los Angeles: Sage. Kristiansen, Tore, and Nikolas Coupland. 2011. Standard Lanaguages and Language Standards in a Changing Europe. Oslo: Novus Press. Kristiansen, Tore, Peter Garrett, and Nikolas Coupland. 2005. "Introducing subjectivities in language variation and change." Acta Linguistica Hafniensia 37 (1):9-35. Kristiansen, Tore, and Stefano Grondelaers. 2013. Language (de)standardisation in Late Modern Europe: Experimental Studies. Oslo: Novus Press. Kristiansen, Tore, and Jens Normann Jørgensen. 2005. "Subjective factors in dialect convergence and divergence." In Dialect Change, edited by Peter Auer, Frans Hinskens and Paul Kerswill, 287-302. Cambridge: Cambridge University Press. Labov, William. 1972. Sociolinguistic Patterns. Philadelphia: University of Pennsylvania Press. Lambert, Wallace E. 1967. "A Social Psychology of Bilingualism." Journal of Social Issues 23 (2):91-109. Lambert, Wallace E., Richard Hodgson, Robert C. Gardner, and Samuel Fillenbaum. 1960. "Evaluation Reactions to Spoken Languages." Journal of Abnormal and Social Psychology 60:44-51. Landauer, Thomas, and Susan Dumais. 1997. "A solution to Plato's problem: the latent semantic analysis theory of acquisition, induction and representation of knowledge." Psychological Review 104 (2):211-240. Langacker, Ronald. 1987. Foundations of Cognitive Grammar. 2 vols. Vol. 1. Stanford: Stanford University Press. Lasagabaster, David. 2004. "Attitude." In Sociolinguistics/Soziolinguistik, edited by Ulrich Ammon, Norbert Dittmar, Klaus J. Mattheier and Peter Trudgill, 399-405. Berlin: Walter de Gruyter. Lenci, Alessandro. 2008. "Distributional semantics in linguistic and cognitive research." Italian Journal of Linguistics 20 (1):1-31. Lenth, Russell. 2014. Least-squares Means: the R Package lsmeans. Likert, Rensis. 1932. "A Technique for the Measurement of Attitudes." Archives of Psychology 140:1-55. Lowe, Will. 2001. "Towards a Theory of Semantic Space." Proceedings of the Twenty-third Annual Meeting of the Cognitive Science Society. Maass, Anne, Daniela Salvi, Luciano Arcuni, and Güun Semin. 1989. "Language Use in Intergroup Contexts: The Linguistic Intergroup Bias." Journal of Personality and Social Psychology 57 (6):981-993.
Marazzini, Claudio. 1994. La lingua italiana. Profilo storico. Bologna: Il Mulino. Mattheier, Klaus. 1997. "Über Destandardisierung, Umstandardisierung und Standardisierung in modernen europäischen Standardsprachen." In Standardisierung und Destandardisierung europäischer Nationalsprachen, edited by Klaus J Mattheier and Edgar Radtke, 1-9. Frankfurt: Lang. Mengaldo, Pier Vincenzo. 1994. Il Novecento, Storia della lingua italiana. Bologna: Il Mulino. Miller, George, and Walter Charles. 1991. "Contextual correlates of semantic similarity." Language and Cognitive Processes 6:1-28. Mioni, Alberto M., and John Trumper. 1977. "Per un'analisi del "continuum" linguistico veneto." In Aspetti sociolinguistici dell'Italia contemporanea, edited by Raffaele Simone and Giulianella Ruggiero, 329-372. Roma: Bulzoni. Osgood, Charles, George Suci, and Percy Tannenbaum. 1957. The measurement of meaning. Urbana: University of Illinois Press. Padó, Sebastian, and Mirella Lapata. 2007. "Dependency-based construction of semantic space models." Computational Linguistics 33 (2):161-199. Parlangèli, Oronzo. 1971. La nuova questione della lingua. Brescia: Paideia. Peirsman, Yves. 2008. "Word Space Models of Semantic Similarity and Relatedness." Proceedings of the ESSLLI-2008 Student Session, Hamburg, Germany. Peirsman, Yves, Kris Heylen, and Dirk Speelman. 2007. "Finding semantically related words in Dutch. Co-occurrences versus syntactic contexts." Proceedings of the CoSMO workshop, Roskilde, Denmark. Peirsman, Yves, and Dirk Speelman. 2009. "Word Space Models of Lexical Variation." Proceedings of the EACL-2009 Workshop on Geometrical Models of Natural Language Semantics, Athens, Greece. Pellegrini, Giovan Battista. 1975. Saggi di Linguistica italiana. Torino: Boringhieri. Poggi Salani, Teresa. 2010. Italiano regionale. In Enciclopedia dell'italiano, edited by Raffaele Simone. Roma: Treccani. Poletto, Cecilia. 2009. "I costrutti verbo+preposizione: l’interferenza tra veneto e italiano regionale." In Italiano, italiani regionali e dialetti, edited by Anna Cardinaletti and Nicola Munaro, 155-172. Milano: Franco Angeli. Preston, Dennis R. 2005. "Perceptual Dialectology." In Sociolinguistics/Soziolinguistik, edited by Ulrich Ammon, Norbert Dittmar, Klaus J. Mattheier and Peter Trudgill, 1683-1696. Berlin: Walter de Gruyter. Ricca, Davide. 2010. Italianizzazione dei dialetti. In Enciclopedia dell'italiano, edited by Raffaele Simone. Roma: Treccani. Rietveld, Toni, and Roeland Van Hout. 1993. Statistical techniques for the study of language and language behaviour. Berlin: Mouton de Gruyter. Rietveld, Toni, and Roeland Van Hout. 2005. Statistics in language research: analysis of variance. Berlin: Mouton de Gruyter. Ryan, Ellen B, Howard Giles, and Miles Hewstone. 1988a. "The measurement of language attitudes." In Sociolinguistics/Soziolinguistik, edited by Ulrich Ammon, Norbert Dittmar and Klaus Mattheier, 1068-1081. Berlin: Mouton de Gruyter. Ryan, Ellen B., and Howard Giles. 1982. Attitudes towards Language Variation. London: Arnold. Ryan, Ellen B., Howard Giles, and Miles Hewstone. 1988b. "The Measurement of Language Attitudes." In Sociolinguistics/Soziolinguistik, edited by Ulrich Ammon, Norbert Dittmar
and Klaus J. Mattheier, 1068-1081. Berlin: Walter de Gruyter. Ryan, Ellen B., Howard Giles, and Richard Sebastian. 1982. "An integrative perspective for the study of attitudes toward language variation." In Attitudes towards language variation: social and applied contexts, edited by Ellen Ryan and Howard Giles, 1-11. London: Arnold. Sabatini, Francesco. 1985. "L'"italiano dell'uso medio": una realtà tra le varietà linguistiche italiane." In Gesprochenes Italienisch in Geschichte und Gegenwart, edited by Günter Holtus and Edgar Radtke, 154-184. Tübingen: Narr. Sabatini, Francesco. 1990. ""Italiani regionali" e "italiano dell'uso medio"." In L'italiano regionale, edited by Michele A. Cortelazzo and Alberto M. Mioni, 75-78. Roma: Bulzoni. Sahlgren, Magnus. 2006. "The Word-Space Model: Using distributional analysis to represent syntagmatic and paradigmatic relations between words in high-dimensional vector spaces." PhD, Department of Linguistics, Stockholm University. Sahlgren, Magnus. 2008. "The Distributional Hypothesis." Italian Journal of Linguistics 20 (1):33-53. Savino, Michelina. 2012. "The intonation of polar questions in Italian: where is the rise?" Journal of the International Phonetic Association 42 (1):23-48. Schmid, Hans-Jörg. 2007. "Entrenchment, salience and basic levels." In The Oxford Handbook of Cognitive Linguistics, edited by Dirk Geeraerts and Hubert Cuyckens, 117-138. Oxford: Oxford University Press. Sgroi, Salvatore C. 1981. "Diglossia, prestigio, italiano regionale e italiano standard: proposte per una nuova definizione." La Ricerca Dialettale 3:207-248. Sobrero, Alberto A. 1988. "Italienisch: Regionale Varianten. Italiano regionale." In Lexicon der Romanistischen Linguistik, edited by Günter Holtus, Michael Metzeltin and Christian Schmitt, 732-748. Tübingen: Niemeyer. Sobrero, Alberto A. 1996. "Italianization and variations in the repertoire: the koinai." Sociolinguistica 10:105-111. Soukup, Barbara. 2013. "The measurement of language attitudes - a reappraisal from a constructionist perspective." In Language (de)standardisation in Late Modern Europe: Experimental Studies, edited by Tore Kristiansen and Stefano Grondelaers, 251-266. Oslo: Novus Press. Speelman, Dirk. 2013. "Taalkundige enquêtering en experiment." Leuven. Speelman, Dirk, Adriaan Spruyt, Leen Impe, and Dirk Geeraerts. 2013. "Language attitudes revisited: Auditory affective priming." Journal of Pragmatics 52:83-92. Stehl, Thomas. 1995. "La dinamica diacronica fra dialetto e lingua: per un’analisi funzionale della convergenza linguistica." In Dialetti e lingue nazionali, edited by Maria Teresa Romanello and Immacolata Tempesta, 55-73. Roma: Bulzoni. Tagliamonte, Sali. 2006. Analyzing Sociolinguistic Variation. Cambridge: Cambridge University Press. Tavoni, Mirko. 1994. Il Quattrocento, Storia della lingua italiana. Bologna: Il Mulino. Telmon, Tullio. 1990. Guida allo studio degli italiani regionali. Alessandria: Edizioni dell'Orso. Telmon, Tullio. 1993. "Varietà regionali." In Introduzione all'italiano contemporaneo, edited by Alberto A. Sobrero, 93-149. Roma-Bari: Laterza. Telmon, Tullio. 1994. "Gli italiani regionali contemporanei." In Storia della lingua italiana. III, Le altre lingue, edited by Luca Serianni and Pietro Trifone, 597-626. Torino: Einaudi.
Telmon, Tullio. 2001. "Italiani regionali tra interlingua, interculturalità e intervariazionalità. Alcune modeste proposte." In L'italiano e le regioni, edited by Fabiana Fusco and Carla Marcato, 47-50. Udine: Forum. Tesi, Riccardo. 2007. Storia dell'italiano. Bologna: Zanichelli. Troncon, Antonella, and Luciano Canepari. 1989. Lingua italiana nel Lazio. Roma: Jouvence. Trudgill, Peter. 1974. The Social Differentiation of English in Norwich. Cambridge: Cambridge University Press. Trudgill, Peter. 1986. Dialects in contact. Oxford: Blackwell. Turney, Peter, and Patrick Pantel. 2010. "From Frequency to Meaning: Vector Space Models of Semantics." Journal of Artificial Intelligence Research 37:141-188. Van Bezooijen, Renée. 2002. "Aesthetic evaluation of Dutch. Comparisons across dialects, accents, and languages." In Handbook of Perceptual Dialectology, edited by Daniel Long and Dennis Preston, 13-30. Amsterdam: Benjamins. Vandermeeren, Sonja. 2005. "Research on Language Attitudes." In Sociolinguistics/Soziolinguistik, edited by Ulrich Ammon, Norbert Dittmar, Klaus J. Mattheier and Peter Trudgill, 1318-1332. Berlin: Walter de Gruyter. Weinreich, Uriel. 1953. Languages in contact: Findings and problems. New York. Wilson, John, and Donn Bayard. 1992. "Accent, gender, and the elderly listener: evaluations of NZE and other English accents by rest home residents." Te Reo 35:19-56. Zahn, Christopher, and Robert Hopper. 1985. "Measuring Language Attitudes: The Speech Evaluation Instrument." Journal of Language and Social Psychology 4 (2):113-123. Zipf, George. 1949. Human behavior and the principle of least effort: an introduction to human ecology. New York: Hafner.
Bijlagen
Clusters
C1: SUPERIORITÀ (N=11) abbondante, pulito, inutile, divertente, pessimo, originario, bene, corretto, arrogante, artistico, soave C2: TEATRALITÀ (N=19) orecchiabile, estroso, aulico, noncurante, antidepressivo, bucolico, confusionario, borioso, spigliato, melodrammatico, palloso, inappropriato, prorompente, ondulato, baldanzoso, abbordabile, inespressivo, cafone, raggiante C3: CIVILTÀ (N=29) rustico, inusuale, variopinto, maleducato, armonioso, coatto, usuale, nordico, paesano, malizioso, invadente, neutro, formale, rude, buono, scherzoso, rapido, schifoso, leggero, ostile, moderno, presuntuoso, irritante, sofisticato, sciolto, grezzo, genuino, selettivo, familiare C4: RIGIDITÀ (N=13) vago, piacevole, rigido, perfetto, spontaneo, secco, caro, spiacevole, incredibile, scettico, male, impossibile, accesso C5: DINAMISMO (N=18) sbruffone, fighetto, figo, gergale, spocchioso, casereccio, benino, fluente, chiacchierone, gutturale, accomodante, ruspante, burlone, ampolloso, slang, farraginoso, scorbutico, pastoso C6: POP (N=11) fighettino, cheese, acculturato, bellissimo, strafico, polentone, truzzo, discotecaro, ristretto, delicato, casinaro C7: VOLGARITÀ (N=15) caciarone, caciara, sboccato, smorfioso, piacione, scostumato, austro, urtante, inascoltabile, casinista, scurrile, ineducato, cacofonico, mafioso, originale C8: / (N=12) trasandato, permaloso, individuabile, popolano, goliardico, sgraziato, loquace, truffatore, sguaiato, affabile, mozzo, nebbioso C9: MOBILITÀ (N=19) monotono, bancario, comico, umano, libero, particolare, facile, colossale, rozzo, mondiale, fico, comunicativo, scomodo, isterico, disordinato, incomprensibile, aristocratico, imperiale, cattivo C10: COMPOSTEZZA (N=8) pagliaccesco, pirlone, sopravvalutato, cantato, sborone, obrobrioso, educato, superiore C11: FASCINO (N=15) sconosciuto, stupido, nuovo, interessante, spettacolare, pieno, misto, imponente, allegro, netto, differente, bello, fluido, confuso, simpatico
C12: VOCE (N=15) incapibile, disponibile, simpaticissimo, cadenziale, allungato, distorto, sottovalutato, stilizzato, buuuh, aspirato, comiziato, coinvolgente, gradevole, morbido, stupendo C13: ELEGANZA (N=16) xxx, dissonante, identitario, tronfio, sciatto, altruista, gretto, discorsivo, melodioso, antiquato, altezzoso, spumeggiante, forbito, opportunista, dispersivo, vanitoso C14: ARROGANZA (N=20) schizzinoso, guascone, burino, strafottente, spaccone, pizzaiolo, eccezzionale, scostante, sgrammaticato, checca, ansiogeno, amicone, festaiolo, menefreghista, supponente, canzonatorio, nazionalista, altolocato, articolato, scolastico C15: PESANTEZZA (N=24) prolisso, enfatico, pomposo, garbato, mercantile, giocondo, scontroso, dialettale, fruibile, espansivo, signorile, amabile, inconcludente, culinario, puzzolente, carnale, snob, osceno, giocoso, stentato, viscido, spavaldo, forte, festivo C16: GENIALITÀ (N=18) timido, nobile, generoso, grasso, lineare, generico, colorato, geniale, vecchio, grandioso, idiota, estremo, toscano, vivace, superficiale, sommo, volgare, quotidiano C17: INSISTENZA (N=13) indelebile, sgradevole, prepotente, marcato, impegnato, passionale, approssimativo, famoso, lavoratore, antipatico, pungente, informale, miliardario C18: / (N=23) chiassoso, esaltato, villano, stucchevole, gagliardo, viziato, svelto, aureo, scenografico, vincolante, saccente, forzato, chic, schematico, periferico, spassoso, sbrigativo, verace, ridondante, caritatevole, vorace, grottesco, tecnico C19: / (N=15) difficoltoso, caldo, sincero, felice, festoso, natalizio, pittoresco, finto, scorrevole, impreciso, incolto, romantico, irriverente, preciso, buffo C20: ESOTICITÀ (N=18) splendido, meridionale, semplice, gay, solare, ricco, essenziale, lirico, lontano, fantastico, comune, diffuso, ridicolo, vario, gelido, modesto, strano, riconoscibile