DOCTORAALSCRIPTIE ALGEMENE TAALWETENSCHAP
TAAL EN MUZIEK DE STRUCTURELE TWEELING VAN ONS COGNITIEVE SYSTEEM
MAARTJE J. SCHREUDER
Begeleiders: Dr. Dicky Gilbers Drs. Wouter Jansen Rijksuniversiteit Groningen Studentnummer: 0822450 Adres: Westerbadstraat 32 9726 CS Groningen 050-3188980 Afstudeerdatum: augustus 1999
VOORWOORD Deze scriptie is geschreven in het kader van het voltooien van mijn studie Algemene Taalwetenschap, afstudeerrichting fonologie, aan de letterenfaculteit van de Rijksuniversiteit Groningen. Dit project heeft mij voornamelijk veel positieve ervaringen opgeleverd. Het onderwerp sprak me heel erg aan en het vinden van informatie, het zelf bedenken en schrijven en ook het uitvoeren van een eigen experiment heb ik met heel veel plezier gedaan. Ik vond het daarom ook best jammer er een einde aan te moeten breien. Het liefst had ik nog veel meer, en dieper onderzocht. Misschien is dat iets voor de toekomst. Het prettige verloop van het schrijven van deze scriptie was voor een groot deel te danken aan het enthousiasme en de behulpzaamheid van mijn begeleiders, Dicky Gilbers en Wouter Jansen. Ik wil hen daar dan ook heel hartelijk voor bedanken, Wouter Jansen met name voor de medewerking aan het experiment en voor de hulp bij de statistische analyses. Verder wil ik Sietske Kloosterman en Judit Steenge bedanken voor het gezellige en stimulerende samen studeren in de bibliotheek. Sietske moet ik speciaal bedanken, want de titel van deze scriptie was een idee van haar en zij heeft mij ook geholpen met de statistiek. Mijn moeder en vader zijn heel behulpzaam geweest door delen van mijn scriptie te lezen en van commentaar te voorzien, vooral op het gebied van de typefouten. Dat scheelde mij weer werk, dus dank daarvoor. Natuurlijk bedank ik ook mijn proefpersonen voor hun medewerking bij mijn experiment. En Adelheid Vos moet ik bedanken voor de cursussen Word, die heel nuttig zijn gebleken. Tenslotte bedank ik iedereen die mij moreel of op een andere manier heeft bijgestaan of geholpen bij de totstandkoming van mijn doctoraalscriptie.
Maartje Schreuder
3
INHOUDSOPGAVE VOORWOORD ................................................................................................................................................... 1 INLEIDING ........................................................................................................................................................ 6 1
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF ........................................................... 8 1.1 HET BEGRIJPEN VAN MUZIEK ................................................................................................................ 8 1.2 TONALE MUZIEK .................................................................................................................................. 9 1.3 HET DOEL VAN DE THEORIE ................................................................................................................ 11 1.4 DE STRUCTURELE BESCHRIJVING VAN MUZIEK .................................................................................... 11 1.4.1 Ritmische structuur .................................................................................................................. 12 1.4.2 Metrische structuur .................................................................................................................. 14 1.4.3 Toonhoogtereductie ................................................................................................................. 16 1.4.3.1 1.4.3.2 1.4.3.3
1.4.4 1.4.5 2
Conflicten................................................................................................................................ 22 Samenvatting........................................................................................................................... 22
OPTIMALITY THEORY ............................................................................................................................ 24 2.1 2.2 2.3 2.4
3
De tijdsspannereductie....................................................................................................................... 16 De prolongeringsreductie................................................................................................................... 19 De verschillen.................................................................................................................................... 21
DE PRINCIPES VAN OPTIMALITY THEORY ............................................................................................ 24 EVALUATIE VAN OUTPUTKANDIDATEN ............................................................................................... 26 DE VOORDELEN VAN OPTIMALITY THEORY ........................................................................................ 26 HARMONIC GRAMMAR....................................................................................................................... 28
VERGELIJKING VAN BEIDE THEORIEËN .................................................................................................. 30 OUTPUTGERICHT ........................................................................................................................................ 30 3.2 GRAMMATICALITEIT .......................................................................................................................... 31 3.3 DOMEINEN VAN ANALYSE .................................................................................................................. 31 3.4 NOTATIEWIJZE EN REPRESENTATIE ..................................................................................................... 32 3.5 PREFERENTIEREGELS, DE FAMILIES..................................................................................................... 33
4
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS ............................................................ 35 4.1 SEGMENTEN EN SYLLABEN ................................................................................................................. 35 4.1.1 Introductie ............................................................................................................................... 35 4.1.2 Een segmentele overeenkomst met muziek............................................................................... 36 4.2 STRESS, METRUM, RITME ................................................................................................................... 38 4.2.1 Introductie ............................................................................................................................... 38 4.2.2 Ritmische overeenkomsten met muziek.................................................................................... 40 4.2.2.1 4.2.2.2 4.2.2.3
Euritmie ............................................................................................................................................ 40 Triolen en rusten................................................................................................................................ 43 Optionaliteit ...................................................................................................................................... 45
4.3 INTONATIE EN FRASERING .................................................................................................................. 46 4.3.1 Introductie ............................................................................................................................... 46 4.3.1.1 4.3.1.2
Toon en intonatie ............................................................................................................................... 46 De functies van intonatie.................................................................................................................... 48
4.3.2 Intonatie: overeenkomsten met muziek..................................................................................... 49 4.4 CONCLUSIE ....................................................................................................................................... 54 5
EXPERIMENT: DECLINATIE-EFFECTEN IN TAAL EN MUZIEK ................................................................... 55 5.1 OPZET EXPERIMENT ........................................................................................................................... 55 5.1.1 De testzinnen ........................................................................................................................... 55 5.1.2 Proefpersonen.......................................................................................................................... 56 5.1.3 Uitvoering ............................................................................................................................... 57 5.1.4 Verwerking.............................................................................................................................. 57 5.1.5 Hypothesen.............................................................................................................................. 61
INHOUDSOPGAVE 5.2 RESULTATEN SPRAAKEXPERIMENT ..................................................................................................... 61 5.3 RESULTATEN MUZIEKEXPERIMENT ..................................................................................................... 64 5.4 CONCLUSIES EN AANBEVELINGEN....................................................................................................... 66 5.4.1 Conclusies ............................................................................................................................... 66 5.4.2 Aanbevelingen......................................................................................................................... 66 6
CONCLUSIE EN DISCUSSIE ...................................................................................................................... 68 6.1 6.2
SAMENVATTING EN CONCLUSIES ........................................................................................................ 68 DISCUSSIE ......................................................................................................................................... 70
REFERENTIES ................................................................................................................................................. 73 BIJLAGEN....................................................................................................................................................... 77 BIJLAGE 1: TESTZINNEN.............................................................................................................................. 77 BIJLAGE 2: MELODIE VOOR MUZIEKEXPERIMENT MET CELLISTEN .................................................................. 79 BIJLAGE 3: SIGNIFICANTIE VERGELEKEN TONEN SPRAAKEXPERIMENT........................................................... 80
5
INLEIDING In deze scriptie trek ik de vergelijking tussen een taaltheorie en een muziektheorie en daarna tussen de verschijnselen taal en muziek zelf. Interessante vergelijking, zult u misschien denken, maar waarom taal en muziek? Zijn die te vergelijken? Er zijn veel aanwijzingen dat taal en muziek meer eigenschappen gemeen hebben dan op het eerste gezicht lijkt, ook al hebben ze totaal verschillende functies. Met taal kunnen vragen en uitspraken over de reële wereld en objecten en relaties daarbinnen gedaan worden. De functie van muziek is van een heel andere orde. Als het al betekenis heeft, is dat een metaforische, poëtische. Muziek is de “taal van de emotie” (Sloboda, 1986). Taal heeft een duidelijke communicatieve functie, terwijl muziek voornamelijk een kunstvorm is. Maar alle culturen hebben taal èn muziek. Er zijn geen culturen zonder muziek. Toch is het moeilijk voor te stellen dat het verlies van muziek de beschaving kwaad zou doen (Sloboda, 1986). Een interessante vraag is daarom waarom de evolutie ons voorzien heeft van een zo complex systeem als muziek, terwijl het geen duidelijke overlevingswaarde heeft (Lerdahl en Jackendoff, 1983). Het zijn beide karakteristieken van de menselijke soort, die zowel universeel voor alle mensen zijn als specifiek voor mensen (Sloboda, 1986). De geluiden die dieren produceren zijn geen taal en geen muziek, maar eerder iets er tussenin. Het is niet zo complex als taal, maar het is ook geen muziek, want het dient wel als communicatiemiddel. (Zo zijn er ook volken die muziek, bijvoorbeeld tromgeroffel, als communicatiemiddel gebruiken. Daarvoor geldt hetzelfde als voor dierengeluiden, het is iets tussen taal en muziek in.) Het lijkt erop dat muziek niet los gezien kan worden van de rest van de menselijke cognitie, net als taal (Lerdahl en Jackendoff, 1983) en dat het puur een gevolg is van het feit dat de mens leerde de wereld om zich heen te conceptualiseren (Sloboda, 1986). Gesproken taal en muziek worden beide voortgebracht door middel van geluid. Zang en taal worden zelfs beide geproduceerd door het in trilling brengen van de stembanden met de luchtstroom uit de longen. Wat dat betreft zijn het beide eenvoudig twee soorten van gestructureerd geluid. En dat is de grootste overeenkomst tussen taal en muziek: de structuur. Structuur is iets dat alle talen en muzieksoorten gemeen hebben. Ze zijn opgebouwd uit losse componenten, die op een hiërarchische manier samengevoegd zijn tot een groter geheel. En voor zowel taal als muziek lijkt het zo te zijn dat dat op een universele manier gebeurt (Lerdahl en Jackendoff, 1983). Die structuur is wat ik onderzoek in deze scriptie en daarvoor vergelijk ik twee theorieën die die structuur beschrijven. De eerste is een muziektheorie, de tweede een taaltheorie. Er zijn nog veel meer overeenkomsten te noemen tussen taal en muziek, zoals de plaats in de hersenen van taal en muziek, maar dat voert te ver in de context van deze scriptie. Het zou leuk zijn dat allemaal nog eens te bestuderen in de toekomst. De opbouw van deze scriptie is als volgt: in het eerste hoofdstuk beschrijf ik een generatieve muziektheorie, een theorie van Lerdahl en Jackendoff, in hoofdstuk 2 geef ik een beschrijving van een taaltheorie, Optimality Theory, van Prince en Smolensky (1993) en in hoofdstuk 3 bekijk ik in hoeverre deze theorieën overeenkomen. Dit is dan ook mijn eerste onderzoeksvraag: zijn de generatieve muziektheorie van Lerdahl en Jackendoff en de
INLEIDING
taaltheorie Optimality Theory van Prince en Smolensky te vergelijken en kunnen ze elkaar aanvullen? Dan volgt er een groot hoofdstuk, hoofdstuk 4, waarin ik de onderwerpen van beide theorieën, taal en muziek, vergelijk. Ik beperk me daarbij tot de structurele eigenschappen van segment, stress, ritme en metrum, en intonatie. De reden dat ik me daartoe beperk, is dat deze scriptie geschreven is in het kader van de fonologie, dus zijn het fonologische kenmerken die ik vergelijk. En binnen het bestek van een scriptie, waar een tijdslimiet aan zit, moet je jezelf nou eenmaal beperkingen opleggen. De onderzoeksvraag die bij dat hoofdstuk hoort, luidt natuurlijk: zijn taal en muziek vergelijkbaar wat hun structuur betreft, met name op de punten segment, stress, ritme en metrum, en intonatie? Tenslotte belicht ik in hoofdstuk 5 een intonatie-onderdeel van hoofdstuk 4, declinatie en declinatie binnen declinatie, apart in een experiment. Dat experiment is onderverdeeld in een spraakgedeelte en een muziekgedeelte. In het spraakgedeelte onderzoek ik of er declinatie binnen declinatie bestaat, wat zou laten zien dat er hiërarchische relaties aangegeven worden door intonatie. En in het muziekgedeelte is de onderzoeksvraag of declinatie wel een intonatieverschijnsel is, of dat het eerder fysiologisch is en te maken heeft met de ademhaling. Als declinatie ook voorkomt in instrumentale muziek, dan is dat evidentie voor de hypothese dat declinatie niet fysiologisch is, maar een middel is om hiërarchische relaties te specificeren. In het laatste hoofdstuk beantwoord ik al deze vragen in de conclusie. Ik eindig mijn scriptie met een discussie over een theoretische kwestie en over de vraag hoe het komt dat taal en muziek zo veel overeenkomsten vertonen. Als besluit van deze inleiding wil ik nog kort iets zeggen over de relevantie van dit onderzoek. Taal en muziek zijn twee cognitieve processen. Meer te weten komen over cognitieve processen, dus over de werking van de hersenen, kan het wetenschappelijk onderzoek op het gebied van de hersenen en de psychologie altijd een stap verder brengen. En natuurlijk kan het van belang zijn voor de taalkunde en de muziekwetenschap zelf. De uitkomsten van mijn experiment zijn mogelijk een aanwinst voor de spraaktechnologie, zoals bijvoorbeeld de toepassing voor sprekerherkenning of spraakcomputers. Dit onderzoek heeft dus relevantie voor verschillende gebieden in de wetenschap.
7
1 EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF Dit hoofdstuk gaat over een muziektheorie waarin de representaties duidelijke overeenkomsten vertonen met die in de taalkunde. De generatieve linguïstiek (Chomsky, 1965, in: Lerdahl en Jackendoff 1977) diende dan ook als voorbeeld voor deze muziektheorie, geschreven door de componist Lerdahl en de taalkundige Jackendoff. Op haar beurt heeft deze muziektheorie weer invloed gehad op een moderne fonologische theorie, Optimality Theory van Prince en Smolensky (1993). Optimality Theory wordt besproken in hoofdstuk 2, waarna ik de vergelijking trek tussen beide theorieën in hoofdstuk 3.
1.1 HET BEGRIJPEN VAN MUZIEK De muziektheorie van Lerdahl en Jackendoff is een theorie over hoe de geoefende luisteraar muziek hoort: als georganiseerde patronen. Dit is een grotendeels onbewust proces, dat de luisteraar in staat stelt een muziekstuk te “begrijpen”. Met de geoefende luisteraar wordt de luisteraar bedoeld die bekend is met het muzikale idioom in kwestie, zodat hij of zij een onbekend stuk kan herkennen als een voorbeeld van dat idioom, voor dat idioom onbekende elementen in het muziekstuk kan identificeren en in het algemeen een stuk kan begrijpen binnen dat idioom. Natuurlijk bestaat er niet iets als een scherpe tweedeling tussen geoefende luisteraars en ongeoefende luisteraars. Ieder individu valt ergens in een continuüm en zal op een ander punt de muziek niet meer “begrijpen” dan een ander. De “geoefende luisteraar” is daarom een abstract begrip en het geeft niet duidelijk weer om wie het gaat. Het omvat een zeer diverse groep luisteraars met verschillend kennisniveau. De manier waarop de “geoefende luisteraar” muziek begrijpt, is dus een soort idealisering van wat al deze luisteraars begrijpen. Dit is hetzelfde met de onbewuste kennis van de taalgebruiker: deze kennis is ook een idealisering. Veel mensen spreken heel anders dan volgens de taalregels. Het is dan net of ze die regels niet kennen. Ook interessant is het dat zo veel mensen moeite hebben met de Nederlandse spelling, terwijl veel van de spelling toch is af te leiden uit onze interne grammatica, ons taalgevoel. Toch is die onbewuste grammatica afgeleid uit de kennis van deze zeer heterogene groep, alle volwassen moedertaalsprekers zonder taalstoornis. De “moedertaalspreker” is dus net zo’n idealisatie als de “geoefende luisteraar”. De muziek wordt bestudeerd als een mentaal geconstrueerde entiteit. De waargenomen geluidsgolven worden door de luisteraar verdeeld in eenheden, patronen en relaties, om de muziek te kunnen “begrijpen”. De manier waarop muziek wordt gehoord is een mentaal product, afgeleid van het fysieke signaal. Het is daarom deel van de cognitieve psychologie, net als de taaltheorie. Het affectieve, emotionele aspect van de muziek wordt buiten beschouwing gelaten omdat het moeilijk is daar iets systematisch over te zeggen. Alleen de structuur van muziek is onderwerp van de theorie. Lerdahl en Jackendoff zien muziek als puur structuur, wat een verschil is met taal, omdat bij taal met betekenissen en functies rekening moet worden gehouden (Lerdahl & Jackendoff, 1983). Evenals in de taalkunde is de vraag interessant of er universele principes bestaan voor een muzikale grammatica. Hoewel er duidelijk erg veel verschillende muzieksoorten bestaan, die soms geen enkel verband lijken te vertonen, is het toch mogelijk dat er bepaalde algemene muzikale kenmerken zijn aan te wijzen. De algemene neiging van luisteraars om muziek in te
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF
delen in georganiseerde patronen lijkt te wijzen op een universele muzikale grammatica, principes die beschikbaar zijn voor alle geoefende luisteraars om de muziek die ze horen te organiseren. Interessant is het om die neiging tot structureren door te trekken naar elke vorm van temporeel geordend gedrag, en zelfs naar ieder menselijk gedrag (zie Gilbers, 1992). Dans is een vorm van temporeel geordend gedrag dat op dezelfde manier wordt gestructureerd als muziek: van losse, ritmische passen tot de hele dans. Maar de mens heeft ook de neiging alles om zich heen te ordenen. In een huis wordt niet alles op een grote hoop gegooid, maar boeken staan in een boekenkast, kleding ligt in de klerenkast en kookgerei wordt in de keuken opgeborgen. Die categorieën zijn nog opgedeeld in deelcategorieën: de pannen bij elkaar, servies bij elkaar en kruiden weer apart. Alles wordt dus ingedeeld in een eigen categorie en daarnaar wordt het geordend. Omdat de neiging tot structureren universeel is, maakt het niet uit met welk muzikale idioom de luisteraar ervaring heeft. Deze theorie gaat uit van Westerse (klassieke) tonale muziek, maar ziet die muziek als deelverzameling van alle muziek; de basiscomponenten voor de theorie zijn ontworpen om muziek van verschillende tradities en historische perioden te omvatten.
1.2 TONALE MUZIEK Alle muzikale culturen delen het toongebied in volgens een bepaald systeem. Al die systemen zijn gebaseerd op het octaafinterval. Het huidige Westerse octaaf is ingedeeld in zeven hele toonafstanden met daartussen nog halve toonafstanden, waardoor het systeem de naam diatoniek heeft meegekregen. Met deze diatonische toonladder zijn intervallen te vormen, relaties tussen twee of meer tonen. Die intervallen kunnen melodisch zijn, de tonen volgen elkaar dan op, of harmonisch, als de tonen simultaan klinken. (1)
prime
secunde
terts
kwart
kwint
sext
septiem
octaaf
De Westerse tonaliteit is gebaseerd op de terts. Bestaat die terts uit twee grote toonafstanden, dan klinkt het stuk in majeur, bestaat de terts uit een grote en een kleine toonafstand, dan klinkt het in mineur. Intervallen kunnen ingedeeld worden in consonante en dissonante intervallen. Volkomen consonant zijn de prime en het octaaf, de kwart en de kwint (consonant). Onvolkomen consonant zijn de terts en de sext. Dissonant zijn de secunde en de septiem. Door één van de leden van een interval (of beide) te verhogen of te verlagen worden de intervallen klein, groot, verminderd of overmatig. Een interval waarin de tonen één halve toon dichter bij de andere komt wordt klein, waar een toon juist verder van de andere af komt 9
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF
wordt het interval groot; komen beide tonen dichter naar elkaar toe dan is het interval verminderd en gaan ze beide verder van elkaar af dan is het interval overmatig. Dissonantie is gradueel. Een melodisch interval dissoneert minder dan een harmonisch interval, tonen die verder uit elkaar liggen in het register vormen dissonantere intervallen dan tonen die binnen hetzelfde octaaf klinken en overmatige en verminderde intervallen worden als erg dissonant ervaren. Een samenklank van drie of meer verschillende tonen wordt een akkoord genoemd. Het meestgebruikte akkoord is de drieklank, opgebouwd uit tertsen (grote, kleine, verminderde of overmatige). Drieklanken kennen een grondligging, waarin de twee tertsen op elkaar boven de grondtoon liggen, en twee omkeringen. In de eerste omkering ligt de grondtoon een octaaf hoger (dit wordt een sextakkoord (6) genoemd), in de tweede omkering is de eerste terts ook een octaaf omhoog geplaatst (dit wordt een kwart-sextakkoord ()genoemd). Omkeringen kunnen natuurlijk ook naar beneden toe plaatsvinden. Een omkering verandert het karakter van een akkoord niet echt. Drieklanken en septiemakkoorden (waarin een derde terts is toegevoegd) worden gevormd op toontrappen in de toonladder waaruit een stuk is opgebouwd. De toontrappen worden aangeduid met Romeinse cijfers: (2)
I
II
III
IV
V
VI
VII
De eerste, vierde en vijfde toontrappen zijn altijd majeurdrieklanken, de tweede, derde en zesde altijd mineur en de zevende is verminderd. De toontrappen hebben ieder een eigen functie in een stuk. De hoofdfuncties zijn I, de tonica, de toonhoogte waarop de melodie in een stuk gebouwd is, IV, de subdominant, die spanningvoorbereidend is naar V toe, de dominant, het sterkste contrast met de tonica. De dominant veroorzaakt spanning, zodat het altijd terug wil naar de tonica, het rustpunt en vormt daarom altijd het einde van een zin in een stuk, samen met de tonica. V-I is een standaardslot van een muziekstuk. In deze drie akkoorden zitten alle tonen van de toonladder. De parallelle functies kunnen optreden als plaatsvervanger voor de hoofdfuncties. Een parallelle functie vervangt altijd de hoofdfunctie waar het een kleine terts onder ligt. II vervangt dus de subdominant IV, III vervangt de dominant V, VI vervangt de tonica I en VII vervangt de dominant. Een akkoord heeft in de ene toonsoort een andere functie dan in de andere toonsoort. Daardoor kan soms van toonsoort veranderd worden (modulatie). Het akkoord dat in de ene toonsoort een bepaalde trap is, vormt in de andere natuurlijk een andere trap en heet daarom het spilakkoord. Vaak is dat de tussendominant: een vijfde trap voor een àndere trap dan de tonica. Het is een tijdelijke dominant, alléén ten opzichte van het volgende akkoord. Normaal is de dominantfunctie V-I, nu is het V-IV. Dit heet een bedrieglijk slot ofwel plagale cadens: het lost niet op in de tonica, maar, in het geval van C groot, in de vervanger A klein (VI). Tonale systemen hebben drie universele elementen: een collectie toonhoogten die is ingedeeld volgens een bepaalde schaal (i.e. de diatonische schaal in Westerse muziek); één lid van die 10
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF
collectie functioneert als tonica en een relatieve stabiliteit tussen de leden van de toonhoogtecollectie (met name in relatie tot de tonica) (Lerdahl & Jackendoff 1983). Juist die relatieve stabiliteit ontbreekt bij atonale muziek. Van de relaties die bestaan tussen de verschillende akkoorden wordt daarin geen gebruik gemaakt en vaak wordt, in tegenstelling tot tonale muziek veel gebruik gemaakt van dissonanten, zonder dat die oplossen in consonanten. Meestal is in atonale muziek ook het ritme niet samenhangend.
1.3 HET DOEL VAN DE THEORIE Het doel van de generatieve muziektheorie van Lerdahl en Jackendoff is de formele beschrijving van de muzikale intuïties van de geoefende luisteraar. Deze geoefende luisteraar is een idealisatie, want niemand hoort een muziekstuk op precies dezelfde manier, maar over het algemeen is er overeenstemming over wat de meest natuurlijke manier is om een stuk te horen. Zoals gezegd zijn die muzikale intuïties grotendeels onbewust. De doelen van deze muziektheorie vertonen parallellen met de doelen van de transformationele generatieve grammatica van de taalkunde, waarbij linguïstische intuïties worden beschreven. Maar het is niet de bedoeling van Lerdahl en Jackendoff dat deze theorie zal lijken op de linguïstische theorie. Ze benaderen muziek en taal als twee verschillende manifestaties van het menselijke cognitieve vermogen. De generatieve theorie van tonale muziek is niet een beschrijving van welke stukken grammaticaal zijn, maar specificeert alle structuren die de geoefende luisteraar afleidt uit zijn of haar waarneming van een muziekstuk. Mij lijkt de overeenkomst groter: de generatieve taalkundige grammatica beschrijft immers niet welke zinnen grammaticaal zijn, maar de intuïties van de mensen over welke zinnen grammaticaal zijn, over de juiste structuur dus van zinnen. Ook deze muziektheorie beschrijft intuïties van mensen, over hoe een muziekstuk gestructureerd is. Het enige verschil is dat het woord grammaticaal niet op muziek van toepassing lijkt te zijn. De theorie van Lerdahl en Jackendoff probeert uit te maken welke manier van horen de meeste voorkeur heeft, gewogen als meer of minder geprefereerd op een schaal van samenhang. Hiervoor wordt de theorie opgedeeld in welgevormdheidscondities, die de mogelijke structurele beschrijvingen specificeren, en voorkeursregels, de zgn. preference rules, die de mogelijke structurele beschrijvingen aanwijzen die corresponderen met de manier van horen van een muziekstuk door de geoefende luisteraar. Wat onder geprefereerd valt, moet voldoen aan een aantal criteria, waaronder interne consistentie van de regels en hun generalisatie van bepaalde gevallen naar het totale domein van de klassieke tonale muziek (Lerdahl & Jackendoff, 1977).
1.4 DE STRUCTURELE BESCHRIJVING VAN MUZIEK De theorie moet psychologisch plausibel zijn. Dat betekent dat de bestaande complexiteit een resultaat moet zijn van de interactie van een vrij klein aantal processen, die op zichzelf relatief eenvoudig zijn. De verschillende domeinen van analyse in de theorie van Lerdahl en Jackendoff zijn groeperingsanalyse, metrische analyse, tijdsspannereductie (time-span reduction) en prolongerings- (aanhoudings-)reductie (prolongational reduction). Deze domeinen interacteren met elkaar. 11
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF
De groeperingsanalyse brengt groepsgrenzen aan in de muziek op een hiërarchische manier op elk niveau van een muziekstuk. De metrische analyse kent een hiërarchie toe van sterke en zwakke beats (maatslagen). De tijdsspannereductie wijst “structurele beginpunten” en “structurele eindpunten” van groepen aan en kent aan de toonhoogten een hiërarchie toe die ze relateert aan de groeperings- en metrische structuren. De prolongeringsreductie kent aan de toonhoogten een hiërarchie toe die harmonische en melodische continuïteit en progressie laat zien. (Lerdahl & Jackendoff, 1977). Deze vier domeinen van analyse kennen ieder hun eigen welgevormdheidseisen en preferentieregels.
1.4.1 Ritmische structuur De luisteraar organiseert bij het horen van een tonaal stuk het geluidssignaal in eenheden, zoals motieven, thema’s, frasen, themagroepen, secties en het stuk zelf. De generaliserende term voor deze eenheden is groep. Met een groeperingsanalyse worden in de muziek groepen aangegeven door middel van bogen onder de muzieknotatie. De groeperingen worden beperkt door groeperingswelgevormdheidsregels. Die eisen: (1) dat een stuk hiërarchisch zó is georganiseerd dat één gebied andere gebieden kan bevatten, maar niet deels met andere gebieden mag overlappen (zie figuur (3 a)); (2) dat processen van organisatie hetzelfde zijn op alle hiërarchische niveaus (zie figuur (3 b)). In (3 b) is dit niet het geval. In j op niveau 2) is een overlapping getekend. Op niveau 2) is dus de organisatie niet hetzelfde als op niveau 1). En in k wordt een groep die op niveau 2) gevormd was op niveau 3) doorbroken. Dat is in de muziek niet mogelijk, net zo min als in taal. Groepen op een hoger niveau omvatten groepen van een lager niveau in hun geheel. (3)
a.
b.
(Lerdahl & Jackendoff, 1977) Zo kun je in de fonologische metrische gridopbouw niet op één niveau geen kruisje hebben en op het volgende niveau wel één: (4)
Dus wel: x x x x x x
en niet: x x x x x
12
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF
Door het toepassen van steeds dezelfde regels is het mogelijk een proces van organisatie oneindig uit te werken. Dit is het principe van recursie. Dat principe is ook op taal van toepassing. Om uit de welgevormde groeperingen de geprefereerde te kunnen selecteren, zijn er groeperingspreferentieregels, geclassificeerd volgens de principes (a) articulatie van grenzen, (b) parallellie in structuur en (c) symmetrie. Groepsgrenzen worden uitgedrukt door factoren als afstand tussen attack-punten, rusten, in de muzieknotatie geschreven bogen, verandering van register, verandering van aard, verandering van dynamiek en verandering van timbre. Een ander articulatorisch middel is de harmonische cadens, die het einde van groepen markeert. De regel Parallellie heeft te maken met een zekere repetitie of gelijkenis in de muziek, zoals een motief, een reeks, een sectie, etc. De gelijkenis is met name aan het begin van groepen bepalend. In tonale muziek is parallellie de belangrijkste factor in groepering op grote schaal. De preferentieregel van Symmetrie is gerelateerd aan die van parallellie. Het stelt dat de ideale onderverdeling van een groep in gelijke delen is. Er doen zich in muziek soms groepsoverlappingen voor. Dat voldoet niet aan de welgevormdheidsregels van hiërarchische organisatie. Om de overlappingen toch te kunnen verantwoorden, zou er een transformationele regel nodig zijn. De transformationele regel relateert onderliggend welgevormde groeperingen aan de muzikale oppervlakte, zodat overlappingen variaties zijn van normale hiërarchische groeperingen (zie voorbeeld (5)): (5) Mozart: Sonata K. 279, I
(Lerdahl & Jackendoff, 1977)
Dit betekent dat op het onderliggende niveau de overlapping uit elkaar wordt gehaald, waarbij het ene deel functioneert als het einde van de voorgaande groep en het andere als het begin van de volgende groep. In de oppervlakte functioneert de overlapping op hetzelfde moment als begin en als einde van groepen. Om dit principe te verduidelijken is het handig om deze visuele parallel te bekijken: (6)
(Lerdahl en Jackendoff, 1983)
13
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF
Bij deze visuele parallel is (6 a) de meest voor de hand liggende manier van waarnemen als twee aan elkaar grenzende hexagoons die een verticale kant delen. Het wordt perceptueel eerder opgelost als b dan als c of d; een enkel grenselement dient als deel van twee onafhankelijke figuren. Dit is vergelijkbaar met overlap in de muziek. In taal komen vergelijkbare overlappingen tussen groepsgrenzen voor. Een voorbeeld is de naam Klukkluk, de indiaan uit de tv-serie Pipo de Clown. De naam is opgebouwd uit twee keer kluk, maar de k’s die in het midden terecht komen worden gerealiseerd als één klank [k]. De uitspraak is dus als [klklk]. Het grenselement [k] dient zowel als einde van het eerste kluk als als begin van het tweede kluk. Hetzelfde gebeurt met het woord soeppan: [sup
1.4.2 Metrische structuur Volgens Lerdahl en Jackendoff is metrische structuur onafhankelijk van groepsstructuur, maar interacteert er wel mee. Hoewel dit meestal wel het geval is, zijn er voorbeelden te noemen waarin metrische structuur niet onafhankelijk is van de groepsstructuur. Zo zijn er stukken waarin verschillende maatsoorten elkaar afwisselen. Als het metrum gewoon door gaat op dezelfde manier, valt het accent plotseling op een andere tel in de maat. Ook kan het voorkomen dat in een stuk het metrum ongeaccentueerd doorgaat als een soort metronoom. Uit de melodie haalt men dan de maatsoort. Gilbers (p.c.) noemde een stuk van een groep die XTC heet. Twee liedjes1 zijn aan elkaar vastgekoppeld, waarbij het monotone ritme onveranderd doorloopt. Uit de melodie blijkt dat het in vijven wordt geteld. Maar plotseling verandert de melodie zó dat het in vieren geteld moet worden (waar het overgaat in het tweede liedje), terwijl in de beat niets veranderd is. Ook hier wordt dus het metrum bepaald door de groepsstructuur van de melodie. De metrische analyse kent aan een muziekstuk een patroon van beats toe, in de structurele beschrijving aangeduid d.m.v. stippen onder de noten. Elk niveau van stippen geeft een representatie van de muziek in gelijke tijdsspannen. Elke stip geeft op een bepaald niveau het oordeel van wat een beat is op dat niveau. Als een beat op een bepaald niveau gevoeld wordt als “sterk”, is het een beat op het volgende niveau en krijgt het een extra stip. Het kan theoretisch opgebouwd worden tot het niveau van het hele stuk, maar de perceptie van het metrum is een relatief locaal fenomeen. (Lerdahl & Jackendoff, 1977). De metrische welgevormdheidsregels verzekeren de hiërarchische conditie dat een beat op een bepaald niveau ook een beat is op alle lagere niveaus. Een karakteristiek van metrische welgevormdheidsregels in klassieke tonale muziek is de gelijke afstanden tussen beats en de voorzorg dat op alle volgende niveaus de afstand tussen de beats twee of drie keer de afstand is van het direct lagere niveau. Dit is precies hetzelfde als bij grids in de metrische fonologie. 1
Het stuk is een samenstelling van de liedjes English roundabout (C. Moulding) en Cut it out (A. Partridge) (live opname mei 1981, Hammersmith Odeon). Deze opname verscheen in 1983 als b-kant van een 12” single Love on a farmboy’s wages (A. Partridge), uitgevoerd door XTC (1983).
14
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF
In hoofdstuk 4 is te zien dat voor de klemtoon in taal eveneens gelijke afstanden ideaal zijn (euritmiciteitsregels Hayes, 1984). Muzikale stijlen van andere culturen en historische perioden hebben vaak ingewikkelder regels van metrische welgevormdheid. De ritmische complexiteit van tonale muziek ontstaat door de interactie van metrische structuur met groepsstructuur en toonhoogtestructuur. (Lerdahl & Jackendoff, 1977). De metrische preferentieregels zijn geclassificeerd overeenkomstig met de principes (a) nadruk op sterke beats, (b) parallellie met groepsstructuur en (c) regelmatigheid van het patroon. Nadruk leggen op relatief sterke beats in de muziek gebeurt door middel van factoren als attack, accent, verandering van dynamiek, verandering van toonhoogteregister, harmonische verandering en vertragingen/oprekkingen. Hieraan kan de neiging van de luisteraar worden toegevoegd parallelle metrische structuren toe te schrijven aan parallelle groepsstructuren. Als contrasterende benadrukte beats niet sterk genoeg zijn om elkaar uit te sluiten, ontstaat er een syncopisch patroon. Deze factoren spelen ook een rol in de prosodie van taal. Zo is een belangrijke overeenkomst met de vertraging/oprekking in muziek het verschijnsel van final lengthening in taal. Dit behandel ik in hoofdstuk 4. Ook voor metrische overlappingen is een transformationele regel nodig. Overlappingen kunnen ontstaan als er een verschuiving in de metrische structuur plaatsvindt, zó dat eenzelfde moment in het stuk een dubbele metrische functie heeft. De transformationele regel deleert een set van stippen ten gunste van de andere in de muzikale oppervlakte. (In figuur (7 a) is de zwakkere metrische functie gedeleerd, in figuur (7 b) de sterkere.) (7)
a.
b.
(Lerdahl en Jackendoff, 1977)
Metrische overlappingen ontstaan soms onafhankelijk, maar over het algemeen ontstaan ze als gevolg van groepsoverlappingen die plaatsvinden op relatief zwakke metrische accenten. Als een groepsoverlapping plaatsvindt op een relatief sterk metrisch accent (zoals in voorbeeld (5)) resulteert dat niet in een metrische overlapping. Een gecombineerde groeps- en metrische overlapping heet een elisie of weglating. Ook hiervan is een visuele parallel te geven: (8)
(Lerdahl & Jackendoff, 1983)
15
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF
De meest natuurlijke manier om een elisie te interpreteren is (8 a), omdat daar de grenzen elkaar overlappen. Perceptueel wordt de elisie eerder als b dan als c of d uit elkaar gehaald. Elisies zijn onder te verdelen in die waarin de zwakkere metrische functie is gedeleerd en die waarin de sterkere metrische functie is gedeleerd. Ook elisies komen in de taal voor. Een voorbeeld komt uit de taal Etsako (Luganda) (cf. Clements, 1979), een toontaal. In toontalen zijn de toonhoogte een deel van de betekenis van het woord. Woordvorming gebeurt in het Etsako door middel van reduplicatie. Zo wordt van het woord owa (huis) ieders huis gevormd door owa + owa. De tonen op owa zijn hoog-laag. In de samenstelling wordt de a van de eerste samensteller gedeleerd, maar de lage toon daarvan blijft staan. Hier is dus sprake van een groepsoverlapping, terwijl de metrische grenzen niet overlappen. Het resultaat is owowa, met de toonstructuur hoog-laag-hoog-laag, waarbij de middelste lage en hoge toon aan dezelfde o gekoppeld zijn.
1.4.3 Toonhoogtereductie De toonhoogten in een stuk vormen relaties met elkaar en zijn net als de groepen en het metrum onder te brengen in hiërarchische structuren. De toonhoogtestructuur kan worden weergegeven zoals die wordt gehoord in de werkelijke tijdstroom, met groepsstructuur en metrische structuur, maar ook bestaat er een interne organisatie, waarin sommige elementen zorgen voor verlenging door uitwerking, of voor vooruitgang door contrast. Voor deze twee verschillende manieren van structureren van de toonhoogten bestaan twee representatiewijzen: de tijdsspannereductie en de prolongeringsreductie. Een reductie is het proces van het recursief substitueren van enkelvoudige pitch events voor opeenvolgingen van pitch events. Dit is het omgekeerde van uitwerkingen. Het laat zien hoe een luisteraar ingewikkelde patronen terugbrengt tot eenvoudige basispatronen om op die manier het stuk beter te kunnen begrijpen. De tijdsspannereductie en de prolongeringsreductie kennen beide hiërarchische structuren toe aan ieder voorkomen van een pitch event (pitch = toonhoogte) in een stuk. Dit wordt gerepresenteerd in een boomnotatie. De relaties in de bomen geven weer dat de opeenvolging van pitch events een uitwerking is van een enkele pitch event. Die enkele pitch event is de dominerende pitch event en is zelf één van de pitch events in de opeenvolging. De uitwerkingen daarvan zijn ondergeschikte pitch events en zijn relatief ornamentaal. Ik behandel beide reducties afzonderlijk in de twee volgende subparagrafen.
1.4.3.1
De tijdsspannereductie
De tijdsspannereductie wordt gebaseerd op de metrische en de groepsstructuur. Elke groep vormt een tijdsspanne. In de boomnotatie van de tijdsspannereductie staat een rechtsvertakking voor de ondergeschiktheid van een pitch event ten opzichte van de voorgaande pitch event binnen dat gebied op dat niveau. Een linksvertakking staat voor de onderschikking van een pitch event aan de volgende pitch event binnen dat gebied op dat niveau. 16
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF
Op opeenvolgende niveaus in de tijdsspannereductie bevinden zich uitwerkingen op meer of minder gespatieerde, afzonderlijke tijdsspannen. In elke tijdsspanne of gebied moet een dominerende pitch event gevonden worden. De rest van de pitch events in het gebied zijn uitwerkingen van die ene pitch event. De welgevormdheidsregels voor de tijdsspannereductie houden in dat takken elkaar niet mogen kruisen (in de fonologie staat dit bekend als de line crossing prohibition) en dat de toekenning van meer dan één tak aan dezelfde pitch event niet toegestaan is. Dit betekent dat samenvallende groepsgrenzen in deze reductie uit elkaar worden getrokken. In de boom correspondeert elk vertakkingsniveau met een gebied dat van toepassing is voor de preferentieregels. De preferentieregels voor de tijdsspannereductie kiezen de meest “stabiele” reductie en brengen die onder in een hiërarchie van zo stabiel mogelijke structuren. De tonica wordt geselecteerd uit de beschikbare collectie toonhoogten. De regels van relatieve stabiliteit of instabiliteit zijn de principes van relatieve consonantie of dissonantie. Locale consonantie is stabieler dan locale dissonantie; de drieklank is in z’n grondvorm stabieler dan de omkeringen; een akkoord is stabieler als de melodische noot in de zelfde toonsoort staat als de grondtoon van het akkoord; de relatieve stabiliteit van twee akkoorden wordt bepaald door de relatieve nabijheid ten opzichte van de tonica van de grondtoon op de kwintencirkels; pitch events zijn het meest stabiel als ze in metrisch sterke positie staan, etc. Al die criteria worden door de preferentieregels gebruikt om de meest dominerende pitch event van het gebied te selecteren. (Lerdahl & Jackendoff, 1977, 1983). In (10) wordt de tijdsspannereductie voor de passage uit een sonate van Mozart in (9) uitgewerkt. De reductie gaat in verschillende fasen. Eerst wordt (in (f)) een overzicht verkregen van de harmonische waarden van alle segmenten door waar nodig events terug te brengen tot hun kale basis, zonder ritmische uitwerking. De tweede fase (e) laat de werking zien van de preferentieregel die zegt dat als hoofd van de tijdsspanne de event (noot of akkoord) gekozen moet worden die in relatief sterke metrische positie staat. De derde en de vierde fasen (d en c) gebruiken weer bovengenoemde preferentieregel, versterkt door de preferentieregel die eist dat als hoofd van een tijdsspanne de event wordt gekozen die relatief harmonisch consonant is. Op het vijfde niveau (b) vindt een conflict plaats: van de uit niveau (c) overgebleven events staat de derde in metrisch sterkere positie dan de vierde. De vierde is in deze passage echter de dominant, die naar de tonica cadenseert en er is een preferentieregel die zegt dat als hoofd van een tijdsspanne de event gekozen moet worden die als cadens het einde van een groep benadrukt. Deze regel is sterker dan beide andere regels voor de keuze van een hoofd van de tijdsspanne. Uiteindelijk (in (a)) blijft de tonica (hier A groot) over. De hiërarchische relaties tussen de hoofden van de verschillende niveaus zijn af te lezen uit het boomdiagram. (Gilbers, 1987). Structurele beginpunten zijn de meest stabiele pitch event vroeg in een groep die een structureel einde kent. Structurele eindpunten van een groep kennen een prototypisch slot, de zogenaamde Full Cadence, een progressie van een V- naar een I-akkoord aan het einde van een groep. Variaties daarop zijn de ‘halve cadens’ (IV-V) en de ‘bedrieglijke cadens’ (V-IV). Een cadens is een syntactische eenheid waarin het eerste element ondergeschikt is aan het laatste. De structurele begin- en eindpunten domineren hiërarchisch alle andere pitch events in de groep. Groepen vallen onder andere groepen in de hiërarchie. Uiteindelijk blijven het structurele begin en eind van het hele stuk over als meest dominerende pitch events. Vaak is 17
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF
het laatste akkoord van het stuk de meest stabiele pitch event, terwijl de rest van het stuk daar een linksvertakking van is. Dat is te interpreteren alsof alle pitch events in het stuk, behalve de laatste, uitstel zijn van het moment van complete rust, het einde. (Lerdahl & Jackendoff, 1977). (9)
Mozart: Sonata K. 331, I
(Lerdahl en Jackendoff, 1977)
18
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF
(10)
Tijdsspannereductie n.a.v. (9):
(Lerdahl en Jackendoff, 1977)
De representatie van deze tijdsspannereductie is heel goed in een grid uit te drukken, zoals in de fonologie gebeurt:
x x x xx
x xx
x x xx
x xx
x x xx
x xx
x xx
x xx xx xx xx
Hieruit is goed af te lezen welke akkoorden de hoofden vormen in de tijdsspanne.
1.4.3.2
De prolongeringsreductie
In voorbeeld (9) is te zien dat belangrijke hiërarchische aspecten van de toonhoogtestructuur niet zijn opgenomen in de tijdsspannereductie in (10). Om deze aspecten toch in te sluiten in de beschrijving, moet de prolongeringsreductie ontwikkeld worden. Deze reductie beschrijft als het ware het in- en uitademen, de spanning en ontspanning in een stuk. Met een stuk wordt 19
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF
een soort verhaal verteld, met een inleiding, een uitwerking en een einde, voorzinnen en nazinnen, vraag en antwoord, met bekende en nieuwe informatie, spanning en rust, etc. In de parameter van het ritme in dit domein komen pitch events voor of na andere pitch events, maar ze worden niet gemeten overeenkomstig met het metrische ontwerp. Relevant is de uitwerking door harmonische en melodische connectie. Er zijn twee soorten van uitwerking in de prolongeringsreductie: de prolongering (verlenging), waarin de pitch event wordt uitgewerkt in twee of meer kopieën van zichzelf, en het contrast, waarin een andere, relatief ornamentele pitch event wordt geïntroduceerd. In het volgende hoofdstuk laat ik zien dat er Optimality Theory-constraints zijn die vergelijkbaar zijn met prolongering en contrast. De één (markedness) zorgt voor uniformiteit door de minst gemarkeerde vorm te kiezen, en de ander (correspondence) voorkomt dat door markedness alléén de minst gemarkeerde vormen voorkomen en alles daardoor hetzelfde zou worden, door input en output en van elkaar afgeleide outputs op elkaar af te stemmen. InputOutput Correspondence voorkomt dus dat bijvoorbeeld broek boek, of zelfs boe zou worden. Correspondence zorgt dus voor contrast, lexicale diversiteit. De prolongering wordt gerepresenteerd als twee takken die ontstaan uit een kleine, cirkelvormige knoop. Geen van beide pitch events heeft hiërarchische prioriteit over de andere. Je zou ze eerder kunnen beschouwen als een uitbreiding in de tijd van iets dat op een dieper niveau dezelfde pitch event is. Contrast wordt in de hiërarchische onderschikking gerepresenteerd als rechts- en linksvertakking, net als in de tijdsspannereductie, maar een belangrijk verschil is dat het in de prolongeringsreductie verder wordt geïnterpreteerd: in de tijdsspannereductie verwijzen vertakkingen slechts naar onderschikking van de ene pitch event aan de andere. In de prolongeringsreductie staat de rechtsvertakking voor progressie in een stuk en een linksvertakking staat (alleen op locaal niveau) voor een vertraging in relatie tot de bas.
20
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF ( <)
(11)
(Lerdahl en Jackendoff, 1977)
De welgevormdheidsregels en preferentieregels voor de prolongeringsreductie zijn vergelijkbaar met die voor de tijdsspannereductie: de welgevormdheidsregels sluiten het kruisen van takken uit evenals de toekenning van meer dan één tak aan de zelfde pitch event. De preferentieregels selecteren een hiërarchie overeenkomstig de principes van stabiliteit, vergelijkbaar met die van de tijdsspannereductie. Metrum wordt genegeerd, prolongeringen worden gemaximaliseerd.
1.4.3.3
De verschillen
De prolongeringsreductie en de tijdsspannereductie verschillen in structuur. Ze maken verschillende connecties tussen pitch events. In de tijdsspannereductie is bijvoorbeeld van de volle cadens het V-akkoord een linksvertakking van het erop volgende I-akkoord, omdat het binnen de tijdsspanne valt van de finale tonica, terwijl het V-akkoord in de prolongeringsreductie een rechtsvertakking van het I-akkoord is, omdat het een progressie is naar de tonica. (In beide is het V-akkoord ondergeschikt aan de tonica in verband met de principes van stabiliteit.) Rechtsvertakking op grote schaal wijst in de prolongeringsreductie altijd op significante syntactische voortgang in het stuk. Een ander verschil is dat in de tijdsspannereductie geen connecties worden gemaakt van harmonische identiteit, terwijl in de prolongeringsreductie te zien is of noten verschillen of hetzelfde zijn. In de tijdsspanne wordt alleen groepering aangebracht. Waarom is het nodig om twee soorten reductie te hanteren? Volgens Lerdahl en Jackendoff vertegenwoordigen ze twee verschillende psychologisch reële aspecten van het muzikale 21
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF
begrip. De tijdsspannereductie representeert de toonhoogtestructuur zoals die wordt gehoord in de werkelijke tijdstroom, waarin een groepsstructuur is aangebracht en een metrische structuur. De prolongeringsreductie staat voor de toonhoogtestructuur zoals die wordt gehoord in termen van de interne organisatie. Op de meeste niveaus is de prolongeringsreductie afhankelijk van de tijdsspannereductie, net zoals de groepsstructuur en de metrische structuur afhankelijk zijn van de toonhoogtestructuur. De twee reducties hoeven niet dezelfde opeenvolgingen van pitch events te produceren op corresponderende niveaus. Als dat wel gebeurt wordt dat congruent genoemd: de significante pitch events worden in de prolongeringsreductie gelijkmatig verdeeld over de tijdsspannen in een frase. Als ze niet de zelfde opeenvolgingen van pitch events produceren zijn ze non-congruent: sommige pitch events worden gerekt ten koste van andere, die gecomprimeerd worden. Congruente frasen zijn relatief rechtlijnig en ordelijk, terwijl non-congruente frasen een meer complexe, als het ware elastische kwaliteit hebben. (Lerdahl & Jackendoff, 1977, 1983).
1.4.4 Conflicten In dit systeem kunnen preferentieregels elkaar versterken, maar ze kunnen ook met elkaar in conflict komen. In (10) is een voorbeeld te zien van een conflict tussen de metrisch sterkere positie van het Fis-E-A-akkoord (het stuk staat in A), met een septiem tussen de Fis en de E, dissonant dus, en het meer stabiele V6 (E-Gis-B)-akkoord in maat 3. Het Fis-E-A-akkoord wordt gekozen in relatie tot de context van de frase als geheel, omdat de regelmaat van het harmonische ritme zo bewaard blijft en er zo een dalende lijn in de bas van tonica tot dominant gecreëerd wordt (A, Gis, Fis, E). In maat 7 is voor hetzelfde akkoord gekozen vanwege de parallellie met maat 3. Hier is dus sprake van een conflict tussen parallellie en stabiliteit. Preferentieregels kunnen dus met elkaar in conflict staan. Welke mogelijkheid dan wint hangt af van welke andere preferentieregels er nog meer in het geding zijn. Die maken uiteindelijk uit welke vorm de voorkeur heeft van de luisteraar.
1.4.5 Samenvatting De vorm van deze muziektheorie van Lerdahl en Jackendoff is samengevat in het overzicht in (12). De rechthoeken staan voor sets van regels, de ellipsen en cirkels voor de inputs en outputs van de regels en de pijlen verwijzen naar de richting van de formele afleiding. Het kan gezien worden als een systeem dat een muzikale oppervlakte als input neemt en als output de structuur produceert die de luisteraar hoort. De preferentieregels maken door middel van versterking of conflict uit wat uiteindelijk de meest geprefereerde analyse van een stuk is.
22
EEN GENERATIEVE MUZIEKTHEORIE: LERDAHL & JACKENDOFF
(12)
(Lerdahl en Jackendoff, 1983)
Het systeem van concurrerende preferentieregels is tegenwoordig niet meer onbekend in de taalkunde. De theorie van Lerdahl en Jackendoff is geschreven in de tijd dat de generatieve grammatica van Noam Chomsky nog niet veel alternatieven kende. Toen leken de taalkunde en deze muziektheorie niet op elkaar toepasbaar. Maar Lerdahl en Jackendoff (1983) noemen zelf al een aantal taalkundige gebieden waarop een gelijksoortige theorie van toepassing zou kunnen zijn, zoals relatieve scope van quantifiers, fonetische perceptie waar het gaat om akoestische tekens in frasen als gray ship, gray chip, great ship en great chip te onderscheiden en ze noemen de gemarkeerdheidsconventies. Een duidelijke parallel die ze met name behandelen is prosodische structuur. Preferentieregels maken in hiërarchische syllabestructuren (Liberman, 1975 en Liberman & Prince, 1977) uit welke syllabe de belangrijkste is. Gilbers (1987) zag in deze muziektheorie meteen de aanwinst voor de taalkunde. Hij werkte een muzikale theorie van triolen en opmaten uit waarmee verklaard kan worden waarom vocaalreductie in sommige posities wel kan optreden en in andere niet (zie hoofdstuk 4). Nu is er een theorie in opkomst die erg veel overeenkomsten lijkt te vertonen met de muziektheorie van Lerdahl en Jackendoff. Die theorie heet Optimality Theory (Prince & Smolensky, 1993) en werkt met constraints die in een hiërarchische relatie met elkaar staan die verschilt per taal. In het volgende hoofdstuk volgt een overzicht van Optimality Theory (OT). 23
2 OPTIMALITY THEORY In navolging van o.a. Chomsky (1965) wordt de grammatica in het algemeen beschreven als een bepaald aantal 'inputs' en structurele regels die de 'input' omzetten in 'outputs'. Deze aanpak is dus sterk inputgericht. Prince en Smolensky kwamen in 1993 met Optimality Theory en introduceerden daarmee een theorie die niet gericht is op de input, maar die het karakter van outputstructuren bekijkt. Hiervoor wordt gebruik gemaakt van condities op de welgevormdheid. De theorie is gebaseerd op Universal Grammar (UG) (Chomsky, 1965) wat wil zeggen dat de theorie uitgaat van een universele grammatica, zowel voor alle talen als voor de hele grammatica, dus ook voor de syntaxis en de semantiek, maar Prince en Smolensky richtten zich met name op de fonologie en de morfologie.
2.1 DE PRINCIPES VAN OPTIMALITY THEORY Het basisidee van Optimality Theory (OT) is dat UG bestaat uit een set condities ("constraints") op de welgevormdheid, waaruit individuele grammatica's worden geconstrueerd. Constraints kunnen in conflict zijn met elkaar over wat de meest welgevormde vorm is. De constraints zijn ‘soft’, wat inhoudt dat ze geschonden kunnen worden om aan een andere constraint te voldoen. Ze zijn hiërarchisch gerangschikt, zodat de hoogste in de hiërarchie zwaar wegen bij de keuze voor een kandidaat, terwijl (meestal) op de achtergrond de lagere nog een rol spelen, wat mogelijk is omdat de evaluatie parallel gebeurt. Volgens Prince en Smolensky bestaat er een 'strikte dominantiehiërarchie' tussen de constraints. Elke constraint heeft absolute prioriteit boven alle constraints die lager staan in de hiërarchie2. Traditioneel werd gebruik gemaakt van afleidingsregels van de vorm A → B/C _ D, voor het beschrijven van fonologische processen. Prince en Smolensky verwerpen deze operatiegebaseerde theorie omdat dat pure datacompressie zou zijn, en daarmee weinig verklarend. In plaats van de regels op de input die de output afleiden, genereren Prince en Smolensky een set van outputkandidaten. De kandidaat die het best voldoet aan de relevante constraints wordt geselecteerd. Daarvoor bestaan in UG de belangrijke mechanismen: GEN(erator), een generator die alle mogelijke outputkandidaten genereert, en H(armony)-EVAL(uator), die de kandidaten (parallel, niet serieel) evalueert en de beste selecteert aan de hand van de constraintrangschikking. Deze constraint-grammatica H-EVAL kan alleen die structuren toestaan die gedefinieerd zijn door GEN en het lexicon samen (Jansen, 1997).
2
Dit blijkt in de praktijk wel eens voor problemen te zorgen, zoals beschreven is in mijn (ongepubliceerde) paper “Hoe Optimaal is Optimality Theory?” (Schreuder, 1998).
OPTIMALITY THEORY
De constraints die werkzaam zijn in OT kunnen worden ingedeeld in constraintfamilies (Gilbers en Jansen, 1996). Drie daarvan zijn de 'Correspondence constraints', de 'Gemarkeerdheidsconstraints' en de 'Generalized Alignmentconstraints'. De 'Correspondence constraints' eisen dat twee representaties identiek zijn (McCarthy & Prince, 1995, in Gilbers en Jansen, 1996). Deze constraints worden opgedeeld in een groep 'faithfulness-constraints', die de relatie aangeven tussen de onderliggende vorm en de outputkandidaat (input-output correspondence) en een groep 'identity-contraints', die de relatie weergeven tussen outputvormen onderling (output-output correspondence). Een voorbeeld van een faithfulness-constraint is PARSE-SEG: elk onderliggend segment wordt opgenomen in de prosodische structuur en dus fonetisch gerealiseerd (Gilbers en Jansen, 1996). Output Output Correspondence speelt een rol bij cyclische effecten. Zo is in het Engels het verschijnsel bekend dat de vocaal in de tweede syllabe in het woord condensation niet reduceert, terwijl dat bij andere woorden met een vergelijkbare vorm, zoals compensation, vaak wel het geval is. Nu is er een identity-constraint die verlangt dat afgeleide vormen een aan hun basis identieke voetstructuur hebben. Condensation wordt dus vergeleken met condense en krijgt dezelfde voetstructuur (Gilbers en Jansen, 1996). In condense krijgt de syllabe -dense de hoofdklemtoon. Omdat condensation dezelfde voetstructuur moet krijgen als condense, kan hier geen vocaalreductie optreden. In compensation echter kan de vocaal in -pen- wel degelijk gereduceerd worden tot ., hoewel dit woord dezelfde voetstructuur heeft als condensation. Maar omdat compensation is afgeleid van compensate, met de klemtoon op com-, is -pen- dus een zwakkere syllabe, die daardoor wel voor reductie in aanmerking komt, in tegenstelling tot condensation. Gemarkeerdheidsconstraints vertellen dat bepaalde vormen gemarkeerder (moeilijker, ongebruikelijker) zijn dan andere. Onder de gemarkeerdheidsconstraints vallen onder andere syllabificatie-constraints: ONS (elke syllabe heeft een onset) en *CODA (een syllabe heeft geen coda) en voetvormconstraints: FOOTBINARITY (FT-BIN) (voeten bestaan uit twee syllabes of twee morae3). Ook onder gemarkeerdheid vallen constraints die bepalen of een segment moeilijker is te realiseren dan een ander segment voor bijvoorbeeld kinderen. De Generalized Alignment-constraints (McCarthy en Prince, 1993a, in: Gilbers en Jansen, 1996) brengen allerlei grammaticale verschijnselen onder één noemer die aan constituentgrenzen refereren. Zo is er bijvoorbeeld een constraint die eist dat morfologische grenzen samenvallen met fonologische grenzen. Constraints die in het vervolg van deze scriptie voorkomen zullen ter plekke worden toegelicht.
3
Let wel, OT is geen theorie over representaties, met andere woorden de inhoud van de hier gebruikte constraints is afhankelijk van de aangenomen representaties (Gilbers en Jansen, 1996).
25
OPTIMALITY THEORY
2.2 EVALUATIE VAN OUTPUTKANDIDATEN Om te illustreren hoe de evaluatie van outputkandidaten van een woord in z'n werk gaat, volgt hier een abstract voorbeeld met een aantal mogelijke outputkandidaten en vier verschillende constraints. (13)
Constraints Input Kandidaten Output 1 Output 2 Output 3
C1 >
C
C2 >
C3 >
*
C4 … *
* *
C
*
(Gilbers & Jansen, 1996)
In het tableau is linksboven een input gegeven, waaronder mogelijke outputvormen staan, door GEN gegenereerd. Horizontaal staan de constraints, van links naar rechts gerangschikt naar hun dominantieverhouding. C1 is dus de belangrijkste . Output 1 voldoet daar niet aan, dus die valt daar al af. Output 2 en 3 schenden beide C2. Om uit te maken welke van de twee dan toch de beste is, wordt gekeken naar de volgende constraint in de hiërarchie, C3. Output 3 schendt C3, dus voldoet Output 2 beter. Alles wat daarna nog met de constraints vergeleken wordt, zoals de schending van C4 door Output 1, speelt geen rol meer (grijstint) omdat de schendingen al fataal waren en alle kandidaten behalve Output 2 zijn afgevallen. Output 2 is de optimale output (aangegeven met ‘ ’). Op deze manier kan bijvoorbeeld de hoofdklemtoon van een woord bepaald worden.
2.3 DE VOORDELEN VAN OPTIMALITY THEORY Optimality Theorie heeft op een aantal punten voordelen boven derivationele theorieën. Het belangrijkste voordeel is dat alle afleidingen op één niveau kunnen gebeuren, waar in derivationele modellen meerdere niveaus nodig waren. Verschijnselen kunnen nu beschreven worden met één en dezelfde constrainthiërarchie. Eén niveau van afleiding is economischer dan meerdere niveaus. Processen die moeilijk of niet te beschrijven waren in termen van seriële regeltoepassing, zijn in OT juist goed te formuleren met de parallelle toepassing van constraints op outputrepresentaties. Prince en Smolensky (1993) bespreken bijvoorbeeld het probleem in het Tongan, waar syllabificatie soms berust op de klemtoon en klemtoon soms de syllabificatie nodig heeft. Er is dus sprake van een zogenaamde 'conspiracy' van invloeden. Deze interactie kan goed worden verantwoord in een OT-analyse met de simultane werking van syllabificatie- en klemtoonconstraints, waar in een derivationeel model regels niet tegelijkertijd kunnen worden toegepast. Ook kan door de parallelle evaluatie de werking van laag gerangschikte constraints zichtbaar worden bij de keuze van kandidaten. Dit is het geval als alle kandidaten alle "hogere" constraints schenden. Een lagere constraint moet dan de doorslag geven. Zo komt de meest
26
OPTIMALITY THEORY
optimale, meest welgevormde kandidaat alleen in aanmerking als deel van een taal4. Dat verschijnsel wordt "emergence of the unmarked" genoemd. Dit komt voor als twee kandidaten even goed of slecht voldoen aan hoger gerangschikte constraints. Zo is bijvoorbeeld de syllabificatie als (pap)(a) een mogelijkheid van onze taal, maar komt toch niet voor. Papa wordt gesyllabificeerd als (pa)(pa) en niet als (pap)(a), door de werking van ONS en *CODA. ONS en *CODA zijn in het Nederlands laag geplaatst in de constrainthiërarchie, maar (pa)(pa) en (pap)(a) voldoen beide even goed aan alle hoger geplaatste constraints, dus wordt hier de doorslag gegeven door de lagere constraints. In een parametersysteem zou je zeggen: in het Nederlands is een onset niet verplicht en een coda niet verboden. In dat geval zou (pa)(pa) niet beter zijn dan (pap)(a). Een ander belangrijk punt is de outputgerichtheid van de theorie waardoor over processen gegeneraliseerd kan worden waar dat niet mogelijk was in derivationele modellen. Dit is te illustreren met een voorbeeld van alernanties in het Turks (Clements & Keyser, 1983, cf. Burzio, 1995, in: Gilbers & De Hoop, 1998): (14) 1. 2. 3.
‘feeling’ ‘transfer’ ‘time’
Accusative hiss+i devr+i zama:n+i
Nominative his devir zaman
Ablative his+ten devir+den zaman+dan
De alternanties van deze drie vormen werden met verschillende regels verklaard in derivationele theorieën. De eerste werd verklaard door een degeminatieregel, de tweede door een epenthesisregel en de derde door vocaalverkorting. Maar als je naar de output kijkt, zie je dat deze processen alledrie plaatsvinden om een CVC-syllabe te vormen. CVC-syllabes zijn optimaal in het Turks. Door hetzelfde proces te beschrijven met drie verschillende regels wordt hier een generalisatie gemist, terwijl mensen generaliseren over deze processen. In de output krijgen alledrie de vormen in Nominatief en Ablatief een CVC-syllabe. Dat gebeurt weliswaar door middel van drie verschillende processen, maar met voor alledrie hetzelfde doel, namelijk een optimale CVC-syllabe te krijgen. Door alleen te kijken naar het resultaat van de drie processen, de output, kan OT hierover generaliseren. De schendbaarheid van constraints schept mogelijkheden die ‘harde’ constraints niet hebben. Als bijvoorbeeld de constraint FT-BIN niet schendbaar geweest zou zijn, zou een groot aantal bestaande woorden niet kunnen bestaan, zoals het woord zee. Zee heeft een open vocaal en is dus licht. Een lichte syllabe kan geen twee morae krijgen en voldoet daarom niet aan FT-BIN. Hoe is het dan toch mogelijk dat zee bestaat? Omdat constraints schendbaar zijn en FT-BIN gedomineerd wordt door de ongedomineerde constraint LX ≈ Pr (Elk lexicaal item heeft in ieder geval prosodische structuur). Zee heeft voetstructuur. Doordat de constraints in iedere taal anders zijn gerangschikt, zijn er zo veel verschillen tussen de talen. Optimality Theory heeft dus vele voordelen boven derivationele theorieën. Toch blijkt Optimality Theory in deze vorm nog niet helemaal optimaal te zijn, zoals ik verderop bespreek. Om die reden doe ik nog een kleine toevoeging aan Optimality Theory, waarvoor ik 4
Echter, in OT zou de mate van grammaticaliteit eventueel ook gradueel kunnen worden gerepresenteerd (zie De Hoop, 1996).
27
OPTIMALITY THEORY
in de volgende paragraaf kort de voorganger van Optimality Theory, Harmonic Grammar, bespreek.
2.4 HARMONIC GRAMMAR In mijn ongepubliceerde paper Hoe optimaal is Optimality Theory? (1998) concludeerde ik dat Optimality Theory optionaliteit niet goed aan kan. In het volgende hoofdstuk bespreek ik nog een aantal verschijnselen die problematisch zijn. Een optie is om terug te grijpen op een theorie waar Optimality Theory uit ontstaan is, Harmonic Grammar. Die theorie bespreek ik beknopt in deze paragraaf.
°
Optimality Theory is voortgekomen uit het connectionisme, een computationele theorie, die ge nspireerd is door de structuur van het menselijk brein. In ons brein werken neurale netwerken, waarin miljoenen neuronen met elkaar in verbinding staan. Kunstmatige neurale netwerken (connectionistische modellen) zijn daar abstracte vereenvoudigingen van en kunnen inzicht geven over hoe cognitieve processen als taalverwerking en muziekverwerking in hun werk gaan. In het connectionisme wordt een relatie gelegd tussen neurale structuur en neurale verwerking. Smolensky (1995) bedacht de voorloper van Optimality Theory, Harmonic Grammar. Dat gaat uit van connectionistische principes, waarbij activatie van connecties tussen eenheden (die uiteenlopende elementen representeren als woorden, klanken, kenmerken, etc.) het gewicht bepalen van een bepaalde output. Elke input-eenheid wordt geassocieerd met een getal dat de activatiewaarde van de eenheid geeft. Elke connectie tussen een input-eenheid en de output-eenheid kan ook geassocieerd worden met een getal: dit getal geeft het gewicht van de connectie. Hoe groter het gewicht, hoe zwaarder of sterker de connectie. Zo krijgt iedere output een gewicht, dat bepaald wordt door middel van allerlei berekeningen en dat omgezet kan worden in een outputsignaal. Smolensky voegt hieraan de notie ‘relatieve welgevormdheid’ toe, oftewel ‘harmonie’. Met betrekking tot een verzameling welgevormdheidscondities (die als kennis in het systeem zijn opgeslagen), geeft een numerieke maat aan in hoeverre een output welgevormd is, door middel van de relatieve harmonie van een ‘activatievector’ in een connectionistisch netwerk (Smolensky, 1986, 1995). Dit zijn ‘zachte’ condities, wat betekent dat ze schendbaar zijn. Hoe hoger de harmonie van het activatiepatroon van een symbolische structuur is, hoe welgevormder de structuur is. Dit staat graduele welgevormdheidsoordelen toe, omdat de zachte condities een variërende sterkte hebben. Door de parallelle verwerking van de input met betrekking tot de in het systeem opgeslagen condities, stijgt de harmonie van het totale activatiepatroon tot het een zeker maximum bereikt. Daar is dan de meest harmonieuze outputkandidaat gevonden. Smolensky en Prince (1993) gingen Harmonic Grammar op de fonologie toepassen en kwamen er achter dat het niet nodig was numerieke waarden toe te kennen aan de relatieve sterkte van constraints. De ordening gaat van sterk naar zwak, wat de numerieke specificatie overbodig zou maken. Ze pleitten in Optimality Theory daarom voor ‘strikte dominantiehiërarchieën’. (De Hoop, 1996). 28
OPTIMALITY THEORY
De notie ‘strikte dominantiehiërarchie’ zorgt hier en daar voor problemen met processen die niet verklaard kunnen worden, zoals verderop zal blijken. Dat is de reden dat ik toekennen van gewicht aan constraints zie als een optie om te bestuderen als toevoeging aan Optimality Theory. In de tijd dat Lerdahl en Jackendoff hun muziektheorie bedachten, bestond er nog een kloof tussen deze theorie en de bestaande generatieve taaltheorie, hoewel er duidelijk overeenkomsten waren. Maar met Optimality Theory lijkt het veel beter overeen te komen. In het volgende hoofdstuk vergelijk ik beide theorieëen, waaruit zal blijken hoeveel overeenkomsten ze hebben.
29
3 VERGELIJKING VAN BEIDE THEORIEËN 3.1 OUTPUTGERICHT De generatieve muziektheorie die Lerdahl en Jackendoff ontwikkelden, verschilt van andere op de generatieve taalkunde gebaseerde muziektheorieën. Sundberg en Lindblom (1976) ontwikkelden bijvoorbeeld een theorie die op de generatieve fonologie van Chomsky en Halle (1968, in: Sundberg & Lindblom, 1976) is gebaseerd. Daarin werd een stresscontour in de oppervlaktestructuur afgeleid van een dieptestructuur. Op dezelfde manier leidden Sundberg en Lindblom (1976) melodieën af van boomdiagrammen. Het is een systeem om muziek te genereren, door middel van een generatief regelsysteem. Dit is een systeem met verschillende niveaus van afleiding, inputgericht. In het voorgaande hoofdstuk heb ik argumenten aangevoerd voor de voordelen van een systeem met één enkel afleidingsniveau. Bovendien lijkt het creatieve aspect van muziek tekort gedaan in een derivationele theorie: alleen prototypische muziek kan door middel van regels afgeleid worden5. Beter dan kijken naar wat de input is van de muziek die aan de oppervlakte wordt waargenomen, is het om je te richten op de output, de muziek zelf zoals die wordt waargenomen door de luisteraar, om dezelfde redenen die voor taal gelden in Optimality Theory. De regelmatige patronen zijn immers aan de oppervlakte te zien. Dit is precies wat Lerdahl en Jackendoff doen en waarin ze sterk afwijken van de taaltheorie waarop ze hun muziektheorie gebaseerd zeggen te hebben. Ze beschrijven hoe de luisteraar muziek hoort en zijn/haar intuïties daarover. Ze noemen het niet direct bij naam, maar net als in Optimality Theory later gebeurde, zijn ze zich dus gaan richten op de output. De muziek wordt niet gegenereerd door middel van regels die worden toegepast op een input, maar er zijn welgevormdheidsregels en preferentieregels die op de output van toepassing zijn. Gilbers merkte in 1987 terecht op dat deze theorie heel mooi voor taal toepasbaar zou kunnen zijn. Enkele jaren later werd Optimality Theory geboren en de overeenkomsten met de theorie van Lerdahl en Jackendoff lijken groot te zijn. Prince en Smolensky (1993) beargumenteren in Optimality Theory waarom het belangrijk is naar de output te kijken en ook zij maken gebruik van welgevormdheidsregels op de output. En het belangrijkste: de constraints kunnen geschonden worden ten gunste van een hoger gerangschikte constraint. Ook dit hadden Lerdahl en Jackendoff al voor de muziek bedacht.
5
Sundberg en Lindblom (1976) maken dan ook gebruik van wiegeliedjes en volksliedjes om de theorie te illustreren. Dat soort volksmuziek staat bekend als prototypisch.
30
VERGELIJKING VAN BEIDE THEORIEËN
Wel is er enig verschil in terminologie: in Optimality Theory gaat het over de meest welgevormde vorm, terwijl Lerdahl en Jackendoff het over de meest geprefereerde vorm hebben. Ze bedoelen hetzelfde: in Optimality Theory lijkt ook meest geprefereerde vorm bedoeld te worden. Het gaat immers om voorkeuren waar niet altijd aan voldaan kan worden als andere voorkeuren voorrang krijgen. De welgevormdheidsregels van Lerdahl en Jackendoff hebben betrekking op de representaties en zijn dezelfde als de representationele regels die voor taal gelden.
3.2 GRAMMATICALITEIT Lerdahl en Jackendoff noemen als belangrijkste verschil met de taalwetenschap dat de generatieve muziektheorie geen beschrijving is van welke stukken grammaticaal zijn, terwijl dat wel het doel is van de taalwetenschap. Zelf denk ik dat het wel degelijk om een soort van grammaticaliteit gaat. Tonale muziek is grammaticale muziek: de noten zijn onderling structureel georganiseerd. Als die relaties worden losgelaten is de structuur weg en dat resulteert in het extreme geval in atonale muziek. Atonale muziek is daarom de muzikale tegenhanger van ongrammaticale taaluitingen. Wel zijn er in de muziek veel meer grammaticale relaties mogelijk dan in taal.
3.3 DOMEINEN VAN ANALYSE De domeinen van analyse van Lerdahl en Jackendoff’s muziektheorie zijn ongeveer dezelfde als in de taalkunde: de groeperingsanalyse, de organisatie van een stuk in secties, themagroepen, thema’s en motieven, is herkenbaar in de taal als het opdelen van tekst in zinnen en constituenten in de syntaxis, morfemen in de morfologie en fonologische frasen, voeten en syllaben in de fonologie6. De metrische analyse is geheel vergelijkbaar met de metrische fonologie, waarin de stress eveneens relationeel wordt afgelezen aan de hand van preferentieregels. Voor elke hiërarchische laag wordt een hoofd bepaald. Voorbeelden van preferentieregels om dat hoofd te bepalen in het Nederlands zijn “In een tweesyllabige voet is de eerste syllabe sterk” of “In een tweevoetig segment is de tweede voet sterk, desda vertakkend” (Gilbers, 1987). De tijdsspannereductie kan vergeleken worden met de hiërarchische indeling van intonatiepatronen in de fonologie, zoals de boomnotatie voor hoge en lage tonen gerelateerd aan het stresspatroon. En in de prolongeringsreductie, die de voortgang in een stuk beschrijft, kunnen overeenkomsten worden gezien met de syntactische en betekenisaspecten die intonatie aan taal toevoegt, zoals de frasering, die kan aangeven of een zin afgelopen is of nog doorgaat na bijvoorbeeld een komma (zie hoofdstuk 4). 6
In Selkirk (1980, in: Gilbers, 1987) wordt ook een woordniveau onderscheiden tussen het voet- en het fonologische frase-niveau. Maar meerdere (éénlettergrepige) woorden kunnen een voet vormen en andersom meerdere voeten een (bijvoorbeeld zeslettergrepig) woord. Hieruit is af te leiden dat het woord geen prosodische categorie is (Giegerich, 1984, in: Gilbers, 1987). Wordt het woord wèl als fonologische categorie aangenomen, dan resulteert dat in niveau-overlappingen, waardoor geen strikte hiërarchie meer bestaat. Hieraan moet worden toegevoegd dat een prosodisch woord niet noodzakelijkerwijs hetzelfde is als een morfologisch woord. Het prosodische woord speelt mogelijk wel een rol als fonologische eenheid.
31
VERGELIJKING VAN BEIDE THEORIEËN
Dat de domeinen van analyse van beide theorieën zo duidelijk overeenkomen, wijst op de overeenkomsten tussen taal en muziek zelf. Ze bevatten beide dezelfde domeinen en daarbinnen doen zich zelfs vergelijkbare processen en verschijnselen voor, zoals verderop in dit hoofdstuk zal worden aangetoond.
3.4 NOTATIEWIJZE EN REPRESENTATIE Ook de notatiewijze die Lerdahl en Jackendoff gebruiken voor de hiërarchische groepering is van dezelfde soort als in de fonologie, waarin de fonologische frase ritmisch wordt opgedeeld in een gelaagde hiërarchie. Een boomdiagram geeft de relatieve stress relationeel weer: (15)
(Gilbers, 1987)
De representatie van metrische patronen gaat in de fonologie op dezelfde manier als wat Lerdahl en Jackendoff doen, al worden in de fonologische metrische grids kruisjes onder de lettergrepen gezet en in de muziek stippen onder de noten. De opbouw is hetzelfde: iedere lettergreep of noot krijgt een kruisje dan wel stip, daarna de hogere groepering weer één, wat weer op het volgende niveau een hoofd kan worden, etc. De welgevormdheidsregels voor de representatie van de groepering in de muziektheorie en Optimality Theory komen op hetzelfde neer: overlappingen en kruising binnen en tussen niveaus zijn uitgesloten en een groep bevat de groepen van het vorige niveau in hun geheel. Het hoofd van een groep wordt gekozen uit de hoofden van de vorige groepen door middel van preferentieregels. Dat de preferentieregels in de domeinen van de taal en de muziek eveneens veel overeenkomsten blijken te vertonen, laat ik zien in hoofdstuk 4. De muziektheorie van Lerdahl en Jackendoff kent ook iets als een GEN(erator) en een EVAL(uator) die de mogelijkheden die GEN genereert checkt door middel van de preferentieregels. Lerdahl en Jackendoff (1977) geven een voorbeeld van twee mogelijke groeperingsanalyses van een Scherzo van Beethoven, te zien in (16):
32
VERGELIJKING VAN BEIDE THEORIEËN
(16) Beethoven: Sonata Op. 2, No.2, Scherzo a.
b.
(Lerdahl & Jackendoff, 1977)
(16 b) is een absurde analyse; op die manier hadden ze ook andere analyses kunnen maken door zomaar wat boogjes te trekken. De groeperingspreferentieregels, die groepsgrenzen, parallellie en symmetrie betreffen, zijn hier totaal genegeerd. (16 a) daarentegen voldoet wel aan die preferentieregels, die elkaar hier versterken. Van de verschillende mogelijkheden zou je op dezelfde manier tableaus kunnen maken als in Optimality Theory, waarin de hiërarchie van de preferentieregels de geprefereerde analyse uitmaakt.
3.5 PREFERENTIEREGELS, DE FAMILIES In de generatieve muziektheorie waren preferentieregels geformuleerd voor groepering, metrum en toonhoogte. Ik heb al genoemd dat deze domeinen ook op de fonologie van toepassing zijn. De preferentieregels waren in de muziektheorie geformuleerd in termen van articulatie van grenzen, parallellie in structuur en symmetrie. De fonologische groeperingspreferentieregels zijn eveneens te relateren aan deze noties. Ze lijken zelfs samen te vallen met de drie belangrijkste constraintfamilies in Optimality Theory. Eén van de drie belangrijkste constraintfamilies in Optimality Theory is Generalized Alignment (McCarthy & Prince, 1993b), die vereist dat grenzen van elke prosodische of morfologische grens van een type samenvallen met de grens van een prosodische of morfologische categorie van een ander type. Veel fonologische en morfologische processen refereren aan constituentgrenzen. Een voorbeeld van een proces dat aan de rechtergrens van Nederlandse woorden plaatsvindt, is final devoicing. Dat houdt in dat stemhebbende 33
VERGELIJKING VAN BEIDE THEORIEËN
obstruenten aan het einde van het woord stemloos worden uitgesproken. Zo wordt bijvoorbeeld de (stemhebbende) [d] in paarden uitgesproken als (stemloze) [t] in het woord paard. Parallellie is volgens Lerdahl en Jackendoff een tweede belangrijke categorie waarbinnen preferentieregels in de muziek vallen. Het houdt in dat gelijkenis en repetitie belangrijk zijn voor de groepering en opbouw in de muziek. Dit lijkt veel op de Optimality Theoryconstraintfamilie Correspondence, dat zorgt voor overeenkomst tussen input en output en tussen output-vormen onderling. In hoofdstuk 2 noemde ik het voorbeeld van condensation tegenover compensation. In compensation kan de vocaal in -pen- gereduceerd worden tot ., terwijl dat in condensation niet kan. Output-output Correspondence is hier de oorzaak van, want de vorm van de werkwoorden waar de woorden van zijn afgeleid verschilt en heeft een ander stresspatroon: compensation komt van compensate, met de klemtoon op com- en condensation van condense, met de klemtoon op -dense, waardoor de vocaal in -den- in condensation niet kan reduceren. En wat de symmetrie betreft zijn ook hier de preferentieregels vergelijkbaar: de ideale onderverdeling in de muziek is in gelijke delen. Gelijke afstanden tussen beats zijn ideaal in de muziek en in de fonologie zijn ook ritmische preferentieregels die regelmatige, alternerende patronen als optimaal zien. Hayes (1984) heeft de euritmieregels beschreven, regels die de ideale patronen voor taal weergeven. Deze theorie komt in hoofdstuk 4, paragraaf 2, uitgebreid aan bod. In dit hoofdstuk blijkt wel dat beide theorieën inderdaad veel overeenkomsten vertonen en dat ze elkaar ook kunnen aanvullen. In het volgende hoofdstuk behandel ik voorbeelden uit de muziek en de fonologie die overeenkomstige preferentieregels hebben. Ik behandel de verschillende fonologische niveaus in een volgorde “van klein naar groot”, dat wil zeggen dat ik begin bij segmenten en syllaben, waarna ik ritme bespreek en besluit met intonatie.
34
4 TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS In dit hoofdstuk zal ik enkele voorbeelden uit de fonologie naar voren halen van verschijnselen die ook in de muziek voorkomen en waarvan de preferentieregels veel overeenkomsten tonen met die in de muziek. Daarvoor leid ik de verschillende fonologische niveaus, die van klein naar groot oplopen, eerst kort in.
4.1 SEGMENTEN EN SYLLABEN 4.1.1 Introductie Fonemen zijn de segmenten van de fonologie. Een foneem voor een taal is een spraakklank die betekenisonderscheidend is in die taal. De fonemen worden traditioneel gezien beschreven door middel van fonetische, articulatorische kenmerken, die plaats en wijze van articulatie beschrijven. Fonemen die een aantal van deze kenmerken gemeen hebben, vormen natuurlijke klassen en nemen als klasse meestal deel aan bepaalde processen. Een voorbeeld is de klasse van de stemhebbende obstruenten, die in het Nederlands het proces ‘final devoicing’ ondergaan. Segmenten kunnen gemarkeerd of ongemarkeerd zijn. Gemarkeerdheid van segmenten wordt afgeleid van de mate van voorkomen in taalsystemen over de hele wereld, van het fonotactische gedrag van een segment, van historische klankveranderingen, van de volgorde waarin segmenten verworven worden door kinderen en door het gemak waarmee de segmenten zijn te produceren. Voor kinderen is het het gemakkelijkst om zo veel mogelijk contrast te maken, tussen sonorant en niet-sonorant. Sonorantie wordt bepaald door de mate waarin de trilling van de stembanden kan weerklinken in de “klankkast” van de mond-keelen neusholte. Hoe minder de luchtstroom wordt gehinderd door de articulatoren, des te sonoranter de klank. (17)
Sonoriteitshiërarchie
klasse: obstruenten voorbeelden: /p,t,k…/ minst sonorant
nasalen /n,m…/
liquids - glides - klinkers /l,r…/ /j,w…/ /a,i,u…/ meest sonorant
Omdat kinderen het gemakkelijkst zo veel mogelijk contrast tussen sonorant en niet-sonorant maken, zijn vocalen en (stemloze) obstruenten het minst gemarkeerd. Alles wat in het ‘grijze gebied’ daartussen ligt, is gemarkeerder. Het meest gemarkeerd zijn de liquids. Een ongemarkeerde optie is deel van de universele grammatica en hoeft dus niet geleerd te worden. Segmentele gemarkeerdheid kan articulatorisch, perceptueel of segmenteel, etc. van aard zijn. Bij positionele gemarkeerdheid gaat het om de posities in de syllabe. De opbouw van syllaben is weer te geven in een model, waarin de posities in de syllabe een eigen mate van belangrijkheid hebben. Die posities hebben de voorkeur voor bepaalde 35
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
fonemen, die een oplopende sonoriteit hebben naar de kern toe en daarna weer in sonoriteit afnemen. In dat model voor syllabeposities (Cairns & Feinstein, 1982), zijn de verticale lijnen de hoofdposities en de diagonale lijnen staan voor afhankelijke posities, die niet gevuld hoeven te worden. Zo is bijvoorbeeld een satellietpositie gemarkeerder dan de margin-core, en de coda gemarkeerder dan de peak. In de Nederlandse syllabe is het zo dat in de peak alleen vocalen kunnen voorkomen, in de margin core en in de coda alles behalve vocalen. In de satellieten komen alleen sonorante consonanten voor en in de extra-syllabische posities (appendix en pre-margin) alleen /s, t (p, k)/. (18)
4.1.2 Een segmentele overeenkomst met muziek De verschillende soorten gemarkeerdheid kunnen in conflict met elkaar zijn. Een voorbeeld van een dergelijk conflict komt van data van Gilbers. Zijn zoontje Steven (2;2 jr.). produceerde korst /k(rst/ als [k(s]. Hij kiest er dus voor het consonantcluster aan het einde van het woord te vereenvoudigen. De [r] is een zeer gemarkeerde klank en staat bovendien in een gemarkeerde syllabepositie, dus die valt af. De keuze voor de [s] of de [t] is een afweging tussen de gemarkeerdheid van het segment en die van de positie. De [t] is minder gemarkeerd dan de [s], maar Steven kiest toch voor de [s]. Dit heeft te maken met de positie in de syllabe. Het woord [k(rst] past als volgt in het model: (19)
Daarin wordt meteen duidelijk waarom Steven kiest voor [k(s]: de [r] staat in een satellietpositie en is daarom gemakkelijk weg te laten, de [s] staat in coda-positie, een belangrijker deel van het rhyme, en de [t] staat in de appendix, een extra-syllabische positie die heel gemakkelijk wordt weggelaten. Steven kiest hier dus voor een hiërarchie waarin de 36
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
gemarkeerdheid van positie belangrijker is dan gemarkeerdheid van het segment: PosM >> SegM. Helaas koos Steven op ongeveer dezelfde leeftijd (1;11 jr.) voor het woord acht ([<xt]) voor de omgekeerde volgorde in de gemarkeerdheidshiërarchie: SegM >> PosM. Hij sprak het uit als [
Blijkbaar vond Steven de [x] als segment zó moeilijk dat hij hier toch gekozen heeft voor de segmentele gemarkeerdheid boven de positionele gemarkeerdheid, want de [x] staat in de coda en de [t] in de appendix. De coda wordt hier weggelaten en de appendix wordt gevuld. Bij deze tegenstelling spelen misschien nog andere invloeden mee. Het is ook interessant om te kijken wat Harmonic Grammar hier kan betekenen. Dan zou de mate van gemarkeerdheid gewichten meekrijgen (niet noodzakelijk numeriek), zodat een zeer gemarkeerd segment zwaarder kan gaan wegen dan een gemarkeerde positie. Dan kan het gebeuren dat toch de voorkeur wordt gegeven aan een klank in de appendix boven zo’n moeilijke klank als de [x]. Een vergelijkbaar voorbeeld van een conflict tussen segmentele en positionele gemarkeerdheid die in de muziek voorkomt heb ik in hoofdstuk 1 laten zien (10). Daar gaat het om een conflict tussen metrische positie en de stabiliteit van het akkoord, ofwel het segment. Het V6 (E-Gis-B)-akkoord is stabieler dan het Fis-E-A-akkoord (in A), maar toch wordt het Fis-E-A-akkoord gekozen als hoofd van de groep. Dat akkoord staat in een metrisch sterkere positie en wat hier de doorslag geeft is Correspondence, de parallellie met de context, namelijk de dalende lijn die hierdoor bewaard blijft. Net als in het voorbeeld van Steven is het in de muziek mogelijk dat een hoofd wordt gekozen op grond van de stabiliteit van het akkoord, ondanks dat het in een metrisch zwakkere positie staat. Dat kan resulteren in een syncopisch ritme. Nog duidelijker dan in de fonologie zou Harmonic Grammar hier uitkomst kunnen bieden. Net als fonemen zijn akkoorden opgebouwd uit verschillende kenmerken, namelijk de afzonderlijke noten. De samenstelling van die noten kan meer of minder gemarkeerd zijn, zeker in relatie tot de toonsoort waarin het stuk staat. In de toonsoort A groot is Fis-E-A gemarkeerder dan E-Gis-B, zoals blijkt uit het bovengenoemde voorbeeld. Een akkoord dat gebouwd is op de tonica, zonder omkeringen, is het minst gemarkeerd: A-Cis-E. Net als ik voor de fonologische segmentele gemarkeerdheid suggereerde, zou het ook hier zo kunnen zijn dat de segmentele gemarkeerdheid van het ene akkoord zwaarder weegt dan de positionele gemarkeerdheid, terwijl dat voor een ander akkoord niet zo is. Een overgangstoon 37
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
(relatief dissonante toon in metrisch zwakke positie) is bijvoorbeeld ondergeschikt aan de voorgaande noot in sterkere positie. Maar een appoggiatura (relatief dissonante toon in sterke metrische positie die oplost in een consonante toon in relatief zwakke positie, door een stijgende of dalende stap) is ondergeschikt aan z’n oplossing, terwijl die toch in zwakkere metrische positie staat. Er is dus een relatieve gradatie van consonantie en dissonantie (Lerdahl en Jackendoff, 1983). Voor de positionele gemarkeerdheid maakt het dan natuurlijk ook uit om wèlke positie het gaat, zowel waar het fonologie als muziek betreft. Een beginpositie en een cadens in de muziek zijn de belangrijkste posities en een volle cadens is weer belangrijker dan een plagale cadens. De distinctieve kenmerken van de segmenten leggen ieder afzonderlijk gewicht in de schaal en de som daarvan is bovendien nog meer dan de delen. Dan wordt gewogen hoe belangrijk de positie is en zo wordt uitgemaakt wat de doorslag zal geven, ook al staat de preferentieregel voor positie als geheel misschien hoger in de hiërarchie. Op deze manier is nog niet verklaard dat stoel beter als [tul] dan als [sul] uitgesproken kan worden. Zo zijn beide nog mogelijk. Maar dit wordt opgelost door Alignment, dat de grenzen samen laat vallen met die van de onderliggende vorm. Later in dit hoofdstuk zal ik laten zien dat dit voor meer fonologische verschijnselen een interessante optie is. In Optimality Theory worden ook de fonologische constraints al opgedeeld, zoals Nonfinality Syllable (Nonfinσ) en Nonfinality Foot (NonfinΣ). Dat het in de muziek zo werkt is veel duidelijker dan in taal. Dit is dus een inzicht waarbij de taaltheorie iets van de muziektheorie kan leren. In deze paragraaf heb ik geïllustreerd dat segmentele kenmerken in taal en muziek mooie overeenkomsten blijken te vertonen, op het gebied van de gemarkeerdheid. In de volgende paragraaf kijk ik of dat ook geldt voor stress, metrum en ritme.
4.2 STRESS, METRUM, RITME 4.2.1 Introductie Net als muziek heeft taal ritme en een metrum. Het is een natuurlijke eigenschap van menselijke taal om metrische patronen op te leggen aan de klankstroom. In de muziek neemt de luisteraar een ritme waar, een instinctief regelmatig patroon waar van sterke en zwakke beats, die gerelateerd worden aan het klinkende muzikale geluid. Op een bepaald niveau van die beats wordt door de luisteraar meegetikt. Dat is hetzelfde niveau als waarop de dirigent met zijn stokje zwaait, het metrum. Het metrum zorgt voor een meeteenheid van tijdsduur tussen regelmatig terugkerende punten, een periodieke alternantie van sterke en zwakke beats (Lerdahl en Jackendoff 1981a). Het metrum in taal wordt gedefinieerd door stresspatronen, gevormd door hoofdklemtoon en nevenklemtonen, op woordniveau, woordsamenstellings- en groepsniveau en fraseniveau. Klemtoon (stress) is auditieve prominentie, die afhankelijk is van toonhoogte, toonlengte en toonluidheid (intensiteit). Beklemtoonde syllaben hebben vaak een hogere toon, langere duur en zijn vaak iets luider dan de omringende onbeklemtoonde syllaben. Luidheid is een minder belangrijke parameter dan toonhoogte en lengte (Katamba, 1995) en er spelen soms nog 38
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
andere fonetische kenmerken een rol. Stress is geen eigenschap van segmenten, maar een suprasegmentele eigenschap van het hele woord (Liberman & Prince, 1977). De functie van stress is dat het delen van woorden benadrukt, maar ook van woordgroepen en fonologische frasen en zinnen. Het onderscheidt de belangrijkere delen van de redundante. De klemtoonpatronen op de verschillende niveaus vormen een regelmatige terugkeer van accenten, het metrum. Tussen de ‘beats’ van het metrum in vormen zich de ritmische patronen, door een afwisseling van ritmisch sterke en zwakke lettergrepen. De sterke lettergrepen zijn prominent in een uiting. Deze prominentie van stress is relatief: iets is alleen sterk (s) ten opzichte van iets anders dat (relatief) zwak (w) is. Er wordt niet alleen onderscheid gemaakt tussen beklemtoonde en onbeklemtoonde syllaben, maar er zijn hiërarchische verschillen. Er is altijd een hoofdklemtoon op ieder prosodisch niveau en daarnaast een nevenklemtoon. Elke lettergreep daaronder heeft zo een plaats in een hiërarchie, die gevormd wordt door de relatieve prominentie van stress. Dit is de manier waarop elementen gegroepeerd worden tot constituenten. Dit is te representeren is in een boomdiagram, waarin de stressrelaties zijn af te lezen op de verschillende prosodische niveaus. Naast het accent (stress), dat met de boomstructuur wordt gerepresenteerd, is er het ritme, de afwisseling van relatieve sterke en zwakke beats. Ritme in taal wordt dus op dezelfde manier gevormd als in de muziek. Het ritme is goed te representeren door middel van grids, die worden geconstrueerd op grond van de verhoudingen in de boom. In de boom en de grid zijn de verschillende stress-niveaus en ritmische patronen af te lezen: (21)
Dit is wederom goed te vergelijken met de tijdsspannereductie van Lerdahl en Jackendoff, die eveneens bomen en grids gebruiken om metrische en tonale accent-hoofden te bepalen 7. De prominentie van een bepaalde syllabe in een uiting hangt ook af van de prosodische structuur. Het prosodisch woord is een belangrijke categorie, maar voor stress is de meest bepalende categorie de voet. 7
Ik reken hier voor de taal het tijdsspanne-aspect van de toonhoogte tot het ritmische gedeelte van taal, omdat stress mede is opgebouwd uit toonhoogte en absolute, discrete toonhoogteverschillen niet van groot linguïstisch belang zijn (Katamba, 1995). In de muziek is het natuurlijk wel een aparte categorie.
39
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
Een syllabe die een voet (Σ) is, heeft altijd een zekere prominentie en kan nooit geïnterpreteerd worden als zwak. Dit is van belang voor verschillende fonologische processen, zoals vocaalreductie, beschreven in subparagraaf 4.2.2.2. Belangrijk voor klemtoontoekenning is wat voor syllaben in een taal een voet vormen, of syllaben (te) licht, zwaar of superzwaar zijn. In het Nederlands moeten zware syllaben prominent zijn in een voet. In het Nederlands zijn de zware lettergrepen: VVC, CVC, VCC en CVVC. Licht zijn: V en CV. Een zware lettergreep is relatief sterk en kan stress krijgen. Zo ontstaat er een alternerend ritmisch patroon van sterke en zwakke lettergrepen. In het Nederlands wordt bijvoorbeeld in de meeste gevallen het woordritme bepaald door sterk-zwak alternerende syllaben, trocheeën.
4.2.2 Ritmische overeenkomsten met muziek 4.2.2.1
Euritmie
Het is duidelijk dat net als in de muziek ook in de fonologie de nadruk ligt op sterke beats: de preferentieregels kiezen de sterkste syllabe voor de hoofdklemtoon. Ook hier loopt de toekenning van stress, en daardoor van het metrum, parallel met de groepstructuur. Dit ligt voor taal in Optimality Theory vastgelegd in de constraint Alignment. Uit de stresshoofden van de lagere niveaus worden de hoofden op de hogere niveaus afgeleid. Hiervoor geldt, net als in de muziek (Lerdahl en Jackendoff, 1977, 1983) dat regelmatigheid van het patroon belangrijk is. Alternerende patronen in het ritme en gelijke afstanden tussen beats hebben ook in de fonologie de voorkeur. Dit idee is door Hayes (1984) uitgewerkt. Zijn theorie is outputgericht, net als de muziektheorie van Lerdahl en Jackendoff en later Optimality Theory. Hij formuleerde een aantal euritmieregels, die de ideale ritmische patronen in de taal beschrijven. De euritmieregels vereisen, net als de metrische preferentieregels in de muziek, gelijke afstanden tussen gridmarkeringen op alle niveaus. Het ideale interval op het scandeerniveau, het niveau direct onder het hoofdaccent, blijkt vier syllaben te zijn. Voor dit niveau geldt de Quadrisyllabic Rule: (22)
Quadisyllabic Rule (QR): Een grid is euritmisch als het een rij bevat waarvan de markeringen op een afstand van elkaar staan van zo dicht mogelijk bij vier syllaben.
Hij kwam hiertoe door het bestaan van (neven-)klemtoonverschuivingen, zoals in (23): (23) fourtéen Mississíppi seventy-séven
-
fòurteen wómen Mìssissippi législature sèventy-seven séals
Hayes stelt dat er verschoven wordt om geprefereerde ritmische patronen te creëren. Bepaalde ritmische structuren zouden hoog gewaardeerd zijn, euritmisch. Verschuiving wordt toegepast
40
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
als dat de euritmie van een tekst verhoogt. Het meest opvallende kenmerk van ritme is de herhaling van beats op ongeveer gelijke tijdsintervallen. De QR is te vergelijken met de 4/4-maat in de muziek, waarin de eerste tel altijd de ideale kandidaat is als metrisch hoofd. De derde tel is dan de ideale ondergeschikte sterke tel. Ditzelfde observeerde Hayes ook in de fonologie. Hij ziet meerdere ritmische niveaus waarop het ritme ideale intervallen bevat. Onder het scandeerniveau, het domein van de QR, ligt een niveau waarop de ideale afstand een interval van twee syllaben is. Hiervoor geldt de Disyllabic Rule: (24)
Disyllabic Rule (DR): De domeinen die op scandeerniveau zijn afgebakend, moeten gelijkmatig worden opgedeeld door de markering op het direct lagere niveau in de grid.
Het scandeerniveau is primair. Het algemene principe dat ritmische intervallen gelijk moeten zijn, blijft gelden voor beide niveaus. Evidentie voor de DR komt van gevallen waarin twee keer een ritmische verschuiving voorkomt binnen een viersyllabige frase: (25)
(Hayes, 1984) De QR zorgt op het scandeerniveau voor een interval van vier syllaben en op het daaronder liggende niveau zorgt de DR voor gelijke intervallen van twee syllaben. De druk van het interne ritme vervalt als het geen gelijke afstanden zou creëren.
V
Het lijkt er dus op dat taal een ideaal ritme heeft die overeenkomt met de -maat in de muziek, met het belangrijkste accent op de eerste tel en een lichter accent op de derde, dus met een indeling in tweeën op het lagere niveau. Mogelijk zijn de euritmieregels universele ritmische preferentieregels voor taal. Evidentie daarvoor vindt Hayes in het Pools en Dauer (1983, in Hayes, 1984) heeft de stress-patronen van veel talen onderzocht. Beiden vonden dat zowel syllable-timed talen (met vaste stress op een bepaalde lettergreep in het woord), als stress-timed talen (met hoofdklemtoon op de sterkste syllabe), de neiging hebben stress op dezelfde manier te spatiëren, met overeenkomstige interne stress-intervallen: de intervallen corresponderen ruwweg met de QR-intervallen. Hieruit valt op te maken dat de euritmieregels mogelijk universeel zijn. Maar omdat er andere dan deze ritmische factoren dan de QR en de DR meespelen door conflicten tussen Optimality Theory-constraints, kan niet altijd voldaan worden aan de ideale 41
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
ritmische patronen. Dat is de reden dat het ritme van taal niet altijd even regelmatig klinkt. Als een interval van vier syllaben niet bereikt kan worden, moet het zo dicht mogelijk in de buurt van vier zijn. Bij een keuze tussen een interval van drie syllaben en van drie verschuiven naar vijf, zoals in Tennessèe legislátion, verschuift er niets omdat drie en vijf evenveel stappen van vier verwijderd zijn. Correspondence bepaalt dan dat het patroon in dit geval beter kan blijven zoals in de input. Euritmie is dus gradueel, wat het interessant maakt voor Harmonic Grammar, maar dat eerst even terzijde. Er zijn veel constraints die strijden met de ritmische constraints. Een voorbeeld waar Correspondence het wint van euritmie komt van Prince (1983, in Hayes, 1984): 2
3
1
2
3
1
aan de stresscontouren van no-propane blues en no-cocaine blues is het onderliggende stresscontrast nog zichtbaar tussen própane en cocáine. Ook focus- en constrastaccent zijn verschijnselen die meespelen en die door het ideale 4/4patroon heen kunnen werken. Verder hebben syntactische categorieën hun invloed op het ritme: een accent verschuift niet over een syntactische grens heen (Hayes, 1984). In de muziek lijken de ritmische preferentieregels een belangrijkere rol te spelen dan in de fonologie. Ook is in poëzie ritme belangrijker dan in proza en alledaagse gesproken taal. Gilbers (1987) en Gilbers en Jansen (1996) pleiten hierom voor een eigen rangschikking van de constraints voor elk register, net als de taalspecifieke rangschikkingen. Mogelijke registers zijn onder andere slordig, informeel taalgebruik, waarin bijvoorbeeld de reductiemogelijkheden anders zijn dan in formeel taalgebruik. Over dit onderwerp, voor elk register een eigen rangschikking, ga ik in sub-paragraaf 4.2.2.3, over optionaliteit, de discussie aan, evenals in de paragraaf discussie aan het einde van deze scriptie. Een ander ritmisch verschijnsel dat het 4/4-patroon verstoort, is dat in langere uitingen op een niveau boven het scandeerniveau de secundaire stress zo ver mogelijk naar voren geplaatst wordt. En dit blijkt niet enkel een verdubbeling te zijn van de QR, want het kan zelfs ten koste gaan van de binaire alternantie: (26)
2
3
3
1
Union of Soviet Socialist Republics 2
3
3
1
Topics in the Theory of Generative Grammar 2
3
3
1
When we were disagreeing about Stacey and Eric 2
3
3
1
I think you’re not being entirely honest (Bolinger, 1965b, in Hayes, 1984)
Hayes formuleert ook dit als een ritmische regel, een asymmetrisch principe van euritmie: (27) Phrasal Rule (PR): Een grid is meer euritmisch als het op twee na hoogste niveau twee markeringen bevat, zo ver mogelijk uit elkaar.
42
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
Dit ritmische fenomeen wordt ook wel een ritmische hangmat genoemd (Van Zonneveld, 1983). Het kan in conflict raken met de QR en de DR. Dit is precies wat Lerdahl en Jackendoff ook constateerden in de muziek: in de tijdsspanne vormen begin- en eindpunten de hoofden en worden gemarkeerd met een accent. Dit is een prachtig voorbeeld van Alignment, dat zowel voor taal als muziek de grenzen van frasen als zeer belangrijk markeert. In de muziek speelt metrische structuur nauwelijks meer een rol op de meer globale niveaus. Toonhoogtestructuur daarentegen functioneert op die niveaus als organiserende kracht en veroorzaakt structurele accenten (Lerdahl en Jackendoff, 1981a). De begin- en eindpunten van de tonale beweging vormen de zwaartepunten. Een interessant idee is het om te kijken of in de fonologie eveneens op de hogere niveaus de beklemtoning wordt verzorgd door met name de toonhoogte. Als dat zo is, vormt het geen verstoring van het 4/4maatritme en zou het eerder een intonatieverschijnsel zijn dan een ritmisch verschijnsel.
4.2.2.2
Triolen en rusten
In mijn paper (Schreuder, 1998) kwam naar voren dat er ook ternaire patronen lijken te ontstaan bij onder andere snelle spraak, allegro-spraak genoemd door Gilbers (1987). In dat artikel onderzoekt Gilbers de ritmische patronen in allegro-spraak en ontwikkelt een op de muziek gebaseerde theorie. Het sneller of langzamer uitvoeren van een muzikale frase kan een heel andere metrische indeling veroorzaken. Gilbers vergelijkt de muzikale maat met linguïstische voet-templaten, omdat in de (tonale) muziek de sterkste beat aan het begin van de maat staat. En linguïstische voeten worden in de meeste gevallen bepaald door sterk-zwak alternerende syllabes, het trochee-principe. Hij gaat voor taal uit van de 2/4-maat, waarbij hij de tweesyllabige voet als ritmische hoofdvorm aanneemt. Ik neem dit idee graag over, hoewel ik voor taal niet de 2/4-maat, maar de 4/4-maat als standaard zie, vanwege de QR van Hayes. In dat geval bestaat de linguïstische 4/4-maat uit twee voeten, waarvan de tweede het accent draagt op het niveau waarop de DR opereert. Als variatie op de tweesyllabige voet ziet Gilbers de driesyllabige voet, die in de metrische poëzie bekend staat als dactylus en in de muziek als triool (over twee tellen): (28) Data: Azië, angstige, hongerig
(Gilbers, 1987)
Naast de vergelijking met muzikale triolen trekt Gilbers de vergelijking tussen lege elementen in syllabepositie (φ) en rusten in de muziek. Het φ-element kan zowel een sterke als een zwakke positie in de voet innemen. Een w-φ-element markeert een linguïstische grens en een s-φ-element een opmaat ter rechterzijde. Een opmaat is in de muziek een onvolledige maat aan het begin van het stuk (Gilbers, 1987). Lerdahl en Jackendoff (1981a) bespreken het 43
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
fenomeen opmaat als het out-of-phase zijn van de metrische structuur met de groepstructuur. Dat wil zeggen dat ze niet helemaal samenvallen. Als een groep begint op een zwakkere dan de sterkste beat in de groep, dan onstaat er een opmaat. In de taal is de groep die hierbij van belang is het woord. De alignment van voeten met woorden wordt in het geval van de linguïstische opmaat geschonden. In woorden als muziek wordt de eerste syllabe als een opmaat beschouwd: (29)
(Gilbers, 1987)
In een groter geheel is te zien dat het lege element opgevuld wordt door de omringende syllaben: (30)
(Gilbers, 1987)
Met het begrip opmaat zijn de plaatsen in woorden te voorspellen waar vocaalreductie mogelijk is. Daarom definieert Gilbers opmaat in de prosodie als alle syllaben die niet staan in de eerste positie van een voet, mits deze niet de laatste voet van een frase is. Een w-positie in een voet is noodzakelijke, maar geen voldoende voorwaarde voor vocaalreductie. Naast ritmische positie spelen natuurlijk nog andere constraints mee, zoals Correspondence in het voorbeeld van condensation tegenover compensation, genoemd in hoofdstuk 1. Een mooi voorbeeld van vocaalreductie dat Gilbers noemt is te zien in (31 a en b):
44
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
(31) a.
b.
(Gilbers, 1987)
In normaal spreektempo vindt geen vocaalreductie plaats van -a- in zuidafrikaans. Die syllabe staat dan ook in s-positie. Maar in snelle spraak kan die syllabe wèl reduceren, wat onmogelijk zou moeten zijn, als die in s-positie staat. Als je aanneemt dat zuidafri- bij snelle spraak een triool vormt, staat -a- opeens wel in reduceerbare positie, een w-positie van de triool. Dit is dus een mooi voorbeeld waarin de muziek verklaart waarom een segment in die positie in snelle spraak kan reduceren, waar dat in lento-spraak niet mogelijk is.
4.2.2.3
Optionaliteit
Uit mijn experiment met allegro-spraak (Schreuder 1998) bleek dat klemtoonverschuiving optioneel was. Het gebeurde ongeveer in 50% van de gevallen8 en het gebeurde zelfs af en toe ook in de lento-spraak. Het ging in dit experiment om de nevenklemtoon van samengestelde woorden (NP’s) waarbij de samenstelling bestaat uit een sterke syllabe gevolgd door een zwakke en het tweede deel begint met twee sterke syllaben, gevolgd door een zwakke. Het ritmische patroon is dus SWSSW. De hoofdklemtoon valt altijd op de eerste sterke syllabe van de samenstelling, de nevenklemtoon op de eerste sterke syllabe van het tweede deel. Enkele voorbeelden zijn te zien in (32): (32)
lento-spraak:
allegro-spraak:
oórlogsslàchtoffers vaárgeulàfbakening stúdietoèlage klémtoontoèkenning polítieuìtbreiding
oórlogsslachtòffers vaárgeulafbàkening stúdietoelàge klémtoontoekènning polítieuitbreìding
8
Dit was een pilot-onderzoek en het was niet statistisch verantwoord. Toch waren de uitkomsten opvallend te noemen.
45
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
léveraàndoening wínteròpruiming ríchtingaànduiding muzikántenuìtdrukking
léveraandoèning wínteropruìming ríchtingaanduìding muzikántenuitdrùkking
De proefpersonen werd gevraagd de woorden eerst allemaal op normaal spreektempo uit te spreken en daarna nog een keer allemaal snel. Niemand koos consequent voor één van beide structuren bij snelle spraak. Dit betekent dat er geen sprake kan zijn van een ‘aparte taal’ voor snelle spraak, met een eigen constraintrangschikking, zoals Gilbers (1987), Yip (1996) en Gilbers en Jansen (1996) suggereren. Dat zou ook geen elegante oplossing zijn, omdat het gevaar dan bestaat voor elk probleem een eigen hiërarchie te creëren en dat komt de generaliserende kracht van de theorie, in het kader van Universal Grammar, niet ten goede. Een mogelijkheid is om constraints in de hiërarchie aan elkaar gelijk te stellen door middel van een “;”, zodat ze afhankelijk van de situatie onderling uitgewisseld kunnen worden. Maar dat is problematisch als de betreffende constraints niet naast elkaar staan in de hiërarchie. In de paragraaf over segmenten en syllaben sprak ik ook al over optionaliteit van preferentieregels, ook in de muziek. Optionaliteit in de constrainthërarchie is dus iets wat zowel in de fonologie als in de muziek voorkomt en een probleem is voor de stricte constrainthiërarchie zoals die in Optimality Theory is geformuleerd. Wederom pleit dit voor een Harmonic Grammar-achtige toevoeging aan Optimality Theory. Meer discussie over dit onderwerp voer ik in de subparagraaf discussie aan het einde van deze scriptie. In deze paragraaf heb ik laten zien dat ook de ritmische en metrische preferentieregels van taal en muziek veel overeenkomsten vertonen. In de volgende paragraaf vergelijk ik linguïstische intonatie met muzikale frasering, om te zien of ook op dat gebied duidelijke overeenkomsten te vinden zijn.
4.3 INTONATIE EN FRASERING In de introductie beschrijf ik eerst wat intonatie in taal is en de functie ervan. In de daarop volgende subparagraaf vergelijk ik dan deze intonatie met muzikale frasering.
4.3.1 Introductie 4.3.1.1
Toon en intonatie
In de vorige paragraaf vertelde ik dat ook stress voor een deel bestaat uit toonhoogte. Maar zoals Wouter Jansen (p.c.) zo mooi opmerkte: klemtoon is meer klem dan toon. In deze paragraaf scheid ik toonhoogte van metrische stress. Toonhoogte heeft, net als stress, de mogelijkheid accent en contrast aan te geven. Ik volg onder anderen Ladd (1996) die stelt dat toonhoogteaccenten los staan van stress, maar wel vaak samenvallen met stress en de klemtoon daardoor versterken. Toonhoogte is onderdeel van intonatie. Intonatie is een suprasegmenteel, postlexicaal verschijnsel. Het wordt toegekend op zinsniveau. Het woord intonatie wijst op het feit dat het met toonhoogte te maken heeft. Dat dekt niet helemaal de lading. Toonhoogte is een belangrijk onderdeel van wat naar mijn idee 46
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
onder intonatie valt, maar het doel van intonatie, het aanbrengen van structuur in de klankstroom, wordt bereikt met andere verschijnselen dan toonhoogte alleen. Andere belangrijke intonatiekenmerken zijn stilte en pauze, vertraging en versnelling en verlenging. Deze kenmerken hebben samen dezelfde functie als frasering in de muziek: het onderscheiden van frasen en het aangeven van de belangrijkste event binnen die frase. Het opvallendste onderdeel van intonatie is toonhoogte. Alle talen gebruiken toonhoogte. Dat is een consequentie van het in trilling brengen van de stembanden bij het produceren van stemhebbende klanken (Katamba, 1995). Toonhoogte heeft twee verschillende functies. De ene functie is het geven van nadruk (accent) en contrast, de andere functie is intonatie. De prominentie van een woord in een bepaalde groep (frase) wordt uitgedrukt door een toonhoogtebeweging omhoog of omlaag op de lexicaal beklemtoonde syllabe van dat woord. Dit is dus toonhoogteaccent. Er moet dus onderscheid gemaakt worden tussen toon en intonatie. Toon kan contrasterende lexicale betekenis binnen een woord bepalen, terwijl intonatie de hele uiting als domein heeft voor de toonhoogte en de betekenis voor die hele zin beïnvloedt. Bovendien is toon niet postlexicaal, zoals intonatie, maar lexicaal. Toontalen zijn talen die toon gebruiken als betekenisbepalend kenmerk. Hoewel toontalen zeer interessant zijn waar het om toon gaat, valt het buiten het domein van deze scriptie. Intonatie is een deel van alle talen (Katamba, 1995). In tegenstelling tot Ladd (1996) en anderen, wil ik toonhoogteaccenten los zien van intonatie, als een aparte structuur. Toonhoogteaccenten vormen een hiërarchische relatie, waarbij beginen eindpunten een accent krijgen. Ook het contrastaccent is zo’n toonhoogteaccent. Intonatie is een hiërarchisch verschijnsel op een hoger niveau. Het geeft voortgang en prolongering weer, door toonhoogte en andere kenmerken en heeft de hele uiting als domein. Wel is de intonatie, net als in de muziek, gebouwd op de structuur van de toonhoogteaccenten. Contrastaccent is daarbij geen intonatieaccent. Dit is heel vergelijkbaar met de opbouw van de tijdsspannereductie voor de muzikale toonhoogteaccenten. Ook die is gebaseerd op de metrische structuur en op de groepsstructuur. De toonhoogten in taal zijn weliswaar niet absoluut en discreet maar relatief, maar ook hier geeft toonhoogte prominentie aan. De toonhoogte in gesproken taal kan op verschillende manieren variëren. Er is een afwisseling van hoge en lage tonen, die hoog of laag zijn, relatief ten opzichte van elkaar. Voor en na die pieken en dalen glijdt de toon plotseling omhoog of omlaag naar een piek of dal toe. Zo ontstaan toonhoogteaccenten, die voornamelijk het begin en het einde van een groep markeren. Het geven van contrastaccent is ook een belangrijke functie van toonhoogteaccenten. Zo is de plaatsing van het toonhoogteaccent in (33) bepalend voor de interpretatie, die verschillend is voor a en b: (33)
1
2
a. English teacher 2
b.
1
English teacher
(Liberman, 1979)
47
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
In (33 a) is sprake van een leraar die Engelse les geeft, in b van een leraar die Engels is. Deze toonhoogteaccenten worden op verschillende manieren gerepresenteerd in de verschillende theorieën, maar de meeste zien ze als samenstellingen van H(oog) en L(aag). Ook wordt een toonhoogteaccent vaak gezien als een omslagpunt in het toonhoogteverloop, meestal met H of L als ‘doeltoon’. Tussen de toonhoogteaccenten blijft de toon meestal een tijdje hangen op hetzelfde niveau.
4.3.1.2
De functies van intonatie
Door de toonhoogtebewegingen worden toonhoogtecontouren gevormd, de melodieën van taal. De patronen van de contour vormen de intonatie. Naast toonhoogteaccenten die vergelijkbaar zijn met de tijdsspannereductie in de muziek, kent taal dus ook intonatieaccenten en -patronen, zoals in de prolongeringsreductie voor muziek van Lerdahl en Jackendoff. In de vorige paragraaf noemde ik al dat het markeren van begin- en eindpunten een intonatieverschijnsel lijkt te zijn. Die accenten hebben eerder een intonatiefunctie dan een stressfunctie. Intonatie heeft linguïstische en buitenlinguïstische functies. Een buitenlinguïstische functie is stemkwaliteit, wat veel kan verraden over leeftijd, sekse, lidmaatschap van een sociale groep, regionale en sociale afkomst, gezondheid, etc. Een andere buitenlinguïstische functie is het doen van taalhandelingen door middel van intonatie, zoals straffen of een compliment geven. Ook de houding van de spreker ten opzichte van wat hij zegt is af te leiden uit de intonatie. En emotie is een sterk waarneembaar buitenlinguïstisch intonatieverschijnsel: iemand die blij is zal een hogere toon kiezen en meer en grotere toonhoogtefluctuaties aanbrengen in z’n spraak dan iemand die verdrietig is. Voor dit soort functies is de relativiteit ten opzichte van de stem van de spreker en de omvang daarvan (Ladd, 1996) van belang. De stem van iedere spreker kent een specifieke schaal, waarbinnen de verhoudingen van hoog en laag worden bepaald. Deze buitenlinguïstische functies gaan vaak samen met duidelijke gesticulatie en gezichtsuitdrukking. Ik ga verder niet diep in op de buitenlinguïstische functies van intonatie. De linguïstische functies van intonatie zijn grammaticaal. Ze werken nauw samen met syntaxis, semantiek en pragmatiek. Het onderscheid tussen verschillende soorten uitingen wordt gemaakt door middel van intonatie. Dit is ook een reden voor mij om intonatie en toonhoogteaccenten als aparte verschijnselen te beschouwen. Voor bijvoorbeeld vragen of mededelingen worden in talen vaste intonatiepatronen gebruikt, waar echter wel van afgeweken kan worden en die sterk verschillen per taal en zelfs per dialect binnen één taal. Een vraag in het Nederlands eindigt bijvoorbeeld bij voorkeur met een stijging van de toonhoogte, terwijl een mededeling eindigt met een daling. Zo worden ook de verschillen aangegeven tussen een zin die in geschreven taal met een komma zou eindigen en een zin die met een punt eindigt. Een zin met een punt eindigt in het Nederlands over het algemeen lager dan een zin met een komma, die nog voortgezet moet worden. De intonatie specificeert dus welke woorden (of muzikale groepen) samen een syntactische eenheid vormen. Syntactische constituenten vormen in de fonologie de fonologische frase en 48
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
meerdere fonologische frasen vormen samen de intonatiefrase (Nespor en Vogel, 1986). Tussen zulke eenheden wordt een groepsgrens aangegeven. Elke groep bevat een grensmarkeerder en een ‘nucleus’, het centrale element van de intonatie-eenheid, dat het belangrijkste accent draagt. In de muziek is dat het hoogtepunt van een frase, waar in de frase naartoe gewerkt wordt door middel van toonhoogte (meestal omhoog) en door middel van dynamiek (sterkte) en zelfs door middel van temposchommelingen. De frasen kun je zien als golven, zoals in de metafoor van Bolinger (1964, in Ladd, 1996). De rimpels in het water zou je kunnen zien als de microprosodie, de locale beroeringen in de F0-contour als gevolg van bepaalde segmenttypen. De golven zijn te vergelijken met het accent, de deining met de golven van de frasen en het onderscheiden van syntactische constituenten en het getij zou het “getij van de emotie” kunnen zijn. Behalve door middel van hoge en lage tonen wordt de grammaticale functie van intonatie bepaald door andere verschijnselen. Een veelbestudeerd verschijnsel in talige intonatie is declinatie. Declinatie is het verschijnsel dat gedurende een uiting de toonhoogte geleidelijk zakt en voor een nieuwe uiting weer hervat wordt op een hoger niveau, en wederom zakt. Ook dit is een manier waarop structuur wordt aangebracht en de omvang van frasen wordt aangegeven. Ladd (1986, 1988, 1996), Thorsen (1984, 1986) e.a. signaleren dat declinatie op meerdere niveaus werkt. Binnen een frase worden kleinere frasen onderscheiden door binnen de algemene trend naar beneden de toonhoogte aan het begin van kleinere frasen te “resetten”. Het lijkt er dus op dat declinatie hiërarchisch en recursief is (Ladd, 1986). Meer hierover in paragraaf 4.3.2 en het experiment in hoofdstuk 5. In taal, zowel als in muziek, bestaat intonatie niet alleen uit toonhoogte, zoals ik al zei. De markering van grenzen gebeurt weliswaar ook door middel van toonhoogteaccenten aan begin en einde van frasen, net als in de muziek, maar ook door middel van pauzes (ofwel rusten), verlenging en ook vertragingen. Pauzes zijn sterke grensmarkeerders. Bij een pauze tussen frasen valt er echt even een stilte. Dit gebeurt zelden binnen een frase of syntactische constituent. Vertraging aan het einde van frasen wordt final lengthening (FL) genoemd. Volgens Selkirk (1986) is dit hetzelfde fenomeen als pauzes, maar nu wordt de pauze opgevuld door middel van verlenging van de voorgaande syllabe, als het ware om een lege gridpositie te vullen. Uit de literatuur (Martin 1970a, b, Lehiste 1979b, in Selkirk, 1986) blijkt ook experimentele evidentie te bestaan voor de equivalentie van pauzes en FL: luisteraars nemen gevallen van FL waar als pauzes. Beide dienen om de klankstroom in te delen in eenheden, frasen, gebaseerd op de syntaxis.
4.3.2 Intonatie: overeenkomsten met muziek In het hoofdstuk over de muziektheorie van Lerdahl en Jackendoff vertelde ik dat de prolongeringsreductie als het ware het in- en uitademen, de spanning en ontspanning in een stuk beschrijft. Verder schreef ik daar dat een stuk een soort verhaal vertelt, met een inleiding, een uitwerking en een einde, voorzinnen en nazinnen, vraag en antwoord, met bekende en nieuwe informatie, spanning en rust, etc. Dit klinkt allemaal al alsof het over taal gaat. In taal wordt natuurlijk al heel veel van deze informatie overgebracht door de woorden, maar de intonatie vervult ook een groot deel van deze taken. Daarom wil ik de intonatie van taal vergelijken met de muzikale prolongeringsreductie van Lerdahl en Jackendoff. 49
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
Evenals in de muziek kun je voor taal zeggen dat de prolongeringsreductie is gebaseerd op de tijdsspannereductie. Belangrijke toonhoogteaccenten zijn in de intonatie belangrijke punten, waaraan de melodie wordt “opgehangen”. Via de prosodische tijdsspannereductie is de intonatiecontour ook verbonden met de metrische en de groepsstructuur in taal. Dit komt overeen met de muzikale preferentieregels. Net als ik voor muziek liet zien in voorbeeld (10), vallen stressaccent en toonhoogteaccent niet altijd samen. Maar belangrijke stressaccenten krijgen ook een toonhoogteaccent. Een mooi voorbeeld hiervan komt van Liberman (1979). De tekst van liedjes, zoals in de typische kinder-plaagliedjes (zie (34)), loopt altijd gelijk met de melodie, dat wil zeggen dat belangrijke syllaben van een woord in belangrijke metrische positie staan in het melodietje en ook een toonhoogteaccent krijgen. (34)
(Liberman, 1979)
In dit voorbeeld valt de hoofdklemtoon van girlfriend op girl- samen met de eerste tel, de metrisch sterkste positie in de maat. Dit woord heeft twee syllaben en past daarom precies op het standaardmelodietje van dit soort plaagliedjes. Als in de laatste maat echter een woord gezongen moet worden met meerdere syllaben, zoals Pamela in het volgende voorbeeld, dan wordt het melodietje aangepast aan de tekst, zoals in (35 b), omdat anders zoals in (35 a) de syllabe van Pa- op de vierde tel in de eerste maat zou vallen en de hoofdklemtoon zou verliezen. (35) a.
b.
(Liberman, 1979)
Meestal gaan belangrijke toonhoogtebewegingen samen met andere prominentiecues. Dus ook hier is Alignment een belangrijke constraint, zowel voor de taal als in de muziek. Van stabiliteitscondities van de toonhoogtecollectie, melodie en harmonie is in de taal geen sprake omdat taal geen absolute toonhoogten kent, maar wel komen bepaalde toonhoogtekenmerken in taal eerder als hoofd in aanmerking dan andere. Die toonhoogtekenmerken markeren dan het begin of einde van een frase en de kern. 50
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
Het markeren van frasen door middel van intonatie vertoont hele duidelijke overeenkomsten met frasering in de muziek. In de vorige paragraaf noemde ik al het onderscheid tussen komma’s en punten in de toonhoogtecontour. Dat heeft in de muziek een parallel. Hierin is duidelijk te zien wat prolongering en voortgang doen. Een komma wijst op voortgang, een punt op voltooiing. Aardig is om te zien dat dat onderscheid op vergelijkbare wijze wordt gemaakt: een komma is in de muziek te vergelijken met de plagale cadens of de halve cadens, die niet eindigen op de tonica, maar op een hoger gelegen vierde trap, de tussendominant (plagale cadens) of als IV-V (halve cadens). De muzikale punt is de tonica, meestal laag gelegen en in grondligging. Dus net als in taal eindigt een muzikale komma vaak hoger dan de muzikale punt. In de (abstracte) intonatiecontouren in voorbeeld (36) is dit verschil in intonatie tussen komma’s en punten te zien: (36) a.
Hij heeft al gegeten.
b.
Hij heeft al gegeten, (maar hij wil toch nog een koekje).
In a gaat de contour aan het einde naar beneden, terwijl in b de toonhoogte in het midden blijft hangen. Bij frasering in de muziek wordt vaak gesproken over het verschijnsel “vraag en antwoord”. Weliswaar is dat verschijnsel niet duidelijk te definiëren, maar het is wel duidelijk dat de ene frase (het antwoord) volgt op de andere frase (de vraag) en daar een reactie op is. Zo kunnen twee adjacente frasen veel op elkaar lijken, waarbij de eerste omhoog eindigt (net als de Nederlandse vraag-intonatie) en de tweede omlaag. Een voorbeeld hiervan is het begin van de bekende Symfonie van Mozart in G Mineur, K. 550 (37): (37)
vraag
antwoord
Wat hierbij ook genoemd moet worden, is het onderscheid tussen bekende en nieuwe informatie. Prolongering is te zien als oude, bekende informatie, terwijl nieuwe informatie voor voortgang zorgt. In de taal wordt nieuwe informatie onderscheiden van bekende door de intonatie. De nieuwe informatie krijgt een intonatie-accent (of toonhoogteaccent). Dit is een pragmatisch aspect van intonatie, de ‘discourse-functie’. Frasering is zowel in taal als in muziek het indelen van de klankstroom in frasen, die bepaalde groepen weergeven. Zulke groepen zijn syntactische groepen, maar het markeren daarvan heeft ook de functie van ‘ademhalen’. In gezongen muziek en in taal zijn de grenzen letterlijk de punten om adem te halen, maar ook in instrumentale muziek laat men de muziek ‘ademen’ 51
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
(Lindblom, 1978). Dit ademhalen is een meer figuurlijk ademhalen. Het wordt gerealiseerd door het invoegen van pauzes of rusten tussen frasen of door middel van verlenging of vertraging, om even te ontspannen voor de nieuwe spanningsopbouw, als het ware. Rusten kunnen ook betekenisonderscheidend werken, zoals in voorbeeld (38): (38) a. That was a man-eating fish. b. That was a man eating fish. (Selkirk, 1986)
In a, zonder pauze tussen man en eating, gaat het over een mensenetende vis, terwijl b, met pauze tussen man en eating, een man beschrijft die vis eet. Ditzelfde verschil kan worden gerealiseerd door middel van final lengthening. FL is het verschijnsel dat een eenheid verlengd wordt aan het einde van een frase. In het gesproken Zweeds wordt bijvoorbeeld de duur van de vocaal [<:] langer in [‘d<:g] als dat woord achteraan staat in de tweewoordfrase in (39). Dit is experimenteel onderzocht door Lindblom (1978). (39) a. Dag berättar b. Finurlige Dag
(Dag vertelt een verhaal) (Vindingrijke Dag)
In b staat de vocaal in finale positie en duurt daadoor ± 55 msec langer dan in initiële positie. Lindblom noemt zelf ook dat FL in muziek op dezelfde manier functioneert. In het liedje ‘Old McDonald’ komt FL twee maal voor per frase, eerst als een komma en dan als een punt: (40)
G G G G G G S i G G G G J i
Old Mc Do-nald had a farm,
ee-i
ee-i
oh.
G G G G G G S i G G G G J i
On this farm he had a cow,
ee-i
ee-i
oh. (naar Liberman, 1979)
Hier is te zien dat ook FL gradaties kent en onderscheid maakt tussen komma’s en punten. In de muziektheorie is het mogelijk aan te geven dat een noot extra lang, langer dan de duur van de noot, moet worden aangehouden. Dit gebeurt door middel van de fermata ( % ) boven die noot. Een verwant verschijnsel is vertraging aan het einde van frasen. In de muziek kan dit worden aangegeven met ritardando, een graduele vertraging van het tempo (Lindblom, 1978). Dit geeft heel duidelijk het einde van een eenheid aan, meestal een grotere eenheid. Dit blijkt ook in taal wel werkzaam te zijn, in combinatie met FL. Het feit dat er gradaties zijn in de sterkte van grenzen, wijst op een hiërarchie binnen frasen. Ladd (1986, 1996) heeft de syntactische verschillen onderzocht van intonatie-grenzen. Hij heeft een experiment gedaan met zinnen van de vorm: 52
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
(41)
A and B but C
en
A but B and C
Voorbeelden van zulke zinnen zijn: (42) a. Warren is a stronger campaigner, and Ryan has more popular policies, but Allan has a lot more money. b. Warren is a stronger campaigner, but Ryan has more popular policies, and Allan has a lot more money. Hieruit bleek dat de grens voor but sterker was dan die van and. Dit leidde hij af uit het declinatieverloop, dat de hiërarchische organisatie zou reflecteren: de initiële pieken van de bijzinnen B en C waren hoger na een but-grens dan na een and-grens en bovendien waren de pauzes voorafgaand aan een but-grens veel langer. Uit andere experimenten van Ladd blijkt dat het niet te maken heeft met de lengte van de constituent, maar met de vertakking ervan (Ladd 1990) 9. Dit onderzoek was naar aanleiding van de ontdekking dat er declinatie binnen declinatie blijkt te bestaan. Dit alleen al wijst op intonatie-hiërarchie in taal. Thorsen (1985, 1986) signaleert dat er intonatiefrasen zijn binnen elke langere intonatiefrase. Een grote intonatiefrase heeft een algemeen declinatieverloop en daarbinnen vindt er een reset plaats aan het begin van iedere subfrase. Deze reset is wel op een lager toonhoogteniveau dan aan het begin van de voorafgaande subfrase. Dit verschijnsel is weergegeven in voorbeeld (43): (43)
(Ladd, 1986)
Er is een discussie gaande of declinatie nu inderdaad een structureringseffect is, of dat het meer met de fysiologie te maken heeft, dus met het leeglopen van de longen. Dit onderzoek ik in een experiment in het volgende hoofdstuk.
9
Uit de data van mijn experiment in het volgende hoofdstuk blijkt echter een neiging van sprekers om in zulke lange zinnen met drie conjuncten, ongeacht de soort van de conjunctie, altijd twee van de drie samen te nemen en de andere daarmee te contrasteren. Het hoeft dus niet aan het verschil tussen and en but te liggen.
53
TAAL EN MUZIEK: OVEREENKOMSTEN IN PREFERENTIEREGELS
4.4 CONCLUSIE In dit hoofdstuk heb ik laten zien dat niet alleen een muziektheorie en een taaltheorie veel overeenkomsten hebben en elkaar aanvullen, maar ook dat muziek en taal zelf ook veel raakpunten hebben. Taal en muziek passen overeenkomstige preferentieregels toe, op het gebied van de segmenten, van stress, metrum en ritme en van intonatie en frasering.
54
5 EXPERIMENT: DECLINATIE-EFFECTEN IN TAAL EN MUZIEK 5.1 OPZET EXPERIMENT Uit experimenten van o.a. Thorsen (1985, 1986) voor het Deens en Ladd (1988) voor het Engels, blijkt dat binnen lange uitingen die meer dan één intonatiefrase bevatten, er declinatie bestaat binnen declinatie. Er vindt een “reset” plaats aan het begin van een intonatiesubfrase en elke subfrase heeft een eigen declinatiehelling. Dit zou wijzen op hiërarchische structuur binnen de intonatiefrase. In dit experiment wil ik dezelfde declinatie-effecten aantonen in uitingen van het Nederlands. Er is een discussie over de vraag of declinatie sprekergecontroleerd is of wordt veroorzaakt door het leeglopen van de longen. Door het leeglopen van de longen vermindert de druk achter de stembanden, waardoor die langzamer gaan trillen en de toon lager wordt. Om te onderzoeken of declinatie wel een hiërarchisch verschijnsel is, gecontroleerd door de spreker, en niet een fysiologisch verschijnsel, van de leeglopende longen, onderzoek ik of hetzelfde effect ook in instrumentale muziek is waar te nemen. Declinatie in muziek lijkt te bestaan. Een bekend verschijnsel is het zakken van de toonhoogte bij a capellazang, en bovendien merk ik bij mezelf dat als ik toonladders aan het oefenen ben op mijn cello, ik heel vaak te laag uitkom aan het einde. Cellomuziek is instrumentale muziek, dus als declinatie daar wordt waargenomen, is het geen fysiologisch verschijnsel en is het in ieder geval geregeld op een abstracter niveau. Het is het onderzoeken daarom waard.
5.1.1 De testzinnen Voor het spraakexperiment heb ik gebruik gemaakt van zinnen met een eenvoudige syntactisch hiërarchische structuur. De zinnen bestaan uit drie gelijkwaardige opeenvolgingen, gecoördineerd door de nevenschikking en. Er zou veel meer hiërarchische complexiteit in de zinnen aangebracht kunnen worden, zoals Ladd dat doet om verschillen in grenssterkte te meten, waarbij de grens van maar sterker zou zijn dan en omdat de toonhoogtereset bij maar groter is dan bij en. Maar hier gaat het om een eenvoudig pilotonderzoek. Ik wil zo veel mogelijk interferentie van andere verschijnselen uitsluiten en gebruik daarom de meest eenvoudige vorm van lange zinnen met meerdere intonatiefrasen. Een voorbeeld van het soort zinnen dat Thorsen (1985, 1986) gebruikte (vertaald in het Engels uit het Deens), is te zien in (44): (44)
Amanda is going away camping, and her mother is taking a course in Germany, and her father is going to hike in Lapland.
Ik heb voor dit experiment gelijksoortige zinnen samengesteld. Daarbij heb ik gelet op een aantal zaken: 55
EXPERIMENT: DECLINATIE –EFFENTEN IN TAAL EN MUZIEK
-
-
de zinnen moesten lang zijn om declinatie goed te kunnen waarnemen de zinnen bestonden uit drie nevengeschikte frasen, gecoördineerd door en de verschillende nevengeschikte delen moesten ongeveer van dezelfde lengte zijn de zinnen en de nevenschikkingen moesten vergelijkbare syntactische structuren hebben. Ik heb gekozen voor de volgende structuur, voor alledrie de nevenschikkingen: subject - predicaat - NP/PP - PP de zinnen moesten goed voor te lezen zijn. Er mochten dus geen “tongbrekers” in zitten om voor segmentele effecten te controleren, bevatten de geaccentueerde syllaben die gemeten moesten worden alleen lage en middenvocalen.
Ik heb op deze manier 25 testzinnen gemaakt, met daar achteraan nog twee “dummy”-zinnen, zodat de proefpersonen niet zouden opmerken dat het de laatste zin was. Anders zou er een “einde”-effect kunnen zijn. (Zie bijlage 1). De muzikale “testzin” is een stukje van zes “frasen” die geleidelijk naar beneden lopen, uit My Mind’s Eye, van Steve Marriott en Ronnie Lane, van Small Faces (Decca, 1966) (zie bijlage 2), die gespeeld wordt op een cello. Aan het einde staat een herhalingsteken, wat dus betekent dat het in z’n geheel herhaald moet worden. Dit is dus maar één testzin. Het basismelodietje bestaat uit vijf maten. Elk van die maten begint met een lange noot (tweetelsnoot), die in elke maat één toon lager ligt dan in de vorige. De lange noot wordt steeds gevolgd door vier korte noten (achtsten) die secundegewijs (steeds één toon) naar beneden aflopen, vanaf één toon boven de tweetelsnoot. Maat 6 en 7 wijken af van dit patroon en vormen samen de afsluiting van het melodietje. Het melodietje moet een keer herhaald worden. Het stukje, inclusief die herhaling, wordt tien keer gespeeld 10.
5.1.2 Proefpersonen Er waren drie proefpersonen voor het lezen van de testzinnen, IS, KB en SM. Het waren twee vrouwen (IS en KB) en een man (SM), alledrie studenten van tussen de 20 en 25 jaar. Alledrie hebben ze het Nederlands als moedertaal. Ze moesten goed bij stem zijn en niet verkouden. Van te voren wisten de proefpersonen niet wat het doel was van het experiment. De muzikale proefpersonen waren twee mannelijke cellisten (PV en PB), in dezelfde leeftijdsgroep als de bovengenoemde proefpersonen. Beide zijn het amateur-musici, die spelen in het studentenorkest waarin ik zelf ook cello speel. Ook zij wisten niet wat het doel was van het experiment. De bladmuziek kregen ze ongeveer een weekend van te voren om te kunnen oefenen, zodat ze het tijdens het experiment foutloos en vloeiend zouden kunnen spelen. De vingerzettingen mochten ze zelf verzinnen, maar er mochten geen losse snaren in voorkomen. De reden hiervoor was dat ze als ze een losse snaar tussendoor zouden spelen, zouden merken dat ze te laag waren uitgekomen en daarom op de zuivere toonhoogte verder zouden spelen vanaf die losse snaar. Bovendien zouden ze er dan na één keer spelen waarschijnlijk heel goed op gaan letten niet lager te worden. Hierdoor zou de opzet van het experiment mislukken.
10
Het zijn er iets minder dan tien geworden doordat ik me verteld heb. Voor beide proefpersonen staat het melodietje in totaal zeventien keer op de band (inclusief de herhalingen).
56
EXPERIMENT: DECLINATIE –EFFENTEN IN TAAL EN MUZIEK
5.1.3 Uitvoering In een studio lazen de proefpersonen van het spraakexperiment de testzinnen één voor één voor van kaartjes. De proefpersonen werden opgenomen op audiocassette. De zinnen waren geprint met een lettergrootte van 14 punten, met een regelafstand van anderhalf. De proefpersonen moesten de zin eerst goed bekijken en hem daarna rustig voorlezen, op een zo natuurlijk mogelijke manier. Als ze haperden of niet tevreden waren, mochten ze de zin opnieuw voorlezen. Ze kregen drie zinnen om mee te oefenen voor de test. De kaartjes moesten ze na het voorlezen van de zin weer achter de stapel terug te stoppen en de hele serie moesten ze twee keer voor lezen. Zo kreeg ik de beschikking over twee keer zo veel materiaal. In totaal kreeg ik dus (25 zinnen) x (2 x lezen) x (3 proefpersonen) = 150 bruikbare zinnen. Hieruit heb ik een selectie gemaakt van wat ik wilde gebruiken. Dat zijn in totaal 100 zinnen geworden, van proefpersonen IS en KB de helft (25) en van SM alle zinnen (SM1 = 25 en SM2 = 25). Als de proefpersoon wilde, mocht die even pauze nemen tussendoor. Het muzikale deel van het experiment gebeurde op eenzelfde manier. Twee cellisten speelden het melodietje in de studio. Ook de cellisten werden op audiocassette opgenomen en ik vroeg ze het melodietje tien keer te spelen, inclusief de herhaling (in totaal dus twintig keer). Voor hen gold ook dat ze het bij hapering of ontevredenheid over mochten doen.
5.1.4 Verwerking De resultaten van de proefpersonen, gesproken en gespeeld, heb ik gedigitaliseerd zodat het geluid in de computer geanalyseerd kon worden. Het materiaal werd geanalyseerd door het computerprogramma PRAAT, dat onder andere het toonhoogteverloop van de testzinnen en de muziek weergeeft en alle berekeningen voor aangegeven punten doet. Daarvoor moesten in de contouren de punten gemarkeerd worden waar de toonhoogte gemeten moest worden. De te meten punten in de contouren waren de F0-pieken en -dalen aan het begin van iedere conjunct, in het midden en aan het einde. Om de declinatie goed te kunnen waarnemen, wilde ik zowel de onderste als de bovenste intonatielijnen meten. De bovenste intonatielijnen worden gevormd door de toppen van de hoge accenten te verbinden met een lijn, de onderste intonatielijnen door de laagste tonen voor en na een hoog accent te verbinden. De toonhoogtepunten heb ik gemarkeerd met labels in het programma PRAAT. De opbouw van de labels is als volgt: nummer van de deelzin (1, 2, of 3); categorie van de toon (l(aag), h(oog), m(idden-)l(aag) of m(idden-)h(oog)); nummer van het accent van de bepaalde categorie. De labels en de bijbehorende toonpunten (voor deelzin 1) zijn samengevat in het schema in (45): (45) Beginaccent: 1l1 laagste toon in eerste geaccentueerde syllabe voorafgaand aan de hoogste toon in die syllabe 1h1 hoogste toon in eerste geaccentueerde syllabe 1l2 laagste toon na eerste geaccentueerde syllabe (meestal het werkwoord) Middenaccent: 1ml1 laagste toon in geaccentueerde syllabe voorafgaand aan de hoogste toon in die syllabe 1mh hoogste toon in geaccentueerde syllabe
57
EXPERIMENT: DECLINATIE –EFFENTEN IN TAAL EN MUZIEK 1ml2 laagste toon na geaccentueerde syllabe (meestal de prepositie meegerekend) Finaal accent: 1l3 laagste toon vlak voor de laatste geaccentueerde syllabe 1h2 hoogste toon in de laatste geaccentueerde syllabe 1l4 laagste toon na laatste geaccentueerde syllabe (alleen gebruikt in voorleesintonatie) Dezelfde labels worden voor de volgende twee conjuncten gebruikt, behalve dat het finale accent van de derde conjunct apart beschouwd wordt, vanwege “final lowering” aan het einde van elke zin. Deze accenten zijn extra verlaagd. Daarom krijgen ze andere labels: he laatste hoogste toon van de zin le laatste laagste toon van de zin.
Over de verschillende accenten is op te merken dat ze niet allemaal overal voorkomen. In bovenstaand schema is al te zien dat de 1l4-toon alleen voorkomt bij voorleesintonatie. In spontaan taalgebruik zal dat accent niet gauw verschijnen. Het middenaccent heb ik gemeten omdat het niet mogelijk was een ongeaccentueerde syllabe in het midden te meten. Dit was te wijten aan het ontwerp van de zinnen, dat een contrastaccent in het midden veroorzaakt. Om toch een ongeaccentueerde syllabe te kunnen meten zouden de zinnen in alle drie de conjuncten hetzelfde woord in het midden (in de eerste PP) moeten hebben. Maar uit het middenaccent kan misschien juist heel mooi het declinatieverloop worden afgelezen. In de derde conjunct kan het voorkomen dat na de hoge middentoon geen lage tonen meer volgen tot het finale hoge accent. De hoge toonhoogte wordt dan tot het finale hoge accent doorgetrokken. Ook is er soms geen hoog finaal accent aanwezig. Dan is er sprake van “downstep”, het verschijnsel dat de toonhoogte stapsgewijs verlaagd wordt per (beklemtoonde) syllabe tot het einde van de zin. Naast de toonhoogte wordt ook de tijdsduur gemeten, van de matrixzin, van de drie conjuncten ten opzichte van het begin van de matrixzin en van de eventuele pauzes tussen de conjuncten. De code par betekent begin van de matrixzin, de deelzinnen zijn gemarkeerd met het nummer van de deelzin. Een “/ ” voor de code betekent einde, dus /par betekent einde van de matrixzin. Verder wordt voor elk toonhoogtepunt ook een punt in de tijd gemeten. Zo zijn alle toonhoogtepunten in een grafiek weer te geven. In (46) is een voorbeeld te zien van de toonhoogtecontour met declinatielijnen en de textgrid die bestaat uit de aangebrachte labels:
58
EXPERIMENT: DECLINATIE –EFFENTEN IN TAAL EN MUZIEK
(46) Toonhoogteverloop van een zin (van SM1) met textgrids: 500
400
300
Frequency (Hz)
200
100
0 Joost gaat op vakantie naar Frankrijk
en Anton gaat met een zeilboot naar Engeland
en Karel wil naar een cursus in Duitsland
–100
/1
par
–200
–300
1l1 1h1
0
1l2
1ml1 1mh 1ml2
1
1l31h2
/2
2l1
2h1
2
2l2
2ml12mh 2ml2
3 Time (s)
2l3
3
2h2
3l1
4
3h1
3l2
3ml1 3mh 3ml23l3 he
5
le
6 6.160
PRAAT heeft voor al die punten de toonhoogte berekend. Met die uitkomsten heb ik vervolgens statistische berekeningen uitgevoerd. Van alle tonen zijn het gemiddelde en de standaarddeviatie (de afwijking van alle waarnemingen ten opzichte van het gemiddelde) berekend. Alle verschillende versies van de zinnen worden samen gemiddeld, alsof het repetities zijn van identieke zinnen, zodat ze voor iedere spreker een bepaalde contour opleveren. Zo kunnen de toplijnen en de onderste lijnen van de contouren vergeleken worden, i.e. de waarden van de F0-pieken en -dalen die geassocieerd zijn met de belangrijkste geaccentueerde syllaben. Voor de vergelijkingen is een ANOVA uitgevoerd en een Posthoc Tukey-test. Een ANOVA vergelijkt meerdere groepen en de Posthoc-test vergelijkt alle groepen met elkaar. Hiermee heb ik dus voor alle gelabelde tonen gekeken of ze hoger of lager waren dan iedere andere toon en of dat verschil significant was. Of een uitkomst significant is, hangt af van het kritieke gebied van de verdeling. Het kritieke gebied wordt gevormd door de verzameling uitkomsten die leidt tot het verwerpen van de hypothese. Om tot een verdeling te komen in een kritiek gebied en een acceptatiegebied, is het criterium α nodig, de kans dat de hypothese ten onrechte wordt verworpen. De ligging van het kritieke gebied Z hangt samen met de formulering van de hypothese, α en de toetsingsgrootheid, waarbij de steekproefomvang een rol speelt. Voor α heb ik hier 0,05 gekozen, omdat het de bedoeling is om verschillen te testen die hoorbaar zijn voor de taalgebruiker. Hele kleine verschillen zouden misschien niet gehoord kunnen worden. Bij een kans van 0,05 beslaat het acceptatiegebied 95% procent. Een uitkomst die daarbinnen valt veroorzaakt niet het verwerpen van de hypothese. Ik heb de tonen vergeleken voor alle waarnemingen, dat wil zeggen de uitkomsten van alle proefpersonen bij elkaar. Maar omdat de patronen behoorlijk sprekerspecifiek zijn en er dan bovendien mannen- en vrouwenstemmen met elkaar vergeleken worden, is het zinvoller om naar de afzonderlijke proefpersonen te kijken. Voor het muziekexperiment heb ik alle noten gelabeld. De tijd werd niet gemeten, omdat het een pilot-onderzoek was en het experiment gericht was op toonhoogte. De labels zijn als volgt 59
EXPERIMENT: DECLINATIE –EFFENTEN IN TAAL EN MUZIEK
opgebouwd: soort noot (L(ang), K(ort) of M(iddellang)); nummer van de maat; nootnaam. Een voorbeeld is K1d, wat betekent korte noot, maat 1, d. De middellange noten komen alleen in maat 6 voor. PRAAT meet de toonhoogte in het midden tussen twee labels. De herhaling in de melodie heb ik apart laten analyseren, als vervolg op de eerste keer11. Zo kan ik bekijken of het declinatie-effect doorloopt over de herhaling, of dat daar een totale reset plaatsvindt. De eerste keer heb ik gemarkeerd met een “a”, de herhaling met een “b”. De frequenties van de toonhoogten zijn vermenigvuldigd met tien. (Dit was nodig voor het computerprogramma.) Het delen van de getallen door tien levert dus het aantal Hertz op. Het toonhoogteverloop van de melodie is te zien in de volgende figuur, gemaakt in PRAAT: (47) Toonhoogteverloop van melodietje, gespeeld door cellist PB 200
Frequency (Hz)
150
100
50
30
b26
1ld 1ke 1kd1kc1kb
2lc 2kd 2kc 2kb2ka 3lb 3kc3kb 3ka3kg 4la 4kb4ka4kg 4kfis 5lg 5ka5kg 5kfis5ke 6lfis 6ke 6d
6a
7lg
rust
0 0
1
2
3
4
5
6
7
8
9 10 Time (s)
11
12
13
14
15
16
17
18
19 19.13
(De afwijkende punten zijn meetfouten, veroorzaakt door bijgeluiden van de cello.)
Enkele onwaarschijnlijke uitschieters in de uitkomsten heb ik vervangen door de meest voorkomende waarde in die kolom. Zulke uitschieters zijn meestal te wijten aan meetfouten van het programma PRAAT, veroorzaakt door bijvoorbeeld bijgeluiden van de cello. Ook hiervan zijn de gemiddelde toonhoogten en de standaarddeviaties berekend. Voor PB zijn de a- en de b-uitkomsten apart berekend en ik heb ze nog een keer samen berekend, omdat er dan meer data zijn om te berekenen. 11
Proefpersoon PB speelde deze herhalingen ook echt als herhaling, dat wil zeggen meteen achter de eerste keer aan, behalve dat hij (en ik) één keer de tel kwijt was en dacht dat die keer de herhaling al was, terwijl dat niet zo was. Proefpersoon PV was zich er helemaal niet van bewust of hij een herhaling aan het spelen was of niet. Hij speelde daarom alles met een pauze ertussen, alsof hij het melodietje in plaats van tien heer met herhaling twintig keer zonder herhaling speelde. Bij de resultaten van deze proefpersoon heb ik daarom niet de declinatie over eerste keer en herhaling gemeten, maar over elke keer dat hij het melodietje speelde apart.
60
EXPERIMENT: DECLINATIE –EFFENTEN IN TAAL EN MUZIEK
Het is niet mogelijk om met deze muziekdata statistische analyses uit te voeren, omdat ze te weinig waarnemingen bevatten om geldige uitspraken over te doen.
5.1.5 Hypothesen Als er bij het spraakexperiment declinatie over de gehele lengte van de uiting plaatsvindt en daarbinnen declinatie van de afzonderlijke intonatiesubfrasen, dan start de declinatiehelling van frasen binnen een zin over het algemeen lager dan die aan het begin van de frase. Er vindt dus een reset plaats binnen de zin, maar geen volledige reset naar het niveau van het begin van de zin. Ik voorspel daarom dat de werkelijke toonhoogte aan het begin van iedere intonatie-subfrase hoger is dan de toonhoogte die je zou voorspellen als je de helling van de eerste frase over de hele uiting zou doortrekken, gezien de lengte van de zin. Dat betekent dat de eerste tonen van iedere subfrase hoger zouden moeten zijn dan de laatste tonen van de voorgaande subfrase. 2l1 is dus hoger dan 1l3, 3l1 hoger dan 2l3, 2h1 hoger dan 1h2 en 3h1 hoger dan 2h2. De hypothese voor het muziekexperiment is dat ook in instrumentale muziek de toonhoogte verlaagd wordt, er dus declinatie plaatsvindt en declinatie daarom geen fysiologisch ademhalingsverschijnsel is, maar een gecontroleerd intonatieverschijnsel zou kunnen zijn voor het aangeven van hiërarchische structuur.
5.2 RESULTATEN SPRAAKEXPERIMENT Van de resultaten zijn de gemiddelden inzichtelijk te kunnen laten zien, heb ik grafiek geplaatst (48). Daaronder zijn gemiddelden van de hoge tonen, met eenzelfde grafiek voor de lage tonen:
per proefpersonen berekend. Om die gemiddelden van één proefpersoon (IS) de gemiddelden in een twee grafieken te zien met het verloop van de daarbij de standaarddeviaties (error bars) (49) en
(48)
Toonhoogte (Hz)
Toonhoogte IS
350 300 250 200 150 100 50 0 1l1 1h1 1l2 1ml1 1mh 1ml2 1l3 1h2 1l4
2l1 2h1 2l2 2ml1 2mh 2ml2 2l3 2h2 2l4 3l1 3h1 3l2 3ml1 3mh 3ml2 3l3
he
le
61
EXPERIMENT: DECLINATIE –EFFENTEN IN TAAL EN MUZIEK
(49) Gemiddelde lage tonen met error bars:
Gemiddelde hoge tonen met error bars: SPEAKER: IS
SPEAKER: IS
400
400
300
300
200
Mean +- 2 SD
Me 200 an +2 SD 100 N=
5
5
P1L1
5
5
P1ML1
P1L2
5
5
P1L3
P1ML2
5
5
P2L2
P2L1
5
5
P2ML2
P2ML1
5
5
P3L1
P2L3
5
5
P3ML1
P3L2
5
P3L3
100 N=
8
8
8
8
8
8
8
8
8
P1H1
P1MH
P1H2
P2H1
P2MH
P2H2
P3H1
P3MH
PHE
P3ML2
In de grafiek van de gemiddelde toonhoogten voor alle gemeten punten is duidelijk te zien dat er declinatie plaatsvindt binnen de drie conjuncten. Iets minder duidelijk, maar toch zichtbaar, is de declinatie over de hele zin. En belangrijker, de hoge accenten aan het begin van elke deelzin lijken een reset te laten zien. Hierbij moet wel opgemerkt worden at de standaarddeviaties erg groot zijn, wat veroorzaakt kan worden door het kleine aantal waarnemingen. En het is ook mogelijk dat er verschillende intonatiecontouren zijn vergeleken. Uit de Posthoc-test bleek dat zowel de hoge als de lage tonen naar het einde toe globaal gezien aflopen. In bijlage 3 is een tabel te zien (voor de hoge en de lage tonen apart), waarin ik voor alle proefpersonen heb beschreven of de relevante tonen hoger of lager waren dan de toon waarmee ze vergeleken werden en of dat verschil significant was. De vergeleken tonen zijn steeds dezelfde tonen van de verschillende conjuncten, bijvoorbeeld 1l1, 2l1 en 3l1 en tonen aan het begin en het einde van de hele zin: 1l1 en 3l3, en 1l2 en le. In de tabel is te zien dat de tonen van de laatste conjunct in ieder geval meestal significant lager waren dan de vergelijkbare tonen van de eerste conjunct. Opmerkelijk is dat dit laatste met name geldt voor de hoge tonen en eigenlijk niet voor de lage. Opgemerkt moet worden dat begintonen (1l1, 1h1 en 1l2) extra verhoogd zijn en eindtonen (he en le) extra verlaagd. Maar over het algemeen is te zien dat de verschillen niet significant zijn en dat er zelfs tonen hoger zijn dan de voorafgaande vergelijkbare toon. Dit laatste zou te wijten kunnen zijn aan het kleine aantal waarnemingen en enkele extreme uitkomsten. Sommige uitkomsten zijn extreem hoog of laag. Hoewel de verschillen over het algemeen niet significant zijn, is de tweede toon van een vergeleken paar meestal toch lager dan de eerste, voor zowel de hoge als de lage tonen. Maar dat de meeste verschillen niet significant bleken te zijn, zou erop kunnen wijzen dat de verschillen voor de taalgebruiker ook niet significant zijn en declinatie daarom geen informatie toevoegt aan het spraaksignaal. Ook de hogere gevallen zijn niet te negeren, maar het feit dat de tonen van de derde conjunct significant lager zijn dan de vergelijkbare tonen van de eerste conjunct, duidt toch op globale declinatie, met name van de hoge tonen. 62
EXPERIMENT: DECLINATIE –EFFENTEN IN TAAL EN MUZIEK
Naast globale declinatie ging het in dit experiment om reset van de toonhoogte aan het begin van een nieuwe conjunct. Bij de lage tonen is de tweede van ieder vergeleken paar (1l3 en 2l1, 2l3 en 3l1, 1l4 en 2l1, 2l4 en 3l1) overal hoger dan de eerste, zoals te zien in bijlage 3. Maar helaas is vrijwel geen van die uitkomsten significant. Bij de hoge tonen verschilt het sterk per proefpersoon. Vergeleken zijn 1h2 en 2h1, en 2h2 en 3h1. IS heeft significante reset in de hoge tonen, KB laat een niet-significante reset zien en SM (1 en 2) laat helemaal geen reset zien in de hoge tonen, maar zelfs meestal een significante verlaging. Dit laatste is opmerkelijk, omdat SM in de lage tonen wel een (niet-significante) reset heeft. Als er al reset te zien is bij deze proefpersonen, dan is dat duidelijker in de lage tonen dan in de hoge tonen. Het is dus niet mogelijk om te concluderen dat er reset plaatsvindt, omdat het in de meeste gevallen niet significant is. Maar als er helemaal geen reset zou zijn, zou de declinatie gewoon doorlopen en zouden ook al deze punten lager moeten zijn. Dit is alleen bij de hoge tonen van SM het geval en verder zijn ze overal hoger. Er is dus wel een aanwijzing dat er reset plaatsvindt aan het begin van iedere conjunct. Opmerkelijk is dat de uitkomsten erop wijzen dat de reset voor de derde conjunct erg groot is, behalve bij proefpersoon SM. Dit lijkt evidentie te zijn tegen de bevindingen van Ladd, die de verschillen in reset tussen and- en but-zinnen vergelijkt en concludeert dat but een sterkere grens vormt dan and. Hoewel mijn data niet ontworpen zijn voor een dergelijk experiment, laten mijn uitkomsten zien dat er onafhankelijk van het soort conjunctie de neiging bestaat om één van de drie zinnen met de andere twee te contrasteren. Het hoeft dus niet te liggen aan het verschil tussen en en maar. In bijlage 3 van mijn scriptie is ook te zien dat de grijze vlakken, dat zijn de gevallen waar in plaats van declinatie verhoging plaatsvindt, grotendeels samengeclusterd zijn. Dat zou voor een deel te maken kunnen hebben met een extra contrast van de derde conjunct met de eerste twee. Te zien is dat die verhogingen vaak voorkomen als er een toon uit de derde conjunct in het spel is, òf een eindtoon van de tweede conjunct, die lijkt voor te bereiden op het extra contrast van de derde conjunct. Dit gaat niet overal op, maar het zou te maken kunnen hebben met de neiging tot het extra contrasteren van de derde conjunct ten opzichte van de eerste twee. Deze neiging is een interessante observatie en is misschien een onderzoekje waard. Opmerkelijke bevindingen zijn dat reset duidelijker was waar te nemen bij de lage tonen en minder goed bij de hoge tonen, terwijl dat voor declinatie andersom gold. Bovendien viel het mij op dat bij de proefpersonen met een reset, de declinatie minder significant was dan bij de proefpersonen zonder reset. Dit laatste is ook een aanwijzing dat reset toch een invloed zou kunnen zijn om rekening mee te houden, want door tussentijdse resets in de globale declinatiehelling wordt die declinatiehelling natuurlijk minder steil. Om te kunnen ondersteunen dat declinatie een gecontroleerd intonatieverschijnsel is voor het hiërarchisch structureren van intonatiefrasen, heb ik onderzocht of declinatie ook in instrumentale muziek voorkomt. Als dat inderdaad zo blijkt te zijn, duidt dat erop dat declinatie niet met ademhaling te maken heeft. Hieronder beschrijf ik de resultaten van dat experiment.
63
EXPERIMENT: DECLINATIE –EFFENTEN IN TAAL EN MUZIEK
5.3 RESULTATEN MUZIEKEXPERIMENT In de volgende grafiek (50) zijn de gemiddelden voor de muziek opgenomen voor proefpersoon PB: (50)
1750 1500 1250 1000 750 500 250 0 l1 d k1 e k1 d k1 c k1 b l2 c k2 d k2 c k2 b k2 a l3 b k3 c k3 b k3 a k3 g l4 a k4 b k4 a k4 g k4 fis l5 g k5 a k5 g k5 fis k5 e l6 fis k6 e m 6d m 6a l7 g
Toonhoogte (Hz x 10)
Toonhoogte PB (a en b)
Deze grafiek is voornamelijk illustratief. Omdat de verschillen zo klein zijn, zijn die moeilijk waar te nemen in de grafiek. Om declinatie in de muziekresultaten aan te kunnen tonen, heb ik de tonen die hetzelfde zouden moeten zijn met elkaar vergeleken. Hiervoor heb ik steeds de lange tonen genomen en die vergeleken met de eerste korte toon in de volgende maat. Dat zijn dezelfde tonen. Die getallen heb ik van elkaar afgetrokken. De resultaten daarvan zijn te zien in het volgende schema: (51) PV PBa PBb PBab Noot Ø Cellist L1d 1438,4118 1421,2222 1418,0000 1419,7059 K2d 1427,8824 1382,3333 1376,2500 1379,4706 verschil 10,5294 38,8889 41,75 40,2353 L2c 1284,4706 1260,5556 1252,7500 1256,8824 K3c 1280,1765 1223,2222 1258,1250 1239,6471 verschil 4,2941 37,3334 - 5,375 17,2353 L3b 1212,1765 1201,6667 1193,6250 1197,8824 K4b 1209,1176 1199,7778 1196,0000 1198,0000 verschil 3,0589 1,8889 - 2,375 - 0,1176 L4a 1086,2941 1074,8889 1072,1250 1073,5882 K5a 1089,2353 1066,0000 1065,8750 1065,9412 verschil - 2,9412 8,8889 6,25 7,647 L5g 966,1176 924,0000 941,6250 932,2941 K7g 967,4118 924,1111 950,5000 936,5294 verschil - 1,2942 - 0,1111 - 8,875 - 4,2353
Ö
64
EXPERIMENT: DECLINATIE –EFFENTEN IN TAAL EN MUZIEK
Uit dit schema is af te lezen dat er inderdaad een declinatietrend lijkt te zijn in de muziek van deze beide cellisten. In (51) is te zien dat tussen de eerste en de tweede, en de tweede en de derde, en de derde en de vierde maat van PV met name verschillen zijn te zien waarbij de tweede van het notenpaar steeds verlaagd is. Het verschil wordt naar het einde toe kleiner (net als in de waarnemingen bij het spraakexperiment) en slaat dan na maat 4 zelfs om naar een negatief verschil van ongeveer 0,3 Hz, wat wil zeggen dat daar de tweede van het notenpaar juist hoger is dan de eerste. Dit zou kunnen liggen aan de speelmanier van PV. Het is waarschijnlijk dat hij halverwege maat 4 begonnen is om in de vierde positie te gaan spelen (hoewel het logischer geweest zou zijn om maat 4 al in de vierde positie te beginnen). In de vierde positie op een cello heeft de duim houvast aan de kast van de cello. Daardoor zou de proefpersoon de zuiverheid kunnen herstellen. Maar ook dat negatieve getal wordt naar het einde toe kleiner, wat betekent dat ook daar toch weer declinatie plaatsvindt. Bij PBa en b zijn de verschillen tussen de notenparen in schema (51) wel extreem groot en onregelmatig. Hieruit is geen declinatie te concluderen. Waarschijnlijk is dit te wijten aan het kleine aantal waarnemingen dat is overgebleven na het scheiden van de a- en b-versies. Dat is jammer en dat zou in een eventueel volgend experiment ondervangen kunnen worden door meer data te creëren. Om toch te onderzoeken of er declinatie is waar te nemen bij proefpersoon PB heb ik ook nog eens de a- en b-versies samen gemiddeld. Omdat daar meer waarnemingen geanalyseerd zijn, kunnen daar eventueel wel uitspraken over gedaan worden. De verschillen zien er daar wat minder grillig uit. Net als bij PV worden de verschillen naar het einde toe steeds kleiner en lijkt er een herstelling in de zuiverheid plaats te vinden tussen maat 4 en 5, waarschijnlijk weer vanwege het houvast in de vierde positie op de cello. Na maat 5 gaat de declinatie weer verder. Bij beide proefpersonen is de laatste noot, L7g, hoger dan de daarmee vergeleken g. Ik denk dat die laatste g ook weer in de vierde positie gespeeld is, samen met de a uit maat 6. Het lijkt er dus op, ondanks het kleine aantal waarnemingen, dat er een declinatietrend is te constateren in de gespeelde melodietjes van deze proefpersonen. De reden dat ik de gemiddelden van de a- en b-versies van PB apart heb laten berekenen was dat ik ze met elkaar wilde vergelijken. Dat is te zien in (52), waarin ik de gemiddelden van de lange noten van beide versies naast elkaar heb gezet: (52) Eerste keer en herhaling van PB Herhaal Ö a Noot Ø L1d 1421,2222 L2c 1260,5556 L3b 1201,6667 L4a 1074,8889 L5g 924,0000 L6fis 899,1111 L7g 924,1111
b
verschil
1418,0000 1252,7500 1193,6250 1072,1250 941,6250 897,6250 950,5000
3,2222 7,8056 8,0417 2,7639 - 17,625 1,4861 - 26,3889
Hoewel ook hier duidelijk meespeelt dat het erg weinig data zijn en dat daardoor de verschillen erg grillig zijn, is het duidelijk dàt er verschillen zijn. En de meeste verschillen zijn positieve verschillen, wat wil zeggen dat de lange noot van de herhaling meestal lager is dan de lange noot van de eerste keer. Heel voorzichtig zeg ik daarom dat misschien de 65
EXPERIMENT: DECLINATIE –EFFENTEN IN TAAL EN MUZIEK
declinatielijn van de eerste keer doorgetrokken wordt over de herhaling. De eerste keer en de herhaling zouden dan samen als één “zin” beschouwd worden en daarom vindt er geen totale reset plaats voor de herhaling. Wat ik ook nog wil opmerken is dat deze proefpersonen nog eens heel duidelijk een ander verschijnsel illustreerden, dat ik in het vorige hoofdstuk heb besproken: final lengthening. Vooral aan het einde van het melodietje werd er sterk vertraagd. Bij proefpersoon PB was daaraan ook het verschil tussen de eerste keer en de herhaling goed te horen, want de verlenging aan het einde van de herhaling (b) was langer dan die aan het einde van de eerste keer (a). Omdat de tijd niet gemeten is in dit experiment, is dat helaas niet in de tabellen en in de bijlagen te zien. Maar in de opnamen is het heel duidelijk te horen.
5.4 CONCLUSIES EN AANBEVELINGEN 5.4.1 Conclusies Wat het spraakexperiment betreft is er een tendens te zien van declinatie over de gehele zin, met name in de hoge tonen, en minder duidelijk van aparte declinatiehellingen voor de deelzinnen, reset dus. De hypothese dat er declinatie is klopt dus, maar de hypothese dat er reset plaatsvindt aan het begin van iedere conjunct moet verworpen worden met een significantieniveau van α = 0,05. En een voorzichtige conclusie uit het muziekexperiment zou kunnen zijn dat het verschijnsel declinatie niet te wijten is aan het leeglopen van de longen, maar dat het een door de spreker beïnvloedbaar verschijnsel is om de hiërarchie van de zin mee te verduidelijken. Het trekken van deze laatste conclusie moet erg voorzichtig gebeuren omdat er zo weinig data vergeleken kunnen worden. Er werden bovendien erg veel valse noten gespeeld door beide cellisten en daarom zou het gevonden declinatie-effect toeval kunnen zijn. Dat er geen harde conclusies getrokken kunnen worden, ligt mede aan de opzet van het experiment. Omdat dit een pilot-onderzoek is, zijn er maar vier proefpersonen voor de zinnen en twee voor de muziek gebruikt. Dat is vrij weinig. Bovendien is het aantal uitingen niet groot, zeker niet wat het muziekgedeelte betreft, wat voor een deel de grote standaarddeviaties kan verklaren bij het spraakgedeelte. Door de kleine aantallen in het muziekgedeelte is het niet zinvol statistische tests uit te voeren op de data, hoewel dat wel aan te bevelen is, zodat er echte, statistisch onderbouwde conclusies getrokken zouden kunnen worden. Daarom doe ik in de volgende subparagraaf enkele aanbevelingen voor statistische analyses voor eventueel toekomstig onderzoek.
5.4.2 Aanbevelingen Het zou goed zijn hetzelfde experiment nog een keer uit te voeren met een grotere opzet, met name met meer testzinnen, in ieder geval alle 150 testzinnen uit dit experiment, en meer proefpersonen voor het muziekexperiment, die het melodietje ook vaker spelen. Dan zouden er geldige statistische uitspraken over gedaan kunnen worden. Voor de spraakwaarnemingen zou het interessant zijn een regressie-analyse uit te voeren. Dan wordt de spreiding berekend van de verschillende toonhoogten en kunnen daarin 66
EXPERIMENT: DECLINATIE –EFFENTEN IN TAAL EN MUZIEK
regressielijnen worden getrokken van de gemiddelde afname van de toonhoogte. Vervolgens zou op grond van die gemiddelde regressie de toonhoogte van de hoge en lage beginaccenten van elke nieuwe deelzin voorspeld kunnen worden. Die voorspelde waarde moet dan afgezet worden tegen de werkelijke waarde door middel van een t-test. Als de werkelijke waarde significant hoger ligt dan de door de regressielijn voorspelde waarde, dan vindt er reset plaats. Maar dit blijkt heel moeilijk te zijn, want eerst moet dan aangetoond worden of bepaalde tonen een lineair verband vertonen, of zelfs een niet-lineair verband, naar aanleiding waarvan dan de declinatiehelling kan worden afgeleid. In dit experiment, met deze data, was een dergelijk verband vooralsnog niet aan te tonen. Verder zou het interessant zijn om te onderzoeken of pauzelengte een rol speelt bij de grootte van de reset en of het voorkomen van een l4-toon ook een effect heeft. Iets anders is dat het de moeite waard is om de significantie te testen met α = 0,01. Dan moet natuurlijk wel onderzocht worden of dat te rechtvaardigen is, dus dat dat significante verschillen oplevert die robuust genoeg zijn om relevant te zijn voor de taalgebruiker. Voor het muziekexperiment zou met een t-toets berekend kunnen worden of het verschil in toonhoogte van dezelfde noten in verschillende maten (elke lange noot en de eerste korte noot in de volgende maat) significant is. Een reset lijkt mij niet te verwachten in muziek, hooguit voor de herhaling. Maar dat is natuurlijk ook te onderzoeken door middel van een regressieanalyse, een voorspelde waarde en een t-toets om die waarde met de gevonden waarde te vergelijken. Verder wil ik aanraden de musici te laten spelen in een periode dat ze regelmatig spelen. Toen ik dit experiment uitvoerde was het net vakantie en beide proefpersonen speelden erg vals. Ik vermoed dat ze de laatste tijd niet veel meer gestudeerd hadden. Het vals spelen kan de uitkomsten sterk beïnvloeden. Tot slot wil ik noemen dat het misschien toch het handigst is om de vingerzettingen niet aan de cellisten over te laten, maar ze van te voren zelf te bepalen. Dan kan zo mogelijk vermeden worden dat ze in de vierde positie spelen en daardoor houvast hebben. Maar het zou ook kunnen dat ze daardoor nog meer valse noten gaan spelen, want het wordt er veel moeilijker door. Het middel moet niet erger zijn dan de kwaal.
67
6 CONCLUSIE EN DISCUSSIE 6.1 SAMENVATTING EN CONCLUSIES De opzet van deze scriptie was om twee theorieën met elkaar te vergelijken. De ene theorie is een muziektheorie, de andere een taaltheorie. Daarnaast heb ik de verschijnselen waarover die theorieën gaan, muziek en taal, met elkaar vergeleken, waar het ging om segmentele, ritmische en intonatieverschijnselen. Dit laatste mondde uit in een experiment, waarin ik een intonatie-effect wilde aantonen in taal, ondersteund door de muziek. In het eerste hoofdstuk besprak ik de generatieve muziektheorie van Lerdahl en Jackendoff. Dit is een theorie die gebaseerd is op de generatieve taalkunde en leek mij daarom bijzonder geschikt voor de vergelijking met taalkundige theorieën. De essentie van deze muziektheorie is dat de manier waarop de luisteraar muziek “begrijpt” een hiërarchische is. Die hiërarchieën worden tot stand gebracht door de afweging van preferentieregels voor de output. Uit versterking en conflicten van de preferentieregels onderling wordt de meest geprefereerde structuur uit de muziek gedestilleerd. Het begrijpen van muziek is dus een mentale activiteit, het indelen van het muzikale geluid in stukjes met onderlinge hiërarchische verhoudingen, op het gebied van groepering, metrum en toonhoogtestructuur. Het concept van conflicterende preferentieregels was in de tijd dat Lerdahl en Jackendoff hun muziektheorie bedachten nog nieuw voor de taalkunde. Maar de laatste jaren is de nieuwe, met name fonologische theorie Optimality Theory in opkomst. In hoofdstuk 2 besprak ik deze theorie, een theorie die, net als de bovengenoemde muziektheorie, werkt met preferentieregels (welgevormdheidscondities) voor de output, die elkaar kunnen versterken of met elkaar in conflict kunnen zijn. Door deze schendbaarheid kan over processen gegeneraliseerd worden waar dat in derivationele theorieën vaak niet mogelijk was. Wel merkte ik op dat Optimality Theory niet goed met optionaliteit overweg kon. Dat was de reden dat ik nog een korte beschrijving gaf van de voorganger van Optimality Theory, Harmonic Grammar. Ik suggereerde dat daar misschien toch voor een deel op teruggegrepen moet worden. Daar kom ik in de discussie op terug. In hoofdstuk 3 vergeleek ik de generatieve muziektheorie met Optimality Theory en daar bleek dat ze inderdaad heel veel overeenkomsten vertonen. Beide zijn outputgericht en werken met softe preferentieregels die de meest geprefereerde outputstructuur bepalen door middel van versterking en conflict. De notatiewijze die beide theorieën gebruiken zijn ook zeer vergelijkbaar, zoals het opbouwen van grids voor de metrische hiërarchie. Zelfs de preferentieregels blijken in grote lijnen overeen te komen. In de muziektheorie zijn die geformuleerd in termen van articulatie van grenzen, parallellie en symmetrie. De belangrijkste constraintfamilies van Optimality Theory blijken grotendeels van dezelfde
CONCLUSIE EN DISCUSSIE
soorten te zijn: de articulatie van grenzen wordt bepaald door de Generalized Alignmentconstraints, parallellie is vergelijkbaar met de Correspondence-familie en symmetrie is in de taal voornamelijk te zien in de ritmische preferentieregels, die de minst gemarkeerde patronen prefereren, wat bepaald wordt door de Gemarkeerdheidsconstraints. Ik heb daarom geconcludeerd dat beide theorieën heel goed vergelijkbaar zijn en elkaar zelfs op bepaalde punten aanvullen. Omdat de families van muzikale en linguïstische preferentieregels zo veel overeenkomsten blijken te hebben, is het een logische stap om de verschijnselen taal en muziek ook te vergelijken. Dat is waar bovengenoemde theorieën op gebaseerd zijn. Als die theorieën zo veel overeenkomsten vertonen, moet dat ook wel gelden voor de objecten van studie voor die theorieën. Daarom bekeek ik in hoofdstuk 4 enkele processen en verschijnselen in taal op de gebieden van segment, stress, ritme en metrum en intonatie en keek of er gelijksoortige verschijnselen in de muziek te vinden waren. Daarbij vroeg ik me af of er dezelfde preferentieregels aan het werk waren. Op het gebied van de segmenten bleek dat er zowel in taal als in muziek conflicten opgelost werden tussen segmentele gemarkeerdheid en positionele gemarkeerdheid. Wat klemtoon, metrum en ritme betrof, bleken er zeer vergelijkbare ritmische preferentieregels van belang te zijn. Heel interessant was het om te zien dat muzikale elementen, zoals triolen en rusten, ook in taal werkzaam lijken te zijn en oplossingen zouden kunnen bieden voor langlopende taalkundige discussies. Waar het ging om toonhoogte heb ik het onderscheid voor taal overgenomen dat Lerdahl en Jackendoff voor de muziek maken tussen hiërarchische relaties tussen toonhoogten, gebaseerd op groeps- en metrische structuur enerzijds en de relaties tussen voortgang en prolongering door toonhoogte en andere fraseringeigenschappen anderzijds. Dat betekent dat ik toonhoogteaccenten los heb gekoppeld van intonatie. De structuur van de toonhoogteaccenten werkt heel nauw samen met de metrische structuur en de groepsstructuur, net als in de muziek. Het bepaalt mede het ritme. En de intonatie is sterk gebaseerd op de structuur van de toonhoogteaccenten, maar heeft een ander doel, namelijk, net als in de muziek, het structureren van de klankstroom in voortgang en prolongering, voorzin en nazin, vraag en antwoord, komma en punt, etc. Ik heb ook laten zien dat dit niet alleen gebeurt door middel van toonhoogte, maar ook voor een groot deel door middel van kenmerken als rust en vertraging. In muzikale frasering gebeurt dat op dezelfde manier. De conclusie uit dit hoofdstuk was dat de objecten van studie van beide besproken theorieën, taal en muziek, sterke overeenkomsten vertonen op de gebieden die ik heb bekeken. In de discussie zal ik nog kort ingaan op de vraag hoe het komt dat deze mentale processen zo vergelijkbaar zijn. Ten slotte heb ik in hoofdstuk 5 nog een intonatieverschijnsel uit de taal onderzocht in een experiment: declinatie en declinatie binnen declinatie. Ik onderzocht of die hiërarchie binnen de frase er was, dus dat er een reset was waar te nemen van de toonhoogte aan het begin van elke subfrase. Dat lijkt inderdaad een tendens te zijn.
69
CONCLUSIE EN DISCUSSIE
Ik heb gekeken of declinatie ook in instrumentale muziek is waar te nemen. Omdat dat leek zo te zijn, heb ik voorzichtig geconcludeerd dat dit evidentie is voor de stelling dat declinatie niet alleen een fysiologisch verschijnsel is, maar ook een intonatieverschijnsel dat de hiërarchie binnen de intonatiefrase en tussen intonatiefrasen onderling kan bepalen. Zo blijkt dat taal en muziek niet alleen op elkaar lijken, maar dat muziek zelfs theoretische stellingen in de taalkunde kan ondersteunen. Misschien kan dat andersom ook?
6.2 DISCUSSIE In de hoofdstukken 2 en 4 noemde ik het probleem van optionaliteit. Dat is iets wat Optimality Theory niet goed aankan. Daarom heb ik aan het einde van hoofdstuk 2 een beschrijving gegeven van Harmonic Grammar. Iets wat lijkt op Harmonic Grammar lijkt nodig te zijn, maar in aangepaste vorm. De strikte dominantiehiërarchie van de constraints zorgt in Optimality Theory voor problemen. Het blijkt dat constraints soms in de ene hiërarchische relatie staan ten opzichte van elkaar en soms in de andere. In hoofdstuk 4, paragraaf 1, liet ik zien dat Steven voor het woordje korst positionele gemarkeerdheid boven segmentele gemarkeerdheid had geplaatst, maar voor acht andersom. Ook in de waarnemingen van mijn experiment in mijn ongepubliceerde paper (Schreuder, 1998) was sprake van optionaliteit. Bij allegro-spraak werd soms het ritme aangepast en soms niet. Gilbers (1987), Yip (1996) en Gilbers en Jansen (1996) pleiten voor een eigen rangschikking van de constraints voor allegro-spraak en zien het dus als een ‘andere taal’. Maar als binnen die ‘allegro-taal’ de constraints de ene keer in de ene hiërarchie staan en de andere keer in de andere, dan is het optionaliteitsprobleem nog niet opgelost. Bovendien vind ik het weinig elegant om elke situatie waarin constraints anders gerangschikt lijken te zijn dan normaal een andere taal te noemen. In het kader van Universal Grammar zou het mooi zijn als dat niet nodig is. Er zou anders een situatie kunnen ontstaan dat er voor elk probleem een eigen constrainthiërarchie bedacht zou worden en daardoor de generaliserende kracht van de theorie verloren zou gaan. En dan wil ik nog opmerken dat er bij zeer jonge taallerende kinderen is waar te nemen dat constraints de ene keer in een bepaalde hiërarchie staan en de andere keer in een andere, of in een randomrangschikking. Zo komt het voor dat kinderen de klank [l] niet in woorden kunnen uitspreken, maar wel la la la kunnen zingen. Hier kan weer een voorbeeld van Steven Gilbers (1;6 jr.) genoemd worden. Steven realiseert hallo als [h<wo], maar zingt wel [lalalalala]. Dit alles is voor mij reden om te suggereren af te stappen van het idee van strikte dominantiehiërarchieën voor constraints. Het hele leven bestaat immers uit het maken van afwegingen tussen ‘constraints’. Als je bijvoorbeeld een cadeautje voor iemand gaat kopen, dan zijn er ook verschillende ‘preferentieregels’ die een rol spelen. Voor mij is de belangrijkste regel dat het een leuk cadeautje moet zijn en ik wil ook wel graag dat het niet te duur is. Maar er bestaan verschillende situaties die de keuze mede bepalen. Als het een cadeautje is voor een hele 70
CONCLUSIE EN DISCUSSIE
goede vriend(in) vind ik de prijs minder belangrijk dan voor een vage kennis en het kan zelfs zo zijn dat ik voor de vage kennis toch maar voor het goedkopere, iets minder leuke (maar toch best leuke) cadeautje kies. De mate van ‘roodstaan’ op mijn rekening speelt natuurlijk mee en misschien mijn humeur ook wel. Er zijn dus wel preferentieregels die een belangrijkere rol spelen dan andere, maar ze zijn allemaal in interactie met elkaar en elke andere situatie bepaalt mede de uiteindelijke keuze. Zo zie ik het ook voor taal en muziek. Elke andere situatie legt de nadruk op andere preferentieregels en bepaalt zo het gewicht voor die preferentieregel, in termen van Harmonic Grammar. Harmonic Grammar was gebaseerd op een connectionistische theorie. Die connectionistische theorie is zelf ook verder geëvolueerd, tot een neuraal netwerkmodel. Dat is een model dat gebaseerd is op de werking van de hersenen. De hersenen werken door elektriciteit te sturen over de verbindingen tussen de neuronen. Dit cognitieve netwerk wordt in de informatica vereenvoudigd geïmiteerd, voor computers dus. Het gaat erom dat de informatieverwerking niet berust op eigenschappen van de neuronen zelf, maar met name om de wijze waarop deze neuronen aan elkaar gekoppeld zijn (Hendriks, Taatgen en Andringa, 1997). Neurale netwerken zijn volledig parallelle structuren. Dat betekent dat alle input, net als in Optimality Theory, tegelijkertijd en parallel verwerkt kan worden. Belangrijk is dat neurale netwerken in staat zijn bepaald gedrag te leren. Dat gebeurt door het steeds weer aanbieden van bepaalde evidentie aan de computer, waardoor bepaalde verbindingen in het kunstmatige neurale netwerk steeds sterker worden. Die verbindingen worden dan steeds beter gebruikt. Bovendien is het in staat op basis van voorbeelden patronen te leren herkennen en die op te delen en te classificeren. Op die manier kan het zelfs onvolledige patronen reconstrueren. (Hendriks, Taatgen en Andringa, 1997). Precies zo zou het kunnen gaan met taallerende kinderen. Door de versterking van verbindingen krijgen langzamerhand de goede, voor die taal belangrijke preferentieregels de overhand. En classificeren is precies waar het in deze scriptie om ging, zowel voor taal als voor muziek als voor alle gedrag. Een neuraal netwerkmodel lijkt mij daarom een geschikt alternatief voor het idee van strikte dominantiehiërarchieën van constraints in Optimality Theory. Een ander punt is de vraag hoe het komt dat taal en muziek, twee mentale verschijnselen die een zo verschillende functie schijnen te hebben, zo veel overeenkomsten vertonen. In hoofdstuk 1 noemde ik al dat het een algemene menselijke neiging van structureren van temporeel geordend gedrag zou kunnen zijn. Lerdahl en Jackendoff (1983) noemen dat ook al. Dans is ook zulk gedrag. En de mens heeft sterk de neiging alles om zich heen te willen ordenen (zie Gilbers 1992). Aantekeningen voor een scriptie moeten het liefst in verschillende mapjes in een grote scriptiemap, geordend op onderwerp. Die onderwerpen worden geordend in verschillende hoofdstukken. Losslingerende vellen met aantekeningen zijn bovendien storend en moeten op z’n minst op verschillende stapeltjes gelegd worden. Chaos is iets waar een mens niet mee kan werken. Daarom moet er zo veel mogelijk structuur in aangebracht worden, om alles te kunnen begrijpen en het overzicht te houden. 71
CONCLUSIE EN DISCUSSIE
Leuk is het om te zien dat taal wordt geordend in ideale ritmische patronen, een 4/4-maat, en dat daarin de eerste en de derde sterke syllabe benadrukt worden. Hayes (1984) en Dauer (1983) suggereren dat de euritmieregels van taal universeel zouden kunnen zijn, dus zou de -maat voor taal best universeel kunnen zijn. De 4/4-maat is in de muziek ook een veel voorkomende maatsoort.
V
Dauer voert het nog verder: het is niet specifiek voor taal, maar het zijn algemene principes voor ritmisch gedrag. Dat het voor muziek ook geldt, heb ik besproken. Dus ook hier zien we weer de tendens om iets dat voor zowel taal als muziek geldt, door te trekken naar algemeen gedrag, net als de neiging tot structureren. Zou dit ritmische gedrag iets te maken kunnen hebben met ons interne ritme, het kloppen van ons hart? Ons bloed stroomt nou eenmaal in een bepaalde cadens door ons lichaam en onze hersenen. Ritmisch gedrag vormt een deel van het algemeen structurerende gedrag. Lichamelijke condities zouden heel goed invloed kunnen hebben op de werking van ons cognitieve systeem. Taal en muziek zijn twee kanten van datzelfde cognitieve systeem. Je zou kunnen zeggen dat taal en muziek een structurele tweeling zijn in ons cognitieve systeem, vandaar de titel van deze scriptie. Het idee dat het structureren een algemene neiging is van het menselijk brein, impliceert dat niet alleen taal en muziek een tweeling vormen, maar dat het brein eenvoudig op die structurerende manier werkt. De stelling van Chomsky (1965) is dat de grammatica voor taal een aangeboren systeem is en dat mensen een aangeboren leermechanisme hebben voor taal. Hij stelt dat dit alleen voor taal geldt en niet voor andere leerprocessen. Ik heb in deze scriptie geïllustreerd dat het niet alleen voor taal geldt, maar zeker ook voor muziek. Alleen krijgt voor taal iedereen veel input om het leerproces te bespoedigen. Lang niet iedereen komt meteen vanaf de geboorte regelmatig in aanraking met muziek, in ieder geval niet in dezelfde mate. Daarom ontwikkelt zich dat voor iedereen verschillend. Deze redenering zou je door kunnen trekken naar alle mentale processen die het menselijk brein voortbrengt. Als het cognitieve systeem gebouwd is om te leren door te structureren in hiërarchische structuren, dan lijken niet alleen taal en muziek op elkaar, maar is de structuur de verbinding tussen alles wat de mens leert, denkt en doet. Dus taal en muziek lijken zo veel op elkaar omdat het beide cognitieve structureringsprocessen zijn om uit de chaos van geluid structuren te destilleren en het zo te kunnen begrijpen.
72
REFERENTIES Bolinger, D. (1964). Intonation: around the edge of language. Harvard Educational Review 34, 282-296. Bolinger, D. (1965b). Pitch Accent and Sentence Rhythm. In: Bolinger, D. (1965a). Forms of English: Accent, Morpheme, Order. Harvard University Press, Cambridge, Massachusetts. Burzio, L. (1995). The rise of optimality theory. Glot International 1 (6), 3-7. Cairns, C. & M. Feinstein (1982). Markedness and the Theory of Syllable Structure. Linguistic Inquiry, vol. 13, 193. Chomsky, N. (1965). Aspects of the Theory of Syntax. Cambridge, Massachusetts. Chomsky, N. & M. Halle (1968). The Sound Pattern of English. New York: Harper and Row. Clements, G. (1979). The description of terraced-level tone languages. Lanuage 55, 536-558. Clements, G. & S. Keyser (1983). CV Phonology. Cambridge, MA: MIT Press. Dauer, R. (1983). Stress-timing and Syllable-timing Reanalyzed. Journal of Phonetics 11, 5162. Giegerich, H. (1984). Relations to Metrical Structure. IULC. Gilbers, D. (1987). Ritmische Structuur. Glot 10, 271-292. Gilbers, D. (1992). Phonological Networks: a theory of segment representation. Grodil 3, Groningen. Gilbers, D. en W. Jansen (1996). Klemtoon en ritme in Optimality Theory, deel 1: hoofd-, neven-, samenstellings- en woordgroepsklemtoon in het Nederlands. TABU 26, Groningen. Gilbers, D. en H. de Hoop (1998). Conflicting Constraints: An introduction to Optimality Theory. Lingua 104, 1-12. t’ Hart, J., Collier, R. & A. Cohen (1990). A perceptual study of intonation. Cambridge University Press. Hayes, B. (1984). The Phonology of Rhythm in English. Linguistic Inquiry, vol. 15, nr. 1, 3374. Hendriks, P., Taatgen, N. & T. Andringa (1997). Breinmakers & Breinbrekers, Inleiding cognitiewetenschap. Addison Wesley Longman, Nederland.
REFERENTIES
Hoop, H. de, (1996). Optimality Theory: Achtergronden en Toepassingen. TABU 26, Groningen. Jackendoff, R. & F. Lerdahl (1981b). Generative Music Theory and its Relation to Psychology. Journal of music theory, vol. 25, 45-90. Jansen, W. (1997). Inherited Accents. Doctoraalscriptie, Groningen. Katamba, F. (1995). An Introduction to Phonology. Longman, London and New York. Ladd, R. (1986). Intonational phrasing: the case for recursive prosodic structure. Phonology Yearbook 3, 311-340. Ladd, R. (1988). Declination ‘reset’ and the hierarchical organization of utterances. Jearbook of the Acoustical Society of America 84, 530-544. Ladd, R. (1990). Metrical representation of pitch register. In: Kingston, J. & M. Beckman (eds.). Papers in Laboratory Phonology I. Between the Grammar and Physics of Speech. Cambridge University Press. Ladd, R. (1996). Intonational Phonology. Cambridge Studies in Linguistics 79, Cambridge University Press. Lehiste, I. (1979b). Perception of sentence and paragraph boundaries. In: Lindblom, B. & S. Ohman, eds., Frontiers of Speech Research. New York: Academic Press. Lerdahl, F. & R. Jackendoff (1977). Toward a Formal Theory of Tonal Music, Journal of music theory, vol. 21, 111-171. Lerdahl, F. & R. Jackendoff (1981a). On the Theory of Grouping and Meter, The musical quarterly, vol. 67, 479-506. Lerdahl, F. & R. Jackendoff (1983). A Generative Theory of Tonal Music. The MIT Press, Cambridge, Massachusetts, London, England. Liberman, M. (1979 (1975)). The Intonational System of English. Garland Publishing, Inc., New York & London. Liberman, M. & A. Prince (1977). On Stress and Linguistic Rhythm. Linguistic Inquiry, vol. 8, nr. 2, 249-336. Lindblom, B. (1978). Final lengthening in speech and music. In: G ôrding, E., Bruce, G. & R. Bannert (eds.). Nordic Prosody. Papers from a symposium Lund: Lund University, Department of Linguistics, 85-101. Martin, J. (1970a). On judging pauses in spontaneous speech. Journal of Verbal Learning and Verbal Behavior 9, 75-78. 74
REFERENTIES
Martin, J. (1970b). Rhythm-induced judgements of word stress in sentences. Journal of Verbal Learning and Verbal Behavior 9, 627-633. McCarthy, J. & A. Prince (1993a). Generalized Alignment. Yearbook of Morphology 1993, 79-154. McCarthy, J. & A. Prince (1993b). Prosodic Morphology I: Constraint Interaction and Satisfaction. Ms., Rutgers Optimality Archive. McCarthy, J. & A. Prince (1995). Faithfulness and Reduplicative Identity. In: Beckman, J. et al. (eds.). Papers in Optimality Theory. (University of Massachusetts Occasional Papers 18), Amherst, MA: GLSA. Nespor, M. & J. Vogel (1986). Prosodic phonology. Dordrecht: Foris. Prince, A. (1983). Relating to the Grid. Linguistic Inquiry 14, 19-100. Prince, A. and P. Smolensky (1993). Optimality Theory: constraint interaction in generative grammar. Ms., Rutgers Optimality Archive. Schreuder, M. (1998). Hoe Optimaal is Optimality Theory? Optimality Theory en ritmische variabiliteit. Ongepubliceerd paper. Selkirk, E. (1980). The Role of Prosodic Categories in English Word Stress. Linguistic Inquiry, vol. 11, nr. 3, 563-605. Selkirk, E. (1986). Phonology and Syntax: The Relation between Sound and Structure. The MIT Press, Cambridge Massachusetts, London, England. Sloboda, J. (1986). The Musical Mind. The cognitive psychology of music. Oxford Psychology series nr.5, Clarendon Press, Oxford. Smolensky, P. (1986). Information processing in dynamical systems: Foundations of harmony theory. In: Rumelhart, D., McClelland, J. & The PDP Research Group. Parallel distributed processing. Explorations in the microstructure of cognition. Vol. 1: Foundations. Cambridge, MA: MIT Press. Smolensky, P. (1995). Reply: Constituent Structure and explanation in an integrated connectionist/symbolic cognitive architecture. In: MacDonald, C. & G. MacDonald (eds.). Connectionism: Debates on psychological explanation. Oxford: Blackwell. Sundberg, J. and B. Lindblom (1976). Generative Theories in language and music descriptions. Cognition 4, 99-122. Thorsen, N. (1985). Intonation and text in Standard Danish. Journal of the Acoustical Society of America 77 (3), 1205-1216.
75
REFERENTIES
Thorsen, N. (1986). Sentence intonation in textual context - Supplementary data. Journal of the Acoustical Society of America 80 (4), 1041-1047. Willemze, T. (1993). Algemene muziekleer. Uitgeverij het Spectrum, Utrecht. Yip, M. (1996). Feet, tonal reduction and speech rate at the word and phrase level in Chinese. University of California, Irvine. Van Zonneveld, R. (1983). Affix Grammatica, een Onderzoek naar Woordvorming in het Nederlands. Dissertatie Rijksuniversiteit Groningen.
76
BIJLAGEN BIJLAGE 1: TESTZINNEN Oefenzinnen Judith gaat op stap met haar vriendinnen en Angela gaat met de trein naar haar ouders en Ina gaat met haar vriend naar de dierentuin. Ineke moet met haar gaatjes naar de tandarts en de tandarts boort met een boor in de kiezen en de kiezen worden gevuld met een vulling. Rixt past op de baby van haar buren en de buren zijn met vrienden aan het sporten en de baby slaapt rustig in het wiegje.
Testzinnen Marleen gaat met de auto naar huis en haar zus gaat met de fiets naar een restaurant en haar vader gaat lopend naar een feestje. Joost gaat op vakantie naar Frankrijk en Anton gaat met een zeilboot naar Engeland en Karel wil naar een cursus in Duitsland. Sarah trouwde met haar verloofde in het gemeentehuis en Freek verloofde zich met zijn vriendin in de kerk en Alex vierde feest met zijn vrienden in de tuin. Lot werkte met haar collega’s aan een project en Bert speelde met een orkest in het concertgebouw en Karen gaf les aan een klas op de basisschool. Carola zong met haar nicht in het koor en Ellen speelde met haar vriend in het orkest en Klaas speelde op het orgel in de kerk. Jan liep met de baby op zijn arm en Esther speelde met het kind in de tuin en Eva rende met het jongetje over de straat. Erna zeilde op een zeilboot op het IJsselmeer en haar vader stond aan dek op de uitkijk en haar zusje zwom aan een touw achter de boot. Anna verhuisde met een vrachtwagen naar Amsterdam en Job verhuisde met de auto naar Beijum en Jolanda verhuisde te voet naar de overkant. Karel viert zijn verjaardag in een cafeetje en Janneke houdt haar afstudeerfeest in de kroeg en Marten wil naar de feestjes van allebei.
BIJLAGE 1
Renate geniet van het mooie weer op het balkon en Ruth zit in de zon op een terrasje en Maartje moet hard studeren in de bibliotheek. Steven gaat met de trein naar België en Frans wil met een vriendje op pad gaan en Rob gaat aan het werk op een boerderij. Lena studeert voor architect in Duitsland en Aafke leert voor therapeut in Engeland en Adriaan is op stage in een ziekenhuis. Andrea woont voor een tijdje in Zimbabwe en Hanna gaat over een tijdje naar Oostenrijk en Kees blijft voor altijd in Nederland. Ron gaat naar de film in de bioscoop en Mark gaat naar de koopavond in de stad en Derk zit de hele avond achter de televisie. Corrie roeide in een roeiboot op het kanaal en Irene trainde haar conditie op het fietspad en Astrid tenniste de hele dag op de tennisbaan. Obelix viel als kind in de toverdrank en Asterix drinkt elke dag van de toverdrank en het hondje krijgt het in de oorlog door zijn eten. De bus vertrekt om vier uur naar Emmen en Opa staat om vijf uur bij de bushalte en Oma wacht in de keuken met een appeltaart. Okke ging met een cadeautje naar de verjaardag en Joke kwam op het feest met een bloemetje en Peter heeft nam wat geld mee voor de jarige. De kalender ligt al de hele dag op de grond en het karton slingert al een week door de kamer en het stof ligt al maanden op de vensterbank. De tennisser slaat de tennisbal met de racket en de tennisbal vliegt met een boog over het net en de tegenspeler slaat de tennisbal buiten de lijnen. De piloot vliegt met het vliegtuig naar Amerika en de stewardess zorgt met haar collega voor de reizigers en de reizigers vertellen hun kinderen over Amerika. Frankrijk staat als vakantieland op nummer één en Nederlanders gaan naar Frankrijk op vakantie en de Fransen zorgen voor ergernis bij de Nederlanders. Anke dronk kruidenthee uit een theekopje en Henk dronk Belgisch bier uit een bierglas en Anneke dronk rode wijn uit een wijnglas. Alexander at warme broodjes met zijn handen en Diana at warme broodjes met mes en vork en Eefje at al haar eten met mes en vork. Eelco studeert over een jaar in Leiden en Alie verhuist volgende week naar Friesland en Carin blijft nog een tijdje bij haar ouders. 78
BIJLAGE 1
dummy-zinnen: Marieke wil later boerin worden en Koen gaat werken als brandweerman en Suzan wil het liefst huisvrouw worden. Sietske is langer dan Annemiek en Annemiek is langer dan Laura en Laura is langer dan Marije.
BIJLAGE 2: MELODIE VOOR MUZIEKEXPERIMENT MET CELLISTEN
Labels: L1d, K1e, K1d, K1c, K1b L2c, K2d, K2c, K2b, K2a L3b, K3c, K3b, K3a, K3g L4a, K4b, K4a,K4g, K4fis L5g, K5a, K5g, K5fis, K5e L6fis, K6e, M6d, M6a L7g :
De labels voor de noten zijn opgebouwd uit een L, K of een M voor Lang, Kort of Middellang, gevolgd door het nummer van de maat en de naam van de noot. De strepen tussen de codes bij de labels komen overeen met de maatstrepen in het melodietje.
79
BIJLAGE 1
BIJLAGE 3: SIGNIFICANTIE VERGELEKEN TONEN SPRAAKEXPERIMENT Voor de duidelijkheid zijn alle cellen waarin de tweede toon hoger is dan de eerste grijs gekleurd. Lage tonen
Alle sprekers
IS
1l3 2l1 2l3 3l1 *1l4 2l1 *2l4 3l1 1l1 2l1 2l1 3l1 1l2 2l2 2l2 3l2 1ml1 2ml1 2ml1 3ml1 1ml2 2ml2 2ml2 3ml2 1l3 2l3 2l3 3l3 1l4 2l4 2l4 le 1l1 3l1 1l2 3l2 1ml1 3ml1 1ml2 3ml2 1l3 3l3 1l4 le 1l1 3l3 1l2 le
niet sign. hoger niet sign. hoger niet sign. hoger niet sign. hoger significant lager niet sign. lager niet sign. lager niet sign. hoger niet sign. lager niet sign. lager niet sign. lager niet sign. hoger niet sign. hoger niet sign. hoger niet sign. lager niet sign. lager significant lager niet sign. lager niet sign. lager niet sign. lager niet sign. hoger niet sign. lager significant lager significant lager
niet sign. hoger niet sign. hoger significant hoger significant hoger significant lager niet sign. lager niet sign. hoger niet sign. hoger niet sign. lager niet sign. hoger niet sign. lager niet sign. lager niet sign. hoger niet sign. hoger niet sign. hoger niet sign. hoger significant lager significant hoger niet sign. hoger niet sign. lager niet sign. hoger niet sign. hoger significant lager significant lager
KB
SM1
SM2
Voorspeld:
niet sign. niet sign. niet sign. Reset hoger hoger hoger (hoger) niet sign. niet sign. niet sign. Reset (hoger) hoger hoger hoger Reset significant niet sign. hoger hoger / (hoger) Reset niet sign. niet sign. hoger hoger / (hoger) significant significant significant Declinatie lager lager lager (lager) niet sign. niet sign. Declinatie niet sign. hoger lager lager (lager) niet sign. Significant niet sign. Declinatie lager lager lager (lager) niet sign. niet sign. Declinatie niet sign. hoger lager lager (lager) niet sign. niet sign. niet sign. Declinatie lager lager lager (lager) niet sign. niet sign. Declinatie niet sign. hoger lager lager (lager) niet sign. niet sign. niet sign. Declinatie lager lager lager (lager) Declinatie niet sign. niet sign. niet sign. hoger hoger hoger (lager) Declinatie niet sign. niet sign. niet sign. hoger hoger hoger (lager) Declinatie niet sign. niet sign. niet sign. hoger hoger hoger (lager) niet sign. niet sign. Declinatie hoger hoger / (lager) niet sign. niet sign. Declinatie lager lager / (lager) significant significant significant Declinatie lager lager lager (lager) significant significant niet sign. Declinatie lager lager lager (lager) niet sign. niet sign. niet sign. Declinatie lager lager lager (lager) niet sign. Declinatie niet sign. niet sign. hoger hoger lager (lager) Declinatie niet sign. niet sign. niet sign. hoger hoger hoger (lager) niet sign. niet sign. Declinatie lager lager / (lager) significant significant significant Declinatie lager lager lager (lager) significant significant significant Declinatie lager lager lager (lager) *Dit zijn waarschijnlijk geen vergelijkbare groepen.
80
BIJLAGE 1 De l4-tonen komen veel minder vaak voor dan de andere accenten. Bij SM2 komen ze zelfs niet vaak genoeg voor om statistische uitspraken over te doen (/).
Hoge tonen
Alle sprekers
IS
KB
SM1
SM2
Voorspeld:
1h2 2h1 2h2 3h1 1h1 2h1 2h1 3h1 1mh 2mh 2mh 3mh 1h2 2h2 2h2 he 1h1 3h1 1mh 3mh 1h2 he
niet sign. hoger niet sign. hoger significant lager niet sign. lager niet sign. lager niet sign. lager niet sign. lager significant lager significant lager niet sign. lager significant lager
significant hoger significant hoger significant lager niet sign. hoger niet sign. lager niet sign. lager niet sign. lager niet sign. lager niet sign. lager niet sign. lager niet sign. lager
niet sign. hoger niet sign. hoger significant lager niet sign. hoger niet sign. hoger niet sign. lager niet sign. hoger significant lager significant lager niet sign. lager significant lager
niet sign. Lager singificant lager significant lager niet sign. lager niet sign. lager niet sign. lager niet sign. hoger significant lager significant lager significant lager significant lager
singificant lager singificant lager significant lager niet sign. lager niet sign. lager niet sign. lager niet sign. lager significant lager significant lager significant lager significant lager
Reset (hoger) Reset (hoger) Declinatie (lager) Declinatie (lager) Declinatie (lager) Declinatie (lager) Declinatie (lager) Declinatie (lager) Declinatie (lager) Declinatie (lager) Declinatie (lager)
81