Het toenaderen-terugtrekken onderscheid in spraak en muziek Een interdisciplinair onderzoek vanuit de hoofdrichting Taal en Cognitie van Liberal Arts & Sciences naar de overeenkomsten en verschillen tussen de subjectieve beleving en de akoestische meting van het ‘toenaderen-terugtrekken’ onderscheid in spraak en muziek.
Bachelor Scriptie Liberal Arts & Sciences Universiteit Utrecht Joëlle Lafeber, 3480380 06-12-2012
Onder leiding van en met dank aan: Dr. Hugo Quené
1
Inleiding
Ieder (gezond) mens heeft emoties. Deze emoties komen soms (in meer of mindere mate) tot uitdrukking. Dit kan expliciet, bijvoorbeeld wanneer een persoon vertelt dat hij of zij verdrietig is. Soms gaat dit meer impliciet, bijvoorbeeld wanneer een persoon tegen wil en dank een trillende onderlip laat zien. Emotie kan ook tot uitdrukking komen in spraak. Vaak krijgen we, naast de lexicale betekenis van een gesproken boodschap, door de ‘toon’ waarop mensen ons aanspreken een indicatie van hoe zij zich voelen. Kwade mensen praten bijvoorbeeld vaak harder, en blije mensen normaliter sneller dan gemiddeld. Als een bepaalde emotie overgebracht kan worden met spraak zonder lexicale betekenis, dan is het waarschijnlijk dat er zich akoestische indicatoren in die spraak bevinden die de emotie van de spreker weerspiegelen. Met andere woorden, het is waarschijnlijk dat spraakreeksen die ervaren worden als ‘verdrietige spraak’, overeenkomstige eigenschappen hebben, zoals: een laag volume, een lage toonhoogte, en een langzaam tempo. In hoofdstuk 3 en 4 van deze scriptie wordt beschreven hoe deze indicatoren van emotie vast te stellen zijn aan de hand van extensief voorgaand onderzoek naar akoestische indicatoren van emotie in spraak. Aan de hand van deze indicatoren kunnen spraakreeksen gemeten worden. Spraak en muziek hebben veel essentiële overeenkomsten en verschillen. Naast de perceptie van emotie bij spraak, is het voor de luisteraar ook mogelijk om emotie waar te nemen bij muziek. Uit voorgaand extensief onderzoek weten wij dat proefpersonen tevens redelijk goed zijn in het ‘raden’ van de emotie in de expressie van de muziek. Hiervoor zijn akoestische indicatoren vast te stellen voor het meten van een muziekreeks, die tevens behandeld worden in hoofdstuk 3 en 4. De belangrijkste overeenkomsten en verschillen voor dit onderzoek worden toegelicht in hoofdstuk 2 van deze scriptie. De resultaten van het experiment worden beschreven in hoofdstuk 5 waarop de discussie zal volgen in hoofdstuk 6.
2
Het concept emotie wordt gespecificeerd naar de term ‘affect’, van waaruit vooral wordt gedacht in termen van positieve en negatieve ‘valenties’. De indicatoren worden onderverdeeld in een daarna noodzakelijk te maken onderscheid, namelijk het ‘toenaderen-terugtrekken onderscheid’. Het belang van deze concepten en uitgebreide definities ervan zijn verder uitgewerkt in hoofdstuk 1. In dit onderzoek werd het onderscheid bij 27 spraak- en 27 muziekfragmenten gemeten aan de hand van de vastgestelde akoestische indicatoren. Er werd gemeten in hoeverre de fragmenten volgens de indicatoren als ‘toenaderend’ of ‘terugtrekkend’ opgevat zouden kunnen worden. Deze meting is uitgewerkt in hoofdstuk 4. De akoestische meting van de fragmenten werd vergeleken met een subjectieve beoordeling van het onderscheid in de fragmenten. De subjectieve beoordeling werd gemeten door 42 proefpersonen de fragmenten te laten beluisteren en een Likert schaal van 1 tot en met 7 in te laten vullen met aan de ene kant ‘toenaderen’ en aan de andere kant ‘terugtrekken’. Drie aspecten zijn hier vooral interessant. Namelijk, 1. Komt de subjectieve beleving van de spraakfragmenten overeen met de akoestische meting van de spraakfragmenten? 2. Komt de subjectieve beleving van de muziekfragmenten overeen met de akoestische meting van de muziekfragmenten? 3. Komt de subjectieve beleving van de spraak- en muziekfragmenten overeen met de akoestische meting van de spraak- en muziekfragmenten? Zij vormen daarom ook de deelvragen die samen de probleemstelling vormen: komt de subjectieve beleving van het toenaderen-terugtrekken onderscheid overeen met resultaten van een akoestische meting van het onderscheid in muziek en in spraak? De hypothese is dat de akoestische meting en de subjectieve beoordeling van de spraakfragmenten en van muziekfragmenten (deelvraag 1 en 2) nagenoeg overeenkomen omdat de akoestische indicatoren van emotie overdraagbaar zijn naar akoestische indicatoren van het toenaderen-terugtrekken onderscheid (zie hoofdstuk 3 en 4). Met andere woorden, hoe het affectonderscheid beleefd ‘zou moeten worden’ volgens de akoestische meting, komt waarschijnlijk overeen met hoe de proefpersonen het affectonderscheid beoordelen. Daarnaast is de verwachting dat er weinig grote verschillen zullen zijn in de resultaten tussen muziek en spraak door de vele 3
essentiële overeenkomsten die spraak en muziek hebben (deelvraag 3)(zie hoofdstuk 2). De accuraatheid (hoe meer de subjectieve beleving en de akoestische meting overeenkomen hoe meer accuraat) van de beoordeling van de proefpersonen is waarschijnlijk ongeveer even groot bij zowel spraak als muziek. Echter, er wordt verwacht dat de overeenkomst bij de muziekfragmenten in subjectieve beleving en akoestische meting iets groter is dan de overeenkomst in subjectieve beleving en akoestische meting in de spraakfragmenten (deelvraag 3). Met andere woorden, de accuraatheid bij de muziekfragmenten is waarschijnlijk iets groter dan bij de spraakfragmenten. Deze verwachting komt voor uit de overtuiging, dat het makkelijker is om het onderscheid correct in te schatten in muziek door een grotere variatie in toonhoogte, volume en tempo. De verschillen ertussen zijn daarom makkelijker op te merken.
Onderzoek naar de relatie van de expressie van emotie in muziek en spraak heeft al een aardige basis. Met deze scriptie voeg ik daar een dimensie aan toe. Die van het toenaderen-terugtrekken onderscheid van affect. Om inzichten te verwerven over dit onderscheid is een interdisciplinaire aanpak onmisbaar. Ian Cross besprak in zijn lezing over inter- en intradisciplinariteit in onderzoek over muziek en taal, dat ons begrip van muziek centraal staat aan ons begrip van sociaal en menselijk leven (2012). Tevens geld voor muziek dat hoewel er verschillende theorieën bestaan over de oorsprong en de primaire functie van taal, veel onderzoekers naar dit onderwerp het eens zijn dat het antwoord van onschatbare waarde zou zijn voor ons begrip van sociaal en menselijk leven. In deze scriptie is daarom gekozen voor een interdisciplinaire aanpak waarin inzichten uit zowel de taalkunde, musicologie, (neuro)biologie, cognitieve wetenschappen en psychologie behandeld zullen worden.
4
Hoofdstuk 1 Emotie, affect en het toenaderen-terugtrekken onderscheid
§1.1 Inleiding Emoties werden jarenlang gezien als tegenpool van rationaliteit, en daarmee niet van (groot) belang voor wetenschappelijk onderzoek. Steven Mithen merkt echter terecht op dat er grote veranderingen hebben plaatsgevonden in academische attitudes tegenover menselijke emoties in de laatste vijftien jaar. Deze golf van verandering heeft emoties in het centrum van menselijke denken en de evolutie van menselijke mentaliteit geplaatst. Zoals de filosoof Dylan Evans treffend uitlegt, zou de ultra-rationaliteit van Mr. Spock (uit Star Trek), een wezen dat emotie geëlimineerd heeft uit zijn vermogen keuzes te maken, in realiteit nooit geëvolueerd kunnen zijn omdat emotie aan de grond ligt van intelligente actie in de wereld. Emoties zijn daarom essentieel voor interactie met de fysieke en sociale wereld (2006). Emotie is essentieel voor ons handelen en is volgens veel filosofen het vertrekpunt van waaruit wordt gehandeld in de interactie met de fysieke en sociale wereld. Om meer inzicht te krijgen in deze interactie is onderzoek naar emotie een noodzaak. In dit hoofdstuk wordt besproken waarom we überhaupt emoties hebben in paragraaf 1.2 Vervolgens wordt in paragraaf 1.3 besproken of, en welke universelen er bestaan in emoties. Emotie wordt in dit onderzoek toegespitst tot de term ‘affect’ dat in paragraaf 1.4 toegelicht zal worden. Vervolgens wordt een aspect van affect benaderd in paragraaf 1.5, namelijk het toenaderen-terugtrekken onderscheid.
§1.2 Waarom we emoties hebben Een belangrijke, en misschien wel de allereerste vraag die we onszelf moeten stellen bij het doen van onderzoek naar emotie is: waarom is het nodig dat we überhaupt emoties hebben? Om deze theorie te behandelen bespreekt Mithen een criterium ontwikkeld door psychologen Keith Oatley en Philip Johnson-Laird. Zij beargumenteren dat het vertrekpunt van een theorie de erkenning is dat elk 5
levend wezen constant keuzes moet maken tussen verschillende acties: moet iemand doorgaan met de huidige taak, of iets anders gaan doen? Emoties leiden acties in situaties waar onvoldoende kennis beschikbaar is en er meerdere, tegenstrijdige doelen zijn – een staat die anderzijds bekend staat als ‘gebonden rationaliteit’. Emoties beïnvloeden onze hersenstatus en maken repertoires van beschikbare acties die voorheen behulpzaam waren in vergelijkbare situaties. Onze emoties zijn daarom essentieel voor ‘rationele’ gedachten; zonder hen, zouden we compleet gedwarsboomd zijn in onze interactie met de fysieke en sociale wereld (2006).
§1.3 Universelen in emotie: basis emoties Wanneer het gaat om inzicht krijgen in de interactie van de mens an sich met de sociale wereld, is het van belang dat het onderzoek representatief is voor de mensheid in het algemeen, en niet slechts voor mensen in een bepaalde cultuur. Maar kunnen we wel aannemen dat emoties voor ieder mens hetzelfde zijn? Verschillende culturen reageren namelijk anders op een zelfde situatie. Sterker nog, verschillende mensen reageren vaak anders op eenzelfde situatie. Toch is het waarschijnlijk dat er universelen te vinden zijn voor hoe emoties ‘werken’. Ooit werd gedacht dat alle emoties cultureel gestructureerd waren en daarom specifiek voor elke andere beschaving. Dit standpunt is voorbij gestreefd door de erkenning dat sommige emoties universeel zijn voor alle leden van onze soort. Zulke emoties zitten ingebakken in de menselijke opbouw door onze evolutionaire geschiedenis. Dit op zichzelf suggereert dat ze meer zijn dat slechts mentale trivia (Mithen, 2006). Paul Ekman (1999), medeontdekker van micro-expressies en één van de meest invloedrijke psychologen van de 20e eeuw, stelde een lijst op met eigenschappen die basis emoties van elkaar en van andere affectieve fenomenen onderscheiden, die op de volgende pagina wordt weergegeven.
6
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
Onderscheidende universele signalen. Onderscheidende fysiologie. Automatische waardering. Onderscheidende universelen in antecedente gebeurtenissen. Onderscheidende blijk van ontwikkeling. Aanwezigheid in andere primaten. Snelle onset. Korte duur. Ongenode opkomst. Onderscheidende gedachten, herinneringen en voorstellingen. Onderscheidende subjectieve beleving.
Wanneer een fenomeen deze eigenschappen bezit is er sprake van een basisemotie, die weer een ‘emotie familie’ van gerelateerde emoties representeert. Hiermee wordt een set van emoties bedoeld die onder deze basisemotie vallen (1999). Onder deze definitie van basisemoties vallen dan ook erg veel van de bestaande (woorden voor) emoties. Het is belangrijk te beseffen dat het gaat om wat uniek is voor emoties, en wat emoties gemeen hebben met elkaar dat ze van andere fenomenen onderscheidt. Daarnaast moet geen van de eigenschappen gezien worden als de sine qua non voor emoties. Wat er uniek aan is, is dat we om proberen te gaan met huidige fundamentele levenstaken op manieren die adaptief waren in ons evolutionaire verleden wanneer een emotie opkomt.
§1.4 Affect Emotie is een breed en omstreden begrip en deze definitie is niet gemakkelijk toetsbaar te maken. Daarom dient de term toegespitst te worden tot de term ‘affect’. Daniel Levitin beschrijft dat wetenschappers de term ‘affect’ gebruiken om te refereren naar de valentie (positief of negatief) van onze interne staat, en gebruiken zij het woord ‘emotie’ om naar specifieke staten te refereren. Affect kan daarom maar twee waarden aannemen (of een derde waarde als je ‘geen affectieve staat’ meerekent). In elke waarde is er een scala aan emoties: positieve emoties houden bijvoorbeeld geluk en verzadiging in, negatieve emoties angst en woede (2006). De staat met als kern de afwezigheid van een affectieve staat, wordt in dit onderzoek buiten beschouwing gelaten. Het is vrijwel onmogelijk om niet in een affectieve staat te verkeren. Er wordt daarom eerder uitgegaan van een
7
passieve affectieve staat waarin een emotie geen of een zeer kleine rol speelt. In dit onderzoek werd echter onderzocht of de subjectieve beleving van een affectonderscheid in muziek en spraak overeen komt met resultaten van een akoestische meting van dat affectonderscheid in muziek en spraak. Een staat waarin weinig tot geen sprake is van emotie is daarom niet interessant voor dit onderzoek.
§1.5 Toenaderen versus terugtrekken Als basis emoties geëvolueerd zijn om om te kunnen gaan met fundamentele levenstaken, dan zouden ze niet alleen informatie moeten geven door expressie naar soortgenoten over wat er plaats vind, maar dan zouden er ook fysiologische veranderingen moeten zijn die het organisme voorbereiden om verschillend te reageren op verschillende emotionele staten (Ekman, 1999). Een onderscheid van affect, het toenaderen-terugtrekken onderscheid, is zo een fysiologische verandering. Er zijn twee valenties van affect: positief en negatief, waar weer een scala van emoties onder te scharen valt. Dit onderscheid in valenties is ook te vatten in de conceptuele ruimte tussen ‘toenaderen’ en ‘terugtrekken’. Toenaderen versus terugtrekken, is een directe vertaling van het affectonderscheid: approach versus withdrawal. Het approach- withdrawal onderscheid is een fundamenteel onderscheid om te maken. Elliot en Covington (2001) geven daar vijf goede redenen voor (op basis van een uitgebreide literatuur studie) die in dit verslag beknopt samengevat worden. Het eerste argument is dat het approach-avoidance onderscheid (waarvan approachwithdrawal is afgeleid) een lange en rijke geschiedenis heeft in intellectueel denken, beginnend bij de Griekse filosofen Democritus (460-379 v.C.) en Aristippus (435-356 v.C.). Zij verbonden zich aan een ‘ethisch hedonisme’ dat het nastreven van genot en het ontwijken van pijn als kernpunt in de gids tot menselijk gedrag beschouwde. De Britse filosoof Jeremy Bentham (1748-1832) beschreef later de machten pijn en genot die volgens hem heersten over de motivatie van de mens. Het onderscheid heeft dus diepe wortels heeft in de wetenschap. 8
Het tweede argument voor de noodzaak van dit fundamentele onderscheid is zijn toepasbaarheid over verschillende vormen van leven. Het onderscheid is niet alleen aanwezig in mensen, maar ook in organismen zo simpel als de eencellige amoebe. De verfijning van het onderscheid tussen de mechanismes zal verschillen over verschillende soorten, met die van protozoa en andere ongewervelden rudimentair en strikt, en die van hogere organismen meer ontwikkeld en flexibel. Deze toepasbaarheid suggereert dat het onderscheid ‘ingebakken’ zit in leefvormen. Een derde argument, en verwant aan het tweede, is dat het onderscheid is gebaseerd in de urgentie, of zelfs primaire eigenschap en automatiek van veel approach-avoidance gebaseerde processen. Vaak gaat het om een reflexieve reactie. Er zijn onderzoeken die argumenteren dat organismen voorgeprogrammeerd zijn om zulke directe approach-avoidance reacties te geven aan verschillende klassen van stimuli. Een vierde argument voor het fundamentele belang van het onderscheid, is de neurofysiologische data die het bestaan aantonen van - in ieder geval deels - onafhankelijke approach en avoidance systemen in het brein. Onderzoeken naar deze systemen, hoewel verschillend in een aantal zaken, hebben de propositie gemeen dat er aantoonbare neuro anatomische substraten in het brein zijn die approach en avoidance processen onderliggen. Het vijfde en laatste argument voor het onderscheid is de notie dat approach en avoidance motivatie hoog intuïtief is, en dat het in essentie lijkt op ‘gezond verstand’. Elliot en Covington (2001) geven aan dat gezond verstand het vertrekpunt is voor iemands kennis en begrip. Zij erkennen daarbij dat intuïtie vaak overreden wordt in het wetenschappelijke proces, en dat dat ook zo hoort. Maar dat dit alleen voor mag komen als er een alternatieve verklaring is, die gegrond is in overtuigende theorie en gesteund wordt door empirische data. Zo een alternatief is nog niet in zicht bij het approach-avoidance onderscheid. Daarom mag intuïtie gezien worden als een belangrijke, onafhankelijke bron voor bewijs dat steun biedt aan de propositie dat het approach-avoidance onderscheid een fundamenteel onderscheid is.
9
Het toenaderen-terugtrekken onderscheid is een vrij abstract concept en daarom op verschillende manieren te benaderen. Elliot en Covington bespreken de meest essentiële methoden van onderzoek naar het toenaderen-terugtrekken onderscheid, zoals een aantal experimentele technieken die de approach-withdrawal motivatie volgens hen te veel te baseren op een ruimtelijke motivatie, in termen van bewegen ‘naar’ of ‘weg’ van een object in een fysieke ruimte. Zij noemen Miller, die opperde dat het approach-avoidance onderscheid begrepen moet worden in een dynamische en functionele zin, en niet in een ruimtelijke (2001). Ook bespreken Elliot en Covington de onderzoekers McClelland en collega’s, die zich vooral richtten op approach en avoidance motieven, die voorkeuren in de ‘aard’ representeren voor het bekrijgen van een positieve, hoped for staat of beleving (bijvoorbeeld motieven voor succes), of voor het ontwijken van negatieve beangstigende staten of belevenissen (bijvoorbeeld het motief om mislukking te vermijden), namelijk hope to avoid staten. Tevens erkenden zij dat het onderscheid tussen approach-avoidance motivatie toepasbaar is op het niveau van ongeleerde, reflexieve mechanismen (2001). De motivatie berust dus deels op een expliciete wens een staat of beleving wel of niet na te streven en deels op een niveau waarop impliciete beslissingen worden genomen vanuit een bepaalde motivatie. Lewin, Miller, en Mclelland en collega’s conceptualiseren volgens Elliot en Covington allen het approach-avoidance onderscheid in termen van onderliggende valentiegebaseerde processen, in plaats van in termen van zichtbaar gedrag (2001). Concluderend is volgens Elliot, Covington en mijzelf de beste manier om de conceptuele ruimte te bespreken in brede zin, en meer in termen van onderliggende motiverende hoped for, en hope to avoid processen, dan dat ze per se zichtbaar is in het gedrag (2001). In dit onderzoek is daarom gekozen voor het benaderen van de conceptuele ruimte tussen ‘toenaderen en terugtrekken’ op basis van onderliggende motiverende processen. Deze onderliggende processen werden getoetst door de proefpersonen te vragen een zo intuïtief en reflexmatig mogelijk antwoord te geven op de vragen in de abstracte ruimte tussen toenaderen en terugtrekken. Er werd gekeken of
10
de intuïtie van de proefpersonen overeen kwam met de akoestische meting die door middel van de in hoofdstuk 2, 3 en 4 behandelde theorie op empirische wijze tot stand kwam.
§1.6 Conclusie Emotie is essentieel voor ons handelen en is volgens veel filosofen het vertrekpunt van waaruit gehandeld wordt in de wisselwerking met de fysieke en sociale wereld. Om meer inzicht te krijgen in deze wisselwerking is het van belang onderzoek te verrichten naar emotie. Emotie werd in dit onderzoek onderzocht door de term toe te spitsen tot het concept ‘affect’ en basisemoties werden gedefinieerd. Het ‘toenaderen-terugtrekken’ onderscheid is een noodzakelijk te maken onderscheid in affect. Vanuit deze aannames werd een onderzoeksvraag geformuleerd die in hoofdstuk 2 nader wordt toegelicht.
11
Hoofdstuk 2 Overeenkomsten en verschillen in spraak en muziek
§2.1 Inleiding Taal en muziek hebben veel gemeen. Patel beschrijft dit treffend wanneer hij zegt dat taal en muziek zelfs de eigenschappen zijn die ons definiëren als mens omdat ze voorkomen in elke menselijke beschaving, ongeacht welke andere aspecten er nog aanwezig zijn in een cultuur (2008). Dat is waarom er in dit onderzoek voor gekozen is om de twee te vergelijken op gemeenschappelijke gronden. Dit hoofdstuk is gewijd aan het in kaart brengen van de meest belangrijke overeenkomsten en verschillen voor dit onderzoek. Vanuit een cognitief wetenschappelijk oogpunt zijn de overeenkomsten en vooral verschillen tussen taal en muziek zeer interessant. Patel beschrijft dat taal en muziek in ons brein twee systemen zijn die verbazingwekkend gelijke interpretatieve prestaties leveren, waarbij complexe akoestische reeksen worden omgezet in hiërarchische structuren die rijke betekenissen bloot leggen. Echter, het onderwerp heeft al veel langer de interesse filosofen, biologen, dichters, componisten, linguïsten en musicologen (2008). In dit onderzoek wordt hier nogmaals op in gegaan vanuit een interdisciplinaire hoek.
§2.2 Evolutie Volgens Patel (2008) (en mij) is het duidelijk dat gegeven de universaliteit en uniekheid van taal en muziek in onze soort, deze eigenschappen veranderingen in het brein reflecteren die plaats hebben gevonden sinds het afsplitsen van onze lijn van die van onze gemeenschappelijke voorvader zes miljoen jaar geleden. Echter, of het menselijk lichaam en brein gevormd zijn door natuurlijke selectie voor muziek is (nog) een onderwerp van ferme discussie. Spraak, een aspect van taal, kan klanken bevatten die de emotie van de spreker weergeven. Spraak wordt doorgaans beschouwd als meer dan alleen een reeks klanken: spraakgeluid heeft een 12
ritmiek en een melodie die in principe onafhankelijk gekozen worden van de klinkers en medeklinkers in de zin. Het geheel van eigenschappen van een spraakuiting die niet herleid kunnen worden tot de opeenvolging van klinkers en medeklinkers is wat Rietveld en Van Heuven terecht onder ‘prosodie’ verstaan (2009). Charles Darwin beschrijft al in The Descent of Man (1871) dat de expressie van gevoelens door prosodische elementen van spraak zelfs aan de evolutie van menselijke taal vooraf ging. Hij beargumenteerde dat zelfs apen sterke gevoelens in verschillende tonen uitdrukken. Boosheid en ongeduld door lage, - angst en pijn door hoge tonen. Er bestaan soortgelijke indicatoren in instrumentele muziek die de emotie van het stuk weergeven. Op deze indicatoren in spraak en muziek wordt verder ingegaan in hoofdstuk 3 en 4. Er is een belangrijk dispuut op een essentieel gebied van taal wanneer men de oorsprong en de evolutie van taal wil belichten, namelijk het gebied van taalverwerving. Dit dispuut betreft de discussie over hoeveel van de taalverwervingscapaciteit special-purpose is. Ray Jackendoff beschrijft dat veel linguïsten en andere wetenschappers denken dat taal verworven is door general-purposeleren, aangevuld door het vermogen tot sociale interactie (2009). Deze optiek staat recht tegenover de bewering tot aan de vroege jaren 1990 dat er een rijke, aangeboren, taalspecifieke Universele Grammatica moet bestaan (Chomsky, 1965, 1981). Tussen deze extremen in bestaan allerlei tussenliggende oogpunten. Een soortgelijke discussie wordt gevoerd over muziek. Jackendoff (2009) beschrijft als ene extreme Pinker’s (1977) hypothese dat muziek auditory cheesecake is1, en aan de andere kant de extreme van de rijke beweringen voor GTTM2. Daar tussenin zit bijvoorbeeld Patel’s oogpunt dat muziek een sociale constructie is.
1
Een incidentele bijkomstigheid van de evolutionaire ontwikkeling van (waarschijnlijk) taal. Generative Theory of Tonal Music (GTTM): een theorie van Fred Lerdahl en Ray Jackendoff die vergelijkbaar is met theorieën over ‘ingebakken’ linguïstische structuur. 2
13
§2.3 Het brein Vanuit een cognitief oogpunt worden er verschillende vermogens gebruikt voor het verwerven en produceren van taal en muziek. Jackendoff noemt er zeven die in dit verslag kort samengevat worden: ten eerste, taal en muziek vereisen beide een aanzienlijk grote geheugen capaciteit om representaties op te slaan (bijvoorbeeld woorden en melodieën); ten tweede, om de nieuwe stimuli waar te kunnen nemen en te begrijpen, vereisen taal en muziek beide het vermogen om opgeslagen representaties te integreren in het werkgeheugen, door middel van een systeem van regels en structurele schema’s; ten derde, het creëren van verwachtingen over wat gaat komen is betrokken in zowel taal als muziek; ten vierde, het produceren van zowel taal als muziek vereist een nauwkeurige, vrijwillige controle over vocale productie; ten vijfde, het leren van het produceren van zowel taal als muziek is afhankelijk van het vermogen en verlangen om iemand anders’ vocale productie te kunnen imiteren; ten zesde, (in ieder geval) sommige mensen moeten het vermogen hebben om nieuwe items – woorden of melodieën – uit te vinden; en ten zevende, individuen moeten het vermogen hebben om gezamenlijke acties aan te gaan (2009). Het is belangrijk op te merken dat de meeste van de zeven vermogens tevens worden gedeeld met andere domeinen.
§2.4 Theorieën over overeenkomsten en verschillen Het belangrijkste verschil tussen taal en muziek is samen te vatten tot één cruciaal punt. Jackendoff beschrijft dit verschil als de ecologische functies die zij hebben in menselijk leven. De taalkundige ‘zin’, is het schikken tussen geluid en “propositionele” of “conceptuele” gedachten. De adaptieve functie van het overbrengen van propositionele en conceptuele gedachten is duidelijk en hoeft niet verder toegelicht te worden. De “zin” van muziek is het intensiveren van affect met een activiteit. Vele verschillende gebruiken van muziek in traditionele culturen zijn aangedragen als de originele adaptieve functie van muziek. Maar echt bewijs daarvoor is schaars (2009). Deze twee schijnbaar van elkaar verschillende functies zijn met elkaar te integreren in spraak. Wanneer de zin van muziek als het intensiveren van affect gezien wordt, kunnen wij ook 14
beargumenteren dat het “muzikale aspect” in spraak dezelfde functie heeft, namelijk de akoestische indicatoren van affect. De functie van het overbrengen van propositionele en conceptuele gedachten wordt vergroot of efficiënter gemaakt doordat deze versterkt wordt door de akoestische indicatoren van affect in spraak. Er zijn een aantal duidelijke overeenkomsten tussen taal en muziek. Jackendoff beschrijft deze als volgt: geen non-mensen hebben taal of muziek in de menselijke vorm en er zijn geen duidelijke evolutionaire voorgangers voor in non-menselijke primaten; geluid productie is betrokken in zowel taal als muziek; iedere cultuur heeft een lokale variant van taal en een lokale variant van muziek; en in elke cultuur is het mogelijk om taal en muziek te verenigen in liederen (2009). Aan dit rijtje kan nu worden toegevoegd dat zowel taal als muziek een functie kan vervullen in het overbrengen van emotie door middel van akoestische eigenschappen.
§2.5 Conclusie Gegeven de universaliteit en uniekheid van taal en muziek in onze soort, is het aannemelijk dat de eigenschappen taal en muziek veranderingen in het brein reflecteren die plaats hebben gevonden sinds het afsplitsen van onze lijn van die van onze gemeenschappelijke voorvader zes miljoen jaar geleden. Het is waarschijnlijk dat de expressie van affect door prosodische elementen (of akoestische kenmerken) overgebracht kan worden. Hetzelfde geldt voor affect in instrumentele muziek. Echter, de oorsprong en evolutie van taal en muziek is een onderwerp van veel debat. Wanneer we kijken naar taalverwerving hebben we aan de ene kant van de discussie de optiek dat taal verworven wordt door general-purpose leren, aangevuld door het vermogen tot sociale interactie. Aan de andere kant hebben we de bewering dat er een rijke aangeboren taal specifieke Universele Grammatica moet bestaan. Een soortgelijk debat over muziek gaat tussen de hypothese dat muziek auditory cheesecake is, en de rijke beweringen voor GTTM. Daarnaast zijn er gedeelde cognitieve vermogens voor het verwerven en produceren van taal en muziek.
15
Onderzoek naar de primaire ‘bedoeling’ (de oorsprong) van taal en muziek geeft ons geen bevredigend, unaniem antwoord. Wel wordt duidelijk dat de functies van taal en muziek te integreren zijn in spraak. De (adaptieve) functie van het overbrengen van propositionele en conceptuele gedachten wordt vergroot of efficiënter gemaakt doordat deze versterkt wordt door de akoestische indicatoren van affect in spraak. Tevens bestaat er over de overeenkomsten tussen spraak en muziek (veel) meer overeengekomen onderzoek dat in hoofdstuk 3 en 4 verder toegelicht zal worden. Dit onderzoek zal door deze scriptie uitgebreid worden met het toenaderenterugtrekken onderscheid. Het is daarom aannemelijk dat de resultaten van de meting (van de subjectieve beleving en de akoestische meting) van het toenaderen-terugtrekken onderscheid (ongeveer) zullen overeenkomen tussen spraak en muziek door de geïntegreerde functie van spraak die zij delen. Dit leidt dan ook tot de onderzoeksvraag: komt de subjectieve beleving van het toenaderenterugtrekken onderscheid overeen met resultaten van een akoestische meting van het onderscheid in muziek en in spraak?
16
Hoofdstuk 3 Het experiment
§3.1 Inleiding Patel beschrijft dat bij elke wetenschappelijke discussie over emotie en muziek een conceptueel onderscheid noodzakelijk is tussen de uitdrukking van emotie door muziek en de beleving van emotie door de luisteraar. De eerste verwijst naar de affectieve kenmerken van een muziek stuk zoals dat door de luisteraar beoordeeld wordt (de “stemming” die geprojecteerd wordt door de muziek). De laatstgenoemde verwijst naar de luisteraar zijn of haar eigen emotionele reactie door de muziek (2008). Dit onderzoek richt zich op de affectieve kenmerken van de muziek- en spraakfragmenten zoals die door de luisteraar beoordeeld werden. De meeste onderzoeken die gedaan zijn naar de expressie van emotie in muziek hebben de vorm van een groep luisteraars die stukken instrumentale muziek moeten beoordelen door uit een lijst van simpele emotionele categorieën (zoals blijheid, boosheid, angst ) te kiezen welke emotie het best past bij het muziekstuk. Luisteraars kan ook gevraagd worden om een beoordeling te geven op een schaal van hoe sterk het stuk de gekozen emotie uitdrukt (Patel, 2008). Gabrielsson en Lindström beschrijven dat er veel overeenstemming is in dit soort experimenten tussen de luisteraars die de expressieve kwaliteiten in muziek moesten beoordelen in resultaten (2001). Patel (2008) beschrijft een grijpbaar verslag van 104 onderzoeken naar vocale expressie en 41 onderzoeken van muzikale expressie dat Juslin en Laukka (2003) schreven. Zij vonden dat in beide domeinen luisteraars vrij goed waren in het beoordelen van de emotie die door de spreker of muzikant bedoeld werd in een spraak/muziekstuk wanneer de emoties gelimiteerd werden tot vijf basis categorieën: blijheid, verdriet, boosheid, angst, en tederheid. Tevens vonden ze substantiële overlap tussen de akoestische indicatoren die gebruikt werden om basis emoties over te dragen in spraak en muziek. Dit corpus aan onderzoek geeft een stevige fundering voor de bewering dat affect op een vergelijkbare manier overgebracht wordt in spraak en muziek. 17
§3.2 Methode §3.2.1 Ontwerp Proefpersonen moesten in dit onderzoek naar 36 muziekfragmenten en 27 spraakfragmenten luisteren. De fragmenten werden beoordeeld door de proefpersonen op een Likert schaal van 1 tot en met 7. De ene kant van de schaal (1) werd aangeduid met ‘toenaderen’, en de andere kant van de schaal (7) met ‘terugtrekken’. De resultaten van de subjectieve beoordeling van de proefpersonen werden vergeleken met een akoestische meting van diezelfde fragmenten. De indicatoren van affect en de emoties waarop de kenmerken ‘toenaderen’ en ‘terugtrekken’ gemodelleerd zijn, worden verder toegelicht in hoofdstuk 4. In dit hoofdstuk zal het ontwerp van het experiment en het evalueren van de subjectieve beoordeling worden toegelicht.
§3.2.2 Materialen Er werd voor dit experiment gebruik gemaakt van 36 muziekfragmenten en 27 spraakfragmenten. De fragmenten duurden ieder tien seconden met aan het begin en einde 0,5 seconde fade-in en fadeout. De muziekfragmenten zijn rechtstreeks van de website Youtube opgenomen met het programma Audacity. De spraakfragmenten komen uit het Corpus Gesproken Nederlands en zijn met Audacity vervormd tot ze onverstaanbaar werden met een 250 Hz cutoff en -24 dB/oct rolloff zodat de lexicale betekenis de subjectieve beoordeling niet kon beïnvloeden. Na het bewerken van de fragmenten zijn ze als .wav-bestanden afzonderlijk opgeslagen en daarna achter elkaar opgenomen in één bestand met Audacity. In het totale bestand werden eerst de spraakfragmenten afgespeeld omdat de verschillen tussen de spraakfragmenten moeilijker waren waar te nemen. Als er voor was gekozen om te beginnen met de grote verschillen in de muziekfragmenten, zou dit er toe kunnen hebben geleid dat de kleine verschillen in de spraakfragmenten als ‘geen verschil’ zouden worden beoordeeld.
18
De muziekfragmenten De fragmenten zijn rechtstreeks opgenomen van Youtube. Het gebruiken van fragmenten die bestaan uit een simpele toonreeks op een piano, gespeeld in de verschillende condities is overwogen. Er is echter gekozen voor het gebruik van fragmenten uit bestaande muziek. De vraag of toonreeksen als ‘echte muziek’ kunnen worden gezien is namelijk omstreden. Er kan beargumenteert worden dat de emotionele inhoud van de muziek wordt weggegooid wanneer er gekozen wordt voor toonreeksen in plaats van muziek die gecomponeerd is om emoties te versterken. Tenslotte is wat je hoort qua emotie in die toonreeksen dan de interpretatie van een bepaalde emotie van de pianist, die zich daarnaast (zeer waarschijnlijk) niet in die emotionele staat bevindt. De muziekfragmenten werden ingedeeld onder (a) één van de drie verschillende condities van volume (luidst, middel en zachtst), (b) één van de drie condities van tempo (snelst, middel, langzaamst), en (c) één van de drie condities van gemiddelde toonhoogte (hoogst, middel, laagst). Een muziekfragment bevatte een combinatie van een conditie uit (a), (b) en (c)3. Door deze eigenschappen te combineren ontstonden er in totaal 27 condities (zie figuur 3.1). Waarom voor deze specifieke condities gekozen werd, is te lezen in hoofdstuk 4, over de analytische akoestische meting. In dit experiment hoefden de proefpersonen slechts intuïtief te reageren wanneer zij de fragmenten beluisterden. Zij luisterden naar de fragmenten en vulden hun beoordeling ervan in op de Likert schaal. De resultaten werden later vergeleken met de akoestische meting.
Pitch hoog
Volume – hard
Tempo – snel
3
In eerste instantie is er gekozen om de muziekfragmenten in te delen naar (a) volume, (b) tempo en (c) mineur versus majeur. Hier kwamen 18 condities uit voort. Er is toen gekozen om alle condities twee maal te vertegenwoordigen in de muziekfragmenten zodat er in totaal 36 muziekfragmenten waren. Echter, het mineur/majeur onderscheid is cultureel bepaald. Dat wil zeggen, het is vrij zeker dat alleen Westerse mensen muziek met een majeur toonsoort als vrolijk, en muziek met een mineur toonsoort als treurig ervaren. De condities waren daarom niet geschikt voor dit onderzoek, en de eigenschap ‘mineur versus majeur’ is dan ook vervangen met de eigenschap ‘toonhoogte’. Omdat het experiment wel uitgevoerd werd door Westerse proefpersonen is er wel gecontroleerd voor het effect van mineur versus majeur. Er werden 9 fragmenten verwijderd uit de resultaten. De 27 overige muziekfragmenten voldeden aan de eigenschappen van volume, tempo en toonhoogte, en waren ongeveer gelijk verdeeld onder de mineur- en majeurtoonsoort. De proefpersonen hebben dus wel alle 36 fragmenten beoordeeld, maar er werden er maar 27 meegenomen in de resultatenanalyse.
19
Pitch middel
Volume – middel
Tempo – middel
Pitch laag
Volume - zacht
Tempo - langzaam
Figuur 3.1 Condities voor de muziekfragmenten
Om de muziek in de fragmenten goed te isoleren is alle gebruikte muziek instrumentaal. Zo konden akoestische indicatoren in spraak of de lexicale betekenis van spraak de beoordeling van de proefpersonen niet beïnvloeden. Er is gekozen voor fragmenten uit verschillende genres zodat de kans dat proefpersonen beïnvloed werden door aan- of afwezige affiniteit voor een bepaald genre werd geminimaliseerd. De genres kwamen geclusterd voor in het bestand zodat de verschillen tussen de fragmenten van dezelfde genres duidelijker waar te nemen waren.
De spraakfragmenten De spraakfragmenten werden op eenzelfde manier ingedeeld als de muziekfragmenten. Namelijk, onder (a) één van de drie verschillende condities van volume (luidst, middel en zachtst), (b) één van de drie condities van tempo (snelst, middel, langzaamst), en (c) één van de drie condities van gemiddelde toonhoogte (hoogst, middel, laagst) (zie figuur 3.2).
Pitch hoog
Volume – hard
Tempo – snel
Pitch middel
Volume – middel
Tempo – middel
Pitch laag
Volume - zacht
Tempo – langzaam
Figuur 3.2 Condities voor de spraakfragmenten
Talen kunnen verschillen in de manier waarop wij ze als terugtrekkend of toenaderend beschouwen. Het is bijvoorbeeld waarschijnlijk dat menig Nederlander vaker spraakfragmenten in het Spaans met een negatieve emotie zouden beoordelen dan dat Spaanstalige mensen dat bij diezelfde fragmenten zouden doen. Het Spaans wordt namelijk vaker als een meer 20
temperamentvolle taal ervaren dan het Nederlands. Andersom is het mogelijk dat Spaanstalige mensen Nederlandse fragmenten vaker zouden beoordelen met een terugtrekkende beoordeling door het temperament wat zij gewend zijn. De proefpersonen in het experiment zijn daarom allen Nederlandstalig en eentalig opgevoed, en de fragmenten allemaal door Nederlandstalige mensen zonder accent ingesproken. Tenslotte is de man/vrouw verdeling in de spraakfragmenten 14/13, zodat mogelijke verschillen in het ervaren van emotie tussen mannen en vrouwen(-stemmen) minder veel invloed kon uitoefenen op de beoordeling van de proefpersonen.
§3.2.3 Proefpersonen Voor dit experiment is gebruik gemaakt van een totaal van 42 proefpersonen. Om zo veel mogelijk externe factoren uit te sluiten is er gebruik gemaakt van een groep proefpersonen die op hbo of woniveau studeert, of dat heeft gedaan. De proefpersonen waren allemaal volwassen (18 jaar en ouder). Geen van hen had (voor zover bekend) een gehoor- of spraakprobleem. Omdat het in dit onderzoek van uiterst belang was dat de proefpersonen goed in staat waren emotie te kunnen waarnemen, werd er alleen gebruik gemaakt van proefpersonen die geen autistische stoornis hadden. (Voor zover bekend) had geen van de proefpersonen een andere afwijking waardoor een normale waarneming van emotie verstoord zou kunnen zijn. Omdat er mogelijk verschillen bestaan in het ervaren van emotie tussen mannen en vrouwen, is er gekozen voor een gelijke man/vrouw verdeling van proefpersonen in het experiment. Er werd slechts gebruik gemaakt van proefpersonen die zeiden op hun gemak te zijn en geen sterke emoties voelden op het moment van het experiment.
§3.2.4 Procedure Het experiment begon met instructies. De onderzoekster vertelde de proefpersonen wat ze moesten doen en legde het principe van de Likert schaal uit. De proefpersonen werd uitgelegd dat het nadrukkelijk ging om de uitdrukking van het toenaderen-terugtrekken onderscheid door de muziek21
en spraakfragmenten (“komt het fragment ‘naar je toe’, of trekt het zich van je terug”). De proefpersonen werd uitgelegd dat ze zich mochten bedenken over een antwoord zolang het volgende fragment nog niet was gestart. Na de instructie van de onderzoekster werd het experiment gestart. De fragmenten mochten ieder slechts één keer beluisterd worden. De onderzoekster hield toezicht. 19 proefpersonen voerden het experiment op deze wijze uit. 23 proefpersonen voerden het experiment thuis uit door het beluisteren van het fragmentenbestand op de website Soundcloud4 en het digitaal invullen van het vragenformulier. In het complete bestand zat er tussen elk fragment vijf seconde waarin de proefpersoon kon antwoorden. Na vijf fragmenten klonk er een piep, zodat de proefpersonen goed bij konden houden waar ze gebleven waren en eventuele nummering van de fragmenten de beoordeling niet kon beïnvloeden. Het totale bestand duurde 16 minuten. Inclusief de uitleg en de afhandeling koste het 20 minuten om het experiment af te ronden.
4
http://soundcloud.com/gijoelle/taal-en-muziekfragmenten-final
22
Hoofdstuk 4 De akoestische meting van de spraak- en muziekfragmenten
§4.1 Inleiding Het idee dat er een verbinding bestaat tussen vocale en muzikale indicatoren en affect heeft een lange geschiedenis. Kivy beschrijft dat filosofen en theoretici zo ver terug als Plato hebben gespeculeerd dat deel van de expressieve kracht van muziek ligt in akoestische indicatoren die gerelateerd zijn aan de geluiden van emotionele stemmen (2002). Zo een standpunt ligt voor de hand. Namelijk, omdat er een relatie bestaat tussen vocaal affect en muzikale aspecten van spraak zoals toonhoogte, tempo en volume (Patel, 2009). Luisteraars zijn vrij goed in het beoordelen van de affectieve kwaliteit van een stem. Met andere woorden, het beoordelen van de stemming die de stem uitdrukt, onafhankelijk van de lexicale betekenis van het woord. Er is een vrij groot corpus aan onderzoek over de akoestische indicatoren naar vocaal affect (Patel, 2009). Sommige van de vindingen zijn parallel aan de indicatoren die gevonden zijn in het onderzoek naar de perceptie van muzikaal affect (Johnstone & Scherer, 2000). Tempo en gemiddelde toonhoogte zijn bijvoorbeeld belangrijke indicatoren van affect in zowel spraak als muziek beschrijft Patel. Verdrietige stemmen en muzikale passages zijn vaak langzamer en hebben een lagere gemiddelde toonhoogte dan blije stukken (2009). In dit hoofdstuk wordt beschreven hoe de indicatoren voor bepaalde emoties ook gelden als indicatoren voor het toenaderen-terugtrekken onderscheid.
§4.2 Psychofysische en cultuurspecifieke indicatoren van muzikale expressiviteit Het maken van een onderscheid tussen psychofysische en cultuurspecifieke indicatoren van muzikale expressiviteit is noodzakelijk (Balkwill & Thompson, 1999). Wanneer we willen onderzoeken wat de eventuele overeenkomsten tussen spraak en muziek zijn voor de mens als soort, is het van belang dat we ons alleen concentreren op psychofysische indicatoren. Pas dan kunnen we beginnen iets te 23
zeggen over de mens an sich, omdat anders niet duidelijk is wat er aan cultuur toe te schrijven is en wat aan de psychofysische eigenschappen van de mens als soort.
§4.3 Indicatoren van emotie Scherer beschreef in een kritische herziening van het bestaande onderzoek naar vocale affect expressie een samenvatting van de vocale indicatoren van emotionele staten die onderzoekers (inclusief Scherer zelf) gebruiken voor onderzoek naar vocale affect expressie. Tempo, toonhoogte en volume zijn belangrijke indicatoren. Zo is bijvoorbeeld de indicator van een blije stem een hoog volume, en die van een droevige stem een laag volume (1986). Door de hoge mate van overeenstemming over de indicatoren toonhoogte, tempo en volume is er in dit onderzoek voor gekozen om deze eigenschappen te beoordelen in de akoestische meting van de muziek- en spraakfragmenten. Eén van de meest overeengekomen indicatoren van stemming in muziek is het mineur/majeur onderscheid. Echter, de affectieve kwaliteit is volgens Patel alleen maar duidelijk voor mensen die opgegroeid zijn met Westerse muziek en die daarom associaties hebben gevormd tussen deze modes en expressieve inhoud. Bijvoorbeeld door het horen van liedjes waarin woorden met affectieve inhoud gepaard gaan met bepaalde muziek (2008). De muziekfragmenten zijn daarom ongeveer gelijk verdeeld onder een mineur of een majeur toonsoort, maar de mineur/majeur distinctie geldt niet als een indicator voor het toenaderen-terugtrekken onderscheid. In dit onderzoek werd onderzocht of de akoestische meting van de fragmenten overeen kwam met de subjectieve beleving van de proefpersonen. Dit werd gedaan door de proefpersonen de fragmenten te laten beoordelen op een schaal waarop het toenaderen-terugtrekken onderscheid werd neergezet in een conceptuele ruimte. De indicatoren die volgens de akoestische meting als specifiek toenaderend of specifiek terugtrekkend werden gezien, zijn gemodelleerd aan de emoties ‘blijheid’ en ‘verdriet’. Over deze emoties is veel overeenstemming gevonden over de indicatoren ervan in onderzoek van onder andere Scherer (2000). 24
Net als dat de indicatoren psychofysische indicatoren (en dus universeel) moeten zijn, is het bij het kiezen van de emoties waaraan gemodelleerd wordt ook van belang dat ze in iedere cultuur voorkomen. Men kan niet zomaar aannemen dat muzikale affectieve categorieën uniform zijn voor verschillende culturen. Alleen die affectieve categorieën die gedeeld worden door verschillende culturen zijn geschikt voor het aanspreken van de consequentie van de link tussen muzikale indicatoren en muzikale expressiviteit (Patel, 2008) (zie ook paragraaf 1.3).
§4.4 Blijheid en toenaderen versus verdriet en terugtrekken Om het onderscheid te kunnen meten moeten de indicatoren voor ‘toenaderen’ en ‘terugtrekken’ gemodelleerd worden aan bestaande indicatoren voor emoties. De keuze om ‘blijheid’ te koppelen aan ‘toenaderen’ en ‘verdriet’ aan ‘terugtrekken’, komt als volgt tot stand: toenaderen moet logischerwijs gekoppeld worden aan een positieve, hoped-for valentie, en terugtrekken aan een hope-to-avoid, negatieve valentie5. De hoped-for, positieve valentie is het gemakkelijkst te associëren met ‘blijheid’. Dit is immers de emotie die het dichtst staat bij geluk. En geluk is voor het merendeel van de mensheid de meest hoped-for valentie. De hope-to avoid, negatieve valentie is het gemakkelijkst te associëren met ‘verdriet’. Dit is de emotie waar we normaliter het meest ons best voor doen om te voorkomen. De indicatoren voor het onderscheid worden gemodelleerd aan deze basisemoties omdat zij geïndiceerd worden door universele, akoestische indicatoren die lijnrecht tegenover elkaar staan6.
5
Zie voor uitleg van deze begrippen paragraaf 1.5. 6 Een kritische noot is dat de emotie ‘angst’ wellicht nog beter te associëren zou zijn met terugtrekken dan ‘verdriet’. Echter, de indicatoren van ‘angst’ zijn vrijwel dezelfde als die van ‘blijheid’. Ze worden allebei geïndiceerd met een hoge gemiddelde toonhoogte, een hoog volume, en een snel tempo. Er zou met de emoties ‘blijheid’ en ‘angst’, dus geen duidelijk onderscheid gemaakt kunnen worden tussen ‘toenaderen’ en ‘terugtrekken’ omdat ze niet contrasteren.
25
§4.5 Conclusie ‘Blijheid’ en ‘verdriet’ zijn de emoties die voldoen aan de eisen: universele (basis)emotie, universele akoestische indicatoren, en onderling tegenstrijdige indicatoren. In figuur 4.1 wordt weergegeven hoe dit alles zich met elkaar verhoudt.
Volume (1= zachtst,
Tempo (1=
Toonhoogte (1=
Affect onderscheid
7=luidst)
langzaamst, 7=
laagst, 7= hoogst)
(1= toenaderend, 7=
snelst)
terugtrekkend)
Blijheid
7
7
7
1
Verdriet
1
1
1
7
Figuur 4.1 Het verband tussen de basisemoties en het affect
26
Hoofdstuk 5 Resultaten
§5.1 Inleiding Om de vraag te beantwoorden: komt de subjectieve beleving van het toenaderen-terugtrekken onderscheid overeen met resultaten van een akoestische meting van het onderscheid in muziek en in spraak? aan de hand van de behaalde resultaten, is de vraag verdeeld in drie deelvragen. Namelijk, 1. Komt de subjectieve beleving van de spraakfragmenten overeen met de akoestische meting van de spraakfragmenten (§5.2.1)? 2. Komt de subjectieve beleving van de muziekfragmenten overeen met de akoestische meting van de muziekfragmenten (§5.2.2)? 3. Komt de subjectieve beleving van de spraak- en muziekfragmenten overeen met de akoestische meting van de spraak- en muziekfragmenten (§5.2.3)? In de komende paragrafen worden de resultaten weergegeven in scatterplots (of, spreidingsdiagrammen), waarin de eventuele correlatie (of, de sterkte en de richting van een verband tussen twee variabelen) tussen de waarden weergegeven wordt. De correlatie wordt gemeten aan de hand van het Pearson kwadraat correlatie coëfficiënt (of determinatiecoëfficiënt) .
§5.2 Resultatenanalyse §5.2.1 In figuur 5.1 wordt de correlatie tussen de akoestische meting en de subjectieve beleving in de spraakfragmenten weergegeven. Daarmee wordt de vraag beantwoord: komt de subjectieve beleving van de spraakfragmenten overeen met de akoestische meting van de spraakfragmenten?
27
Figuur 5.1 Spraakfragmenten: X-as= gemiddelde subjectieve beleving, y-as= gemiddelde akoestische meting
De
van de subjectieve beleving van de spraakfragmenten en de akoestische meting van de
spraakfragmenten is 0,052. Hierbij wordt benadrukt dat hoe dichter deze waarde bij de 1 ligt, hoe sterker het verband tussen de x-waarden en de y-waarden is, en hoe dichter bij de 0, hoe minder sterk het verband. Er kan hier dus niet gesproken worden van een duidelijke correlatie tussen de akoestische meting en de subjectieve beleving van de spraakfragmenten. Er moet dus geconcludeerd worden dat de subjectieve beleving van de spraakfragmenten en de akoestische beleving van de spraakfragmenten nauwelijks tot niet overeen komen.
§5.2.2
28
In figuur 5.2 wordt de correlatie tussen de akoestische meting en de subjectieve beleving weergegeven in de muziekfragmenten. Daarmee wordt de vraag beantwoord: komt de subjectieve beleving van de muziekfragmenten overeen met de akoestische meting van de muziekfragmenten?
Figuur 6.2 Muziek: X-as= gemiddelde subjectieve beleving, y-as= gemiddelde akoestische meting
De
van de subjectieve beleving van de muziekfragmenten en de akoestische meting van de
muziekfragmenten is 0,018. Er kan hier dus niet gesproken worden van een duidelijke correlatie tussen de akoestische meting en de subjectieve beleving van de muziekfragmenten. Er moet dus geconcludeerd worden dat de subjectieve beleving van de muziekfragmenten en de akoestische meting van de muziekfragmenten nauwelijks tot niet overeenkomen.
§5.2.3 Wanneer we kijken naar de resultaten van de twee voorgaande paragrafen over de correlatie tussen de subjectieve beleving en de akoestische meting van de spraak- en muziekfragmenten apart, kan al
29
met vrij veel zekerheid opgemerkt worden dat er waarschijnlijk (nagenoeg) geen verband bestaat tussen de subjectieve beleving en de akoestische meting van de fragmenten. Om toch met zo veel mogelijk zekerheid de vraag te beantwoorden: komt de subjectieve beleving van de spraak- en muziekfragmenten overeen met de akoestische meting van de spraak- en muziekfragmenten? worden ook deze resultaten samen in een scatterplot weergegeven in figuur 5.3.
Figuur 5.3 Muziek en spraak: X-as= gemiddelde subjectieve beleving, y-as= gemiddelde akoestische meting
Hoe hoger de waarde van
, hoe hoger de waarde van de voorspellingen die gedaan zouden
kunnen worden met de resultaten. Ondanks dat er wel een licht positief lineair verband te zien is aan de Fit Line in de scatterplot, moet er geconcludeerd worden dat met een
van 0,024 de
voorspellingen nauwelijks tot niet betrouwbaar zouden zijn. De subjectieve beleving van de spraak30
en muziekfragmenten komt daarom nauwelijks tot niet overeen met de akoestische meting van de spraak- en muziekfragmenten.
31
Hoofdstuk 6 Discussie
Aan de hand van de antwoorden op de deelvragen in hoofdstuk 5 moet geconcludeerd worden dat de vraag: komt de subjectieve beleving van het toenaderen-terugtrekken onderscheid overeen met resultaten van een akoestische meting van het onderscheid in muziek en in spraak? met ‘zeer waarschijnlijk niet’ beantwoord moet worden. Dit antwoord is in contrast met de hypothese dat: de subjectieve beleving en akoestische meting van de spraakfragmenten overeen zouden komen; de subjectieve beleving en akoestische meting van de muziekfragmenten overeen zouden komen; de resultaten van spraak en muziek (min of meer) overeen zouden komen; er een sterkere correlatie zou zijn in de subjectieve beleving en de akoestische meting in muziek dan in de subjectieve beleving en de akoestische meting van spraak Er kunnen verschillende redenen zijn voor dit contrast. Ten eerste, het is mogelijk en zelfs zeer waarschijnlijk dat de akoestische indicatoren van affect elkaar beïnvloeden. Daarom is er ook gekozen voor het combineren van de drie verschillende condities van volume, tempo en toonhoogte. Patel belicht dit goed wanneer hij benoemt dat meer onderzoek naar hoe de factoren elkaar beïnvloeden nodig is om te onderzoeken hoe de wisselwerking tussen factoren in de perceptie van expressieve kwaliteiten werkt (2008). Het is mogelijk dat de wisselwerking ervoor heeft gezorgd dat het onderscheid niet toetsbaar is op deze wijze. Daarnaast is het mogelijk dat er een indicator mist die mogelijk invloed heeft op de perceptie (of: de subjectieve beleving) van het onderscheid waardoor het onderscheid in dit onderzoek niet meer toetsbaar is. Ten tweede, de indicatoren van ‘blijheid’ en ‘verdriet’ in spraak en muziek uit de literatuur zijn mogelijk niet (op deze wijze) te vertalen naar indicatoren van het toenaderen-terugtrekken onderscheid. Ten derde, toonhoogte gedraagt zich anders in muziek dan dat het zich gedraagt in spraak. Het is mogelijk dat het toenaderen-terugtrekken onderscheid daarom ook anders wordt ervaren in de 32
muziek- dan in de spraakfragmenten. Als dat het geval is, is het logisch dat de correlatiecoëfficiënt daardoor veel lager komt te liggen. Ten vierde, er is wel degelijk sprake van een kleine correlatiecoëfficiënt. Het is mogelijk dat veel duidelijkere verschillen in de fragmenten zouden leiden tot een sterkere correlatie. Er is bijvoorbeeld voor dit onderzoek gebruik gemaakt van het Corpus Gesproken Nederlands waarin weinig emotionele spraak te vinden is. Het gebruiken van fragmenten ingesproken door mensen die daadwerkelijk erg blij of erg verdrietig zijn, zou kunnen leiden tot sterkere correlatie tussen de subjectieve beleving en de akoestische meting. Ten vijfde, het is mogelijk dat de proefpersonen niet goed (genoeg) begrepen wat er van hen verwacht werd of dat zij niet intuïtief genoeg antwoordden. Ten zesde, de condities zijn bepaald door mij en zijn daarom afhankelijk van mijn subjectieve beoordeling van volume, tempo en toonhoogte. Een exactere methode voor het meten van volume, tempo en toonhoogte zou geschikter zijn om duidelijkere resultaten te verkrijgen. Deze waren voor dit onderzoek helaas niet beschikbaar, maar zouden in toekomstig onderzoek zeker gebruikt moeten worden.
Sterke conclusies kunnen helaas niet getrokken worden uit dit onderzoek. Wel is er reden om te geloven dat met dit onderzoek een begin is gemaakt aan een nieuwe dimensie (die van het toenaderen-terugtrekken onderscheid), die toegevoegd kan worden aan het onderzoek naar de relatie van expressie van affect in muziek en/of spraak. Er is na het schrijven van deze scriptie in ieder geval vertrouwen dat het belang ervan is aangetoond. De aanname is dat na het herzien van de methode, verder onderzoek naar vocale en muzikale indicatoren in het toenaderen-terugtrekken onderscheid zijn vruchten af zal werpen.
33
Referenties
Balkwill, L.L., & Thompson, W.F. (1999). A Cross-Cultural Investigation of the Perception of Emotion in Music: Psychophysical and Cultural Cues. Music Perception, 17, 43-64. Cross, I. (2012, September 28). Lecture on the International Study day “Music and Science”. Drift 21. Utrecht, The Netherlands. Darwin, C. (1871). The Descent of Man. http://www.infidels.org/library/historical/charles_darwin/descent_of_man/ . (cited 2 december 2012). Ekman, P. (1999). Basic Emotions. In Dalgleish, T., & Power, M. (eds.), Handbook of Cognition and Emotion (pp. 45-60). Chichester: John Wiley & Sons Ltd. Elliot, A.J., & Covington, M.V. (2001). Approach and Avoidance Motivation. Educational Psychology Review, 13.2, 73-92. Gabrielsson, A., & Lindström, E. (2001). The influence of Musical Structure on Emotional Expression. In Juslin, P.A., & Sloboda, J.A. (eds.), Music and Emotion: Theory and Research (pp. 223-248). Oxford, UK: Oxford University Press. Kivy, P. (2002). Introduction to a Philosophy of Music. Oxford, UK: Oxford University Press. Lerdahl, F., & Jackendoff, R. (1983). A Generative Theory of Tonal Music. Cambridge: MIT Press. Patel, A, D. (2008). Music, Language, and the Brain. Oxford: Oxford University Press. Repko, A.F. (2008). Interdisciplinary Research: Process and Theory. Thousand Oaks: Sage Publication, Inc. Rietveld, A.C.M., & Heuven, van, V.J. (2009). Algemene Fonetiek. Bussum: Uitgeverij Coutinho. Scherer, K.R. (1986). Vocal Affect Expression: A Review and a Model for Future Research. Psychological Bulletin, 99.2, 143-165. Schreuder, M. (2006). Prosodic Processes in Language and Music. Unpublished linguistics dissertation, Rijksuniversiteit Groningen. Jackendoff, R. (2008). Parallells and Nonparallells between language and music. Music Perception, 26.3, 195-204. 34
Johnston, T., & Scherer, K.R. (2000). Vocal Communication of Emotion. In Lewis, M., & HavilandJones, J.M. (Eds.), Handbook of Emotions (2nd ed., pp.220-235). New York: Guilford Press. Mithen, S. (2006). The Singing Neanderthals: The Origins of Music, Language, Mind and Body. Cambridge: Harvard University Press.
Bijlagen Cd-rom met inhoud: -
De vragenlijst inclusief instructies.
-
De resultaten van het experiment in Excell.
-
De originele spraak- en muziekfragmenten.
-
Het gebruikte geluidsbestand bij het experiment.
35