PDF hosted at the Radboud Repository of the Radboud University Nijmegen
The following full text is a publisher's version.
For additional information about this publication click this link. http://hdl.handle.net/2066/105363
Please be advised that this information was generated on 2015-10-03 and may be subject to change.
A9.1 Meten in de spraak- en taalpathologie DR.
T.
RIETVELD
Afdeling Taal en Spraak,
DR.
P.H.H.M .
VAN
ku
Nijmegen
LIESHOUT
Department o f Speech-Language Pathology, University o f Toronto, Canada
INHOUD
1
Inleiding: wat is meten?
3
2
Ruwe en afgeleide data
7
3
Schaaltypen
5)
4
Chaostheorie
12
5
Een overzicht van meettechnieken in de spraak-en taalpathologie
16
R E D A C T I E : dr. H .F.M . Peters, hoofdredacteur | prof. dr. R. Bastiaanse | prof. dr. J. van Borsel | p ro f dr. P.H.O. D ejonckere | drs. K. Jansonius-Schultheiss drs. Sj. van der M eulen | B.J.E. M ondelaers
STEM-SPRAAK-TAALPATHOIOGIE
AFL.
J ( 1 999)
A9 . 1 I
1
Meten in de spraak- en taalpathologie T . R I E T V E L D & P . H . H . M . VAN L I E S H O U T
)
i
Inleiding: wat is meten?
) Het begrip ‘spraakketen’ is onder logopedisten, fonetici en spraak- en taalpathologen zeer bekend. M et dit begrip wordt tot uitdrukking gebracht dat taal en spraak een groot aantal fasen doorlopen tussen enerzijds de 'form ulering’ en 'planning’ van een boodschap door de spreker, en anderzijds het begrip van die boodschap bij de luisteraar (zie het artikel van Maassen & Van Lieshout, ‘Cognitieve architectuur van taal en spraak' (A2.1)). Nadat de boodschap is geformuleerd worden spiercommando’s vanuit het centrale zenuwstelsel ge ïnitieerd waarmee de luchtstroom op gang wordt gebracht, het laryngeale sys teem een setting krijgt die al dan niet leidt tot fonatie en de articulatoren in beweging worden gebracht. Bij de luisteraar (maar ook bij de spreker) verwer ken het auditief systeem en het centrale zenuwstelsel ten slotte de geluidsgol ven op een dusdanige wijze dat de luisteraar de boodschap van de spreker begrijpt. In elk van die stadia en substadia kunnen zich stoornissen voordoen; om die reden hebben de clinicus en /of de onderzoeker vaak reden om m etin gen uit te voeren naar het verloop van de processen in een o f meer van de bovengenoemde stadia. Het woord meting suggereert het gebruik van instrumenten en directe toegang tot het stadium o f proces in kwestie; dat is echter niet noodzakelijk en veelal zelfs onmogelijk. Wat is meten? M eten wordt (Stevens, 1951) gedefinieerd als het toekennen van getallen aan objecten of gebeurtenissen volgens regels. De verzameling van die getallen (of symbolen) wordt een schaal genoemd. Wanneer een luiste raar een oordeel uitspreekt over het spraakgeluid van een spreker, en zegt: 'Deze spreker vind ik m atig nasaal’, dan is een m eting uitgevoerd, en wel door een menselijke waarnemer; de eerste vraag die we kunnen stellen is o f de luisSTEM-SPRAAK-TAALPATHOLOGIE
ABL. 7 ( l 9 9 9 )
A9.1 I 3
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
teraar iets wil zeggen over de productie van de spreker, o f over het effect in de waarneming. We laten dat hier in het midden. De waarnemer heeft misschien van een schaal gebruikgemaakt die loopt van o (niet nasaal) via 3 (matig nasaal) tot 6 (zeer nasaal). Wat zijn de regels die de luisteraar hanteert? Hij gebruikt natuurlijke getallen zodanig dat een hogere getalwaarde een hogere mate van nasaliteit weergeeft dan een lagere getalwaarde; een gelijke mate van nasaliteit wordt weergegeven door een gelijk getal. Deze regels zijn specifiek voor een bepaald individu, waardoor een gelijk getal voor nasaliteit bij twee verschil lende luisteraars niet hoeft te betekenen dat dit getal met een gelijke waarge nomen mate van nasaliteit correspondeert. Instrumentele metingen, bijvoor beeld de grondfrequentie gemeten in Hz, worden natuurlijk ook door regels bepaald (Fo = 1/T0), waarbij een grondfrequentie van 10 1 Hz 1 Hz hoger is dan een grondfrequentie van 100 Hz; negatieve waarden zijn voor deze schaal niet gedefinieerd. In dit geval zijn echter in principe alle m ogelijke waarden groter dan o mogelijk: 100 Hz - 100,32 Hz enzovoort. D it soort regels zijn gedefi nieerd op basis van algemeen geaccepteerde dan wel gestandaardiseerde (veel al fysische) principes en kunnen daarom veelal wel over individuele waarne m ingen heen vergeleken worden. Dus, als onderzoeker A bij een bepaalde toon een waarde vindt van 100 Hz zal dezelfde toon bij onderzoeker B ook een waarde van 100 Hz moeten opleveren, daarbij natuurlijk uitgaande van de ver onderstelling dat hij geen m eetfout maakt en van apparatuur van dezelfde kwaliteit gebruikmaakt. In de spraak- en taalpathologie, maar ook in de psychologie natuurlijk, maakt men vaak een onderscheid tussen enerzijds instrumentele en anderzijds perceptieve (ook wel: subjectieve] metingen. De term 'subjectief klinkt niet al te vertrou wenwekkend; voor dat gebrek aan vertrouwen is echter niet altijd een reden aanwezig. De oordelen van luisteraars kunnen zeer consistent en betrouwbaar zijn, en instrumentele m etingen zijn dat lang niet altijd (zo is de kans erg groot dat verschillende typen toonhoogtemeters verschillende waarden geven van de grondffequentie van een spraaksignaal). Het feit dat oordelen consis tent en zelfs betrouwbaar zijn, w il natuurlijk nog niet zeggen dat zij meten wat zij pretenderen te meten (dit vaak in tegenstelling tot instrumentele metingen): hier doet zich het probleem van de validiteit van metingen voor. Vooral als het gaat om metingen op het niveau waar het m enselijk gehoor niet op ingesteld is (en zelfs met training maar beperkt op ingesteld kan worden) doet zich dit probleem voor. Denk aan het vele onderzoek naar spreekfouten dat veelal uitstluitend op luisteroordelen is gebaseerd. Fysiologisch onderzoek (bijv. M owrey & MacKay, 1990) toont aan dat dit soort oordelen weleens ACJ.1 I 4
STEM-SPRAAK-TAALPATHOLOGIE
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
behoorlijk verwijderd kan zijn van de daadwerkelijke onderliggende mecha nismen en fenomenen. Consistentie in luisteraarsoordelen wil vaak alleen maar zeggen 'consistentie in de beperkingen die aan het m enselijk gehoor ten grondslag liggen’. Je zou dit enigzins kunnen vergelijken met het feit dat de meeste mensen altijd weer (consistent en betrouwbaar) in de perceptuele illu sies trappen die zo populair zijn in attractieparken, ook al is er fysiek voldoen de informatie voorhanden om de am biguïteit o f m isleiding op te lossen. Wij zien/horen wat ons brein m et een behoorlijke dosis 'sophisticated guessing ons vertelt wat er aan de hand is. Ondanks de altijd weer optredende onzekerheid over de validiteit van m etin gen, blijft het van belang om vast te stellen o f m etingen consistent en betrouwbaar zijn. In dit verband moeten we een duidelijk onderscheid maken tussen twee begrippen die - zeker in de context van perceptieve oordelen vaak door elkaar gehaald worden. Laten we daartoe een voorbeeld geven. Stel, drie luisteraars hebben vier stemmen beoordeeld op een schaal van o (niet na saal) tot en met 6 (zeer nasaal): stemmen:
A
B
C
1
z
3
4
2 3
3 5
4 5
5 7
4
1 2
(luisteraars]
3
Wat zien we hier? We zien hier drie beoordelaars (luisteraars) A, B en C die het niet met elkaar eens zijn: hun beoordelaarsovereenkomst (‘agreement’) is gering voor wat betreft de absolute waarde die zij aan een bepaalde stem qua nasalitei: toekennen. Ze zijn het wel eens over de rangorde waarin de stemmen moeten worden gebracht: de interbeoordelaars-betrouwbaarheid ('interju d ge reliability’) is groot. Kortom: beoordelaarsovereenkomst en betrouw baarheid dekken verschillende begrippen (zie Rietveld & Van Hout, 1993). In het ene geval is een geringe beoordelaarsovereenkomst zeer ongewenst, b ij voorbeeld wanneer het erom gaat om te beoordelen o f de stemmen van sollici tanten geschikt zijn voor een functie met een sterke stembelasting, in het andere geval is dat veel minder het geval, en is een hoge betrouwbaarheid vol doende. Onze nasaliteitsoordelen zijn daarvan een goed voorbeeld. Wanneer we bijvoorbeeld nasaliteitsoordelen w illen vergelijken m et instrumenteel ver kregen ‘nasalance scores’, en ons willen beperken tot de mate waarin de beide STEM-SPRAAK-TAALPATHOLOGIE
AFL. J ( l p p p )
A9. 1 1 5
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
typen m etingen op gelijke wijze variëren (ofwel in statistische zin met elkaar 'correleren'), dan is een hoge betrouwbaarheid van de perceptieve scores vaak voldoende. Directe toegang tot het te meten proces is zoals al vermeld vaak niet mogelijk. Om die reden is het van belang een onderscheid te maken tussen direct en indi rect meten. Als we een luisteraar vragen op een knop te drukken zodra hij een
bepaalde stim ulus hoort (bijv. een bepaalde syllabe in een woord), dan zijn we bezig een m eting u it te voeren in de fase van de decodering. Er wordt evenwel niet gemeten aan bepaalde delen van de hersenen, maar er wordt een reactie tijd gemeten; de lengte van deze reactietijd kan de onderzoeker een idee geven over verschillen in verwerkingstijd bij de detectie van verschillende typen sti m uli en daarmee inzicht bieden in de wijze waarop menselijke luisteraars spraaksignalen verwerken. Dit inzicht is gebaseerd op het gehanteerde spraakperceptie-model waarmee gepoogd wordt iets zinnigs te zeggen over de theo retische volgorde en voortgang van processen. Alternatieve modellen over dit soort processen kunnen leiden tot uiteenlopende interpretaties van verschil len in verwerkingstijd. Een dergelijke m eting is een 'indirecte' meting, want echt toegang tot de psychische en fysiologische processen bij het spraakverstaan bieden ze niet. Op basis van vooronderstellingen zoals gedefinieerd bin nen het theoretisch kader van het m odel - bijvoorbeeld: als de reactietijd lang is, dan vraagt de stimulus een ingewikkelder psychische bewerking dan wan neer de reactietijd kort is - kan de onderzoeker verschillen tussen de benodig de ‘mentale' bewerking veronderstellen bij stimuli. Een voorbeeld van een directe m eting lijken akoestische m etingen te leveren; zo zal een klinker die 100 ms duurt als de reflectie van een snellere articulatie kunnen worden gezien dan eenzelfde klinker met een duur van 200 ms. M et opzet schreven we ‘akoes tische metingen lijken direct'. In een bepaald opzicht zijn ze niet direct. Zo kunnen aan een langere akoestische duur verschillende processen ten grond slag liggen. Een fraai voorbeeld vinden we in de lengte van beklemtoonde klinkers, en klinkers aan het einde van een zin. In beide gevallen vinden we klinkerverlenging. Wat de akoestische m eting echter niet verraadt is dat bij beklem toning de kaak verder zakt dan ‘normaal', terwijl aan het einde van een zin de beweging van de kaak vertraagd wordt: articulatorische verschijnselen van verschillende aard kunnen blijkbaar tot vergelijkbare akoestische effecten leiden. Om die reden zullen vele metingen bij nader inzien toch indirecte m etingen blijken te zijn, die alleen op basis van vooronderstellingen o f andere gegevens interpreteerbaar zijn.
A9 . 1 I 6
STEM-SPRAAK-TAALPATHOLOGIE
Registreren aan stem, spraak en taal j Meten in de spraak- en taalpathologie
z
Ruwe en afgeleide data
We moeten nog een ander verschil introduceren: het verschil tussen ruwe, postprocessed (nabewerkte) en afgeleide data. Ruwe data zijn bijvoorbeeld posities van
gemarkeerde punten op de tong in een X/Y-vlak; afgeleide data zijn de trajec ten die deze punten afleggen (a x ) en de snelheden (a x f At) en versnellingen die de gemeten posities vertonen als functie van de tijd (wanneer de tong in bewe gin g is). Postprocessed data vorm en een categorie hiertussenin. Ruwe data ver tonen vaak een nare eigenschap: ze laten variaties zien die soms alleen maar het gevolg zijn van fouten van het meetinstrument, o f van niet relevant geach te fluctuaties in het te meten proces. D it laatste punt echter wordt in meer recente theoretische ontwikkelingen tegengesproken. De meest markante theorie in deze is chaostheorie. Een korte bespreking van deze theorie en haar m ogelijke toepassingen volgt verderop in dit hoofdstuk (paragraaf 4). Een mooi voorbeeld van de wens om data te postprocessen leveren de waarden van de grondfrequentie. Wanneer m en kijkt naar het verloop van de grondfrequentie als functie van de tijd (figuur 1, bovenste paneel) dan ziet m en soms eigenaardige, m oeilijk verklaarbare plotselinge sprongen. Inderdaad, in een reeks van bijvoorbeeld 100 - 120 - 130 - 260 - 140 - 150 Hz lijkt de waarde van 260 Hz een foutieve m eting (hier: een octaafsprong). Door de ruwe data te postprocessen - bijvoorbeeld door elke waarde te vervangen door de mediaan van een venster waarin de betreffende waarde en die van zijn voorganger en opvolger (een zogenaamde derde orde-mediaanfilter) - kunnen sterke afwijkingen wor den weggefilterd. In ons geval zou de volgende reeks resulteren: 120 - 130 - 140 - 150 Hz (de samples aan de randen kunnen niet meedoen); het resultaat is een reeks die er wat vertrouwenwekkender uitziet. De grootte van het aantal samples waarvan de mediaan wordt genomen (men spreekt van 'mediaanorde’) bepaalt de mate waarin de uitbijters na filtering nog zichtbaar blijven. Een mediaanorde van 3 is onvoldoende om twee successieve uitbijters weg te wer ken, zoals uit de figuur blijkt (zie het middelste paneel). Het weglaten van cijfers achter de komm a kan ook als een soort postproces sing worden gezien (bijna niem and zal bijvoorbeeld waarden van de grondfre quentie met een precisie van 2 cijfers achter de komma weergeven). Ook perceptieve scores worden vaak pas na postprocessing verder gebruikt; denk in dit verband aan de veelgebruikte procedure om oordelen van luisteraars te m id*
delen. M iddelen over ruwe data van een tijdreeks van herhaalde stim uli is een veelgebruikte m anier om zogenaamde random (hier bedoeld als synoniem met 'niet relevante') informatie weg te werken. Deze methode wordt veel gebruik bij fysiologische data, bijvoorbeeld in elektromyografisch STEM-SPRAAK-TAALPATHOLOGIE
AF
1
. 7 [1999]
(em g)
A9 . I \ 7
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
1
300 0
........... I "
1
1
1
!
1
1
00 .
0
0
1 on gefilterd 0
(GtgfflD ($> CBD COOOOQ3$> O
O O
0
300
0
300
0
0 ,1
0
0,2
1 0,3
1 0,4
"1
1
1 0 ,1
1 0,2
1 0,3
1 0,4
" 1
1
1
I
0
o
1 0,5
1
0,6
tijd (s)
►
0 1 0,7
oo
1 0,8
1 0,9
1
m ed iaan ord e = 3
1 0,5
0,6
1
tijd (s)
►
1
1
1 0,7
1
1 0,8
1
0,9
1
1 1 m ed iaan ord e = 5
1
1
1
1
1
1
1
1
1
0 ,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
tijd (s)
>■
1
F ig u u r 1 I O ngefilterde Fo-w aarden (bovenste paneel) en de effecten van postprocessing door m iddel van m ediaanfiltering van de derde respectievelijk de vijfde orde (met dank aan B. Cranen, KU N ijm egen).
A 9 .1 I 8
STEM-SPRAAK-TAAL PATHOLOGIE
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
onderzoek, waarbij het middelen van spieractiviteit van herhaalde gelijksoor tige bewegingen moet leiden tot een soort prototypische EMG-activiteit (= patroon] voor die betreffende beweging. Ook de heden ten dage populaire brain im aging technieken zoals
pet
en
m ri
(zie onder) maken nog steeds
dankbaar gebruik van deze bewerkingstechniek bij het zoeken naar prototypi sche (= gemiddelde) hersenactiviteit voor een bepaalde taak (Lauter, 1997). Ech ter, het domweg middelen van tijdreeksen die een zelfde uiting betreffen om een soort patroon te generen, kan problematisch zijn en leiden tot een verte kend beeld van de werkelijk relevante variaties. Complexere technieken, die in dit kader verder onbesproken blijven, lijken nodig om d it soort 'fouten' op te vangen (Lucero, M unhall, Gracco & Ramsay, 1 997).
3
Schaaltypen
We moeten nog een verschil introduceren tussen typen m etingen en de daar uit resulterende data. Wanneer wij een uiting transcriberen, en bijvoorbeeld een genasaleerde klinker waarnemen, dan zal dat worden weergegeven door m iddel van een transcriptiesymbooi, bijvoorbeeld [a]. De m eting is van catego riale aard: er wordt al dan niet nasaliteit waargenomen; men spreekt dan van een m eting op een nominale schaal. Op een nominale schaal kunnen we identi teit en verschil tussen de gemeten objecten aflezen: de [a] is een andere klinker dan de [a]. Perceptieve oordelen die op schalen zijn weergegeven - bijvoor beeld 'mate waarin spreker Standaard Nederlands spreekt’ - op een schaal van 1 tot 7 - worden soms geacht van ordinaal niveau te zijn, omdat alleen de volg orde van de scores betekenis heeft: ‘5 ’ is meer dan '4’, maar m en durft niet te zeggen dat het verschil (interval) tussen 5 en 4 gelijk is aan dat tussen 1 en 2; verder heeft het o-punt niet direct betekenis. Een ander voorbeeld van een schaal die in een bepaald dom ein alleen van ordinale aard is: we kunnen niet zeggen dat het verschil tussen 100 Hz en 105 Hz 'subjectief gelijk is aan het verschil tussen 300 Hz en 305 Hz. Bij schalen van een intervalniveau hebben bui ten de rangorde (en identiteit en verschil) van de scores ook de verschillen tus sen de intervallen betekenis (maar niet het nulpunt). Vele metingen leveren scores op die in het grijze gebied tussen de ordinale en intervalschaal liggen. Voor praktische doeleinden m ag m en deze schalen echter ook als 'intervalschalen’ opvatten (hierover bestaat onder statistici en schaaltheoretici verschil ^
van opvatting, zie bijv. Borgotta & Bornstedt, 1981 en Townsend & Ashby, 1984). Een m eting met een nasometer, die 'nasalance scores’ van o tot 100% levert, is een m eting op een ratioschaal: het nulpunt heeft betekenis, en verder hebben de ratio’s en verschillen tussen, en natuurlijk de rangorde van de scoSTEM-SPRAAK-TAALPATHOLOGIE
AFL. 7 ( 1 9 9 9 )
A9.1 | 9
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
res een betekenis. Buiten het dom ein van de fysische m etingen (o ms o f o dB hebben inderdaad echt betekenis) komen we ratioschalen niet vaak tegen. Het niveau waarop wordt gemeten is bepalend voor de mathematische bewerkin gen die op de data kunnen worden uitgevoerd, en daarmee ook voor de statis tische technieken die kunnen worden toegepast. Zo is het gemiddelde van ordinale data geen zinvolle maat; immers, bij het bepalen van het gemiddelde m aken we gebruik van de veronderstelling dat de verschillen tussen opeenvol gende getallen overal even groot zijn. Bij een echt ordinale schaal is dat niet het geval. Kenmerken van schalen worden goed samengevat door de operaties die op de vier schaaltypen m ogen worden uitgevoerd: nominale schaal: elke een-op-een substitutie van de schaalwaarden is toege
staan, zolang de categorisatie van alle objecten als 'gelijk' dan wel Ver schillend' gewaarborgd blijft ordinale schaal: elke monotone transformatie is toegestaan, dat is een trans
formatie die de volgorde van de objecten onaangetast laat. Een transfor matie als ƒ (x) = a x x 2 is niet toegestaan; hierbij staat a voor een constante intervalschaal: de lineaire transformatie ƒ [x] = a x x + b is toegestaan. Scores op
een intervalschaal mogen m et een constante worden vermenigvuldigd, en daar m ag ook nog een constante bijgeteld worden; het nulpunt is immers zonder betekenis -
ratioschaal: alleen de transformatie ƒ [x] = a x x is toegestaan; toevoeging van
een constante zou het nulpunt laten verdwijnen. Voor de beschrijving van vele verschijnselen kan niet worden volstaan met een enkele schaal. Denk bijvoorbeeld aan de akoestische beschrijving van een klin ker. De golfvorm van een klinker is een ingewikkeld patroon waarvan de ken merken - na een spectrale analyse - worden samengevat door minstens twee kengetallen: de waarden van de eerste en tweede formant. We hebben hier te maken met een multivariate m eting (in dit geval gaat het om een bivariate repre sentatie). Het ingewikkelde patroon van het spectrum is daartoe geparametriseerd in twee waarden: de F x en de F 2. Dit zijn waarden die voor de waarneming van klinkers van groot belang zijn gebleken. Parametrisering komt neer op de invoering van schalen waarop kengetallen kunnen worden gelokaliseerd waar mee een complex beeld kan worden gereduceerd tot een aantal saillante ken merken. Hoe meer schalen, hoe dichter de beschrijving het origineel nadert, maar uiteraard ook hoe complexer het beeld. Andere ingewikkelde patronen zijn minder makkelijk te parametriseren dan klinkerspectra, denk bijvoorbeeld aan de vorm van stembandpulsen; zie daarvoor het onderstaande voorbeeld.
A p .l | 1 0
STEM-SPRAAK-TAALPATHOLOGIE
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
time (ms)
F ig u u r 2 | De vorm van een stem bandpuls (boven) en zijn afgeleide (onder) (met dank aan B. Cranen,
ku
N ijm egen).
In figuur 2 zien we onder elkaar de vorm van de stembandpuls (het verloop in de tijd van de hoeveelheid lucht tussen de stembanden, de zogenaamde glottal flow, uitgedrukt in cm3/s) en de eerste afgeleide van die functie. De eerste afge leide - in ons geval dU/dt - is een veelgebruikte stap bij de parametrisering van complexe golfvormen. Hij geeft in feite de mate van verandering in de luchtstroom per tijdseenheid weer. Zo zien we dat op het m om ent waarop de luchtstroom zijn m axim um heeft bereikt, de eerste afgeleide o is; op dat moment verandert er niets in de luchtstroom. Op het m oment waarop de ver andering maximaal is, is ook de eerste afgeleide maximaal (positief als de ver andering positief is, negatief wanneer de verandering negatief is). Bij de para m etrisering van de stembandpuls wordt vaak gebruikgem aakt van de functie van de eerste afgeleide. Zo neemt m en aan dat de excitatie plaatsvindt als de eerste afgeleide maximaal negatief is, punt C in onze figuur. De asymmetrie van de stembandpuls kan bijvoorbeeld worden bepaald door de duur van de beweging van de stembanden naar sluiting (PC) te delen door de duur van de puls (bijv. het tijdsinterval OC). Het openingsquotiënt (ratio van open en gesloten deel van de stembandpuls) wordt geschat door OQ_= OC/BC. Het zal duidelijk zijn dat sommige parameters een grotere zekerheid bieden dan andere. Zo is punt C eenduidig te bepalen, voor het interval OC is dat al wat moeilijker omdat O niet m akkelijk vast te leggen is; immers, waar begint de STEM-SPRAAK-TAALPATHOLOGIE
AFL. 7 ( 1 9 9 9 )
A 9 .1 | x i
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
glottal flow echt door te zetten? Kengetallen als hier genoemd, en die verkre gen zijn na parametrisering van een ingewikkeld verschijnsel, stellen de onderzoeker in staat om het gedrag van de stembanden te relateren aan ande re verschijnselen, zoals kenmerken van het stem geluid in de perceptie o f in het spectrum van het afgestraalde geluid. Een groot aantal problemen bij het meten van verschijnselen in spraak en taal wordt veroorzaakt door het feit dat die verschijnselen vaak geen een-op-een relaties met elkaar vertonen. Zo is het m ogelijk om tijdens de productie van een [a] een relatief grote velum opening vast te stellen, terwijl het spraaksignaal niet nasaal klinkt. Een even grote opening bij de [i] kan daarentegen wel tot waargenomen nasaliteit leiden. Voorbeelden van dit type zijn er vele. Zo blijkt waargenomen spreektempo niet alleen samen te hangen met gerealiseerd spreektempo, maar vooral met de lengte van pauzes.
4
Chaostheorie
In dit artikel hebben we tot nog toe vooral gesproken over metingen vanuit een vrij klassiek standpunt zoals dit al sinds jaar en dag wordt verkondigd en gepraktiseerd. D it standpunt over meten kan men eenvoudig als volgt weerge ven: een signaal (S) op een bepaald tijdstip t is een functie van een bepaalde specifieke gebeurtenis (A) waarover we meer willen weten en een combinatie van random gebeurtenissen (R van ruis), die ons eigenlijk niet interesseert. Kortom, S (t) = A (t) + R (t) (meestal gemodelleerd als een proces met constante statistische eigenschappen, dus geen functie van de tijd). Voor ingenieurs is dit een logisch standpunt. Immers, bij het aansturen van een bepaald proces wil je liefst een zo zuiver m ogelijk signaal zonder ruis, zodat je een duidelijke relatie kunt leggen tussen input (aansturing) en output (gedrag van het systeem dat aangestuurd wordt). Echter, de toepassing van dit principe bij het meten van signalen in biologische systemen is in zekere zin minder voor de hand liggend. Variaties (de R-factor in onze bovenstaande simpele vergelijking) in biologi sche systemen kom t voort uit het natuurlijk functioneren van dergelijke sys temen en het is maar zeer de vraag in hoeverre deze variaties als random (in de zin van niet-informatief) moeten worden gezien. In chaostheorie (ook wel bekend onder de namen 'Com plex Systems theory’ en ‘Nonlinear Dynamical Systems theory’) is dit nu ju ist een punt waaraan veel aandacht wordt besteed. Daar waar volgens een klassiek standpunt quasi-random variaties als onge wenste ruis w ordt gezien en derhalve met alle (technische en statistische) m id delen moet worden bestreden, zijn in chaostheorie dit soort variaties nu ju ist A p .l I
12
STEM-SPRAAK-TAALPATHOLOGIE
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
het essentiële kenmerk van een systeem. Essentieel, omdat via deze fluctuaties het systeem in staat is om nieuwe wegen te zoeken in het volbrengen van een bepaalde taak. De ruimte ontbreekt hier om uitgebreid op deze theorie in te gaan, maar wellicht dat een korte en noodzakelijkerwijs vereenvoudigde ken schets in eerste instantie kan volstaan. Allereerst is het belangrijk om een typische m isvatting over chaostheorie weg te nemen, nam elijk dat zij zich uitsluitend bezighoudt met onvoorspelbaar gedrag. Systemen die zich in een stadium van chaos bevinden, zijn weliswaar veelal onvoorspelbaar, maar zeker niet per definitie willekeurig. Er is nam elijk sprake van een complexe structuur waarin zich afhankelijk van de ingangscondities verschillende vormen van gedrag kunnen ontwikkelen. Soms is dit gedrag heel stabiel, dan weer kan het zeer variabel in de zin van nagenoeg onvoorspelbaar zijn. Het klimaatsysteem is een bekend voorbeeld van een der gelijk complex systeem. De ene keer toont het zich zeer stabiel (hittegolf), dan weer is het zeer veranderlijk, waarbij kleine verschillen in ingangscondities (de bekende vleugelslag van de vlinder in Zuid-Amerika) kunnen leiden tot instabiliteiten in de vorm van snel veranderlijke weerpatronen. Het klimaat is dus in zekere zin een chaotisch systeem, maar niet random in de zin van willekeu rig. Chaostheorie nu probeert al dit soort variaties in gedrag te verklaren. Het zoekt als het ware naar de orde in ogenschijnlijke wanorde en naar de onderliggende algemene principes waarmee fluctuaties in tijd kunnen worden ver klaard. Een en ander moge wellicht duidelijk worden in figuur 3 (vrij naar Kelso, 1988), waarin de relatie tussen complexe systemen, het ontstaan van orde door middel van zelforganisatie en het daaruit resulterende complexe gedrag staat afgebeeld. Het voorbeeld van het spraakproductiesysteem is in dit kader wellicht meer ‘sprekend’ dan het klimaat. Het spraakproductiesysteem is zeer complex in haar veelheid aan vrijheidsgraden op allerlei niveaus (neuraal, musculair, kinematisch enz.). Via bepaalde mechanismen ontstaan grotere verbanden (ook wel coördinatieve structuren o f synergieën genoemd), waar mee het aantal vrijheidsgraden gereduceerd en onder controle gebracht kan worden. Desondanks o f ju ist daarom kunnen dergelijke geordende systemen allerlei vormen van complex gedrag voortbrengen, zoals zich dat in de afzon derlijke bewegingen van lippen, kaak, tong enzovoort, voordoet, en waarmee een zekere mate van flexibiliteit gewaarborgd is. Immers, onder bepaalde omstandigheden kan het nodig zijn dat de bovenlip compenseert voor beper kingen die vanuit een bepaalde natuurlijke spraakcontext aan de onderlipbeweging worden opgelegd. Dergelijke compensatiemogelijkheden zijn experi menteel meerdere malen aangetoond (zie Gracco, 19517, voor een discussie van STEM-SPRAAK-TAALPATHOLOGIE
AFL. 7 ( 1 9 9 9 }
A 9 .1 I 1 3
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
dit en gerelateerd onderzoek]. M ogelijke onderzoeksstrategieën om dergelijke systemen en de onderliggende mechanismen te leren begrijpen worden onderaan de figuur aangegeven. COM PLEX SYSTEEM
LAGERE ORDE D IM EN SIES
COMPLEX GEDRAG
Reductie van
Groot aantal ruizige, vaak niet-homogene elementen
(multi)Stabiliteit,
vrij heidsgraden
r
r
door non-
y
lineaire
deterministische chaos, variabiliteit
koppelingen
Voorbeeld
Y
Spraakproductiesysteem
Koppeling tussen articulatoren (cf. Van Lieshout, Hubtijn, Alfonso & Peters, 1997)
Bewegingen lippen, kaak & tong, stembanden etc.
M echanismen waarmee
M echanismen waarmee
het ontstaan van orde
complex gedrag verklaard
in complexe systemen
kan worden
verklaard kan worden Topics voor onderzoek
F ig u u r 3
Schem a van complexe system en, structuur door zelforganisatie en resulterend
com plex gedrag, in clu sie f m ogelijke onderzoeksstrategieën (naar Kelso, 15188).
D it alles wil niet zeggen dat er niet zoiets als echte random variatie bestaat. In tegendeel, random variatie o f ruis kom t overal voor, maar alleen in chaostheo rie heeft ruis een betekenis. Het is in feite een mechanisme waarmee bestaande stabiliteiten onder druk worden gezet en mogelijkheden voor nieuwe oplos singen bereikbaar worden. Het is m et andere woorden een mechanisme voor flexibiliteit. Zonder deze flexibiliteit zou het systeem rigide en dus keurig voorspelbaar zijn. Goed wellicht voor bepaalde systemen, maar niet voor syste m en die zich voortdurend m oeten aanpassen aan een veranderende context, zoals dat bij biologische en veel andere systemen het geval is. Chaostheorie gaat dus over zowel stabiliteit (= niet rigiditeit!) en instabiliteit (= flexibiliteit) als zijnde inherente eigenschappen van een adapterend (en in die zin dus ook lerend) systeem. Zoals gezegd hebben ingangscondities een sterke invloed op systemen in een chaotisch stadium, maar veel systemen verkeren vaak in een stadium dichtbij, maar niet in chaos ('at the edge o f stability and chaos’). Op deze m anier kan het systeem tegelijkertijd stabiel en flexibel zijn. Meer in het A 9 .1 I 1 4
STEM-SPRAAK-TAALPATHOLOGIE
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
algemeen kunnen systemen allerlei gradaties vertonen tussen monostabiel (de perfecte klok) en chaotisch gedrag. Onder bepaalde omstandigheden kan een systeem zich zelfs keurig (in de zin van voorspelbaar) lineair gedragen. Maar, alleen in het variëren van ingangscondities en dus in het introduceren van i
variatie kunnen we erachter komen o f dit slechts een klein deel van de werke lijke eigenschappen iaat zien. H et interessante van chaostheorie met haar wis kundige/fysische achtergrond en benadering is dat al deze gradaties gemodel leerd kunnen worden vanuit de eigenschappen van een enkel systeem door simpelweg bepaalde parameters te variëren. Een mooi voorbeeld van deze benadering is beschreven in een recent en heel toegankelijk artikel van Kauffman en Sabelli (1998). Zij laten zien hoe aan de hand van een eenvoudige ver gelijking met een inherente feedbackloop (At = At +g sin (Aj) een scala aan ver schillende daadwerkelijk ook voorkomende systeemgedragingen kan worden gemodelleerd. Dergelijke feedbackloops vormen overigens een cruciaal ele ment in non-lineaire dynamische systemen. Een andere belangrijke eigen schap van dit soort systemen is zoals reeds genoemd zelforganisatie, hetgeen zoveel wil zeggen als dat het gedrag van het systeem bepaald wordt door de interactie tussen de acties van de bijdragende componenten. Door deze inter actie o f koppeling onstaat een orde van lagere dimensies waarmee het com plexe systeem als het ware beheersbaar wordt (zie figuur 3). Turvey noemt dit principe zeer treffend ‘Sim plicity ffom complexity’ (Turvey, 1 988; zie ook Kelso, 1995). Variatie is dus belangrijk en dit heeft dan ook praktische consequenties voor het doen van onderzoek. Bijvoorbeeld in spraak- en taalonderzoeken wordt volgens het klassieke standpunt gestreefd naar homogene onderzoekspopula ties (met zo m in m ogelijk intersubjectvariaties). We beperken zodoende als het ware de range van ingangscondities en maken daardoor slechts een klein deel van de inherente eigenschappen van het systeem zichtbaar. Door filtering o f middelen werken we dan vaak nog de laatste beetjes variatie weg om een soort prototypisch gedrag te tonen. In de chaostheorie wordt er ju ist gestreefd naar zoveel m ogelijk variatie om zodoende de complexiteit van het systeem in kaart te kunnen brengen. Voor systemen die zich niet-lineair gedragen (en dat zijn er zeer vele) is het simpelweg middelen van gedrag onzinnig en bepaalde cruciale informatie kan uit het zicht verdwijnen (zie voor een voorbeeld met betrekking tot respiratiegedrag bij ratten Webber & Zbilut, 1994). Het is om die reden dat chaostheorie en haar m ethodieken een ingang zullen vinden in spraak- en taalonderzoek. Een voorbeeld hiervan is terug te vinden in een arti kel van Porter and Hogue (1 998). Voor meer algemene introducties in de STEM-SPRAAK-TAALPATHOLOGIE
AFL. 7 [ ï p p 9)
A 9 .1 | 1 5
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
chaostheorie o f ook meer gespecialiseerde informatie kan men terecht op de website van de Society for Chaos theory in Psychology and Life Sciences: (http://www.vanderbilt.edu/art5/p5ycholo^/co$sci/chaos/cspls.html)
5
Een overzicht van meettechnieken in de spraak- en taalpathologie
In het onderstaande geven we een kort overzicht van de in de spraak- en taal pathologie meetbare objecten/processen, de naam van de (meest gangbare) meettechniek die daar bijhoort, en de benaming van de ruwe en de afgeleide data. Het zal duidelijk zijn dat niet alle meetprocedures door elke onderzoe ker/clinicus zonder meer kunnen worden gebruikt. De volgende criteria kun nen bij een keuze een rol spelen (zie Van Lieshout, 1996): Welke klinische symptomen staan voorop bij een patiënt, en hoe kan ik deze het beste (met voor de situatie noodzakelijke nauwkeurigheid, een voud en snelheid) vastleggen? Hoeveel moeite kost het de clinicus/onderzoeker om zich een bepaalde methode eigen te maken? Immers, sommige methoden vragen een specia le training en ervaring om gegevens zinvol te kunnen gebruiken. Welke investeringen in de infrastructuur zijn vereist met betrekking tot registratie, verwerking en analyse van de data? Hoe belastend is de m eting voor de patiënt? Z ijn de m etingen m akkelijk parametriseerbaar? Welke statistische bewerkingen zijn m ogelijk? Het volgende overzicht kent vier categorieën: het te meten obj eet/proces de gebruikte registratietechniek de ruwe data het meetniveau en een aanwijzing o f de data uni- o f multivariaat zijn. T abel x
M eetprocedures.
Te meten object/proces
Registratietechniek
Ruwe data
Meetniveau; üni-/multivanaat
(1) H ersenactiviteit
Positron Emissie
Emissiewaarden
bij spraakproductie
Tomografie (p e t)
van relatieve concentraties
Interval; m ultivariaat
van in de bloedbaan aan wezige radioactiefgelabelde glucose o f zuurstof
A9 . 1 I 1 6
STEM-SPRAAK-TAAL PATHOLOGIE
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
T ab el i
M eetprocedures.
(2) Productietijd bij
Reactietijdmeting
Reactietijden in ms
Ratio; univariaat
Respitrace
bewegingen borst- en buik
Interval; univariaat
spraakplanning
(3) Respiratie
volume-veranderingen Elektromyografie
spieractiviteit primaire
(e m g )
en secundaire
Interval; m ultivariaat
respiratoire m usculatuur Flowm eting
luchtstroom (in volume/s)
Interval; univariaat
Spirometer
statische longvolumes
Interval; m ultivariaat
en longcapaciteiten
[4) Fonatie
Stroboscoop
Beweging van stem
Interval/ratio; m ultivariaat
banden Elektro-Glottogram
Mate van contact
(e g g )
oppervlak tussen
Ratio; univariaat
stembanden Fotogiottogram
Openingsgraad
Interval/ratio; m ultivariaat
stemspleet Drukopnemer
subglottale druk c.q.
Interval; univariaat
transglottale druk Invers filtering
Vorm van stembandpulsen
Interval/ratio; m ultivariaat
Schaaloordelen
Scores op een schaal
Ordinaal/interval; univa riaat; ook m ultivariaat
(luisteren)
(5) Articulatie
Elektromyografie
Spieractiviteit intra- en
(e m g )
extralaryngeaal
Interval; m ultivariaat
Röntgen
Posities van articulatoren
Interval/ratio; m ultivariaat
M agnetic Resonance
Posities van articulatoren
Interval/ratio; m ultivariaat
Bewegingen van
Interval/ratio; m ultivariaat
Im aging (m r i ) Elektromagnetische
articulatoren M idsagittale Articulografie Elektro-Palatografie
Mate en plaats van con
Interval; m ultivariaat
tactoppervlak tussen tóng en verhemelte Elektromyografie
spieractiviteit orale/faciale
(e m g )
m usculatuur
golfvorm:
Duren van akoestische
Interval/ratio; m ultivariaat
Ratio; univariaat
gebeurtenissen;
STEM-SPRAAK-TAALPATHOLOGIE
Beschrijving van
Interval/ratio; univariaat
het spectrum
en multivariaat
AFL. 7 ( l p p p ]
A p.l I 1 7
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
T ab el i
M eetprocedures. Nasometer
Ratio; univariaat
Verhouding nasale/ orale geluidsdruk
Velograaf
Velumbewegingen
Ratio/interval; multivariaat
Rothenbergmasker
Orale luchtstroom
Interval/ratio; m ultivariaat
en -druk (herleidbaar tot orale/nasale luchtweerstand)
(7) Spraakdetectie
Fonetische
iPA-transcriptie
transcriptie (luisteren]
symbolen
Nominaal
Schaaloordelen
scores op een schaal
Ordinaal/interval; univa
Spraakaudiogram
‘Correct-scores’
Ratio; univariaat
Reactietijden
Reactietijden in ms
zie boven
riaat, ook m ultivariaat
(luisteren)
Literatuur Borgotta, E.F., & B o rn sted t, G.W. (1981). Levels o f m easurem ent. Once over again. In G.W. Bornstedt & Borgotta, E.F. (eds.), Social Measurements: Current Issues (pp. 23-37). N ew b ury Park, CA: Sage. Gracco, V.L. (1997). A neurom otor perspective on speech production. In W. H ulstijn, H .F.M . Peters & P .H .H .M . van Lieshout (eds.), Speech production: Motor Control, Brain Research, and Fiueng/ Disorders. A m sterdam : Elsevier Science
b ijv .
Kauffm an, L.H., & Sabelli, H .C. (1998). T h e proces equation. Cybernetics and System: An International]oumal, 29, 345-362. Kelso, J.A.S. (1988). Introductory rem arks: D ynam ic Patterns. InJ.A.S. Kelso, A.J. M andell, & M .F . Shlesinger (eds.), Dynamic Patterns in Complex Systems (pp. 1-5). Singapore: W orld Scientific P u b lishin g Co. Kelso, J.A.S. (1995). Dynamic?attems. C am bridge: Bradford. Lauter, J.L. (1997) N oninvasive brain im ag in g in speech m otor control and stuttering: Choices and challenges. In Speech production: Motor control, Brain research and Fiueng/ Disorders, (eds.) W. H ulstijn, H .F.M . Peters, P.H .M .M . van Lieshout, pp. 233-257. Lucero, J.C ., M unhall, K.G., Gracco, V.L., & Ramsay, J.O., (x997). On the registration o f tim e and the patterning o f speech m ovem ents. Journal ofSpeech, Language, and Hearing Research, 40 (5) 1 x 1 x-x 1 x7. M ow rey, R.A., & M acK ay, I.R.A. (X990). Phonological prim itives: Elektrom yographic speech error evidence. Journal of the Acoustical Society of America, 8 8 ,12 9 9 -13 x2. Porter, R.J., & H ogue, D.M . (X998). N on lin ear D ynam ical System s in Speech Perception and Production. Nonlinear Dynamics, Psychology, and Life Sciences, 2 (2). Rietveld, T. & Van H out, R. (1993) Statistical techniquesfor the study of language and language behaviour. Berlin: G ruyter M outon. Tow nsend, j.T . & Ashby, F.G. (X984) M easurem ent Scales and Statistics: The M isconception M isconceived. Tsychological Bulletin, 96, 39 4 -4 0 1. A9.1 I 18
STEM-SPRAAK-TAALPATHOLOGIE
Registreren aan stem, spraak en taal | Meten in de spraak- en taalpathologie
Turvey, M .T. (1988). Sim plicity from Com plexity: Archetypal action regim es and sm art perceptual instrum ents as execution-driven phenom ena. In J.A.S. Kelso, A.J. M andell, & M .F. Shlesinger (eds.), Dynamic Patterns in Complex System (pp. 327-347). Singapore: World Scientific Pu blishing Co. Van Lieshout, P.H .H .M . (1996). T echnieken en m ethoden in spraakproductie-onderzoek. Stem-, Spraak-enTaalpathologie, 5 (3) 17 3 -19 7 . Van Lieshout, P.H .H .M ., H ulstijn, W., Alfonso, P.J., & Peters, H .F.M . (1997). H igher and low er order influences on the stability o f the dynam ic coupling between articulators. In W. H ulstijn, H .F.M . Peters, & P.H .H .M . van Lieshout (eds.), Speech production: Motor control, brain research andfluency disorders (pp. 16 1-17 0 ). Am sterdam , The N etherlands: Elsevier Science Publishers. Webber, C.L., & Z b ilu t, J.P. (1994). D ynam ical assessm ent o f physiological systems and states using recurrence plot strategies. Journal of Applied Physiology, j 6 , 965-973.
STEM-SPRAAK-TAALPATHOLOGIE
AFL. 7 ( 1 9 9 9 ]
A 9 .1 | 1 9