4660_Bwrk
02-10-2006
14:05
Pagina 117
Correspondentieadres De heer L.D. de Jong, MSc ‘De Vogellanden’, Centrum voor Revalidatie Afdeling Fysiotherapie, Sectie Volwassenen Postbus 1057 8001 bb Zwolle E:
[email protected]
L.D. de Jong, MSc ‘De Vogellanden’, Centrum voor Revalidatie, Zwolle
Dr. A. Nieuwboer Katholieke Universiteit Leuven, Leuven, België
G. Aufdemkampe, MSc Hogeschool van Utrecht, Studierichting Fysiotherapie en Kenniskring Leefstijl en Gezondheid, Utrecht
Ned Tijdschr Fysiother 2006;116(5):117-122
De Ashworth Schaal: interbeoordelaarsbetrouwbaarheid van een Nederlandse vertaling bij cva-patiënten Doel van de studie De van origine Engelstalige (gemodificeerde) Ashworth Scale (AS) is een veel gebruikt meetinstrument om spasticiteit te kwantificeren. Hoewel de betrouwbaarheid van de Engelstalige versie(s) al werd aangetoond bij CVA-patiënten, werd dit voor een Nederlandstalige originele 5-punts Ashworth Schaal niet eerder nagegaan. De vraagstelling van dit onderzoek luidde: ‘Wat is de interbeoordelaarsbetrouwbaarheid van een Nederlandse vertaling van de originele 5-punts AS wanneer deze wordt gebruikt door twee fysiotherapeuten voor het bepalen van de weerstand bij passief extenderen van de elleboog bij een steekproef met CVA-patiënten?’ Methode In het kader van een overkoepelende studie werd de originele 5-punts AS vertaald in het Nederlands. Vervolgens werd in tien weken tijd met deze schaal driemaal een bepaling gedaan van de weerstand bij passief bewegen van de extensie van de elleboog bij respectievelijk 18, 13 en 12 CVA-patiënten door dezelfde twee beoordelaars. Resultaten De interbeoordelaarsbetrouwbaarheid werd berekend met behulp van een gewogen Cohen’s Kappa en Kendall’s tau-b. Bij de eerste serie van 18 bepalingen liet de mate van overeenstemming te wensen over (gewogen Kappa 0,48; Kendall Tb 0,55). Naarmate de beoordelaars meer ervaring hadden opgedaan, steeg de mate van overeenstemming tot een acceptabel niveau (maximum gewogen Kappa 0,77; Kendall Tb 0,82). Conclusie De interbeoordelaarsbetrouwbaarheid van de vertaling van de AS is acceptabel voor het bepalen van de weerstand van de elleboogflexoren bij CVA-patiënten. De betrouwbaarheid lijkt voorts sterk af te hangen van de mate van ervaring in het afnemen van de test. Voor het dagelijks gebruik bij CVA-patiënten kan de vertaling een beperkt, maar waardevol meetinstrument zijn. De resultaten van deze studie moeten echter met enige voorzichtigheid geïnterpreteerd worden gezien de kleine onderzoekspopulatie.
• Voor het bepalen van de weerstand van de elleboogflexoren bij CVA-patiënten is de interbeoordelaarsbetrouwbaarheid van de vertaling van de Ashworth Schaal (AS) acceptabel. • De betrouwbaarheid lijkt sterk af te hangen van de mate van ervaring in het afnemen van de test. In Nederland worden jaarlijks ongeveer 30.000 personen voor het eerst getroffen door een beroerte.1 Onder een beroerte of cerebrovasculair accident (CVA) verstaat de Wereld Gezondheids Organisatie (WHO): ‘plotseling optredende verschijnselen van een focale stoornis in de hersenen waarvoor geen andere oorzaak aanwezig is dan een vasculaire stoornis’.2,3 Op basis van demografische ontwikkelingen alleen is de verwachting dat het absolute aantal personen met een beroerte in Nederland tussen 2000 en 2020 met 43,6% zal stijgen.4 Van de mensen die een CVA overleven, ervaart 41% beperkingen in het dagelijks leven.1 Een CVA wordt klinisch doorgaans gekenmerkt door zowel ‘positieve’ als ‘negatieve’ symptomen.5,6 Met de negatieve symptomen worden onder andere fenomenen als parese (spierzwakte) of paralyse (verlamming) bedoeld. De positieve symptomen behelzen ontremmingsverschijnselen, zoals verhoogde peesreflexen, synergistische bewegingspatronen en spasticiteit. Over het laatstgenoemde fenomeen, spasticiteit, is de laatste jaren veel geschreven. Onlangs werd door een consortium van experts7 de al jaren in gebruik zijnde definitie van Lance8 geherdefinieerd tot ‘een ontregelde sensomotorische bewegingscontrole ten gevolge van een laesie van het centraal motorisch neuron, zich manifesterend als een met tussenpozen verschijnende of aanhoudende onwillekeurige activatie van musculatuur’. Dat spasticiteit een frequent optredend fenomeen is bij patiënten die een CVA hebben doorgemaakt, bleek onlangs uit de studie van Sommerfeld et al.9: spasticiteit ontwikkelde zich bij 26% van de CVA-patiënten en was drie maanden later nog aanwezig bij 28% van de proefpersonen. Een jaar na het CVA werd een prevalentie gerapporteerd van 38%.10 Om de effecten van verschillende therapievormen op de mate van spasticiteit te kunnen kwantificeren, wordt veelvuldig gebruik gemaakt van de van oorsprong Engelstalige 5-punts Ashworth Scale (AS).11 Deze werd later ten behoeve van de responsiviteit gemodificeerd tot een 6-puntsschaal door Bohannon en Smith.12 De Nederlandse Hartstichting2 en het KNGF13 bevelen het gebruik van de gemodificeerde Ashworth Scale (MAS) in hun richtlijnen aan. De betrouwbaarheid van de Engelstalige versie bij gebruik bij CVA-patiënten werd door meerdere auteurs vastgesteld en varieerde van redelijk tot zeer goed, vooral wanneer deze werd bepaald voor de extensie van de elleboog.14-16 Een Nederlandse vertaling van een aangepaste AS werd in de studie van Waardenburg et al. op betrouwbaarheid getest bij psychogeriatrische patiënten met paratonie en werd aanvaardbaar geacht.17 In het kader van een overkoepelend effectonderzoek naar de effecten van een contractuurpreventieve rekhouding van de bovenste hemiplegische extremiteit op onder andere de ervaren weerstand van de elleboogflexoren ontstond de behoefte om de betrouwbaarheid van die metingen te bepalen.18 Om daarnaast gegevens over de betrouwbaarheid van een Nederlandstalige n e d e r l a n d s t i j d s c h r i f t v o o r f ys i ot h e r a p i e – n r 5 – o k to b e r 2 0 0 6 – ja a r g a n g 1 1 6
117
4660_Bwrk
02-10-2006
14:05
Pagina 118
L.D. de Jong A. Nieuwboer G. Aufdemkampe
versie van de 5-punts Ashworth Schaal bij CVA-patiënten te genereren, werd deze studie uitgevoerd met als uiteindelijke vraag: ‘Wat is de interbeoordelaarsbetrouwbaarheid van een Nederlandse vertaling van de originele 5-punts Ashworth Scale wanneer deze wordt gebruikt door twee fysiotherapeuten voor het bepalen van de weerstand bij passief extenderen van de elleboog bij een steekproef bestaande uit CVA-patiënten?’
METHODE Vertaling van de Ashworth Scale Voor aanvang van de studie werden bestaande Engels- en Nederlandstalige versies van de AS, de MAS en de aangepaste AS van Waardenburg et al. door twee auteurs (LDJ en AN) bestudeerd. Ondanks de reeds bestaande vertaling van Waardenburg et al. (figuur 1a) werd gekozen voor een nieuwe vertaling, die geschikter werd geacht voor de CVA-populatie omdat hiermee, beter dan met de vertaling van Waardenburg et al., een onderscheid kon worden gemaakt tussen weerstand aan het eind van een beweging of gedurende het gehele traject van de beweging.17 Gekozen werd voor een (niet officieel erkende en gevalideerde) vertaling (figuur 1 b). Proefpersonen CVA-patiënten die in de periode van maart 2003 tot januari 2005 werden opgenomen in revalidatiecentrum ‘De Vogellanden’ te Zwolle, ‘Kastanjehof’ te Apeldoorn en vanaf januari 2004 in het Militair Revalidatiecentrum (MRC) Aardenburg te Doorn, werden in het kader van de overkoepelende studie gescreend op de volgende inclusiecriteria: (1) eerste CVA waarbij de patiënt maximaal 12 weken post-CVA is; (2) een bloeding of infarct in het arteria cerebri media-gebied, vastgesteld door middel van een CT- of MRIscan; (3) geen premorbide functiestoornissen van de aangedane arm; (4) geen hevige schouderpijn; (5) geen gebruik van spasticiteitsverlagende medicatie; (6) geen gebruik van pijnstillers behalve paracetamol; (7) geen geplande ontslagdatum uit het revalidatiecentrum en (8) in staat om ‘informed consent’ te geven. Na het voldoen aan de initiële inclusiecriteria werden nog vier Figuur 1a Aangepaste tonusschaal van Ashworth volgens Waardenburg et al.17 0. Normale tonus. Passief bewegen normaal mogelijk. 1. Licht verhoogde tonus. Lichte weerstand bij passief bewegen. 2. Matig verhoogde tonus. Matige weerstand bij passief bewegen. 3. Ernstig verhoogde tonus. Zware weerstand bij passief bewegen. 4. Zeer ernstig verhoogde tonus. Passief bewegen is vrijwel niet mogelijk.
Figuur 1b Nederlandse vertaling van de originele 5-punts Ashworth Scale. 0. Geen verhoogde tonus. 1. Licht verhoogde tonus, te voelen door lichte aanspanning gevolgd door een snelle relaxatie of door een licht verhoogde weerstand aan het einde van het bewegingstraject bij flexie of extensie. 2. Matig verhoogde tonus gedurende het grootste deel van het bewegingstraject, maar het aangedane lichaamsdeel kan eenvoudig bewogen worden. 3. Sterk verhoogde tonus, passieve beweging van het lichaamsdeel is moeilijk. 4. Aangedane lichaamsdeel is rigide in flexie of extensie.
118
tests afgenomen om patiënten uit te sluiten met een (9) een fors neglect (een verschil van meer dan drie letters op de O-zoektest19), (10) een forse stoornis van het houdingsgevoel (‘proprioceptie) van de arm (scores 2 en 3 op de Thumb Finding Test20,21) en (11) duidelijk beperkte cognitieve stoornissen (< 23 punten op de Mini Mental State Examination22-24). Patiënten met een beperkende afasie werden tevens uitgesloten (minder dan 67 punten op de taalbegripsonderdelen van de Akense Afasie Test25). Ten slotte werden patiënten met een redelijk goed herstelde armfunctie (> 18 van de 36 punten op de subonderdelen schouder/ elleboog van de 66-punts Fugl-Meyer Assessment26) uitgesloten. De studie werd goedgekeurd door de Medisch Ethische Toetsingscommissie van de Isala Klinieken te Zwolle.
Beoordelaars De twee beoordelaars, beiden fysiotherapeut, hadden aan het begin van de studie respectievelijk zeven en vier jaren ervaring met het behandelen van CVA-patiënten. Een van de beoordelaars had geen ervaring met het afnemen van de Ashworth Schaal, de andere beoordelaar gebruikte de schaal gemiddeld tweemaal per maand. Voor aanvang van de studie kregen beide therapeuten een korte training in het afnemen van de vertaalde AS door middel van het oefenen van het hieronder beschreven meetprotocol op drie proefpersonen. De twee beoordelaars waren niet betrokken bij de behandeling van de proefpersonen. Meetprocedure Het meetprotocol van de studie naar de contractuurpreventieve rekhouding was zodanig vormgegeven dat tijdens iedere meting van de deelnemende proefpersonen drie metingen per proefpersoon in tien weken door twee verschillende beoordelaars een weerstandsbepaling kon worden gedaan van de flexoren van de elleboog van de hemiplegische arm. De door de onderzoeker ervaren weerstand van de elleboogflexoren werd hierbij uitgedrukt in een van de scores van de vertaalde AS. In de meetprocedure werd rekening gehouden met onder meer aanbevelingen van Bohannon en Smith12, Johnson27, Koolstra et al.28 en Pandyan et al.29 Elke meting vond op de volgende wijze plaats: De proefpersoon lag met (gedeeltelijk) ontbloot bovenlichaam in ruglig op de onderzoeksbank met het hoofd in de middenpositie op een kussen. Een beenrol werd onder de knieën gelegd. De proefpersoon werd gevraagd zich in deze uitgangshouding zoveel mogelijk te ontspannen. Voor het testen van de rechter elleboog van de proefpersoon gold: de rechterhand van de onderzoeker omvatte de pols van de proefpersoon, de linkerhand van de onderzoeker omvatte de dorsolaterale zijde van de bovenarm net proximaal van de elleboog en vice versa voor het testen van de linker elleboog. De aangedane arm werd tevens door de beoordelaar licht in abductie (maximaal 30 graden) in de schouder gepositioneerd. De onderarm werd in een neutrale stand (d.w.z. tussen pro- en supinatie in) vanuit maximale elleboogflexie naar extensie bewogen. Alvorens de weerstand werd beoordeeld werd de passieve bewegingsuitslag (Passieve Range of Motion, PROM) van de elleboog in flexie-extensierichting eenmaal bepaald door middel van een ‘slow-stretch’ beweging binnen de pijngrens om eventuele bewegingsbeperkingen op te sporen. Direct daarna vond de daadwerkelijke weerstandsmeting plaats. Er werd naar gestreefd de passieve beweging binnen een seconde uit te voeren (ter ondersteuning werd dit verbaal verduidelijkt door ‘duizend-en-een’ te zeggen). De beweging werd vervolgens een keer uitgevoerd waarna de score werd genoteerd. Hoesten, geeuwen en persen moest worden vermeden tijdens het onderzoek. Indien dit toch gebeurde, of bij
n e d e r l a n d s t i j d s c h r i f t v o o r f ys i ot h e r a p i e – n r 5 – o k to b e r 2 0 0 6 – ja a r g a n g 1 1 6
4660_Bwrk
02-10-2006
14:05
Pagina 119
De Ashworth Schaal: interbeoordelaarsbetrouwbaarheid van een Nederlandse vertaling bij cva-patiënten
voorkomen, werden de AS-scores van de drie evaluatiemomenten (de beginmeting, de eindmeting vijf weken later en de followupmeting na 10 weken) onafhankelijk van elkaar berekend. Een soortgelijke methode werd gehanteerd door Pandyan et al.30 Tijdens de drie verschillende evaluatiemomenten konden bij respectievelijk 18, 13 en 12 proefpersonen de Ashworthscores door dezelfde twee beoordelaars worden bepaald en vergeleken op hun onderlinge overeenstemming. De statistische analyses werden uitgevoerd met SPSS voor Windows (versie 10.0.5) en SAS Enterprise Guide voor Windows (versie 2).
Tabel 1 Baselinekarakteristieken van de 19 geïncludeerde proefpersonen. Karakteristiek Leeftijd (jaren, gemiddelde ± SD)
54 (± 10,01)
Geslacht (man/vrouw)
10 / 9
Type CVA (ICVA/HCVA)
14 / 5
Aangedane zijde (links/rechts)
10 / 9
Fugl-Meyer arm score (mediaan, IQR)
10 (8-20)
Tijd post-CVA tijdens eerste meting (dagen, gemiddelde ± SD)
39 (± 12)
SD:
RESULTATEN
standaarddeviatie; ICVA: ischemisch cerebrovasculair accident;
verdenking op willekeurige spierspanning werd een minuut gewacht, waarna de beweging nogmaals werd uitgevoerd. Terwijl de eerste beoordelaar bovenstaand protocol doorliep, draaide de tweede beoordelaar zich tijdens de testafname van de eerste beoordelaar en de proefpersoon af. Vervolgens werd de patiënt een minuut met rust gelaten, waarop de tweede beoordelaar het protocol op dezelfde wijze doorliep, inclusief de PROM-bepaling. De meetresultaten werden op gescheiden scoreformulieren genoteerd om blindering te garanderen. Alle metingen werden door dezelfde twee meettherapeuten en in dezelfde volgorde afgenomen. De metingen vonden plaats in de namiddag.
Proefpersonen Een overzicht van de baselinekarakteristieken staan weergegeven in tabel 1. De geïncludeerde 10 mannen en 9 vrouwen waren gemiddeld 54 jaar oud. De proefpersonen waren ten tijde van de eerste evaluatie tussen de vier en vijf weken post-CVA, en bevonden zich daarmee aan het einde van de subacute en aan het begin van de postacute fase na het CVA.13 De meeste proefpersonen hadden een ischemisch cerebrovasculair accident doorgemaakt (± 74%) en de verdeling tussen links- of rechtszijdige hemiplegie was nagenoeg gelijk. Op het armonderdeel van de Fugl-Meyer Assessment scoorden de proefpersonen bij aanvang van de studie een mediaan van 10 van de maximaal haalbare 66 punten. Hieruit blijkt dat de proefpersonen weinig mogelijkheid tot selectief bewegen in hun aangedane arm hadden.
Statistische analyse Naast de percentages van overeenkomst werd de interbeoordelaarsbetrouwbaarheid berekend met behulp van een kwadratisch gewogen Cohen’s Kappa (kw). Kendall’s tau-b (Kendall’s Tb) werd berekend om een vergelijking met de bevindingen van Waardenburg et al. te kunnen maken. Om afhankelijkheid in de data te
Maten van overeenstemming De resultaten van de 44 door beide beoordelaars uitgevoerde metingen zijn weergegeven in tabel 2. Met name de graden 0, 1 en 2 werden gescoord. Viermaal werd een Ashworthgradering van 3 gevonden en graad 4 werd niet gemeten. Tabel 3 toont de bijbehorende maten van overeenstemming.
HCVA:
hemorragisch cerebrovasculair accident; IQR: interkwartielbereik.
Tabel 2 Scores van de beoordelaars MT1 en MT2 op de Ashworth Schaal tijdens de drie evaluatiemomenten. Proefpersoon
Evaluatie 1 (n = 18)
Evaluatie 2 (n = 13)
Evaluatie 3 (n = 12)
MT1
MT2
MT1
MT2
MT1
MT2
01
2
0
1
0
2
1
02
1
0
1
2
1
1
03
0
0
2
1
2
1
04
1
1
-
-
-
-
05
2
2
2
2
2
2
06
2
1
3
3
2
2
07
0
0
0
0
1
1
08
2
1
1
1
2
2
09
2
1
3
3
2
2
10
1
1
1
1
1
1
11
2
2
2
2
3
3
12
1
1
1
1
-
-
13
1
1
2
2
-
-
14
2
2
-
-
3
3
15
1
1
-
-
-
-
16
-
-
-
-
2
2
17
1
1
2
2
-
-
18
1
1
-
-
-
-
19
1
0
-
-
-
-
MT1, eerste beoordelaar; MT2, tweede beoordelaar; - ontbrekende meetwaarde(s) vanwege drop-out of afwezigheid van een van de beide beoordelaars als gevolg van vakantie of ziekte. De waarde is niet weergegeven indien door slechts één meettherapeut een Ashworthbepaling kon worden gedaan.
n e d e r l a n d s t i j d s c h r i f t v o o r f ys i ot h e r a p i e – n r 5 – o k to b e r 2 0 0 6 – ja a r g a n g 1 1 6
119
4660_Bwrk
02-10-2006
14:05
Pagina 120
L.D. de Jong A. Nieuwboer G. Aufdemkampe
Tabel 3 Maten van overeenstemming op de drie evaluatiemomenten. Maat van overeenstemming
Evaluatie 1 (n = 18)
Evaluatie 2 (n = 13)
Evaluatie 3 (n = 12)
Overeenkomst (%)
67
77
83
Gewogen kappa (kw) (95%-bi)
0,48 (0,17-0,80)
0,76 (0,50-0,99)
0,77 (0,48-0,99)
Kendall tau-b
0,55*
0,80**
0,82*
* correlatie significant op het 0,05-niveau; ** correlatie significant op het 0,01-niveau.
DISCUSSIE De belangrijkste bevinding van deze studie is dat de interbeoordelaarsbetrouwbaarheid van de Ashworth Schaal bij CVA-patiënten acceptabel is wanneer deze wordt gebruikt bij het bepalen van een gradering van de passieve extensie over de elleboog (waarbij de flexoren van de elleboog worden gerekt). Deze conclusie volgt uit de redelijk hoge percentages van overeenstemming tussen de meettherapeuten en de waarden van gewogen kappa. Echter, de interpretatie van de kappawaarden verschilt aanzienlijk in de literatuur.31 Hoewel normering van kappawaarden strikt genomen niet geoorloofd is, worden door Bouter en van Dongen kappawaarden van 0,40 of lager gezien als een indicatie voor geringe mate van overeenstemming en waarden van 0,75 of hoger als een indicatie voor een uitstekende overeenstemming.32 Landis en Koch leggen de ondergrens voor een aanzienlijke (‘substantial’) overeenstemming bij 0,60.33 Voorts duiden de lage kappawaarden aan het begin van het onderzoek wellicht op de invloed van de mate waarin de beoordelaars ervaren zijn in het afnemen van de test. De uitkomsten van dit onderzoek dienen om meerdere redenen met enige voorzichtigheid geïnterpreteerd te worden. In de eerste plaats zou kritiek kunnen worden gegeven op de Ashworth Schaal zelf. In de internationale literatuur bestaat de nodige weerstand tegen het gebruik van de AS/MAS. Dit heeft te maken met het gegeven dat de validiteit van het meetinstrument als maat voor ‘spasticiteit’ al geruime tijd ter discussie staat. Het grote nadeel van de AS is dat de effecten van de mechanische stijfheid van spieren en de neurologische componenten samen worden beoordeeld waardoor niet duidelijk is welke component het meest verantwoordelijk is voor de door de onderzoeker ervaren weerstand.34 Experts op het gebied van het meten van spasticiteit zijn het er daarom over het algemeen over eens dat, indien gebruik wordt gemaakt van de AS/MAS, gesproken moet worden over het meten van ‘weerstand bij passief bewegen’ en niet meer over het meten van spasticiteit.27,30,35,36 In dit kader kan dan ook kritiek worden geleverd op onze vertaling, waarin nog wordt gesproken over ‘tonus’. Echter, alvorens te bepalen of een Nederlandstalige (gemodificeerde) Ashworth Schaal ‘tonus’ of ‘weerstand bij passief bewegen’ meet, zou validiteitsonderzoek moeten plaatsvinden. Omdat deze validiteitsvraag niet viel binnen de opzet van het onderzoek hebben we ervoor gekozen de bestaande terminologie zo accuraat mogelijk te vertalen. Wel sluiten we ons aan bij de in zwang zijnde opvatting dat de hier vertaalde Ashworth Schaal vooral een indicatie van de door de onderzoeker ervaren weerstand geeft. Ondanks de reeds aangetoonde betrouwbaarheid van de MAS werd door sommige auteurs de voorkeur uitgesproken voor gebruik van de originele 5-punts AS. Hiervoor werden twee redenen gegeven. In de eerste plaats is er bij de Engelse versie van de MAS sprake van onduidelijkheid over de definities van de termen ‘catch’ en ‘release’ in de graden 1 en 1+. Zolang deze termen niet 120
goed zijn gedefinieerd, aldus sommige auteurs, moet de MAS worden beschouwd als een meetinstrument op nominaal niveau.27,29 Hierdoor zou het meetinstrument statistisch minder krachtig zijn dan de als een ordinaal meetinstrument beschouwde originele AS. Ten tweede kan het toevoegen van een extra graad aan een meetschaal de responsiviteit vergroten. Dit kan echter ten koste gaan van de betrouwbaarheid van de metingen. Dit was ook precies wat Pandyan et al. concludeerden in hun uitgebreide review over dit onderwerp.29 De auteurs gaven aan dat het gebrek aan overeenstemming in de gevonden waarden tussen beoordelaars zich vooral leek te concentreren rond de waarden 1 en 1+ van de MAS.29 De genoemde redenen pleiten ervoor om de AS te gebruiken. Gezien het feit dat voor de overkoepelende studie de inclusiecriteria vrij streng waren, is de geselecteerde steekproef niet representatief voor de gehele CVA-populatie. Patiënten met een goede prognose van armfunctieherstel werden hierdoor namelijk uitgesloten van de studie. Bovendien viel op dat waarden 3 en 4 amper voorkwamen. Hierdoor werd een slechte celdistributie verkregen, met als gevolg dat daardoor de kappastatistiek een vertekend (minder gunstig) beeld geeft van de geschatte overeenkomst. De redelijk hoge percentages van overeenkomst tussen de meettherapeuten (67% en hoger) daarentegen lieten een positiever beeld zien. Daartegenover stond het gegeven dat de geselecteerde populatie van bescheiden omvang was, een factor die de nadelen van het gebruik van Cohen’s Kappa weer versterkt.37 Het verschil in groepsgrootte en het aantal beoordelaars maakt het lastig onze resultaten te vergelijken met die van andere auteurs. Toch vergelijken we onze bevindingen met die van de enige gepubliceerde Nederlandstalige AS die ons bekend is. Waardenburg et al.17 beoordeelden 28 proefpersonen met twee beoordelaars en vonden Kendall’s Tb-waarden van 0,72 en 0,77. Onze beoordelaars haalden tijdens de eerste evaluatie met 18 proefpersonen beduidend lagere waarden van overeenstemming (Kendall’s Tb 0,55), maar tijdens de tweede (n = 13) en derde evaluaties (n = 12) iets hogere waarden (resp. 0,80 en 0,82). De in vergelijking met Waardenburg et al. gevonden hogere waarden van onze tweede en derde evaluaties zouden kunnen zijn veroorzaakt door het effect van de groepsgrootte op de hoogte van de maten van overeenstemming. Echter, de ruwe scores laten ook het volgende beeld zien: de beoordelaars bereikten in de loop van het onderzoek steeds betere overeenstemming in hun metingen. Dit kan het gevolg zijn geweest van een trainingseffect, iets waarvan reeds eerder werd geopperd dat het de betrouwbaarheid van de Ashworthgraderingen in positieve zin zou kunnen beïnvloeden.12,38 Pandyan et al. gaven aan dat het juist rond de laagste waarden van de schaal maar de vraag is of er daadwerkelijk sprake is van een toegenomen weerstand, of dat de gevoelde weerstand beïnvloed wordt door de snelheid van bewegen.30 Goede afspraken over en voldoende ervaring met de juiste snelheid van bewegen lijkt daarom onontbeerlijk voor een betrouwbare interpretatie van de gevoelde weerstand. De door ons vooraf
n e d e r l a n d s t i j d s c h r i f t v o o r f ys i ot h e r a p i e – n r 5 – o k to b e r 2 0 0 6 – ja a r g a n g 1 1 6
4660_Bwrk
02-10-2006
14:05
Pagina 121
De Ashworth Schaal: interbeoordelaarsbetrouwbaarheid van een Nederlandse vertaling bij cva-patiënten
uitgevoerde oefensessie met slechts drie proefpersonen was hoogstwaarschijnlijk te beperkt, en daarmee mogelijkerwijs een factor die de lage kappawaarden tijdens de eerste evaluatie zou kunnen verklaren. De verschillen met de studie van Waardenburg et al. zouden echter ook nog verklaard kunnen worden door het verschil in diagnose van de proefpersonen (dementerende bejaarden met paratonie versus CVA-patiënten met spasticiteit) en verschillen in de vertaling van de AS. Het onderscheid tussen de graden 1, 2 en 3 (respectievelijk licht/matig/ernstig verhoogde tonus, lichte/matige/ernstige weerstand bij passief bewegen) was bij hen wellicht niet optimaal objectief gedefinieerd. Onze vertaling van de originele AS lijkt geschikt voor gebruik in de dagelijkse praktijk wanneer een indruk moet worden verkregen van de weerstand van de elleboogflexoren bij passieve elleboogextensie van de hemiplegische arm. Veranderingen in deze weerstand als gevolg van therapeutische handelingen (bijvoorbeeld elektrostimulatie, het rekken van verkorte en/of spastische musculatuur) kunnen hierdoor door een en dezelfde therapeut gekwantificeerd worden. Aangezien de intrabeoordelaarsbetrouwbaarheid over het algemeen niet onderdoet voor de interbeoordelaarsbetrouwbaarheid is de verwachting dat deze vertaling ook voor herhaaldelijk gebruik door een en dezelfde therapeut een beperkt, maar waardevol meetinstrument kan zijn. Vooraf veel ervaring opdoen in het gebruik van de schaal lijkt essentieel voor een betrouwbare afname. Vanwege de genoemde nadelen van de AS wordt recentelijk steeds vaker geopperd om de (gemodificeerde) Tardieu Scale te gebruiken.38,39 De snelheid van bewegen en de gewrichtshoek waarbij de weerstand wordt gevoeld zijn in deze test gestandaardiseerd. Hierdoor zou een beter onderscheid kunnen worden gemaakt tussen de neurale component van de ervaren weerstand en een contractuur.40 Ondanks deze voordelen is over dit meetinstrument inzake het gebruik bij CVA-patiënten nog weinig informatie voorhanden. Daarom lijkt het gerechtvaardigd om, bij gemis aan een goed gevalideerde opvolger, vooralsnog de AS te gebruiken om de weerstand bij passief bewegen van de elleboogextensie te kwantificeren. Pas wanneer een Nederlandse vertaling van de MAS op betrouwbaarheid is getest, kan worden bepaald of deze de voorkeur verdient boven de hier onderzochte 5-puntsschaal. Pas dan kan ook worden bepaald of de vermeende toename in responsiviteit van de MAS opweegt tegen het verwachte inboeten aan betrouwbaarheid. Verder onderzoek op grotere groepen CVA-patiënten zal licht moeten werpen op de beoordelaarsbetrouwbaarheid van de alhier gebruikte AS en de vermeende verschillen in betrouwbaarheid tussen de AS en de MAS.
DANKWOORD De auteurs willen dank betuigen aan de beoordelaars Mireille de Wissel (MRC Aardenburg, Doorn) en Floris Menkveld (Meander MC, Amersfoort). Geralda Kooi, Gerard Hommes (De Vogellanden, Zwolle), Miranda van Hooff (Kastanjehof, Apeldoorn) en Maartje Gebhard (MRC Aardenburg, Doorn) worden bedankt voor hun coördinerende inspanningen op de werkvloer gedurende het onderzoek. Daarnaast is dank verschuldigd aan de Dr. W.M. Phelps-Stichting voor Spastici voor de financiële ondersteuning.
A b st r a c t The Ashworth Scale: interrater reliability of a Dutch translation of the scale in stroke patients O b j e c t i v e . The original and modified versions of the Ashworth Scale are used worldwide to quantify spasticity. Despite the proven reliability of the scale in patients with stroke, nothing is known about the reliability of a Dutch translation of the original 5-point Ashworth Scale in such patients. Therefore we set out to investigate the interrater reliability of this scale when used to quantify resistance to passive extension of the elbow flexors. M e t h o d s . As a part of a randomized clinical trial, the original 5-point Ashworth Scale was translated into Dutch. This scale was then administered three times over 10 weeks to the same 18, 13, and 12 patients who had had a stroke. The resistance of the elbow flexors was scored on each occasion by the same two raters. R e s u lt s . Interrater reliability was calculated by means of a weighted Kappa and Kendall’s tau-b. The first series of measurements revealed low levels of agreement (weighted Kappa .48, Kendall Tb .55). However, as the raters gained experience during the trial, agreement between the two raters increased to acceptable levels (maximum weighted Kappa .77 and Kendall Tb .82). C o n c l u s i o n . The Dutch translation of the Ashworth Scale has acceptable interrater reliability when used to assess the resistance of the elbow flexors, provided that raters are experienced in using the test. The Dutch Ashworth Scale appears to be a limited, but valuable, tool for the clinical assessment of patients with stroke. The results of this study should be interpreted with caution because the sample sizes were small. K e y w o r d s : cerebrovascular accident; muscle spasticity; reproducibility of results Literatuur 1 Evers S, Struijs J, Ament A, van Genugten M, van den Bos G. The disease impact, health care management, and costs of stroke in the Netherlands. Bilthoven: rivm; 2002. 2 cva-Revalidatie C. Revalidatie na een beroerte, richtlijnen en aanbevelingen voor zorgverleners. Den Haag: Nederlandse Hartstichting; 2001. 3 Aho K, Harmsen P, Hatano S, Marquardsen J, Smirnov V, Strasser T. Cerebrovascular disease in the community: results of a who collaborative study. Bull World Health Organ. 1980;58:113-30. 4 Gijsen R, Poos M. Beroerte samengevat. In: Volksgezondheid Toekomst Verkenning, Nationaal Kompas Volksgezondheid. Bilthoven: rivm; 2003. 5 Barnes M. An overview of the clinical management of spasticity. In: Barnes C, Johnson G, editors. Upper Motor Neurone Syndrome and Spasticity. Cambridge: Cambridge University Press; 2001. p. 1-11. 6 O’Dwyer N, Ada L, Neilson P. Spasticity and muscle contracture following stroke. Brain. 1996;119:1737-49. 7 Pandyan A, Gregoric M, Barnes M, Wood D, Wijck F van, Burridge J, et al. Spasticity: clinical perceptions, neurological realities and meaningful measurement. Disabil Rehabil. 2005;27(1/2):2-6. 8 Lance J. Symposium synopsis. In: Feldman R, Young R, Koella W, editors. Spasticity: disordered motor control. Chicago: Chicago Yearbook Medical Publications; 1980. p. 485-494. 9 Sommerfeld D, Eek E, Svensson A, Holmquist L, Arbin M von. Spasticity after stroke: its occurence and association with motor impairments and activity limitation. Stroke 2004;35:134-40. 10 Watkins C, Leathley M, Gregson J, Moore A, Smith T, Sharma A. Prevalence of spasticity post stroke. Clin Rehabil. 2002;16:515-22. 11 Ashworth B. Preliminary trial of carisoprodol in multiple sclerosis. The Practitioner. 1964;192:540-2. 12 Bohannon R, Smith M. Interrater reliability of a modified Ashworth Scale of muscle spasticity. Phys Ther. 1987;67(2):206-7. 13 Peppen R van, Kwakkel G, Harmeling-van der Wel B, Kollen B, Hobbelen J, Buurke J, et al. kngfrichtlijn Beroerte. Ned Tijdschr Fysiother. 2004 Suppl.;5:1-78. 14 Brashear A, Zafonte R, Corcoran M, Galvez-Jimenez N, Gracies J, Forrest Gordon M, et al. Inter- and intrarater reliability of the Ashworth Scale and the Disability Assessment Scale in patients with upper-limb poststroke spasticity. Arch Phys Med Rehabil. 2002;83:1349-54. 15 Gregson J, Leathley M, Moore A, Smith M, Sharma A, Watkins C. Reliability of measurements of muscle tone and muscle power in stroke patients. Age Ageing. 2000;29:223-8. 16 Sloan R, Sinclair E, Thompson J, Taylor S, Pentland B. Inter-rater reliability of the modified Ashworth Scale for spasticity in hemiplegic patients. Int J Rehabil Res. 1992;15:158-61. 17 Waardenburg H, Elvers J, Vechgel F van, Oostendorp R. Is paratonie te meten? Een betrouwbaarheidsonderzoek voor het meten van paratonie met de vas en de gemodificeerde tonusschaal van Ashworth. Ned Tijdschr Fysiother. 1999;109(2):30-5. 18 Jong LD de, Nieuwboer A, Aufdemkampe G. Contracture preventive positioning of the hemiplegic arm in subacute stroke patients: a pilot randomized controlled trial. Clin Rehabil. 2006; 20:656-67. 19 Beers K. De o-zoek test. Hoensbroek: Stichting Revalidatie Limburg; 2001, 1 november. 20 Lanska D, Kryscio R. ‘Thumb localizing test’ for detecting a lesion in the posterior column-medial lemniscal system [Letter to the editor]. J Neurol Sci. 2000;174:152-3.
n e d e r l a n d s t i j d s c h r i f t v o o r f ys i ot h e r a p i e – n r 5 – o k to b e r 2 0 0 6 – ja a r g a n g 1 1 6
121
4660_Bwrk
02-10-2006
14:05
Pagina 122
L.D. de Jong A. Nieuwboer G. Aufdemkampe
21 Hirayama K, Fukutake T, Kawamura M. ‘Thumb localizing test’ for detecting a lesion in the posterior column-medial lemniscal system. J Neurol Sci. 1999;167:45-9. 22 Agrell B, Dehlin O. Mini Mental State Examination in geriatric stroke patients. Validity, differences between subgroups of patients, and relations to somatic and mental variables. Aging Clin Exp Res. 2000;12(6):439-44. 23 Tombaugh T, McIntyre N. The Mini Mental State Examination: a comprehensive review. J Am Ger Soc. 1992;40:922-35. 24 Folstein M, Folstein S, McHugh P. “Mini-mental state”. A practical method for grading the cognitive state of patients for the clinician. J Psychiatr Res. 1975;12:189-98. 25 Graetz P, de Bleser R, Willmes K. Akense Afasie Test, Handleiding. Lisse: Zwets & Zeitlinger b.v.; 1992. 26 Fugl-Meyer A, Jääsko L, Leyman I, Olsson S, Steglind S. The post-stroke hemiplegic patient. 1: a method for evaluation of physical performance. Scand J Rehabil Med. 1975;7:13-31. 27 Johnson G. Measurement of spasticity. In: Barnes M, Johnson G, editors. Upper motor neurone syndrome and spasticity. Cambridge: Cambridge University Press; 2001. p. 79-95. 28 Koolstra M, Burgers-Bots I, Lemmens C, Smeets C, Kwakkel G. Klinimetrie na een beroerte. Amersfoort: Nederlands Paramedisch Instituut / VU medisch centrum; 2001. 29 Pandyan A, Price C, Curless R, Barnes M, Rodgers H. A review of the properties and limitations of the Ashworth and modified Ashworth Scales as measures of spasticity. Clin Rehabil. 1999;13:373-83. 30 Pandyan A, Price C, Barnes M, Johnson G. A biomechanical investigation into the validity of the modified Ashworth Scale as a measure of elbow spasticity. Clin Rehabil. 2003;17:290-4. 31 Sim J, Wright C. The Kappa statistic in reliability studies: use, interpretation, and sample size requirements. Phys Ther. 2005;85(3):257-68. 32 Bouter L, van Dongen M. Epidemiologisch onderzoek. Opzet en interpretatie. vierde, herziene druk ed. Houten/Diegem: Bohn Stafleu van Loghum; 2000. 33 Landis J, Koch G. The measurement of observer agreement for categorical data. Biometrics. 1977;33:159-74. 34 Vattanasilp W, Ada L. The relationship between clinical and laboratory measures of spasticity. Aust J Phys. 1999;45:135-9. 35 Bakheit A, Maynard V, Curnow J, Hudson N, Kodapala S. The relation between Ashworth scale scores and the excitability of the a motor neurones in patients with post-stroke muscle spasticity. J Neurol Neurosurg Psychiatry. 2003;74:646-8. 36 Pandyan A, Price C, Rodgers H, Barnes M, Johnson G. Biomechanical examination of a commonly used measure of spasticity. Clin Biomech. 2001;16:859-65. 37 Portney L, Watkins M. Foundations of clinical research. 2nd ed. Upper Saddle River, New Jersey: Prentice-Hall, Inc.; 2000. 38 Vuadens P, Barnes M, Peyron R, Laurent B. Spasticity and pain after stroke. In: Barnes M, Dobkin B, Bogousslavsky J, editors. Recovery after stroke. New York: Cambridge University Press; 2005. p. 286319. 39 Boyd R, Ada L. Physiotherapy management of spasticity. In: Barnes M, Johnson G, editors. Upper motor neurone syndrome and spasticity. Cambridge: Cambridge Univerity Press; 2001. p. 96-121. 40 Patrick E, Ada L. The Tardieu Scale differentiates contracture from spasticity whereas the Ashworth Scale is confounded by it. Clin Rehabil. 2006;20:173-82.
nnn%[`ee\e`j[`i\Zk`ee\e%ec
122
n e d e r l a n d s t i j d s c h r i f t v o o r f ys i ot h e r a p i e – n r 5 – o k to b e r 2 0 0 6 – ja a r g a n g 1 1 6