De intrabeoordelaarsbetrouwbaarheid van het meten van lichaamsbalans. Stok, J.R., Reenders, M., Broekmans, S.D.
Abstract DOEL: Afname van propriocepcis in de onderste extremiteit uit zich in een verminderde lichaamsbalans. Afgenomen lichaamsbalans is een risicofactor voor het ontstaan van enkelblessures. Het doel van dit onderzoek is het bepalen van de intrabeoordelaarsbetrouwbaarheid van het meten van lichaamsbalans met een observatielijst. METHODE: Een observatielijst (“de Neuromusculaire Functietest” ) werd gebruikt om de mate van balans op één been te meten. Gezonde proefpersonen (n=17) werden geïncludeerd in het onderzoek. Een getrainde observator voerde de test uit op twee meetmomenten. De proefpersonen werden gemeten volgens een protocol. De lichaamsbalans werd gemeten van het staan op het voorkeursbeen en het nietvoorkeursbeen. ANALYSE: De gewogen Kappa werd berekend voor de intrabeoordelaarsbetrouwbaarheid. RESULTATEN: De gewogen Kappa van score van “het voorkeursbeen” was 0.56. De score van “het niet-voorkeursbeen” had een gewogen Kappa van 0.72 CONCLUSIE: De intrabeoordelaarsbetrouwbaarheid van het meten van de lichaamsbalans is laag. Gebruik van de meting bij wetenschappelijk onderzoek dient nader onderzocht te worden.
Correspondentie adres: Dhr. J.R. Stok Lange Scheistraat 8 2312 CR Leiden 071-5147877
[email protected]
Inleiding Verminderde enkelstabiliteit initieert verminderde propriocepsis van de enkel, wat negatieve invloed heeft op de lichaamsbalans(1). Uit onderzoek is gebleken dat een verminderde enkelstabiliteit na een eerder enkelletsel, een verhoogd risico op enkelblessures impliceert(2,3). De verminderde stabiliteit kan door balanstraining verbeterd worden, waardoor een mogelijk recidief van enkelblessures voorkomen kan worden(4). Voor het bepalen van de lichaamsbalans wordt in het algemeen een krachtenplatform gebruikt. Echter, het gebruik van een krachtenplatform vergt veel kennis, tijd en geld. Een alternatief voor het meten van lichaamsbalans is de “Neuromusculaire Functietest” van Bahr(5). Het gebruik van deze test vergt veel minder tijd, geld en kennis. Daarentegen is deze lijst nog niet beoordeeld voor gebruik in wetenschappelijk onderzoek en in de klinische praktijk. Om dit meetinstrument te gebruiken is het van belang de intrabeoordelaarsbetrouwbaarheid te meten. In de literatuur zijn geen onderzoeksgegevens bekend en er is nog geen onderzoek naar gedaan. Als blijkt dat de intrabeoordelaarsbetrouwbaarheid laag is dan is verder onderzoek naar de interboordelaarsbetrouwbaarheid en validiteit onnodig. Het doel van dit onderzoek is de intrabeoordelaarsbetrouwbaarheid te bepalen voor het meten van lichaamsbalans met de “Neuromusculaire Functietest” bij gezonde proefpersonen. Methode Proefpersonen Een onderzoek werd uitgevoerd onder 17 derdejaars fysiotherapie studenten aan de Hogeschool van Amsterdam. De inclusie criteria waren gezonde mensen tussen de 18 en 25 jaar die de afgelopen 12 maanden vrij zijn geweest van blessures aan de onderste extremiteit, geen operaties hebben ondergaan, geen neurologische aandoeningen hebben die het evenwicht mogelijk kunnen beïnvloeden en een goede visus hebben of met corrigerend middel voor visus. De onderzoekspopulatie moest minimaal 60 minuten voorafgaand aan de test een maaltijd hebben genuttigd om zo een lage bloedsuikerspiegel, wat negatieve invloed kan hebben op concentratie en algemene lichamelijke gesteldheid, te voorkomen. De onderzoekspopulatie had een volledige beheersing van de Nederlandse taal. Het meetinstrument. De “Neuromusculaire Functietest” is een Engelstalige lijst. Gescoord wordt op een ordinale vijfpunts schaal. Voor de verwerking van de gegevens zijn er cijfers toegekend aan de variabelen. De beoordeling was gebaseerd op vijf criteria die twee domeinen omvatten; De tijd (kwantitatief) en het bewegingspatroon (kwalitatief). Score 0 staat voor ernstig abnormaal (severely abnormal) en wordt gescoord als de proefpersoon alleen voor korte periodes op één been kan blijven staan. Bij deze score wordt geen kwalitatieve score toegekend. Score 1 staat voor abnormaal (abnormal) en wordt gescoord als de proefpersoon voor 1 minuut op één been kan blijven staan, maar soms het andere been gebruikt voor het behouden van de lichaamsbalans en wordt gescoord als de proefpersoon niet in staat is om lichaamsbalans te behouden met alleen de enkel, maar moet knieën, heupen en bovenlichaam de hele tijd gebruiken. Score 2 staat voor iets abnormaal (slightly abnormal) en wordt gescoord als de proefpersoon gedurende 1 minuut op één been kan blijven staan en wordt gescoord wanneer de proefpersoon corrigeert met de enkel, maar af en toe de balans moet corrigeren met knieën, heupen en bovenlichaam.
2
Score 3 staat voor normaal (normal) en wordt gescoord als de proefpersoon gedurende 1 minuut op één been kan blijven staan en wordt gescoord als de proefpersoon in staat is om 45 seconden te blijven staan met alleen de enkel als correctie. Score 4 staat voor boven normaal (above normal) en wordt gescoord als de proefpersoon gedurende 1 minuut op één been kan blijven staan en wordt gescoord als de proefpersoon de gehele tijd alleen de enkel gebruikt om de balans te corrigeren en is in staat om, na 1 minuut 15 seconden, met ogen dicht te blijven staan zonder de balans te verliezen.* * Vrije vertaling vanuit de Engelstalige “Neuromusculaire Functietest” van Bahr. Design Een protocol werd opgezet om de metingen zo gestandaardiseerd mogelijk uit te voeren. Tussen de 2 metingen zat exact 1 week. Alle proefpersonen waren gekozen uit twee klassen van het derde jaar fysiotherapie. Ze waren willekeurig ingedeeld in een tijdsschema, die voor de tweede meting opnieuw willekeurig was ingedeeld. De observator heeft geen inzicht in deze indeling gehad. De proefpersonen waren niet ingelicht over de inhoud van de “Neuromusculaire Functietest” en de wijze van scoretoekenning. De meetruimte was een lokaal op de Hogeschool van Amsterdam. Voor de plaats van de meting was gekozen voor een rustige plek in het gebouw, zodat eventuele afleidende omgevingsfactoren die de meting zouden kunnen verstoren waren geminimaliseerd. In de ruimte hing een stip aan de muur op 2 meter hoogte als vast kijkpunt voor de proefpersoon om dwaling van de ogen te voorkomen. De plaats van de proefpersoon werd gemarkeerd met een kruis op 2,5 meter van de muur. Meetprocedure Om de onderzoekers te trainen is voorafgaand het onderzoek een pilot-studie gedaan. Vijf willekeurige studenten aan de HvA werden benaderd om hier aan mee te werken. De proefpersonen werden om de beurt ontvangen in de ruimte waar zij werden ondervraagd zodat zij voldeden aan de inclusiecriteria. Vervolgens werd een korte instructie gegeven hoe de meting zou geschieden waarna de meting startte en de proefpersoon geobserveerd werd door de observator die volgens de “Neuromusculaire Functietest” scoorde. Na de pilotstudie werd het onderzoek uitgevoerd. Hierbij waren drie onderzoekers betrokken. De eerste onderzoeker ontving de proefpersonen buiten de testruimte en nam een controlelijst af om zo na te gaan of de proefpersoon voldeed aan de inclusie criteria. De volgende gegevens van de proefpersonen werden gevraagd: naam, leeftijd, gewicht en lengte. Om eventuele invloed op verminderde balans zichtbaar te maken werd gevraagd naar: gemiddeld gebruik van glazen alcohol per week; nuttiging van alcohol 24 uur voor afname van de test; nicotine gebruik in aantal sigaretten per week; letsels aan de onderste extremiteit; een operatie aan de onderste extremiteit in de afgelopen 12 maanden; aanwezigheid van neurologische aandoeningen; ziekte op de dag van het onderzoek; visusklachten; of in het uur voorafgaand van het onderzoek een maaltijd was genuttigd en of de proefpersoon nog gebruik moest maken van het toilet. Vervolgens werd de proefpersoon gevraagd zich te ontdoen van broek en schoenen. De tweede onderzoeker ontving de proefpersoon in de meetruimte en instrueerde de procedure. In de instructie werd verteld dat de proefpersoon 1 minuut en 15 seconden geobserveerd zou worden terwijl hij op één been stond. Hierbij hield de proefpersoon de armen gekruist voor de borst en werd gevraagd zich te focussen op de stip op de muur. Om de houding uit te proberen werd gevraagd of de proefpersoon voor 10 seconden op één been wilde gaan staan. De tenen van het geheven been kwamen daarbij ter hoogte van de malleolus medialis van het standbeen. Het gekozen standbeen werd genoteerd als voorkeursbeen. Na de 10 seconden moest de proefpersoon weer op twee benen staan. Uitgelegd werd dat na één minuut staan op één been de observator zou vragen de ogen te sluiten gedurende 15 seconden. Daarna was er een laatste mogelijkheid voor de
3
proefpersoon om vragen te stellen. Vervolgens werd de proefpersoon gevraagd op het kruis plaats te nemen en het been te heffen als hij/zij er klaar voor was. De tijdsbewaker nam plaats schuin achter de proefpersoon, buiten het zicht. Vijf seconden nadat de proefpersoon in positie stond startte de tijdsbewaker de stopwatch. De derde onderzoeker was de observator. Deze zat schuin onder stip tegenover de tijdsbewaker en hoorde middels een pieptoon van de stopwatch wanneer de tijd was ingegaan. Na 45 seconden gaf de tijdsbewaker een stil sein aan de observator. Dit nogmaals op 58 seconden. Hierop vroeg de observator de proefpersoon de ogen te sluiten. Na 1 minuut 15 werd de test beëindigd. Na afloop noteerde de observator de score op de “Neuromusculaire Functietest”. De ingevulde score werd na elke observatie aan de tijdsbewaker overhandigd. Bij elke observatie werd gebruik gemaakt van een nieuw scoreformulier. Voor het niet-voorkeursbeen volgde dezelfde procedure. Bij de tweede meting, een week later, werd gestart met hetzelfde been als bij de eerste meting. Analyse Van de 17 proefpersonen zijn beide benen gemeten. Alle gegevens zijn verwerkt in Microsoft Excel en weergegeven in een kruistabel. Voor het uitrekenen van de demografische gegevens werd SPSS gebruikt(6). De gewogen Kappa werd berekend. Hiervoor is gekozen omdat de gegevens op ordinale schaal waren(7). Voor het berekenen van de gewogen Kappa werd StatXact gebruikt(8). Resultaten De onderzoekspopulatie bestond uit 11 vrouwen en 6 mannen. Het alcoholgebruik en rookgedrag was niet noemswaardig. Alle proefpersonen voldeden aan de inclusiecriteria. Er was 1 dropout, wegens uitval bij de tweede meting. De demografische gegevens van de proefpersonen staan in tabel 1. Een overzicht van de scoreverdeling is te zien in tabel 2 en 3. ------------ Invoegen tabel 1 ----------------------- Invoegen tabel 2 ----------------------- Invoegen tabel 3 -----------De gewogen Kappa van score “voorkeursbeen” was 0.56 (0.15-0.97 CI); p=0.02. De score “niet-voorkeursbeen” had een gewogen Kappa van 0.72 (0.44-1.00 CI); p=0.00. Discussie Uit deze studie is naar voren gekomen dat de intrabeoordelaarsbetrouwbaarheid van het meten van de balans van het voorkeursbeen niet adequaat is. De gewogen Kappa van het niet-voorkeursbeen is nét adequaat als uitgegaan wordt van een grens van 0.70 als ondergrens. Opvallend was dat de uitslag van het niet-voorkeursbeen een hogere intrabeoordelaarsbetrouwbaarheid heeft dan het voorkeursbeen. Mogelijk komt dit door een grotere variatie door mindere stabiliteit van het niet-voorkeursbeen, waardoor de score-toekenning makkelijker geschiedt dan bij een meting waarbij de variatie klein is. De reden dat de intrabeoordelaarsbetrouwbaarheid laag is uitgevallen kan komen door verschillende factoren. De kwalitatieve waarden bij de verschillende scores blijkt in de praktijk ontoereikend te zijn. De proefpersoon die op alle punten een 4 zou scoren, krijgt door een enkele beweging van het lichaam score 2. Dit is voor een scorelijst van 5 stappen een te grote overgang. Tevens staat in de kwalitatieve beschrijving van het
4
bewegingspatroon de term: “af en toe”. Met deze ongespecificeerde term is het lastig een juiste score toe te kennen. Het meetinstrument is niet gestandaardiseerd. Buiten het feit dat de armen voor de borst gekruist moesten worden was het geheel onduidelijk wat het protocol van handelen was voor de proefpersoon en de observatoren. Voor dit onderzoek hebben wij zelf een protocol opgesteld en dit bij elke meting toegepast. Hierdoor is de meting wellicht anders verlopen dan Bahr(4) bedoeld zou hebben. De onderzoekspopulatie was homogeen en had geen blessures of andere aandoeningen. Bij onderzoek van deze populatie kan een verschil tussen de metingen moeilijk te observeren zijn geweest, waardoor het toekennen van een score bemoeilijkt wordt. Bij een heterogene groep zou de observatie mogelijk makkelijker kunnen zijn door grotere variatie tussen proefpersonen. De observator die de proefpersonen gemeten heeft, was getraind in het observeren van proefpersonen in een pilotstudie. Het is onduidelijk of de observator meer training nodig gehad zou moeten hebben. Omdat de test zeer eenvoudig af te nemen is, kunnen we er vanuit gaan dat dit weinig tot geen invloed heeft gehad op de uiteindelijke resultaten. Tevens kende de observator een deel van de proefpersonen. Het is niet uitgesloten dat dit invloed heeft gehad op de score doordat de observator bepaalde verwachtingen gehad zou kunnen hebben bij bepaalde proefpersonen. De “Neuromusculaire Functietest” is Engelstalig. Voorafgaand aan het onderzoek is deze test vertaald naar het Nederlands. Het is mogelijk dat de tekst verkeerd vertaald is. Dit heeft mogelijk invloed gehad op de scoretoekenning. Aangezien de gebruikte Engelse taal in deze test niet ingewikkeld is en wij deze taal goed beheersen, kunnen we er van uitgaan dat de invloed hiervan op de score nihil is geweest. De tijd tussen meting 1 en meting 2 was een week. Hiervoor is gekozen omdat de gegeven tijd voor het onderzoek niet toereikend was voor een langere tussentijd. Mogelijk is de tijdsperiode tussen de metingen te klein geweest. De observator kan dan de scores onthouden die bij meting 1 zijn toegekend, waardoor de score van meting 2 gekleurd zou kunnen zijn. Een voordeel van deze relatief korte tussenperiode is dat er minder kans op grote veranderingen van persoonlijke factoren van de proefpersonen en omgevingsfactoren is. Voor vervolgonderzoek bevelen wij aan dit onderzoek opnieuw op te zetten met een aangepaste versie van de test. De aangepaste versie dient een meer onderscheidend vermogen te bevatten. Tevens raden wij aan het onderzoek met een grotere populatie gezonde proefpersonen uit te voeren voor een nauwkeuriger resultaat. Tevens dient dan ook de absolute meetfout van het instrument bepaald te worden, uitgedrukt inde Standard Error of Measurement (SEM). Dankwoord Onze dank gaat uit naar Evert Verhagen en Martin van der Esch voor de begeleiding tijdens het onderzoek.
5
Abstract Intra-rater reliability of body balance measurement. Objective. The reduction of propriocepsis in the lower extremity, causing less balance of the body, is a known risk factor for ankle injuries. The aim of this study is to determine the intra-rater reliability of body balance measurements using an observation list. Methods. The “Neuromuscular Function Test” of Bahr is an observation list for measuring body balance. This list was used for measuring the balance standing on one leg. Healthy persons (n=17) where included in the study. A trained rater observed the two moments of measurement. The subjects were tested according to a protocol. Of each subject first the balance of standing on the preference leg was measured, followed by the balance on the other leg. Analysis. The weighted Kappa was used for the calculation of the intra-rater reliability. Results. The weighted Kappa of the score of the “preference leg measurement” was 0.56. The score of the “non-preference leg measurement” had a weighted Kappa of 0.72. Conclusion. The intra-rater reliability of body balance measurements with the Bahr Neuromuscular Function Test appears to be insufficient for the purpose of scientific research. Key words: intra-rater reliabilityNeuromuscular Function Test
6
Literatuurlijst
1. Hertel, J., Functional Instability Following Lateral Ankle Sprain. Sports Med. Injury Clinic. 2000, 29 (5) 361-371 2. Milgrom, C., Shlamkovitch N, Finestone A, et al: Risk factors for lateral ankle sprains: a prospective study among military recruits, Foot Ankle 1991,12: 26-30, 3. Freeman, M.A., Instability to the foot after injuries to the lateral ligament of the ankle. J. Bone. Joint. Surg. Br., 1965, 47, 669-677. 4. Verhagen E. et al, Ankle sprains in volleyball, players off balance, 2004, Wageningen: Ponsen & Looijen BV 5. Bahr R. Acute ankle injuries. In: Clinical Guide to sports injuries, 2004, Canada, Human Kinetics 6. Baarda, D.B., Dr., Goede, de, M.P.M., Dr., Dijkum, van, C.J. Basisboek statistiek met SPSS : handleiding voor het verwerken en analyseren van en rapporteren over (onderzoeks)gegevens (2e druk), 2003, EPN, Educatieve Partners Nederland, Houten 7. Aufdemkampe G, van den Berg J, van der windt DAWM, Hoe vind ik het? Zoeken,interpreteren en opzetten van fysiotherapeutisch onderzoek, (1e druk), 2000, Bohn Stafleu Van Loghum, Houten/Diegem. 8. Baarda, D.B., Dr., Goede, de, M.P.M., Dr. Basisboek Methoden en Technieken, handleiding voor het opzetten en uitvoeren van onderzoek, 2001, WoltersNoordhoff, Groningen
7
Leeftijd Lengte Gewicht BMI
Gem. 21 1.75 67 22.98
SD 1.7 0.06 6.86 2.08
Tabel 1. Gemiddelde en standaarddeviatie van de demografische gegevens
8
Abnormal Score 1 voorkeursbe en
Abnormal Slightly abnormal Slightly normal Normal Above Normal
Totaal
Score 2 voorkeursbeen Slightly Above normal Normal Normal
Totaal
1
0
0
0
1
0
1
0
0
1
0
5
2
1
8
0
2
0
2
4
0
1
0
1
2
1
9
2
4
16
Tabel 2. Kruistabel van score 1 voorkeursbeen tegenover score 2 voorkeursbeen.
9
Abnormal Score 1 nietvoorkeursbe en
Abnormal Slightly abnormal Slightly normal Normal Above Normal
Totaal
Score 2 niet-voorkeursbeen Slightly Slightly abnormal normal Normal
Above Normal
Totaal
1
0
0
0
0
1
0
3
1
0
0
4
0
0
5
0
1
6
0
0
1
1
1
3
0
0
1
0
1
2
1
3
8
1
3
16
Tabel 3. Kruistabel van score 1 niet-voorkeursbeen tegenover score 2 niet-voorkeursbeen.
10