INHOUDSTAFEL Dit is de korte versie van het onderzoeksrapport betreffende het project “Implementatie en evaluatie van ‘Mindfulness-Based Cognitive Therapy’ in een gezondheidszorgregio in Vlaanderen: een gerandomiseerd klinisch onderzoek.”. Voor meer gedetailleerde uitleg betreffende het project en de resultaten van de verschillende onderzoeksvragen en de meeste bijbehorende tabellen en grafieken verwijzen we naar de uitgebreide en volledige versie van het onderzoeksrapport.
I. ONDERZOEKSOPDRACHT
p. 2
II. EVOLUTIE
p. 4
III. ONDERZOEK
p. 4
A. IMPLEMENTATIESTUDIE Objectieven Resultaten Conclusies B. EFFECTSTUDIE Objectieven Methode Resultaten
p. 4 p. 4 p. 4 p. 6 p. 7 p. 7 p. 9 p. 16
Onderzoeksvraag 1
p. 18
Onderzoeksvraag 2
p. 22
Onderzoeksvraag 3
p. 24
Onderzoeksvraag 4
p. 29
Onderzoeksvraag 5
p. 67
Discussie
p. 68
IV. BELEIDSADVIEZEN
p. 70
V. REFERENTIES
p. 74
VI. BIJLAGEN
p. 78
I. ONDERZOEKSOPDRACHT Depressie wordt door de Wereld Gezondheids Organisatie beschouwd als de ziekte van de 21ste eeuw. Volgens de DEPRES-studie (Depression Research in European Society; Lépine et al, 1997) bedraagt de zesmaandprevalentie van depressie (majeure depressie, mineure depressie en depressieve symptomen) in Europa 17% (Portzky & van Heeringen, 2001). In de ESEMeD-studie (European Study on Epidemiology of Mental Disorders; Bruffaerts et al, 2004) rapporteert 13,6% van de respondenten ooit in zijn/haar leven een depressie in enge zin gehad te hebben. Naar aanleiding van de ‘Gezondheidsenquête 2001’ gaf 5% van de bevraagden in het Vlaams Gewest (15 jaar of ouder) aan in het voorbije jaar een depressie te hebben doorgemaakt (verslagboek Gezondheidsconferentie, 2003). Het hervalrisico bij depressie is groot en patiënten met recidiverende depressies vertonen een sterk verhoogd suïciderisico. Na één depressieve episode hebben patiënten ongeveer 50% kans om te hervallen, na 2-3 episodes stijgt dit percentage tot 70 à 80% (Teasdale et al, 2000; Williams, 2004). Klassiek stelt men dat 60 à 70% van de zelfmoordpogingen ondernomen wordt door personen met depressie. Anders bekeken sterft 15% van de mensen die lijden aan recidiverende, ernstige depressies door zelfmoord. Depressies hebben een aanzienlijke gezondheidseconomische impact. Zij vertegenwoordigen 4% van de totale kosten voor gezondheidszorg en bijna een kwart van de kosten voor geestesziekten (verslagboek Gezondheidsconferentie, 2003). Naar aanleiding van de gezondheidsconferentie over preventie van depressie en zelfmoord in december 2002 werd ‘Mindfulness-Based Cognitive Therapy’ uitgekozen als een van de preventiestrategieën binnen de zesde Vlaamse gezondheidsdoelstelling. Dit op basis van de doeltreffendheid op het vlak van preventie van herval van depressie bij mensen die ten minste drie depressieve episodes hebben meegemaakt (infra) alsook op basis van de mogelijkheid om deze behandeling praktisch te implementeren. In het kader van de zesde Vlaamse gezondheidsdoelstelling (preventie van depressie en zelfmoord) dient de implementatie van ‘Mindfulness-Based Cognitive Therapy’ (MBCT) – een groepspsychotherapeutische interventie bestaande uit een combinatie van meditatie en cognitieve therapie – onderzocht te worden. Uit internationaal onderzoek blijkt MBCT een doeltreffende niet-farmacologische kostenefficiënte psychotherapeutische benadering met het oog op het voorkomen van herval bij patiënten, die reeds meerdere depressieve episoden hebben doorgemaakt en hersteld zijn op het moment van de training (evidence-based). In het onderzoek van Teasdale, Segal, Williams et al (2000) werd de doeltreffendheid van deze aanpak door middel van een RCT aangetoond (follow-up-onderzoek tot een jaar na het beëindigen van MBCT). Bij patiënten met drie of meer depressieve episodes in het verleden was sprake van een significante daling in het risico op herval (66% in de controlegroep versus 37% in de experimentele groep). Ma & Teasdale (2004) stelden in de replicatie van deze studie gelijkaardige resultaten vast. Er kan dus gesteld worden dat een grote, methodologisch goed uitgevoerde studie een duidelijk effect van MBCT aantoont in de preventie van herval in depressie, met name voor die patiënten die al meerdere depressies (drie of meer) hebben doorgemaakt. Aanvullend onderzoek blijft echter nodig, met name naar de aanvaardbaarheid bij hulpverleners en depressieve patiënten, vandaar het belang van deze MBCT-studie. De implementatiemogelijkheden werden in Vlaanderen immers nog niet onderzocht. Ten dien einde wordt deze gerandomiseerde gecontroleerde studie MBCT-pilootstudie voorgesteld.
2
Doelgroep voor deze MBCT-studie zijn de patiënten die lijden aan recidiverende depressie, met ten minste drie depressieve episodes in de voorgeschiedenis en op het moment van inclusie geen acute depressieve status. Verdere gegevens worden vermeld bij de beschrijving van de inclusie- en exclusiecriteria (infra). De studie beoogt de implementatie van de Mindfulness-Based Cognitive Therapy in een Vlaamse context. Het beoogde geografisch gebied voor deze pilootstudie betreft de zorgregio’s Gent, Eeklo, Lokeren en Sint-Niklaas. De Vlaamse Overheid wenst na te gaan in welke mate deze nieuwe behandelingsvorm ingang vindt bij patiënten en verwijzers. Huidig pilootonderzoek omvat enerzijds (1) het naturalistische luik waarbij men zich de vraag stelt naar de implementatiemogelijkheid van MBCT in Vlaanderen, meer bepaald in de pilootzorgregio’s (haalbaarheidsonderzoek). In dit kader inventariseren we de mate van bereidheid tot medewerking – na sensibilisering – van verwijzers (huisartsen, psychiaters, psychologen) en algemene bevolking. De geografische spreiding bij de implementatie en de financiële tegemoetkoming in het kader van de studie kunnen bijdragen tot de drempelverlaging tot deelname aan MBCT. Anderzijds omvat deze pilootstudie (2) het luik effectonderzoek, parallel met het onderzoek van Teasdale et al (2000) en Ma & Teasdale (2004). Beide luiken van de studie worden hierna beschreven. Deze studie wil – naar analogie met de hoger genoemde internationale studies – er tevens toe bijdragen dat aan patiënten een evidencebased behandelingspakket kan aangeboden worden op vlak van hervalpreventie. Er wordt op deze manier aandacht besteed aan tertiaire preventie (voorkomen van nadelige gevolgen van ziekte door voorziening in adequate en kwaliteitsvolle zorgverlening). Aan de hand van de verschillende sessies van de MBCT krijgen patiënten en intermediairen meer inzicht in de werkingsmechanismen van (recidiverende) depressie, met gunstig effect op vlak van behandeling en hervalpreventie. Tengevolge van de uitgebreide sensibiliseringscampagne werden professionelen en patiënten ruim geïnformeerd (kennistoename) en werd een steentje bijgedragen tot het eventueel doorbreken van taboes omtrent depressie. De MBCT-studie omvat een psychiatrisch-psychologisch luik (cf. aard van de bestudeerde problematiek en behandelingsvorm), heeft sociaal en maatschappelijk belang (cf. sensibiliseringscampagne, doorbreken van taboes ...) en kan in de toekomst leiden tot organisatorische en beleidsmatige aanpassingen. Het onderzoek naar de mogelijkheden van deze vernieuwende behandelingsvorm - met het oog op het toevoegen van een efficiënte evidence-based interventie aan de patiëntenzorg bij depressie – heeft een maatschappelijke meerwaarde. Aan de hand van de implementatie van MBCT in een pilootregio kan men de effectiviteit (kosten / baten) toetsen. Een doelstelling vanuit gezondheidseconomisch oogpunt dus. De studie werd uitgevoerd door Prof. Dr C. van Heeringen en Lic. Karen Godfrin – Universitaire Dienst Psychiatrie & Vakgroep Psychiatrie en Medische Psychologie – 1 K12 F UZ Gent. De MBCT-trainingen die in het kader van deze studie georganiseerd werden werden voornamelijk geleid door Dr. David Dewulf, enkele trainingen werden geleid door door hem opgeleide medetrainers.
3
II. EVOLUTIE De MBCT-piloot-studie kan ingedeeld worden in het luik 'implementatiestudie' en het luik 'effectstudie'. De implementatiestudie wordt onmiddellijk hierna besproken, daarna volgt de bespreking van de effectstudie. De studie kan ingedeeld worden in de voorbereidings-, uitvoerings- en evaluatiefase. Tijdens de voorbereidingsfase werden stappen ondernomen op vlak van het onderzoeksopzet, de detectie van de studiedoelgroep (informeren en sensibiliseren van verwijzers en potentiële deelnemers, screenings- (inclusie- / exclusiecriteria deelnemers), de motivatie van de doelgroep, de opstart van een gedecentraliseerd aanbod MBCT, de recrutering en randomisatie van de studiegroep … . De uitvoerings- en evaluatiefase betreft de baselinemeting en follow-up-metingen van de studiegroep van de verschillende onderzoeksvariabelen (patiëntkenmerken en effect van MBCT in vergelijking met TAU) alsook de uitvoering van het luik ‘implementatiestudie’. In de loop van de MBCT-pilootstudie werd de evolutie van de voorbereidings-, uitvoeringsen evaluatiefase duidelijk en uitgebreid beschreven in de verschillende voortgangsrapporten en rapporten in het kader van de stuurgroepen. Dit eindrapport omvat de bespreking van de statistische analyses in het kader van de onderzoeksvragen van deze MBCT-studie.
III. ONDERZOEK A. IMPLEMENTATIESTUDIE Objectieven Door middel van twee enquêtes - een voor een random sample zelfstandig werkende intermediairen (huisartsen, psychiaters, psychologen) en een voor CGG's, telkens binnen de onderzoeksregio van de studie (zorgregio's Eeklo, Gent, Lokeren, Sint-Niklaas) - willen we een beeld krijgen van de kennis van, attitude en verwachtingen tegenover en mate van vroegere en toekomstige doorverwijzingen naar MBCT bij intermediairen. Beide versies van de enquête zijn in bijlage aan dit rapport toegevoegd. De in het verleden ingediende rapporten in het kader van de stuurgroepvergaderingen geven meer informatie omtrent de evolutie van deze enquêtes en de implementatie ervan. Resultaten Hier willen we overzicht bieden van de antwoorden van de intermediairen (opgesplitst in de drie bevraagde beroepscategorieën – huisartsen, psychiaters en psychologen) en van de CGG’s op de verschillende enquête-items (aan de hand van kruistabellen). We kregen zo een zicht op de responsen van hulpverleners uit de eerste, tweede en derde lijnszorg. Tevens hebben we per item een vergelijking gemaakt tussen bovengenoemde drie beroepscategorieën wat betreft de demografische karakteristieken en hun antwoorden op de items (χ2-test). Daar waar relevant worden significante waarden van deze χ2-tests vermeld. Indien SPSS aangeeft dat de χ2-test niet ‘valid’ is (de validiteit van de χ2-test komt immers in het gedrang wanneer de frequenties in de cellen van de betreffende kruistabellen klein zijn), dient de waarde van de Fisher’s exact test te worden geïnterpreteerd; ook hiervan worden, daar waar relevant, de
4
significante resultaten vermeld. Meer informatie wordt beschreven bij de conclusies enerzijds en bij de beleidsadviezen (infra) anderzijds. Demografische karakteristieken Intermediairen Van de 341 opgestuurde enquêtes naar een random sample huisartsen, psychiaters en psychologen (200 opgestuurd in een eerste ronde, 141 in een tweede ronde) hebben we er slechts 90 ingevuld ontvangen, een respons rate van 90/341 (± 26%) (respons rate eerste ronde: 58/200 (29%); respons rate tweede ronde: 32/141 (23%)). Variabele Regio (N - %) Eeklo Gent Lokeren Sint-Niklaas Totaal Sekse (N - %) Mannen Vrouwen Leeftijd (M ± SD)
Psychologen N-%
Psychiaters N-%
Huisartsen N -%
5.9 76.5 0.0 17.6
1 6.7 12 80.0 0 0.0 2 13.3
6 10.3 25 43.1 9 15.5 18 31.0
17 18.9
15 16.7
58
64.4
5 12
8 7
44 14
75.9 24.1
1 13 0 3
29.4 70.6
40.53(9.45)
53.3 46.7
48.00(9.62)
Totaal N-% 8 50 9 23
8.9 55.6 10.0 25.6
90 100.0
48.40(10.04)
Sekse: χ2 = 12.99, df = 2, p = .002 . CGG Van de 15 opgestuurde enquêtes naar de CGG's gelokaliseerd in de pilootregio van de MBCT-studie hebben we er 7 ingevuld ontvangen, een respons rate van 7/15 (± 47%) Variabele Regio (N - %) Eeklo Gent Lokeren Sint-Niklaas Totaal Leeftijd (M ± SD)
CGG 1 3 2 1
14.3 42.9 28.6 14.3 7
46.43 (3.78)
5
Enquêtevariabelen Volgende aspecten worden in de enquête bevraagd: kennis over MBCT, attitude en verwachtingen tegenover MBCT, doorverwijzingen naar MBCT tot op heden (patiënten met recidiverende depressie) alsook mate van bereidheid voor toekomstige doorverwijzingen, reactie en feedback van patiënten na informatie over en eventuele deelname aan MBCT, wens tot bijscholing. Voor een gedetailleerd overzicht van de responsen van huisartsen, psychiaters, psychologen en CGG’s verwijzen we naar het uitgebreid rapport van deze pilootstudie. Bij onderstaande conclusies alsook bij de beleidsadviezen worden de resultaten van deze enquête besproken. Conclusies Door middel van de enquête krijgen we een beeld van de kennis van, attitude en verwachtingen tegenover en mate van vroegere en toekomstige doorverwijzingen naar MBCT bij de deelnemende intermediairen en de CGG’s. In zekere zin geven de resultaten van deze enquêtes (naast het grote aantal studiedeelnemers die zich voor de studie aanmeldden - zie hiervoor het luik 'effectstudie' (infra)) ook een beeld van de haalbaarheid van implementatie van MBCT in Vlaanderen, in de pilootregio, gezien we te weten komen of MBCT de steun krijgt van hulpverleners in het kader van doorverwijzing van hun patiënten die in aanmerking komen voor MBCT. De antwoorden van de intermediairen en CGG's zijn gezien de (vrij lage) respons rate (zeker bij de intermediairen van wie slechts ongeveer 26% gereageerd heeft; ongeveer 47% voor de CGG's) echter niet te extrapoleren naar de globale groep van hulpverleners. De resultaten in de tabellen betreffende de CGG's betreffen de globale antwoorden van de CGG-teams die bestaan uit een of meerdere psychiaters, psychologen, maatschappelijk assistenten ...; de antwoorden van de andere intermediairen zijn hun individuele antwoorden. Voor de drie groepen intermediairen (drie beroepscategorieën - psychiaters, psychologen, huisartsen) berekenden we per enquête-item (indien sprake van een voldoende hoge respons rate op het item i.t.t. een lage respons rate die te wijten kan zijn aan het hoge aantal 'niet van toepassing'-antwoorden) de chi-kwadraat-statistiek en/of de Fisher's exact test - een manier om categoriale variabelen te analyseren, meer bepaald om na te gaan of er een associatie bestaat tussen de beroepscategorie van intermediairen en de antwoordcategorie van het enquête-item. Daar waar de net genoemde statistieken relevant én significant zijn, dus waar sprake is van een associatie tussen de beroepscategorie en de antwoordcategorie, werd de waarde ervan bij de tabellen vermeld. De chi-kwadraat-test betreffende ‘sekse’ toont aan dat er een significant verschil bestaat tussen de drie groepen intermediairen (kan misschien ook verklaard worden daar de ‘pool’ huisartsen de grootste beroepscategorie is) per categorie mannen / vrouwen (cf. vermelde %), alsook dat sprake is van een significant verschil per beroepscategorie wat betreft de sekse-ratio (cf. vermelde %). Zo zijn er bij de psychologen significant meer vrouwen in de sample, bij de huisartsen significant meer mannen (twee verhoudingen waarmee we dagdagelijks geconfronteerd worden). De Fisher’s exact tests in verband met ‘kennis over inhoud en vorm van MBCT’ en ‘kennis over praktische implementatie van MBCT’ (zie vermelde %) tonen aan dat er per antwoordcategorie van deze beide enquête-items een significant verschil bestaat tussen de beroepscategorieën (bv. significant meer huisartsen hebben helemaal nog geen kennis over de inhoud en vorm en praktische implementatie van MBCT) alsook dat per beroepscategorie significante verschillen
6
merkbaar zijn in het antwoordpatroon (bv. de psychiaters duiden meer aan dat ze ‘veel’ kennis hebben over MBCT dan ‘helemaal niet of een beetje’). De Fisher’s exact test betreffende ‘heeft u reeds patiënten met recidiverende depressie doorverwezen naar MBCT’ leert dat er een significant verschil bestaat tussen de beroepscategorieën wat betreft het percentage patiënten met recidiverende depressie dat zij reeds doorverwezen hebben naar MBCT. Zo blijkt dat dit percentage het grootst is bij de psychiaters, een groep die in de praktijk ook meest in aanmerking zal komen met de betreffende patiëntengroep én die – in vergelijking met bijvoorbeeld huisartsen – meer opgeleid is om deze specifieke diagnose te stellen. Van sommige items in de enquête zijn ook kwalitatieve gegevens beschikbaar, daar waar de respondenten hun antwoord op een open vraag konden noteren. Een overzicht van deze antwoorden vindt u in een bijlage bij het uitgebreid onderzoeksrapport.
B. EFFECTSTUDIE Objectieven Wetenschappelijk kader Ons artikel in het Tijdschrift voor Geneeskunde en ons hoofdstuk uit het Handboek voor Psychiatrie en Psychotherapie worden in bijlage aan het uitgebreid onderzoeksrapport toegevoegd. Op deze manier wordt een duidelijk overzicht geboden van MBCT en de rol ervan binnen het domein van hervalpreventie van recidiverende depressie. Onderzoeksvragen en -hypothesen In deze effectstudie willen we een antwoord formuleren op de onderstaande onderzoeksvragen. In wat volgt gebruiken we steeds de afkortingen E en C om te verwijzen naar respectievelijk de experimentele groep en de controlegroep van de studie. Onderzoeksvraag 1: Hoe scoort de onderzoekspopulatie bij aanvang van de training (baseline assessment) ? Vergelijking van de baseline kenmerken van de onderzoekspopulatie (E versus C) op vlak van (1) demografische karakteristieken, (2) klinische karakteristieken (voorgeschiedenis en huidige situatie) en (3) variabelen gemeten door middel van de vragenlijsten. De scores van E en C (ook opgesplitst mannen versus vrouwen) op vlak van de vragenlijstvariabelen worden tevens vergeleken met normwaarden, om zo na te gaan of deze specifieke onderzoekspopulatie significant verschillend scoort dan ofwel een psychiatrische normpopulatie ofwel een ‘normale’ referentiegroep. Onderzoeksvraag 2: Hoe scoort de onderzoekspopulatie op de verschillende follow-up-meettijdstippen ? Vergelijking van de kenmerken van de onderzoekspopulatie (E versus C) op de verschillende follow-up-meettijdstippen op vlak van verandering qua (1) demografische karakteristieken, (2) klinische karakteristieken en (3) variabelen gemeten door middel van de vragenlijsten. De scores van E en C op vlak van de vragenlijstvariabelen worden tevens vergeleken met normwaarden, om zo na te gaan of deze specifieke onderzoekspopulatie significant verschillend scoort dan een ‘normale’ referentiegroep. 7
Onderzoeksvraag 3: Oefent MBCT een effect uit op het hervalrisico in depressie ? Vergelijking binnen de onderzoekspopulatie (E versus C) van het risico op herval in depressie tijdens een follow-up-periode van iets meer dan een jaar. De tijd tussen de start aan de studie en een eerste herval in depressie wordt nagegaan voor de experimentele en controlegroep. Onderzoeksvraag 4: Oefent MBCT bij de onderzoekspopulatie (E versus C) een effect uit op vlak van primaire en secundaire uitkomstvariabelen ? Primaire uitkomstvariabelen Dit zijn de variabelen algemene psychiatrische / psychische status, depressieve symptomen en suïcidaliteit. (1) Beck Depression Inventory: leidt het volgen van MBCT tot een verandering in / vermindering van depressieve symptomen ?
(2) Hamilton Rating Scale for Depression: leidt het volgen van MBCT tot een verandering in / vermindering van depressieve symptomen ?
(3) Profile of Moods Scale: leidt het volgen van MBCT tot een verandering in psychische status ?
(4) Suïcidaliteit: leidt het volgen van MBCT tot een verandering in de variabelen gelinkt aan suïcidaliteit ?
Secundaire uitkomstvariabelen Dit zijn de intermediaire – cognitieve / neuropsychologische – variabelen (// kwetsbaarheid voor depressie): hopeloosheid, angst (state/trait), ruminatie, coping, mindful awareness, levenskwaliteit. (5) Beck Hopelessness Scale: leidt het volgen van MBCT tot een verandering in / vermindering van gevoelens van hopeloosheid ?
(6) Zelf Beoordelings Vragenlijst: leidt het volgen van MBCT tot een verandering in / vermindering van angstgevoelens ?
(7) Ruminative Response Scale: leidt het volgen van MBCT tot een verandering in / daling in ruminatie ?
(8) Utrechtse Coping Lijst: leidt het volgen van MBCT tot een verandering in copingstijl ?
(9) Mindful Attention and Awareness Scale: leidt het volgen van MBCT tot een verandering in / stijging van de ‘mindful attention awareness’ (aandachtscomponent) ?
(10) Quality of Life in Depression Scale: leidt het volgen van MBCT tot een verandering in / verbetering van levenskwaliteit ?
Onderzoeksvraag 5: Wat zijn de verwachtingen van de onderzoekspopulatie ten opzichte van MBCT en hoe evalueren zij de training ? Evalueren van de motivatie tot deelname van de studiedeelnemers, alsook hun verwachtingen aangaande MBCT. Tevens zijn we geïnteresseerd in de persoonlijke evaluatie van de deelnemers omtrent formele en praktische aspecten van de training (training-, groeps- en therapeutkenmerken) en trachten we hierbij na te gaan in hoeverre aan de verwachtingen van de deelnemers voldaan is.
8
Methode Onderzoeksopzet De MBCT-pilootstudie is een gecontroleerde en gerandomiseerde klinische studie: vergelijking tussen de experimentele conditie (MBCT + TAU) en de controleconditie (TAU) (TAU = treatment-as-usual) - eigen aanmelding door kandidaat-deelnemers of aanmelding via verwijzer. Na een initiële behandelingsfase van 2 maanden volgt een follow-up-fase van ongeveer 1 jaar (longitudinal interventional design). De controlegroep krijgt de kans om na de volledige follow-up-fase ook te participeren aan MBCT (delayed wait list control), doch omwille van de voorziene duur van de studie konden deze personen niet meer verder opgevolgd worden na hun deelname aan MBCT. Er werd per meetmoment nauwkeurig aan de patiënten uit de controleconditie gevraagd welke (onderhouds)behandeling (TAU) zij in het kader van recidiverende depressie volgden. Ook aan de patiënten uit de experimentele conditie werd gevraagd welke (onderhouds)behandeling in het kader van recidiverende depressie zij volgden naast de MBCT.
EXPERIMENTELE conditie
algemene bevolking hulpverleners
2 instroomkanalen
CONTROLE
algemene bevolking
algemene bevolking
hulpverleners
hulpverleners
CONDITIE
pre
post
6m FU
12m FU
Voor alle verdere gegevens omtrent het onderzoeksopzet (o.a. informed consent, randomisatieprocedure …) verwijzen we naar de voortgangsrapporten en de verslaggeving voor de stuurgroepen. Onderzoekspopulatie Inclusie- en exclusiecriteria De inclusie- en exclusiecriteria bakenen de onderzoekspopulatie duidelijk af, zodat de resultaten van de statistische analyses uitgevoerd bij deze studiesample gelinkt zijn aan een specifieke onderzoeksgroep. De onderzoekscriteria zijn niet te restrictief, anders zou de doelgroep niet representatief genoeg zijn en zou er sprake zijn van een selectiebias die de resultaten kan beïnvloeden.
9
De onderstaande tabel geeft een overzicht van de gelijkenissen en verschillen tussen deze MBCT-pilootstudie en de studies van Teasdale et al (2000) en Ma & Teasdale (2004). van Heeringen, & Godfrin
Teasdale, Segal, Williams, Ridgeway, Soulsby, & Lau (2000) (a)
(2004-2008) MBCT-pilootstudie
Ma, & Teasdale (2004) (b)
INCLUSIEcriteria Age: 18 Years and older Place of residence in accordance with a welldefined region (pilot study). * Diagnosis of recurrent depression (DSM-IV-TR).
≠ ≠
=
* At least 3 depressive episodes in history (depression: either primary or secondary diagnosis).
≠
* Last depressive episode at least 8 weeks ago (DSM-IVTR).
≠
* No current depressive episode.
=
Age: 18 – 65 years.
=
Age: 18 – 65 years.
Meeting DSM-III-R-criteria for a history of recurrent MD
=
Meeting DSM-IV-criteria for a history of recurrent MD (these
(these normally require a history of 2 or more previous episodes of DSMIII-R MD in the absence of a history of (hypo)mania; in addition we required that at least 2 episodes of MD occurred within the past 5 years and that at least 1 of those episodes was within the past 2 years).
=
normally require a history of 2 or more previous episodes of DSM-IV MD in the absence of a history of (hypo)mania; in addition we required that at least 2 episodes of MD occurred within the past 5 years and that at least 1 of those episodes was within the past 2 years).
(***)
History of treatment by an antidepressant medication.
=
≠
History of treatment by a recognized antidepressant medication (a.m.), but off a.m., and in recovery /remission, at the time of baseline assessment and for at least the preceding 12 weeks
=
=
Having a history of treatment by a recognized a.m., nut being off a.m. and in recovery/remission at the time of baseline assessment and for at least the preceding 12 weeks.
(it was not possible to determine the adequacy of treatment by a.m.; rather, this criterion was used as an indicator that, in the naturalistic course of service delivery, patients had been judged as appropriate for pharmacotherapy by a treating physician).
HRSD-score <14 at baseline assessment (Hamilton Rating
≠
At baseline assessment a 17item HRSD-score of < 10.
Scale for Depression, HRSD-17).
Given informed consent.
10
=
At baseline assessment a 17item HRSD-score of < 10.
EXCLUSIEcriteria Schizophrenia or schizoaffective disorder in the anamnesis. Based on DSM-IV-TR current diagnosis of any of the following psychiatric disorders: current substance abuse, obsessive-compulsive disorder.
=
History of schizophrenia or schizoaffective disorder.
=
History of schizophrenia or schizoaffective disorder.
=
Current substance abuse, eating disorder or obsessivecompulsive disorder.
=
Current substance abuse, eating disorder or obsessivecompulsive disorder.
Based on DSM-IV-TR current diagnosis of any of the following psychiatric disorders: organic mental disorder, pervasive developmental disorder.
=
Organic mental disorder, pervasive developmental delay or borderline personality disorder.
=
Organic mental disorder, pervasive developmental delay or borderline personality disorder.
Based on DSM-IV-TR current primary diagnosis of axis-II-disorder. Based on DSM-IV-TR current diagnosis of dysthymia. Based on DSM-IV-TR current diagnosis of any of the following psychiatric disorders: lifetime mood disorder, chronic depression, bipolar disorder, acute psychosis, cognitive disorder, mental retardation, at risk for suicide. Physical problems which make it difficult to participate in the programme.
≠ Dysthymia before age 20.
=
Dysthymia before age 20.
≠
> 4 sessions of cognitivebehavioral treatment (CBT) ever.
=
> 4 lifetime sessions of CBT.
Intensive psychotherapy during the training and follow-up. More than 1 psychiatric consultation per 3-4 weeks during the training and follow-up. Extended experience with zen- or vipassana meditation (or mindfulness) in the past. More than 1 hour practice of zen- or vipassana meditation (or mindfulness) per week during the last 8 weeks.
≠
Current psychotherapy counseling > 1x/month.
or
=
Current psychotherapy counseling > 1x/month.
Current practice of meditation >1x/week or yoga >2x/week.
≠
Other meditation practices except for MBCT during the training.
≠
≠ ≠
≠
≠
≠ ≠
11
or
(a) Teasdale J.D., Segal Z.V., Williams, J.M.G., Ridgeway V.A., Soulsby J.M., & Lau M.A. (2000). Prevention of relapse/recurrence in major depression by Mindfulness-Based Cognitive Therapy. Journal of Consulting and Clinical Psychology, 68(4), 615-623. (b) Ma S.H., & Teasdale J.D. (2004). Mindfulness-Based Cognitive Therapy for depression: replication and exploration of differential relapse prevention effects. Journal of Consulting and Clinical Psychology, 72(1), 31-40. (***) “The reason for including only those with three or more previous episodes of depression is that research carried out to date on MBCT (2000, 2004) has shown that the treatment is not effective in those who have had fewer episodes of depression.” (2007)
Recrutering Alle gegevens omtrent de recrutering van de onderzoekspopulatie werden beschreven in de vroegere voortgangsrapporten en tussentijdse rapporten in het kader van de stuurgroepvergaderingen. Meetmomenten en meetinstrumenten De totale looptijd van de studie betreft 56 weken = 8 weken MBCT / TAU + 48 weken follow-up. Gedurende deze periode werden alle studiedeelnemers op 4 meettijdstippen geëvalueerd: (1) intakegesprek / pre-meting: baseline evaluatie (week 0), (2) post-meting: evaluatie 8 weken na pre (week 8), (3) FU-6M-meting: evaluatie 6 maanden na post (week 32) en (4) FU-12M-meting: evaluatie 6 maanden na FU-6M (week 56). Deze evaluatie gebeurt aan de hand van gestandaardiseerde gestructureerde interviews en intake- en followup-gesprekken met de studiedeelnemers enerzijds en zelfrapportagevragenlijsten ingevuld door de studiedeelnemers anderzijds. De keuze van de gehanteerde vragenlijsten is gebaseerd op literatuuronderzoek en overleg met experts ter zake. De primaire uitkomstvariabelen van deze studie zijn de volgende (tussen haakjes wordt telkens vermeld door welke instrumenten deze variabelen gemeten worden): algemene psychiatrische / psychische status (SCID-I, Intake, POMS), depressieve symptomen (HRSD, BDI), suïcidaliteit (SCID, HRSD, BDI, BHS). De secundaire uitkomstvariabelen van de studie zijn de intermediaire – cognitieve / neuropsychologische – variabelen (gelinkt aan de kwetsbaarheid voor depressie): hopeloosheid (BHS), coping (UCL), angst (state/trait) (ZBV), ruminatie (RRS), mindful awareness (MAAS), levenskwaliteit (QLDS), persoonlijkheidstrekken (TCI), mate van geloof in en verwachtingen ten opzichte van MBCT (CEQ). Vooreerst beschrijven we kort de rationale voor het includeren van enkele van de bovenstaande variabelen in deze MBCT-studie. Een volledige uiteenzetting zou te ver leiden in het kader van dit onderzoeksrapport. MBCT werd ontwikkeld als hulp bij de risicoreductie voor herval van depressie (Mason & Hargreaves, 2001). Zo worden deelnemers – hersteld van episodes van majeure depressie – geholpen zich meer bewust te worden van hun negatieve gedachten en emoties, alsook van het veranderingsproces betreffende de wijze waarop zij zich ten opzichte van deze gedachten en gevoelens verhouden, meer bepaald zodanig dat zij het vermijden hierop te focussen. Deelnemers leren dat zij in contact kunnen komen met het huidige moment, zonder te moeten rumineren omtrent het verleden, of zich zorgen te maken over de toekomst. Bij een ‘mindful’ persoon reageert de geest op een nieuwe manier bij iedere unieke ervaring in plaats van ‘mindless’ te reageren ten opzichte van deelervaringen, meer bepaald door middel van oude, relatief stereotiepe, routinematige gedachtepatronen (Segal, Williams, & Teasdale, 2002). 12
Hopeloosheid speelt een zeer belangrijke rol in suïcidaliteit. Bij depressieve psychiatrische toestandsbeelden zou de ernst van de hopeloosheid de belangrijkste voorspellende waarde hebben wat betreft het optreden van suïcidaal gedrag (van Heeringen, 1999; Portzky & van Heeringen, 2001). Met de term hopeloosheid verwijst men naar het feit dat de betrokkene zich geen positief beeld van de toekomst kan vormen. Een factor die bijdraagt tot de waarschijnlijkheid van herval in depressie is de mate van vertrouwen van een deelnemer in zijn coping met een hoogrisicosituatie (Marlatt & Gordon, 1985; Breslin et al, 2002). Het verwerven van ‘mindfulness skills’ is een van de doelstellingen van de MBCT (Mason & Hargreaves, 2001). De deelnemers leren vaardigheden aan die hen helpen de terugkeer van depressie te voorkomen, meer bepaald leidt mindfulness tot een betere omgang met stress en tot effectieve probleemoplossing (cf. boek Williams). MBCT wordt gehanteerd als ‘counter’ voor ‘relapse’ en ‘recurrence’ van depressie. De theorie van Nolen-Hoeksema (1987, 1991) stelt voorop dat de reactie van een persoon op een depressieve stemming het verloop, waaronder de duur en de ernst verlengt (Raes et al, 2003). ‘Rumineren’ wordt gedefinieerd als herhaaldelijk denken en doen, gericht op de symptomen van de depressie, de mogelijke oorzaken en de gevolgen ervan. Het wordt gezien als een cognitieve kwetsbaarheidsfactor voor zowel het optreden (Nolen-Hoeksema, 2000) als het minder gunstige verloop van de depressie. Zoals Teasdale et al (2000) melden beoogt MBCT “to disengage from dysphoria-activated depressogenic thinking”. “Metacognitive awareness is a cognitive set in which negative thoughts / feelings are experienced as mental events, rather than as the self.” (Teasdale, Moore et al, 2002). Een verminderde ‘metacognitive awareness’ gaat gepaard met een vulnerabiliteit voor depressie. Volgens Teasdale et al (2002) verminderen cognitieve therapie en MBCT de kans op herval in depressie gezien de toegenomen ‘metacognitive awareness’. Tenslotte is het van belang om de variabele ‘levenskwaliteit’ te meten. Zoals Bruffaerts et al (ESEMeD, 2004) stellen wordt in de huidige tijdsperiode het begrip gezondheid niet langer gedefinieerd aan de hand van een mortaliteitscriterium, maar hebben concepten als ‘kwaliteit van leven’ en ‘mentale gezondheid’ gradueel aan belang gewonnen. Hieronder volgt een korte beschrijving van deze vragenlijsten. Gestructureerd Klinisch Interview voor de vaststelling van DSM-IV As-I Stoornissen (SCID-I) De SCID-I is een gestructureerd klinisch interview voor het vaststellen van psychiatrische stoornissen gebaseerd op de DSM-IV As I. Het interview van de SCID-I heeft betrekking op de as I stoornissen van de DSM-IV, zoals stemmingsstoornissen, schizofrenie en andere psychotische stoornissen, aan een middel gebonden stoornissen, angststoornissen, somatoforme stoornissen en eetstoornissen. (van Groenestijn et al, 1999). Hamilton Rating Scale for Depression (HRSD) De Hamilton-schaal (Hamilton, 1960) werd oorspronkelijk ontwikkeld om de intensiteitsveranderingen van depressiesymptomen te meten bij klinische tests met antidepressiva, maar geleidelijk werd het gebruik ervan uitgebreid naar andere klinische tests. Vandaag wordt de schaal zelfs gebruikt als diagnose-instrument in de dagelijkse praktijk. (Oswald, 2007) De HRSD is een vaak gebruikte maat voor de ernst van depressie en bevraagt
13
een waaier van affectieve, gedragsmatige en biologische symptomen (17-items) en heeft aanvaardbare psychometrische eigenschappen. Intake-interview/ Follow-up-interview Meting en inventarisatie van inclusie- en exclusiecriteria, de depressieve stemming, het aantal depressieve episodes in de voorgeschiedenis en het aantal relapsen van depressie, comorbide psychopathologie, relevante demografische en aan de behandeling gekoppelde gegevens, de verwachtingen van de deelnemers … . Op het einde van de training beogen we de mening van de deelnemers over de bijgewoonde sessies (onder meer betreffende de inhoud van de training, hoe men zelf de training beleefde, hoe men ermee omging, hoe men zichzelf zag in de groep) te inventariseren. Tevens gaan we na of de training aan de verwachtingen heeft voldaan en welke veranderingen bewerkstelligd werden. Zowel van het intakeformulier als het follow-up-formulier is in bijlage een exemplaar toegevoegd aan dit rapport. Beck Depression Inventory - II - Nederlandstalige versie (BDI-II) De Beck Depression Inventory-Second Edition is een veelgebruikte korte zelfrapportagevragenlijst (21 items) voor het meten van de algehele ernst van een depressie en bevraagt een waaier van affectieve, cognitieve, motivationele, gedragsmatige en somatische / biologische symptomen van depressie. De deelnemers dienen uit elk rijtje één uitspraak aan te duiden, meer bepaald die uitspraak die het best omschrijft hoe zij zich de ‘afgelopen twee weken met vandaag erbij’ gevoeld hebben (Beck, 1987, 2002; van der Does, 2002). Deze vragenlijst heeft aanvaardbare psychometrische eigenschappen. Beck Hopeloosheids Schaal (BHS) Deze schaal bestaat uit 20 juist-onjuist stellingen, die de drie belangrijke aspecten van hopeloosheid meten: gevoelens met betrekking tot de toekomst, verlies van motivatie en verwachtingen. (Beck et al, 1988; De Clerck et al, 2006) Utrechtse Coping Lijst (UCL) Deze vragenlijst meet copinggedrag (47 items) en gaat dus na hoe mensen omgaan met problemen en gebeurtenissen. Mensen reageren vaak heel verschillend als zij met problemen of onplezierige gebeurtenissen te maken krijgen. Wat men in een bepaald geval doet hangt sterk af van de aard van het probleem of de gebeurtenis en de ernst ervan. Toch reageert men ‘over het algemeen’ wat vaker op de ene dan op de andere manier. De vragenlijst omvat beschrijvingen die aangeven wat men zoal kan denken of doen als er problemen zijn. De deelnemers dienen achter iedere zin aan te geven hoe vaak zij in het algemeen op de beschreven manier reageren. Er worden in deze vragenlijst 7 subschalen onderscheiden (deze worden verder beschreven bij onderzoeksvraag 4 - infra). (Schreurs et al, 1988, 1993) Zelf Beoordelings Vragenlijst (ZBV) Deze vragenlijst is de Nederlands bewerking van de Spielberger State-Trait Anxiety Inventory. De vragenlijst is opgebouwd aan de hand van twee luiken. Enerzijds dienen de deelnemers bij iedere uitspraak aan te geven hoe zij zich voelen, dus ‘nu op dit moment’ (angst als een toestand). Anderzijds dienen zij bij iedere uitspraak aan te geven hoe zij zich ‘in
14
het algemeen’ voelen (angst als een kenmerk van de persoonlijkheid). (van der Ploeg, Defares, & Spielberger, 1979; van der Ploeg, 2000) Profile Of Moods Scale - Nederlandstalige versie (POMS) De POMS is een zelfbeoordelingsschaal voor wisselende gemoedstoestanden (van der Ark et al; Wald & Mellenbergh, 1990). De gemeten aspecten worden verder beschreven bij onderzoeksvraag 4 – infra. Quality of Life in Depression Scale - Nederlandstalige versie (QLDS) De QLDS is een zelfrapporteringsschaal (34 items) om de levenskwaliteit van depressieve patiënten te meten. (Tuynman-Qua et al, 1992). Ruminative Response Scale - Nederlandstalige versie (RRS) Mensen denken en doen heel wat verschillende dingen wanneer ze droevig zijn, zich triest, neerslachtig of depressief voelen. Deelnemers dienen bij elk van de uitspraken aan te geven of ze ‘bijna nooit’, ‘soms’, ‘vaak’ of ‘bijna altijd’ datgene denken of doen wat in elke uitspraak beschreven staat, dit ‘wanneer zij zich droevig, neerslachtig of depressief voelen’. Het is de bedoeling dat zij aangeven wat zij dan doorgaans doen, niet wat ze denken dat ze zouden moeten doen. (Raes, Hermans, & Eelen, 2001) Mindful Attention and Awareness Scale - Nederlandstalige versie (MAAS) Deze zelfrapportagevragenlijst (15 items) beoogt het ‘mindfulness-niveau’ van een persoon te meten. (Brown & Ryan, 2003) Nederlandse vertaling, na toestemming van auteurs, door Godfrin, Goeleven & Schoof (2004). Credibility and Expectancy Questionnaire - Nederlandstalige versie (CEQ) De CEQ is een snelle en eenvoudig af te nemen schaal om de verwachtingen van personen over de te volgen behandeling (“expectancy”) alsook van geloof in de behandeling (“credibility”) te meten. (Devilly & Borkovec, 2000) Nederlandse vertaling, na toestemming van auteurs, door Godfrin, Goeleven & Schoof (2004). Temperament and Character Inventory - Nederlandstalige versie (TCI) De TCI beoogt persoonlijkheidsaspecten te meten. De temperament-en karakterschalen worden bij onderzoeksvraag 1 vermeld (infra). Deze vragenlijst (240 items) omvat uitspraken die mensen gebruiken om hun houdingen, meningen, interesses en andere persoonlijke gevoelens te beschrijven. De deelnemers dienen te beschrijven hoe zij zich ‘gewoonlijk of in het algemeen’ gedragen en voelen, niet alleen hoe zij zich op dit moment voelen. (Duijsens & Spinhoven, 2000) De onderstaande tabel geeft een overzicht wanneer welke meetinstrumenten door wie gehanteerd en ingevuld worden.
15
PRE
POST
FU-6
FU-12
MBCT Researcher
Deelnemer
Intakeformulier. SCID HRSD DSM-IV-TR BDI-II-NL BHS UCL ZBV POMS QoL RRS MAAS CEQ TCI
SCID HRSD DSM-IV-TR FU-?lijst
SCID HRSD DSM-IV-TR FU-?lijst
SCID HRSD DSM-IV-TR FU-?lijst
BDI-II-NL BHS UCL ZBV POMS QoL RRS MAAS
BDI-II-NL BHS UCL ZBV POMS QoL RRS MAAS
BDI-II-NL BHS UCL ZBV POMS QoL RRS MAAS
Evaluatie?lijst TAU Researcher
Idem
Idem
Idem
Idem
Deelnemer
Idem
Idem
Idem
Idem
Data-analyse Voor het opstellen van de datamatrix en de analyses van de resultaten hanteerden we SPSS voor Windows versie 15.0. Van de meeste vragenlijsten werden de ruwe itemscores ingevoerd en werd de score op de verschillende subschalen berekend, van enkele vragenlijsten werden enkel de ruwe schaalscores in de datamatrix ingevoerd. Voor de beschrijving van de gehanteerde statistische analyses verwijzen we naar de weergave en bespreking van de onderzoeksresultaten (zie uitgebreid onderzoeksrapport). Resultaten Om een antwoord te krijgen op hogergenoemde onderzoeksvragen maken we gebruik van een scala aan statistische tests. Er wordt steeds tweezijdig getoetst. Bij het uitvoeren van de statistische analyses wordt de intent-to-treat-sample gehanteerd, hiermee wordt de totale onderzoekspopulatie bedoeld. “The intent-to-treat sample provides a stringent test of whether the MBCT and TAU groups differed in outcome, reducing possible artifactual selective effects of differential attrition from the two treatment conditions … .” (Teasdale, Segal et al, 2000) Bij de beschrijving van de onderzoeksresultaten hanteren we de significantieniveaus .05 (p ≤ .05), .01 (p ≤ .01) en .001 (p ≤ .001) waarbij de p-waarde ‘as such’ wordt weergegeven zodat ook ‘borderline significante resultaten’ tot uiting komen (klinisch relevantie versus statistische significantie). De resultaten van de statistische analyses worden in het uitgebreid onderzoeksrapport per onderzoeksvraag beschreven en geïnterpreteerd, waarbij het resultaat geconcretiseerd wordt in de zin dat dit beschreven wordt in termen van de subschalen en het codeboek. In de deze beknopte versie van het onderzoeksrapport beperken we ons tot de beschrijving van de samenvattende resultaten. Aan de hand van de verschillende onderzoeksvragen verkrijgen we informatie in verband met het effect van
16
MBCT op vlak van depressie enerzijds en suïcidaliteit anderzijds (survival analyse in het kader van onderzoek naar de effectiviteit van MBCT op vlak van hervalpreventie voor depressie – met depressie als risicofactor voor suïcide – en repeated measures analyses op vlak van variabelen die gelinkt zijn aan depressie en suïcidaliteit of de ‘suicidal mode of mind’). De studieresultaten vormen ook de basis voor de verder in dit rapport beschreven beleidsadviezen. Onderzoeksgroep De totale onderzoekspopulatie bestaat uit 106 personen, waarvan 54 personen tot de experimentele conditie behoren (50.9%) en 52 personen tot de controleconditie (49.1%). De onderstaande tabel geeft een overzicht van het aantal personen op welk tijdstip in de studie geïncludeerd werden en hoeveel personen aan iedere - in het kader van de studie georganiseerde - MBCT-training deelnamen. Variabele
Experimentele conditie MBCT + TAU N
Controleconditie TAU
52 21 13 6 12
54 15 13 13 13
45
43
09/03/2006 – DB (Destelbergen) 10/03/2006 – G (Gent)
4 12
0 0
12/05/2006 – G 15/05/2006 – StN (Sint-Niklaas)
8 3
0 0
28/08/2006 – M (Melle) 01/09/2006 – G
1 5
0 0
29/10/2006 – DB 02/11/2006 – DB
8 4
0 0
08/05/2007 – DB 09/05/2007 – G
0 0
1 4
30/08/2007 – A (Antwerpen) 03/09/2007 – M 05/09/2007 – DB 05/09/2007 - G
0 0 0 0
1 1 9 4
25/10/2007 – M
0
6
07/01/2008 – M 10/01/2008 – M 10/01/2008 – DB 13/01/2008 – DB 15/01/2008 - DB
0 0 0 0 0
4 2 2 3 6
NVT
7
11
Startdatum studie Respons rate Maart 2006 Mei 2006 September 2006 November 2006 Startdatum MBCT Respons rate
17
N
Drop-out is onvermijdelijk in een studie. In het uitgebreide onderzoeksrapport wordt een overzicht geboden van het aantal drop-outs (N) bij de gesprekken en vragenlijsten op de verschillende meetmomenten. Bijgevolg zijn de verschillende statistische analyses gebaseerd op een wisselend aantal personen (N) in de experimentele en controlegroep, afhankelijk van hoeveel patiënten voor de betreffende meettijdstippen vragenlijstgegevens beschikbaar zijn. Deze N-waarden worden steeds duidelijk vermeld. Geen enkele van de χ2-tests en Fisher’s exact tests betreffende de drop-out-variabelen zijn significant. Er zijn met andere woorden geen significante verschillen tussen E en C wat betreft de drop-out-rates. Onderzoeksvraag 1: Hoe scoort de onderzoekspopulatie bij aanvang van de training (baseline assessment) ? In het kader van een profielbeschrijving van de deelnemers aan de MBCT-studie gingen we na hoe de onderzoekspopulatie bij aanvang van de training scoorde op vlak van demografische en klinische karakteristieken enerzijds en vragenlijstvariabelen anderzijds. Globaal beschouwd is sprake van een groepsequivalentie tussen E en C wat betreft bovengenoemde drie groepen karakteristieken. Demografische karakteristieken In het uitgebreid onderzoeksrapport biedt een tabel een overzicht van de belangrijkste baseline demografische karakteristieken van E versus C. Tevens hebben we bij de variabelen een vergelijking gemaakt tussen de experimentele groep en de controlegroep (χ2-test) om enerzijds na te gaan of er per studiegroep een verschil bestaat tussen de categorieën van de gemeten variabele en anderzijds of er per categorie van de variabele een verschil bestaat tussen beide studiegroepen E en C. Indien SPSS aangeeft dat de χ2-test niet ‘valid’ is (de validiteit van de χ2-test komt immers in het gedrang wanneer de frequenties in de cellen van de betreffende kruistabellen klein zijn), dient de waarde van de Fisher’s exact test te worden geïnterpreteerd. Van geen enkele van de uitgevoerde χ2-tests en Fisher’s exact tests betreffende de vermelde demografische karakteristieken zijn de resultaten significant. Klinische karakteristieken Voorgeschiedenis In het uitgebreide onderzoeksrapport wordt door middel van een tabel een overzicht geboden van de psychiatrische voorgeschiedenis van de onderzoekspopulatie. Tevens hebben we bij de variabelen een vergelijking gemaakt tussen de experimentele groep en de controlegroep om enerzijds na te gaan of er per studiegroep een verschil bestaat tussen de categorieën van de gemeten variabele en anderzijds of er per categorie van de variabele een verschil bestaat tussen beide studiegroepen E en C. Van de uitgevoerde χ2-tests en Fisher’s exact tests betreffende de vermelde klinische karakteristieken betreffende de voorgeschiedenis zijn enkel de volgende resultaten significant: (1) Fisher’s exact test (recentheid laatste depressieve episode) = 13.91, p = .002 en (2) χ2-test (ervaring met yoga) = 6.53, df = 1, p = .011 .
18
Bekijken we de gegevens betreffende de ‘recentheid van de laatste depressieve episode’ (de categorie ‘onduidelijk’ buiten beschouwing gelaten) dan zien we dat bij de meeste van de studiedeelnemers het einde van de laatste depressieve episode voor hun start aan de studie minder dan 1 jaar is. Dit willen we linken aan de volgende beschrijving van een hoogrisicopopulatie: “high-risk group of relapse/recurrence = currently in remission, according to DSM-IV, for longer than 10 weeks and no longer than 2 years” (2005). Voor de ‘bar chart’ verwijzen we naar het uitgebreide onderzoeksrapport. Eveneens in het uitgebreide rapport geeft een tabel weer in hoeverre sprake is van suïcidegedachten en/of -poging(en) ten tijde van de vier belangrijkste – door patiënt beschreven – depressieve episodes in het verleden (voorgeschiedenis, VG). Er dient hier wel rekening te worden gehouden met het feit dat deze gegevens gebaseerd zijn op het verhaal van de patiënten en dat factoren zoals schaamte e.d. kunnen leiden tot een onderrapportering. Geen enkele van de uitgevoerde χ2-tests en Fisher’s exact tests betreffende de variabelen die nagaan of sprake is van suïcidegedachten en/of -poging(en) ten tijde van vroegere depressieve episodes (geen rekening houdende met de categorieën ‘geen gegevens’, ‘onduidelijk’ of ‘NVT’) zijn significant. Huidige situatie Vragenlijstvariabelen De gegevens omtrent de psychische status (weergegeven aan de hand van de scores op de verschillende vragenlijsten) ten tijde van de premeting staan vermeld in een overzichtelijke tabel in het uitgebreide onderzoeksrapport, die bijkomend een overzicht geeft van de totaalen/of subschaalscores (M ± SD) van alle vragenlijsten van de E versus C groep op de drie andere meetmomenten van de studie. Verdere gegevens omtrent de pre-meting (zoals TAU) worden weergegeven bij onderzoeksvraag 2 (zie uitgebreid rapport). Daar wordt de evolutie van de studiedeelnemers op de verschillende meettijdstippen weergegeven. Aan de hand van one-sample-t-tests willen we vergelijken of de baseline scores van E en C op de HRSD significant verschillen met de door Frank et al (1991) beschreven referentiewaarden “17-item-HRSD: asymptomatic = score ≤ 7; fully symptomatic = score ≥ 15”. Noch de score van E noch deze van C ten tijde van de premeting is significant verschillend van de score '7' (respectievelijk t(51) = -.58, p = .563 en t(50) = .45, p = .656), zowel E en C scoren in de lijn van '7'. Vergelijken we de scores van E en C ten tijde van de premeting met de referentiescore '15', dan zijn de respectievelijke t-tests wel significant (t(51) = -14.02, p = .000 en t(50) = 14.79, p = .000) - zowel E en C scoren veel lager dan '15'. We kunnen hieruit besluiten dat de onderzoeksgroep van deze studie ten tijde van pre niet als 'fully symptomatic' kan beschouwd worden, dus voldoet aan het onderzoekscriterium van geen acute depressieve status. Geen enkele van de vier ongepaarde t-tests in het kader van de vergelijking van de scores van mannelijke en vrouwelijke studiedeelnemers (globaal over E en C) op de HRSD op de verschillende meetmomenten zijn significant. Noch baseline, noch ten tijde van de follow-up verschillen mannen en vrouwen significant van elkaar wat betreft hun scores op de HRSD.
19
Om na te gaan of de gemiddelde baseline scores (pre-meting) van E en C al dan niet significant van elkaar verschillen op de (subschalen van de) verschillende vragenlijsten voerden we onafhankelijke t-tests (en de non-parametrische variant, met name de Mann Whitney U test) uit. De resultaten zijn weergegeven in een tabel in het uitgebreide rapport. Uit deze t-tests en parallelle Mann Whitney U tests komen geen significanties naar voren. Dit kan beschouwd worden als een bewijs voor de equivalentie van E en C (vergelijkbaarheid van de experimentele en controleconditie) alsook voor de randomisatie. Feit dat ook uit de χ2tests en Fisher’s exact tests betreffende de hoger beschreven demografische en klinische karakteristieken quasi geen significante resultaten naar voren komen is tevens een goed punt in het licht van de randomisatie. In het kader van een profielbeschrijving van de deelnemers aan de MBCT-studie gingen we tevens na hoe onze onderzoeksgroep (mannen versus vrouwen) bij aanvang van de training scoorde in vergelijking met de gekende normgroepen ‘klinische populatie’ versus ‘normale populatie’ (bij die vragenlijsten waarvan normscores beschikbaar zijn). Voor enkele subschalen zijn geen aparte normen voor beide seksen beschikbaar, dan hanteren we dezelfde normwaarden voor mannen en vrouwen. Aan de hand van one sample t-tests gingen we na of de gemiddelden van de mannelijke versus vrouwelijke studiedeelnemers uit de totale onderzoeksgroep significant verschilden van de respectievelijke normgemiddelden. In het uitgebreide onderzoeksrapport biedt een tabel een vergelijkend overzicht van de gemiddelde scores van beide seksen uit onze onderzoeksgroep, de normscores voor beide seksen en toont ook de resultaten van de bovengenoemde one-sample t-tests. Uit de resultaten van deze onesample t-tests kunnen we het volgende besluiten (opsplitsen in normgroepen ‘klinische populatie’ versus ‘normale populatie’). Daar beschikbaar voor de BDI, ZBV en RRS hebben we een onderscheid gemaakt tussen een normgroep 'patiënten' en een normgroep 'controlegroep' (= 'algemene bevolking' / 'studenten' ...). De vrouwelijke deelnemers uit deze studie scoren op de BDI significant (op .05 niveau) lager dan de norm 'patiënten' en zowel de mannen als vrouwen scoren op de BDI significant hoger (op .001 niveau) dan de norm 'controlegroep'. Bekijken we de ZBV dan zien we dat op vlak van de toestandsangst ('state') de mannelijke én vrouwelijke studiedeelnemers significant (op .001 niveau) hoger scoren dan de norm 'studenten'. Wat de angstdispositie betreft ('trait') scoren mannen en vrouwen significant (op .05 niveau) hoger dan de norm 'patiënten' én op .001 niveau significant hoger dan de norm 'studenten'. Op de RRS scoren de vrouwelijke studiedeelnemers op .001 niveau lager in vergelijking met de norm 'patiënten' én scoren zij op .001 niveau significant hoger dan de normgroep 'studenten'. Bij de andere vragenlijsten zijn slechts normscores van één bepaalde normgroep beschikbaar om onze onderzoeksgroep mee te vergelijken (zie bovenstaande tabel). De gegevens in de tabel duiden aan waar de mannelijke of vrouwelijke studiedeelnemers significant (* = op .05 niveau, ** = op .01 niveau of *** = op .001 niveau) lager of hoger scoren in vergelijking met de in de tabel vermelde normgegevens. Van de UCL zijn in een recente uitgave van de handleiding nieuwe normgegevens voor mannen en vrouwen beschikbaar (en noemt de subschaal 'depressief reactiepatroon' nu 'passief reactiepatroon'). Wanneer we one-sample t-tests uitvoeren ter vergelijking van de mannelijke en vrouwelijke studiedeelnemers van deze onderzoeksgroep in vergelijking met de nieuwere normgegevens dan blijven de significanties en de significantieniveaus behouden zoals nu beschreven.
20
In het kader van de profielbeschrijving van de deelnemers aan de MBCT-studie gingen we verder ook na hoe onze onderzoeksgroep - E versus C - bij aanvang van de training scoorde in vergelijking met de gekende normgroepen ‘klinische populatie’ versus ‘normale populatie’ (bij die vragenlijsten waarvan normscores beschikbaar zijn, deze keer niet uitgesplitst mannen versus vrouwen). Aan de hand van one sample t-tests gingen we na of de gemiddelden van E versus C significant verschilden van de normgemiddelden. De tabel in het uitgebreid onderzoeksrapport biedt een vergelijkend overzicht. Uit bovenstaande informatie weten we reeds dat er geen significante verschillen zijn tussen E en C wat betreft hun baseline scores op de verschillende vragenlijsten. Uit de resultaten van de one-sample t-tests kunnen we het volgende besluiten (opsplitsen in normgroepen ‘klinische populatie’ versus ‘normale populatie’); we hanteren boven beschreven aanduiding van de significantieniveaus (*, ** of ***). Enkel voor de subschalen van de POMS en voor de RRS zijn relevante normgegevens beschikbaar voor een globale groep, hiermee bedoelen we relevante normgegevens die niet opgesplitst zijn voor mannen en vrouwen. Op de subschaal 'depressief' van de POMS scoren E én C significant hoger dan de betreffende normgroep; op de subschaal 'moe' scoort enkel C significant hoger dan de norm; op de subschaal 'krachtig' scoren E en C significant lager dan de normscore en wat betreft de subschaal 'gespannen' scoren én E én C significant hoger. Op vlak van ruminatie scoren E en C op de RRS significant lager dan de normgroep 'patiënten' en significant hoger dan 'studenten'. Voor de MAAS stemt een hogere score overeen met een hoger niveau van “dispositional mindfulness”. Bij deze vragenlijst hebben we voor de vergelijking van de scores van E versus C met de normwaarde van de referentiegroep ‘algemene volwassen populatie’ de scores van E en C vergeleken met de referentiewaarden 3.70, 3.80 en 3.90 .In vergelijking met de waarde 3.70 scoort de onderzoeksgroep niet significant verschillend; in vergelijking met 3.80 scoort C op .05 lager en in vergelijking met 3.90 scoren E en C significant lager, respectievelijk op .05 en .001 niveau. Zoals te verwachten scoort de onderzoeksgroep (én E én C) significant lager dan de normscore van ‘zen-beoefenaars’. De scores van de onderzoeksgroep op de TCI bieden een persoonlijkheidsprofiel van E versus C en worden weergegeven in de tabel in het uitgebreide onderzoeksrapport. De ongepaarde t-tests voor de vergelijking van de experimentele en de controleconditie tonen aan dat enkel de t-test voor de subschaal ‘doelbewust’ een significant resultaat (op het .05 niveau) geeft: t(96) = -2.12, p = .037 (significant hogere score van E in vergelijking met C). De nonparametrische variant van de ongepaarde t-test, de Mann-Whitney U test, toont gelijkaardige resultaten. Meer bepaald zijn alle p-waarden van de Mann Whitney-statistiek van de totaal- en subschaalscores van de TCI evenmin significant, behalve betreffende de 'totaalscore van reward dependence' (p = .047) en de 'subschaalscore doelbewust' (p = .028). Ook wat betreft de persoonlijkheidskenmerken kunnen we tot een globale groepsequivalentie besluiten. Naar analogie met de scores van de premeting op de vragenlijsten BDI, BHS, UCL, ZBV, POMS, QLDS, RRS, MAAS en CEQ gingen we ook voor de TCI na hoe onze onderzoeksgroep bij aanvang van de training scoorde in vergelijking met de normgroep (mannen versus vrouwen). Voor enkele subschalen zijn geen aparte normen voor beide seksen beschikbaar, dan hanteren we dezelfde normwaarden voor mannen en vrouwen. Aan de hand van one sample t-tests gingen we na of de gemiddelden van beide seksen binnen de totale onderzoeksgroep significant verschilden van de normgemiddelden. In het uitgebreid onderzoeksrapport staat de samenvattende tabel. Bekijken we nu de resultaten van one-sample t-tests (vergelijking van de totaalscores van mannelijke versus vrouwelijke studiedeelnemers met de respectievelijke normgroepen (‘normale populatie’). Op vlak van ‘prikkelzoekend’, ‘sociaalgericht’ en ‘zelftranscendentie’ verschillen de mannen en vrouwen van de studiegroep
21
niet significant met de normgroepen. Wat betreft ‘leedvermijdend’ scoren de mannelijke en vrouwelijke studiedeelnemers significant hoger (op .001 niveau) dan de norm. Op de schaal ‘volhardend’ scoren enkel de vrouwen uit de studie significant hoger (op .001 niveau) dan de betreffende normgroep. Op vlak van ‘zelfsturend’ scoort de studiegroep (mannen én vrouwen) significant (op .001 niveau) lager dan de normgroepen. Verder gaan we tevens na hoe E versus C scoren in vergelijking met de normgroep. Aan de hand van one sample t-tests gingen we na of de gemiddelden van de totale onderzoeksgroep (E versus C) significant verschilden van de normgemiddelden. Voor de samenvattende tabel verwijzen we opnieuw naar het uitgebreid onderzoeksrapport. Uit de resultaten van onesample t-tests (vergelijking van de totaalscores met normwaarden, waar beschikbaar) kunnen we vooreerst besluiten dat zowel E als C op de schaal ‘volhardend’ significant hoger (respectievelijk op .01 en .05 niveau) scoren dan de normgroep. Op vlak van ‘selfdirectedness’ scoren E én C op .001 niveau lager dan de normgroep. Onderzoeksvraag 2: Hoe scoort de onderzoekspopulatie op de verschillende follow-up-meettijdstippen ? Voor deze onderzoeksvraag gaan we na hoe de onderzoekspopulatie scoort op vlak van demografische en klinische karakteristieken enerzijds en vragenlijstvariabelen anderzijds op de verschillende follow-up-tijdstippen en welke veranderingen optreden in vergelijking met voorgaande meettijdstippen. Demografische karakteristieken In het uitgebreide rapport biedt een tabel een overzicht van de eventuele veranderingen van E versus C op vlak van enkele demografische karakteristieken. Voor deze variabelen hebben we de vergelijking gemaakt tussen de experimentele groep en de controlegroep (χ2-test) om enerzijds na te gaan of er per studiegroep een verschil bestaat tussen de categorieën van de gemeten variabele en anderzijds of er per categorie van de variabele een verschil bestaat tussen beide studiegroepen E en C. Indien SPSS aangeeft dat de χ2-test niet ‘valid’ is (de validiteit van de χ2-test komt immers in het gedrang wanneer de frequenties in de cellen van de betreffende kruistabellen klein zijn), dient de waarde van de Fisher’s exact test te worden geïnterpreteerd. Van geen enkele van de uitgevoerde χ2-tests en Fisher’s exact tests betreffende de verandering op vlak van demografische karakteristieken zijn de resultaten significant. Klinische karakteristieken Bij de analyses betreffende de verandering van E en C tussen de verschillende meettijdstippen op vlak van klinische karakteristieken komen hierna de volgende domeinen aan bod: lichamelijke status, psychische status, eventuele dip(s) en/of herval(momenten), suïcidaliteit en treatment-as-usual (TAU). Tevens hebben we bij de variabelen een vergelijking gemaakt tussen de experimentele groep en de controlegroep (χ2-test / Fisher’s exact test – supra) om enerzijds na te gaan of er per studiegroep een verschil bestaat tussen de categorieën van de gemeten variabele en anderzijds of er per categorie van de variabele een verschil bestaat tussen beide studiegroepen E en C. De samenvattende tabellen staan vermeld in het uitgebreide onderzoeksrapport.
22
Van de uitgevoerde χ2-tests en Fisher’s exact tests betreffende de lichamelijke status zijn de volgende resultaten significant: (1) fysieke gezondheid post in vergelijking met pre – Fisher’s exact test = 15.12, p = .002; (2) energie post in vergelijking met pre – Fisher’s exact test = 33.05, p = .000 . Blijkt dat de patiënten uit E in vergelijking met deze uit C ten tijde van de post-meting een significant verschil melden (verbetering) op vlak van fysieke gezondheid en energieniveau, waarna geen significant verschil (noch verbetering, noch vermindering) meer wordt gerapporteerd na de post-meting. Het resultaat van de volgende Fisher’s exact test betreffende de psychische status is significant: psychische gezondheid post in vergelijking met pre – Fisher’s exact test = 44.67, p = .000 . Blijkt dat de patiënten uit E in vergelijking met deze uit C ten tijde van de postmeting een significant verschil melden (verbetering) op vlak van psychische gezondheid, waarna geen significant verschil (noch verbetering, noch vermindering) meer wordt gerapporteerd na de post-meting. Het resultaat van de volgende Fisher’s exact tests betreffende de aanwezigheid van dip(s) en/of hervalmoment(en) zijn significant: (1) dip en/of herval in de periode tussen post en FU6M – Fisher’s exact test = 9.87, p = .016 en (2) dip en/of herval in de periode FU-6M en FU12M – Fisher’s exact test = 9.63, p = .019 . Er bestaat een significant verschil tussen E en C wat betreft de aanwezigheid van dips en/of hervalmomenten tussen de follow-upmeettijdstippen. Dit resultaat kan gekoppeld worden uit het verder beschreven resultaat bij onderzoeksvraag 3. Van de variabelen betreffende suïcidaliteit is enkel het resultaat van de Fisher’s exact test van ‘is sprake van suïcidegedachten tussen pre en post’ significant (op .05 niveau), p = .031: meer mensen in de controlegroep dan in de experimentele groep gaven ten tijde van de postmeting aan dat zij in de periode tussen de pre- en postmeting suïcidegedachten gehad hebben. Betreffende item 9 van de BDI (peilt naar de mate van suïcidale gedachten of wensen) stellen we zowel bij de post-, FU-6M- en FU-12M-meting een significant verschil vast tussen de antwoorden van E en C. De respectievelijke Fisher’s exact tests geven de volgende pwaarden: .004, .005 en .045 . Dezelfde conclusie kan getrokken worden uit de resultaten van de ongepaarde t-tests betreffende de vergelijking van E en C op van hun scores op dit vragenlijstitem, respectievelijk: t(88) = 3.09, p = .003; t(71) = 3.40, p = .001 en t(72) = 2.50, p = .015 (significant hogere score van C op het item 9 ten tijde van én post én FU6M én FU12M). Betreffende item 11 van de HRSD (peilt eveneens naar de mate van suïcidale gedachten of wensen) stellen we bij de post-meting een significant ongepaarde t-test resultaat vast – t(64) = 2.20, p = .031 . Van de treatment-as-usual-variabelen zijn enkel de volgende tests significant: χ2 (consultaties psychiater ttv pre) = 6.03, df = 1, p = .014; χ2 (consultaties psychiater ttv FU12M) = 5.37, df = 1, p = .021 en χ2 (consultaties huisarts ttv FU6M) = 6.00, df = 1, p = .014 . Vragenlijstvariabelen De gemiddelde totaal- en subschaalscores van E en C ttv Post, FU6M en FU12M voor de BDI, BHS, UCL, ZBV, POMS, QLDS, RRS en MAAS werden reeds in de tabel bij onderzoeksvraag 1 weergegeven (zie uitgebreid onderzoeksrapport). De statistische analyses ter vergelijking van E en C (nagaan van effect van MBCT) worden verder beschreven bij onderzoeksvraag 4.
23
We onderzoeken tevens of de scores van E versus C op de meettijdstippen post, FU6M en FU12M terugkeren naar het ‘normale’ niveau (vergelijking met normgroepen - niet opgesplitst in mannen versus vrouwen - als ‘controlegroep’, ‘studenten’ …). “Kendall et al (1999) have recently described the use of normative comparisons as a method to evaluate the clinical significance of the changes produced by therapeutic interventions. This approach is particularly useful when applied to patient populations that begin treatment with abnormally elevated symptom scores and are reassessed on those measures following treatment. In this situation, comparison of patients’ posttreatment scores with those from normative samples provides a valuable indicator of the clinical significance of the extent of therapeutic gains achieved.” De tabel in het uitgebreide onderzoeksrapport biedt een overzicht van de p-waarden van de one-sample-t-tests (*** = p ≤ .001, ** = p ≤ .01 en * = p ≤ .05). Onderzoeksvraag 3: Oefent MBCT een effect uit op het hervalrisico in depressie ? Deze onderzoeksvraag peilt naar de preventieve waarde van MBCT. Meer bepaald willen we nagaan of er een verschil bestaat tussen de experimentele groep en controlegroep wat betreft herval en de ‘survival time to relapse’, dit wil zeggen ‘de tijd (aantal weken) vooraleer sprake is van een eerste herval in depressieve episode sinds de start van de studie’. Zo kunnen we te weten komen of MBCT een effect uitoefent op het hervalrisico in depressie. Gezien de belangrijkheid van deze statistische analyses wordt de bespreking ervan ook in dit beknopt onderzoeksrapport volledig weergegeven. Om deze onderzoeksvraag te beantwoorden voerden we een Kaplan-Meier survival analyse uit met als time-variabele “timeherval” (time to onset of relapse or recurrence (in weeks) = aantal weken tussen start deelname aan studie (premeting) en eerste herval), als statusvariabele “statusherval” (is bij deze patiënt in de loop van de studie sprake van herval) en “group” (studiegroep) als factor-variabele. Voor de concretisering van de status-variabele ‘herval’ (eindpunt van de survival analyse) – hanteerden we de volgende werkwijze. Gedurende de follow-up-meetmomenten werd enerzijds aan de hand van de HRSD en anderzijds door middel van het gesprek (waarin de DSM-criteria voor herval in depressie werden gecheckt) nagegaan of bij de betrokkenen al dan niet sprake was van herval. In het kader van extra nauwkeurigheid werden die patiënten bij wie de HRSD-score ≥ 15 (Frank et al, 1991 “17-item-HRSD: fully symptomatic = score ≥ 15”) én bij wie op een aantal kwalitatieve variabelen (weergave van gespreksgegevens) sprake was herval gedefinieerd als hervallen in depressie in de loop van de studie. Zo werden 44 patiënten ‘geselecteerd’ bij wie sprake is van ‘herval’ (E: 12 patiënten; C: 32 patiënten). Bekijken we chi-kwadraat test betreffende onderstaande kruistabel – χ2 = 12.5, df = 1, p = .000 – dan kunnen we besluiten dat er per categorie ‘herval’ of ‘geen herval’ een significant verschil bestaat tussen E en C meer mensen in C hervallen in vergelijking met E - en per studiegroep een significant verschil tussen het aantal personen dat al dan niet hervalt. Dit wordt duidelijk weergegeven in onderstaande figuur (bar chart).
24
Gegevens uit tabel gebaseerd op N = 87, N = 19 (missing values – drop‐out).
Uit bovenstaande tabel kunnen we afleiden dat in de loop van de studie bij 30 % van de experimentele groep versus 68 % van de controlegroep sprake is van herval. Deze cijfers liggen in dezelfde grootte-orde van de resultaten uit de RCT’s (randomized controlled trials) betreffende MBCT van 2000 en 2004 (supra). In de studie van Teasdale et al (2000) hervallen in de groep personen (intent-to-treat-sample) met ≥ 3 depressieve episodes in de voorgeschiedenis (// onderzoeksgroep van deze pilootstudie) 40 % in E versus 66 % in C (de resultaten van de analyses in de studie van 2000 op de per-protocol-sample zijn respectievelijk 37 % herval in E en 66 % herval in C). De studieresultaten van Ma & Teasdale (2004) zijn 36% herval in E versus 78 % herval in C (eveneens bij groep personen met ≥ 3 depressieve episodes in de voorgeschiedenis, intent-to-treat-sample).
25
Van deze 44 personen die hervallen (supra) hebben we echter van 23 personen geen exacte gegevens omtrent het tijdstip van een eerste herval (patiënten kunnen dit niet steeds exact aangeven), waardoor deze in de analyse werden beschouwd als missing values. Bijgevolg zijn van 21 van deze 43 patiënten wel exacte gegevens beschikbaar omtrent het aantal weken tussen hun start aan de studie en een eerste herval in depressie. De onderzoekssubjecten die omwille van drop-out niet verder in de studie konden opgevolgd worden, diegenen die hervielen maar bij wie niet kon achterhaald worden na hoeveel weken sinds de start van de studie en diegenen bij wie in de loop van de studie geen herval kon vastgesteld worden werden niet meegenomen in de Kaplan-Meier survival analyse (werden als ‘censored’ beschouwd). In de uiteindelijke Kaplan-Meier analyse werden dus 21 patiënten die hervielen betrokken: 4 van hen behoren tot de experimentele groep, 17 van hen tot de controlegroep. Op de onderstaande grafiek toont de bovenste curve het aantal weken vooraleer de 4 personen uit E hervallen, de onderste curve toont de tijd tot een eerste herval van de 17 personen uit C (sommige personen hervallen na hetzelfde aantal weken). De gemiddelde survival time voor de experimentele en controlegroep zijn respectievelijk 43.0 weken en 25.3 weken. De bijhorende log-rank-test geeft het volgende resultaat: χ2 = 3.55, df = 1, p =.060 . Deze p-waarde kan als borderline significant op het .05 niveau gezien worden. Zo kunnen we op basis van deze test besluiten dat de personen in de controlegroep quasi significant sneller hervallen dan de personen uit de experimentele groep. Het gemiddeld aantal weken tussen start van de studie en eerste herval voor E en C samen is 28.7 weken (ongeveer 7 maanden). Dit gegeven willen we linken aan de uitspraak van Professor Williams “Most of the relapses and recurrences took place in that first 6 months.”, bij C is het gemiddeld aantal weken vooraleer herval 25.3, ongeveer 6 maanden.
.
26
Ter vergelijking toont de onderstaande figuur de survival curve voor de patiënten met 3 of meer depressieve episodes in de voorgeschiedenis uit de studie van Teasdale et al (2000). “This study provided the first demonstration that a group-based psychological intervention, initially administered in the recovered state, could significantly reduce risk of future relapse/recurrence in patients with recurrent major depression. Reflecting the cost-efficient group-skills-learning format, the gains were achieved with an average of less than 5hr therapist contact time per patient.”
Uit interesse en deels naar analogie met het onderzoek van 2000 en 2004 hebben we nog twee bijkomende analyses uitgevoerd. Vooreerst hebben we nog de Kaplan Meier survival analyse uitgevoerd met als time-variabele “timeherval” (time to onset of relapse or recurrence (in weeks) = aantal weken tussen start deelname aan studie (premeting) en eerste herval), als status-variabele “statusherval” (is bij deze patiënt in de loop van de studie sprake van herval) en “aantal vroegere depressieve episodes” (gecategoriseerd in ‘< 4 depressieve episodes in de voorgeschiedenis (VG)’, ‘> 4 depressieve episodes in de voorgeschiedenis’ en ‘onduidelijk (sowieso ≥ 3 depressieve episodes in de voorgeschiedenis doch niet te bepalen door de patiënt’) als factor-variabele. Net als in bovengenoemde analyse werd bij 21 patiënten een herval gedefinieerd: 3 van hen hebben < 4 depressieve episodes in de voorgeschiedenis, 16 van hen hebben > 4 depressieve episodes in de voorgeschiedenis en van 2 personen die hervallen is het onduidelijk hoeveel depressieve episodes ze in het verleden doorgemaakt hebben. Op de onderstaande grafiek toont de meest rechtse curve het aantal weken vooraleer de 3 personen met < 4 depressieve episodes in de VG hervallen, de meest linkse curve toont de tijd tot een eerste herval van de 16 personen met > 4 depressieve episodes in de VG (sommige personen hervallen na hetzelfde aantal weken) en de middelste curve toont de tijd tot herval van de 2 personen van wie niet exact gekend is hoeveel depressies ze vroeger hebben doorgemaakt. De gemiddelde survival time voor de groep ‘< 4 depressieve episodes’ is 49.3 weken, voor de groep ‘> 4 depressieve episodes’ is dit 24.5 weken en voor de groep ‘onduidelijk’ is dit 31.0 weken. De bijhorende log-rank-test geeft het volgende resultaat: χ2 = 6.87, df = 2, p =.032 . Deze p-waarde is significant op het .05 niveau, waaruit kan besloten worden dat er een significant verschil bestaat op vlak van ‘time to relapse’ tussen de deelnemers die < of > 4 depressieve episodes in de VG hadden - diegenen met > 4 episodes in de VG hervallen sneller. Dit kan gelinkt worden aan het mechanisme van de “differentiële activatie”. Na het herstel van een depressie zijn de negatieve gedachten nog steeds latent aanwezig onder de
27
vorm van een depressief denkprogramma en dus vatbaar voor reactivatie. Dit proces van reactivatie wordt benoemd als differentiële activatie (Segal et al, 2002). Hoe meer depressieve episodes men meemaakt, hoe sterker het geleerde verband tussen de stemming, gedachten en lichamelijke sensaties en dus hoe kleiner de drempel wordt voor terugval. Het activatieproces van dit depressief denkprogramma wordt als het ware autonoom, dus onafhankelijk van externe omstandigheden. (Godfrin et al, 2007)
Tevens hebben we de Kaplan Meier survival analyse uitgevoerd met als time-variabele “timeherval” (time to onset of relapse or recurrence (in weeks) = aantal weken tussen start deelname aan studie (premeting) en eerste herval), als status-variabele “statusherval” (is bij deze patiënt in de loop van de studie sprake van herval) en “recentheid van de laatste depressieve episode” (d.i. de tijd (in maanden) tussen het einde van de laatste depressieve episode in de voorgeschiedenis en de start van de betreffende patiënten aan de studie; gecategoriseerd in ‘2-3 maanden’, ‘4-11 maanden’, ’12 maanden of meer’ en ‘onduidelijk (sowieso 2 à 3 maanden doch niet door de patiënt te concretiseren’) als factor-variabele. Net als in bovengenoemde analyse werd bij 21 patiënten een herval gedefinieerd: bij 11 van hen was het einde van de laatste depressieve episode 2-3 maanden voor hun start aan de studie, bij 1 patiënt was dit 4-11 maanden, eveneens bij 1 persoon was het einde van diens laatste depressie ≥ 12 maanden voor de start aan de studie en bij 8 patiënten tenslotte kon niet exact gedefinieerd worden wanneer hun laatste depressieve episode afgelopen was. Op de onderstaande grafiek (van links naar rechts) toont de meest linkse curve het aantal weken vooraleer de 11 personen hervallen bij wie het einde van de laatste depressieve episode 2-3 maanden voor hun start aan de studie was, de curve ernaast betreft de 8 personen van wie niet duidelijk is wanneer het einde van de laatste depressieve episode viel, vervolgens zien we de curve van de ene persoon bij wie er 4-11 maanden verliepen tussen het einde van diens laatste depressieve episode en de start aan de studie en tenslotte verwijst de meest rechtse curve naar de persoon bij wie het einde van diens laatste depressie ≥ 12 maanden voor de start aan de studie viel. De gemiddelde survival time voor de groep ‘2-3 maanden’ is 25.5 weken, voor de groep ‘4-11 maanden’ is dit 30.0 weken, voor de groep ‘≥ 12 maanden’ 40.0 weken en voor de groep ‘onduidelijk’ is dit 31.5 weken. De bijhorende log-rank-test geeft het volgende resultaat: χ2 = .52, df = 3, p = .914. Deze p-waarde is niet significant, evenmin de p-waarde van de Breslow-test: χ2 = 2.42, df = 3, p = .490 . Uit dit resultaat dienen we dus te besluiten 28
dat bij deze onderzoeksgroep geen significant verschil bestaat tussen de groepen personen op basis van het aantal maanden tussen het einde van hun laatste depressieve episode en hun start aan de studie.
Onderzoeksvraag 4: Oefent MBCT bij de onderzoekspopulatie (E versus C) een effect uit op vlak van primaire en secundaire uitkomstvariabelen ? De effectiviteit van MBCT gaan we na door middel van de '4 (Time) x 2 (Group) Mixedmodel Repeated Measures ANOVA' per vragenlijst, waarbij de volgende aspecten onderzocht worden: (1) bestaat er over de meetmomenten heen een verschil tussen beide studiegroepen wat betreft hun scores op de vragenlijst (hoofdeffect van de variabele ‘studiegroep’), (2) bestaat er globaal gezien voor de studiegroepen een verschil tussen de scores op de verschillende meetmomenten (hoofdeffect van de variabele ‘tijd’) en (3) of er sprake is van een interactie-effect van ‘groep’ x ‘tijd’ (met andere woorden of enerzijds het effect van de factor ‘tijd’ verschillend is per groep en of het effect van de factor ‘groep’ verschillend is per meetmoment). Bij de verschillende repeated measures analyses is sprake van verschillende Nwaarden voor E en C, dit is afhankelijk van het aantal onderzoekssubjecten van wie ten tijde van die specifieke meetmomenten scores op die bepaalde vragenlijsten voor die specifieke analyse beschikbaar zijn. Daar waar de 'sphericity assumption was not met' (slechts een beperkt aantal keer) werd de Greenhouse-Geisser of andere correctie toegepast. Gezien de belangrijkheid van deze statistische analyses wordt ook de bespreking van onderzoeksvraag 4 in dit beknopt onderzoeksrapport volledig weergegeven. Wil men toch onmiddellijk de samenvattende conclusies lezen, dan verwijzen we naar pp.63-67.
29
Primaire uitkomstvariabelen Depressieve symptomen (BDI) Repeated measures-analyse voor de totaalscores op de BDI met als within-subjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en between-subjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde totaalscores van E en C op de BDI – M(SD) – bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E
C
Post E C
FU-6M E C
FU-12M E C
N=34 N=39
N=34 N=39
N=34 N=39
N=34 N=39
17.59 20.44 11.65 12.46
6.76 8.13
8.47 17.67 9.63 13.00
8.35 19.28 10.20 13.72
Tijd
ANOVA Groep
BDI M SD
21.88 11.90
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
F(3,213) = 10.94 p =.000 ***
F(1,71) = 16.45 p =.000 ***
F(3,213) = 8.82 p =.000 ***
.134
.188
.110
Betreffende het effect van MBCT op vlak van depressieve symptomen, gemeten door middel van de BDI, stellen we vooreerst door middel van de ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de BDI van E versus C) vast dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(96) = .68, p = .495). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de Mann-Whitney-test. Op de grafiek van de repeated measures analyse voor de BDI is de bovenste curve van C, de onderste van E. We stellen vast dat sprake is van een significant hoofdeffect van de factor ‘tijd’ op .001 significantieniveau (F(3,213) = 10.94, p = .000). Vergelijken we de gemiddelde scores per meettijdstip, globaal over de twee groepen E en C - M (pre) = 19.01; M (post) = 14.02; M (FU6M) = 13.07; M (FU12M) = 13.82 - dan stellen we een sterke daling vast van de gemiddelde scores tussen pre en post, een effect die behouden blijft op langere termijn. Tevens is sprake van een significant hoofdeffect van de factor ‘groep’ op .001 niveau 30
(F(1,71) = 16.45, p = .000); de gemiddelde scores per studiegroep globaal over de vier meettijdstippen - M (E) = 10.29; M (C) = 19.67 – tonen een veel lagere gemiddelde score voor E in vergelijking met C. Tenslotte stellen we ook een significant interactie-effect ‘time x groep’ vast op het .001 niveau (F(3,213) = 8.82, p = .000). De vergelijking per meettijdstip van de gemiddelde scores van groep E versus groep C (onderstaande tabel) leert dat op de drie follow-up-meetmomenten er een significant verschil is tussen E en C, waarbij E lager scoort op de BDI (cf. significante resultaten van de vermelde ongepaarde t-tests en de nonparametrische variant, de Mann-Whitney-tests). De vergelijking per studiegroep van de gemiddelde scores van de vier meettijdstippen leert dat bij E sprake is van een sterke daling van de score tussen pre en post en dat de scores gedurende de follow-up-tijdstippen in de zelfde lijn liggen, terwijl de scores van C weinig van elkaar verschillen in de loop van de studie. BDI Pre t(96) = .68, p = .495 MW = 1071.00, p = .359 Post t(89) = 5.67, p = .000 *** MW = 370.50, p = .000 *** FU6M t(82) = 4.11, p = .000 *** MW = 524.00, p = .000 *** FU12M t(74) = 3.80, p = .000 *** MW = 402.00, p = .001 ***
E 17.59
C 20.44
6.77
21.28
8.47
17.67
8.35
19.28
Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen, waarbij het standaard significantie niveau .05 dient gedeeld te worden door het aantal paarsgewijze vergelijkingen (6) - .05 / 6 = .008 . Resultaten worden bij deze analyse als significant beschouwd als de p-waarde < .008, aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. BDI pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E t(41) = 7.11, p = .000 * t(38) = -1.24, p = .223 t(34) = .07, p = .944 t(39) = 5.82, p = .000 * t(35) = 4.72, p = .000 * t(34) = -1.11, p = .273
31
C t(48) = .22, p = .824 t(45) = 1.31, p = .198 t(38) = -1.01, p = .318 t(45) = 1.02, p = .312 t(40) = .68, p = .498 t(40) = .91, p = .369
Depressieve symptomen (HRSD) Repeated measures-analyse voor de totaalscores op de HRSD met als within-subjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en betweensubjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde totaalscores van E en C op de HRSD – M(SD) – bij pre-, post-, FU-6Men FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E
C
E
Post C
FU-6M E C
FU-12M E C
N=39 N=44
N=39 N=44
N=39 N=44
N=39 N=44
6.59 3.99
4.97 3.73
4.82 8.93 4.50 5.67
5.51 8.00 6.15 5.21
Tijd
ANOVA Groep
HRSD M SD
7.32 3.65
9.64 5.50
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
F(3,218) = .453 p =.694
F(1,81) = 11.36 p =.001 *** .123
F(3,218) = 6.39 p =.001 *** .073
In verband met het effect van MBCT op vlak van depressieve symptomen, bekijken we tevens de resultaten van de repeated measures analyse van de HRSD. Vooreerst stellen we door middel van de ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de HRSD van E versus C) vast dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(101) = .73, p = .466). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de Mann-Whitney-test. Op de grafiek van de repeated measures analyse voor de HRSD is de bovenste curve van C, de onderste van E. Bij deze vragenlijst is geen sprake van een significant hoofdeffect van de factor ‘tijd’ (F(3,218) = .45, p = .694). Vergelijken we de gemiddelde scores per meettijdstip, globaal over de twee groepen E en C - M (pre) = 6.95; M (post) = 7.31; M (FU6M) = 6.88; M (FU12M) = 6.76 - dan zien we dat deze scores in dezelfde lijn liggen over de meetmomenten heen. Er is daarentegen wel sprake van een significant hoofdeffect van de factor ‘groep’ op .001 niveau (F(1,81) = 11.36, p = .001); de gemiddelde scores per studiegroep globaal over de vier meettijdstippen - M (E) = 5.47; M (C) = 8.47 – tonen een lagere gemiddelde score voor E in vergelijking met C. Verder is ook
32
sprake van een significant interactie-effect ‘time x groep’ op het .001 niveau (F(3,218) = 6.39, p = .001). De vergelijking per meettijdstip van de gemiddelde scores van groep E versus groep C (onderstaande tabel) leert dat op de drie follow-up-meetmomenten er een significant verschil is tussen E en C, waarbij E lager scoort op de HRSD (cf. significante resultaten van de vermelde ongepaarde t-tests en de non-parametrische variant, de Mann-Whitney-tests). De vergelijking per studiegroep van de gemiddelde scores van de vier meettijdstippen leert dat bij E sprake is van een daling van de score tussen pre en post en dat de scores gedurende de follow-up-tijdstippen in de zelfde lijn liggen, terwijl de score van C eerst een weinig stijgt tussen pre en post om vervolgens terug iets te dalen om terug naar het niveau van de premeting terug te keren. HRSD Pre t(101) = .73, p = .466 MW = 1192.50, p = .377 Post t(91) = 4.40, p = .000 *** MW = 549.50, p = .000 *** FU6M t(81) = 3.78, p = .000 *** MW = 558.00, p = .001 *** FU12M t(82) = 2.05, p = .043 * MW = 588.50, p = .009 **
E 6.59
C 7.32
4.97
9.64
4.82
8.93
5.51
8.00
Psychische status (POMS) Aan de hand van de scores van E en C op de POMS kunnen we het effect van MBCT nagaan op bepaalde aspecten van de psychische status, meer bepaald de domeinen ‘depressiviteit’, ‘boosheid’, ‘moeheid’, ‘kracht’ en ‘gespannenheid’. Subschaalscore ‘Depressief’ Repeated measures-analyse voor de subschaalscore POMS-DEPRESSIEF met als withinsubjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en between-subjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde schaalscores van E en C op POMS-DEPRESSIEF – M(SD) – bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E
C
E
Post C
FU-6M E C
FU-12M E C
N=34N=41
N=34 N=41
N=34 N=41
N=34 N=41
8.50 9.95 7.57 9.14
3.97 4.85
4.82 9.59 6.12 9.01
5.41 9.83 6.27 9.57
Tijd
ANOVA Groep
POMSDEPRESSIEF
M SD
12.15 8.60
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
33
F(3,219) = 2.00 p =.115
F(1,73) = 9.70 p =.003 **
F(3,219) = 4.99 p =.002 **
.117
.064
Beschouwen we vooreerst de subschaal ‘depressief’, waarbij sprake is van een significant hoofdeffect van de factor ‘groep’ op .01 niveau (F(1,73) = 9.70, p = .003) en een significant interactie-effect ‘tijd x groep’ eveneens op .01 niveau (F(3,219) = 4.99, p = .002). De ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de subschaal ‘depressief’ van de POMS van E versus C) toont aan dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(97) = .45, p = .655). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de Mann-Whitney-test. Op de grafiek van de repeated measures analyse is de bovenste curve van C, de onderste van E. Bij deze vragenlijst is geen sprake van een significant hoofdeffect van de factor ‘tijd’ (F(3,219) = 2.00, p = .115). Er is daarentegen wel sprake van een significant hoofdeffect van de factor ‘groep’; de gemiddelde scores per studiegroep globaal over de vier meettijdstippen - M (E) = 5.68; M (C) = 10.38 – tonen een lagere gemiddelde score voor E in vergelijking met C. Verder is ook sprake van een significant interactie-effect ‘time x groep’. De vergelijking per meettijdstip van de gemiddelde scores van groep E versus groep C (onderstaande tabel) leert dat bij de post- en FU6M-meting er een significant verschil is tussen E en C, waarbij E lager scoort op de subschaal ‘depressief’ van de POMS (cf. significante resultaten van de vermelde ongepaarde t-tests en de non-parametrische variant, de Mann-Whitney-tests). De vergelijking per studiegroep van de gemiddelde scores van de vier meettijdstippen leert dat bij E sprake is van een daling van de score tussen pre en post en dat de scores gedurende de follow-uptijdstippen in de zelfde lijn liggen (lichte stijging ttv FU12M, doch niet significant gezien geen significant hoofdeffect van ‘tijd’), terwijl de score van C eerst een weinig stijgt tussen pre en post om vervolgens terug te dalen. POMS-DEPRESSIEF Pre t(97) = .45, p = .655 MW = 1175.00, p = .726 Post t(86) = 4.45, p = .000 *** MW = 544.50, p = .000 *** FU6M t(82) = 3.60, p = .001 *** MW = 575.50, p = .001 *** FU12M t(77) = 1.80, p = .076 MW = 622.50, p = .133
E 5.94
C 7.73
3.21
8.22
3.59
6.24
4.27
6.07
34
Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008 , aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. POMS-DEPRESSIEF pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(42) = 4.28 , p = .000 * t(38) = .00 , p = 1.000 t(34) = -.52 , p = .605 t(39) = 3.94 , p = .000 * t(35) = 2.48 , p = .018 t(34) = -1.53 , p = .137
t(47) = -1.77 , p = .083 t(45) = 1.07 , p = .292 t(41) = -.02 , p = .983 t(46) = -.48 , p = .634 t(41) = .12 , p = .902 t(42) = 1.83 , p = .074
Subschaalscore ‘Boos’ Repeated measures-analyse voor de subschaalscore POMS-BOOS met als within-subjectsfactor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en between-subjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde schaalscores van E en C op POMS-BOOS– bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E POMS -Boos M SD
C
Post E C
FU-6M E C
FU-12M E C
N=34 N=41
N=34 N=41
N=34 N=41
N=34 N=41
5.94 7.73 6.44 6.63
3.21 5.00
3.59 6.24 6.63 6.63
4.26 6.07 5.16 6.67
8.22 6.35
Effect size
Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
35
Tijd
F(3,219) = 3.23 p =.023 * .042
ANOVA Groep
F(1,73) = 5.55 p =.021 * .071
F(3,219) = 2.56 p =.056
Bij de subschaal ‘boos’ is sprake van een significant hoofdeffect van de factor ‘tijd’ op .05 niveau (F(3,219) = 3.23, p = .023) en een significant hoofdeffect van de factor ‘groep’ eveneens op .05 niveau (F(1,73) = 5.55, p = .021). De ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de subschaal ‘boos’ van de POMS van E versus C) toont aan dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(97) = 1.20, p = .232). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de MannWhitney-test (M-W = 1036.50, p = .185). Op de grafiek van de repeated measures analyse is de bovenste curve van C, de onderste van E. Vergelijken we de gemiddelde scores per meettijdstip, globaal over de twee groepen E en C - M (pre) = 6.84; M (post) = 5.71; M (FU6M) = 4.92; M (FU12M) = 5.17 - dan zien we dat deze scores globaal gezien dalen over de meetmomenten heen (enkel een lichte stijging ten tijde van FU12M). Uit het significant hoofdeffect van de factor ‘groep’ kunnen we afleiden dat E significant lager scoort dan C (gemiddelde scores per studiegroep globaal over de vier meettijdstippen - M (E) = 4.25; M (C) = 7.07). Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008, aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. POMS-BOOS pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(42) = 3.01 , p = .004 * t(38) = .19 , p = .850 t(34) = -.60 , p = .553 t(39) = 3.70 , p = .001 * t(35) = 1.77 , p = .086 t(34) = -1.35 , p = .187
36
t(47) = .08 , p = .935 t(45) = 1.84 , p = .072 t(41) = .51 , p = .615 t(46) = 1.54 , p = .131 t(41) = 1.63 , p = .110 t(42) = 2.51 , p = .016
Subschaalscore ‘Moe’ Repeated measures-analyse voor de subschaalscore POMS-MOE met als within-subjectsfactor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en between-subjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde schaalscore van E en C op POMS-MOE – bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E POMS -MOE M SD
C
E
Post C
FU-6M E C
FU-12M E C
N=34 N=42
N=34 N=42
N=34 N=42
N=34 N=42
9.00 7.00
4.68 5.93
6.03 6.07
5.44 6.29
9.95 7.01
10.81 7.18
7.67 6.30
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
8.52 7.15
Tijd
F(3,222) = 4.70 p =.003 ** .060
ANOVA Groep
F(1,74) = 6.08 p =.016 * .076
F(3,222) = 4.25 p =.006 ** .054
De repeated measures analyse van de subschaal ‘moe’ van de POMS toont een significant hoofdeffect van de factor ‘tijd’ op .01 niveau (F(3,222) = 4.70, p = .003), een significant hoofdeffect van de factor ‘groep’ op .05 niveau (F(1,74) = 6.08, p = .016) en een significant interactief-effect ‘tijd x groep’ op .01 niveau (F(3,222) = 4.25, p = .006). De ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de subschaal ‘moe’ van de POMS van E versus C) toont aan dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(98) = .43, p = .667). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de Mann-Whitney-test. Op de grafiek van de repeated measures analyse is de bovenste curve van C, de onderste van E. In het kader van het hoofdeffect van ‘tijd’ vergelijken we de gemiddelde scores per meettijdstip, globaal over de twee groepen E en C M (pre) = 9.48; M (post) = 7.74; M (FU6M) = 6.85; M (FU12M) = 6.98 - dan zien we een globale daling van de scores over de meetmomenten heen (enkel een lichte stijging ten tijde van FU12M). Het significant hoofdeffect van ‘groep’ toont zich bij de vergelijking van de gemiddelde scores per studiegroep globaal over de vier meettijdstippen - M (E) = 6.29; M (C) = 9.24: er is sprake van een significant lagere gemiddelde score voor E in vergelijking met C. 37
Verder is ook sprake van een significant interactie-effect ‘time x groep’. De vergelijking per meettijdstip van de gemiddelde scores van groep E versus groep C (onderstaande tabel) leert dat bij de postmeting een significant verschil is tussen E en C, waarbij E significant lager scoort op de subschaal ‘moe’ van de POMS (cf. significante resultaten van de vermelde ongepaarde t-tests en de non-parametrische variant, de Mann-Whitney-tests). De vergelijking per studiegroep van de gemiddelde scores van de vier meettijdstippen leert dat bij E sprake is van een sterke daling van de score tussen pre en post en dat de scores gedurende de followup-tijdstippen in de zelfde lijn liggen (lichte stijging ttv FU6M om nadien terug te dalen), terwijl de score van C eerst een weinig stijgt tussen pre en post om vervolgens te dalen ttv FU6M en nadien terug te stijgen ttv FU12M. POMS-MOE Pre t(98) = .43, p = .667 MW = 1187.50, p = .669 Post t(90) = 3.97, p = .000 *** MW = 543.50, p = .000 *** FU6M t(86) = 1.76, p = .082 MW = 753.50, p = .083 FU12M t(77) = 1.55, p = .126 MW = 610.00, p = .105
E 9.00
C 9.95
4.68
10.81
6.03
7.67
5.44
8.52
Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008, aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. POMS-MOE pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(42) = 5.88 , p = .000* t(38) = -.99 , p = .328 t(34) = .36 , p = .722 t(39) = 2.99 , p = .005* t(35) = 2.85 , p = .007* t(34) = -.95 , p = .351
t(48) = -.85 , p = .399 t(45) = 2.21 , p = .032 t(41) = -.85 , p = .399 t(47) = 1.07 , p = .292 t(42) = 1.43 , p = .160 t(42) = 2.14 , p = .038
Subschaalscore ‘Krachtig’ Repeated measures-analyse voor de subschaalscore POMS-KRACHTIG met als withinsubjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en between-subjects factor ‘studiegroep’ (experimentele groep en controlegroep).
38
Tabel: Overzicht van de gemiddelde schaalscores van E en C op POMS-KRACHTIG – bij pre-, post-, FU6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E
C
Post E C
FU-6M E C
FU-12M E C
N=34 N=42
N=34 N=42
N=34 N=42
N=34 N=42
8.65 5.06
11.62 4.77
10.44 4.17
11.50 5.42
Tijd
ANOVA Groep
POMSKRACH TIG
M SD
7.67 4.50
7.95 4.31
8.95 4.90
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
8.76 5.46
F(3,222) = 4.76 p =.003 ** .060
F(1,74) = 6.45 p =.013 * .080
F(3,222) = 2.28 p =.080
Bij de subschaal ‘krachtig’ is sprake van een significant hoofdeffect van de factor ‘tijd’ op .01 niveau (F(3,222) = 4.76, p = .003) en een significant hoofdeffect van de factor ‘groep’ op .05 niveau (F(1,74) = 6.45, p = .013). De ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de subschaal ‘krachtig’ van de POMS van E versus C) toont aan dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(98) = -1.02, p = .311). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de MannWhitney-test (M-W = 1110.50 p = .337). Op de grafiek van de repeated measures analyse is de bovenste curve van E, de onderste van C. Vergelijken we de gemiddelde scores per meettijdstip, globaal over de twee groepen E en C - M (pre) = 8.16; M (post) = 9.79; M (FU6M) = 9.70; M (FU12M) = 10.13 - dan zien we dat deze scores globaal gezien stijgen over de meetmomenten heen (enkel een lichte daling ten tijde van FU6M). Uit het significant hoofdeffect van de factor ‘groep’ kunnen we afleiden dat E significant hoger scoort dan C (gemiddelde scores per studiegroep globaal over de vier meettijdstippen - M (E) = 10.55; M (C) = 8.33). Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet 39
behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008, aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. POMS-KRACHTIG pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(42) = -4.14 , p = .000* t(38) = 1.71 , p = .095 t(34) = -1.15 , p = .258 t(39) = -2.14 , p = .038 t(35) = -3.01 , p = .005* t(34) = .47 , p = .638
t(48) = -.42 , p = .675 t(45) = -1.23 , p = .226 t(41) = .28 , p = .783 t(47) = -1.13 , p = .264 t(42) = -1.24 , p = .223 t(42) = -.82 , p = .417
Subschaalscore ‘Gespannen’ Repeated measures-analyse voor de subschaalscore POMS-GESPANNEN met als withinsubjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en between-subjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde schaalscores van E en C op POMS-GESPANNEN bij pre-, post-, FU6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E
C
E
Post C
FU-6M E C
FU-12M E C
N=34 N=41
N=34 N=41
N=34 N=41
N=34 N=41
9.03 6.86
4.79 4.70
5.29 5.10
4.41 4.46
Tijd
ANOVA Groep
POMSGESPANNEN
M SD
10.10 6.38
10.00 7.03
7.68 6.10
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
40
8.10 7.06
F(3,219) = 10.90 p =.000 *** .130
F(1,73) = 6.91 p =.010 ** .086
F(3,219) = 3.76 p =.012 * .049
Bekijken we de repeated measures analyse voor de subschaal ‘gespannen’ van de POMS, dan merken we op dat sprake is van een significant hoofdeffect van ‘tijd’ op .001 niveau (F(3,219) = 10.90, p = .000), een significant hoofdeffect van ‘groep’ op .01 niveau (F(1,73) = 6.91, p = .010) en een significant interactie-effect van ‘tijd x groep’ op .05 niveau (F(3,219) = 3.76, p = .012). Op basis van het resultaat van de ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de subschaal ‘gespannen’ van de POMS van E versus C) stellen we vast dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(97) = .46, p = .643). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de MannWhitney-test (M-W = 1122.00, p = .470). Op de grafiek van de repeated measures analyse voor de BDI is de bovenste curve van C, de onderste van E. In het kader van het hoofdeffect van ‘tijd’ vergelijken we de gemiddelde scores per meettijdstip, globaal over de twee groepen E en C - M (pre) = 9.56; M (post) = 7.40; M (FU6M) = 6.49; M (FU12M) = 6.26 - dan stellen we een daling vast van de gemiddelde scores over de meetmomenten heen. Het hoofdeffect van ‘groep’ blijkt uit de vergelijking van de gemiddelde scores per studiegroep globaal over de vier meettijdstippen - M (E) = 5.88; M (C) = 8.97: E scoort gemiddeld lager dan C. In het kader van het interactie-effect ‘time x groep’ vergelijken we enerzijds de gemiddelde scores van groep E versus groep C per meettijdstip (onderstaande tabel) – op de drie follow-upmeetmomenten is er een significant verschil is tussen E en C, waarbij E lager scoort op de subschaal ‘gespannen’ van de POMS (cf. significante resultaten van de vermelde ongepaarde t-tests) – en anderzijds vergelijken we per studiegroep de gemiddelde scores van de vier meettijdstippen - bij E is sprake van een sterke daling van de score tussen pre en post, een lichte stijging ttv FU6M en daarna terug een daling ttv FU12M; bij C liggen de scores van pre en post in dezelfde lijn met een daling op langere termijn, ttv FU6M en FU12M. POMS-GESPANNEN Pre t(97) = .46, p = .643 MW = 1122.00, p = .470 Post t(89) = 3.52, p = .001 *** MW = 653.50, p = .002 ** FU6M t(86) = 2.39, p = .019 * MW = 673.00, p = .016 * FU12M t(75) = 2.17, p = .034 * MW = 596.50, p = .079
E 9.03
C 10.10
4.79
10.00
5.29
7.68
4.41
8.10
Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008, aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures.
41
POMS-GESPANNEN pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(42) = 5.05 , p = .000* t(38) = .31 , p = .756 t(34) = 1.24 , p = .224 t(39) = 4.40 , p = .000* t(35) = 4.22 , p = .000* t(34) = .18 , p = .862
t(47) = .43 , p = .668 t(45) = 2.04 , p = .048 t(41) = -.11 , p = .917 t(46) = 2.05 , p = .047 t(41) = 2.46 , p = .018 t(42) = 2.23 , p = .031
Suicidaliteit Aan de hand van de scores van E en C op item 9 van de BDI, item 11 van de HRSD en de BHS krijgen we meer informatie omtrent het effect van MBCT op vlak van suïcidaliteit. Tijd BDIItem9 M SD
Groep
E: N=33 C: N=41 F(3,216) = 1.08 p =.357
F(1,72) F(3,216) = 7.61 = 3.09 p =.007 p =.028 ** * Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
De repeated measures analyse van de scores van E en C op item 9 van de BDI (= “…”) toont enerzijds een significant hoofdeffect van de factor ‘groep’ op .01 niveau (F(1,72) = 7.61, p = .007) - globaal gezien over de meetmomenten heen scoort E significant lager dan C - en anderzijds een significant interactie-effect ‘tijd x groep’ op .05 niveau (F(3,216) = 3.09, p = .028) - significant lagere score van E in vergelijking met C op de drie follow-upmeettijdstippen; bij E zien we een daling van de gemiddelde score tussen pre en post, met nadien een stijging ten tijd van FU6M en FU12M, bij C is na pre sprake van een stijging van de gemiddelde score over de drie follow-up-meetmomenten heen. Tijd HRSD Item11 M SD
Groep
E:N= 39 C:N= 45 F(3,219) = 2.07 p =.112
F(1,82) = .967 p =.328
F(3,219) = 1.45 p =.234
Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
Bij de repeated measures analyse van de scores van E en C op item 11 van de HRSD (= “…”) is noch het hoofdeffect van ‘tijd’, noch het hoofdeffect van ‘groep’, noch het interactie-effect van ‘tijd x groep’ significant.
42
Secundaire uitkomstvariabelen Hopeloosheid (BHS) Repeated measures-analyse voor de totaalscores op de BHS met als within-subjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en between-subjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde totaalscores van E en C op de BHS – M(SD) – bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E
C
Post E C
FU-6M E C
FU-12M E C
N=34 N=41
N=34 N=41
N=34 N=41
N=34 N=41
7.03 4.09
5.50 4.25
5.82 4.76
6.41 5.49
Tijd
ANOVA Groep
BHS M SD
9.73 4.78
10.39 5.18
9.44 5.50
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
10.27 5.37
F(3,219) = .97 p =.408
F(1,73) = 15.02 p =.000 *** .171
F(3,219) = 1.56 p =.200
Bij de vragenlijst BHS is sprake van een significant hoofdeffect van de factor ‘groep’ op .001 niveau (F(1,73) = 15.02, p = .000). De ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de BHS van E versus C) toont aan dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(96) = 1.78, p = .079). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de Mann-Whitney-test (M-W = 950.00, p = .077). Op de grafiek van de repeated measures analyse is de bovenste curve van C, de onderste van E. Vergelijken we de gemiddelde scores per studiegroep globaal over de vier meettijdstippen - M (E) = 6.19; M (C) = 9.96 – dan leiden we hieruit af dat E significant lager scoort dan C.
43
Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008; bij deze vragenlijst is echter - noch bij E noch bij C - geen enkele p-waarde < .008 . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. BHS pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(40) = 2.42 , p = .020 t(38) = -.05 , p = .964 t(34) = -.91 , p = .370 t(38) = 2.45 , p = .019 t(35) = 1.32 , p = .197 t(34) = -1.18 , p = .246
t(48) = -.41 , p = .681 t(45) = .59 , p = .557 t(41) = -1.12 , p = .270 t(47) = -.03 , p = .978 t(42) = -.66 , p = .510 t(41) = .10 , p = .920
Angst (ZBV) Betreffende het effect van MBCT op vlak van angst, gemeten door middel van de ZBV, stellen we vooreerst door middel van de ongepaarde t-test vast dat wat betreft de ‘state anxiety’ - t(98) = .58, p = .561 - én de ‘trait anxiety’ – t(98) = .61, p = .543 - E en C baseline (premeting) niet significant van elkaar verschillen. Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de Mann-Whitney-test. Subschaalscore ‘State’ Repeated measures-analyse voor de subschaalscore ZBV-STATE met als within-subjectsfactor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en between-subjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde schaalscores van E en C op ZBV-STATE – M(SD) – bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E
C
E
Post C
FU-6M E C
FU-12M E C
N=34 N=42
N=34 N=42
N=34 N=42
N=34 N=42
46.59 49.10 13.99 13.08
37.03 50.86 12.19 13.47
38.76 45.48 11.84 14.83
37.12 46.00 12.22 14.90
Tijd
ANOVA Groep
ZBVSTATE
M SD
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
44
F(3,222) = 7.81 p =.000 *** .095
F(1,74) = 9.78 p =.003 ** .117
F(3,222) = 5.38 p =.001 *** .068
Bespreken we vooreerst de subschaal ‘state anxiety’. Op de grafiek van de repeated measures analyse voor de subschaal ‘state’ van de ZBV is de bovenste curve van C, de onderste van E. We stellen vooreerst vast dat sprake is van een significant hoofdeffect van de factor ‘tijd’ op .001 significantieniveau (F(3,222) = 7.81, p = .000). Vergelijken we de gemiddelde scores per meettijdstip, globaal over de twee groepen E en C - M (pre) = 47.84; M (post) = 43.94; M (FU6M) = 42.12; M (FU12M) = 41.56 - dan stellen we per meettijdstip een daling vast van de gemiddelde scores. Tevens is sprake van een significant hoofdeffect van de factor ‘groep’ op .01 niveau (F(1,74) = 9.78, p = .003); de gemiddelde scores per studiegroep globaal over de vier meettijdstippen - M (E) = 39.88; M (C) = 47.86 – tonen een veel lagere gemiddelde score voor E in vergelijking met C. Tenslotte stellen we ook een significant interactie-effect ‘time x groep’ vast op het .001 niveau (F(3,222) = 5.38, p = .001). De vergelijking per meettijdstip van de gemiddelde scores van groep E versus groep C (onderstaande tabel) leert dat op de drie follow-up-meetmomenten er een significant verschil bestaat tussen E en C, waarbij E lager scoort op de subschaal ‘state’ van de ZBV (cf. significante resultaten van de vermelde ongepaarde t-tests en de non-parametrische variant, de Mann-Whitney-tests). De vergelijking per studiegroep van de gemiddelde scores van de vier meettijdstippen leert dat bij E sprake is van een sterke daling van de score tussen pre en post en dat de scores gedurende de followup-tijdstippen in de zelfde lijn liggen (lichte stijging ttv FU6M), terwijl de scores van C ttv pre en post weinig van elkaar verschillen en daarna wel licht dalen ttv FU6M en FU12M. ZBV-STATE Pre t(98) = .58, p = .561 MW = 1144.50, p = .469 Post t(90) = 4.42, p = .000 *** MW = 522.00, p = .000 *** FU6M t(86) = 3.01, p = .003 ** MW = 651.00, p = .010 ** FU12M t(77) = 2.32, p = .023 * MW = 554.00, p = .030 *
E 46.59
C 49.10
37.03
50.86
38.77
45.48
37.12
46.00
Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet 45
behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008, aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. ZBV-STATE pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(41) = 5.34 , p = .000* t(38) = -.23 , p = .821 t(34) = .78 , p = .440 t(39) = 4.50 , p = .000* t(35) = 4.16 , p = .000* t(34) = -.23 , p = .817
t(49) = -1.03 , p = .307 t(46) = 1.74 , p = .089 t(41) = -.23 , p = .818 t(47) = .54 , p = .593 t(42) = 1.73 , p = .090 t(42) = 2.48 , p = .017
Subschaalscore ‘Trait’ Repeated measures-analyse voor de subschaalscore ZBV-TRAIT met als within-subjectsfactor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en between-subjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde schaalscores van E en C op ZBV-TRAIT – M(SD) – bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E
C
E
Post C
FU-6M E C
FU-12M E C
N=34 N=42
N=34 N=42
N=34 N=42
N=34 N=42
52.26 54.57 11.09 11.74
41.97 56.26 11.12 12.30
42.94 49.43 10.72 13.54
40.03 51.93 12.66 14.15
Tijd
ANOVA Groep
ZBVTRAIT
M SD
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
46
F(3,222) = 15.17 p =.000 *** .170
F(1,74) = 13.49 p =.000 *** .154
F(3,222) = 9.15 p =.000 *** .110
Bespreken we vervolgens de subschaal ‘trait anxiety’. Op de grafiek van de repeated measures analyse voor de subschaal ‘trait’ van de ZBV is de bovenste curve van C, de onderste van E. We stellen vast dat sprake is van een significant hoofdeffect van de factor ‘tijd’ (F(3,222) = 15.17, p = .000), een significant hoofdeffect van ‘groep’ (F(1,74) = 13.49, p = .000) en een significant interactie-effect (F(3,222) = 9.15, p = .000), alledrie significant op .001 niveau. Vergelijken we de gemiddelde scores per meettijdstip, globaal over de twee groepen E en C - M (pre) = 53.42; M (post) = 49.12; M (FU6M) = 46.19; M (FU12M) = 45.98 - dan stellen we per meettijdstip een daling vast van de gemiddelde scores. De gemiddelde scores per studiegroep globaal over de vier meettijdstippen - M (E) = 44.30; M (C) = 53.05 – tonen een veel lagere gemiddelde score voor E in vergelijking met C. De vergelijking per meettijdstip van de gemiddelde scores van groep E versus groep C (onderstaande tabel) leert dat op de drie follow-up-meetmomenten er een significant verschil bestaat tussen E en C, waarbij E lager scoort op de subschaal ‘trait’ van de ZBV (cf. significante resultaten van de vermelde ongepaarde t-tests en de non-parametrische variant, de Mann-Whitney-tests). De vergelijking per studiegroep van de gemiddelde scores van de vier meettijdstippen leert dat bij E sprake is van een sterke daling van de score tussen pre en post en dat de scores gedurende de follow-up-tijdstippen in de zelfde lijn liggen (lichte stijging ttv FU6M), terwijl de scores van C ttv pre en post weinig van elkaar verschillen en daarna wel licht dalen ttv FU6M en FU12M. ZBV-TRAIT Pre t(98) = .61, p = .543 MW = 1159.50, p = .535 Post t(91) = 5.50, p = .000 *** MW = 433.50, p = .000 *** FU6M t(86) = 3.20, p = .002 ** MW = 626.50, p = .005 ** FU12M t(77) = 3.47, p = .001 *** MW = 438.50, p = .001 ***
E 52.27
C 54.57
41.97
56.26
42.94
49.43
40.03
51.93
Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008, aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. ZBV-TRAIT pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(42) = 6.59 , p = .000* t(38) = -.36 , p = .724 t(34) = 1.34 , p = .188 t(39) = 6.48 , p = .000* t(35) = 6.14 , p = .000* t(34) = .78 , p = .443
47
t(49) = -.76 , p = .451 t(46) = 3.31 , p = .002* t(41) = -1.52 , p = .137 t(47) = 2.42 , p = .019 t(42) = 1.49 , p = .145 t(42) = 2.61 , p = .013
Ruminatie (RRS) Repeated measures-analyse voor de totaalscores van de RRS met als within-subjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en betweensubjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde totaalscores van E en C op RRS – M(SD) – bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E RRS M SD
C
E
Post C
FU-6M E C
FU-12M E C
N=34 N=42
N=34 N=42
N=34 N=42
N=34 N=42
51.79 50.48 12.96 11.43
46.38 49.48 11.97 11.28
45.03 48.24 14.04 10.99
40.56 46.95 14.14 12.66
Effect size
Tijd
F(3,222) = 13.34 p =.000 *** .153
ANOVA Groep
F(1,74) = 1.33 p =.252
F(3,222) = 3.58 p =.015 * .046
Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
In verband met het effect van MBCT op vlak van ruminatie, bekijken we de resultaten van de repeated measures analyse van de RRS. Vooreerst stellen we door middel van de ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de RRS van E versus C) vast dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(98) = -.60, p = .548). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de MannWhitney-test. Op de grafiek van de repeated measures analyse voor de RRS is de bovenste curve van C, de onderste van E. Bij deze vragenlijst is sprake van een significant hoofdeffect van de factor ‘tijd’ op .001 niveau (F(3,222) = 13.34, p = .000). Vergelijken we de gemiddelde scores per meettijdstip, globaal over de twee groepen E en C - M (pre) = 51.14; M (post) = 47.93; M (FU6M) = 46.63; M (FU12M) = 43.76 - dan zien we dat deze scores dalen over de meettijdstippen heen. Er is geen sprake van een significant hoofdeffect van de factor ‘groep’ (F(1,74) = 1.33, p = .252). Verder is dan wel sprake van een significant interactie-effect ‘time x groep’ op het .05 niveau (F(3,222) = 3.58, p = .015). De vergelijking per meettijdstip van de gemiddelde scores van groep E versus groep C (onderstaande tabel) leert dat ttv FU12M sprake is van een significant verschil tussen E en C, waarbij E lager scoort op de RRS (cf. significant resultaat van de Mann-Whitney-test). De vergelijking per 48
studiegroep van de gemiddelde scores van de vier meettijdstippen leert dat zowel bij E als C per meettijdstip sprake is van een daling van de score. RRS Pre t(98) = .-.60, p = .548 MW = 1164.00, p = .555 Post t(91) = 1.47, p = .145 MW = 878.50, p = .130 FU6M t(86) = 1.57, p = .120 MW = 752.00, p = .081 FU12M t(77) = 1.98, p = .052 MW = 556.50, p = .032 *
E 51.79
C 50.48
46.38
49.48
45.03
48.24
40.56
46.95
Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008, aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. RRS pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(42) = 3.67 , p = .001* t(38) = 1.10 , p = .279 t(34) = 2.46 , p = .019 t(39) = 4.48 , p = .000* t(35) = 5.39 , p = .000* t(34) = 3.04 , p = .005*
t(49) = .62 , p = .539 t(46) = .30 , p = .768 t(41) = .83 , p = .412 t(47) = 1.11 , p = .273 t(42) = 2.25 , p = .030 t(42) = 1.76 , p = .086
Coping (UCL) Voor het effect van MBCT op vlak van coping, bekijken we de resultaten van de repeated measures analyses van de verschillende subschalen van de UCL. Subschaalscore ‘Actief aanpakken (ACT)’ Repeated measures-analyse voor de subschaalscore UCL-ACT met als within-subjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en betweensubjects factor ‘studiegroep’ (experimentele groep en controlegroep).
49
Tabel: Overzicht van de gemiddelde schaalscores van E en C op UCL-ACT bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E
C
E
Post C
FU-6M E C
FU-12M E C
N=34 N=42
N=34 N=42
N=34 N=42
N=34 N=42
15.50 15.07 3.43 3.79
17.68 14.93 3.95 3.58
17.82 15.93 4.22 3.61
18.38 14.74 4.49 3.83
Tijd
ANOVA Groep
UCLACT
M SD
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
F(3,222) = 8.03 p =.000 *** .098
F(1,74) = 7.72 p =.007 ** .094
F(3,222) = 7.94 p =.000 *** .097
Beginnen we met de subschaal ‘actief aanpakken (ACT)’. Vooreerst stellen we door middel van de ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de UCL-ACT van E versus C) vast dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(98) = -.72, p = .475). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de Mann-Whitney-test. Op de grafiek van de repeated measures analyse voor de subschaal ACT van de UCL is de bovenste curve van E, de onderste van C. Bij deze subschaal is sprake van een significant hoofdeffect van de factor ‘tijd’ op .001 niveau (F(3,222) = 8.03, p = .000). Vergelijken we de gemiddelde scores per meettijdstip, globaal over de twee groepen E en C - M (pre) = 15.29; M (post) = 16.30; M (FU6M) = 16.88; M (FU12M) = 16.56 - dan zien we dat deze scores globaal gezien stijgen over de meettijdstippen heen (lichte daling ttv FU12M). Er is tevens sprake van een significant hoofdeffect van de factor ‘groep’, nu op het .01 niveau (F(1,74) = 7.72, p = .007). Vergelijking van de gemiddelde scores van E versus C globaal gezien over de vier meettijdstippen – M(E) = 17.35, M(C )= 15.17 – toont dat E significant hoger scoort dan C. Verder is ook sprake van een significant interactie-effect ‘time x groep’, op het .001 niveau (F(3,222) = 7.94, p = .000). De vergelijking per meettijdstip van de gemiddelde scores van groep E versus groep C (onderstaande tabel) leert dat ttv de drie follow-up-meettijdstippen sprake is van een significant verschil tussen E en C, waarbij E hoger scoort op de UCL-ACT-subschaal (cf. significant resultaat van de respectievelijke ongepaarde t-tests en Mann-Whitney-tests). De vergelijking per studiegroep van de gemiddelde scores van de vier meettijdstippen leert dat bij
50
E per meettijdstip sprake is van een stijging van de score, bij C liggen de vier scores op de betreffende meettijdstippen in dezelfde lijn. UCL-ACT Pre t(98) = .-.72, p = .475 MW = 1153.50, p = .506 Post t(90) = -3.24, p = .002 ** MW = 658.00, p = .002 ** FU6M t(86) = -2.21, p = .030 * MW = 685.00, p = .021 * FU12M t(77) = -3.80, p = .000 *** MW = 428.50, p = .001 ***
E 15.50
C 15.07
17.68
14.93
17.82
15.93
18.38
14.74
Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008, aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. UCL-ACT pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(42) = -4.65 , p = .000* t(38) = -.42 , p = .676 t(34) = -.94 , p = .354 t(39) = -4.95 , p = .000* t(35) = -4.46 , p = .000* t(34) = -1.16 , p = .256
t(48) = -.16 , p = .873 t(45) = -2.16 , p = .036 t(41) = 2.57 , p = .014 t(47) = -2.24 , p = .030 t(42) = .85 , p = .401 t(42) = .71 , p = .481
Subschaalscore ‘Palliatief reactiepatroon (PAL)’ Repeated measures-analyse voor de subschaalscore UCL-PAL met als within-subjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en betweensubjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde schaalscores van E en C op UCL-PAL bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E UCLPAL M SD
C
Post E C
FU-6M E C
FU-12M E C
N=33 N=40
N=33 N=40
N=33 N=40
N=33 N=40
16.42 17.10 2.99 2.70
18.00 17.13 3.35 2.87
18.27 17.78 3.51 3.07
18.09 16.40 3.40 2.95
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
51
Tijd
F(3,213) = 4.11 p =.007 ** .055
ANOVA Groep
F(1,71) = 1.10 p =.298
F(3,213) = 3.52 p =.016 * .047
De volgende subschaal van de UCL betreft ‘palliatief reactiepatroon (PAL)’. Vooreerst stellen we door middel van de ongepaarde t-test (vergelijking van de gemiddelde baselinescores op de UCL-PAL van E versus C) vast dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(97) = .44, p = .662). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de Mann-Whitney-test. Op de grafiek van de repeated measures analyse voor de subschaal PAL van de UCL is de bovenste curve van E, de onderste van C. Bij deze vragenlijst is sprake van een significant hoofdeffect van de factor ‘tijd’ op .01 niveau (F(3,213) = 4.11, p = .007). Vergelijken we de gemiddelde scores per meettijdstip, globaal over de twee groepen E en C - M (pre) = 16.76; M (post) = 17.56; M (FU6M) = 18.02; M (FU12M) = 17.25 - dan zien we dat deze scores stijgen tot FU6M en nadien lichtjes dalen. Er is geen sprake van een significant hoofdeffect van de factor ‘groep’ (F(1,71) = 1.10, p = .298). Vergelijking van de gemiddelde scores van E versus C globaal gezien over de vier meettijdstippen – M(E) = 17.70, M(C )= 17.10 – toont immers dat deze scores in dezelfde lijn liggen. Er is dan wel weer sprake van een significant interactie-effect ‘time x groep’ op het .05 niveau (F(3,213) = 3.52, p = .016). De vergelijking per meettijdstip van de gemiddelde scores van groep E versus groep C (onderstaande tabel) leert dat ttv post en FU12M sprake is van een significant verschil tussen E en C, waarbij E hoger scoort op de UCL-PAL-subschaal (cf. significant resultaat van de Mann-Whitney-tests). De vergelijking per studiegroep van de gemiddelde scores van de vier meettijdstippen leert dat bij E per meettijdstip sprake is van een stijging van de score tot FU6M waarna een lichte daling, bij C liggen de scores tot FU6M in dezelfde lijn waarna een daling. UCL-PAL Pre t(97) = .44, p = .662 MW = 1134.50, p = .528 Post t(88) = -1.94, p = .055 MW = 760.00, p = .042 * FU6M t(86) = -.63, p = .531 MW = 898.50, p = .604 FU12M t(77) = -2.39, p = .019 * MW = 553.00, p = .028 *
E 16.42
C 17.10
18.00
17.13
18.27
17.78
18.09
16.40
52
Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008, aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. UCL-PAL pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(41) = -3.03 , p = .004* t(38) = -.29 , p = .775 t(34) = .43 , p = .669 t(38) = -3.23 , p = .003* t(34) = -3.14 , p = .003* t(34) = .00 , p = 1.000
t(46) = -.31 , p = .759 t(43) = -1.49 , p = .144 t(41) = 2.48 , p = .017 t(47) = -1.86 , p = .069 t(42) = 1.35 , p = .185 t(40) = 1.63 , p = .110
Subschaalscore ‘Vermijden (VER)’ Repeated measures-analyse voor de subschaalscore UCL-VER met als within-subjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en betweensubjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde schaalscores van E en C op UCL-VER bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E UCLVER M SD
C
E
Post C
FU-6M E C
FU-12M E C
N=33 N=41
N=33 N=41
N=33 N=41
N=33 N=41
16.24 17.85 4.39 4.09
15.73 17.07 3.28 4.14
16.12 17.83 3.77 3.58
16.33 17.63 3.92 4.07
Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
53
Tijd
F(3,216) = 1.25 p =.292
ANOVA Groep
F(1,72) = 3.57 p =.063
F(3,216) = .14 p =.939
Bij de repeated measures analyse van de subschaal ‘vermijden (VER)’ is geen sprake van significante hoofdeffecten van ‘tijd’ (F(3,216) = 1.25, p = .292) noch ‘groep’ (F(1,72) = 3.57, p = .063), noch van een significant interactie-effect ‘tijd x groep’ (F(3,216) = .14, p = .939). Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Bij deze subschaal is geen enkel resultaat van deze gepaarde t-tests significant, noch voor E noch voor C (geen enkele p-waarde is < .008 - supra). Subschaalscore ‘Sociale steun zoeken (SOC)’ Repeated measures-analyse voor de subschaalscore UCL-SOC met als within-subjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en betweensubjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde schaalscores van E en C op UCL-SOC bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E UCLSOC M SD
C
Post E C
FU-6M E C
FU-12M E C
N=33 N=41
N=33 N=41
N=33 N=41
N=33 N=41
14.52 13.00 5.05 4.27
15.21 12.90 4.35 4.57
15.85 13.17 4.02 4.69
15.12 12.46 4.20 4.28
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
Tijd
F(3,187) = 1.84 p =.150
ANOVA Groep
F(1,72) = 5.95 p =.017 * .076
F(3,187) = 1.13 p =.336
Voor de subschaal ‘sociale steun zoeken (SOC)’ toont de repeated measures analyse een significant hoofdeffect van ‘groep’ op .05 niveau (F(1,72) = 5.95, p = .017). Door middel van de ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de UCL-SOC van E versus C) stellen we vast dat de experimentele groep en controlegroep bij de start van de
54
studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(97) = -1.35, p = .182). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de Mann-Whitney-test. Op de grafiek van de repeated measures analyse voor de subschaal SOC van de UCL is de bovenste curve van E, de onderste van C. Vergelijking van de gemiddelde scores van E versus C globaal gezien over de vier meettijdstippen – M(E) = 15.17, M(C )= 12.88 – toont dat E significant hoger scoort dan C. Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008, aangeduid als *. Deze resultaten worden besproken bij de samenvattende conclusies van de repeated measures. UCL-SOC pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(41) = -1.17 , p = .250 t(38) = -1.95 , p = .059 t(34) = 1.66 , p = .105 t(38) = -2.83 , p = .007* t(34) = -.67 , p = .505 t(34) = .29 , p = .774
t(47) = -.13 , p = .900 t(44) = -.98 , p = .335 t(41) = 1.63 , p = .111 t(47) = -1.19 , p = .239 t(42) = 1.43 , p = .159 t(41) = 1.32 , p = .193
Subschaalscore ‘Depressief reactiepatroon (DEP)’ Repeated measures-analyse voor de subschaalscore UCL-DEP met als within-subjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en betweensubjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde schaalscores van E en C op UCL-DEP bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E UCLDEP M SD
C
E
Post C
FU-6M E C
FU-12M E C
N=33 N=41
N=33 N=41
N=33 N=41
N=33 N=41
16.06 16.37 3.37 3.60
13.24 16.66 3.26 3.81
13.00 15.73 2.95 3.69
12.64 15.46 3.77 3.73
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
55
Tijd
F(3,216) = 13.80 p =.000 *** .161
ANOVA Groep
F(1,72) = 10.94 p =.001 *** .132
F(3,216) = 7.17 p =.000 *** .091
De volgende subschaal is ‘depressief reactiepatroon (DEP)’. Door middel van de ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de UCL-DEP van E versus C) stellen we vast dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(97) = .06, p = .954). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de Mann-Whitney-test. Op de grafiek van de repeated measures analyse voor de subschaal DEP van de UCL is de bovenste curve van C, de onderste van E. Bij deze subschaal is sprake van een significant hoofdeffect van de factor ‘tijd’ op .001 niveau (F(3,216) = 13.80, p = .000). Vergelijken we de gemiddelde scores per meettijdstip, globaal over de twee groepen E en C - M (pre) = 16.21; M (post) = 14.95; M (FU6M) = 14.37; M (FU12M) = 14.05 - dan zien we dat deze scores globaal gezien dalen over de meettijdstippen heen. Er is tevens sprake van een significant hoofdeffect van de factor ‘groep’ eveneens op .001 niveau (F(1,72) = 10.94, p = .001). Vergelijking van de gemiddelde scores van E versus C globaal gezien over de vier meettijdstippen – M(E) = 13.74, M(C )= 16.06 – toont dat E significant lager scoort dan C. Verder is ook sprake van een significant interactie-effect ‘time x groep’ op het .001 niveau (F(3,216) = 7.17, p = .000). De vergelijking per meettijdstip van de gemiddelde scores van groep E versus groep C (onderstaande tabel) leert dat ttv de drie follow-up-meettijdstippen sprake is van een significant verschil tussen E en C, waarbij E lager scoort op de UCL-DEP-subschaal (cf. significant resultaat van de respectievelijke ongepaarde t-tests en Mann-Whitney-tests). De vergelijking per studiegroep van de gemiddelde scores van de vier meettijdstippen leert dat bij E per meettijdstip sprake is van een daling van de score, bij C liggen de vier scores op de betreffende meettijdstippen in dezelfde lijn (lichte daling na post). UCL-DEP Pre t(97) = .06, p = .954 MW = 1210.50, p = .924 Post t(89) = 4.20, p = .000 *** MW = 544.50, p = .000 ** FU6M t(86) = 4.08, p = .000 *** MW = 528.50, p = .000 *** FU12M t(77) = 3.31, p = .001 *** MW = 443.50, p = .001 ***
E 16.06
C 16.37
13.24
16.66
13.00
15.73
12.64
15.46
56
Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008, aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. UCL-DEP pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(41) = 5.25 , p = .000* t(38) = .69 , p = .496 t(34) = .45 , p = .654 t(38) = 6.65 , p = .000* t(34) = 6.06 , p = .000* t(34) = 1.20 , p = .238
t(47) = -.10 , p = .924 t(44) = 2.26 , p = .029 t(41) = .36 , p = .720 t(47) = 1.31 , p = .198 t(42) = 1.33 , p = .190 t(41) = 2.32 , p = .025
Subschaalscore ‘Expressie van emoties (EXP)’ Repeated measures-analyse voor de subschaalscore UCL-EXP met als within-subjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en betweensubjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde schaalscores van E en C op UCL-EXP bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E UCLEXP M SD
C
Post E C
FU-6M E C
FU-12M E C
N=33 N=41
N=33 N=41
N=33 N=41
N=33 N=41
6.91 6.46 1.96 1.61
6.97 6.49 1.98 1.96
7.03 6.51 1.86 1.65
6.70 6.27 1.83 1.66
Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
57
Tijd
F(3,216) = .902 p =.441
ANOVA Groep
F(1,72) = 1.76 p =.188
F(3,216) = .022 p =.996
Bij de repeated measures analyse van de subschaal ‘expressie van emoties (EXP)’ is geen sprake van significante hoofdeffecten van ‘tijd’ (F(3,216) = .90, p = .441) noch ‘groep’ (F(1,72) = 1.76, p = .188), noch van een significant interactie-effect ‘tijd x groep’ (F(3,216) = .022, p = .996). Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Bij deze subschaal is geen enkel resultaat van deze gepaarde t-tests significant, noch voor E noch voor C (geen enkele p-waarde is < .008 - supra). Subschaalscore ‘Geruststellende gedachten (GER)’ Repeated measures-analyse voor de subschaalscore UCL-GER met als within-subjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en betweensubjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde schaalscores van E en C op UCL-GER bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E UCLGER M SD
C
Post E C
FU-6M E C
FU-12M E C
N=33 N=41
N=33 N=41
N=33 N=41
N=33 N=41
10.94 11.41 2.45 2.92
13.30 11.07 3.02 2.41
12.42 11.85 3.00 2.34
13.06 11.61 3.15 2.68
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
58
Tijd
F(3,216) = 6.28 p =.000 *** .080
ANOVA Groep
F(1,72) = 3.20 p =.078
F(3,216) = 7.62 p =.000 *** .096
De laatste te bespreken subschaal van de UCL is ‘geruststellende gedachten (GER)’. De ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de UCL-GER van E versus C) toont aan dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(97) = 1.28, p = .204). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de Mann-Whitney-test. Op de grafiek van de repeated measures analyse voor de subschaal GER van de UCL is de bovenste curve van E, de onderste van C. Bij deze subschaal is sprake van een significant hoofdeffect van de factor ‘tijd’ op .001 niveau (F(3,200) = 7.26, p = .000). Vergelijken we de gemiddelde scores per meettijdstip, globaal over de twee groepen E en C - M (pre) = 11.18; M (post) = 12.19; M (FU6M) = 12.14; M (FU12M) = 12.34 - dan zien we dat deze scores globaal gezien stijgen over de meettijdstippen heen. Er is geen sprake van een significant hoofdeffect van de factor ‘groep’ (F(1,72) = 3.20, p = .078). Tenslotte is er bij deze subschaal sprake van een significant interactie-effect ‘time x groep’ op het .001 niveau (F(3,216) = 7.62, p = .000). De vergelijking per meettijdstip van de gemiddelde scores van groep E versus groep C (onderstaande tabel) leert dat ttv post en FU12M sprake is van een significant verschil tussen E en C, waarbij E hoger scoort op de UCL-GER-subschaal (cf. significant resultaat van de respectievelijke ongepaarde t-tests). De vergelijking per studiegroep van de gemiddelde scores van de vier meettijdstippen leert dat bij E sprake is van een sterke stijging van de score tussen pre en post met vervolgens een lichte daling om tenslotte opnieuw te stijgen; bij C liggen de vier scores op de betreffende meettijdstippen in dezelfde lijn. UCL-GER Pre t(97) = 1.28, p = .204 MW = 1027.50, p = .165 Post t(89) = -3.17, p = .002 ** MW = 646.50, p = .002 ** FU6M t(86) = -1.25, p = .214 MW = 819.00, p = .234 FU12M t(77) = -2.01, p = .048 * MW = 603.50, p = .091
E 10.94
C 11.42
13.30
11.07
12.42
11.85
13.06
11.61
Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008, aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. UCL-GER pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(41) = -5.29 , p = .000* t(38) = 1.09 , p = .281 t(34) = -1.42 , p = .166 t(38) = -4.19 , p = .000* t(34) = -4.40 , p = .000* t(34) = .39 , p = .696
59
t(47) = .06 , p = .955 t(44) = -1.95 , p = .058 t(41) = .71 , p = .483 t(47) = -.90 , p = .374 t(42) = -.44 , p = .664 t(41) = -1.06 , p = .297
Mindful awareness (MAAS) Repeated measures-analyse voor de totaalscores op de MAAS met als within-subjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en betweensubjects factor ‘studiegroep’ (experimentele groep en controlegroep). Tabel: Overzicht van de gemiddelde totaalscores van E en C op de MAAS bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E MAAS M SD
C
Post E C
FU-6M E C
FU-12M E C
N=33 N=42
N=33 N=42
N=33 N=42
N=33 N=42
3.72 .63
3.93 .72
4.09 .72
4.22 .87
3.48 .84
3.46 .89
3.66 .88
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
3.54 .94
Tijd
F(3,200) = 7.26 p =.000 *** .091
ANOVA Groep
F(1,73) = 7.14 p =.009 ** .089
F(3,200) = 3.10 p =.032 * .041
Betreffende het effect van MBCT op vlak van mindful awareness, gemeten door middel van de MAAS, stellen we vooreerst door middel van de ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de MAAS van E versus C) vast dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(97) = -.86, p = .395). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de Mann-Whitney-test. Op de grafiek van de repeated measures analyse voor de MAAS is de bovenste curve van E, de onderste van C. We stellen vast dat sprake is van een significant hoofdeffect van de factor ‘tijd’ op .001 significantieniveau (F(3,200) = 7.26, p = .000). Vergelijken we de gemiddelde scores per meettijdstip, globaal over de twee groepen E en C - M (pre) = 3.60; M (post) = 3.69; M (FU6M) = 3.88; M (FU12M) = 3.88 - dan stellen we een stijging van de score per meetmoment vast. Tevens is sprake van een significant hoofdeffect van de factor ‘groep’, op .01 niveau (F(1,73) = 7.14, p = .009); de gemiddelde scores per studiegroep globaal over de
60
vier meettijdstippen - M (E) = 3.99; M (C) = 3.54 – tonen een hogere gemiddelde score voor E in vergelijking met C. Tenslotte stellen we ook een significant interactie-effect ‘time x groep’ vast, op het .05 niveau (F(3,200) = 3.10, p = .032). De vergelijking per meettijdstip van de gemiddelde scores van groep E versus groep C (onderstaande tabel) leert dat op de drie follow-up-meetmomenten er een significant verschil is tussen E en C, waarbij E hoger scoort op de MAAS (cf. significante resultaten van de vermelde ongepaarde t-tests en de nonparametrische variant, de Mann-Whitney-tests). De vergelijking per studiegroep van de gemiddelde scores van de vier meettijdstippen leert dat bij E sprake is van een stijging van de score per meettijdstip, terwijl de scores van C per meetmoment lichtjes stijgen of dalen. MAAS Pre t(97) = -.86, p = .395 MW = 1060.50, p = .252 Post t(91) = -2.34, p = .022 * MW = 772.00, p = .019 * FU6M t(86) = -2.71, p = .008 ** MW = 613.50, p = .004 ** FU12M t(77) = -2.92, p = .005 ** MW = 497.50, p = .006 **
E 3.72
C 3.48
3.92
3.46
4.09
3.66
4.22
3.54
Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores (dezelfde testresultaten of de totaalscores al dan niet /15items) op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008, aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. MAAS pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E t(41) = -2.36, p = .023 t(38) = -2.14, p = .039 t(34) = -1.41, p = .167 t(38) = -3.91, p = .000 * t(34) = -3.66, p = .001 * t(34) = -2.39, p = .023
C t(49) = .25, p = .803 t(46) = -1.98, p = .054 t(41) = 1.39, p = .172 t(47) = -1.48, p = .145 t(42) = -.60, p = .554 t(42) = -.84, p = .405
Levenskwaliteit (QLDS) Repeated measures-analyse voor de totaalscores op de QLDS met als within-subjects-factor het meetmoment ‘tijd’ (pre-, post-, follow-up-6M en follow-up-12M-meting) en betweensubjects factor ‘studiegroep’ (experimentele groep en controlegroep).
61
Tabel: Overzicht van de gemiddelde totaalscores van E en C op de QLDS bij pre-, post-, FU-6M- en FU-12M-meting en overzicht van effect van Tijd, Groep en Tijd x Groep.
Pre E QLDS M SD
C
E
Post C
FU-6M E C
FU-12M E C
N=34 N=41
N=34 N=41
N=34 N=41
N=34 N=41
7.82 10.32 6.97 9.35
3.79 11.51 4.98 9.45
4.24 10.00 6.23 10.33
4.88 11.02 7.47 10.18
Effect size Noot: * p ≤ .05 ** p ≤ .01 *** p ≤ .001
Tijd
F(3,199) = 1.80 p =.155
ANOVA Groep
F(1,73) = 11.17 p =.001 *** .133
F(3,199) = 3.18 p =.029 * .042
Tenslotte bespreken we het effect van MBCT op vlak van levenskwaliteit, gemeten door middel van de QLDS. De ongepaarde t-test (vergelijking van de gemiddelde baseline-scores op de QLDS van E versus C) toont aan dat de experimentele groep en controlegroep bij de start van de studie en deelname van E aan MBCT niet significant van elkaar verschillen (t(97) = 1.07, p = .289). Deze bevinding wordt ondersteund door het resultaat van de parallelle nonparametrische test, met name de Mann-Whitney-test. Op de grafiek van de repeated measures analyse voor de QLDS is de bovenste curve van C, de onderste van E. We stellen vast dat sprake is van een significant hoofdeffect van de factor ‘groep’, op .001 niveau (F(1,73) = 11.17, p = .001); de gemiddelde scores per studiegroep globaal over de vier meettijdstippen - M (E) = 5.18; M (C) = 10.71 – tonen een veel lagere gemiddelde score voor E in vergelijking met C (bij deze vragenlijst wijst een lagere score op een hogere levenskwaliteit en een hogere score op en lagere levenskwaliteit). We stellen tevens een significant interactie-effect ‘time x groep’ vast, op het .05 niveau (F(3,199) = 3.18, p = .029). De vergelijking per meettijdstip van de gemiddelde scores van groep E versus groep C (onderstaande tabel) leert dat op de drie follow-up-meetmomenten er een significant verschil is tussen E en C, waarbij E lager scoort op de QLDS (cf. significante resultaten van de vermelde ongepaarde t-tests en de non-parametrische variant, de Mann-Whitney-tests). De vergelijking per studiegroep van de gemiddelde scores van de vier meettijdstippen leert dat bij E sprake is van een sterke daling tussen pre en post waarna een lichte stijging van de score ttv FU6M en FU12M; de scores van C stijgen of dalen lichtjes per meettijdstip.
62
QLDS Pre t(97) = 1.07, p = .289 MW = 1074.50, p = .295 Post t(87) = 4.02, p = .000 *** MW = 553.50, p = .000 *** FU6M t(77) = 3.32, p = .001 *** MW = 627.50, p = .017 * FU12M t(76) = 3.04, p = .003 ** MW = 475.50, p = .005 **
E 7.82
C 10.32
3.79
11.51
4.24
10.00
4.88
11.02
Aan de hand van de gepaarde t-tests waarbij voor E versus C de scores op de verschillende meettijdstippen onderling met elkaar worden vergeleken kunnen we bij elk van de studiegroepen apart enerzijds nagaan of de scores op verschillende meettijdstippen significant verschillend zijn en anderzijds of de eventuele verandering tussen meettijdstippen al dan niet behouden blijft. Onderstaande tabel geeft een overzicht van de statistische resultaten. In het kader van de beslissing of een resultaat significant is of niet dienen we bij deze specifieke analyse een Bonferroni-correctie toe te passen (supra), waarbij resultaten bij deze analyse als significant beschouwd worden als de p-waarde < .008, aangeduid als * . Deze resultaten worden geïnterpreteerd bij de samenvattende conclusies van de repeated measures. QLDS pre – post post – 6M 6M – 12M pre – 6M pre – 12M post – 12M
E
C t(41) = 4.47 , p = .000* t(37) = -.16 , p = .876 t(34) = -.27 , p = .793 t(38) = 3.36 , p = .002* t(34) = 1.90 , p = .066 t(33) = -.82 , p = .421
t(49) = -.46 , p = .646 t(45) = .24 , p = .815 t(40) = -.76 , p = .451 t(45) = -.25 , p = .801 t(42) = -.80 , p = .426 t(42) = .38 , p = .704
Samenvattend kunnen op basis van de repeated measures analyses van de verschillende vragenlijsten de onderstaande conclusies getrokken worden betreffende de effectiviteit van MBCT bij de specifieke onderzoekspopulatie van deze MBCT-pilootstudie. We gaan na hoe de resultaten zich verhouden ten opzichte van de initiële formulering van de onderzoeksvragen, beschrijven de grafieken van de verschillende analyses en dit in termen van wat gemeten wordt door de vragenlijsten en subschalen. Ondanks de globaal gezien vrij kleine effect sizes van de significante hoofd- en interactie-effecten, het blijven sterk significante effecten (meestal p < .001 en p < .01) en daarom zeer belangrijk in het kader van de evaluatie van de effectiviteit van MBCT. De scores op de BDI geven een beeld van de ernst van een eventueel aanwezige depressieve status. We brengen er de mate van depressieve symptomen mee in kaart, maar stellen hiermee geen diagnose. De totaalscore geeft een schatting van de algehele ernst van de depressie; bijkomend verdient de inhoud van de items bijzondere aandacht. In dit kader bespreken we verder item 9. Men dient echter steeds het volledige patroon van door de patiënt gerapporteerde depressieve symptomen te onderzoeken. Uit het significante interactie-effect van ‘tijd x groep’ blijkt dat het effect van de ene variabele afhankelijk is van het ‘level’ van de andere variabele. De grafiek toont dat het effect van MBCT (cf. variabele ‘tijd’) afhankelijk is van de aard van de studiegroep. Bij E is sprake van een significante daling van de scores tussen pre en post, waarna geen significante verschillen meer vastgesteld worden 63
tussen de follow-up-tijdstippen (post, FU6M en FU12M) onderling. Bij C daarentegen is bij de vergelijking van de verschillende meettijdstippen onderling nergens sprake van een significant verschil. Voor de start van de studie was er geen significant verschil in de score van E versus C. Het effect van de variabele ‘groep’ toont zich ten tijde van de drie follow-upmomenten (C scoort veel hoger dan E). Item 9 van de BDI betreft "suïcidale gedachten of wensen" en is een indicator voor risico op suïcide. Ook bij dit specifieke item blijkt dat sprake is van een significant groeps- en interactie-effect, waarbij E significant lager scoort dat C. Bij de subschaal 'depressief' van de POMS is sprake van een significant hoofdeffect van de factor 'groep' alsook van een interactie-effect 'tijd x groep'. De grafiek leert ons dat het effect van MBCT afhankelijk is van de studiegroep. De experimentele groep rapporteert ten tijde van post een significante daling van hun score op deze subschaal in vergelijking met pre, ook ten tijde van FU6M is deze daling nog significant in vergelijking met pre. Dit gunstige effect blijft behouden op de andere twee follow-up-meettijdstippen, na post zijn er geen significante daling of stijging meer van de subschaalscores bij E. Bij C daarentegen zijn er wat schommelingen van de scores op de verschillende meetmomenten, doch deze zijn niet significant. Het effect van 'groep' is het duidelijkst op de meetmomenten post en FU6M (significante t-tests E versus C). De subschaal 'boos' wordt gekenmerkt door de significante hoofdeffecten van 'tijd' en 'groep' en een borderline interactie-effect (p = .056). Bekijken we de grafiek dan zien we dat E een significante daling rapporteert op dit vlak tussen pre en post, die significant blijft ten tijde van FU6M. Bij de controlegroep zijn er wel wat schommelingen tussen de scores op de verschillende meettijdstippen, doch niet noemenswaardig want niet significant. Wat betreft de rapportering van symptomen kaderend binnen de subschaal 'moe' zien dat er sprake is van een verschil tussen de meettijdstippen (hoofdeffect van 'tijd') en dat dit effect van de tijdsvariabele afhankelijk is van de studiegroep. De grafiek en de paired samples t-tests tonen duidelijk dat enkel bij E sprake is van een significant verschil (meer bepaald een sterke daling in de scores) tussen pre en post, alsook tussen pre en FU6M en tussen pre en FU12M. Wat de subschaal 'krachtig' betreft blijkt dat de E groep een significante verbetering op dit vlak rapporteert, die behouden blijft tot het moment van de FU12M (significant verschil tussen pre en FU12M), terwijl de scores van C niet noemenswaardig van elkaar verschillen over de meetmomenten heen. In de rapportering van de mate waarin de personen uit E en C zich ‘gespannen’ voelen ten tijde van de verschillende meetmomenten blijken opnieuw significante resultaten enkel bij E: significant lagere scores op de drie follow-up-momenten in vergelijking met de baseline meting. De BHS meet de mate van hopeloosheid die bij de betreffende patiënten aanwezig is. Hopeloosheid hangt sterk samen met het risico op suïcide. Bij de onderzoeksgroep van de MBCT-studie schommelen de scores van E en C wel tussen de verschillende meettijdstippen doch de paired samples t-tests leren ons dat deze verschillen echter noch bij E noch bij C significant zijn. De repeated measures analyse laat wel toe dat we besluiten dat E globaal gezien veel lager scoort dan C, dat MBCT een effect blijkt uit te oefenen op vlak van hopeloosheid. Door middel van de ZBV worden twee angst-concepten gemeten: enerzijds de toestandsangst ("state anxiety") en anderzijds de angstdispositie ("trait anxiety") – infra. State anxiety
Trait anxiety
een voorbijgaande momentane emotionele conditie van het individu die gekenmerkt wordt door subjectieve bewust ervaren gevoelens van spanning of gespannenheid, alsmede een verhoogde activiteit van het autonome zenuwstelsel; varieert in intensiteit en fluctueert in de tijd relatief stabiele individuele verschillen in angstgeneigdheid, de tendentie om op als bedreigend ervaren situaties te reageren met verhogingen in de intensiteit van de toestandsangst
64
Zowel voor de subschaal toestandsangst als voor de subschaal angstdispositie is sprake van significante hoofdeffecten voor de factoren ‘tijd’ én ‘groep’ alsook van een significant interactie-effect ‘tijd x groep’. Bij beide subschalen tonen de curves van de grafiek (beide grafieken zijn zeer gelijkaardig qua vorm) enerzijds aan dat C tijdens het ganse studieverloop (uitgezonderd de baseline meting) significant hoger scoort dan E en anderzijds dat het effect van tijd (het effect van MBCT m.a.w.) afhankelijk is van de studiegroep. Dit laatste uit zich concreet in het feit dat enkel bij E sprake is van een significant lagere score ten tijde van post én FU6M én FU12M in vergelijking met de premeting; de schommelingen van de scores van C zijn niet significant verschillend van elkaar (behalve dat bij subschaal ‘trait’ sprake is van een significante daling van de score tussen post en FU6M). De RRS is een maat voor ruminatie. Bij de start van de studie scoort E iets hoger dan C, doch dit is geen significant verschil. Uit het significante hoofdeffect van de factor ‘tijd’ en het significante interactie-effect ‘tijd x groep’ kunnen we afleiden dat de experimentele groep in vergelijking met pre significant lager scoort ten tijde van post, FU6M en FU12M alsook dat de score ten tijde van FU12M significant lager is dan de score post. In tegenstelling hiermee zijn er bij C geen significant lagere scores over de meetmomenten heen. Aan de hand van de UCL kan worden nagegaan welk copinggedrag personen in het algemeen stellen bij confrontatie met problemen of aanpassingvereisende gebeurtenissen. Copinggedrag wordt hier beschouwd als een persoonskenmerk, gekenmerkt door een zekere mate van stabiliteit, maar in principe veranderbaar. Deze vragenlijst bestaat uit 7 subschalen die elk een bepaald copinggedrag meten, samengevat in onderstaande tabel. Actief aanpakken (ACT) Palliatieve reactie (PAL) Vermijden (VER) Sociale steun zoeken (SOC) Depressief / passief reactiepatroon (DEP)
Expressie van emoties (EXP) Geruststellende en troostende gedachten (GER)
"de situatie rustig van alle kanten bekijken, de zaken op een rijtje zetten; doelgricht en met vertrouwen te werk gaan om het probleem op te lossen" "afleiding zoeken en zich met andere dingen bezighouden om niet aan het probleem te hoeven denken; proberen zich wat prettiger te voelen door te roken, te drinken of zich wat te ontspannen" "de zaak op zijn beloop laten, de situatie uit de weg gaan of afwachten wat er gaat gebeuren" "het zoeken van troost en begrip bij anderen; zorgen aan iemand vertellen of hulp vragen" "zich volledig door de problemen en de situatie in beslag laten nemen, de zaak somber inzien, zich piekerend in zichzelf terugtrekken, niet in staat om iets aan de situatie te doen; piekeren over het verleden; inertie" "het laten blijken van ergernis of kwaadheid; spanningen afreageren" "zichzelf geruststellen met de gedachte dat na regen zonneschijn komt, dat anderen het ook wel eens moeilijk hebben of dat er nog wel ergere dingen gebeuren; jezelf moed inspreken"
Op vlak van ‘het actief en doelgericht aanpakken van problemen’ blijkt dat E in vergelijking met C - met uitzondering van de premeting - tijdens de studie significant hoger scoort alsook dat bij E het verschil tussen de prescore enerzijds en de FU6M- en FU12M-scores anderzijds significant is (stijging van de scores na deelname aan MBCT). Wat betreft de subschaal ‘palliatieve reactie’ ligt de curve van E hoger dan C, doch er is geen sprake van een significant hoofdeffect van ‘groep’, waardoor mag geconcludeerd worden dat globaal gezien de scores van E en C op de verschillende meettijdstippen niet significant van elkaar verschillen (enkel de ongepaarde t-test bij FU12M is significant, en dan pas op het .05 niveau; ttv post geeft enkel de niet-parametrische variant een significant resultaat). Tevens blijkt dat de score van E ten tijde van post, FU6M en FU12M significant hoger ligt dan de pre-score, voor de C groep zijn geen significante verschillen tussen de scores op de verschillende meetmomenten waar te nemen. Op vlak van ‘vermijden’ zijn in de loop van de studie geen significante verschillen vast te stellen tussen E en C. Wat betreft ‘het zoeken van sociale steun’ bij de confrontatie met problemen is het zo dat op basis van de resultaten enkel kan
65
besloten worden tot een significant hoofdeffect van de factor ‘groep’, namelijk dat E over de ganse lijn hoger scoort dat C. Zowel voor E als C zijn de verschillen tussen de scores op deze subschaal op de drie follow-up-meettijdstippen onderling niet significant verschillend (behalve vergelijking pre en FU6M voor E waar sprake is van een significante stijging). Bekijken we de subschaal ‘depressief / passief reactiepatroon’ dan zien we significante hoofdeffecten voor de factoren ‘tijd’ en ‘groep’ én een significant interactie-effect ‘tijd x groep’. Over de follow-up-momenten heen beschouwd scoort C hoger dan E en is bij E – in tegenstelling tot C – een significante daling van de score tussen pre en post waar te nemen, een gunstig effect dat stabiel blijft op langere termijn (FU6M en FU12M). Net als bij de subschaal vermijden zijn er voor ‘expressie van emoties’ in de loop van de studie geen significante verschillen vast te stellen tussen E en C. Op vlak van ‘geruststellende en troostende gedachten’ scoort E ten tijde van post en FU12M significant hoger dan C én is eveneens bij E - in tegenstelling tot C - sprake van een significante stijging van de score bij de onderlinge vergelijking van pre met de drie follow-up-meetmomenten. De MAAS is een maat voor de mate van ‘mindful awareness’. Hier is sprake én van significante hoofdeffecten voor de factoren ‘tijd’ en ‘groep’ én van een significant interactieeffect ‘tijd x groep’. Uit de grafiek kunnen we aflezen dat de scores van E op deze vragenlijst stijgen naarmate de studie vordert; de stijging tussen pre en FU6M enerzijds en pre en FU12M anderzijds is zelfs significant op .001 niveau. De scores van C op de verschillende meettijdstippen verschillen onderling niet significant van elkaar. Verder toont het hoofdeffect van ‘groep’ ook dat E gedurende de ganse follow-up significant hoger scoort dan C. De QLDS meet de levenskwaliteit wanneer sprake is van een depressieve status. Bij deze vragenlijst is het zo dat hoe hoger de totaalscore is, hoe lager de levenskwaliteit van de betrokkenen. Hier is sprake van een significant hoofdeffect van ‘groep’ – C scoort op de drie follow-up-momenten significant hoger dan E en rapporteert dus een lagere levenskwaliteit dan E. Het effect van ‘tijd’ is afhankelijk van de studiegroep – we zien dat enkel bij E sprake is van een significant verschil tussen pre en post (daling van de score = verbetering van de levenskwaliteit), een verbetering die ook behouden blijft ten tijde van FU6M en FU12M (gezien geen significant verschil meer tussen post en FU6M enerzijds en FU6M en FU12M anderzijds); de scores van C verschillen onderling niet significant van elkaar. Globaal gezien kunnen we uit de bovenstaande samenvattende bevindingen besluiten dat MBCT op vlak van depressieve symptomen en kwetsbaarheidsfactoren voor herval in depressie (bv. ruminatie) enerzijds en voor de 'suicidal mode of mind' (bv. hopeloosheid, gebrekkige probleemoplossende vaardigheden) anderzijds gunstige effecten blijkt uit te oefenen. Bekijken we de verschillende vragenlijsten dan is meestal sprake van een significant hoofdeffect van de factor ‘groep’ en/of een significant interactie-effect ‘tijd x groep’ (behalve bij UCL-vermijden en UCL-expressie van emoties zijn geen van beide effecten aanwezig). Uit het hoofdeffect van groep kan dan afgeleid worden dat de experimentele groep over de meetmomenten heen gunstiger scoort dan de controlegroep (een gunstigere score voor E is of een hogere of een lagere score dan C, afhankelijk van het meetobjectief van de betreffende vragenlijst). Uit het interactie-effect tijd x groep blijkt dan voornamelijk dat enkel bij de experimentele groep (behalve bij ZBV-TRAIT) sprake is van een significant verschil tussen de scores ten tijde van pre en post (dus reeds significant verschillende score vlak na deelname aan MBCT = reeds effect op korte termijn – behalve bij UCL-sociale steun-score (en MAASscore) van E waar significant effect pas ttv FU6M) en dat de bekomen verandering na MBCT behouden blijft op langere termijn, meer bepaald ten tijde van FU6M en FU12M (meestal
66
geen significant verschil tussen post en FU6M onderling en tussen FU6M en FU12 onderling). Concreet zien we dat MBCT reeds op korte termijn een gunstig effect uitoefent op vlak van depressieve symptomen (vermindering – zie BDI, HRSD, POMS-depressief) en de globale lichamelijke en psychische status (daling POMS-boos-score, daling POMS-moescore, stijging POMS-krachtig-score, daling POMS-gespannen-score) enerzijds en tal van intermediaire – cognitieve / neuropsychologische – variabelen anderzijds. Zo blijkt het volgen van MBCT te leiden tot een vermindering van angst (ZBV-state en ZBV-trait), een daling van de mate van ruminatie (RRS), een veranderd copingpatroon (voornamelijk stijging UCLactief aanpakken-score, daling UCL-depressief reactiepatroon-score, stijging UCLgeruststellende gedachten-score), een stijging van de mate van ‘mindful awareness’ (MAAS) en een verbetering van de levenskwaliteit (QLDS). Wat betreft hopeloosheid kan niet direct besloten worden dat het volgen van MBCT leidt tot een significante daling hiervan, doch indirect toont de globale significant lagere score van E ten opzichte van C een effect van MBCT over de meetmomenten heen. Belangrijk is dat de beschreven gunstige effecten globaal gezien behouden blijven op langere termijn (de studie evalueert tot een jaar na de postmeting). Onderzoeksvraag 5: Wat zijn de verwachtingen van de onderzoekspopulatie ten opzichte van MBCT en hoe evalueren zij de training ? In het uitgebreide onderzoeksrapport bieden verschillende tabellen een overzicht van de responsen van de onderzoekspopulatie op de variabelen in verband met de verwachtingen ten opzichte van MBCT alsook van het door de experimentele groep (na deelname aan MBCT) vermelde effect van MBCT op vlak van enkele klinische karakteristieken (in zekere zin een evaluatie in welke mate aan de verwachtingen werd voldaan). Tevens weergave van de mate van oefening tussen de sessies door, het al dan niet volgen van extra mindfulness-sessies na de training … . Vervolgens ook weergave van de variabelen ivm de evaluatie van vormgeving van MBCT (o.a. tevredenheid met de behandeling – mbt aard, duur, interactie met de therapeut …) – enkel van toepassing voor de experimentele groep. Aan de hand van de enquête hebben we reeds informatie bekomen omtrent de evaluatie van MBCT door de intermediairen. De tabellen in het uitgebreide onderzoeksrapport betreffende onderzoeksvraag 5 bieden een duidelijk overzicht van de gegevens omtrent de verwachtingen tegenover en evaluatie van MBCT van de onderzoeksgroep en de cijfers spreken voor zich. Bij het onderdeel ‘beleidsadviezen’ (infra) worden de belangrijkste resultaten samengevat.
67
Discussie Pluspunten van de studie Belangrijk in deze MBCT-studie is de vraag naar de effectiviteit van MBCT - toegevoegd aan de treatment-as-usual en in vergelijking met een groep die louter de TAU volgt - bij patiënten met recidiverende depressie, die minimum 3 depressieve episodes hebben doorgemaakt in het verleden en niet in een acute depressieve status verkeren op moment van deelname aan de studie. Deze vraag wordt in deze studie geconcretiseerd in twee onderzoeksvragen (de onderzoekspopulatie wordt gedefinieerd door middel van specifieke inclusie- en exclusiecriteria en de effecten worden gemeten met zorgvuldig geselecteerde evaluatieinstrumenten). Door middel van de evaluatie-instrumenten kan de klinische evolutie van een patiënt gemeten worden en subjectief beleefde situaties en therapeutisch effecten vastgesteld. Enerzijds is er de hoger beschreven onderzoeksvraag 3, die nagaat of MBCT bij de specifieke beschreven onderzoekspopulatie kan bijdragen tot het verkleinen van het risico op herval. Anderzijds onderzoeken we bij onderzoeksvraag 4 het effect van MBCT op vlak van variabelen die een rol spelen in de kwetsbaarheid voor depressie en suïcidaliteit. Deze onderzoeksvragen zijn zeer relevant en zijn een wetenschappelijke vertaling van een klinische vraag, gezien de nood naar interventies in het domein van hervalpreventie voor depressie. De MBCT-pilootstudie is een gecontroleerde studie. “Het bestaan van een controlegroep vermijdt de verwarringsbias, verbetert de interne validiteit en verhoogt de statistische power van het resultaat.” (Oswald, 2007) De controlegroep werd tegelijkertijd met de experimentele groep gerecruteerd. Deze studie kan enkel besluiten dat de toevoeging van MBCT een eventuele meerwaarde kan hebben ten opzichte van TAU alleen; er kan niet besloten worden tot een zuiver causaal verband tussen MBCT en bv. een verminderd risico op herval noch dat MBCT superieur is aan bestaande behandelingen die mogelijks TAU zijn. Extra informatie (die de relevantie van de basisvraag zou kunnen verhogen) waarin in de klinische sector interesse voor bestaat is de vergelijking van MBCT met een andere therapie bij de specifieke onderzoekspopulatie. Tevens is deze MBCT-pilootstudie een gerandomiseerde studie. ‘Randomisatie vermijdt een selectiebias, verbetert de interne validiteit en verhoogt de statistische power van het resultaat.” (Oswald, 2007) Bij randomisatie worden er twee vergelijkbare groepen samengesteld en worden de bekende en onbekende factoren die de klinische evolutie beïnvloeden (geslacht, leeftijd, comorbiditeit) willekeurig gespreid. Zoals bij de onderzoeksresultaten werd beschreven kunnen we voor de experimentele en controlegroep in deze studie besluiten tot een groepsequivalentie. De statistische analyses werden uitgevoerd op de intention-to-treat (ITT)-sample. “Een ITTanalyse omvat alle gerandomiseerde proefpersonen en vermijdt op die manier de zogenaamde attritiebias (waarbij patiënten die zijn opgenomen in de studie niet betrokken worden bij de analyse).” (Oswald, 2007) Het zou fout zijn om patiënten uit te sluiten uit de eindanalyse want de vergelijkbaarheid van de randomisatiegroepen zou niet langer gewaarborgd zijn. De ITT-analyse vereist dat alle patiënten geanalyseerd worden zodra ze gerandomiseerd zijn, ongeacht hun therapietrouw en ongeacht of ze uit de studie zijn gestapt of niet. Het ontbreken van een ITT-analyse kan tot bias leiden in het voordeel van de studiebehandeling. Zo zou er een overschatting kunnen zijn van het effect van de behandeling als er wordt van uitgaan dat de uitgesloten proefpersonen meer risico lopen om niet te reageren op het geteste.
68
Beperkingen van de studie Betreffende de blindheid van de studie willen we het volgende vermelden. De MBCT-studie betreft geen enkel- (onderzoeker weet welke patiënt tot welke groep behoort, patiënt niet) noch dubbelblinde (noch onderzoeker noch patiënt zelf weet wie tot welke groep behoort) studie. Bij een dubbelblinde studie wordt de evaluatie van de doeltreffendheid niet beïnvloed door kennis van de behandeling. “Een dubbelblinde studie verkleint de kans op een followup- en een evaluatiebias, verbetert de interne validiteit en verhoogt de statistische power van het resultaat.” (Oswald, 2007) Het is echter zo dat een psychotherapeutische techniek niet dubbelblind kan geëvalueerd worden (besluit na overleg met verschillende collega’s, Prof. Williams en expert inzake statistiek, alsook parallel met andere studies), doch dit vormt geen belemmering voor het bereiken van een goed gefundeerde studie-opzet en bijbehorende resultaten. Omwille van geen blindheid dient dan wel rekening te worden gehouden met de factor ‘sociale wenselijkheid’. De keuze van objectieve doeltreffendheidscriteria botst in zekere zin op de complexiteit van symptomen van psychiatrische aandoeningen. (Oswald, 2007) Gezien het gebruik van zelfrapportagelijsten in deze studie dienen we bij de interpretatie van de vragenlijstscores rekening te houden met het feit dat iedere zelfrapportagevragenlijst tendenties (de zogenaamde 'response bias') kan vertonen. Ofwel kunnen individuen eventueel meer symptomen laten zien dan ze feitelijk hebben (waardoor onterecht hoge scores worden gemeten), ofwel kunnen ze symptomen ontkennen waardoor onterecht lage scores worden gemeten. We dienen er rekening mee te houden dat de ons bekende gegevens omtrent de diagnoses van de patiënten gebaseerd zijn op wat de patiënten zelf antwoorden op onze specifieke gedetailleerde vragen die peilen naar o.a. diagnoses en kenmerken (tijdens het checken van de inclusie-/ en exclusiecriteria). De verbeterde toestand van de experimentele groep kan op sommige vlakken eventueel te danken zijn aan fenomenen (de zogenaamde ‘confounding factors’) zoals het natuurlijke ziekteverloop, het placebo-effect (alleen al aandacht voor de patiënten kan een gunstig effect hebben), effect van groepstherapie, concomitante maatregelen. Een gecontroleerde studie biedt echter een oplossing voor de ‘verwarringsbias’ (geen rekening houden met confounders); een gerandomiseerde studie voor de ‘selectiebias’ (beide groepen zijn niet vergelijkbaar) en een intention-to-treat studie voor de ‘attritiebias’ (de gerandomiseerde patiënten worden niet betrokken bij de eindanalyse). (Oswald, 2007) In het kader van extrapolatie van de onderzoeksresultaten dient het volgende vermeld te worden. De resultaten van deze MBCT-studie zijn de eerste inleidende resultaten van een pilootstudie in een welbepaalde onderzoeksregio in een welbepaald land bij een specifieke duidelijk gedefinieerde onderzoekspopulatie (inclusie- en exclusiecriteria) en kunnen niet zonder meer geëxtrapoleerd worden naar andere indicaties en regio’s. Ondanks de eventuele aanwezigheid van interfererende factoren is in deze studie toch sprake van sterke significanties. De p-waarde geeft een indicatie van de statistische relevantie van een resultaat door het foutrisico te beheersen, maar meet niet de werkzaamheid van een product. Uiteindelijk kan een p-waarde > .05 te wijten zijn aan een gebrek aan werkzaamheid van het product, maar ook van een gebrek aan statistische power. We moeten ook rekening houden met de soms lage respons-rate op sommige variabelen omwille van het feit dat wel eens veel patiënten zaken niet gedetailleerd kunnen beschrijven (waardoor dan veel de categorie ‘onduidelijk’ dient gescoord te worden die geen bijzondere informatie biedt). Er dient steeds rekening te worden gehouden met de uitspraak “Gebrek aan bewijs is nog geen bewijs van gebrek aan werkzaamheid !” (Oswald, 2007)
69
IV. BELEIDSADVIEZEN Deze MBCT-pilootstudie kadert binnen de zesde Vlaamse gezondheidsdoelstelling. Er wordt belang gehecht aan MBCT met het oog op hervalpreventie van depressie. Uit internationaal onderzoek is reeds gebleken dat MBCT een doeltreffende niet-farmacologische kostenefficiënte psychotherapeutische benadering is met het oog op het voorkomen van herval bij patiënten die reeds meerdere depressieve episoden hebben doorgemaakt en hersteld zijn op het moment van de training (evidence-based). In het kader van de implementatiestudie blijkt dat de globale evaluatie van intermediairen en CGG over MBCT gunstig is. Ook de studiedeelnemers van de experimentele conditie zijn globaal gezien positief over MBCT. Inachtnemende de methodologische problemen die zich bij elk dergelijk onderzoek kunnen voordoen, kunnen we afleiden uit de gunstige statistische resultaten van deze effectstudie (zie ook onderstaande samenvatting) dat er een significant verschil bestaat tussen de experimentele en controlegroep wat betreft de mate van herval (verminderd hervalrisico bij E), dat MBCT resulteert in een bijna significant verschil tussen E en C qua aantal weken tot eerste herval én dat MBCT een gunstig effect uitoefent op meerdere variabelen die een rol spelen in de kwetsbaarheid voor depressie en de zogenaamde ‘suicidal mode of mind’ (temeer daar depressie een risicofactor is voor suïcidaliteit). Bijgevolg kunnen we besluiten dat MBCT bij de onderzochte populatie een belangrijke rol speelt als ‘back-up’ voor andere medicamenteuze en therapeutische behandelingen in het kader van hervalpreventie bij depressie. Dit is een belangrijk gezondheidseconomisch aspect, denken we hierbij aan de timemanagement voor hulpverleners bij het aanbieden van MBCT. Of zoals Teasdale et al (2000) het verwoorden: “The preventative effect of MBCT was achieved for an average investment of less than 5 hr of instructor time per patient, suggesting that offering a group skills-based training program to recovered depressed patients may be a cost-efficient strategy for prevention.” Alle onderzoeksresultaten van deze pilootstudie verdienen voldoende aandacht. Met het oog op de ruimere bekendmaking van deze studieresultaten willen we hieronder echter de belangrijkste resultaten definiëren. Deze conclusies kunnen als basis dienen voor tal van beleidsbeslissingen. 1. Tussen de huisartsen, psychiaters en psychologen uit de random sample die de enquête heeft ingevuld bestaat er een significant verschil wat betreft hun kennis over de inhoud en vormgeving van MBCT enerzijds en de praktische implementatie ervan anderzijds. De huisartsen hebben, in vergelijking met psychologen en psychiaters, heden ten dage minder kennis omtrent MBCT. De deelnemende CGG’s melden al tamelijk veel kennis te hebben. 2. De attitude van de deelnemende intermediairen en CGG’s is globaal gezien positief. 3. Psychiaters hebben, in vergelijking met huisartsen en psychologen, al significant meer in aanmerking komende patiënten doorverwezen naar MBCT. Dit is in zekere zin te verwachten daar zij – bv. in vergelijking met huisartsen – ook meest in contact komen met de betreffende patiëntengroep en meer opgeleid zijn de specifieke diagnose van recidiverende depressie te stellen. Ook reeds doorverwijzingen vanuit de deelnemende CGG’s. Alle groepen deelnemers geven aan globaal gezien bereid te zijn om in de toekomst in aanmerking komende patiënten door te verwijzen naar MBCT.
70
4. Uit de antwoorden van de aan de enquête deelnemende huisartsen, psychiaters, psychologen en CGG’s betreffende de attitude van hun patiënten die ofwel geïnformeerd werden over MBCT ofwel deelnamen aan MBCT blijkt dat deze patiënten globaal gezien positief ingesteld zijn voor of na deelname. 5. De experimentele groep rapporteert ten tijde van het post-gesprek (vergelijking met de status ten tijde van de premeting) in vergelijking met de controlegroep een significante verbetering op vlak van hun fysieke gezondheid, energieniveau en psychische gezondheid. Na de postmeting blijken geen significante verschillen tussen experimentele groep en controlegroep op vlak van deze drie aspecten meer gerapporteerd te worden. 6. Op vlak van de mate van suïcidale gedachten of wensen ten tijde van de follow-up blijkt een verschil te bestaan tussen de experimentele groep en de controlegroep, waarbij de controlegroep een hogere mate rapporteert. 7. Uit de studie blijkt een significant verschil tussen de experimentele groep en controlegroep wat betreft de mate van herval: in de loop van de studie hervallen meer mensen in de controlegroep (68.1 %) in vergelijking met de experimentele groep (30 %). Bij de follow-upgesprekken stellen we dit verschil vast bij de bevraging van aanwezigheid van dips en/of hervalmomenten tussen de verschillende meettijdstippen (globaal gezien minder dips en/of hervalmomenten bij de experimentele groep). 8. Uit de analyse betreffende het aantal weken tussen de start van de deelnemers aan de studie en een eerste herval in depressie is de gemiddelde survival time voor de experimentele en controlegroep respectievelijk 43.0 weken en 25.3 weken. Personen in de controlegroep hervallen quasi significant sneller dan de personen uit de experimentele groep. 9. Deelnemers die reeds > 4 depressieve episodes in de voorgeschiedenis doorgemaakt blijken significant sneller te hervallen dan diegenen met < 4 depressieve episodes in de voorgeschiedenis. 10. Op basis van verschillende statistische analyses kunnen we besluiten dat MBCT op vlak van depressieve symptomen en kwetsbaarheidsfactoren voor herval in depressie (bv. ruminatie) enerzijds en voor de 'suicidal mode of mind' (bv. hopeloosheid, gebrekkige probleemoplossende vaardigheden) anderzijds gunstige effecten blijkt uit te oefenen. Meestal scoort de experimentele groep over de meetmomenten heen gunstiger dan de controlegroep. Verder blijkt meestal dat voornamelijk enkel de experimentele groep significant verschillend gunstiger - scoort vlak na deelname aan MBCT (reeds effect op korte termijn) en dat de bekomen verandering na MBCT behouden blijft op langere termijn, meer bepaald ten tijde van FU6M en FU12M (meestal geen significant verschil tussen post en FU6M onderling en tussen FU6M en FU12 onderling). Concreet zien we dat MBCT leidt tot een vermindering van depressieve symptomen, een verbetering van de globale lichamelijke en psychische status, een vermindering van angst (toestandsangst en angsdispositie), een daling van de mate van ruminatie, een veranderd (gunstiger) copingpatroon, een stijging van de mate van ‘mindful awareness’ en een verbetering van de levenskwaliteit.
71
11. Wat verwachten deelnemers van MBCT ? Uit de studieresultaten blijken spanningsreductie, het opbouwen van een grotere psychische weerbaarheid, het beter beheersen van negatieve automatische gedachten, een beter stressmanagement, het ervaren van meer innerlijke rust, het verwerven van kennis omtrent de mechanismen van depressie en het verwerven van tips om hiermee om te gaan en in zekere mate het contact met lotgenoten en de aandacht van de trainer voor de persoonlijke situatie van de deelnemer. 12. De meeste deelnemers aan MBCT rapporteren dat de training aan hun verwachtingen heeft voldaan (effect op korte termijn en behoud op lange termijn). Meer bepaald melden zij een verminderde spanning, grotere psychische weerbaarheid, betere coping met lichamelijke klachten en negatief automatische gedachten, verminderd angstniveau, groter gewaarzijn, beter onderscheid tussen observatie en interpretatie, versterkte zelfzekerheid, betere concentratie, beheersing van de vaardigheden ‘in het moment zijn’ en ‘toelaten en loslaten’. 13. De meeste deelnemers ervaren niet al te veel moeilijkheden om MBCT vol te houden ten tijde van de training. De frequentie van meditatie (meest toepassing van de inzichtmeditaties en 3minuten-ademruimte) vermindert over de follow-up-meetmomenten heen alsook het gebruik van de begeleidende CD’s. 14. De globale evaluatie van de deelnemers betreffende de vormgeving van MBCT (duur sessies, tijd tussen sessies, aantal sessies en huiswerkopdrachten) is goed. Gezien de hoge nood aan hulpverlening op vlak van hervalpreventie voor depressie én de hoger beschreven (kosten)efficiëntie van MBCT is het belangrijk dat voldoende hulpverleners goed opgeleid zijn om MBCT aan de betreffende patiëntenpopulaties aan te bieden (deskundigheidsbevordering van professionelen). Uit de resultaten van de enquête blijkt immers dat de meeste hulpverleners die deelnamen geïnteresseerd zijn in MBCT (om bv. patiënten door te verwijzen, om zich bv. zelf verder bij te scholen). Men dient zeer waakzaam te zijn dat geen ‘wildgroei’ van onvoldoende opgeleide trainers ontstaat. Opdat MBCT de gewenste resultaten levert is het zeer belangrijk dat de MBCT-trainers degelijk geschoold zijn in deze training. Het slagen van een therapie wordt immers niet enkel bepaald door de behandelmethode (Miller, Duncan & Hubble, 1997); maar liefst 30% van het slagen wordt bepaald door de therapeutische relatie tussen cliënt en hulpverlener. Bijgevolg mag de rol van de hulpverlener niet onderschat worden. Opdat sprake zou zijn van kwaliteitsbewaking zou het bijgevolg nuttig zijn dat geïnteresseerde kandidaat-trainers zich kunnen vervolmaken tot MBCT-trainer in erkende – eventueel gedeeltelijk gefinancierde – opleidingscentra. Er zijn immers belangrijke aandachtspunten voor MBCT-trainers (Hayoun, 2007) die aan bod dienen te komen in een degelijke opleiding. Zo is het zelf ervaring hebben met mindfulness-meditatie (versus pure theoretische kennis) iets wat in vele werken aangehaald wordt als een vereiste voor trainers. Ook met betrekking tot het taalgebruik stellen zich een aantal “do’s” en “don’t’s” om de subtiele boodschap bij mindfulness niet te missen. De woordkeuze berust volgens Dewulf op een diepere onderliggende mindfulness-psychologie – bv. het werkwoord “moeten” is uit den boze daar het gelinkt is aan de doe-modus waarvan MBCT net afstand probeert te nemen, bv. het belang van het hanteren van een neutrale toon bij het geven van de instructies … . Betreffende de houding van de trainer is een nieuwsgierige, accepterende en niet-oordelende houding belangrijk (als het ware rolgedrag naar de deelnemers toe, zodat zij nieuwsgierig(er) worden naar hun eigen ervaringen). Verder zijn vele uren training en supervisie vereist zodat de therapeut zichzelf door en door leert kennen vooraleer hij/zij een ander kan gaan begeleiden. Om een degelijke en gestructureerde (bv. cf. www.aandacht.be)
72
scholing voor MBCT-trainers alsook om op termijn een netwerk voor vlotte doorverwijzing van patiënten naar de meest geschikte hulpverlening te realiseren kan het oprichten van een overlegplatform van geïnteresseerde hulpverleners nuttig zijn. Uit de literatuur omtrent de evaluatie van de effectiviteit van MBCT blijkt er tot op heden evidentie in geval van toepassing bij remissie van recidiverende depressie (Teasdale et al (2000) en Ma & Teasdale (2004) - “recurrently depressed patients currently in remission or recovery from major depression at the time of the baseline assessment”, ≥ 3 depressieve episodes in de voorgeschiedenis). Na een depressie kampen mensen vaak nog lange tijd met restverschijnselen. Gezien de impact hiervan op verschillende levensdomeinen is het van groot belang om adequate hulp te kunnen bieden aan deze doelgroep (Hayoun, 2007). De aan de enquête deelnemende huisartsen, psychiaters, psychologen en CGG’s rapporteren dat hun patiënten die ofwel geïnformeerd werden over MBCT ofwel deelnamen aan MBCT globaal gezien positief ingesteld zijn tegenover MBCT. Opdat voldoende patiënten (geselecteerd aan de hand van inclusiecriteria, gebaseerd op evidentie bij wie MBCT nut heeft) zouden kunnen genieten van de effectiviteit van deze vernieuwende en beloftevolle behandeling (continuïteit van zorg), is enerzijds een gedecentraliseerd aanbod van MBCT (gegeven door degelijk opgeleide trainers, supra) over Vlaanderen belangrijk en anderzijds is een gedeeltelijke terugbetaling van de trainingskosten belangrijk om te overwegen. Tevens is het van belang om duidelijk te definiëren welke patiëntenpopulaties meest baat hebben van deelname aan MBCT. In dit kader verwijzen we naar Ma & Teasdale (2004) – “The finding that MBCT can be relatively unhelpful for a particular group of patients (ze bedoelen hiermee de subgroep met 2 depressieve episodes in het verleden) highlights the need to understand the relevance of MBCT to particular relapse-related psychopathologies (Teasdale, Segal, & Williams, 2003).” De huisartsen die deelnamen aan de enquête beschrijven een positieve attitude tegenover MBCT én tonen interesse om zich verder bij te scholen in MBCT. In het kader van een efficiënte doorverwijzing van de geschikte kandidaten voor MBCT willen we benadrukken (actiepunt) dat het voor de toekomst belangrijk is dat huisartsen (eerste lijns gezondheidszorg) enerzijds voldoende geïnformeerd worden omtrent recidiverende depressie en MBCT en anderzijds gesensibiliseerd worden voldoende waakzaam te zijn voor de diagnosticering van recidiverende depressie bij hun patiënten. Een zo vroeg mogelijke (in het ziekteproces) correcte diagnosticering en doorverwijzing van patiënten naar de voor hen meest doeltreffende behandelingen kan bijdragen tot een kostenefficiënt werkende gezondheidszorg (gezondheidseconomisch oogpunt). Misschien kan ook met het oog op een doeltreffend management van (recidiverende) depressie in de eerstelijnszorg in de toekomst een overlegplatform opgericht worden.
73
V. REFERENTIES Opdat dit rapport niet te lijvig zou worden omvat deze referentielijst slechts een selectie van de literatuur die we in de loop van de studie hebben doorgenomen (zo hebben we ook tal van handleidingen omtrent statistiek en SPSS doorgenomen). Voor bijkomende referenties verwijzen we ook naar de referentielijst van onze eigen artikels, toegevoegd in bijlage. Een uitgebreide literatuurlijst kan steeds opgevraagd worden. Beck A.T., Steer R.A. (1988). Manual for the Beck Hopelessness Scale. San Antonio, TX: Psychological Corp. Bockting C.L.H., Schene A.H., Spinhoven P., Koeter M.W.J., Wouters L.F., Huyser J., Kamphuis J.H., The DELTA Study Group (2005). Preventing relapse / recurrence in recurrent depression with cognitive therapy: a randomized controlled trial. Journal of Consulting and Clinical Psychology, 73(4), 647-657. Brown K.W., Ryan R.M. (2003). The benefits of being present: mindfulness and its role in psychological well-being. Journal of Personality and Social Psychology; 84(4): 822-848. Nederlandse vertaling door Godfrin K., Goeleven E., & Schoof P. (2004). Bruffaerts R., Bonnewyn A., van Oyen H. e.a. (2004). Prevalentie van mentale stoornissen in de Belgische bevolking. Resultaten van de European Study on Epidemiology of Mental Disorders (ESEMeD). Tijdschrift voor Geneeskunde, 60(2), 75-85. Cayoun B.A., Sauvage V., & Van Impe M. (not published / presented to the Hobart Clinic’s Clinical Advisory Committee on 31/08/04). Outcome data for the Hobart Clinic’s MCBT groups pilot trials. De Clerck S., Manshoven J., & Mertens, T. (2006). Rapport omtrent het project “Recidivepreventie suïcidepogingen in samenwerking met huisartsen” – Project uitgevoerd in opdracht van en gerealiseerd met de financiële steun van het ministerie van de Vlaamse Gemeenschap. De Fruyt F., Van De Wiele L., van Heeringen C. (2000). Cloninger’s psychobiological model of temperament and character and the five-factor model of personality. Personality and Individual Differences; 29: 441-452. Devilly G.J., Borkovec T.D. (2000). Psychometric properties of the credibility / expectancy questionnaire. Journal of Behavior Therapy and Experimental Psychiatry; 31: 73-86. Nederlandse vertaling door Godfrin K., Goeleven E., & Schoof P. (2004). Dewulf D. (2007). Mindfulness – Een pad van vrijheid. Leuven: Uitgeverij Acco. Dewulf D., Godfrin K., Audenaert K., Vervaet M., Van den Abbeele D., van Heeringen C. (2005). “Mindfulness-based cognitive therapy” en depressie. Tijdschrift voor Geneeskunde 61(22); 1599-1609. Duijsens I.J., & Spinhoven Ph. (2000). Handleiding van de Nederlandse Temperament en Karakter Vragenlijst. Leiderdorp: Datec.
74
Evers A., van Vliet-Mulder J.C., ter Laak J. (1992). Documentatie van Tests en Testresearch in Nederland. Assen / Maastricht: Van Gorcum; Amsterdam: Nederlands Instituut van psychologen. Finucane A., & Mercer S.W. (2006). An exploratory mixed methods study of the acceptibility and effectiveness of mindfulness-based cognitive therapy for patients with active depression and anxiety in primary care. BMC Psychiatry, 6. Fleiss J.L. (1981). Statistical methods for rates and proportions. New York: Wiley. Frank E., Prien R.F., Jarrett R.B., Keller M.B., Kupfer D.J., Lavori P.W., Rush A.J., & Weissman M.M. (1991). Conceptualization and rationale for consensus definitions of terms in major depressive disorder. Remission, recovery, relapse, and recurrence. Archives of General Psychiatry, 48, 851-855. Godfrin K., Dewulf D., van Heeringen, C (2007). Mindfulness-Based Cognitive Therapy (MBCT) en terugvalpreventie bij depressie. In: Schene A.H., Boer F., Jaspers J.P.C., Sabbe B., van Weeghel J.. Jaarboek voor psychiatrie en psychotherapie 2007-2008; Houten: Bohn Stafleu van Loghum; pp.211-222. Groenestijn M.A.C. van, Akkerhuis G.W., Kupka R.W., Schneider N., Nolen W.A. (1999). Gestructureerd Klinisch Interview voor de vaststelling van DSM-IV As I stoornissen – Vertaling van Structured Clinical Interview for DSM-IV Axis I Disorders SCID-I/P version 2.0 (First M.B., Spitzer R.L., Gibbon M., Williams J.B.W., 1996, 1997). Lisse: Swets & Zeitlinger / Harcourt Publishers. Hamilton M (1960). A rating scale for depression. Journal of Neurology, Neurosurgery and Psychiatry; 23: 56-62. De Nederlandse versie is gebaseerd op de versie van Wyeth en de vertaling van de HRSDSAD (Oxford: Mood Disorders Clinic). Hayoun M. (2007). Mindfulness-Based Cognitive Therapy – Aandacht voor de rol van de trainer – Literatuurstudie en verkennend onderzoek. Scriptie voor het bekomen van het diploma van Bachelor in de Toegepaste Psychologie. Antwerpen: Lessius Hogeschool. Kenny M.A., & Williams J.M.G. (2007). Treatment-resistant depressed patients show a good response to Mindfulness-based Cognitive Therapy. Behaviour Research and Therapy, 45, 617-625. Kingston T., Dooley B., Bates A., Lawlor E., & Malone K. (2007). Mindfulness-based cognitive therapy for residual depressive symptoms. Psychology and Psychotherapy: Theory, Research and Practice, 80, 193-203. Koster van Groos, G.A.S. (2002). Beknopte handleiding bij de diagnostische criteria van de DSM-IV-TR. Lisse: Swets and Zeitlinger. Lau M.A., Segal Z.V., & Williams J.M.G. (2004). Teasdale’s differential activation hypothesis: implications for mechanisms of depressive relapse and suicidal behaviour. Behaviour Research and Therapy, 42, 1001-1017.
75
Lépine J.P., Gastpar M., Tylee A. (1997). Depression in the community: the first panEuropean study DEPRES (Depression Research in European Society). Int Clin Psychopharmacol; 12(1): 19-29. Ma S.H., & Teasdale J.D. (2004). Mindfulness-Based Cognitive Therapy for depression: replication and exploration of differential relapse prevention effects. Journal of Consulting and Clinical Psychology, 72(1), 31-40. Mason O., Hargreaves I. (2001). A qualitative study of mindfulness-based cognitive therapy for depression. British Journal of Medical Psychology; 74: 197-212. Miller S.D., Duncan B.L., & Hubble M.A. (1997). Escape from Babel. Toward a unifying language for psychotherapy practice. London: W.W. Norton & Company. Nolen-Hoeksema S. (1987). Sex differences in unipolar depression: evidence and theory. Psychological Bulletin, 101: 259-282. Nolen-Hoeksema S. (1991). Responses to depression and their effects on the duration of depressive episodes. Journal of Abnormal Psychology, 100: 569-582. Oswald P. (2007). Kritische lezing van klinische studies in de psychiatrie. Survival manual. Brussel: ViVio. Portzky G., & van Heeringen C. (2001). Het stillen van de pijn – Over preventie van suïcide. Diegem: Kluwer. Prien R.F., Carpenter L.L., & Kupfer D.J. (1991). The definition and operational criteria for treatment outcome of major depressive disorder. A review of the current research literature. Archives of General Psychiatry, 48, 796-800. Raes F., Hermans D., Eelen P. (1991). Ruminative Response Scale (RRS-NL) - Nederlandse vertaling van Nolen-Hoeksema S. & Morrow J. . Leuven. Schreurs P.J.G., van de Willige G., Tellegen B., Brosschot J.F. (1988). De Utrechtse Coping Lijst: UCL. Omgaan met problemen en gebeurtenissen – Handleiding. Lisse: Swets & Zeitlinger. Schreurs P.J.G., van de Willige G., Brosschot J.F., Tellegen B., & Graus G.M.H. (1993). De Utrechtse Coping Lijst – Handleiding. Harcourt Publishers. Segal Z.V., Williams J.M.G., Teasdale J.D. (2002). Mindfulness-Based Cognitive Therapy for depression: a new approach to preventing relapse. New York: Guilford Publications. Nederlandse vertaling: van de Weijer R., & Wagenaar S. (2004). Aandachtgerichte cognitieve therapie bij depressie – Een nieuwe methode om terugval te vookomen. Amsterdam: Uitgeverij Nieuwezijds. Sheehy N., O’Connor R.C. (2002). Cognitive style and suicidal behaviour: implications for therapeutic intervention, research lacunae and priorities. British Journal of Guidance & Counselling, 30(4), 353-362.
76
Spielberger C.D., Gorsuch R.R., Luchene R.E. (1970). State-Trait Anxiety Inventory. Palo Alto, CA, Consulting Psychologists Press. Sprey A. (2002). Praktijkboek persoonlijkheidsstoornissen. Diagnostiek, cognitieve gedragstherapie en therapeutische relatie. Houten / Diegem: Bohn Stafleu Van Loghum. Teasdale J.D. (1999a). Emotional processing three modes of mind and the prevention of relapse in depression. Behaviour Research and Therapy; 37:S53-S77. Teasdale J.D. (1999b). Metacognition, mindfulness and the modification of mood disorders. Clinical Psychology and Psychotherapy; 6: 146-155. Teasdale J.D., Moore R.G., Hayhurst H., Pope M., Williams S., Segal Z.V. (2002). Metacognitive awareness and prevention of relapse in depression: empirical evidence. Journal of Consulting and Clinical Psychology; 70(2): 275-287. Teasdale J.D., Segal Z.V., Williams J.M.G. (1995). How does cognitive therapy prevent depressive relapse and why should attentional control (mindfulness) training help ? Behaviour Research and Therapy; 33(1): 25-39. Teasdale J.D., Segal Z.V., Williams J.M.G. (2003). Mindfulness training and problem formulation. Clinical Psychology: Science and Practice; 10(2): 157-160. Teasdale J.D., Segal Z.V., Williams J.M.G., Ridgeway V.A., Soulsby J.M., & Lau M.A. (2000). Prevention of relapse / recurrence in major depression by Mindfulness-Based Cognitive Therapy. Journal of Consulting and Clinical Psychology, 68(4), 615-623. Tuynman-Qua H., de Jonghe F., McKenna S., & Hunt S. (1992). Quality of Life in Depression Rating Scale / Schaal voor de meting van de kwaliteit van het leven bij depressie. Houten: Ibero. Van der Ark L.A., Marburger D., Mellenbergh G.J., Vorst H.C.M., Wald F. Aangepaste Profile of Mood States. Nijmegen: Berkhout BV. Van der Does A.J.W. (2002). Beck Depression Inventory-II (second edition) – Handleiding – Vertaling van originele versie (Beck AT, Steer RA, Brown GK, 1987, 1996). Lisse: Swets & Zeitlinger / Harcourt Publishers. Van der Ploeg H.M., Defares P.B., Spielberger C.D. (1981). Handleiding bij de ZelfBeoordelings Vragenlijst ZBV. Een nederlandstalige bewerking van de Spielberger StateTrait Anxiety Inventory STAI-DY. Lisse: Swets & Zeitlinger. Van der Ploeg H.M. (2000). Zelf-Beoordelings Vragenlijst – Nederlandse bewerking van de STAI-Y. Harcourt Publishers. Van Heeringen C. (1999). Recente inzichten in de pathogenese van suïcidaal gedrag. Tijdschrift voor Geneeskunde, 55, 114-116. Wald F.D.M., & Mellenbergh G.J. (1990). Instrumenteel onderzoek. De verkorte versie van de Nederlandse vertaling van de Profile of Moods States (POMS). Nederlands Tijdschrift voor de Psychologie, 45, 86-90.
77
Williams J.M.G., Duggan D.S., Crane C., Fennell M.J.V. (2006). Mindfulness-Based Cognitive Therapy for prevention of recurrence of suicidal behavior. Journal of Clinical Psychology: In Session, 62(2), 201-210. Williams J.M.G., & Swales M. (2004). The use of mindfulness-based approaches for suicidal patients. Archives of Suicide Research, 8, 315-329. Williams M., Teasdale J., Segal Z., & Kabat-Zinn J. (2007). The mindful way through depression. Freeing yourself from chronic unhappiness. New York: The Guilford Press. Nederlandse vertaling: van de Weijer R., & Wagenaar S. (2007). Mindfulness en bevrijding van depressie. Voorbij chronische ongelukkigheid. Amsterdam: Uitgeverij Nieuwezijds.
VI. BIJLAGEN Zie hiervoor het uitgebreide onderzoeksrapport.
78