Erasmus Universiteit Rotterdam – Faculteit der Sociale Wetenschappen
Master Scriptie Effectiviteit van Werkgeheugentraining bij Depressie
Marissa Smits 322447 Februari 2015 Scriptie Begeleider: Dr. S.W. Wanmaker Klinische Psychologie
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
Abstract In deze studie werd de effectiviteit van een vier weken durende werkgeheugentraining onderzocht bij patiënten met depressieve klachten. Er werd bekeken of deze training leidde tot verbeteringen in het werkgeheugen en stemmingsklachten. Na vier weken toonde zowel de training- als placebogroep verbetering op de getrainde taken, maar de wachtgroep niet. Er werd een minimale transfer naar ongetrainde taken gevonden: de traininggroep ging slechts op één score van een transfertaak vooruit in vergelijking met de placebogroep. De wachtgroep toonde gemengde resultaten op de transfertaken, met zowel verbetering als achteruitgang ten opzichte van de andere twee groepen. De werkgeheugentraining slaagde er niet in om een significant behandelresultaat teweeg te brengen: de traininggroep verschilde niet van de andere twee groepen wat betreft patroon van stemmingsklachten. Na drie maanden werd er een follow-up meting uitgevoerd, waar enkel de training- en placebogroep aan deelnamen. Beide groepen gingen vooruit op de getrainde taken, maar enkel ten opzichte van de premeting. Op lange termijn werd er geen enkel transfer effect meer waargenomen en ook kon er geen verschil in stemmingsproblematiek worden gevonden tussen de twee groepen. Concluderend wordt gesteld dat dit onderzoek te weinig bewijs levert om de onderzochte werkgeheugentraining als alternatieve behandelmethode voor depressie te mogen beschouwen. De tekortkomingen van de studie en mogelijkheden tot vervolgonderzoek worden besproken.
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
Inhoudsopgave
Blz. 1-9 1 4 4 6 8
Hoofdstuk 1
Inleiding 1.1 Effectiviteit huidige behandeling 1.2 De rol van cognities 1.3 Gebreken in het werkgeheugen 1.4 Werkgeheugentraining als behandelmogelijkheid 1.5 Hypothesen huidig onderzoek
Hoofdstuk 2
Methoden 2.1 Participanten 2.2 Materiaal 2.3 Procedure
10 - 18 10 11 18
Hoofdstuk 3
Resultaten 3.1 H1: ‘Het werkgeheugen zal verbeteren’ 3.2 H2: ‘De depressieve symptomatologie zal afnemen’ 3.3 H3: ‘De effecten zullen op lange termijn aanwezig zijn’
19 - 34 19 27 29
Hoofdstuk 4
Discussie 4.1 Effecten werkgeheugen 4.2 Effecten depressieve symptomen 4.3 Lange termijn effecten 4.4 Overall conclusie 4.5 Mogelijke valkuilen 4.6 Vervolgonderzoek
35 - 42 35 37 38 39 40 41
Referenties
43 - 48
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
1. Inleiding In Nederland heeft 18.7% van de bevolking tussen de 18 en 65 jaar in hun leven ooit geleden aan een depressie (De Graaf, Ten Have & Dorsselaer, 2010). Depressie staat dan ook op de vierde plek in de top tien lijst van ziekten die de grootste ziektelast veroorzaken, waarbij ook lichamelijke ziekten zijn opgenomen. Bovendien vormt depressie een risicofactor voor suïcide en vergroot het de kans op overlijden bij mensen met een lichamelijke aandoening (Gommer, Poos & Hoeymans, 2010). Mensen die lijden aan een depressieve stoornis, zoals beschreven in de DSM-5 (2013) hebben gedurende minstens twee weken tijdens het grootste deel van de dag last van een negatieve stemming en/of verlies van interesse en plezier. Daarnaast kan er sprake zijn van eetproblemen, slaapproblemen, concentratieproblemen, gevoelens van spanning en onrust, gevoelens van waardeloosheid en schuld en gedachten aan de dood. Deze symptomen hebben niet alleen veel negatieve invloed op de patiënt zelf, ook de omgeving kan lijden onder verslechterde sociale relaties of verminderde werk- en schoolprestaties. Er is dus veel terrein te winnen met een goede behandeling tegen depressie. 1.1 Effectiviteit huidige behandeling Momenteel is cognitieve gedragstherapie (CGT) een van de meest toegepaste behandelingen bij de depressieve stoornis. CGT richt zich op het analyseren en veranderen van onderliggende disfunctionele attitudes of assumpties (bv. ‘ik ben niks waard’) die zorgen voor bepaalde negatieve cognities (bv. ‘ik doe alles verkeerd’). De cognitieve gedragstherapeut moedigt de patiënt aan om de automatische negatieve cognities uit te dagen en er een nieuwe evenwichtige gedachte tegenover te zetten (Beck, 1979). Daarbij worden gedragstechnieken toegepast om specifiek ongezond gedrag dat de patiënt inzet bij moeilijke situaties te onderzoeken en uiteindelijk te veranderen. Ook al wijst wetenschappelijk onderzoek richting positieve effecten van CGT (Butler, Chapman, Forman & Beck 2006), hierbij kunnen een aantal belangrijke kritische kanttekeningen worden geplaatst. Zo stellen Rounsaville en Carroll (2002) dat CGT, zoals deze in onderzoek wordt toegepast, niet te vergelijken is met hoe de therapie daadwerkelijk in de praktijk wordt uitgevoerd. Zowel de specifieke behandeltechnieken als de duur van de therapie komen niet overeen. Het label ‘CGT’ wordt dan ook te snel geplakt op eenvoudige psychotherapeutische behandelingen. Bovendien wordt de controlegroep niet altijd minimaal behandeld, dat wil zeggen dat er soms alsnog een vorm van hulp of steun plaatsvond. Dit maakt een adequate vergelijking onmogelijk omdat er dan nog andere factoren een rol kunnen spelen. Daarnaast worden vaak niet-klinische populaties onderzocht of wordt zelfrapportage gebruikt om de effectiviteit te meten (Hollon, Thase & Markowitz, 2002). Aan het gebruik van zelfrapportage zitten een aantal nadelen, zoals de subjectiviteit van de patiënt en gebrek aan
1
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
toelichting van de gerapporteerde klachten. Bovendien blijkt dat de kwaliteit van de cognitieve gedragstherapeut een zeer grote rol speelt bij de effectiviteit van de behandeling. Een therapeut met meer ervaring kon een significant grotere effectiviteit teweeg brengen dan minder ervaren therapeuten (Jacobson & Hollon, 1996). Tot slot kunnen er vraagtekens worden gezet bij de exacte werking van de onderliggende mechanismen van cognitieve gedragstherapie. In de review van Parker, Roy en Eyers (2003) lukte het hen niet om de link te ondersteunen tussen de theorie achter cognitieve therapie enerzijds en de onderliggende mechanismen van depressie anderzijds. Mensen die hersteld waren van een eerdere depressie bleken namelijk evenveel cognitieve kwetsbaarheden te hebben als mensen zonder depressie in de voorgeschiedenis. Deze bevinding spreekt de cognitieve theorie tegen omdat de theorie suggereert dat mensen met een depressie in de voorgeschiedenis een altijd aanwezige cognitieve kwetsbaarheid hebben. Bovendien vonden zowel Imber en collega’s (1990) net als Simons en collega’s (1984) geen verschil in verandering van automatische negatieve gedachten bij patiënten die cognitieve therapie volgden of medicatie gebruikten. Een andere behandelmethode voor depressie is interpersoonlijke psychotherapie (IPT). IPT werd in 1984 ontwikkeld door Klerman en collega’s als pragmatische behandeling bestaande uit drie fases. In de eerste fase maakt de therapeut een inventarisatie van de problemen van de patiënt en wordt het kernprobleem in een van de vier interpersoonlijke probleemgebieden ingedeeld. Vervolgens worden er in de tweede fase specifieke strategieën aan de patiënt geleerd en in de derde fase worden de nieuwe competenties van de patiënt verder ontwikkeld en ondersteund (Klerman, 1987). Uit een recente meta-analyse blijkt de effectiviteit van IPT vergelijkbaar te zijn met die van CGT (Cuijpers et al., 2011), de auteurs wijzen echter op een mogelijke overschatting van IPT’s effectiviteit. Opvallend is namelijk dat er lagere resultaten behaald werden bij onderzoek dat de originele instructies van IPT hanteerde in tegenstelling tot onderzoek dat eigen aangepaste instructies hanteerde. Deze bevinding trekt niet alleen de theoretische fundering van IPT in twijfel, maar maakt standaardisatie van de resultaten bovendien onmogelijk. Naast het gebrek aan een consistente toepassing van IPT, is ook in algemenere zin de kwaliteit van onderzoek naar IPT niet optimaal te noemen. Slechts 24% van de studies in de meta-analyse van Cuijpers en collega’s (2011) voldeed aan de benodigde kwaliteitscriteria. Naast bovengenoemde mogelijkheden tot psychotherapie kan worden gekozen voor psychofarmaca om depressie te behandelen. Uit onderzoek van het Trimbos Instituut blijkt dat Nederlandse huisartsen niet huiverig zijn om antidepressiva voor te schrijven, in 2008 kreeg 70,1% van de depressieve patiënten een antidepressivum voorgeschreven (Memeo, De Graaf, Ten Have & Kroon, 2010). Mogelijk is hier sprake van een zogenaamde ‘overbehandeling’ van volwassenen met
2
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
lichtere vormen van een depressie. Dit is een zorgelijke kwestie omdat er een aantal aanzienlijke nadelen en zelfs gevaren kunnen zitten aan het gebruik van antidepressiva. Ten eerste verschilt de optimale dosering per patiënt, met als gevolg dat de patiënt vaak terug moet naar de arts om het middel of de dosering aan te passen. Dit kan een lang en moeizaam proces zijn omdat de eerste effecten van de meeste antidepressiva pas na zes weken merkbaar worden. Daarnaast zijn er een groot aantal vervelende bijwerkingen te noemen. Lichamelijke bijwerkingen van antidepressiva zijn onder andere maagklachten, spierklachten en slaapproblemen, maar ook psychische bijwerkingen zoals veranderde eetlust, verminderd libido en geheugenproblemen kunnen ontstaan (Hollon, Thase & Markowitz, 2002). Bovendien kan beargumenteerd worden dat medicatie bij een depressie voornamelijk palliatief is; het onderdrukt slechts tijdelijk de manifeste symptomen maar speelt niet in op mogelijk dieperliggende oorzaken. Wanneer gestaakt wordt met het gebruik van antidepressiva komen de symptomen dan ook in 40% van de gevallen weer terug (Hollon et al., 2005). Financieel gezien betekent dit dat het gebruik van antidepressiva niet ideaal is, de medicatie moet immers langdurig worden toegediend. In 2008 gaf de overheid al 86 miljoen euro uit om 800.000 Nederlanders te voorzien van antidepressiva (Stichting Farmaceutische Kengetallen, 2009). De kosten van de geestelijke gezondheidszorg, uitgesplitst naar de diagnose ‘depressie’, stegen tussen 2005 en 2010 met zo’n 211 miljoen naar ongeveer 677 miljoen in 2010. Voor de patiënt zelf is het volgen van psychotherapie financieel ook niet gemakkelijk. Met ingang van het jaar 2013 worden namelijk slechts vijf eerstelijns behandelsessies vergoed, waarbij tevens een eigen bijdrage verplicht is afhankelijk van de zorgverzekeraar (Kamerbrief ‘Eigen Bijdrage’, 2012). Voor een groot aantal patiënten is deze maatregel een reden om de psychologische behandeling niet door te zetten. Dit blijkt uit de bevindingen van een online enquête naar zorgvermijding waarin 75% van de huisartsen stelt dat zij wekelijks te maken hebben met patiënten die niet naar een GGZ-instelling gaan vanwege financiële redenen (LHV, enquête over zorgmijden, 2013). Tot slot is het belangrijk om te vermelden dat de effecten van zowel psychotherapie als antidepressiva mogelijk overschat worden vanwege een publicatiebias veroorzaakt door persoonlijke en financiële interesses (Cuijpers, Smit, Bohlmeijer, Hollon & Andersson, 2010). Samenvattend zijn er een aantal gebreken bij de huidige behandelmethoden voor depressie: er is niet genoeg duidelijkheid over de exacte werking van de behandeling, een vaardige en ervaren therapeut is altijd vereist, er wordt onvoldoende ingespeeld op de onderliggende problematiek en de kosteneffectiviteit verhouding is niet ideaal. Een nieuwe behandelmethode zou mogelijk een oplossing kunnen bieden voor deze problemen, maar hoe zou deze behandelmethode eruit kunnen zien?
3
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
1.2 De rol van cognities Inmiddels is duidelijk geworden dat cognities een belangrijke rol spelen bij mensen met een depressie. Volgens Beck (1967) hebben depressieve mensen negatieve schema’s, dit zijn gedachtepatronen die zich aan de hand van vroegere gebeurtenissen hebben ontwikkeld en nu als leidraad dienen om bepaalde inferenties of interpretaties te maken. Negatieve schema’s kunnen leiden tot sombere gedachten en attitudes en daarnaast tot het negatief interpreteren van bepaalde gebeurtenissen. Hierbij gaat het om percepties over de persoon zelf, de wereld en de toekomst, deze drie uitgangspunten vormen de cognitieve triade. Specifieker werd door Abramson en collega’s (1978) een model ontwikkeld om te begrijpen hoe depressieve personen met positieve en negatieve gebeurtenissen omgaan, het zogenaamde ‘learned helplessness model’. Depressieve personen hebben de neiging om negatieve gebeurtenissen toe te schrijven aan interne, stabiele en globale oorzaken. Dit wil zeggen, men denkt dat de vervelende situatie door hen zelf wordt veroorzaakt (intern), dit zal de volgende keer weer het geval zijn (stabiel) en het was geen kleine fout, maar een algemeen gevoel van disfunctioneren (globaal). Positieve gebeurtenissen worden daarentegen sneller geweid aan externe factoren (de ander), die onstabiel (niet altijd) en specifiek (toeval, geluk) zijn. De focus van deze theorieën ligt voornamelijk op de inhoud van de cognities. Er wordt namelijk gesteld dat mensen met een depressie vaker negatieve gedachten en attributies hebben dan mensen zonder een depressie. Wat echter onduidelijk blijft is wat de oorzaak en wat het gevolg is. Leiden al aanwezige negatieve cognities tot depressieve symptomen of zorgen depressieve symptomen zoals moeheid en somberheid voor negatieve gedachten en interpretaties? Om antwoord op deze vraag te kunnen geven is het belangrijk dat de focus wordt gelegd op de achterliggende cognitieve processen die plaatsvinden in het werkgeheugen. Het werkgeheugen is de opslagplaats voor tijdelijke taakrelevante informatie, dat is de informatie die de persoon op dat moment nodig heeft om te kunnen functioneren. De maximum hoeveelheid informatie die men kan opslaan in het werkgeheugen is bepalend voor zowel het probleemoplossend als redenerend vermogen (Fry & Hill, 1996; Kyllonen & Christal, 1990). Mogelijk kan onderzoek naar het werkgeheugen van depressieve patiënten nieuw licht werpen op alternatieve behandelmogelijkheden. 1.3 Gebreken in het werkgeheugen Uit onderzoek naar het werkgeheugen van depressieve patiënten is gebleken dat zij een aanzienlijk gebrek aan inhibitie van negatieve informatie toonden (Goeleven, De Raedt, Baert & Koster, 2006; Joormann 2004). Dit wil zeggen dat wanneer zowel depressieve patiënten als mensen met een
4
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
depressie in hun verleden de emotionele expressie van een gezicht moesten waarderen, het beide groepen meer moeite kostte om negatieve, afleidende gezichten te negeren dan de controlegroep. Naast een controlegebrek over het toelaten van irrelevant negatief materiaal in het werkgeheugen, bleek dat depressieve patiënten ook meer moeite hadden met het verwijderen van irrelevant negatief materiaal uit het werkgeheugen (Joormannn & Gotlib 2008). Wanneer twee lijsten met emotionele woorden werden aangeboden kostte het de depressieve patiënten bij een latere herkenningstaak meer moeite om de negatieve woorden van één van de lijsten niet op te noemen dan de controlegroep. Dit effect kan niet zuiver worden toegeschreven aan een negatieve stemming, immers wanneer de controlegroep werd gemanipuleerd in een sombere stemming, lieten zij dit effect niet zien. Opvallend is dat de depressieve patiënten het positieve materiaal even gemakkelijk konden negeren als nieuw materiaal dat nog niet eerder werd aangeboden. Bovendien werd er in dit onderzoek een positief verband gevonden tussen de mate van interferentie van irrelevant materiaal enerzijds en zelf-gerapporteerde ruminatie anderzijds. Ruminatie, ook wel bekend als piekeren, versterkt de aanwezige depressieve symptomen en is een risicofactor voor terugval in depressie (Joormann, 2010). Een depressieve stemming activeert namelijk stemmings-congruente cognities in het werkgeheugen, in dit geval zijn dat negatieve gedachten en assumpties. Aangezien depressieve patiënten een controlegebrek hebben over het negatieve materiaal in hun werkgeheugen, zoals uit bovenstaand onderzoek bleek, kan het negatieve materiaal hierdoor langer aanwezig blijven in het werkgeheugen. Dit resulteert in rumineren, het ‘herkauwen’ van de negatieve inhoud van het werkgeheugen. Vanzelfsprekend staat dit het herstel van de depressieve stemming in de weg, samen met de neiging om stemmings-incongruent materiaal, in dit geval positief materiaal, te blokkeren. Het onderzoek van Levens en Gotlib (2010) naar het updaten van de emotionele inhoud van het werkgeheugen toonde dit effect ook. Depressieve personen hielden niet alleen de verdrietige stimuli langer in het werkgeheugen, maar zij lieten de vrolijke stimuli ook sneller los uit het werkgeheugen. Het omgekeerde bleek te gelden voor de controlegroep waarmee zij werden vergeleken. De Raedt en Koster (2010) legden aan de hand van bestaande onderzoeken een link tussen de cognitieve en biologische kwetsbaarheidsfactoren voor het ontwikkelen van een depressie. Zij stellen dat mensen die kwetsbaar zijn voor depressies een verstoring hebben in de wisselwerking tussen de hypothalamus, hypofyse en bijnierschors (HHB- of HPA-as). In reactie op stressoren, zal de ontregelde HPA-as leiden tot een ontregeling van het serotonine metabolisme, wat vervolgens zal leiden tot verminderde activiteit in de prefrontale gebieden. De prefrontale hypoactiviteit heeft twee gevolgen: enerzijds ontstaat er verminderde aandacht controle en anderzijds ontstaat er een hyperactiviteit in de amygdala. Tegelijkertijd met deze neurobiologische processen, worden in reactie
5
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
op stressoren negatieve schema’s geactiveerd. Zowel de activatie van deze schema’s als de verminderde aandacht controle leiden tot ruminatie omdat het negatieve materiaal hierdoor langer actief blijft in het werkgeheugen. De ruminatie enerzijds en de hyperactieve amygdala anderzijds, zullen het negatieve affect van de persoon in stand houden, aldus De Raedt en Koster (2010). Men zou op basis hiervan kunnen verwachten dat er naast de eerder genoemde specifieke beperkingen in het werkgeheugen, tevens meer algemene tekortkomingen in het werkgeheugen van mensen met een depressie gaande zijn. Dit is inderdaad het geval, depressieve patiënten bleken niet alleen moeite te hebben met het updaten van specifiek materiaal in het werkgeheugen, ook het updaten van neutrale stimuli kostte hen meer moeite dan een controlegroep (Harvey et al., 2004). Dit werd gemeten door middel van een N-back taak, een taak waarbij deelnemers telkens relevante informatie in hun werkgeheugen moeten behouden en updaten met nieuw materiaal, waarbij letters en cijfers dienen als neutrale stimuli. Deze taak kan complexer worden gemaakt door meer stimuli aan te bieden tussen de begin- en eindstimulus, waarmee waarschijnlijk ook de cognitieve processen van verdeelde aandacht, het wisselen van doel (set shifting) en inhibitie worden gemeten. Bij de complexere condities van deze taak presteerden de depressieve patiënten eveneens slechter dan de controlegroep, wat suggereert dat er ook sprake is van algemene beperkingen in set shifting en inhibitie bij mensen met een depressie. Dit idee wordt in hetzelfde onderzoek ondersteund door twee andere testen die tevens algemene set shifting en inhibitie maten, waarop de depressieve personen ook slechter presteerden dan de controlegroep (Harvey et al., 2004). Deze resultaten werden later eveneens gevonden in het onderzoek van Rose en Ebmeier (2006), waarbij de onderzoekers naast een langzamere prestatie van depressieve personen ook een minder accurate prestatie van deze groep vaststelden in vergelijking met de controlegroep. Dit is van toevoegende waarde voor de validiteit van de bevindingen, omdat er onafhankelijk van de snelheid meer fouten werden gemaakt door de depressieve personen. Hierdoor kan de invloed van factoren zoals motorische vertraging en perfectionisme worden uitgesloten. 1.4 Werkgeheugentraining als behandelmogelijkheid Mogelijk zou een nieuwe behandelmethode tegen depressie zich dus kunnen richten op de algemene tekorten in het werkgeheugen van depressieve patiënten. Uit onderzoek van Klingberg, Forssberg en Westerberg komt naar voren dat het werkgeheugen daadwerkelijk te trainen is (2002). Deze onderzoekers ontwikkelden een werkgeheugentraining waardoor jong volwassenen met ADHD op zowel werkgeheugentaken als op een niet-verbale complexe redeneringstaak significante verbeteringen lieten zien. Bovendien waren soortgelijke verbeteringen te zien bij jong volwassenen zonder ADHD én toonden beide groepen verbeteringen in prestaties op niet-getrainde visueel-
6
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
spatiële taken. Dit suggereert dat het werkgeheugen significant verbeterd kan worden door een werkgeheugentraining én dat het effect gegeneraliseerd kan worden naar taken die niet getraind werden. De generalisatie van getrainde naar ongetrainde taken werd ook getoond in een onderzoek naar het effect van een werkgeheugentraining op vloeibare intelligentie (Jaeggi, Buschkuehl, Jonides & Perrig, 2008). Vloeibare intelligentie is de kundigheid om het eigen denken aan een nieuw probleem of nieuwe situatie aan te passen, onafhankelijk van eerder vergaarde kennis. Uit dit onderzoek bleek dat gezonde proefpersonen niet alleen verbetering toonden op de aangeboden werkgeheugentraining zelf, maar ook op een intelligentietest die vloeibare intelligentie meet. Morrison en Chein (2011) hebben een verklaring voor deze transfer, volgens hen is hier namelijk sprake van een kerntraining. Kerntrainingen spelen in op algemene werkgeheugenmechanismen met een hoge cognitieve werklading, waarbij geen sprake mag zijn van automatisering of domein specifieke strategieën. Een kerntraining kan tot een diepe transfer leiden, die een brede generalisatie teweeg brengt. Dit in tegenstelling tot een strategietraining die enkel tot een nabije transfer leidt, omdat men hiermee hele specifieke strategieën en methodes traint. Hieruit kan geconcludeerd worden dat de inhoud van de aangeboden werkgeheugentraining zeer van belang is. Uit recenter onderzoek naar de effecten van een werkgeheugentraining bij ADHD-patiënten bleek dat de training niet alleen zorgde voor verbeteringen in het verbale werkgeheugen, responsinhibitie en complex redeneren, ook waren de symptomen van ADHD volgens de ouders van de kinderen verminderd (Klingberg et al., 2005). Het inzetten van taken die aandacht, (werk)geheugen, cognitieve flexibiliteit en sociale cognitie trainen bij patiënten met ernstige cognitieve gebreken wordt al langer gedaan in de neuropsychologie en wordt ook wel cognitieve remediatie therapie genoemd (CRT; Medalia, Revheim & Herlands, 2009). Afhankelijk van de psychische stoornis en de mate van cognitieve verstoring worden bovengenoemde taken ingezet als behandeling of aanvulling in een behandelprogramma. Momenteel wordt er bijvoorbeeld in het Nederlandse Centrum voor Eetstoornissen Ursula de behandelmodule CRT aangeboden ter aanvulling van de behandeling van patiënten met anorexia nervosa. Uit pilotstudies is namelijk gebleken dat deze patiënten verbeteringen in cognitieve flexibiliteit lieten zien nadat zij tien weken CRT-taken trainden (Tchanturia, Davies & Campbell, 2007). In een latere pilotstudie was er naast verbetering in cognitieve prestaties ook sprake van een significante gewichtstoename en een significante afname van zelfgerapporteerde depressieklachten (Tchanturia et al., 2008). De patiënten die deelnamen aan de pilotstudies waren zelf ook positief over CRT, vooral omdat er niet specifiek werd gericht op emoties en het omgaan met eten. Bij patiënten met schizofrenie wordt al langer onderzocht of CRT effectief is, voornamelijk
7
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
omdat deze patiënten zich kenmerken door een gebrekkig cognitief functioneren (DSM-5, 2013). Onderzoek wees op vermindering van cognitieve tekorten door CRT en dit zou een positieve invloed hebben op het sociaal functioneren van de schizofrene patiënten die deelnamen (Wykes, Reeder, Corner, Williams & Everitt, 1999). Specifieker bleek dat CRT leidde tot significante blijvende verbeteringen in het werkgeheugen en verbetering in cognitieve flexibiliteit bij een groep schizofrene patiënten, waarbij geheugenverbetering een voorspeller bleek te zijn voor sociaal functioneren (Wykes et al., 2007). Een recente meta-analyse van CRT bij schizofrenie vond daarnaast dat de effectiviteit van CRT vergroot kon worden als er ook andere psychiatrische rehabilitatie werd aangeboden (Wykes, Huddy, Cellard, McGurk & Czobor, 2011). Bovendien werd er bij schizofrene patiënten die het verbaal geheugen trainden ook een verbeterde hersenactiviteit waargenomen door middel van fMRI. De verbeteringen in verbale prestaties waren namelijk gecorreleerd met een toegenomen activiteit van de linker inferieure frontale cortex (Wexler, Anderson, Fulbright & Gore, 2000). Aangezien het werkgeheugen geassocieerd wordt met hersenactiviteit in gebieden in de frontale en pariëtale cortices, onderzochten Olesen, Westerberg en Klingberg (2004) ook of werkgeheugentraining zorgde voor verandering van hersenactiviteit. Zij konden door middel van fMRI vaststellen dat de mediale frontale gyrus en superieure en inferieure pariëtale cortices na een werkgeheugentraining van vijf weken een verhoogde activiteit toonden. Daarnaast is gebleken dat het werkgeheugen afhankelijk is van een adequate dopamine neurotransmissie (Sawaguchi & Goldman-Rakic, 1991). Mogelijk zou een werkgeheugentraining dan ook veranderingen in dopamine neurotransmissie teweeg brengen. Dit bleek inderdaad het geval: een vijf weken durende werkgeheugentraining veroorzaakte een verandering van dichtheid in corticale dopamine D1receptoren (McNab et al., 2009). Naar mate het werkgeheugen van de deelnemers verbeterde was er een afname te zien in het binding potentieel van dopamine D1-receptoren. De veranderingen van zowel corticale activiteit als dichtheid van corticale dopamine D1-receptoren toont een wederkerige relatie tussen mentale activiteit enerzijds en hersenchemie anderzijds. 1.5 Hypothesen huidig onderzoek Tot nu toe kan worden gesteld dat werkgeheugentraining zorgde voor positieve resultaten bij patiënten met ADHD, anorexia nervosa en schizofrenie. Daarnaast bleek dat de effecten van een werkgeheugentraining terug te zien waren in een grotere activatie van specifieke hersengebieden en een verandering in dopamine neurotransmissie. Dit zijn hoopvolle bevindingen die wijzen richting een nieuwe effectieve behandelmethode voor depressie. De focus van dit onderzoek zal daarom liggen op de invloed van een vier weken durende werkgeheugentraining bij mensen met depressieve
8
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
symptomen. Er zullen twee groepen worden vergeleken: een experimentele en placebogroep. De placebogroep zal een werkgeheugentraining volgen die nooit oploopt in moeilijkheid, waardoor er sprake is van een placebo training. Daarnaast worden deze twee groepen vergeleken met een wachtgroep om eventuele placebo-effecten te kunnen uitsluiten. Deze groep volgde geen training en werd op twee momenten gemeten met een onderbreking van vier weken. Er wordt ten eerste verwacht dat de deelnemers van de experimentele groep na vier weken verbetering toont in het werkgeheugen in tegenstelling tot de deelnemers van de placebo- en wachtgroep. Onderzoek toonde immers aan dat het werkgeheugen te trainen is (Klingberg, Forssberg & Westerberg, 2002; Klingberg et al., 2005). Door de training van het werkgeheugen zal het negatieve materiaal minder lang aanwezig zijn in het werkgeheugen, dus wordt er verwacht dat de deelnemers van de experimentele groep vooruitgang tonen in depressieve symptomen. Dit zal niet het geval zijn voor de placebo- en wachtgroep. Tot slot toont neuropsychologisch onderzoek aan dat de hersenactiviteit verandert door de werkgeheugentraining (McNab et al., 2009; Olesen, Westerberg & Klingberg, 2004). Dit is waarom er wordt verwacht dat de experimentele groep op lange termijn nog verbeteringen toont in het werkgeheugen en depressieve problematiek.
9
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
2. Methode 2.1 Participanten Voor dit onderzoek deden 144 personen mee aan de telefonische pre-meting. Hiervan hebben 110 personen meegedaan aan het onderzoek, waarvan er uiteindelijk 101 personen zijn geselecteerd voor de data-analyse. Van deze deelnemers deden 50 mannen en 51 vrouwen mee. De gemiddelde leeftijd was 45.34 jaar (SD = 11.23, Range = 25-62). In onderstaande tabel 1 zijn de demografische gegevens per groep weergegeven. Bij de follow-up deden na 3 maanden nog 46 deelnemers mee, waarvan 23 mannen en 23 vrouwen. De wachtgroep bestond uit 10 mensen, waarvan 5 mannen en 5 vrouwen. Van deze groep was de gemiddelde leeftijd 43.7 jaar (SD = 14.06, Range = 25-61). Bij deze groep werd net als de andere twee groepen een pre- en postmeting afgenomen, met afwijking van de locatie. De wachtgroep mocht namelijk thuis alle vragenlijsten invullen en werkgeheugentaken maken. Dit betekende dat de werkgeheugentaken waar een testbegeleider voor nodig was niet werden uitgevoerd. Dit gold ook voor de klinische interviews, deze werden enkel bij de training- en placebogroep afgenomen.
Tabel 1. Beschrijvende statistieken uitgesplitst naar de drie groepen en van totale groep Placebo groep N = 44
Training groep N = 47
Wacht groep N = 10
Totaal
63.6
36.2
58.3
49.5
M: 45.25 SD: 10.26 Range: 26-61
M: 45.77 SD: 11.75 Range: 25-65
M: 43.7 SD: 14.06 Range: 25-61
M: 45.34 SD: 11.23 Range: 25-65
MAVO/VMBO/MULO/LTS HAVO VWO/HBS MBO/LBO HBO WO
11.4 2.3 6.8 29.3 29.5 20.5
19.1 8.5
8.3
23.4 34 10.6
8.3 58.3 8.3
Antidepressiva Antipsychotica Anxiolitica Kalmeringsmiddel Slaapmiddel Pijnstillers Overig Totaal (ja)
47.7
21.3 4.3 4.3 17 4.3 10.6 17 57.4
41.7 16.7 16.7 16.7 8.3
% Man Leeftijd (in jaren) % Opleiding
% Medicatie
6.8 4.5 6.8 2.3 9.1 54.5
16.7 66.7
N = 101
13.9 5.9 3 24.8 35.6 14.9 35.6 4 6.9 11.9 5.9 5.9 13.9 58.4
10
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
% Therapie Momentel
% Therapie Ooit
% Opname Ooit
Gesprekstherapie CT CGT Lichttherapie ECT Overig
25 2.3 6.8 4.5
27.7 2.1 6.4
16.7 8.3 16.7
25.7 3 7.9 2
13.6
14.9
8.3
13.9
Gesprekstherapie CT CGT Lichttherapie ECT Overig
47.7 40.9 11.4 4.5
51.1 17 27.7 6.4
41.7 8.3 16.7 8.3
49.5 26.7 19.8 5.9
29.5
29.8
8.3
11.4
14.9
25
Noot. CT = cognitieve therapie, CGT = cognitieve gedragstherapie, ECT = electro convulsieve therapie.
14.9
De deelnemers konden zich per e-mail opgeven voor deelname, vervolgens werden zij telefonisch benaderd om te controleren of zij voldeden aan de DSM-IV criteria voor een depressieve stoornis of angststoornis. De deelnemers werden op een aantal manieren geworven. Zo konden zij zich na de uitzending van een bekend Nederlands tv-programma opgeven voor het onderzoek en daarnaast werd er op een aantal internetsites informatie over het onderzoek aangeboden. Ook benaderde het onderzoeksteam proefpersonen die zich al eerder voor een soortgelijk onderzoek hadden opgegeven, maar daarvoor toen niet meer in aanmerking kwamen. De exclusiecriteria voor dit onderzoek was een psychose in het afgelopen jaar en een leeftijd jonger dan 18 of ouder dan 65 jaar. Daarnaast werden deelnemers met een verslaving uitgesloten. De proefpersonen werden dubbelblind over de beide traininggroepen verdeeld. Zij werden getest op de Erasmus Universiteit Rotterdam door Master studenten Klinische Psychologie. 2.2 Materiaal De pre- en postonderzoeken bestonden uit een breed scala aan vragenlijsten en taken. Voor het diagnosticeren van depressieve klachten werd een gestructureerd klinisch interview voor DSMstoornissen (SCID-I) afgenomen. Daarnaast werden werkgeheugen transfer taken afgenomen: de Reading Span, Digit Span, Interne Shift Taak (IST) en autobiografische geheugentest (AMT). Ook werden er wekelijkse vragenlijsten afgenomen om de stemming van de deelnemers te meten: de BDI-II, RRS en STAI. Verder werden de Symmetry Span en duale N-back taak afgenomen tijdens preen postmeting. Deze twee taken vormden samen de werkgeheugentraining. Tot slot werd er tijdens
11
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
de pre-meting gebruik gemaakt van een demografische vragenlijst om de algemene karakteristieken van de proefpersonen uit te vragen. Hieronder zal het testmateriaal uitgebreid besproken worden. 2.2.1 SCID-I Het gestructureerde klinische interview voor DSM stoornissen (SCID-I, Structured Clinical Interview for DSM-III, Spitzer, Williams, Gibbon & First, 1990) werd gebruikt om bij alle deelnemers de onderdelen stemmingsstoornissen en angststoornissen na te vragen. Volgens schattingen heeft immers zo’n 85% van de patiënten met een depressie ook significante angstsymptomen, bovendien heeft 90% van de patiënten met een angststoornis last van depressieve symptomen (Gorman, 1996). Voor het afnemen van de SCID-I hebben alle onderzoekers een training gevolgd. De SCID-I bestaat uit een aantal diagnostische vragen waarop de interviewer een score van 1 tot 3 kan toerekenen. Een score van 1 betekent dat het symptoom afwezig is, een score van 2 betekent twijfelachtig en een score van 3 houdt in dat het symptoom aanwezig is. De vragen zijn zo ingedeeld dat wanneer er een bepaalde criteria voldaan is dat de interviewer verder door moet vragen. Wanneer er niet aan de algemene criteria van een stoornis wordt voldaan kunnen de specifieke vragen worden overgeslagen. Eerder wetenschappelijk onderzoek toonde een acceptabele tot goede interbeoordelaarsbetrouwbaarheid van de SCID-I, waarbij Cohen’s Kappa varieert van .70 tot .80 (Skre, Onstad, Torgersen & Kringlen, 1991). De obsessief-compulsieve stoornis is hierop wel een uitzondering, met een lagere Cohen’s Kappa van .40. Bovendien bleek de interbeoordelaarsbetrouwbaarheid van de SCID-I over een langere tijd nog redelijk te noemen, waarbij Cohen’s Kappa nooit onder .60 kwam (Williams et al., 1992). 2.2.2 Werkgeheugen Transfer Taken Om het werkgeheugen bij de deelnemers voor en na de werkgeheugentraining te testen werden een aantal Span-taken afgenomen. Uit onderzoek bleken deze taken een goede indicatie te zijn voor de capaciteit van het werkgeheugen (Engle, Tuholski, Laughlin & Conway, 1999). Bij iedere Span-taak worden items aangeboden die onthouden moeten worden. Deze items worden afgewisseld met afleidende oefeningen die correct moeten worden uitgevoerd. Voorafgaand aan de Span-taak wordt eerst een korte oefening aangeboden zodat de deelnemers begrijpen wat er van hen verwacht wordt. Alle Span-taken werden door middel van geautomatiseerde versies via een Windows computer afgenomen. Bij de Reading Span worden de items, in dit geval letters, afgewisseld met Nederlandse betekenisvolle of betekenisloze zinnen (Daneman & Carpenter, 1980). De letters moeten in de juiste
12
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
volgorde worden onthouden, waarbij men tussendoor moet beoordelen of de aangeboden zin betekenisvol of betekenisloos is. Na een aantal letters en zinnen gezien te hebben moet men de juiste letters in de juiste volgorde aanklikken in een raster van letters. In dit raster staan dus ook letters die men niet heeft gezien. De moeilijkheid van de Reading Span varieert random van drie tot zeven zinnen gevolgd door een letter, waarbij alle niveaus drie keer worden aangeboden aan de deelnemer. De interne consistentie van de Reading Span is goed te noemen, met een Cronbach’s Alfa van .80 (Unsworth, Brewer & Spillers, 2009). Daarnaast is de test-hertest betrouwbaarheid hoog, waarvoor Pearson’s correlaties werden gevonden tussen .70 en .80 (Conway et al., 2005). In de dataanalyse zullen de volgende scores op de Reading Span worden geanalyseerd: het aantal correct onthouden letters, het totaal aantal fouten, het totaal aantal herinnerde sets en de totale score. De totale score is de som van alle items die in de correcte positie werden herinnerd, onafhankelijk van of de deelnemer de hele trial correct herinnerde. De Digit Span (Lumiley & Calhoon, 1934) meet hoeveel cijfers de deelnemer achtereen kan onthouden. Er wordt iedere keer een rode stip getoond, waarna de cijfers één voor één gedurende een seconde worden laten zien. Men moet dan de juiste volgorde van de cijfers op het toetsenbord intypen. Deze taak bestaat uit veertien trials waarbij de cijfers een seconde worden laten zien. In het eerste deel van de Digit Span moet de deelnemer de aangeboden cijfers voorwaarts onthouden en in het tweede gedeelte achterwaarts, dit wil zeggen dat het laatste cijfer als eerst moet worden ingetypt. Bij de voorwaartse reeks wordt begonnen met drie cijfers, waarna er steeds een cijfer bij komt totdat de proefpersoon een fout maakt. Bij de achterwaartse reeks wordt er begonnen met twee cijfers. Als er één fout wordt gemaakt krijgt men nog een keer hetzelfde niveau aangeboden, maar bij twee fouten wordt de taak afgebroken. De traditionele maat van de Digit Span meet alleen het niveau dat in eerste instantie gehaald wordt. Daarnaast wordt er ook gemeten hoe hoog het aantal cijfers oploopt ongeacht het aantal fouten. Er komen dan ook vier scores uit, het aantal cijfers dat correct voorwaarts en achterwaarts onthouden kan worden, voor beide maten. Deze vier scores zullen in de data-analyse worden meegenomen. De test-hertest betrouwbaarheid van de Digit Span is redelijk, Pearson’s correlatie voor de voorwaartse Digit Span is .50 en voor de achterwaartse Digit Span .60 (Williams, Simms, Clark & Paul, 2005). 2.2.3 Interne Shift Taak De Interne Shift Taak (IST; Chambers, Lo & Allen, 2008) meet de kundigheid om aandacht te switchen tussen verschillende categorieën, een indicatie voor een goed werkgeheugen (De Lissnyder, Koster & De Raedt, 2011). Hierbij wordt onderscheid gemaakt tussen emotionele stimuli en non-emotionele stimuli. Wanneer proefpersonen emotionele stimuli aangeboden krijgen moeten ze hun aandacht
13
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
switchen tussen neutrale en boze gezichten en bij de non-emotionele stimuli tussen gezichten van mannen en vrouwen. Er werd random besloten of de deelnemers in dit onderzoek met de emotionele stimuli of de non-emotionele stimuli begonnen, zodat de invloed van volgorde van stimuli uitgesloten kan worden. De bedoeling is dat de deelnemers tellen hoe vaak beide vormen van emotionele en non-emotionele stimuli zijn getoond en dit vervolgens intoetsen op het toetsenbord van de computer. Door middel van intern tellen konden de deelnemers bijhouden hoe vaak beide stimuli getoond werden. De deelnemers konden zelf op de spatiebalk drukken om de volgende stimulus te zien. Alvorens de taak begon werd kort geoefend met de testbegeleider. In deze oefenfase moest men hardop tellen zodat de testbegeleider kon nagaan of de taak werd begrepen. In de oefenfase werd benadrukt dat men niet hardop mocht tellen. Elke trial bestaat uit tien tot veertien afbeeldingen waar een interval van 200 milliseconden tussen zit. Voor zowel de emotionele als non-emotionele conditie werden op counter-gebalanceerde wijze twaalf trials aangeboden (Lissnyder, Koster & De Raedt, 2011). Dit levert drie scores op om te analyseren; de globale score, de score op de emotionele versus non-emotionele stimuli en de score op de mannelijke versus vrouwelijke gezichten. Er is helaas nog geen onderzoek gedaan naar de test-hertest betrouwbaarheid en interne consistentie van deze taak. 2.2.4 Autobiographic Memory Test Naast de computertaken werd de autobiographic memory test (AMT; Williams, 1995) afgenomen. Uit onderzoek is namelijk gebleken dat mensen met een depressie een overalgemeen autobiografisch geheugen hebben, wat betekent dat zij moeite hebben met het ophalen van specifieke autobiografische herinneringen (Sumner, Griffith & Mineka, 2010). De AMT meet de mate van een overalgemeen autobiografisch geheugen. Hierbij krijgt men vijf positieve en vijf negatieve woorden te zien waarbij een passende specifieke autobiografische herinnering moeten worden verteld aan de testbegeleider. Eerst kunnen de deelnemers oefenen met vijf andere positieve en negatieve woorden totdat ze bij drie woorden een specifieke herinnering hebben opgehaald en beschreven. Tijdens de test krijgen ze 60 seconden de tijd om een specifieke persoonlijke herinnering op te halen zonder eerdere herinneringen te herhalen. De herinnering wordt gecodeerd als ´specifiek´ als het gaat om een herinnering van een bepaalde plaats of tijd en korter duurde dan een dag. Wanneer de herinnering meer lijkt op een samenvatting van herhaalde gebeurtenissen (bv. een verjaardag) dan wordt het gecodeerd als een ´categorische´ herinnering. Als de herinnering langer duurde dan een dag (bv. een vakantie) dan wordt het gecodeerd als ‘langer dan een dag’. Wanneer er geen herinnering kan worden gegeven dan wordt dit gecodeerd als ´geen herinnering´. Als dezelfde herinnering wordt gegeven die eerder al
14
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
werd genoemd dan wordt deze gecodeerd als ´zelfde herinnering´. Voor de totale score op de test wordt gekeken naar het aantal specifieke herinneringen en de responstijd. De zes scoremogelijkheden worden samen met de gemiddelde reactietijd meegenomen in de analyse. De interbeoordelaars- betrouwbaarheid van de AMT is voldoende tot goed te noemen, met Cohen’s Kappa van .77 voor de pre-meting, .82 voor de post-meting en .75 voor de follow-up. 2.2.5 Wekelijkse vragenlijsten Bij alle participanten werd de tussentijdse stemming gemeten door middel van de Beck Depression Inventory-II (BDI-II; Beck et al., 1961), de State-Trait Anxiety Inventory (STAI; Spielberger, 1983) en de Ruminative Respons Scale (RRS; Nolen-Hoeksema, 1991). De BDI-II bestaat uit 21 vragen over de mate van depressieve stemming. Hierop wordt op een 4-puntschaal aangegeven in hoeverre het item op de persoon van toepassing is. Een score van 0 betekent afwezig en een score van 3 houdt in dat het symptoom zeer ernstig aanwezig is. De totaalscore op de BDI-II bestaat uit alle scores bij elkaar opgeteld. De test-hertest betrouwbaarheid is hoog, Pearson r = .93 en interne consistentie is ook hoog, alpha = .91 (Beck et al., 1996). De interne consistentie van de afgenomen BDI bij de deelnemers was ook hoog, alpha = .78. De STAI bestaat uit twee schalen, de State-schaal en de Trait-schaal. De State-schaal meet de angstig voor bepaalde gebeurtenissen en de Trait-schaal meet angst als een altijd aanwezige persoonlijkheidstrek. Beide schalen bestaan uit 20 uitspraken waarop individuen op een 4-puntschaal moeten scoren hoe ze zich voelen. Een score van 1 houdt in dat het individu zich helemaal niet zo voelt als de stelling en een score van 4 betekent dat het individu zich heel erg op die manier voelt. De totaalscore bestaat uit de scores van beide schalen bij elkaar opgeteld, waarbij een aantal vragen omgeschaald moesten worden. De test-hertest betrouwbaarheid van beide schalen is hoog, met een Pearsons correlatie van .70 en 0.88 voor de State- en Trait-schalen respectievelijk. Ook de interne consistentie is hoog, met Cronbachs alfa van .91 voor de State-schaal en .89 voor de Trait-schaal (Barnes, Harp & Jung, 2002). De interne consistentie van de afgenomen STAI was hoog, alpha = .93 voor de State-schaal, alpha = .87 voor de Trait-schaal en de interne consistentie van de totale STAI was ook hoog, alpha = .94. De RRS is een subschaal van de Response Styles Questionnaire (RSQ; Nolen-Hoeksema & Morrow, 1991) en bestaat uit 22 items. Deze items meten depressief rumineren of piekeren over het individu zelf, zijn of haar symptomen en de oorzaken of gevolgen ervan. Elk item moet op een 4puntschaal worden gescoord in de aanwezigheid, waarbij een score van 1 betekent dat het ‘haast nooit gebeurt’ en een score van 4 ‘bijna altijd’. De RRS heeft een hoge interne betrouwbaarheid, met Cronbachs alfa variërend van .88 tot .92. Daarnaast is de test-hertest betrouwbaarheid hoog te
15
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
noemen, na zes maanden werd een Pearsons correlatie van .80 gevonden ten op zichte van de eerdere meting (Luminet, 2004). De interne consistentie van de afgenomen RRS bij de deelnemers was hoog, alpha = .92. 2.2.6 Duale N-back taak De duale N-back taak vormt samen met de Symmetry Span de aangeboden werkgeheugentraining (Jaeggi et al., 2010). Bij de duale N-back taak worden visuele en auditieve stimuli tegelijkertijd aangeboden via de computer. De visuele stimuli zijn in dit geval vierkanten die op acht verschillende plaatsen ten opzichte van een kruis verschijnen en de auditieve stimuli zijn uitgesproken letters die men via een koptelefoon te horen krijgt. Beide stimuli worden 2000 milliseconden aangeboden met een interval van 500 milliseconden. Deelnemers krijgen alvorens de taak begint een korte oefening en visuele instructies. De taak van de deelnemers is om te beoordelen of de stimuli die zij zien en horen overeenkomen met de stimuli die eerder werden getoond, de referentiestimuli. Zij moeten op de letter ‘A’ drukken als het vierkant zich op dezelfde plek bevindt en op de letter ‘L’ wanneer zij dezelfde letter horen. Hierbij is het ook mogelijk dat beide of geen van beide letters moeten worden ingedrukt. De referentiestimuli waarmee men moet vergelijken wordt bepaald door de grootte van ‘N’. Als ‘N’ 1 is, dan moet men één stap terug doen in de getoonde stimuli, dus dat betekent dat er beoordeeld moet worden of de huidige stimuli gelijk zijn aan de vorige stimuli. Wanneer ‘N’ 2 is, dan moet men twee stappen terug doen in het geheugen, dus dat betekent dat de huidige stimuli niet moeten worden vergeleken met de vorige stimuli, maar met de stimuli die daarvóór werden aangeboden. Er zit bij N = 2 dus één interferende set stimuli tussen de twee sets die men moet vergelijken en deze set moet men dus als het ware negeren. Bij ‘N’ = 3 zijn er twee sets interferende stimuli, omdat men dan drie stappen terug moet doen in het geheugen. Naar mate ‘N’ dus groter wordt neemt de moeilijkheid van de N-back taak toe en wordt er op meer gecompliceerde werkgeheugenprocessen beroep gedaan, waarbij het maximale aantal ‘N’ in principe 5 is (Jaeggi, Buschkuehl, Jonides & Perrig, 2008). Er is wederom een verschil tussen de experimentele groep en de controlegroep. Bij de experimentele groep zal ‘N’ namelijk oplopen van een tot vijf, terwijl de controlegroep telkens dezelfde referentie van eerst geziene stimuli gebruikt. Daarbij zal ‘N’ dus nul blijven. Het totaal aantal trials is voor beide groepen 13. Voor zowel de visuele stimuli als de auditieve stimuli worden het aantal hits, missers, correcte afwijzing en vals alarm geanalyseerd. Naast deze acht scores wordt bij de experimentele groep ook de hoogst behaalde score meegenomen in de data-analyse, dat is het grootste aantal ‘N’ stappen terug die men foutloos kan maken.
16
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
De test-hertest betrouwbaarheid van de snelheid op de N-back taak is goed te noemen, Pearson’s correlatie varieert tussen .69 en .86. Bovendien is het aantal juiste antwoorden over tijd ook redelijk betrouwbaar waarbij de correlaties uiteenlopen van .49 tot .73 (Hockey & Geffen, 2004). 2.2.7 Symmetry Span De Symmetry Span (Kane et al., 2004) is te vergelijken met de Reading Span, echter hoeft men geen letters te onthouden maar de plek waar rode vierkanten op het scherm worden getoond. De rode vierkanten die in een raster van zestien vlakken konden staan, worden afgewisseld met afbeeldingen (zie figuur 1) waarvan men moet beoordelen of deze verticaal symmetrisch zijn of niet. Vervolgens moet er in het raster worden aangeklikt waar de rode vierkanten zich bevonden. Het aantal trials dat wordt aangeboden verschilt tussen de experimentele groep en de controle groep. Wanneer de experimentele groep geen fouten maakt in zowel de symmetrieafbeeldingen als de vierkanten, zal het aantal vierkanten oplopen tot een maximum van twaalf vierkanten wat uitkomt op een totaal van zeventien trials. Als de experimentele groep een fout maakt wordt nogmaals het zelfde niveau aangeboden. De controle groep zal nooit meer dan twee vierkanten hoeven te onthouden, met een totaal van 29 trials. Doordat de controlegroep ongeacht het aantal fouten hetzelfde niveau behoudt, zal bij deze groep het werkgeheugen niet worden getraind. De Symmetry Span-scores die worden geanalyseerd zijn: de totale score, het percentage correct onthouden letters, het totaal aantal fouten, het totaal aantal onthouden sets en het grootste aantal vierkanten dat men correct aanklikt in het raster. Cronbach’s alfa voor de Symmetry Span varieert tussen .72 en .86, dit duidt op een goede interne consistentie (Martens & Johnson, 2009; Unsworth, Brewer & Spillers, 2009). De test-hertest betrouwbaarheid van de Symmetry Span is redelijk, Pearsons correlaties liggen tussen .62 en .77 (Redick et al., 2012).
Figuur 1. Voorbeelden van symmetrie-afbeeldingen gebruikt voor de Symmetry Span
17
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
2.3 Procedure Alle deelnemers werden alvorens deelname telefonisch gescreend op bovengenoemde in- en exclusiecriteria. Vervolgens werden zij ingepland voor een pre- en post-test meting. Voor het begin van de pre-meting ondertekenden de deelnemers het toestemmingsformulier en daarnaast ontvingen zij extra informatie over het deelnemen aan wetenschappelijk onderzoek. De pre- en postmeting van de training- en placebogroep vonden plaats in het Erasmus Behavioral Lab op de Erasmus Universiteit te Rotterdam. De wachtgroep voerde thuis twee aangepaste metingen uit met een interval van vier weken. Na afloop van de eerste meting kregen de deelnemers van de trainingen placebogroep instructies mee voor het uitvoeren van de training op de computer. Tussen de preen post metingen zat een interval van vier weken waarin de deelnemers thuis op de computer gedurende zes dagen per week de werkgeheugentraining uitvoerden. Tijdens deze vier weken werd telefonisch begeleiding gegeven door alle deelnemers iedere week te bellen. Bij vragen konden de deelnemers ook zelf contact opnemen via e-mail of telefonisch contact. Het onderzoeksteam stuurde iedere week de BDI-II, STAI en RRS op om de stemming te meten. De vergaarde data werd tijdens het onderzoek bijgehouden door het gebruik van Microsoft Office Excel. Toen alle data compleet was werd alles verzameld en geanalyseerd door middel van IBM SPSS Statistics 19. Een aantal deelnemers kwamen 10 weken na de post-meting nog terug voor een follow-up, deze meting was vergelijkbaar met de inhoud van de post-meting. Nadat de resultaten van het onderzoek binnen waren werden deelnemers ingelicht of zij de placebotraining of de geteste werkgeheugentraining hadden gevolgd.
18
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
3. Resultaten 3.1 Resultaten Hypothese I: ‘Het werkgeheugen van de deelnemers zal door de training verbeteren’ Volgens de eerste hypothese zal de traininggroep een significant verschil op de werkgeheugentaken laat zien in vergelijking met de placebo- en wachtgroep. Voor elke werkgeheugentaak werd daarom een repeated measures ANOVA uitgevoerd voor de verschillende variabelen, waarbij werd gekeken naar het interactie-effect tussen de meetmomenten enerzijds en de drie groepen anderzijds. Het verschil tussen de twee meetmomenten moet immers afhankelijk zijn van het verschil tussen de drie groepen om te kunnen spreken van een verbetering in het werkgeheugen door de training. 3.1.1 Hypothese I: Reading Span Voor de resultaten van de Reading Span werd een repeated measures ANOVA uitgevoerd met vier scores, twee meetmomenten (pre en post) en drie groepen (training-, placebo- en wachtgroep) als between subjects factor. Op de totale score van de Reading Span verschillen de drie groepen significant op hun verschilscores van de twee metingen, F(2,69) = 3.61, p = .03. Om te zien waar dit verschil vandaan komt werd een Post Hoc vergelijking uitgevoerd, waarbij werd gekozen voor de Games-Howell methode, vanwege het verschil in groepsgrootte (Field, 2009). Hieruit bleek dat de gemiddelde verschilscore op pre- en postmeting van de traininggroep niet significant verschilt met de verschilscore van de placebogroep (t (63) = -.81, p = .42). De verschilscores van de training- en wachtgroep verschillen wel significant (t (38) = -2.26, p = .03), net zoals tussen de placebo- en wachtgroep (t (37) = -.81, p = .01). De gemiddelde verschilscores in tabel 2 laten zien dat de wachtgroep significant sterker vooruitging van pre- naar postmeting dan zowel de training als placebogroep. Voor het totaal aantal fouten op de Reading Span werd ook een significant interactie-effect gevonden, F(2,69) = 4.89, p = .01. Games-Howell Post Hoc procedure wees bij benadering enkel op een significant verschil tussen de training- en placebogroep, (t (63) = 3.17, p = .02). Zoals tabel 2 toont, betekent dit dat de traininggroep ten opzichte van de placebogroep minder fouten maakte op de postmeting dan op de premeting. Voor de training- en wachtgroep werd geen significant verschil gevonden (t (38) = -1.09, p = .29), net als tussen de placebo- en wachtgroep (t (37) = .77, p = .45).
19
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
Tabel 2. Gemiddelde en standaardafwijkingen voor de verschilscores van de pre- en postmetingen waarvoor een significant interactie-effect werd gevonden tussen de groepen en meetmomenten. Placebo groep N = 44
Traininggroep N = 47
Wachtgroep N = 10
M
SD
M
SD
M
SD
RS totale score
.630
14.32
3.42
13.67
16.29
13.78
RS totaal aantal fouten
.97
4.29
-2.24
3.87
-.43
4.76
DS voorwaarts maximaal
1.00
.80
1.00
.83
.14
.69
DS achterwaarts traditioneel
-.55
1.71
-1.30
1.49
.29
1.25
Noot. M = gemiddeld verschil tussen pre- en postmeting, SD = standaardafwijking. Een positieve waarde betekent vooruitgang van pre- naar postmeting, negatieve waarde weerspiegelt achteruitgang.
De drie groepen verschillen niet significant op hun verschilscores wat betreft het totaal aantal herinnerde sets, F(2,69) = 2.88, p = .06. Er werd ook geen significant verschil gevonden voor het percentage correct onthouden letters, F(2,69) = 2.13, p = .13. Over het geheel gezien blijkt dat er significante interactie effecten gevonden werden voor de totale score en het totaal aantal fouten. Hiervoor toonden Post Hoc toetsen dat de wachtgroep significant verbeterde op de totale score ten opzichte van zowel de training- als placebogroep. Anderzijds maakte de traininggroep significant minder fouten dan de placebogroep ten opzichte van de premeting. Voor het totaal aantal onthouden sets en het percentage correct onthouden letters van de Reading Span werden geen interactie-effecten gevonden. 3.1.2 Hypothese I: Digit Span Om de vooruitgang op de Digit Span te analyseren werd een repeated measures ANOVA uitgevoerd met vier scores en de al genoemde drie groepen als between subjects factor, waarbij werd gekeken naar de significantie van de interactie-effecten. De eerste score die de Digit Span genereert is de ´voorwaarts traditionele score´, waarbij het aantal cijfers oploopt totdat de deelnemer een bepaald aantal fouten maakt. Op deze variabele werd geen verschil gevonden voor de drie groepen op de twee meetmomenten, F(2, 69) = 1.91, p = .16. Daarnaast werd gemeten hoe ver de deelnemers kwamen wanneer het aantal cijfers opliep ongeacht het aantal fouten, deze score is de ´voorwaarts maximale score´. Voor deze variabele kan wel een significant interactie-effect worden vastgesteld, F(2, 69) = 3.57, p = .03. Post Hoc procedure door middel van Games-Howell vindt significante verschillen tussen de training- en wachtgroep (t (38) = 2.55, p = .02) en tussen de wacht- en placebogroep (t (37) = 2.61, p = .01). Zoals tabel 2 toont verbeterde de training- en placebogroep
20
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
beide significant ten opzichte van de wachtgroep tussen de pre- en postmeting. Tussen de verschilscores van de training- en placebogroep werd geen significant verschil gevonden (t (63) = 00, p = 1.00). Naast de voorwaartse cijferreeks werden er ook achterwaartse cijferreeksen aangeboden, waarbij de deelnemers de cijfers in omgekeerde volgorde moesten onthouden. Voor de ‘achterwaarts traditionele score’ werd een interactie-effect gevonden, F(2, 68) = 3.75, p = .03. Een Post Hoc Games-Howell toets vond een significant verschil tussen de training- en wachtgroep (t (38) = -2.63, p = .01). De gemiddelde verschilscores uit tabel 2 laten zien dat dit betekent dat de wachtgroep sterker vooruitging dan de traininggroep op deze variabele. Echter, tussen de verschilscores training- en placebogroep (t (62) = 1.89, p = .06), en placebo- en wachtgroep (t (36) = 1.21, p = .23) werden geen significante verschillen gevonden. Bij de ‘achterwaarts maximale score’ kon geen significant interactie-effect worden vastgesteld, F(2, 68) = 2.98, p = .06. Samengevat werden er op twee variabelen significante interactie-effecten gevonden; ‘voorwaarts maximale score’ en ‘achterwaarts traditionele score’. De uitgevoerde Post Hoc toetsen vonden een verbetering van de training- en placebogroep ten opzichte van de wachtgroep op de variabele ‘voorwaarts maximale score’. Anderzijds toonde de wachtgroep meer verbetering op de variabele ‘achterwaarts traditionele score’ dan de traininggroep. Voor de andere twee variabelen (‘voorwaarts traditioneel’ en ‘achterwaarts maximaal’) werd geen significant interactie-effect gevonden. 3.1.3 Hypothese I: Interne Shift Taak Voor de scores op de IST, werd een repeated measures ANOVA uitgevoerd met drie scores, twee meetmomenten en de twee groepen als between subjects factor. De wachtgroep werd niet meegenomen in deze analyse omdat deze groep de IST niet kon maken. Voor de juiste afname van de IST was namelijk instructie nodig van de onderzoekers en de wachtgroep maakte thuis alle testen. De globale score op de IST is een algemene indicatie voor de snelheid van het ‘shiften’ of wisselen tussen twee stimuli, hiervoor werd gevonden dat de twee groepen niet significant verschillen op de twee meetmomenten, F(1, 60) = .22, p = .69. Daarnaast werd er specifieker gemeten hoe snel de deelnemers konden wisselen tussen het zien van verschillende emoties en geslachten. Voor zowel de ‘emotie score’ als de ‘geslacht score’ werden geen significante interactie-effect gevonden, respectievelijk F(1, 64) = .59, p = .4 en F(1, 64) = .20, p = .66. Op de gehele IST blijkt er dus geen significant verschil te zijn voor de twee groepen op de verschilscores van de twee meetmomenten.
21
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
3.1.4 Hypothese I: Autobiographic Memory Test Om de verschillen in de vooruitgang op de AMT te meten werd een repeated measures ANOVA uitgevoerd. Er werden zeven scores (zes antwoord categorieën en de gemiddelde reactietijd), twee meetmomenten (pre en post) en twee groepen als between subjects factor ingevoerd. De wachtgroep werd niet meegenomen omdat deze groep de AMT niet heeft gemaakt. Ook hiervoor was interactie met de onderzoekers vereist, maar dit was niet mogelijk aangezien de wachtgroep thuis de testen invulde. Voor het aantal specifieke herinneringen op de AMT leken de twee groepen niet significant te verschillen wat betreft pre- en postscores, F(1, 74) = .04, p = .85. Ook werd er geen significant interactie-effect gevonden voor het aantal categorische herinneringen, F(1, 74) = .00, p = .97. Het aantal herinneringen dat niet specifiek is, maar juist langer duurde, verschilde niet significant voor de twee groepen op de twee meetmomenten, F(1, 74) = .07, p = .79. Er werd ook geen significant interactie-effect gevonden voor het aantal keren dat er geen respons kwam van de deelnemers, F(1, 74 = .02, p = .90). Daarnaast werd er geen significante interactie gevonden voor het aantal onduidelijke antwoorden van de deelnemers, F(1, 74) = .20, p = .66. Het kwam ook voor dat deelnemers dezelfde herinnering nogmaals vertelden, voor deze variabele kon ook geen significant interactie-effect worden gevonden F(1, 74) = .15, p = .70. Tot slot werd gekeken of de gemiddelde reactietijd van de deelnemers wel verschilt voor de twee groepen door de tijd heen, hiervoor bleek F(1, 74) = .12, p = .73, wederom geen significant interactie-effect. Over het geheel kon er voor geen van de zeven verschillende AMT-scores een significant verschil worden gevonden voor de verschilscores op de twee meetmomenten van de twee groepen. 3.1.5 Hypothese I: Werkgeheugentraining De werkgeheugentraining bestond uit de Symmetry Span en de Duale N-back taak. Als onderdeel van hypothese I, wordt er verwacht dat de deelnemers van de traininggroep verbetering laten zien op de werkgeheugentaken ten opzichte van de placebo- en wachtgroep. Omdat de placebogroep een aangepaste werkgeheugentraining volgde, waarbij het niveau nooit hoger opliep, kunnen de drie groepen niet adequaat worden vergeleken in een repeated measures ANOVA. Daarom werd drie maal een t-toets voor gekoppelde paren uitgevoerd, waarvan de resultaten zijn weergegeven in tabel 3 voor de Symmetry Span en tabel 4 voor de Duale N-back taak. In overeenstemming met de hypothese worden significante verschillen in pre- en postmeting verwacht voor de traininggroep. Voor de wachtgroep worden non-significante verschillen verwacht en voor de placebogroep zowel significante als non-significante verschillen. Nu zullen de resultaten in meer detail worden besproken om te zien of dit het geval is.
22
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
3.1.6 Hypothese I: Symmetry Span Zoals te zien in tabel 3 gingen de deelnemers van de traininggroep significant vooruit op de variabele ´totale score´ (t (32) = -5.49, p <.01). Ook verbeterde het totaal aantal onthouden sets ten opzichte van de premeting voor de groep (t (32) = -6.16, p <.01). Daarnaast blijkt de traininggroep op de variabele ‘PU score’, het percentage correct onthouden vierkanten, significant vooruit gegaan te zijn van pre- naar postmeting (t (32) = -2.13, p <.05). Dit is ook het geval voor het hoogste niveau dat de deelnemers konden bereiken tijdens de training, deze bleek significant vooruit te zijn gegaan van premeting naar postmeting (t (32) = -8.06, p <.01). De variabele ‘aantal fouten’ vormt een uitzondering op deze resultaten, voor deze variabele kon geen significant verschil (t (32) = .15, p >.05) worden gevonden tussen pre- en postscores van de traininggroep. Samenvattend kan gesteld worden dat de traininggroep vooruit is gegaan op de totale score, het totaal aantal onthouden sets, het totaal aantal onthouden vierkanten en het hoogst haalbare niveau op de Symmetry Span, maar het totaal aantal fouten is niet significant verbeterd tussen pre- en postmeting. De placebogroep verbeterde ook significant op de totale score van de Symmetry Span (t (31) = -3.58, p <.01). Dit is ook het geval voor het totaal aantal onthouden sets t (31) = -3.58, p <.01). Ditzelfde geldt voor de ‘PU score’, het percentage correct onthouden vierkanten, waarop de placebogroep significant verbetering toont op de postmeting ten opzichte van de premeting (t (31) = -3.48, p >.01). Voor het aantal gemaakte fouten op de Symmetry Span bleek geen significant verschil tussen pre- en postmeting (t (31) = 1.66, p >.05) van de placebogroep. Er kon geen t-toets worden uitgevoerd voor de variabele ‘hoogste niveau’ omdat de placebogroep nooit opliep in niveau. Samengevat blijkt dat de placebogroep vooruit is gegaan op de totale score, het totaal aantal onthouden sets en op het percentage correct onthouden vierkanten van de Symmetry Span, maar niet op het totaal aantal fouten. De wachtgroep toont op geen van de gemeten Symmetry Span scores een significant verschil tussen pre- en postmeting. De totale score van de Symmetry Span verschilde niet tussen pre- en postmeting voor deze groep (t (6) = .21, p >.05). Hetzelfde geldt voor het totaal onthouden sets (t (6) = .37, p >.05), totaal aantal fouten (t (6) = 1.18, p >.05), correct onthouden vierkanten (t (6) = .07, p >.05) en het hoogst haalbare niveau (t (6) = -.68, p >.05). Samengevat blijkt de wachtgroep op geen van de vijf geanalyseerde variabelen een significante vooruitgang te hebben gemaakt.
23
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
Tabel 3. Gemiddelden en standaarddeviaties van de pre, post en follow-up scores op de Symmetry Span uitgesplitst naar drie groepen Placebo groep N = 44
Traininggroep N = 47
Wachtgroep N = 10
M
SD
M
SD
M
SD
Pre
35.88
5.18
9.42
4.08
15.43
11.84
Post
38.94
3.8
18.85
10.10
14.57
7.96
Follow-up
38.2
3.83
22.35
12.27
Pre
17.94
2.59
3.12
1.08
4.29
2.5
Post
19.47
1.9
4.73
1.59
4
1.73
Follow-up
18.7
2.94
6.12
4.04
Pre
3.69
5.13
4.52
4.44
3.43
2.3
Post
2.66
3.29
4.4
3.3
2.71
2.06
Follow-up
1.9
1.94
5.18
3.68
Pre
.91
.08
.53
.13
.59
.19
Post
.96
.05
.58
.13
.59
.22
Follow-up
.69
.21
.64
.22
Pre
4.64
.9
5.29
1.6
Post
6.36
1.56
5.57
1.4
Follow-up
6.5
1.67
SS scores
Totale score
Totaal onthouden sets
Totaal aantal fouten
PU score
Hoogste Niveau
Noot. SS = Symmetry Span, M = gemiddelde, SD = standaarddeviatie. PU = percentage correct onthouden vierkanten. Voor de placebogroep werd geen t-toets uitgevoerd voor de variabele ‘hoogste niveau’ omdat deze groep nooit opliep in niveau. Voor de wachtgroep vond geen follow-upmeting plaats.
3.1.7 Hypothese I: Duale N-back taak Bij de duale N-back taak werd onderscheid gemaakt tussen het visueel en auditief aanbieden van de te onthouden stimuli. Wanneer de deelnemer de juiste knop indrukte bij de aanwezigheid van de juiste stimuli, werd dit gescoord als een ‘hit’ en als een ‘misser’ als de deelnemer niet drukte. Bij afwezigheid van de stimulus hoorde de deelnemer ook niet te drukken, in dit geval is er sprake van een ‘correcte afwijzing’, maar wanneer de deelnemer wel drukte is dit een ‘vals alarm’. Zoals te zien in tabel 4 komt dit neer op vier variabelen voor zowel de visuele als auditieve stimuli en bovendien
24
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
werd bij de training- en wachtgroep het maximale niveau dat de deelnemers konden bereiken geanalyseerd, ‘hoogste niveau’. 3.1.7.1 Hypothese I: Duale N-back resultaten Traininggroep De traininggroep verbeterde op het aantal ‘visuele hits’ van pre- naar postmeting (t (32) = -3.82, p <.01), zoals tabel 4 toont. Dit was ook het geval voor het aantal ‘visuele missers’ (t (32) = 3.94, p <.01), welke afnam tussen pre- en postmeting. Het hoogst haalbare niveau dat de deelnemers van de traininggroep behaalden op de duale N-back taak ging vooruit tussen de pre- en postmeting (t (32) = -8.23, p <.01). Voor het aantal keren dat de traininggroep ‘visueel vals alarm’ sloeg op de duale Nback taak werd geen significant verschil gevonden tussen pre- en postmeting (t (32) = .05, p >.05). Dit geldt ook voor de variabele ‘visueel correcte afwijzing’ (t (32) = -.08, p >.05). Wat betreft de auditieve stimuli, hiervoor werd geen verschil gevonden tussen de pre- en postscores van de traininggroep. Het aantal hits verschilde niet significant tussen pre- en postmeting (t (32) = -1.25, p >.05), net als het aantal ‘auditieve missers’ (t (32) = 1.39, p >.05). Ook het aantal keren dat de traininggroep ‘auditief vals alarm’ sloeg bleek niet significant te verschillen tussen preen postmeting (t (32) = 1.71, p >.05). Ditzelfde geldt voor het aantal keren ‘auditief correcte afwijzing’ (t (32) = -1.80, p >.05). Samengevat ging de traininggroep op de visuele hits en missers vooruit tussen pre- en postmeting, net zoals op het hoogst haalbare niveau. Op het aantal keren visueel vals alarm, correcte afwijzingen en alle vier de auditieve metingen was geen significant verschil waarneembaar tussen de pre- en postmeting. Tabel 4. Gemiddelden en standaarddeviaties van de scores op de duale N-back taak uitgesplitst naar drie groepen Placebo groep N = 44
Traininggroep N = 47
Wachtgroep N = 10
M
SD
M
SD
M
SD
Pre
5.27
.70
3.44
.78
3.60
1.67
Post
5.90
.25
4.09
.82
3.93
.68
Follow-up
5.66
.41
4.15
1.12
Pre
.73
.70
2.58
.77
2.40
1.67
Post
.11
.25
1.91
.82
2.07
.68
Follow-up
.35
.41
1.85
1.12
Duale N-back scores
Visueel Hits
Missers
25
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
Vals alarm
Correcte afwijzing
Pre
.22
.31
.85
.47
.90
.48
Post
.07
.12
.84
.54
1.22
.37
Follow-up
.17
.24
.79
.51
Pre
13.78
.31
13.13
.52
13.09
.48
Post
13.93
.12
13.16
.54
12.78
.37
Follow-up
13.83
.24
13.21
.51
Pre
4.70
1.60
4.12
.83
3.76
1.80
Post
5.87
.31
4.36
1.02
4.41
.76
Follow-up
5.65
.53
4.29
.9
Pre
1.31
1.60
1.90
.83
2.23
1.80
Post
.13
.31
1.64
1.02
1.59
.76
Follow-up
.35
.53
1.71
.9
Pre
.31
.28
1.21
.63
1.26
.73
Post
.07
.13
.99
.57
1.34
.70
Follow-up
.11
.13
1.15
.78
Pre
13.69
.28
12.77
.70
12.74
.73
Post
13.93
.13
13.01
.57
12.65
.70
Follow-up
13.89
.13
12.85
.78
Pre
2.12
.49
2.57
.79
Post
3.36
.90
3.00
.58
Follow-up
3.18
.81
Auditief Hits
Missers
Vals alarm
Correcte afwijzing
Hoogste Niveau
Noot. M = gemiddelde, SD = standaarddeviatie. Voor de placebogroep werd geen t-toets uitgevoerd voor de variabele ‘hoogste niveau’ omdat deze groep nooit opliep in niveau. Voor de wachtgroep vond geen follow-upmeting plaats.
3.1.7.2 Hypothese I: Duale N-back resultaten Placebogroep De placebogroep volgde een aangepaste duale N-back taak, waarbij de moeilijkheid niet opliep omdat de referentiestimuli altijd hetzelfde bleef. Deze groep ging tussen de pre- en postmeting vooruit op het aantal ‘visuele hits’ (t (32) = -5.38, p <.01). Ook het aantal ‘visuele missers’ nam af
26
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
tussen pre- en postmeting (t (35) = 5.38, p <.01), net als het aantal keren ‘visueel vals alarm’ (t (32) = 3.34, p <.01). Het aantal keren ‘visueel correcte afwijzing’ verbeterde significant van pre- naar postmeting (t (32) = -3.34, p <.01). De gemiddelden en standaardafwijkingen van deze variabelen zijn terug te vinden in tabel 4. Wat betreft de auditieve stimuli, hiervoor werden soortgelijke resultaten gevonden. Het aantal ‘auditieve hits’ verbeterde van pre- naar postmeting (t (32) = -4.40, p <.01). Het aantal ‘auditieve missers’ ging achteruit tussen pre- en postscores van de placebogroep (t (32) = 4.40, p <.01). Ditzelfde geldt voor het aantal keren ‘auditief vals alarm’ (t (32) = 5.72, p <.01). Tot slot werd ook een significante verbetering van pre- naar postscores gevonden voor het aantal keren ‘auditieve correcte afwijzing’ (t (32) = -5.72, p <.01). De placebogroep volgde een aangepaste duale N-back taak, waarvoor de deelnemers op elk van de variabelen vooruitgang toonde. 3.1.7.3 Hypothese I: Duale N-back resultaten Wachtgroep De wachtgroep werd op twee momenten getest, maar volgde geen werkgeheugentraining. Deze groep behaalde op geen van de variabelen een significante vooruitgang. Het aantal ‘visuele hits’ (t (6) = -.54, p >.05) en ‘visueel correcte afwijzingen’ (t (6) = 1.33, p >.05) verbeterde niet significant tussen pre- en postmeting. Het aantal ‘visuele missers’ (t (6) = .54, p >.05) en ‘visueel vals alarm’ (t (6) = 1.38, p >.05)verminderde niet significant tussen pre- en postmeting. Ook voor het aantal ‘auditieve hits’ werd geen significant verschil gevonden tussen pre- en postmeting (t (6) = -1.01, p >.05), net als het dat het aantal ‘auditieve missers’ niet significant verschilt (t (6) = 1.00, p >.05). Daarnaast werd geen significant verschil gevonden tussen de pre- en postscores van het aantal keren ‘auditieve vals alarm’ (t (6) = -.26, p >.05). Dit bleek ook het geval voor ‘auditieve correcte afwijzingen’ (t (6) = .26, p >.05) en het hoogste niveau dat de wachtgroep behaalde (t (6) = -2.12, p >.05). Samengevat behaalde de wachtgroep op geen van de gemeten variabelen van de duale N-back taak een significante vooruitgang van pre- naar postmeting. 3.2 Resultaten Hypothese II: ‘De depressieve symptomatologie zal afnemen’ Deze hypothese voorspelt dat het volgen van de werkgeheugentraining leidt tot een afname in depressieve symptomen. In vergelijking met de deelnemers van de placebo- en wachtgroep zouden de deelnemers van de traininggroep een afname in depressieve symptomen hebben ervaren na het volgen van de werkgeheugentraining. Voor het testen van deze hypothese werden de SCID-II diagnoses, BDI-II, STAI, RRS en de wekelijkse vragenlijsten geanalyseerd door middel van een repeated measures ANOVA waarbij de interactie-effecten tussen de twee groepen en de twee meetmomenten in detail zullen worden bekeken.
27
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
3.2.1 Hypothese II: SCID-I Diagnoses Een Chi-kwadraattoets werd toegepast om vijf SCID-I diagnoses te analyseren: een depressieve episode op het moment van de meting (‘depressie nu’), de aanwezigheid van een depressieve stoornis (‘depressieve stoornis), de aanwezigheid van depressieve klachten die in een restcategorie vallen of niet anderszins omschreven (‘depressie NAO’), de aanwezigheid van een chronische depressieve stemming (‘dysthyme stoornis’) en de aanwezigheid van depressie en manische periodes, waarbij depressieve periodes overheersen (‘bipolair type I’). De twee meetmomenten (pre en post) werden gecombineerd met de twee groepen (training- en placebogroep) om het effect van de training op de SCID-I diagnose te kunnen bekijken. De twee groepen bleken niet te verschillen op een diagnose van een huidige depressieve episode op de twee meetmomenten, X2 (2, n=76) = 1.62, p = .45. Ook werd er voor ‘depressieve stoornis’ geen significant verschil gevonden, X2 (2, n=76) = 1.35, p = .51. Hetzelfde geldt voor de aanwezigheid van overige depressieve klachten, ‘depressie NAO’, waarvoor X2 (2, n=75) = .79, p = .67. De twee groepen verschillen ook niet significant wat betreft pre- en postmeting voor ‘dysthyme stoornis’, X2 (2, n=76) = 2.82, p = .24 of ‘bipolair type I’, X2 (1, n=76) = .11, p = .74. Samenvattend kon op geen van de vijf SCID-I diagnoses een significant verschil worden gevonden. 3.2.2 Hypothese II: BDI-II, STAI en RRS Tijdens de voor- en nameting vulden de deelnemers drie vragenlijsten in die zijn ontworpen om de stemming te meten. De mate van een depressieve stemming werd gemeten door middel van Beck´s Depression Inventory (BDI-II). De State-Trait Anxiety Inventory (STAI) werd afgenomen om de aanwezigheid van een angstige stemming te meten en de Ruminative Respons Scale (RRS) om de mate van piekeren (‘rumineren’) te meten. Om deze vragenlijsten te analyseren werd een repeated measures ANOVA uitgevoerd waarin drie scores van vragenlijsten (BDI-II, STAI en RRS) op twee meetmomenten (pre en post) werden geanalyseerd, met als between subjects factor drie groepen (training-, placebo- en wachtgroep). Voor de BDI-II werd geen significant verschil gevonden tussen de verschilscores van de drie groepen, F(2, 76) = .62, p = .54. Dit was ook het geval voor de STAI, voor zowel de state-score F(2, 76) = .52, p = .60 als trait-score F(2, 76) = 1.07, p = .35 werd geen significant interactie-effect gevonden. Tevens kon er geen significant interactie-effect worden gevonden voor de scores op de RRS, F(2, 76) = .08, p = .93. Op geen van de drie vragenlijsten kon dus een significant verschil worden gevonden voor de drie groepen tussen pre- en postmeting. Tijdens het volgen van de werkgeheugentraining vulden de deelnemers de BDI-II, STAI en RRS ook wekelijks thuis in op de computer. Op deze manier zou specifieker kunnen worden vastgesteld
28
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
op welk moment een mogelijke verandering in stemmingsklachten zou plaatsvinden. Een repeated measures ANOVA werd uitgevoerd om dit te analyseren, met drie vragenlijsten (BDI-II, STAI en RRS), drie meetmomenten (na week 1, 2 en 3) en drie groepen (training-, placebo- en wachtgroep). De significantie van de interactie-effecten werd bekeken om te zien of de drie groepen verschilden op de verschilscores van de drie weken. Voor de BDI-II kon geen significant interactie-effect worden gevonden, F(3.27, 103.1) = 1.46, p = .23. Ook de scores van de drie groepen op de STAI verschilden niet significant op de drie meetmomenten, F(4, 126) = .70, p = .60. Tot slot kon er geen significant interactie-effect worden gevonden voor de RRS, F(3.38, 106.48) = .46, p = .73. Samenvattend kon op geen van de drie vragenlijsten een significant verschil worden gevonden voor de drie meetmomenten van de drie groepen.
3.3 Resultaten Hypothese III: ‘De effecten van de werkgeheugentraining zullen op lange termijn aanwezig zijn’ Deze hypothese heeft betrekking op de lange termijn effecten van de werkgeheugentraining. Hiervoor werd gekeken naar het verschil tussen de drie meetmomenten; pre- en post training en drie maanden na de training. Omdat de wachtgroep niet meedeed aan de follow-upmeting worden alleen de training- en placebogroep vergeleken, specifieker worden de interactie-effecten tussen deze twee groepen en de drie meetmomenten worden geanalyseerd. Allereerst worden de resultaten voor de werkgeheugentaken worden besproken, inclusief de taken die samen de werkgeheugentraining vormden, waarna wordt afgesloten met de indicaties voor klinische verbetering in depressieklachten. 3.3.1 Hypothese III: Reading Span De volgende vier variabelen werden geanalyseerd: het totaal aantal herinnerde sets, totaal aantal fouten, aantal correct onthouden letters en de totale score. Een repeated measures ANOVA met drie meetmomenten (pre, post en follow-up) en twee groepen (training- en placebogroep) resulteerde niet in een significant interactie-effect voor de vier scores. Voor het totaal aantal fouten verschilden de twee groepen niet significant op de drie meetmomenten, F(2,68) = 2.49, p = .09. Dit is ook het geval voor het totaal aantal herinnerde sets, F(1.82, 62.01) = 1.26, p = .29. Het aantal correct onthouden letters blijkt ook niet significant te verschillen tussen de twee groepen op de drie meetmomenten, F(2,68) = 1.08, p = .35. Tot slot blijkt er op de totale score van de Reading Span geen significant interactie effect te zijn, F(2,68) = .93, p = .40. De twee groepen verschillen dus op geen van de vier geanalyseerde variabalen significant op de drie meetmomenten.
29
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
3.3.2 Hypothese III: Digit Span Wederom werd gekeken naar de traditionele en maximale score wanneer de cijfers voorwaarts en achterwaarts werden aangeboden. Dit betekent dat een repeated measures ANOVA werd uitgevoerd met vier scores (voorwaarts en achterwaarts, beide traditioneel en maximaal), drie meetmomenten (pre, post en follow-up) en twee groepen (training- en placebogroep). Voor zowel de ‘voorwaarts traditionele score’ als de ‘voorwaarts maximale score’ werden geen significante interactie-effect gevonden, respectievelijk F(2, 68) = 1.21, p = .31 en F(2, 68) = .68, p = .51. Ditzelfde geldt voor de ‘achterwaarts traditionele score’ en de ‘achterwaarts maximale score’, respectievelijk F(2, 68) = 1.25, p = .29 en F(1.79, 60.79) = 1.13, p = .33. Op geen van de vier scores op de Digit Span verschilden de twee groepen significant op de drie meetmomenten. 3.3.3 Hypothese III: Interne Shift Taak Voor de lange termijn effecten van de IST werden de globale score en specifieker de scores voor de emotie- en geslachtwisseling geanalyseerd. Er werd een repeated measures ANOVA uitgevoerd met drie scores (‘globaal’, ‘emotie’ en ‘geslacht’), drie meetmomenten (pre, post en follow-up) en twee groepen (training- en placebogroep). De drie analyses konden geen significante interactie-effecten vinden, voor de ‘globale score’: F(2, 44) = .62, p = .55, ‘emotie score’: F(2, 54) = .30, p = .74 en ‘geslacht score’: F(2, 54) = 1.37, p = .26. 3.3.4 Hypothese III: Autobiographic Memory Test De lange termijn effecten van de AMT werden geanalyseerd door middel van een repeated measures ANOVA. De zeven scores (zes antwoord categorieën en de gemiddelde reactietijd) werden op drie meetmomenten (pre, post en follow-up) geanalyseerd voor twee groepen (training- en placebogroep), die als between subjects factor werden ingevoerd. Voor ‘AMT-score 1’, het aantal specifieke herinneringen, bleek dat er geen significant verschil was tussen de twee groepen voor de verschillen op de drie meetmomenten, F(2, 76) = .38, p = .68. Ook voor de variabele ‘AMT-score M’, het aantal categorische herinneringen, werd geen significant interactie-effect gevonden, F(2, 76) = .39, p = .68. Hetzelfde geldt voor ‘AMT-score GT’, het aantal niet-specifieke herinneringen, F(2, 76) = 1.24, p = .30. Ook voor de variabele ‘AMT-score NR’, geen respons van de deelnemer, kon geen significante interactie worden gevonden, F(1.42, 53.85 = 1.78, p = .19. Zo ook voor ‘AMT-score QM’, het aantal onduidelijke antwoorden, bleek F(2, 76) = 1.95, p = .15, aldus geen significante interactie tussen de twee groepen enerzijds en de drie meetmomenten anderzijds. Voor ‘AMT-score Z’, het aantal dezelfde herinneringen bleek F(1.77, 67.38) = 1.12, p = .33, wederom geen significant interactie-effect. Tot slot werd ook geen significant interactie-effect gevonden voor ‘AMT
30
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
gemiddelde reactietijd’, F(2, 76) = 1.51, p = .23. Voor geen van de zeven AMT-scores kon een significant verschil worden gevonden tussen de twee groepen op de drie meetmomenten. 3.3.5 Hypothese III: Werkgeheugentraining Om de lange termijn effecten van de werkgeheugentraining te toetsen is gekozen voor twee aparte repeated measures ANOVA, omdat er drie scores worden vergeleken en de twee groepen (trainingen placebogroep) niet precies dezelfde training volgden. Voor de Symmetry Span en de Duale N-back taak werden aparte analyses uitgevoerd waarvan de resultaten onderstaand zijn weergegeven. 3.3.6 Hypothese III: Symmetry Span De uitgevoerde repeated measures ANOVA toonde dat de deelnemers van de traininggroep significant verschillen op de drie scores van de variabele ´totale score´, F(2, 36) = 13.56, p = .00. Geplande contrasten (simpel, laatste meting als referentie) toont een significant verschil tussen preen follow-up, F(1, 18) = 17.09, p = .00, Zoals te zien in tabel 3 verbeterde de traininggroep significant van pre- naar follow-upmeting. Tussen post- en follow-upmeting werd geen significant verschil gevonden, F(1, 18) = .03, p = .87. Dit is ook het geval voor het totaal aantal onthouden sets, met een significante verandering tussen de drie scores, F(1.20, 21.51) = 5.87, p = .02. Van pre- naar followupmeting vond een significante verbetering plaats, F(1, 18) = 7.20, p = .02, maar van post- naar follow-upmeting niet, F(1, 18) = 1.03, p = .32 volgens geplande contrasten. Het hoogste niveau dat de deelnemers konden bereiken tijdens de training bleek ook significant te verschillen tussen de drie metingen F(2, 34) = 28.49, p = .00. Geplande contrasten toont hetzelfde patroon, een significante verbetering van pre- naar follow-upmeting, F(1, 17) = 32.69, p = .00, maar niet van post- naar followupmeting, F(1, 17) = 2.13, p = .16. Voor het aantal fouten kon geen significant verschil worden gevonden tussen pre-, post- en follow-upscores van de traininggroep, F(1.50, 27.02) = 2.46, p = .12. Wat betreft de variabele ‘PU score’, het percentage correct onthouden vierkanten, hier is ook geen significant verschil te zien tussen de drie scores van de traininggroep F(2, 36) = 2.84, p = .07. Samenvattend kan gesteld worden dat de traininggroep vooruit is gegaan op de follow-upmeting ten opzichte van de pre-meting wat betreft de totale score, het totaal aantal onthouden sets en het hoogst haalbare niveau op de Symmetry Span. Het totaal aantal fouten en het percentage correct onthouden vierkanten verschilt niet significant voor de drie meetmomenten. De placebogroep laat op de totale score van de Symmetry Span een significant verschil zien tussen pre-, post- en follow-upscores, F (2, 34) = 5.84, p =.00. Geplande contrasten wijzen uit dat het hierbij gaat om een significante verbetering van pre- naar follow-upmeting, F (1, 17) = 4.50, p = .05, maar niet tussen post- en follow-upmeting, F (1, 17) = .88, p = .36. De ‘PU score’, het percentage
31
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
correct onthouden vierkanten, verschilt ook significant op de drie meetmomenten, F (1.11, 19.96) = 26.75, p = .00. Hierbij verschillen zowel de pre- en follow-upmeting significant, F (1, 18) = 25.01, p = .00, als de post- en follow-upmeting, F (1, 18) = 29.34, p = .00. De gemiddelden in tabel 4 tonen echter dat het in beide gevallen gaat om een achteruitgang ten opzichte van de eerdere metingen, de scores op de pre- en postmeting waren significant hoger dan op de follow-upmeting. Dit geldt niet voor het totaal aantal onthouden sets, deze drie scores verschillen niet significant voor de placebogroep, F (1.50, 25.54) = 3.01, p = .08. Het totaal aantal gemaakte fouten op de Symmetry Span bleek ook niet significant te verschillen tussen pre-, post- en follow-upscores, F (2, 34) = .72, p = .49 van de placebogroep. Er werd geen t-toets worden uitgevoerd voor de variabele ‘hoogste niveau’ omdat de placebogroep nooit opliep in niveau. Samengevat blijkt dat de placebogroep vooruit is gegaan op de totale score, maar enkel tussen de pre- en follow-upmeting. Het percentage correct onthouden vierkanten ging significant achteruit voor zowel pre- als postmeting ten opzichte van de follow-upmeting. Het totaal aantal onthouden sets en het totaal aantal fouten veranderde niet significant. 3.3.7 Hypothese III: Duale N-back taak De uitgevoerde repeated measures ANOVA voor de duale N-back taak resulteerde in een significant verschil tussen de drie scores (pre-, post- en follow-up) van de traininggroep op het aantal ‘visuele hits’, F (1.46, 26.30) = 4.25, p = .04. Geplande contrasten tonen een significant verbetering van prenaar follow-upmeting, F (1, 18) = 5.09, p = .04, maar niet tussen de post- en follow-upmeting, F (1, 18) = .01, p = .94. Tabel 4 toont de gemiddelden en standaarddeviaties van deze scores. Ook het aantal ‘visuele missers’ verschilt significant voor de drie scores, F (1.46, 26.21) = 4.36, p = .03. Wederom wijzen geplande contrasten op een significante afname van het aantal missers tussen de pre- en follow-upmeting, F (1, 18) = 5.22, p = .04, maar niet tussen de post- en follow-upmeting, F (1, 18) = .01, p = .94. Daarnaast werd een significant verschil gevonden tussen de drie scores van het hoogste niveau dat de deelnemers van de traininggroep behaalden op de duale N-back taak, F (1.50, 26.98) = 23.68, p = .01. Ook hier tonen geplande contrasten een significante verbetering van prenaar follow-upmeting, F (1, 18) = 29.27, p = .00, maar tussen de post- en follow-upmeting werd geen significant verschil gevonden, F (1, 18) = .19, p = .67. Er kon geen verschil worden gevonden voor het aantal keren dat de traininggroep ‘visueel vals alarm’ sloeg op de duale N-back taak, F (2, 36) = .34, p = .71. Daarnaast werd er voor de variabele ‘visueel correcte afwijzing’ geen significant verschil gevonden tussen pre-, post- en follow-upscores, F (2, 36) = .49, p = .62. Wanneer wordt gekeken naar de auditieve stimuli kan geen enkel significant verschil worden vastgesteld. Het aantal auditieve hits verschilt niet significant tussen de drie metingen, F (1.54, 27.80)
32
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
= 1.38, p = .26, net zoals het aantal ‘auditieve missers’: F (1.67, 29.99) = 1.47, p = .25, het aantal keren ‘auditief vals alarm’: F (1.17, 21.01) = 1.52, p = .24 en het aantal keren ‘auditief correcte afwijzing’: F (2, 36) = 1.65, p = .21. Samengevat ging de traininggroep op de pre-scores van de visuele hits, visuele missers en het hoogst haalbare niveau vooruit ten opzichte van de follow-upscores, maar niet wanneer de post-scores met follow-upscores werden vergeleken via de geplande contrasten. Het aantal keren visueel vals alarm, correcte afwijzingen en alle vier de auditieve metingen bleek veranderde niet. Zoals eerder beschreven, volgde de placebogroep een aangepaste duale N-back taak, waarbij de moeilijkheid niet opliep omdat de referentiestimuli altijd hetzelfde bleef. Van het aantal ‘visuele hits’ en het aantal ‘visuele missers’ verschillen de drie scores significant, F (1.44, 26.00) = 4.69, p =. 03. Geplande contrasten toont echter geen significant verschil tussen follow-up en pre-scores, F (1, 18) = 2.10, p = .17 of tussen follow-up en post-scores, F (1, 18) = 3.59, p = .07. Deze twee variabelen hebben dezelfde uitkomst omdat het niveau van de duale N-back nooit opliep, waardoor er altijd sprake is van enerzijds een hit of anderzijds een misser. Dit geldt ook voor de variabelen ‘visueel vals alarm’ en ‘visueel correcte afwijzing’, F (2, 36) = 2.78, p = .08. Wederom leveren de geplande contrasten geen significante verschillen op tussen follow-up en pre-scores, F (1, 18) = .35, p = .57 of tussen follow-up en post-scores, F (1, 18) = 2.82, p = .11. Voor de auditieve stimuli werden soortgelijke resultaten gevonden als voor de visuele stimuli. Een significante verandering vond plaats in het aantal ‘auditieve hits’ en ‘auditieve missers’, beide F (1.14, 20.55) = 6.57, p = .02. Geplande contrasten leveren een significante verbeteringen ten opzichte van de follow-upmeting F (1, 18) = 5.41, p = .03 voor de pre-meting maar niet ten opzichte van de postmeting, F (1, 18) = 1.93, p = .18. Dit is terug te zien in tabel 4; de placebogroep heeft een hoger gemiddeld aantal ‘auditieve hits’ op de follow-upmeting dan op de premeting, maar gemiddeld een lager aantal ‘auditieve missers’ op de follow-upmeting ten opzichte van de premeting. Daarnaast verschillen de pre-, post- en follow-upscores van de placebogroep significant op de variabelen ‘auditief vals alarm’ en ‘auditief correcte afwijzing’, beide F (1.17, 21.01) = 16.20, p = .00. Geplande contrasten toont wederom een significante verbetering voor ‘auditief vals alarm’ en afname voor ‘auditief correcte afwijzing’ op de follow-upscores ten opzichte van de pre-scores, F (1, 18) = 13.09, p = .00, maar er werd geen significant verschil gevonden tussen de post- en follow-upscores, F (1, 18) = 1.70, p = .21. Samengevat werd er voor de placebogroep op elk van de variabelen een significant verschil gevonden tussen de drie meetmomenten. Bij benadering bleek er voor de visuele variabelen geen verschil tussen pre- en postmeting enerzijds en follow-upmeting anderzijds. Wat betreft de auditieve variabelen werd een significante verbetering gevonden van de pre- naar de followupmeting.
33
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
3.3.8 Hypothese III: SCID-I Diagnoses Opnieuw werden de vijf SCID-I diagnoses geanalyseerd: ‘depressie nu’, ‘depressieve stoornis’, ‘depressie NAO’, ‘dysthyme stoornis’ en ‘bipolair type I’. De uitgevoerde Chi-kwadraattoets bevatte deze vijf scores, twee groepen (training en placebogroep) en de drie meetmomenten (pre, post en follow-up). Voor de diagnose ‘depressie nu’ bleken de twee groepen niet significant te verschillen tijdens het verloop van de drie metingen, X2 (5, n=16) = 8.67, p > .05. Ditzelfde geldt voor de diagnose ‘depressieve stoornis’, de twee groepen verschillen niet significant op de drie metingen, X2 (4, n=31) = 2.46, p > .05. Voor de diagnose ‘depressie NAO’, werd geen significant interactie-effect gevonden, X2 (4, n= 2) = 1.04, p >.05. Eveneens leverde de analyse voor ‘dysthyme stoornis’ geen significant interactie-effect op, X2 (4, n=1) = 3.95, p >.05, net zoals de groepen niet significant verschilden voor de diagnose ‘bipolair type I’ X2 (4, n=2) = 6.48, p >.05, op de drie meetmomenten. Dit betekent dat op alle vijf diagnoses non-significante interactie-effecten worden vastgesteld. 3.3.9 Hypothese III: BDI-II, STAI en RRS Om te zien of er op de lange termijn verschil was in zelfgerapporteerde stemming, werden de vragenlijsten die de deelnemers tijdens de metingen invulden geanalyseerd door middel van een repeated measures ANOVA. Deze analyse bevatte drie scores van de vragenlijsten (BDI-II, STAI en RRS), twee groepen (training- en placebogroep) en drie meetmomenten (pre, post en follow-up). Op de BDI-II, een vragenlijst die de mate van depressieve stemming meet, werd geen significant interactie-effect gevonden, F(1.23, 46.53) = .14, p = .76. Ook op de STAI, een vragenlijst die angstige stemming meet, verschilden de twee groepen niet significant op de drie meetmomenten, F(1.40, 53.35) = .37, p = .62. Ditzelfde bleek het geval voor de RRS, F(1.23, 46.58) = .28, p = .65, aldus geen significant interactie-effect. Voor geen van de drie vragenlijsten werd een significant interactie-effect gevonden.
34
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
4. Discussie In deze studie werd de effectiviteit van een werkgeheugentraining onderzocht als alternatieve behandelmethode tegen depressie. Onderzoek toonde namelijk zowel specifieke als algemene gebreken in het werkgeheugen van patiënten met een depressie (Harvey et al., 2004; Joormann 2004; Joormannn & Gotlib 2008; Levens & Gotlib; 2010). Door middel van drie hypothesen werd bekeken of de training zorgde voor een verbetering in het werkgeheugen, verbetering van psychische klachten en of deze verbeteringen op lange termijn ook nog aanwezig waren. Hieronder zullen de resultaten worden samengevat en geïnterpreteerd aan de hand van bestaande literatuur. 4.1 Effecten Werkgeheugentaken De traininggroep liet op geen van de gemeten werkgeheugen-transfer-taken significant meer verbetering zien dan de placebogroep, met uitzondering van één van de vier gemeten scores op één van de vier taken. De transfer van de getrainde taken naar ongetrainde taken is dus niet dermate aanwezig dat het de experimentele groep van de placebogroep kon onderscheiden. Logischerwijs kan men hieruit concluderen dat de experimentele training er niet in slaagde om het werkgeheugen zodanig te trainen dat deze effecten generaliseerbaar waren naar andere functies. Een andere verklaring hiervoor is dat er bij beide groepen een transfer plaats vond, maar dit lijkt geen gepaste verklaring aangezien de placebogroep geen echte training onderging. De training van de placebogroep ging immers nooit vooruit in niveau en zou volgens Morrison en Chein (2011) dus eerder als oppervlakkige training worden gecategoriseerd waarbij geen diepe transfer mogelijk is. Uit het gebrek aan transfer naar ongetrainde taken kan nog niet worden geconcludeerd dat de werkgeheugentraining geen effect had, daarvoor moet ook worden gekeken naar de prestaties van de twee groepen op de trainingtaken zelf. De traininggroep ging vooruit op bijna alle variabelen van de Symmetry Span en op drie van de negen scores van de Duale N-back taak. De vooruitgang van de traininggroep is niet onverwacht, onderzoek van Klingberg, Forssberg en Westerberg toonde in 2002 ook al de trainbaarheid van het werkgeheugen door middel van een vijf wekelijkse training. De placebogroep ging echter vooruit op dezelfde scores en toonde daarnaast ook vooruitgang op vijf andere scores van de Duale N-back taak, met uitzondering van één score die voor deze groep niet kon worden gemeten. Deze vooruitgang is ook niet onverwacht, aangezien het niveau voor de placebogroep nooit opliep in moeilijkheid. De placebogroep trainde hoogstwaarschijnlijk dus niet het werkgeheugen, maar toonde vooruitgang omdat zij structureel een taak oefende die nooit moeilijker werd. Wanneer de prestaties van de twee groepen op de transfertaken worden vergeleken met de wachtgroep vallen een aantal resultaten op. Aan de ene kant wordt op één score een verbetering van
35
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
training- en placebogroep gevonden ten opzichte van de wachtgroep. Beide groepen (training- en placebo) gingen dus sterker vooruit dan de wachtgroep op deze score. Dit kon worden verwacht omdat er geen verschil werd gevonden tussen de training- en placebogroep op de ongetrainde transfer-taken. Anderzijds suggereert dit dat er voor beide groepen die een training volgde (zowel experimenteel als placebo) een transfer plaatsvond. Deze transfer moet dan wel minimaal worden genoemd aangezien het slechts één score betrof. Daarnaast vond eerder genoemd onderzoek van Klingberg, Forssberg en Westerberg (2002) enkel een transfer bij de traininggroep en niet bij de controle groep. Ditzelfde geldt voor een onderzoek naar het effect van een werkgeheugentraining op vloeibare intelligentie (Jaeggi, Buschkuehl, Jonides & Perrig, 2008), waar de controle groep ook geen transfer toonde. Aan de andere kant valt ook op dat de wachtgroep op twee scores sterker vooruitging dan de traininggroep en op één score daarvan ook meer verbetering toonde ten opzichte van de placebogroep. Deze bevinding spreekt een mogelijke transfer tegen en suggereert dat een training van vier weken niet nodig is om verbetering te bereiken op de transfertaken. Anderzijds gaat het hier om twee scores op één van de vier taken dus zou deze conclusie te voorbarig kunnen worden genoemd. Het feit dat de wachtgroep uit een klein aantal deelnemers (N = 10) bestond zou ook een verklaring kunnen zijn voor deze opvallende bevindingen. De resultaten van de wachtgroep op de werkgeheugentraining-taken kunnen mogelijk meer inzicht geven. Wanneer deze resultaten worden bekeken komen geen verbeteringen naar voren ten opzichte van de pre- naar postmeting. Deze bevinding kan op meerdere manieren worden uitgelegd. Wanneer er puur naar de scores wordt gekeken, lijkt het erop dat training- en placebogroep werden getraind op de twee genoemde taken, maar de wachtgroep niet. Immers de training- en placebogroep gingen wel vooruit op deze taken, maar de wachtgroep verbeterde niet in hun prestaties op deze taken. Er zou ook kunnen worden gesteld dat de stemming van de patiënten ten tijde van de pre- en postmeting invloed heeft gehad op de prestatie op de twee taken. In dat geval zou beargumenteerd kunnen worden dat de placebogroep baat had bij het wekelijks contact, het gevoel van steun en het idee behandeld te worden. Dit zou mogelijk hebben geleid tot verbeteringen op de getrainde taken via een verbetering in depressieve klachten. Hiervoor zou echter het causale verband tussen depressieve klachten en gebreken in het werkgeheugen nader moeten worden onderzocht. Het onderzoek van De Raedt en Koster (2010) wijst op een verstoorde HPA-as bij mensen die kwetsbaar zijn voor het ontwikkelen van een depressie, maar geeft geen uitsluitsel of de HPA-as weer herstelt wanneer de klachten verminderen. Onderstaande bevindingen over de invloed van de werkgeheugentraining op de depressieve symptomatologie kunnen ook meer licht werpen op
36
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
de validiteit van deze verklaring. Daarnaast is het redelijk om aan te nemen dat er altijd fluctuaties voorkomen in depressieve klachten (Kessler, Zhao, Blazer & Swartz 1997). Het gebrek aan verbetering van de wachtgroep wijst erop dat het niet waarschijnlijk is dat de verbetering van de placebogroep enkel te wijden is aan een normaal fluctuerend patroon van depressieve klachten. Nu volgen de resultaten van de invloed van de werkgeheugentraining op de stemmingsproblematiek van de patiënten. 4.2 Effecten in Depressieve Symptomatologie Op geen van de vijf geanalyseerde diagnosen van de SCID-I toonde de traininggroep een grotere verbetering dan de placebogroep, bij de wachtgroep werd geen SCID-I afgenomen. Dit betekent dat de experimentele training er na vier weken niet in slaagde om een zodanig succesvolle behandeling te bieden aan de experimentele groep dat deze groep kon worden onderscheiden van de placebogroep. Hiervoor zijn een aantal verklaringen mogelijk. Ten eerste vormt de eerder genoemde minimale transfer naar ongetrainde taken een aanwijzing dat er geen structurele werkgeheugenveranderingen hebben plaatsgevonden. Het gebrek aan een grote, diepliggende verandering van de onderliggende mechanismen van depressieve problematiek zou kunnen verklaren dat de klachten niet verminderden na de experimentele training. Ten tweede zou het gebruikte meetinstrument geen ruimte kunnen hebben gelaten voor veranderingen in de intensiviteit en draaglast van de symptomen omdat enkel de aan- en afwezigheid van diagnoses werden geanalyseerd. Deze verklaring werd onderzocht door ook de stemmingsvragenlijsten die werden afgenomen te analyseren. Op geen van de drie vragenlijsten toonde de traininggroep echter een sterkere verbetering dan de placebogroep, ook niet wanneer er specifieker werd gekeken naar de drie wekelijkse meetmomenten van de vragenlijsten. Deze bevinding geeft meer uitsluitsel over de invloed van de gebruikte meetinstrumenten op het gebrek aan vooruitgang in depressieve symptomatologie. De stemmingsklachten werden namelijk wekelijks gemeten door zelfrapportage vragenlijsten en daarnaast werd een klinisch diagnostisch interview afgenomen, voor en na de werkgeheugentraining. Echter op geen van deze meetinstrumenten kon een verschil worden waargenomen tussen de training- en placebogroep. Daarnaast werd de wachtgroep ook meegenomen in de analyse van de stemmingsvragenlijsten. Er werd geen verschil gevonden tussen de drie groepen in de mate dat hun stemmingsproblematiek (zoals gemeten door de stemmingsvragenlijsten) veranderde tussen de meetmomenten. Een derde verklaring voor het uitblijven van verbeteringen in depressieve symptomatologie zou kunnen voortkomen uit de complexiteit van het werkgeheugenproces. Joormann vond in 2010 dat rumineren (of piekeren) het herstel van een depressieve stemming belemmert omdat negatief materiaal hierdoor langer aanwezig blijft in het werkgeheugen. Aan de hand van dit onderzoek zou er
37
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
beredeneerd kunnen worden dat de positieve verandering in symptomen een langer durend proces is. Het negatieve materiaal blijft immers volgens Joormann (2010) langer aanwezig in het werkgeheugen en zou daardoor verbetering op korte termijn kunnen belemmeren. Mogelijk zou een langer durende werkgeheugentraining hier meer uitkomst kunnen bieden. Deze conclusie levert gelijk meer inzicht in de resultaten van de eerste hypothese. Als mogelijke verklaring voor de verbetering die de placebogroep toonde op de getrainde taken werd beredeneerd dat deze groep mogelijk baat had bij het idee dat zij behandeld werden. De wachtgroep toonde namelijk geen verbetering op deze taken. Gevoelens van hoop en steun bij de placebogroep hadden kunnen resulteren in een verbeterde werkgeheugencapaciteit via een afname van depressieve klachten, echter de zojuist besproken bevindingen over het uitblijven van een verbeterd klachtenpatroon ten opzichte van de andere twee groepen spreken dit tegen. De traininggroep verschilde immers niet van de placebo- en wachtgroep in depressieve symptomatologie op zowel korte- als lange termijn. Nu zullen de lange termijn effecten van de training op de werkgeheugentaken nader worden besproken. 4.3 Lange Termijn Effecten Werkgeheugentaken Een follow-up meting werd na drie maanden uitgevoerd om de lange termijn effecten van de werkgeheugentraining te onderzoeken. Op geen van de transfertaken bleek de traininggroep op lange termijn superieur ten opzichte van de placebogroep. Al slaagde de experimentele training er op korte termijn nog in om een minimale transfer teweeg te brengen, deze effecten konden op lange termijn niet meer worden gevonden. Het uitblijven van een transfer naar ongetrainde taken op de lange termijn zou kunnen worden verklaard doordat de training niet voldoende beroep deed op de complexe functies van het werkgeheugen, dit blijkt ook uit de minimale transfer op korte termijn. Wanneer wordt gekeken naar de getrainde taken, dan blijkt dat de traininggroep op langere termijn nog verbetering toonde op drie van de vijf scores op de Symmetry Span en op drie van de negen scores op de Duale N-back taak. Hierbij moet echter worden benadrukt dat de verbetering in follow-upscores plaatsvond ten opzichte van de pre-meting, maar niet ten opzichte van de postmeting. De initiële verbetering die wordt veroorzaakt door de experimentele training is op lange termijn dus nog steeds meetbaar, maar na het eindigen van de training vindt er geen verdere verbetering plaats. Dit suggereert dat de verbetering in werkgeheugencapaciteit stabiel blijft. Een training is dus nodig om te verbeteren in prestatie, maar na het stoppen van de training lijkt de prestatie op hetzelfde niveau te blijven. Mogelijk was de traininggroep de aangeleerde strategieën en tactieken tijdens de follow-upmeting dus nog niet vergeten. Een follow-upmeting op een nog langere termijn zou kunnen uitwijzen of de prestaties weer terug gaan naar het eerdere niveau of blijvend zijn.
38
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
Om deze resultaten beter te kunnen interpreteren is het ook belangrijk om te kijken naar de lange termijn effecten voor de placebogroep. De placebogroep ging vooruit op twee van de vijf scores op de Symmetry Span en vier van de acht scores op de Duale N-back taak. Voor bijna alle verbeteringen gold dat deze plaats vonden tussen de pre- en follow-upmeting. Hiervoor kan dezelfde verklaring worden gegeven als voor de traininggroep; na langere tijd wist de placebogroep mogelijk nog steeds hoe zij de taken het beste konden aanpakken. Daarbij moet worden opgemerkt dat deze strategieën voor de placebogroep aanzienlijk minder complex waren; de taken liepen immers nooit op in moeilijkheid. Dit zou mogelijk ook een andere opvallende bevinding kunnen verklaren. De placebogroep verbeterde namelijk ook op één van de scores tussen post- en follow-upmeting. Naast de simpelheid van de placebotraining hebben mogelijk ook andere factoren, zoals het tijdstip van afname hierin een rol gespeeld. Patiënten met depressieve stoornis hebben veelal last van klachten in de ochtend, zo stellen onderzoekers dat depressie met melancholische kenmerken vaak wordt gekenmerkt door een negatieve affectieve staat in de ochtend (Besiroglu, Agargun & Inci, 2005). Mogelijk kwamen de deelnemers van de placebogroep op de follow-upmeting vaker op tijdstippen na de ochtend ten opzichte van de andere meting, maar aan de andere kant geldt deze variatie in tijdstippen ook voor de deelnemers van de traininggroep. Bovendien suggereert recenter onderzoek (Wirz-Justice, 2008) dat het circadiaan ritme op meerdere punten verstoord kan zijn, waarbij depressieve patiënten zowel in de ochtend, middag als avond een dip in hun stemming kunnen ervaren. Deze variatie in invloed van tijd op stemming doet de invloed van tijdstip van afname op prestaties op de gemeten taken verwaarloosbaar lijken. 4.4 Overall conclusie De conclusie kan worden uitgesplitst naar korte- en lange termijn resultaten. De korte termijn resultaten, die na vier weken werden gemeten, kunnen wederom worden uitgesplitst naar transferen trainingtaken. Enkel op één score van één transfertaak toonde de traininggroep significant meer verbetering dan de placebogroep, op de overige scores werd geen verschil gevonden. De analyses van de wachtgroep toont gemengde resultaten, met zowel significante vooruit- als achteruitgang ten opzichte van de andere twee groepen. Op de trainingtaken gingen zowel de training- als placebogroep vooruit op de meeste scores, maar de wachtgroep niet. Ook verschilden de drie groepen niet in stemmingsklachten. De werkgeheugentraining slaagde er op korte termijn dus niet overtuigend in om de traininggroep te onderscheiden van zowel placebo- als wachtgroep. Drie maanden later werd een deel van de training- en placebogroep nogmaals vergeleken. Wederom werd geen verschil gevonden tussen de depressieve klachten. Ook kon er op geen van de transfertaken verschil worden gevonden tussen de twee groepen. Wel gingen beide groepen vooruit
39
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
op de getrainde taken, maar enkel ten opzichte van de premeting. Bovenstaande bevindingen duiden erop dat de werkgeheugentraining enkel op de getrainde taken verbetering toonde, maar niet zodanig verbetering kon bewerkstelligen in transfertaken en depressieve klachten dat het als een alternatieve behandelmethode voor depressie kan worden beschouwd. 4.5 Mogelijke valkuilen Een aantal kritische opmerkingen kunnen geplaatst worden bij de dataset. Ten eerste valt op dat de man-vrouw verhouding bij de training- en placebogroep niet exact hetzelfde zijn, ruwweg bestaat de placebogroep voor twee derde uit mannen en de traininggroep voor twee derde uit vrouwen. Omdat beide variabelen (geslacht en groep) op nominaal niveau zijn gemeten werd een Chi-kwadraat toets uitgevoerd. Hieruit blijkt dat de man-vrouw verhouding significant verschilde tussen de twee groepen, X2 (2, n=110) = 5.4, p = .02. Dit is mogelijk een probleem voor de interpretatie van de uitkomsten, omdat vrouwen bijna twee keer zo vaak last hebben van een depressie als mannen (Kessler, 2003). De oorzaak hiervoor ligt volgens Nolen-Hoeksema (2001) aan de grotere reactiviteit van vrouwen op gelijke stressoren in vergelijking met mannen. Hierbij gaat het met name om life events zoals (seksueel) misbruik en/of trauma’s, waar vrouwen door gebrek aan ‘sociale power’ vaker aan worden blootgesteld. Door deze grotere reactiviteit van vrouwen samen met een hogere frequentie van blootstelling aan life events is er mogelijk een ander mechanisme bij vrouwen dan bij mannen verantwoordelijk voor de depressie. Het vergelijken van een traininggroep die significant meer vrouwen bevatte met een placebogroep die meer significant meer mannen bevatte zou daarom de generaliseerbaarheid van de resultaten kunnen bemoeilijken. Daarnaast is het opvallend dat een kwart van de deelnemers tijdens de pre-meting aangaf dat zij op dat moment een bepaalde vorm van therapie volgde. Dit maakt het complex om de resultaten van de werkgeheugentraining op zichzelf te kunnen interpreteren, omdat andere vormen van therapie deze resultaten mogelijk versterkt of verzwakt kunnen hebben. Tijdens gesprekstherapie worden immers veel dingen besproken die een tijdelijk negatieve stemming kunnen verergeren (bijvoorbeeld herinneringen aan jeugdtrauma’s). Hetzelfde geldt voor de invloed van medicatie-gebruik op de effectiviteit van de werkgeheugentraining, meer dan de helft van de totale dataset gebruikte medicatie ten tijde van de training. De invloed van eerder genoemde bijwerkingen van antidepressiva (Hollon, Thase & Markowitz, 2002) is bovendien nog niet onderzocht in combinatie met werkgeheugentrainingen. Bij de analyse van de resultaten van deze studie werd al eerder genoemd dat de werkgeheugentraining wellicht niet de juiste experimentele training was. Er vond immers een minimale transfer van getrainde naar ongetrainde taken plaats. Zoals Morrison en Chein (2011)
40
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
uitlegden is er pas sprake is van een ‘kerntraining’ wanneer deze resulteert in een diepe transfer die niet alleen zorgt voor verbetering op de getrainde taken, maar ook op bredere taken die het werkgeheugen zouden trainen. Morrison en Chein (2011) beschouwen de duale N-back taak als een kerntraining omdat deze taak meerdere dimensies overkoepelt, er is sprake van interferentie, het doet in hoge mate beroep op cognitieve werklading (een constante ‘update’ is vereist) en beperkt op deze manier het gebruik van domeinspecifieke strategieën. De Symmetry Span wordt door deze auteurs niet specifiek genoemd als een voorbeeld van een kerntraining. Dit roept de vraag op of deze taak mogelijk beter past onder de ‘strategietraining’. Bij strategietraining is er sprake van het groeperen van informatie (‘chunking’), het gebruiken van verbeelding en herhaling. Omdat hiervoor hele specifieke strategieën nodig zijn resulteert dit niet in een transfer naar andere ongerelateerde werkgeheugentaken. Inzicht in de gebruikte strategieën door de deelnemers zou dan ook meer opheldering kunnen geven over de effectiviteit van de Symmetry Span. Mogelijk zou de intensiviteit en duur van de training ook van invloed kunnen zijn geweest. Dit onderzoek trainde vier weken lang de deelnemers, maar in andere onderzoeken werd een training toegepast die vijf weken duurde en daar konden wel significante transfer-effecten worden vastgesteld (Klingberg, Forssberg & Westerberg, 2002; Jaeggi, Buschkuehl, Jonides & Perrig, 2008). 4.6 Vervolgonderzoek Olesen, Westerberg en Klingberg (2004) toonden door middel van fMRI aan dat een werkgeheugentraining van vijf weken een verhoogde activiteit teweeg bracht in specifieke hersenonderdelen bij patiënten met ADHD. Ook kon er een verandering in hersenchemie worden waargenomen na een werkgeheugentraining van vijf weken bij deze patiënten (McNab et al., 2009). Vervolgonderzoek zou gebruik kunnen maken van fMRI bij depressieve patiënten om meer inzicht te geven in de hersenmechanismen die bij deze patiënten in werking zijn om meer uitsluitsel te geven over de effectiviteit van een werkgeheugentraining. Aangezien er in de genoemde onderzoeken jonge patiënten werden onderzocht zou het ook relevant zijn om de invloed van leeftijd op de trainbaarheid van het werkgeheugen te onderzoeken. De leeftijdsrange in het huidige onderzoek was namelijk vrij breed, de jongste deelnemer was 25 jaar en de oudste deelnemer 65 jaar (de gemiddelde leeftijd was 45,5 jaar). Logischerwijs zou beargumenteerd kunnen worden dat jongere individuen een sneller werkgeheugen hebben en daardoor misschien ook sneller getraind kunnen worden, echter onderzoek naar het werkgeheugen bij verschillende leeftijden wijst op tegenstrijdige resultaten. Zowel onder- als overactiviteit van oudere individuen ten opzichte van jongere individuen wordt gerapporteerd (Nagel & Lindenberger, 2014). Leeftijd is dus een interessant onderwerp om in de toekomst meer aandacht aan te besteden
41
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
wanneer de effectiviteit van werkgeheugentraining bij depressieve patiënten wordt onderzocht. Voor het huidige onderzoek werd al eerder genoemd dat veel deelnemers ten tijde van onderzoek ook nog andere behandelingen volgden, waarvan de meerderheid een vorm van gesprekstherapie (meer dan een kwart van de totale dataset). Het eerder besproken CRT (cognitieve remediatie therapie; Medalia, Revheim & Herlands, 2009), combineert gesprekstherapie met werkgeheugentaken en dat leidde bij patiënten met een eetstoornis en patiënten met schizofrenie tot positieve resultaten (Tchanturia, Davies & Campbell, 2007; Wykes et al., 1999). Deze positieve resultaten zouden een reden kunnen zijn om de combinatie van gesprekstherapie en een werkgeheugentraining te onderzoeken, waarbij vanzelfsprekend aandacht moet zijn voor de toegevoegde waarde van de werkgeheugentaken. Bovendien werd er bij schizofrenie patiënten ook een verandering in activatie van hersengebieden gevonden, die correleerde met de verbeteringen in prestaties (Wexler, Anderson, Fulbright & Gore, 2000). Wederom zou fMRI onderzoek hier dan ook meer uitkomst kunnen bieden.
42
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
5. Referenties Abramson, L. Y., Metalsky, F. I., & Alloy, L. B. (1989). Hopelessness depression: A theory based subtype of depression. Psychological Review, 96(2), 358-372. American Psychiatric Association. (2013). The Diagnostic and Statistical Manual of Mental Disorders: DSM 5. bookpointUS. Barnes, L.L.B., Harp, D. & Jung, W.S. (2002). Reliability generalization of scores on the Spielberger state-trait anxiety inventory. Educational and Psychological Measurement, 62, 603-618. Beck, A. T. (1967). Depression: Causes and treatment. Philadelphia: University of Pennsylvania Press. Beck, A.T., Rush, A.J., Shaw, B.F. & Emery, G. (1979). Cognitive therapy of depression. New York: Guilford Press. Beck, A.T., Steer, R.A. & Brown, G.K. (1996). Beck Depression Inventory-Second Edition manual. San Antonio, TX: The Psychological Corporation. Beck, A.T., Ward, C.H., Mendelson, M., Mock, J., & Erbaugh, J. (1961). An inventory for measuring depression. Archives of general psychiatry, 4, 561-571. Besiroglu, L., Agargun, M.Y., Inci, R., 2005. Nightmares and terminal insomnia in depressed patients with and without melancholic features. Psychiatry Res. 28, 285–287. Butler, A. C., Chapman, J. E., Forman, E. M., & Beck, A. T. (2006). The empirical status of cognitive behavioral therapy: a review of meta-analyses. Clinical psychology review, 26(1), 17-31. Chambers, R., Lo, B. C. Y., & Allen, N. B. (2008). The impact of intensive mindfulness training on attentional control, cognitive style, and affect. Cognitive Therapy and Research, 32, 303–322. Conway, A. R. A., Kane, M. J., Bunting, M. F., Hambrick, D. Z., Wilhelm, O., & Engle, R. W. (2005). Working memory span tasks: A methodological review and user's guide. Psychonomic Bulletin and Review, 12, 769-786. Cuijpers, P., Smit, F., Bohlmeijer, E.T., Hollon, S.D. & Andersson, G. (2010). Efficacy of cognitive behavioral therapy and other psychological treatments for adult depression: overestimated meta-analytic study of publication bias. British Journal of Psychiatry, 196, 173-178. Cuijpers, P., Geraedts, A. S., van Oppen, P., Andersson, G., Markowitz, J. C., & van Straten, A. (2011). Interpersonal psychotherapy for depression: a meta-analysis. American Journal of Psychiatry, 168(6), 581-592.
43
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
Daneman, M., & Carpenter, P.A. (1980). Individual differences in WM and reading. Journal of Verbal Learning and Verbal Behavior, 19, 450–466. De Lissnyder, E., Koster, E.H.W. & De Raedt, R. (2011). Emotional interference in working memory is related to rumination. Cognitive therapy and research, 10, 264-280. De Raedt, R., & Koster, E. H.W. (2010). Understanding vulnerability for depression from a cognitive neuroscience perspective: A reappraisal of attentional factors and a new conceptual framework. Cognitive, Affective, and Behavioral Neuroscience, 10, 50-70. Engle, R. W., Tuholski, S. W., Laughlin, J. E., & Conway, A. R. (1999). Working memory, short-term memory, and general fluid intelligence: a latent-variable approach. Journal of Experimental Psychology: General, 128(3), 309. Field, A. (2009). Discovering statistics using SPSS. Sage publications. Fry, A. F., & Hale, S. (1996). Processing speed, working memory, and fluid intelligence: Evidence for a developmental cascade. Psychological science, 7(4), 237-241. Goeleven, E., De Raedt, R., Baert, S., & Koster, E. H. W. (2006). Deficient inhibition of emotional information in depression. Journal of Affective Disorders, 93, 149–157. Gommer A.M., Poos M.J.J.C., Hoeymans N. (2010). Verloren levensjaren, ziekte en ziektelast voor 56 geselecteerde aandoeningen. In: Volksgezondheid Toekomst Verkenning, Nationaal Kompas Volksgezondheid. Bilthoven: RIVM. Gorman, J. M. (1996). Comorbid depression and anxiety spectrum disorders. Depression and Anxiety, 4(4), 160-168. Graaf, de, R., Ten Have, M., Van Dorsselaer, S. (2010). NEMESIS-2: De psychische gezondheid van de Nederlandse bevolking. Opzet en eerste resultaten. Utrecht: Trimbos-instituut. Harvey, P.O., Le Bastard, G., Pochon, J.B., Levy, R., Allilaire, J.F., Dubois, B. & Fossati, P. (2004). Executive functions and updating of the contents of working memory in unipolair depression. Journal of Psychiatrisch Research, 38, 567-576. Hockey, A. & Geffen, G. (2004). The concurrent validity and test-retest reliability of a visuospatial working memory task. Intelligence, 32, 591-605. Hollon, S. D., DeRubeis, R. J., Shelton, R. C., Amsterdam, J. D., Salomon, R. M., O’Reardon, J. P., et al. (2005). Prevention of relapse following cognitive therapy versus medications in moderate to severe depression. Archives of General Psychiatry, 62, 417–422. Hollon, S.D., Thase, M.E. & Markowitz, J.C. (2002). Treatment and prevention of depression. Psychological Science in the Public Interest, 3, 39-77.
44
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
Imber SD, Pilkonis PA, Sotsky SM, Elkin I, Watkins JT, et al. 1990. Mode-specific effects among three treatments for depression. Journal of Consulting and Clinical Psychology, 58, 352–359 Jaeggi, S.M., Buschkuehl, M., Jonides, J. & Perrig, W. (2008). Improving fluid intelligence with training on working memory. Proceedings of the National Academy of Sciences, 105, 6829-6833. Jaeggi, S.M., Studer-Luethi, B., Buschkuehl, M., Su, Y., Jonides, J. & Perrig, W.J. (2010). The relationship between n-back performance and matrix reasoning – implications for training and transfer. Intelligence, 38, 625-635. Joormann, J. (2004). Attentional bias in dysphoria: The role of inhibitory processes. Cognition and Emotion, 18, 125–147. Joormannn, J. & Gotlib, I.H. (2008). Updating the contents of working memory in depression: Interference from irrelevant negative material. Journal of Abnormal Psychology, 117, 182- 192. Joormann, J. (2010). Cognitive Inhibition and Emotion Regulation in Depression. Current Directions in Psychological Science, 19, 161-166. Kane, M. J., Hambrick, D. Z., Tuholski, S. W., Wilhelm, O., Payne, T. W., & Engle, R. W. (2004). The generality of working memory capacity: A latent variable approach to verbal and visuospatial memory span and reasoning. Journal of Experimental Psychology: General, 133, 189-217. Kessler, R. C. (2003). Epidemiology of women and depression. Journal of affective disorders, 74(1), 513. Kessler, R. C., Zhao, S., Blazer, D. G., & Swartz, M. (1997). Prevalence, correlates, and course of minor depression and major depression in the National Comorbidity Survey. Journal of affective disorders, 45(1-2), 19-30. Klerman, G. L., Weissman, M. M., Rounsaville, B. J., & Chevron, E. S. (1984).Interpersonal Psychotherapy of depression. Basic Books. Klingberg, T., Fernell, E., Olesen, P.J., Johnson, M., Gustafsson, P., Dahlström, K., Gillberg, C.G., Forssberg, H. & Westerberg, H. (2005). Computerized training of working memory in children with adhd. A randomized, controlled trial. Journal of The American Academy of Child & Adolescent Psychiatry, 44, 177-186. Klingberg, T., Forssberg, H., & Westerberg, H. (2002). Training of working memory in children with ADHD. Journal of Clinical and Experimental Neuropsychology, 24(6), 781-791. Kyllonen, P. C., & Christal, R. E. (1990). Reasoning ability is (little more than) working-memory capacity?!. Intelligence, 14(4), 389-433.
45
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
Levens, S. M., & Gotlib, I. H. (2010). Updating positive and negative stimuli in working memory in depression. Journal of Experimental Psychology: General, 139, 654–664. Landelijke Huisartsen Vereniging (2013). Patiënten mijden steeds vaker zorg. De Dokter, 25, 19-21. Lumiley, F. H., and Calhoon, S. W.(1934). Memory Span for Words Presented Auditorially. Applied Psychology, 18, 773-784. Luminet, O. (2004). Measurement of depressive rumination and associated constructs. In: Papageorgiou, C., & Wells, A., (Eds), Depressive rumination. Nature, theory and treatment, 187 – 215. Chichester: Wiley. Medalia, A., Revheim, N., & Herlands, T. (2009). Cognitive remediation for psychological disorders: therapist guide. Oxford University Press, USA. Martens, S. & Johnson, J. (2009). Working memory capacity, intelligence, and the magnitude of the attentional blink revisited. Experimental Brain Research, 1, 43-52. McNab, F., Varrone, A., Jucaite, A., Bystritsky, P., Forssberg, H. & Klingberg, T. (2009). Change in cortical dopamine D1 receptor binding associated with cognitive training. Science, 323(5915), 800-802. Morrison, A.B., & Chein, J.M. (2011). Does working memory training work? The promise and challenges of enhancing cognition by training working memory. Psychonomic Bulletin & Review, 18, 46-60. Nagel, I. E., & Lindenberger, U. (2014). 6 Adult age differences in working memory. Working Memory and Ageing, 129. Nolen-Hoeksema, S. (1991). Responses to depression and their effects on the duration of depressive episodes. Journal of Abnormal Psychology, 100, 569–582. Nolen-Hoeksema, S. (2001). Gender differences in depression. Current directions in psychological science, 10(5), 173-176. Nolen-Hoeksema, S., & Morrow, J. (1991). A prospective study of depression and posttraumatic stress symptoms after a natural disaster: The 1989 Loma Preita earthquake. Journal of Personality and Social Psychology, 61, 115–121. Olesen, P. J., Westerberg, H. & Klingberg, T. (2004). Increased prefrontal and parietal brain activity after training of working memory. Nature Neuroscience, 7, 75–79. Parker, G., Roy, K., & Eyers, K. (2003). Cognitive behavior therapy for depression? Choose horses for courses. American Journal of Psychiatry,160(5), 825-834. Redick, T. S., Broadway, J. M., Meier, M. E., Kuriakose, P. S., Unsworth, N., Kane, M. J., & Engle, R. W.
46
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
(2012). Measuring working memory capacity with automated complex span tasks. European Journal of Psychological Assessment,28(3), 164. Rose, E.J. & Ebmeier, K.P. (2006). Pattern of impaired working memory during major depression. Journal of Affective Disorders, 90, 149-161. Rounsaville, B. J., & Carroll, K. M. (2002). Commentary on dodo bird revisited: Why aren't we dodos yet?. Clinical Psychology: Science and Practice, 9(1), 17-20. Sawaguchi, T., & Goldman-Rakic, P. S. (1991). D1 dopamine receptors in prefrontal cortex: Involvement in working memory. Science (New York, NY),251(4996), 947. Simons, A.D., Garfield S.L., Murphy, G.E. (1984). The process of change in cognitive therapy and pharmacotherapy for depression. Archives of General Psychiatry, 41, 45–51. Skre, I., Onstad, S., Torgersen, S. & Kringlen, E. (1991). High interrater reliability for the Structured Clinical Interview for DSM-III-R Axis I (SCID-I). Acta Psychiatrica Scandinavica, 84, 167-173. Spielberger, C. D. (1983). Manual for the State–Trait Anxiety Inventory STAI (Form Y). Palo Alto, CA: Mind Garden. Spitzer, R.L., Williams, J.B.W., Gibbon, M. & First, M.B. (1990). The structured clinical interview for DSM-III-R (SCID) I: History, rationale and description. Archives of General Psychiatry, 49, 624-629. Stichting Farmaceutische Kengetallen (2009). Kosten antidepressiva flink gedaald. Farmaceutisch weekblad, jaargang 144, Nr. 13. Sumner, J. A., Griffith, J. W., & Mineka, S. (2010). Overgeneral autobiographical memory as a predictor of the course of depression: A meta-analysis. Behaviour research and therapy, 48(7), 614. Tchanturia, K., Davies, H., & Campbell, I. C. (2007). Cognitive remediation therapy for patients with anorexia nervosa: preliminary findings. Annals of General Psychiatry, 6(1), 14. Tchanturia, K., Davies, H., Lopez, C., Schmidt, U., Treasure, J., & Wykes, T. (2008). Letter to the Editor: Neuropsychological task performance before and after cognitive remediation in anorexia nervosa: a pilot case-series. Psychological Medicine, 38(09), 1371-1373. Turner, M. L., & Engle, R. W. (1989). Is working memory capacity task dependent? Journal of Memory & Language, 28, 127-154. Unsworth, N., Brewer, G. A., & Spillers, G. J. (2009). There’s more to the working memory capacity fluid intelligence relationship than just secondary memory. Psychonomic bulletin & review, 16(5), 931-937.
47
Effectiviteit Werkgeheugentraining bij Depressie Marissa Smits
Unsworth, N., Heitz, R.P., Schrock, J.C., & Engle, R.W. (2005). An automated version of the operation span task. Behavior Research Methods, 37, 498 - 505. Unsworth, N., Redick, T. S., Heitz, R. P., Broadway, J. M., & Engle, R. W. (2009). Complex working memory span tasks and higher-order cognition: A latent-variable analysis of the relationship between processing and storage. Memory,17(6), 635-654. Watkins, E., Teasdale, J.D. & Williams, R.M. (2000). Decentring and distraction reduce overgeneral autobiographic memory in depression. Psychological Medicine, 30, 911-920. Wexler, B. E., Anderson, M., Fulbright, R. K., & Gore, J. C. (2000). Preliminary evidence of improved verbal working memory performance and normalization of task-related frontal lobe activation in schizophrenia following cognitive exercises. American Journal of Psychiatry, 157(10), 1694-1697. Williams, J. M. G. (1995). Autobiographical Memory Test. Department of Psychology, University of Wales, Bangor. Williams, L., Simms, E., Clark, R., Paul, R., Rowe, D. & Gordon, E. (2005). The test-retest reliability of a standardized neurocognitive and neurophysiological test battery: ‘neuromarker’. International Journal of Neuroscience, 115, 1605-1630. Wirz-Justice, A. (2008). Diurnal variation of depressive symptoms. Dialogues in clinical neuroscience, 10(3), 337. Wykes, T., Huddy, V., Cellard, C., McGurk, S. R., & Czobor, P. (2011). A meta-analysis of cognitive remediation for schizophrenia: methodology and effect sizes. American Journal of Psychiatry, 168(5), 472-485. Wykes, T., Reeder, C., Corner, J., Williams, C., & Everitt, B. (1999). The effects of neurocognitive remediation on executive processing in patients with schizophrenia. Schizophrenia bulletin, 25(2), 291-307. Wykes, T., Reeder, C., Landau, S., Everitt, B., Knapp, M., Patel, A., & Romeo, R. (2007). Cognitive remediation therapy in schizophrenia Randomised controlled trial. The British journal of psychiatry, 190(5), 421-427.
48