1 Gestandaardiseerde psychodiagnostische methoden

1

Gestandaardiseerde psychodiagnostische methoden

Jan H. Kamphuis en Hilde M. Geurts

1.1

Inleiding

5

1.2

Betrouwbaarheid, validiteit en afbreekscores

6

1.3

Het interview

8

1.4

Observaties

9

1.5

Psychologische tests 1.5.1 Wanneer psychodiagnostiek en waarom tests? 1.5.2 Functie en intelligentietests 1.5.3 Objectieve zelf-invullijsten op het gebied van persoonlijkheid en klachten 1.5.4 Performance-based projectieve tests

10 12 13

Slotbeschouwing

18

1.6

1.1

15 17

Inleiding

Psychodiagnostiek wordt doorgaans ondernomen wanneer men aanvullende informatie nodig heeft om tot klinische beslissingen te komen. Het gaat daarbij vaak om beslissingen die belangrijk kunnen ingrijpen in het leven van mensen: beslissingen met betrekking tot evaluatie (bijv. voor strafverlof), plaatsing (voor poliklinische of klinische behandeling) of indicatiestelling. De opdrachtgever zal een beeld van het functioneren en de klachten van de cliënt willen krijgen, begrijpen hoe bepaald probleemgedrag verklaard en in stand gehouden wordt, voorspellen hoe het zich zal ontwikkelen, of weten wat er aan te doen is. Met andere woorden: men wenst verhel-

6

Handboek psychopathologie deel 2

dering/onderkenning, verklaring, predictie of indicatiestelling van het psychologisch onderzoek (De Bruijn e.a., 2003; Vertommen, Ter Laak & Bijttebier, 2002). Goede diagnostiek wordt aangestuurd door een heldere vraagstelling op een of meer van deze gebieden. De diagnosticus gaat vervolgens – net als bij ander empirisch onderzoek – op basis van zijn voorlopige hypothesen hoogwaardige instrumenten selecteren die optimaal inzicht kunnen geven in de betrokken vraagstelling, er data mee verzamelen en er zijn hypothesen mee toetsen, om ten slotte één en ander in een verslag neer te leggen en terug te koppelen. Dit wordt wel aangeduid als de diagnostische cyclus (zie Van Strien, 1986; De Bruijn e.a., 2003). Diverse instrumenten kunnen de diagnosticus bijstaan. Achtereenvolgens worden hier beknopt besproken: het klinisch interview, methoden van observatie en psychologische tests. De laatste categorie wordt verbijzonderd naar intelligentie- en andere functietests, objectieve zelf-invulvragenlijsten (waaronder persoonlijkheidstests en klachtenlijsten) en projectieve methoden. Voorafgaand aan deze bespreking wordt kort stilgestaan bij enkele belangrijke psychometrische overwegingen. Tevens wordt aandacht besteed aan de kenmerkende voordelen en beperkingen van tests.

1.2

Betrouwbaarheid, validiteit en afbreekscores

Psychometrische eigenschappen van tests hebben vergaande praktische consequenties. Deze paragraaf beoogt – noodzakelijkerwijs onvolledig en globaal – enkele klinisch relevante implicaties te bespreken van betrouwbaarheid, validiteit en het gebruik van afbreekscores. Voor uitgebreidere informatie wordt verwezen naar standaardhandboeken op het gebied van de testtheorie (bijv. Cronbach, 1990). Betrouwbaarheid heeft betrekking op de consistentie van testresultaten: als de test nog eens wordt uitgevoerd (test-hertestbetrouwbaarheid) of als de test door een ander wordt afgenomen (interbeoordelaarsbetrouwbaarheid), krijgen we dan (min of meer) dezelfde uitkomsten? Het praktische belang van betrouwbaarheid kan misschien het beste aanschouwelijk worden gemaakt door stil te staan bij situaties waar die niet (voldoende) aanwezig is. Een paar voorbeelden: twee medici die op grond van hetzelfde uitstrijkje verschillend oordelen over de goedaardigheid, twee tandartsen die op grond van dezelfde radiografie verschillende elementen aanwijzen die volgens hen door cariës zijn aangetast, twee psychologen die op grond van dezelfde Rorschach-gegevens van mening verschillen over de realiteitstoetsing van de cliënt. Elk van deze gevallen (van onvoldoende inter-beoordelaarsbetrouwbaarheid) kan leiden tot ingrijpende foutieve beslissingen. Hetzelfde geldt voor situaties van lage test-hertestbetrouwbaarheid: als veel van de variantie bij herhaling van de test door het toeval wordt bepaald, past terughoudendheid bij het afleiden van klinische implicaties. Validiteit van een test verwijst naar de mate waarin een test daadwerkelijk meet wat hij pretendeert te meten. Een test die bijvoorbeeld pretendeert intelligentie te meten maar in feite ‘scholing’ meet, is geen valide index van

1 Gestandaardiseerde psychodiagnostische methoden

intelligentie. Verschillende soorten validiteit kunnen worden onderscheiden. Predictieve validiteit is meestal van groot belang voor tests; men wil immers vaak de testdata gebruiken om uitspraken te kunnen doen over het toekomstig functioneren van mensen. De criteriumvaliditeit van een test wordt vaak bepaald door de correlatie te berekenen tussen de testscore en een ‘gouden standaard’-gedragscriterium. Uit het voorgaande zal duidelijk zijn dat betrouwbaarheid geen garantie is voor validiteit: twee beoordelaars kunnen perfect overeenstemmen maar iets heel anders meten dan zij beogen te meten. De psychometrische kwaliteiten die in de testhandleiding en de evaluatie van de COTAN (Commissie Test-Aangelegenheden Nederland; Evers, Van Vliet-Mulder & Groot, 2000) worden vermeld, gelden uiteraard voor de toepassing van de test zoals beschreven. Betrouwbaarheden zijn in principe beperkt tot de populaties waarop deze bepaald zijn. De test-hertestbetrouwbaarheid of interne consistentie van een test bij een klinische populatie kan bijvoorbeeld (sterk) afwijken van de waarden die bij de ‘normale’ populatie worden gevonden. Ten aanzien van validiteit geldt iets vergelijkbaars. Ter illustratie: in de in Nederland in zwang zijnde Dynamische Theoriegestuurde Profielinterpretatie (DTP; Eurelings-Bontekoe & Snellen, 2004) wordt de NVM (de Nederlandse Verkorte MMPI) gebruikt om de persoonlijkheidsorganisatie van een individu te bepalen. Dergelijk gebruik van de NVM is ver verwijderd van de door Luteijn en Kok (1985) geclaimde meetpretentie van het instrument en bij deze toepassing vervalt dan ook de COTAN-validiteitsbeoordeling van ‘goed’. Men kan dus – in principe – als goed beoordeelde instrumenten zodanig toepassen dat die beoordeling in het geheel niet meer van toepassing is (Smid & Kamphuis, 2005). Ten slotte een opmerking over de relatie tussen afbreekscores en base rates. Veel tests kennen zogenaamde afbreekscores of cut-offs: dat wil zeggen een kritieke score die een soort ‘caseness’ of klinisch significant niveau identificeert. De testgebruiker doet er verstandig aan hier voorzichtig mee om te springen: dergelijke scores zijn meestal empirisch bepaald door minimalisatie van het totale aantal foute beslissingen, zowel fouten van overidentificatie (‘negatieve treffers’) als onderidentificatie (‘negatieve missers’). De base rate (het percentage van een bepaald kenmerk in een gegeven populatie) van de werkelijke caseness heeft echter een zeer sterke invloed op de verdeling van die fouten; een afbreekscore is daarmee meer bruikbaar naarmate de base rate in de eigen populatie dichter bij die van de normgroep lag. Het is mogelijk dat de twee soorten fouten in de klinische praktijk niet even ernstig of schadelijk zijn, gegeven de doelstelling die men voor ogen heeft (bijv. screening versus diagnostiek; in het eerste geval zal men negatieve missers ernstiger waarderen, in het tweede juist de negatieve treffers). Een klassiek voorbeeld is de predictie van suïcide: een negatieve misser heeft extreem ernstige consequenties (gemiste zelfmoord), terwijl de gevolgen van een negatieve treffer minder onherroepelijk zijn en zullen afhangen van de genomen vervolgstappen. Overigens geldt voor het voorspellen van suïcide het algemenere probleem dat het statistisch voorspellen van laagfrequente gebeurtenissen praktisch onmogelijk is; de lage base rate leidt inherent tot

7

8


problemen van overidentificatie. Voor een uitgebreidere bespreking van de klinische implicaties van base rates: zie Kamphuis en Finn (2003) of Streiner (2003).

1.3

Het interview

Het klinisch interview is waarschijnlijk het meest gebruikte instrument bij diagnostiek. Een hoge mate van flexibiliteit, de mogelijkheid om een band met de cliënt te vormen en de cliënt te observeren, behoren tot de kenmerkende voordelen van het klinisch interview. Interviews variëren in de mate van gestructureerdheid en de (semi)gestructureerde interviews variëren in hun specifieke focus. In gestructureerde interviews zijn de vragen min of meer letterlijk voorgeschreven. Welke vragen precies moeten worden gesteld is mede afhankelijk van de klachtenrapportage van de cliënt. Interviews waarin een breed scala psychiatrische beelden aan de orde komt, zijn onder meer het Structural Clinical Interview for DSM-IV disorders (SCID; Spitzer e.a., 1992; Groenestijn e.a., 1999) en het Diagnostic Interview Schedule (DIS, Robins e.a., 1996). De breedte van dit type interview heeft tot gevolg dat de verschillende psychiatrische beelden vaak slechts oppervlakkig aan bod komen. Andere interviews richten zich meer op specifieke stoornissen zoals de Positive and Negative Syndrome Scale (PANNS; Linszen e.a., 1994) om de aard en ernst van de schizofreniesymptomen te meten en de Hamilton Rating Scale for Depression (HRSD; Hamilton, 1960) om de ernst van depressiesymptomen te meten. Tevens zijn er allerhande interviews die zich juist meer op persoonlijkheidsstoornissen richten (voor een overzicht zie Maesschalck & Vertommen, 1997). Bovenstaand type interviews is dus minder breed in het scala aan psychiatrische stoornissen dat het pretendeert te meten, maar gaat dieper in op de specifieke problematiek. Binnen de neuropsychologische diagnostiek bestaan specifieke instrumenten om verschillende cognitieve functies eenvoudig te screenen, bijvoorbeeld de Cognitieve Screening Test (CST; De Graaf & Deelman, 1991). De CST is bedoeld om in tien à vijftien minuten de aanwezigheid en ernst van cognitieve achteruitgang bij ouderen vast te stellen. De uitslag van de CST kan worden gebruikt als beginpunt voor uitgebreidere dementiediagnostiek. Kortom, de keuze van het te gebruiken interview is sterk afhankelijk van de specifieke vraagstelling en uiteraard ook van de betrouwbaarheid en validiteit van de verschillende interviews. Het doel van (semi)gestructureerde interviews is alle relevante informatie te verzamelen op een uniforme en welomschreven manier. Een diagnose kan pas worden gesteld als het interview integraal is afgenomen. Deze methode ontwijkt diverse potentiële valkuilen van het ongestructureerde interview, zoals de veel voorkomende neiging om tot een diagnose te komen voordat alle informatie verzameld is, selectief informatie verzamelen, en negeren van informatie die de diagnose tegenspreekt. Een bekend nadeel van volledig gestructureerde interviews is het ontbreken van controle op de manier waarop de vraag door de cliënt wordt geïnterpreteerd. Daarnaast vergt de afname van gestructureerde interviews meestal veel tijd. De gestructureerde


interviews zijn vaak zeer betrouwbaar, maar er kunnen soms vraagtekens worden gezet bij de validiteit. Bij een semigestructureerd interview wordt dit nadeel ondervangen door de mogelijkheid tot doorvragen. Bij semigestructureerde interviews moet de interviewer goed getraind zijn en kennis hebben van psychopathologie. Overigens kan de mogelijkheid tot doorvragen wel een grotere onbetrouwbaarheid tot gevolg hebben.

1.4

Observaties

Voor alle onderdelen van diagnostiek is observatie een belangrijk onderdeel. Het belang van observaties is tweeledig. Ten eerste kan men met behulp van observaties een algemeen beeld krijgen van het functioneren van de cliënt. Iemand kan bijvoorbeeld zeer emotioneel zijn klachten presenteren, heel verwijtend of juist erg onverschillig. Dit kan de diagnosticus informatie geven over de klachtenbeleving van de cliënt. Iemand die constant om herhaling van de vragen vraagt kan bijvoorbeeld onzeker zijn, maar ook problemen hebben met zijn geheugen. Ten tweede kunnen observaties helpen de validiteit van de testresultaten vast te stellen. Observaties bepalen immers deels de context waarbinnen de uitslagen op bijvoorbeeld functietests moeten worden beoordeeld. De hoofdvraag is of de testprestaties en de vragenlijstscores een reële weergave vormen van wat de cliënt al dan niet kan en of de cliënt aldus goed getypeerd wordt. Ter illustratie: wanneer een cliënt overduidelijk zijn best niet doet bij testafname, dan is zijn score waarschijnlijk geen goede indicatie van zijn mogelijkheden en kan de validiteit van de score bediscussieerd worden. Daarnaast kunnen bepaalde gedragingen een specifieke diagnostische waarde hebben (bijv. specifieke taalfouten voor de diagnostiek van afasieën). Ongeacht de setting en de vraagstelling leveren uiterlijke verschijning (conform leeftijd, verzorging, lichaamsbouw?), benadering (vriendelijk, terughoudend, argwanend, onpersoonlijk, oogcontact?), klachtenpresentatie/ vraagstelling (een heldere uiteenzetting, met gevoel, zakelijk, onverschillig, beschuldigend?), stemming en affect (opgewekt, somber, geïrriteerd, zenuwachtig?) en motivatie (al dan niet coöperatief, slordige werkwijze, werktempo?) een schat aan informatie op. De diagnosticus is bij een observatie zelf het belangrijkste meetinstrument. Net als bij een algemeen klinisch interview kan de verwachting van de diagnosticus een grote rol spelen bij de observaties. Het is daarom van belang om de cliënt zo concreet mogelijk te beschrijven in plaats van de observaties direct te interpreteren in het kader van een bepaald ziektebeeld. Het is daarnaast essentieel dat de diagnosticus in het rapport de lezer niet overspoelt met een brij aan observatiegegevens. Ook bij observaties geldt dat standaardisatie zorgt voor betrouwbaarder gegevens. Afhankelijk van de vraagstelling kan het eveneens zinvol zijn om ook op de volgende aspecten te letten: ziekte-inzicht, bewustzijn (helder of vernauwd?), concentratie/aandacht (snel afgeleid, zit te gapen?), oriëntatie van tijd/plaats/persoon, waarneming (hallucinaties, beperkingen op het gebied

9

10


van visus of gehoor?), motoriek (mate van activiteit, apraxie, synkinesieën?), taal (stoornissen in taalbegrip of taalgebruik, articulatie?), geheugen (confabulaties, vergeten van instructies?), intelligentie en executieve functies (stop- of startproblemen, perseveraties?). Bij elk van de domeinen waar de diagnosticus op kan letten, zijn in het bovenstaande overzicht slechts enkele voorbeelden gegeven (zie voor een overzicht van observaties Ponds & Hendriks, 2004).

Psychologische tests

1.5

Tabel 1.1 nr

Beoordelingen TOP-20 tests (Evers, Zaal & Evers, 2002).

naam

theoreti-

testma-

hand-

nor-

betrouw-

be-

crite-

test

sche

teriaal

leiding

men

baarheid

grips-

rium-

uit-

vali-

validi-

gangs-

diteit

teit

punten 1

WAIS

o

g

v

g

g

o

o

2

NVM

g

g

g

v

v

v

o

3

NPV

g

g

g

g

v

v

v

4

WISC-R

g

g

g

g

v

v

o

5

SCL-

g

g

v

v

g

g

g

UCL

g

g

v

o

v

v

v

90 6 7

8 9

MMPI

g

g

g

o

o

o

o

MMPI-2

o

g

g

o

v

o

o

ZAT

o

o

o

nvt

o

o

o

GIT

g

g

g

g

v

v

v

Ver.

o

g

v

o

o

o

o

GIT 10

Stroop

g

g

v

o

o

v

o

11

15WT

v

v

v

o

g

g

o

12

NPV-J

v

g

v

o

v

g

v


nr

11

naam

theoreti-

testma-

hand-

nor-

betrouw-

be-

crite-

test

sche

teriaal

leiding

men

baarheid

grips-

rium-

uit-

vali-

validi-

gangs-

diteit

teit

punten 13

PMT

g

g

g

v

v

g

v

14

(G)-

v

v

v

v

v

v

v

EPPS 15

TMT

o

o

o

o

o

o

o

16

BWT

o

g

o

v

g

o

o

17

RAKIT

g

g

g

g

g

g

g

18

Ra-

g

g

g

o

v

v

v

venPM 19

DAT83

g

g

g

g

v

g

g

20

NEO-

g

g

g

v

v

g

o

PI-R Opmerking: WAIS = Wechsler Adult Intelligence Scales; NVM = Nederlandse Verkorte MMPI; NPV (-J) = Nederlandse PersoonlijkheidsVragenlijst; WISC-R = Wechsler Intelligence Scales for Children; SCL-90 = Symptom Checklist; UCL = Utrechtse CopingLijst; MMPI (-2)= Minnesota Multiphasic Personality inventory (Revised); ZAT = Zin-Aanvul-Test; GIT = Groninger IntelligentieTest; Stroop = Stroop kleur-woordtest; 15 WT = 15-Woorden-Test; PMT = Prestatie-Motivatie-Test; EPPS = Edwards Personal Preference Schedule; TMT = Trail Making Test; BWT = Bourdon-Wiersma-Test; RAKIT = Revisie Amsterdamse KinderIntelligentieTest; Raven PM = Raven Progressive Matrices; DAT83 = Differentiële Aanleg-Test; NEO-PI-R = NEO Personality Inventory.

Tabel 1.1 geeft aan de hand van een top-20 van de frequentie van afname (Evers, Zaal & Evers, 2002) een indruk van het huidige feitelijke testgebruik in Nederland. Het blijkt dat deze top-20 vrij sterk overeenstemt met het testgebruik in de Verenigde Staten (zie Watkins e.a., 1995); nationaal veelgebruikte tests blijken vaak afgeleid van internationaal ontwikkelde tests. In het volgende komt het merendeel van deze tests aan de orde. Criteria die de testselectie kunnen aansturen zijn de mate van ‘fit’ tussen de meetpretentie van het instrument en het doel/object van onderzoek, de psychometrische eigenschappen van het instrument (zie tabel 1.1 en de COTAN-beoordelingen; Evers, Van Vliet-Mulder & Groot, 2000), efficiëntie in termen van tijd en geld, en bekendheid en ervaring met het instrument, zowel persoonlijk als in de betrokken instelling.

12


1.5.1

Wanneer psychodiagnostiek en waarom tests?

In de klinische praktijk wordt psychologisch onderzoek meestal in gang gezet om a het huidige functioneren c.q. de klinische symptomatologie in kaart te brengen, b klinische indrukken te bevestigen, verwerpen of aan te passen, c te komen tot indicatiestelling, d de progressie in de behandeling/ klachten vast te stellen, en e soms als directe empathische, therapeutische interventie op zichzelf (Finn & Tonsager, 1992). Lang niet altijd is het nodig of zelfs maar zinnig om klinische beslissingen te ondersteunen met testgebruik. Meyer e.a. (2001) inventariseerden typische klinische situaties waarin testdiagnostiek optimaal nuttig is. Zij noemen de volgende scenario’s: – Wanneer de patiënt tevergeefs verschillende behandelingen heeft ondergaan of wanneer er een impasse in de behandeling is. – Wanneer er duidelijke indicatiecriteria bestaan voor alternatieve behandelingen waar de tests duidelijke uitspraken over kunnen doen. – Wanneer patiënten intrinsiek gemotiveerd zijn om bepaalde aspecten van hun functioneren beter te begrijpen. – Bij complexe problemen, waarvan de aanpak prioritering vereist. Waarom uitgebreid psychologisch onderzoek, met behulp van tests? Vergeleken met het ongestructureerde klinisch interview komt een aantal kenmerkende voordelen van (goede) psychologische tests naar voren (Meyer e.a., 2001): – Tests kunnen responsattitudes aan het licht brengen. Door middel van zogenoemde validiteitsschalen (zoals prominent aanwezig in de MMPI-2) kunnen zowel inhoudsonafhankelijke als -afhankelijke bedreigingen van de validiteit gemeten worden. Voorbeelden van de eerste soort zijn cliënten die willekeurig antwoorden of juist alles beamen. Inhoudsafhankelijke bedreigingen van de validiteit komen voort uit een onzuivere zelfpresentatie; de cliënt kan zich defensief opstellen, of juist sterk overdrijven tot en met simuleren. – Tests kunnen in principe een zeer breed scala aan cognitieve, emotionele en gedragsmatige aspecten zeer efficiënt bevragen. Bij de constructie van de lijst is (idealiter) goed nagedacht over de inhoudsvaliditeit van de test, hetgeen een goede dekking van het meetdomein waarschijnlijk maakt. Een of twee diagnostische interviews zijn vaak zeer krap bemeten als het gaat om het omvattend uitvragen van het functioneren en de symptomatologie van de patiënt. – Tests worden in principe op dezelfde standaardwijze afgenomen en gescoord; juist deze uniformiteit maakt het mogelijk om unieke aspecten van bijvoorbeeld de testaanpak bij cliënten te observeren. – Tests zijn genormeerd; dit maakt het mogelijk om de individuele cliënt te vergelijken met zijn relevante peers en om vast te stellen hoe (on)gebruikelijk een bepaalde score is vergeleken met de zogenaamde normalen en wat het idiosyncratische profiel van relatief sterke en zwakke aspecten van functioneren is.


– In tegenstelling tot bijvoorbeeld het ongestructureerde interview leveren tests gekwantificeerde informatie op met een bekende betrouwbaarheid en validiteit van de scores; mits correct gebruikt, heeft men dus informatie over wat die scores waard zijn in termen van accuratesse, herhaalbaarheid en validiteit. – Ten slotte kunnen tests in een batterij elkaar cross-valideren, hetgeen vooral speelt wanneer de instrumenten uit verschillende bronnen komen (cliënt versus partner) en wanneer verschillende methoden worden gebruikt (bijv. zelfrapportage, interview en observatie). Psychologische tests kunnen worden ingedeeld in functie- en intelligentietests die gegevens opleveren over functionele capaciteiten en beperkingen, objectieve zelf-invullijsten die de zelfpresentaties van patiënten wat betreft hun functioneren, symptomatologie en persoonlijkheid in beeld brengen, en projectieve instrumenten die pretenderen gedrag in meer ongestructureerde situaties te meten alsmede onderliggende, impliciete dynamiek van emoties en persoonlijke schema’s. 1.5.2

Functie en intelligentietests

Bij functietests gaat het om het in kaart brengen van de aan- en afwezigheid van cognitieve functiestoornissen. In de diagnostiek wordt door middel van kwantitatieve methoden (de score op de functietests) en kwalitatieve methoden (de manier waarop de functietest wordt uitgevoerd) een sterkte/zwakteprofiel gemaakt van de cliënt. Om te kunnen bepalen of er daadwerkelijk sprake is van een stoornis op een specifiek cognitief domein dient de diagnosticus een beeld te hebben van het algemene cognitieve niveau van een cliënt. Voor dit doel zijn de Wechsler Adult Intelligence Scale (WAIS; Wechsler, 2000) en de Groninger IntelligentieTest (GIT; Luteyn & Van der Ploeg, 1983) de meest gebruikte tests. Beide tests bestaan uit een serie subtests die een beroep doen op verschillende cognitieve vaardigheden. Deze tests geven niet alleen een beeld van het algemene cognitieve niveau van een cliënt, maar kunnen tevens een bron van neuropsychologische informatie zijn over specifieke cognitieve (dis)functies. Verschillende onderdelen van de WAIS en de GIT worden in de klinische praktijk vaak als individuele functietests gebruikt. Op het moment dat er bij een cliënt sprake is van hersenletsel is het van belang om het premorbide intelligentieniveau (het niveau van vóór het letsel) in te schatten. Dit kan op uiteenlopende manieren, bijvoorbeeld door gebruik te maken van het opleidingsniveau en beroep van de cliënt of het afnemen van specifieke voor dit doel ontwikkelde tests zoals de Nederlandse Leestest voor Volwassenen (NLV; Schmand, Lindeboom & Van Harskamp, 1992). Functietests zijn er voor verschillende cognitieve deelgebieden, namelijk taal, geheugen, perceptie, motoriek, aandacht en concentratie en executieve functies (bijv. het plannen en het stoppen van gedrag). Daarnaast zijn er allerhande testbatterijen ontwikkeld waarin de verschillende cognitieve functies aan bod komen (bijv. de ANT: Amsterdam Neuropsychological Tests; De Sonneville, 1999) of tests die focussen op de verschillende facetten van één speci-

13

14


fiek cognitief domein zoals de Test for Every Day Attention for Children (TEACh, Robertson & Nimmo-Smith, 1998). In het overzicht van het feitelijke testgebruik in het Nederlandse taalgebied (zie tabel 1.1) staat een aantal veel gebruikte specifieke functietests met hun COTAN-beoordelingen, zoals de Stroop kleur-woordtest (Stroop; Hammes, 1997), de 15-Woorden-Test (15-WT; Saan & Deelman, 1986), de Trailmaking Test (TMT; Reitan, ongedateerd) en de Bourdon-Wiersma-Test (oorspronkelijk uit 1910; lijkt erg op de BourdonVos) (Vos, 1988). De bekendheid van deze specifieke functietests is geen garantie dat zij daadwerkelijk het meest geschikt zijn om de bepaalde functies te meten. Er zijn vele, en soms dus ook betere, alternatieven op de markt. Een uitgebreid overzicht van de grote hoeveelheid bestaande functietests is te vinden in het werk van Bouma, Mulder en Lindeboom (2002), en Lezak, Howieson en Loring (2004). Bij de keuze van functietests is het uiteraard van belang om rekening te houden met de psychometrische kwaliteiten van het instrument, de specifieke vraagstelling en praktische overwegingen zoals de beschikbare tijd. De psychometrische kwaliteiten van de verschillende functietests worden beschreven in de COTAN en de kwaliteiten van de hier genoemde functietests variëren van onvoldoende tot goed (zie tabel 1.1). De psychometrische kwaliteit van een instrument lijkt niet bepalend voor een test om al dan niet in de top-25 van de meest gebruikte tests te verschijnen. De TMT wordt bijvoorbeeld op alle fronten als onvoldoende beoordeeld en wordt toch veelvuldig toegepast. Bij COTAN-beoordelingen van functietests zijn enkele kanttekeningen te plaatsen. Ten eerste worden niet alle taken gebruikt voor datgene waarvoor ze eigenlijk ontwikkeld zijn, zoals bij de hierboven beschreven WAIS en GIT. De beoordeling in de COTAN is uiteraard gebaseerd op het originele gebruik van de test. Ten tweede zijn veel tests die in het klinisch veld worden gebruikt niet genormeerd en psychometrisch onderzocht in Nederland, maar wel in het buitenland. Dit is voor de COTAN niet voldoende, terwijl dit wel voldoende kan zijn voor bepaalde taken, bijvoorbeeld perceptietaken. Ten derde dient voor de COTAN de normgroep een bepaalde omvang te hebben om als voldoende te worden beoordeeld. Sommige neurologische beelden laten een duidelijk interpreteerbaar contrast zien in vergelijking met gezonde cliënten en daardoor is vaak een kleinere normgroep reeds voldoende (Ponds & Hendriks, 2004). Bij het interpreteren van de functietests moet in acht worden genomen dat een slechte prestatie op een specifieke test verschillende oorzaken kan hebben. Voor het vaststellen van een tekort is het van belang om rekening te houden met het patroon van presteren op een serie verschillende tests, de informatie uit de anamnese, en observaties. Een veel gemaakte denkfout is het idee dat een bepaalde meting een vaststaande betekenis heeft. Zo kan bijvoorbeeld een patiënt om verschillende redenen slecht presteren op de hierboven genoemde 15-WT. Deze test doet primair een beroep op het geheugen, maar onder meer aandacht en concentratie zijn ook van belang. Bij het interpreteren van de taak dient dus rekening te worden gehouden met de prestatie op de aandacht- en concentratietaken. Ook zal bij interpretatie van de uitgestelde reproductie (wat de cliënt na een tijdsinterval van ongeveer


twintig minuten nog weet van een te leren woordenlijst) rekening moeten worden gehouden met de directe reproductie (wat de cliënt nog weet direct na het leren van de woordenlijst) op de 15-WT (zie Lezak, Howieson & Loring, 2004). 1.5.3

Objectieve zelf-invullijsten op het gebied van persoonlijkheid en klachten

Bij objectieve persoonlijkheidsvragenlijsten of klachtenlijsten gaat het om afname van een standaardset vragen of stellingen waarop de cliënt met een vastgestelde set antwoorden kan reageren. Antwoordmogelijkheden hebben meestal de vorm van ‘juist’ versus ‘onjuist’, ‘ja’ versus ‘nee’, maar kunnen ook de vorm aannemen van een Likert-schaal, waarbij men bijvoorbeeld van 1 tot 5 aan kan geven in welke mate men het met de stelling eens is. Persoonlijkheidsvragenlijsten De Minnesota Multiphasic Personality Inventory-Revised (MMPI/MMPI-2; Butcher, e.a., 1989; Derksen, Sloore & De Mey, 1993) is internationaal de meest gebruikte persoonlijkheidstest in de hedendaagse psychologie, zowel in de klinische praktijk als in empirisch onderzoek. Qua opzet en feitelijk meetbereik is de MMPI-2 beter te begrijpen als een test van psychopathologie en persoonlijkheidsfunctioneren dan als een test van persoonlijkheidstrekken. De MMPI-2 is daarbij nadrukkelijk gericht op de problematische kant van de cliënt, met weinig oog voor zijn meer adaptieve en sterke kanten. Kenmerkend voor de klinische schalen van de MMPI is de empirische schaalconstructie. Dat wil zeggen dat de samenstellende items van een schaal geselecteerd zijn op grond van hun statistisch vermogen te discrimineren tussen een klinische groep (die de naam aan de schaal geeft) en een groep ‘normalen.’ Deze wijze van testconstructie heeft verstrekkende gevolgen waarvan het belangrijk is dat de clinicus ze begrijpt. Men dient in gedachten te houden dat de MMPI-2 a-theoretisch van opzet is en primair kansuitspraken genereert met betrekking tot het al of niet tot een klinische groep behoren. Die uitspraken berusten vervolgens deels op non-intuïtieve items, hetgeen kan betekenen dat de cliënt zich niet per se bewust is van wat hij de diagnosticus met zijn antwoorden ‘meedeelt’ en bevindingen dus misschien niet zal (h)erkennen. Dit geldt niet voor de later ontwikkelde ‘inhoudsschalen’, die feitelijk opgevat kunnen worden als ingebedde, rationeel ontwikkelde klachtenlijsten. Psychometrisch verdiende de ‘oude’ MMPI geen schoonheidsprijs, zoals ook blijkt uit het oordeel van de COTAN (Evers, Van VlietMulder & Groot, 2000): onvoldoendes werden uitgedeeld voor normen, betrouwbaarheid en validiteit. De huidige MMPI-2 presteert wat psychometrie betreft duidelijk beter, zonder overigens alle problemen opgelost te hebben. De NEO-PI-persoonlijkheidstest is de meest gebruikte operationalisatie van het Big Five-model (ook wel Five Factor Model genoemd) van de persoonlijkheid. Dit model veronderstelt dat alle persoonlijkheidstrekken kunnen worden samengevat op (een combinatie van) vijf in principe onafhankelijke

15

16


dimensies: Neuroticisme, Extraversie, Consciëntieusheid, Altruïsme en Openheid, die met hun samenstellende facetten geacht worden een uitputtende samenvatting te zijn van de variatie in menselijke karaktertrekken; het model is a-theoretisch, factoranalytisch verkregen. De NEO-PI heeft goede psychometrische eigenschappen en correspondeert nauw met het model van de Big Five. De NEO-PI is bovendien veelzijdig en gebruiksvriendelijk door de beschikbaarheid van zelf- en anderbeoordeling, een verkorte versie (NEO-FFI; 60 items) en een uitgebreide handleiding. In Nederland wordt bovendien reeds lange tijd veel gebruik gemaakt van de Nederlandse Persoonlijkheidsvragenlijst (NPV; Luteijn, Starren & Van Dijk, 1985) en de Nederlandse Verkorte MMPI, beter bekend als de NVM (Luteijn & Kok, 1985). Beide instrumenten zijn genormeerd voor zowel de ‘normale’ als de psychiatrische populatie. De NPV is een bewerking en vertaling van de items van de California Personality Inventory (CPI). De NPV doet uitspraken over zeven persoonlijkheidstrekken, die stuk voor stuk behoorlijk homogeen en stabiel over de tijd zijn. Het instrument heeft een positieve COTANbeoordeling. Recent is tevens een jeugdversie ontwikkeld, de NPV-J. De NVM is in 2004 vanwege licentieproblemen van de Nederlandse markt genomen. De NVM leverde (heel anders dan de MMPI) informatie over vijf brede persoonlijkheidstrekken op. De opvolger van de NVM, de Negativisme, Ernstige Psychopathologie en Somatisering Test (NPST; Luteijn & Barelds, 2003), handhaaft drie van de oorspronkelijke trekken van de NVM, de overige trekken worden niet door dit instrument gemeten. Indien informatie over de andere schalen gewenst wordt, suggereren Luteijn en Barelds aanvulling met de NPV. Klachtenlijsten Klachtenlijsten kunnen worden verdeeld in ‘brede band’-klachtenlijsten die een waaier aan diverse klachten bestrijken, en domeinspecifieke klachtenlijsten, die een specifiek probleemgebied in kaart brengen. In de praktijk kan het zinvol zijn om sequentieel van breed naar specifiek te meten (volgens het ‘trechter’-model). Meestal zijn de klachtenlijsten rationeel geconstrueerd en is de aanvankelijke itemselectie geoptimaliseerd via statistische psychometrische procedures. Het resultaat is idealiter een homogene schaal, die kan worden opgevat als een index (van de zelfpresentatie) van de betreffende klachten. De Symptom Checklist (SCL-90; Arrindell & Ettema, 1981) is internationaal waarschijnlijk de meest gebruikte maat voor een brede-bandinventarisatie op het gebied van psychoneurotische klachten. De SCL-90 bestaat uit een lijst van 90 specifieke klachten waarbij de cliënt op een schaal van 1 (‘nooit’) tot 5 (‘altijd’) aangeeft in welke mate hij/zij er last van heeft. De SCL-90 heeft een gunstige COTAN-beoordeling. Alternatieven om psychisch onwelbevinden te meten zijn de General Health Questionnaires (GHQ-12 of GHQ-36; Koeter & Ormel, 1991) of, meer gericht op dimensies van kwaliteit van leven, de RAND-36 (Van der Zee & Sanderman, 1996). Veel gebruikte domeinspecifieke klachtenlijsten zijn de Beck Depression Inventory (BDI; Beck, 1961; Luteijn & Bouman, 1988) voor de meting van depres-


sieve klachten, en de Zelfbeoordelingsvragenlijst (ZBV; Van der Ploeg, 2000) voor de meting van angst, zowel toestandsangst als trekangst. Een ander klinisch veel gebruikt instrument is de Utrechtse Copinglijst (UCL; Schreurs e.a., 1993) die het gebruik van habituele omgangsstrategieën bij problemen inventariseert. Het valt buiten het bestek van dit hoofdstuk om de enorme verscheidenheid aan goede en minder goede zelf-invullijsten voor diverse domeinen te bespreken; de lezer wordt verwezen naar de COTAN (2000), en het themanummer van het Tijdschrift voor Psychiatrie (oktober 2004), waarin voor diverse as-I-stoornissen domeinspecifieke tests worden besproken. 1.5.4

Performance-based projectieve tests

Projectieve tests maken gebruik van ambigue stimuli (bijv. inktvlekken) en laten de respondent een in principe oneindig aantal responsen open. Meest gebruikt zijn de Rorschach-inktvlekkentest, Thematische ApperceptieTest (TAT), Zin-Aanvul-Test (ZAT), en projectieve tekeningen. De Rorschach-test bestaat uit tien ambigue inktvlekken, vijf zwart-wit, vijf levendig gekleurd. De instructie voor de respondent is simpelweg de vraag: ‘wat zou dit – de inktvlek – kunnen zijn?’ Sommige inktvlekken hebben vrij sterke vormaspecten, andere niet. Vanuit psychodynamisch gezichtspunt geldt dat, naarmate de respondent meer afwijkende percepten rapporteert, er sterkere aanwijzingen zijn voor persoonlijke betrokkenheid bij de respons: de zogenaamde projectieve hypothese. Een aantal aspecten staat bij de scoring van Rorschach-protocollen volgens het Exner-systeem (Exner, 1993) centraal. Gebruikt de respondent de gehele inktvlek of isoleert hij/zij vooral details? Is er een gezonde balans tussen conventionele en idiosyncratische percepten? Hoe gaat de respondent om met kleur? In welke mate is de persoon geneigd om ‘beweging’ toe te voegen aan de objectief gezien statische stimuli? Zijn er bijzonderheden ten aanzien van de relatieve frequentie van de inhoud van de percepten? ‘De Rorschach’ is altijd een zeer controversieel instrument geweest; aanhangers moeten vooral in de psychodynamische hoek gezocht worden, critici in de meeste andere therapiescholen. Er is wel beweerd dat het tempo van de vooruitgang van de psychologie afgemeten kan worden aan de snelheid waarmee de Rorschach wordt afgeschaft. Als dat waar is, schiet het met de psychologie niet erg op: in de frequentieverdeling van testgebruik neemt de Rorschach nog immer een prominente plaats in, zowel nationaal als internationaal. De controverse heeft kort geleden weer een opleving gekend, waarbij de Rorschach over en weer verhit is aangevallen dan wel verdedigd (zie Wood e.a., 2002). De Thematische ApperceptieTest (TAT) werd in 1935 geïntroduceerd door Morgan en Murray (1935). Vergeleken met de Rorschach biedt de TAT, de op een na meest gebruikte projectieve test, de respondent meer gestructureerde stimuli. Er zijn in totaal 31 platen, waarvan één blanco; de meeste geven interpersoonlijke situaties weer en enkele slechts objecten. Tevens verlangt deze test meer gestructureerde antwoorden: de respondent wordt gevraagd een verhaal te verzinnen in aansluiting op de afbeelding op de kaart, waarin de personen (hun gedachten en gevoelens), de situatie, wat voorafging en de

17

18


afloop moeten worden verwerkt. Er zijn verschillende scoringssystemen in omloop, soms toegespitst op bepaalde domeinen/thema’s (bijv. prestatiemotivatie, autonomie). In de praktijk worden deze echter zelden toegepast en is meer ‘klinisch’ gebruik de regel: de clinicus probeert thema’s en prominente conflicten te ontwaren in de verhalen van de cliënt. Meestal wordt slechts een selectie van de kaarten afgenomen; Murray adviseerde er twintig te selecteren. Het geïndividualiseerde, klinische gebruik impliceert dat de TAT meer geschikt is voor het genereren dan voor het toetsen van hypothesen; normatieve toetsing is niet goed mogelijk. De Zin-Aanvul-Test (ZAT) bestaat uit zinstammen die de cliënt vrijelijk mag afmaken. Er bestaat een aantal vaste ZAT’s en voor enkele versies bestaan zelfs scoringsprotocollen. In de praktijk wordt echter meestal meer ‘klinisch’ gekeken naar prominente thema’s die uit de responsen naar voren komen. Ook wordt er in de praktijk nog veel gebruik gemaakt van zogenaamde projectieve tekeningen (bijv. de trits huis-boom-persoon), al is herhaaldelijk aangetoond dat een toepassing als test absoluut niet psychometrisch verdedigd kan worden. Beter te verdedigen is het gebruik van tekeningen om bijvoorbeeld kinderen te observeren of om te helpen dingen bespreekbaar te maken. Dit neemt niet weg dat er nog regelmatig interpretatiehandleidingen worden gepresenteerd. Een probleempunt dat zich bij uitstek bij de projectieve instrumenten opdringt, is de incrementele validiteit. Met andere woorden: wat is de meerwaarde van de afname van de Rorschach wanneer reeds objectieve diagnostiek is verricht? Deze vraag is des te prangender omdat afname van de Rorschach veel tijd en training vergt en dus kostbaar is. Waarschijnlijk zal de theoretische oriëntatie van de clinicus een belangrijke bijdrage leveren aan het oordeel over deze kwestie, maar ongeacht oriëntatie zal men moeten kunnen verantwoorden dat een valide en unieke bijdrage van het instrument te verwachten is.

1.6

Slotbeschouwing

Aan een inspectie van de testkwaliteitsgids van de COTAN kan men licht een pessimistisch gevoel overhouden: slechts zeer weinig instrumenten krijgen ‘goede’ beoordelingen. Dit sombere gevoel kan nog toenemen wanneer men zich realiseert dat de criterium- en predictieve validiteit van testscores, uitgedrukt als de correlatie tussen de testscore en een (toekomstig) gedragscriterium, voor de betere tests tussen 0,3 en 0,5 ligt. Met andere woorden: sterke tests verklaren gemiddeld tussen 10 en 25% van de variantie die men beoogt te verklaren. Toch passen hier enkele nuancerende opmerkingen. Ten eerste zijn dergelijke validiteitscijfers zeer vergelijkbaar met die van breed geaccepteerde medische procedures (Meyer e.a., 2001). Psychomedische procedures betreffen vaak zeer complexe fenomenen en de validiteit van enkelvoudig testgebruik kent een duidelijk (en laag) plafond. Ten tweede geldt dat de validiteitscoëfficiënten meestal zijn gebaseerd op groepsgemiddelden van enkelvoudige correlaties tussen de betrokken schaal en een criterium. In


de klinische praktijk werkt men echter bijna altijd met diverse instrumenten tegelijkertijd. Een clinicus moet de informatie uit het interview, informatie van derden, gedragsobservaties en diverse testdata met elkaar combineren en uit het gehele patroon van bevindingen proberen uitspraken te doen ten aanzien van de vraagstellingen van cliënt en verwijzer. De interpretatie van de testscore is in de praktijk niet los te zien van de context van de patiënt en is vaak enkel in configuratie te duiden. Dit sluit ook aan bij een relativering van de COTAN zelf: ‘onvoldoende’ betekent niet altijd ‘onbruikbaar.’ De COTAN-beoordelingen zijn vooral bedoeld om beter gebruik van betere tests te bevorderen. ‘Beter gebruik’ houdt vooral in het zorgvuldig volgen van de diagnostische cyclus via een proces van hypothesegericht testen, niet ‘testen om te testen.’ Aan de andere kant moet worden vastgesteld dat er wat indicatiestelling betreft momenteel nauwelijks evidence-based aanbevelingen kunnen worden gedaan op grond van testgegevens (Vervaeke & Emmelkamp, 1998). Er is nog altijd een forse spanning tussen wat de praktijk van dag tot dag nodig heeft (bruikbare informatie ten aanzien van de vraag: welke behandeling voor deze patiënt?) en wat de onderzoeksevidentie heden aan richtlijnen oplevert.

Literatuur Arrindell, W.A. & Ettema, H. (1981). Handleiding bij de multidimensionele psychopathologieindicator. Lisse: Swets & Zeitlinger. Beck, A.T., Ward, C.H., Mendelsohn, M., Mock, J. & Erbaugh, J. (1961). An inventory for measuring depression. Archives of General Psychiatry, 4, 561-571. Bouma, A., Mulder, J. & Lindeboom, J. (2002). Neuropsychologische diagnostiek. Handboek. Lisse: Swets & Zeitlinger. Brickenkamp, R. (1981). Test d2: Aufmerksamkeits-Belastungs-Test (Handanweisung). Göttingen: Verlag für Psychologie & C.J. Hofrege. Bruijn, de, E.E.J., Ruijssenaars, A.J.J.M., Pameijder, N.K. & Aarle, E.J.M. van (2003). De diagnostische cyclus: Een praktijkleer. Leuven: Acco. Butcher, J.N., Dahlstrom, W.G., Graham, J.R., Tellegen, A. & Kaemmer, B. (1989). MMPI-2 (Minnesota Multiphasic Personality Inventory-2): Manual for administration and scoring. Minneapolis: University of Minnesota Press. Cronbach, L.J. (1990). Essentials of psychological testing (5th ed). New York: Harper & Row. Derksen, J.J.L., Sloore, H. & Mey, H.R.A. de (1993). MMPI-2: Handleiding bij afname, scoring en interpretatie. Nijmegen: Pen Publisher. Eurelings-Bontekoe, E.H.M. & Snellen, W.M. (2003). Dynamische persoonlijkheidsdiagnostiek. Lisse: Swets & Zeitlinger. Evers, A., Vliet-Mulder, J.C. van & Groot, C.J. (2000). Documentatie van tests en testresearch in Nederland, Deel I en II: Testbeschrijvingen. Amsterdam/Assen: NIP/Van Gorcum. Evers, A., Zaal, J.N. & Evers A.N. (2002). Ontwikkelingen in het testgebruik van Nederlandse psychologen. De Psycholoog, 2, 54-61. Exner, J.E., Jr. (1993). The Rorschach: A comprehensive system: 1. Basic foundations. New York: John Wiley.

19

20


Finn, S.E. & Tonsager, M.E. (1992). Therapeutic effects of providing MMPI-2 test feedback to college students awaiting therapy. Psychological Assessment, 4, 278-287. Graaf, A. de & Deelman, B.G. (1991). Cognitieve screening test. Handleiding. Lisse: Swets & Zeitlinger. Groenestijn, M.A.C. van, Akkerhuis, G.W., Kupka, R.W., Schneider, N. & Nolen, W.A. (1999). Gestructureerd klinisch interview voor de vaststelling van DSM-IV as-1-stoornissen. Lisse: Swets & Zeitlinger. Hamilton, M. (1960). A rating scale for depression. Journal of Neurology, Neurosurgery, and Psychiatry, 23, 56-62. Hammes, J.G.W. (1997). De Stroop Kleur-Woord Test. Handleiding. Lisse: Swets & Zeitlinger. Kamphuis, J.H., Finn, S.E. (2002). Incorporating base rate information in daily clinical decision making. In James N. Butcher (Ed.), Clinical personality assessment: Practical approaches (pp. 257-268). New York: Oxford University Press. Koeter, M.W.J. & Ormel, J. (1991). General health questionnaire: Nederlandse bewerking. Lisse: Swets & Zeitlinger. Lezak, M.D., Howieson, D.B. & Loring, D.W. (2004). Neuropsychological assessment. New York: Oxford University Press. Linszen, D., Haan, L. de, Kuipers, T. & Dingemans, P. (1994). Gestructureerd klinisch interview voor de positieve en negatieve syndroomschaal (SCI-PANNS). Amsterdam: Academisch Medisch Centrum, Divisie Psychiatrie. Luteijn, F. & Barelds, D.P.H. (2003). NPST: Negativisme, Ernstige Psychopathologie en Somatisering Test. Handleiding. Lisse: Swets & Zeitlinger. Luteijn, F. & Bouman, T.K. (1988). De validiteit van Beck’s Depression Inventory. Nederlands Tijdschrift voor de Psychologie, 43, 340-343. Luteijn, F. & Kok, A.R. (1985). NVM: Nederlandse Verkorte MMPI. Handleiding. Lisse: Swets & Zeitlinger. Luteijn, F., Starren, J. & Dijk, H. van (1985). Handleiding bij de NPV. Lisse: Swets & Zeitlinger. Luteijn, F. & Ploeg, F.A.E. van der (1983). Groninger IntelligentieTest. Lisse: Swets & Zeitlinger. Maesschalck, C. & Vertommen, H. (1997). Diagnostiek van persoonlijkheidsstoornissen: Een overzicht van Nederlandstalige instrumenten aansluitend bij de DSM-classificatie en bij andere benaderingen. Diagnostiekwijzer, 4, 176-199. Meyer, G.J., Finn, S.E., Eyde, L. D., Kay, G.G., Moreland, K.L., Dies, R. R., Eisman, E.J., Kubiszhyn, T.W. & Reed, G.M. (2001). Psychological testing and psychological assessment: A review of evidence and issues. American Psychologist, 56, 128-165. Morgan, C.D. & Murray, H.A. (1935). A method for investigating phantasies: The Thematic Apperception Test. Archives of Neurology and Psychiatry, 34, 289-306. Ploeg, H.M. van der (2000). Handleiding bij de zelf-beoordelingsvragenlijst ZBV. Lisse: Swets & Zeitlinger. Ponds, R. & Hendriks, M. (2004). Methoden in de neuropsychologische diagnostiek. In B. Deelman, P. Eling, E. de Haan & E. van Zomeren (red.), Klinische neuropsychologie (pp. 6381). Amsterdam: Boom. Reitan, R.M. (ongedateerd). Instructions and procedures for administrating the psychological test battery used at the Neuropsychology Laboratory, Indiana University Medical Center. Indianapolis: Indiana University Medical Center (ongepubliceerd rapport). Robertson, I.H. & Nimmo-Smith, I. (1998). Test for every day attention for children. Lisse: Swets & Zeitlinger.


Robins, L.N., Marcus, L., Reich, W. e.a. (1996). Diagnostic interview schedule, version IV. St. Louis: Department of Psychiatry, Washington School of Medicine. Saan, R.J. & Deelman, B.G. (1986). De 15-woordentest A en B (een voorlopige handleiding). Groningen: Afdeling Neuropsychologie, AZG. Schmand, B., Lindeboom, J. & Harskamp, F. van (1992). De Nederlandse leestest voor volwassenen. Lisse: Swets & Zeitlinger. Schreurs, P.J.G., Willige, G. van der, Brosschot, J.F., Tellegen, B. & Graus, G.M.H. (1993). De Utrechtse CopingLijst: UCL. Lisse: Swets & Zeitlinger. Smid, W. & Kamphuis, J.H. (2005). Enige bedenkingen en vraagtekens bij de Dynamische Theoriegestuurde Profielinterpretatie. De Psycholoog, 2, 71-75. Sonneville, L.M.J. de (1999). Amsterdam Neuropsychological tasks: A computer aided assessment program. In B.P.L.M. den Brinker, P.J. Beek, A.N. Brand, S.J. Maarse & L.J.M. Mulder (Eds.), Computers in psychology, volume 6: Cognitive ergonomics, clinical assessment and computer-assisted learning (pp. 187-203). Lisse: Swets & Zeitlinger. Spitzer, R.L., Williams, J.B.W., Gibbon, M. & First, M. (1992). The structured clinical interview for DSM-III-R (SCID). 1. History, rationale, and description. Archives of General Psychiatry, 49, 624-629. Streiner, D.L. (2003). Diagnosing tests: Using and misusing diagnostic and screening tests. Journal of Personality Assessment, 81, 209-219. Strien, P.J. van (1986). Praktijk als wetenschap: Methodologie van het sociaal wetenschappelijk handelen. Assen: Van Gorcum. Vertommen, H., Laak, J. ter & Bijttebier, P. (2002). Het diagnostisch proces. Diagnostiekwijzer, 5, 4-16. Vervaeke, A.C. & Emmelkamp, P.M.G. (1998). Treatment selection: What do we know? European Journal of Psychological Assessment, 14, 50-59. Vollema, M. & Rijn, D. van (2003). Het meten van psychopathologie en cognitieve stoornissen in de cognitieve neuropsychiatrie. In P. Eling, E. de Haan, R. Hijman & B. Schmand (red.), Cognitieve neuropsychiatrie (pp. 46-92). Amsterdam: Boom. Vos, P.G. (1988). Bourdon Vos: Handleiding. Lisse: Swets & Zeitlinger. Watkins, C.E., Campbell, V.L., Nieberding, R. & Hallmark, R. (1995). Contemporary practice of psychological assessment by clinical psychologists. Professional Psychology: Research & Practice, 26, 54-60. Wechsler, D. (2000). WAIS-III. Technische handleiding. Nederlandstalige bewerking. Lisse: Swets & Zeitlinger. Wood, J.M., Garb, H.N., Lilienfeld, S.O. & Nezworski, M.T. (2002). Clinical assessment. Annual Review of Psychology, 53, 519-543. Zee, K.I. van der & Sanderman, R. (1996). Het meten van de algemene gezondheidstoestand met de RAND-36: Een handleiding. Groningen: Noordelijk centrum voor gezondheidsvraagstukken.

21

1 Gestandaardiseerde psychodiagnostische methoden

Recommend Documents