Psychodiagnostiek 1 Les 1 Doelstellingen lessen
Introductie in de psychologische diagnostiek Kritische evaluatie van psychologische tests en diagnostische procedures: validiteit, betrouwbaarheid (meet het instrument wat het beoogt te meten?) en fairheid Kennismaking met enkele psychologische tests uit de belangrijkste domeinen Kennismaking met één diagnostisch domein: het meten van emotionele intelligentie Eerste kennismaking met het afnemen en interpreteren van psychologische tests
Examen Meerkeuze op 16 punten van examen. Werkcolleges op resterende 4 punten.
Diagnostiek in de psychologie TEIque: Traid Emotional Intelligence TAS: meet hoe slecht je in emotionele intelligentie bent (omgekeerde van TEIque) Rosenberg Self-Esteem Scale: psychisch welbevinden, hangt samen met EI ! Definitie beroep 'Psycholoog': in België een beschermd beroep: “een beroep dat zich richt op (1) evaluatie van, (2) interventie in, (3) onderzoek naar en ontwikkeling van methoden voor evaluatie van en interventie in en (4) disseminatie van informatie over menselijk gedragsmatig en mentaal functioneren op basis van de wetenschappelijke discipline van de psychologie”. Diagnostiek in de toegepaste psychologie Diagnostiek is de basis voor de psycholoog, evalueren! Nodig om handelen te oriënteren. 3 sectoren: 1) Klinische psychologie en gezondheids-psychologie 2) Personeels-, Beroepskeuze, Arbeids- en Organisatiepsychologie 3) Onderwijspsychologie
1
1) Klinische psychologie en gezondheidspsychologie
Veld: gedrag en belevingen die niet aan een norm voldoen, veranderingsgericht (hulpverlening, therapie, stress-management), preventie, beleid, het individu staat meestal centraal Instellingen: CGGZ, crisiscentra, revalidatiecentra, klinieken, bedrijfsgezondheidsdiensten, algemene en psychiatrische ziekenhuizen Diagnostische procedures: diagnostische protocollen (DSM), intelligentie- en persoonlijkheidstesten (mentale achteruitgang), projectieve testen (vb. inktplaten, omstreden en niet duidelijk), functionele gedragsanalyse (vb. eetproblematiek, welke cues uit de omgeving houden dat gedrag in stand), diagnose van omgevingssysteem
Vraagstellingen en onderzoeksprocedures: V: Is er sprake van een psychiatrische stoornis? O: Het toepassen van de psychiatrische classificatie-criteria (DSM), het afnemen van de anamnese, interviews en tests V: Wat is de draagkracht / last van een persoon? O: Vergelijking van intellectuele en emotionele capaciteiten in verhouding tot de ernst van stressoren V: Wat is het klimaat op een afdeling, leefgroep of instelling? O: Het observeren en beoordelen met behulp van schalen. V: Is er sprake van een problematische gezins- of echtpaarrelatie? O: Het maken van gezins/relatie-analyse aan de hand van gesprekken, observaties en vragenlijsten 2) Personeels-, Beroepskeuze, Arbeids- en Organisatiepsychologie Personeelspsychologie
Veld: individuele verschillen in prestaties, functie-analyse, functiewaardering, werving, selectie, plaatsing, loopbaanbegeleiding, prestatiebeoordeling, functioneringsgesprekken, training Instellingen: afdelingen personeelszaken (HRM) Diagnostische procedures: testbatterijen voor selectie en plaatsing, diagnostiek van leiderschap en macht
Beroepskeuzepsychologie
Veld: proces van kiezen van opleiding, beroep, werkkring, info over beroepen en vereisten Instellingen: beroepskeuzebureaus Diagnostische procedures: tests voor geschiktheid, interesse, intelligentie en persoonlijkheid (in praktijk geschiktheid en intelligentie vaak zelfde!)
2
Arbeidspsychologie
Veld: kwaliteit van het werk, arbeidssatisfactie, motivatie, ziekteverzuim, stress, betrokkenheid, pesten, absenteïsme Instellingen: selectie- en organisatieadviesbureaus, bedrijfsgezondheidsdiensten, voorlichting & preventiediensten Diagnostische procedures: diagnostiek van individuen, groepen, werkomgevingen, en ‘bedrijfscultuur’: interviews, tests (waarden in kader van werk) Verwant domein: ergonomie
Organisatiepsychologie
Veld: functioneren van personen en groepen in organisaties, samenwerking, competitie, coalitievorming, groepspolarisatie, communicatie, macht, leiderschap Instellingen: staffuncties bij organisatieadviesbureaus, overheid en bedrijven Diagnostische procedures: doorlichting van bedrijf via interview en tests
Vraagstellingen en onderzoeksprocedures (3 domeinen samen) V: Voldoet de kandidaat aan de functie-eisen? O: Screening van de kandidaat met behulp van test en interviews op vooraf gedefinieerde criteria via klassieke tests en assessment centers (rollenspel) V: Is er sprake van stress-oproepende werkomstandigheden? O: Het beoordelen van werkomgeving op inhoud, omstandigheden, voorwaarden, en verhoudingen door middel van observatie en gesprekken V: Heeft de arbeidsorganisatie een goed ‘sociaal klimaat’? O: Beoordelen van organisatie op ordelijkheid, doelgerichtheid, vertrouwen, waardenoriëntatie via observatie en onderzoek omgeving V: Hoe functioneert de persoon in zijn baan? O: Beschrijven van werkwijze, gedragsstijl, beleving en prestaties V: Hoe verloopt het werkoverleg in het team? O: Beschrijven van teambesprekingen in besliskundige en groepsdynamische categorieën. V: Voor welk beroep heeft de persoon belangstelling? O: Onderzoek van beroepsinteresses en –waarden, zelfbeeld, en identiteit V: Is de persoon geschikt voor het gekozen beroep? O: Onderzoeken van voor dat beroep vereiste intellectuele niveau en vaardigheden V: Waarom kan de persoon niet tot een keuze komen? O: Onderzoek van persoonlijkheid, levensloop, levensomstandigheden, en betekenis van keuze 3) Onderwijspsychologie Veld: bestuderen van onderwijsleerprocessen, cognitieve en persoonlijkheidskenmerken, groep en groepsleiding, taakkenmerken Instellingen: CLB Diagnostische procedures: individueel onderzoek van leerlingen, behalen van resultaten 3
Vraagstellingen en onderzoeksprocedures
V: Is er sprake van een hoge begaafdheid? O: Het onderzoeken van intelligentie, creativiteit, interesses en motivatie. V: Wat is het prestatieprofiel van een leerling? O: Het onderzoeken van schoolvorderingen, interesses en motivatie V: Heeft het kind voldoende verstandelijke capaciteiten om de leerstof van de lagere school te kunnen opnemen? O: Onderzoeken van intelligentie en leervermogen. Conclusie: Diagnostiek speelt een centrale rol in (vrijwel) alle toepassingsgebieden van de psychologie. Voor veel toepassingsgebieden is de diagnostiek van de persoonlijkheid en van de intelligentie relevant. Ook relevant voor wetenschappelijk onderzoek. Enkele gangbare definities
: onderscheiding, onderscheidingsvermogen, beslissing De Bruyn (1988): systematisch beslissingsproces waarin verschillende theoretische en empirische onderzoekslijnen samengebracht worden De Zeeuw (1983): individuele verschillen tussen mensen vaststellen om deze kennis toe te passen op het enkele individu, de persoon ten dienste van zijn of haar belang in persoonlijk of maatschappelijk opzicht Van Aarle (1990): op wetenschappelijk verantwoorde wijze verzamelen van informatie omtrent de persoon en zijn omgeving met het oog op het nemen van beslissingen Walsh en Betz (2001): proces van hulp bieden aan personen met hun vragen en problemen (informatieverzameling, begrijpen van de informatie, integreren van de informatie tot een oordeel en advies, interventie om het probleem op te lossen) Jäger & Petermann (1999): wetenschappelijke discipline die methoden ontwikkelt en toepast om relevante kenmerken van personen, groepen, situaties, instituties en zelfs voorwerpen vast te stellen, die vervolgens in een oordeel geïntegreerd moeten worden Een psychologische test of vragenlijst is “… een systematische procedure om gedragingen te classificeren of te meten. Hij stelt in staat om een bewering te doen over een theoretisch attribuut of latente trek van personen of over niet-test gedragingen, bijvoorbeeld, criteriumgedrag, aan de hand van objectief vastgestelde antwoorden op een aantal items. De betekenis van deze antwoorden wordt duidelijk door ze te vergelijken met een representatieve steekproef, of binnen de persoon in de loop van de tijd of op verschillende tijdstippen.” (Drenth & Sijtsma, 2005) The Board agreed a definition of assessment as a “systematic method or procedure for ascertaining the psychological characteristics of an individual or group of individuals, or the performance of an individual or group of individuals”. The Board emphasizes that it intends a broad view of ‘psychological characteristics’ (EFPA Board of Assessment).
4
Enkele begrippen
Psychodiagnostiek: meestal algemeen begrip Diagnose: meestal psychiatrische diagnose, centraal in klinische wereld Psychologisch testen: gestandaardiseerde procedure vb. vragenlijst Psychologische evaluatie: komt terug in definitie van de psychologencommissie (Frans) Assessment: (dit in de Engelse literatuur) meer de overkoepelende term, gebruikt in de Angelsaksische wereld
Assessmentmethoden
(Psychologische) Test: heel veel gebruikte methode Interview: heel breed; ongesructureerd (weinig validiteit) tot heel gestructureerd (coherent) Gedragsobservatie: vb. hoe functioneert kind in de klas (ook van on- naar gestructureerd) Portfolio: vb. kunstenaar, dus competenties Case history: kijken naar wat persoon gedaan heeft, wat gebeurd is in het verleden Rollenspel: wordt gebruikt door assessment centers
Betrokken partijen
Testontwikkelaar: plicht om goed gevalideerd instrument aan te bieden Testgebruiker: adequaat aangewezen gebruik van die test, confidentialiteit Geteste persoon: leerling die niet weet wat te studeren, kandidaat voor een job.. Verwanten/instellingen/organisaties: scholen, werkgevers, The Organisation for Economic Co-operation and Development (OECD) Maatschappij: consequenties van toepassen van die diagnostiek voor bredere maatschappij
Geschiedenis van de psychodiagnostiek Geschiedenis van de theorievorming Al van in het begin van het ontstaan van de psychologie: aandacht voor het meten van assessment. Maar: het meten van assessment <-> zeer historisch belangrijke filosofische traditie van Descartes: dualisme bij de mens: lichaam en ziel. Alles van het lichaam was meetbaar, van de ziel niet. Maar in de labo's van Wundt zag men dat men toch al aandacht had voor psychologische processen (Fechner!) vb. Experimenteel onderzoek van Fechner & Wundt: relatie tussen lichaam en geest: wat is de verhouding tussen de objectieve sterke van een stimulus en de waarneming ervan? -> mathematische uitleg, logaritmische functie! Wet van Fechner: De subjectieve ervaring is proportioneel aan het logaritme van de stimulusintensiteit
5
Wundt: Individuele verschillen in snelheid van zenuwgeleiding oorzaak van verschillen in waarneming. Maakte ook meetinstrumenten. -> Opkomst van empirisch pragmatische epistemologie in VS! De waarde van kennis evalueren: wat je ermee kan doen, werkt het? Geschiedenis van de meetmodellen
Voorlopers: ontwikkeling van theorie van meetfouten (Laplace, Gauss, & Legendre)
Karl Pearson: toepassing op menselijk oordelen (lijnstukken in twee delen: nooit perfect!)
Charles Spearman (1910): betrouwbaarheidscoëfficiënt als correlatie tussen twee testhelften, testen in principe hetzelfde, dus correlatie zogezegd 1
Klassieke testtheorie: Gulliksen (1950) en Lord & Novick (1968) - Ware score is de waarde over een oneindig aantal herhalingen -S=T+E betrouwbaarheid: random fouten validiteit: systematische fouten
Item response theorie: Georg Rasch: Kans op correct antwoord gemodelleerd als logistische functie van vaardigheid van persoon en moeilijkheidsgraad van item Geschiedenis van de testbeweging Historische voorlopers: Selectiesysteem van het Chinese keizerrijk: heel veel verliep bij ons volgens erfelijkheid, in Chinese keizerrijk hadden ze (objectieve!) testen! - ontstaan in 605 tijdens de Sui dynastie - afgeschaft in 1906 tijdens Qing dynastie - sterk georiënteerd op kennis van Confuciaanse teksten en filosofie - hiërarchisch selectiesysteem met selecties op districts-, provinciaal- en hoofdstedelijk niveau - zeer grote druk (high stakes selection) - bestrijden van fraude Europa: Universitaire examens zoals Bologna (13de), Oxford (17de), vanaf 1860 veralgemeend in Europa en de VS
6
Voorlopers vanuit de psychiatrie: Esquirol (1850) en Segin (1860): idiotie versus dementie. Idiotie is een mentale cognitieve beperking (blijvend), dementie is een psychische aandoening (komen en gaan) Classificatiesysteem van Kraepelin: Minnesota Multiphasic Personality Inventory (MMPI) Medisch model: syndroom als gevolg van pathologisch proces DSM als geheel van afspraken: recente discussie over DSM-V Minnesota Multiphasic Personality Inventory (MMPI): Hathaway & McKinley (1943): psychopathologie en persoonlijkheidsaspecten efficiënt inventariseren, maar men is niet begonnen vanuit een theoretische fundering voor de items. Men heeft de items voorgelegd aan klinische groep en aan 'normale', en dan gekeken naar hoe mensen op die items antwoordden. Dan die items gekozen die verschillend waren tussen de twee groepen. 1000 potentiële items: bestaande vragenlijsten, beoordelingsschalen, psychiatrische interviews, handboeken psychiatrie, persoonlijke ervaring (504 geteste items) Matige, niet-psychopatologische vormen ontdekken -> Empirische itemselectie! Klinische groepen van normalen differentiëren Klinische groepen onderling onderscheiden Maatschappelijke context voor ontstaan van testbeweging: sterke bevolkingsgroei industrialisering verstedelijking complexer worden van maatschappij 1. Sir Francis Galton (1822-1911) neef van Charles Darwin: genetische benadering "Whenever you can, count." Inquiries into Human Faculties and its development (1883): fysische en psychofysische metingen (vb. onderscheiden twee gewichtjes) (in de traditie van het Engels empirisme) stelde het begrip 'intelligentie" aan de orde (boek: erfelijk!) co-relations founding father van assessment 2. James McKeen Cattell leerling van Wundt en Galton "Mental Tests" met fysiologische en sensorische focus (1890), vb.: - Sterkte van handgreep - Snelheid van handbeweging - Onderscheiden van gewichten - Oordeel over verstreken tijd - Hoeveelheid druk nodig om pijn te voelen Wissler (1901), -> ging ervan uit dat er geen onderliggende mentale vaardigheid was, heeft psychologie opgegeven! maar Jensen (1998) 7
3. Alfred Binet focus op hogere mentale processen eenvoudige taken die aandacht houden! methode selecteren voor bijzonder onderwijs (opgelegd door ministerie van onderwijs) 1905: eerste test 1908: mentale leeftijd (erna dan: IQ = MA/CA *100) 1911: met vijf items per leeftijdscategorie, die typisch waren voor die leeftijd verder in VS ontwikkeld door Terman: Stanford-Binettest (Termites) 4. Henry Herbert Goddard Past Simon-Binet-test toe in “Training school for feeble minded boys and girls” Overtuigt hele geledingen van Amerikaanse maatschappij van gebruik van IQ-tests Testen van immigranten: ongeveer 80% van Oost-Europese migranten gediagnosticeerd als “morons” Aanhanger van eugenetica (=mogelijkheid voortplanting ontnemen bij laag IQ) 5. Yerkes: groeptests in het leger Army Alpha-test (1921) - Opvolgen van mondelinge instructies (op een blad) - Rekenkundig redeneren - Praktisch oordelen - Synoniem-antoniemparen - Door elkaar gegooide zinnen - Cijferreeksen aanvullen - Analogieën - Informatie (algemene kennis) Army Beta-test (non-verbale test via pantomime): er waren veel immigranten die geen Engels konden, ofwel konden ze wel Engels, maar waren ze niet gealfabetiseerd. -> pantomime (maar heel saai!) inhoud van de test gaat ook verschuiven. Meet niet helemaal hetzelfde als verbale tests! - visueel-perceptuele tests en motorische tests - Brigham (1923) in A study of American Intelligence: “… process of racial intermixture … with the resulting deterioration of American intelligence”: analyseerde de testingen in Amerikaanse leger, en vond dat er grote etno-culturele verschillen waren. Hij dacht dat de testen een rechtstreeks beeld gaf van genetisch bepaalde intelligentie. Dus als verschillende groepen verschillen, moet je ze zeker apart zetten! (segregeren: heel lang daardoor 'segregatie' in U.S.A. zwarten-blanken. man-vrouw: geen verschil, maar wel in rechten, vb. geen stemrecht vrouwen. hiervoor niet 'gestraft', maar onterecht) - Andere typen tests: SAT, persoonlijkheid.. - grote culturele verschillen, alhoewel al minder dan bij verbale tests
8
Les 2: Validiteit Introductie op begrip validiteit Definitie = meten wat we beogen te meten, niet zoals in positieve wetenschappen rechtstreeks observeren "Validity is an integrative evaluative judgment of the degree to which empirical evidence and theoretical rationales support the adequacy and appropriateness of inferences and actions based on test scores and other modes of assessment” (Samuel Messick) Testscore = samenvatting van consistentie van gedrag - kijken naar consistentie in gedrag en itemresponsen - meten is samenvatting van consistenties in een score - brede betekenis van score Validiteit = inductieve samenvatting van zowel de bestaande evidentie voor en de mogelijke consequenties van score-interpretatie en -gebruik Niet de test maar de score-interpretatie wordt gevalideerd Validiteit is een kwestie van mate, niet van 'ja' of 'nee' Validiteit is een zich ontwikkelende eigenschap en validering een continue proces Kernaspecten van Messick’s benadering: - Validiteit is unitair concept: verschillende aspecten onder 1 paraplu - Gebruikt methoden van de wetenschap ‣ inferenties = hypothesen ‣ gebruik van alle experimentele, statistische en filosofische middelen
Scores Scores, maar niet de test op zich, afhankelijk van - Persoon: vb. rekening houden met dyslexie, - Meetcontext: vb. WISE niet gebruiken voor toegangsexamen geneeskunde (algemeen) Betekenis in het specifieke geval Gradaties van generaliseerbaarheid
Scores als steekproef of als teken 2 vormen van interpretaties van scores
Steekproef: testgedrag als steekproef van domein van gedrag vb. examen: voor elk onderdeel een paar vragen, zodat alles behandeld wordt in examen -> uitspraak kennis Teken: testgedrag als teken (= indicatie) van onderliggende processen en trekken vb. klassieke intelligentietest 9
Vanwaar komen responsconsistenties? - Trek: stabiel kenmerk, proces of dispositie vb. intelligentie - Toestand: tijdelijke conditie van gemoed vb. emoties, kwaad - Responsklasse: zelfde functionele relaties met antecedente, concurrente en consequente stimuluscondities (leergeschiedenis: leerpsychologen) Trekvaliditeit: twee begrippen meten met zelfde verschillende methodes, en dan kijken als we echt twee verschillende begrippen gemeten hebben. Maar, verwarrend gebruik! Niet: meten van psychologische trekken.
Bronnen van evidentie Evidentie = data + rationale, feiten + theorie Data spreken niet voor zich: je kan een test hebben die slaagkans meet voor geneeskunde, maar het feit dat die test correleert met einduitslag, is niet genoeg! We moeten ook weten wat we aan het meten zijn (theorie errond). Testcriteriumcorrelaties zijn niet voldoende: waarom en de theorie erachter ook nodig! 3 grote vormen van validiteit: 1. Inhoudsvaliditeit: in welke mate bevat het instrument een representatieve en relevante steekproef van de gedragingen waar men een uitspraak wil over doen? - relevantie en representativiteit, maar omvat geen testresponsen - is op zich geen validiteit want gaat niet over score-inferenties Het feit dat de inhoud ok is, wil niet zeggen dat het gedrag op die test het gedrag is dat we willen observeren. (vb. dyslexie of op werk hedonisme aanvinken) 2. Criteriumgerelateerde validiteit: men wil graag relevant gedrag voorspellen: predictieve (gedrag dat in de toekomst ligt) en concurrente validiteit (test en criterium tegelijk afnemen: praktischer) - evenveel vormen als er criteria zijn - op zich kwetsbaar voor gebrek aan inhoudsrelevantie en nadelige sociale consequenties (hogere studies aanvangen of niet) 3. Constructvaliditeit: begrijpen wat je aan het meten bent. Welke verklarende concepten, variabelen verklaren hoe je het doet op de test? - geen strikt operationalisme: wat we meten definiëren door test zelf - omvat inhoudsrelevantie en -representativiteit en criteriumgerelateerde aspecten - inschatting van sociale consequenties ontbreekt
10
Vroeger: de 3 vormen van validiteit stonden op zichzelf, als je op eentje goed scoorde, was het ok. Maar Messick vond dat je op alle 3 goed moest scoren, niet onafhankelijk! Men is hem daarin gevolgd. Je moet ze geïntegreerd bekijken.
Historische trends Van specifieke criteria over typen van validiteit naar unitaire conceptualisering - Guilford (1946): “in a very general sense, a test is valid for anything with which it correlates” - APA Standards (1974): "the holy tree" - Cronbach (1980): “all validation is one” Fundamentele focus: van predictie naar verklaring, begrijp ik wat ik meet? + aantonen dat je dat meet, en niet iets anders! Betekenis en waarden Twee facetten om unitair validiteitsconcept op te splitsen:
Bron van rechtvaardiging van het testen: - Evidentie als basis - Consequenties als basis Functie van het testen: - Testinterpretatie - Testgebruik Evidentie voor testinterpretatie - Constructvaliditeit ‣
Omvat inhoudsvaliditeit
‣
Omvat criteriumvaliditeit
‣
Verleiding: slechts op één type evidentie beroep doen
11
Evidentie voor testgebruik - Relevantie voor specifieke toepassing - Utiliteit: test-criterium correlatie + kosten-baten analyse van testen - Constructvaliditeit: Sluit relevantie en utiliteit aan bij betekenis van item- en testscores? Consequenties van testinterpretatie - Waardenimplicaties: vb. psychopathielabel gegeven - Constructvaliditeit: Zijn de waardenimplicaties het gevolg van wat de test bedoelt te meten? Consequenties van testgebruik - Sociale consequenties: vb. mechanisch redeneren in toegangstest steken voor psychologie -> veel minder vrouwen in opleiding (zijn daar minder goed in) - Constructvaliditeit: Zijn de sociale consequenties het gevolg van wat de test bedoelt te meten? Filosofische achtergronden Verklarend versus normatief gebruik van filosofie Kritiek op validiteitconcepten: gebaseerd op voorbijgestreefde filosofische principes Relatie tussen unitair concept van validiteit en wetenschapsfilosofische benaderingen a) Logisch positivisme Basis voor constructvaliditeit: Cronbach & Meehl (1955) Betekenis = logische/mathematische structuur + corresponentieregels + feitelijke verificeerbaarheid: empirisch observeerbaar Twee benaderingen: - Empiristische benadering: operationalisme - Syntactische benadering: nomologisch netwerk. eerst een theorie hebben, daarna toesten Feedback tussen observatie- en theoretisch niveau Eerste uitwerking van concept “constructvaliditeit”: noodzaak van nomologisch netwerk: alle mogelijke verbanden tussen theoretische constructen b) Positivisme - Relativisme - Rationalisme Kritieken op het positivisme: Niet verificeerbaarheid maar falcifieerbaarheid (Popper): alternatieve theorieën + strijdige bevindingen vb. zwarte zwanen Onafhankelijkheid van theoretische en observationele termen? Nee: - Theorie maakt het mogelijk om fenomenen te onderzoeken (Hanson) - Wetenschappelijke paradigma's en paradigmashifts: op een bepaald ogenblik is een theoretische benadering dominant, dan paradigmashift, dus andere benadering! (totaalbeeld waarbinnen met onderzoek uitvoert) (Kuhn) 12
- Fundamentele incommensurabiliteit van theorieën (Feyerabend): geen overlap tussen ervaringen. Men spreekt over andere dingen, maar denken dat ze over hetzelfde praten, dus overlap en discussie erover. De theorie waarin je geïnteresseerd bent, bepaalt mee wat je ziet! Reactie: extreem relativisme: er bestaan geen absolute waarheden, enkel theoretische kaders die mensen zelf maken, dus deze kunnen we enkel bekijken - ‘mind and world cannot be separated’: constructie van realiteit - gaat samen met naturalistische en kwalitatieve onderzoeksmethoden - scheiding tussen wetenschap en objectiviteit: wetenschap kan niet meer objectief zijn, geen absolute wetenschap meer. Consequentie van relativisme: iets heeft maar betekenis binnen een theorie, maar niet meer daarbuiten! Problemen met beiden: - probleem positivisten en falsificationisten: statisch, maar hoe verandering? - probleem relativisten: rationaliteit intern aan paradigma Antwoorden: Graduele evolutie van theorieën - Onderzoeksprogramma’s (Lakatos): wanneer theorie niet bevestigd werd, kan het zijn dat de theorie niet correct is, of dat de methode niet geschikt was vb. snelheid handbeweging - intelligentie : methodeprobleem ‣
onderscheid kerntheorie en achtergrondtheorieën (methoden, instrumenten)
‣ cfr. multimethodebenadering voor kwaliteitsbenadering vb. voor diagnostiek verschillende informanten gebruiken: ouders, leekracht en kind zelf - Wetenschappelijk domein (Shapere): ‣
total body of information a theory is expected to account for
‣ “unloading” van informatie: observaties veelvoudig theoriegeladen op verschillende niveaus vb. depressie volgens Beck en Bett, leerpsychologischcognitieve benadering en de psychoanalytische benandering, maar ze bedoelen hetzelfde, met andere woorden gepresenteerd ‣
cfr. relevantie en representativiteit
- Rationaliteit van menselijke activiteit (Toulmin): ‣ rationele weddenschappen: wetenschap is dynamisch, we weten niet waar we zullen uitkomen (weddenschap) ‣
cfr. validiteit als een zich ontwikkelende eigenschap
13
c) Van instrumentalisme naar realisme Ontologische status van theoretische entiteiten in - Logisch-positivisme: betekenis is contextueel (coherence or instrumentalist theory) - Relativisme: binnen theorie (instrumentalisme) Realiteitstesting in falsificationisme en graduele evolutie van theorieën - Realisme: reëel bestaande attributen in de wereld die onderzoeken sturen - Kritisch of constructivistisch realisme: reëel bestaande attributen, maar enkel toegang van constructies - Causaliteit centraal, maar niet in gesloten systeem - Cfr. Constructrepresentatie: we gaan een test valideren door de onderliggende psychologische processen in kaart te brengen die leiden tot het testgedrag: causaliteit!
14
d) Van formele naar recursieve systemen van onderzoek Leibniziaans onderzoekssysteem: vb. relativiteitstheorie van Einstein - Formele, symbolische benadering: deductief - Borg: specificatie van standaarden + consistentie, volledigheid, omvattendheid Lockeaans onderzoekssysteem: vb. big five - Empirisch inductieve benadering: elementaire data, werken met aanvaarde methoden - Borg: consensus over objectiviteit van data en methoden Kantiaans onderzoekssysteem: vb. vergelijking tussen twee intelligentiemodellen - Doelbewuste formulering of identificatie van alternatieve (niet antagonistische) perspectieven - Borg: goodness of fit tussen theorie en data Hegeliaans onderzoekssysteem: vb. Binet-test intelligentie wel/niet genetisch bepaald - Doelbewuste formulering van antagonistische, antithetische perspectieven - Borg: conflict (verborgen assumpties en latente inconsistenties naar boven brengen) Singeriaans onderzoekssysteem: vb. - Observeren van onderzoekssystemen: recursief toepassen op elkaar - Onderzoeken van ethische implicaties - Borg: vooruitgang door successieve benaderingen Elk onderzoekssysteem komt in aanmerking om de validiteit te onderbouwen, maar zowel op zoek gaan naar convergente als discriminante evidentie. We gaan proberen onze theorieën te bevestigen, maar ook te weerleggen! Kijken naar alternatieve hypothese.
15
Evidentie als basis voor testinterpretatie: construct validiteit Definitie Construct validity = the evidence and rationales supporting the trustworthiness of score interpretation in terms of explanatory concepts that account for both test performance and relationships with other variables. Bedreigingen Niet alleen toevalsfouten in meting: meting als onvolkomen toonbeeld van het construct -> construct A,B,C gemeten als A+B+X, A+C+Y, B+C+Z en X is vb. sociale wenselijkheid, instemmingstendens of extremiteit Iets té weinig = construct onderrepresentatie -> breedte van het inhoudsdomein representeren Iets té veel = construct irrelevante surplus -> constructirrelevante moeilijkheid vb. taal te moeilijk, en niets te maken met test -> constructirrelevante gemakkelijkheid: “testwiseness” vb. trucje kennen voor giscorrectie Twee typen evidentie samen nodig: Aantonen van implicaties van construct = convergente validiteit -> A+B+C, maar enkel A+X en B+X gemeten Relaties niet toe te schrijven aan alternatief construct = discriminante validiteit -> rivaliserend construct: methode -> meting = construct-methode-eenheid, specifieke methodevariantie leidt tot monomethodebias Convergente en divergente validiteit moeten allebei aanwezig zijn om kwaliteitsvolle test te hebben! Gebrek aan convergerende en divergerende evidentie: - Test meet construct niet goed: methodefout - Constructtheorie is fout: bestaat emotionele intelligentie wel? - Aanvullende hypothesen zijn deficiënt - Onderzoek (experimenteel opzet) is niet adequaat (vb. onbetrouwbaarheid, kleine steekproef, slechte training indien twee meetmomenten met training tussen) Evidentie op basis van inhoud Traditioneel: test = steekproef van bepaald gedragsdomein of itemuniversum Hoofdvragen: - Specificatie van aard en grenzen van domein: wat behoort tot domein? - Relevantie - Representativiteit
16
Drie operationaliseringen van inhoudsvaliditeit: - Inhoud in test < inhoud van domein - Gedragingen in test < gedragingen in domein - Processen in test < processen in domein
Aard van gedragsdomein belangrijk bij: - Testconstructie: blauwdruk -Testgebruik: relevantie en representativiteit voor toegepast domein Domeinconceptualisering: - grenzen - facetten: herkennen, kennen en managen Constructtheorie essentieel voor domein-beschrijving: referentiedomein = geheel van informatie waarvoor construct verklaring moet bieden Inhoudsrelevantie Oordelen voor relevantie van testitems of –taken Alle aspecten van testprocedure in rekening brengen: - inhoud, gedragingen, processen - stimulusopmaak: video of geschreven format - antwoordalternatieven: 'fortement d'accord' of 'tout à fait d'accord' heeft verschil! (dagelijkse taal of niet) - uitvoeringscondities: vrijwillig of selectiecontext helemaal anders! - criteria voor scoren van items: vb. mogen er punten afgetrokken worden op -dt fouten in bijvoorbeeld toets aardrijkskunde? Inhoudsrepresentativiteit Veronderstelt specificatie van grenzen van en onderverdelingen in domein Subdomeinen representeren volgens: - uniformiteit, elk aspect even veel aan bod laten komen - voorkomen in realiteit - belangrijkheid van componenten Beperkingen van inhoud als enige basis voor validiteit Ebel (1961): “If the test we propose to use provides in itself the best available operational definition, the concept of validity does not apply” - maar, best available = best conceivable? Ebel (1983): operational definition + rational justification - maar, rationele verantwoordingen zijn hypotheses, geen garanties voor validiteit Inhoudsvaliditeit geen eigenschap IN de test, maar van oordeel van experts: - over domeinrelevantie en –representativiteit - over relatie tussen test- en referentiedomein
17
Inhoudsgebaseerde inferenties zijn in het beste geval unidirectioneel: - hoge scorers moeten de vaardigheid bezitten - over lage scorers kan men weinig zeggen Conclusie: Inhoud is onvoldoende (contexteffecten en irrelevante methode-effecten steeds mogelijk), maar essentieel onderdeel van valideringsproces Evidentie op basis van interne structuur Substantieve component = confrontatie tussen beoordeelde inhoudsrelevantie/representativiteit én empirische antwoordconsistentie Interne structuur = modelleren van empirische antwoordconsistenties Interne structuur modellen: - cumulatief-kwantitatieve modellen: factoranalyse en irt-modellen: lineair model, hoe meer items je oplost, hoe hoger je vaardigheid. je telt gewoon op! - nabijheidsmodel (ontvouwing): vb. politieke voorkeuren, niet zomaar links-rechts - niet-compensatorisch intensiteits of kwaliteitsmodel: vb. creativiteit meten, elk 10 opdrachtjes maken. Een iemand heeft op elke taak een 1/10, andere 10/10 op 1 taak, de rest 0/10. Laatste waarschijnlijk meest creatiefst! - klassenmodel: veronderstellen dat er kwalitatief verschillende types van mensen zijn - dynamisch model: eenzelfde construct kan tot verschillende manieren tot uiting komen, maar niet tezelfdertijd. vb. freezing of weglopen - ipsatieve model: persoon vergelijken met zichzelf, niet met anderen Structurele getrouwheid (structural fidelity): overeenkomst van structurele relaties tussen testitem met andere manifestaties van construct Overeenkomst tussen scoremodel en score-interpretatie: - modelvermenging: elk model moet worden verantwoord (vb. dimensie & cutoff) - modelverwarring: scores via één en interpretatie via ander meetmodel (vb. MMPI)
Evidentie op basis van responsprocessen Causaal modelleren van item- of taakprestaties Identificeren van mechanismen onderliggend aan taakprestaties Decompositie van taak i.t.v. componentprocessen Voorbeeld: Componentieel model voor analoog redeneren - Opsplitsen van globale taak in subtaken - Meten van elk van de subtaken
18
1. 2. 3. 4. 5.
Encoderen: coderen van de attributen (groot, blij, man, zwarte hoed) Inferentie van relatie tussen A en B: blij naar droevig, man naar vrouw Mapping (afbeelden) relatie A en C: van groot naar klein Toepassen van AB-relatie op CD: droevig, klein, vrouw met zwarte hoed Produceren van correct antwoord: subcomponenten 1. Genereren van kandidaat 2. Vergelijken tussen alternatieven 3. Proces van verantwoording indien ze niet matchen -> gaan ervan uit dat iedereen dezelfde stappen overloopt! (niet waar)
Evidentie op basis van relatie met andere variabelen Overeenkomst tussen verwachte en geobserveerde relaties van test met andere tests en non-testgedrag Het construct moet de relaties kunnen verklaren Meestal met totaalscore (= tussenliggende variabele tussen geobserveerde consistenties en externe variabelen) Twee typen relaties: - relaties tussen de test en andere methoden om hetzelfde en onderscheiden constructen te meten: trekvaliditeit - relaties met maten van andere constructen: nomologische validiteit Trekvaliditeit en de multitrek-multimethode matrix Bij trekvaliditeit, construct niet steeds ingebed in sterk uitgewerkt theoretisch kader, soms gewoon lekenconstructen: niet goed voor nomologisch netwerk, maar wel voor convergente en divergente validiteit. Bij multitrek-multimethode matrix wel theorietisch kader nodig! Trekvaliditeit = construct mag niet aan één enkele methode verbonden zijn, noch ongehoord redundant met andere constructen Twee typen redundantie (overlap) - gewenste: over methoden, zoveel mogelijk overlap observeren - ongewenste: met andere constructen mag er geen overlap zijn, twee andere dingen 19
Multimethode-multitrekmatrix (Campbell & Fiske, 1959): wat kan ik toeschrijven aan de trekken, en in welke mate is er sprake van methode effecten? Deze twee systematisch uit elkaar halen met zo'n matrix.
Nomologische validiteit en nomothetische spanwijdte Nomologische validiteit = overeenkomst tussen theoretische relaties van construct en geobserveerde relaties met andere variabelen Nomologische ruis: methode effect, vb. persoonlijkheid en jobprestatie beiden onderliggend aan sociale wenselijkheid, dus te sterke verbanden, of verbanden die er wel moeten zijn, niet vinden, vb. - ongewenste impact van methodefactoren (werken met multimethode-benadering) - verschillen in scorebetrouwbaarheid Nomothetische spanwijdte = met hoeveel andere variabelen hangt mijn meting samen? (IQ test is een test met een heel grote spanwijdte) empirisch netwerk van relaties van test met: - metingen van andere constructen - andere metingen van zelfde construct - criterium gedrag
Sterke versus zwakke constructvalidering
Sterke constructvalidering: duidelijke theorie + deductieve benadering Zwakke constructvalidering: geobserveerde relaties zonder duidelijk theoretisch kader, meer empirisch Maar interactie tussen Leibnitziaans en Lockiaanse onderzoeksbenaderingen
20
Soorten gegevens en analyses a. Beoordelings- en logische analyses: oordelen van items b. Correlatie- en covariantie-analyses: correlaties bekijken c. Analyses van het proces d. Analyses van groepsverschillen en veranderingen doorheen de tijd e. Gevoeligheid van scores voor experimentele behandelingen en manipulatie van condities a. Beoordelings- en logische analyses (relevantie en representativiteit beoordelen en fouten zien) Identificeren van mogelijke rivaliserende hypothesen voor score-interpretatie: wat kan ertoe leiden dat mijn scores niet kunnen geïnterpreteerd worden?
uitbreiden van itempool: items toevoegen aanpassen van antwoordformaat: vb. doolhoventest, niet overal papier-potlood gewend! aanpassen van procedure: vb. op computer ipv papier-potlood, video's ipv tekst keuze van data-analyse: nadenken over interne structuur -> goed model kiezen
Voorbeeld: test voor leesbegrip - alternatieve hypothesen: woordenschat (te moeilijk), geheugen (beter geheugen, dus meer herinneren), leessnelheid (mensen die sneller lezen, beter) - mogelijkheden: aanpassen woordenschat, minder directe matching vragen, tijdslimieten aanpassen b. Correlatie- en covariantie-analyses Multimethode-multitrek: - convergentie van indicatoren: samenhangen van zelfde constructen - onderscheidingsvermogen ten overstaan van andere constructen - consistentie over methoden Exploratorische factoranalyse: meest gebruikte methode om de interne structuur van een test aan te tonen, te onderzoeken
21
- beperkt aantal factoren onderliggend aan correlatiematrix - factorinterpretatie = te toetsen hypothese - zowel convergente als divergente informatie - onregelmatige bevindingen kunnen leiden tot aanpassen van theorie
Ze hebben in dit onderzoek 18 lichamelijke klachten voorgelegd aan studenten en volwassenen, en wat bleek; je kan deze 18 items opdelen in 5 factoren. Confirmatorische factoranalyse: Antwoorden op verschillende indicatoren terugbrengen vanuit een beperkt aantal onderliggende indicatoren. Hierbij moet je dus op voorhand zeggen wat/welk model je verwacht. Dus is het een deductieve benadering.
22
Regressieanalyse, padanalyse en structurele vergelijkingsmodellen: modellen om nomologisch netwerk te onderzoeken - modelleren van causale structuur
c. Procesanalyse: proberen te begrijpen hoe de score tot stand komt Protocolanalyses: vb. vragen om luidop na te denken of het op te schrijven Computermodellering: werkgeheugen aanpassen Chronometrische analyses: je meet de snelheid Cognitieve correlaten: cognitieve maat afnemen en die correleren met gedrag dat je bestudeert. vb. 'star above sun' en zo snel mogelijk 'juist' of 'fout' zeggen. Twee manieren om dit op te lossen: visueel of verbaal. Visueel: je stelt de zin visueel voor en kijkt of deze overeenkomt met de tekening, of verbaal: hetgeen je ziet omzetten in een zin en dan de 2 zinnen vergelijken Analyse van de redenen: vragen, 'waarom doe je dit?' Analyse van de oogbewegingen Analyse van de systematische fouten: vb. water in twee verschillende bekers (Piaget) Analyse van de strategieën en stijlen van taakprestatie (individuele verschillen) Mathematische/psychometrische modellering - Complexiteitsfactoren (vb. encoderings-complexiteit + transformatiecomplexiteit (hoeveel moet die figuur gedraaid worden) = moeilijkheid geometrische analogieën) - Subtaken (vb. idee genereren + beoordelen op adequaatheid = divergente productietaak) vb. 'wat kan je allemaal doen met een baksteen?' d.
Analyses van groepsverschillen en verschillen doorheen de tijd Longitudinale analyse: relatieve stabiliteit en ontwikkelingsveranderingen Verschillen tussen vooraf gekende groepen Verschillen tussen experts en beginnelingen: kwalitatieve verschillen Test-hertestbetrouwbaarheid overeenkomstig met het construct (vb. trek vs gemoedstoestand) Veranderingen in scoreniveau, scorevariabiliteit en dimensionale structuur
23
e. Gevoeligheid van scores voor experimentele behandelingen en manipulatie van condities Is impact van behandeling, interventie, instructie in overeenstemming met theoretische verwachtingen? Systematische manipulatie van item-eigenschappen of testcondities (instemming belangrijker onder hoge tijdsdruk) Veralgemening van constructbetekenis Generaliseerbaarheid (niet gelijk aan validiteit!) van betekenis van testscores mag niet worden verondersteld! Populatiegeneraliseerbaarheid: vb. Turkse kinderen en Vlaamse kinderen Ecologische generaliseerbaarheid: kunnen we een testsituatie generaliseren naar een andere context? standaardisering als mogelijke bron van verschillen Temporele generaliseerbaarheid: stabiliteit & continuïteit Taakgeneraliseerbaarheid: van assessment naar reële taak Consequentie als basis voor testinterpretatie: waardenimplicaties (Messick) Waarden eigen aan validiteit - Waardengeladenheid van theorieën: de vraag is niet langer of maar hoe waarden in rekening moeten worden gebracht - “valid” en “value” afgeleid van zelfde Latijnse stam, “valere”: sterk zijn Houden beide verband met Franse “valoir” wat betekent “waard zijn” - Waardenvertekening (bias): “intrusion of ordinarily tacit extrascientific motives or beliefs into the fulfillment of scientific purposes” - Maar waarden ook intrinsiek relevant, vb. beroepsethiek - Wanneer +/-: “Values make for bias, not when they dictate problems, but when they prejudge solutions” (Kaplan) - Hoe mee omgaan: expliciet aan de orde stellen in het onderzoek Bronnen van waardenimplicaties bij metingen en constructen - De waarde van constructnamen ‣ “Flexibiliteit versus rigiditeit” versus “Verwarring versus consistentie” ‣ “Geïnhibeerd versus impulsief” of “zelfcontrole versus expressiviteit” ‣ “Stress” versus “uitdaging” ‣ Streven naar trekimplicaties en evaluatieve implicaties van de naam, of uitklaren van conflicterende waardenimplicaties ‣ Constructen verwijzen zowel naar mogelijke als actuele relaties - De waarde van theorieën ‣ Niet alleen constructnamen, maar bredere theorieën bepalen hoe observaties worden geïnterpreteerd 24
‣ Voorbeeld: intellectuele vaardigheden ‧
Oorsprong en ontwikkeling
‧
Beperkingen en mogelijkheden van leren
‧ Favoriete onderzoeksbenaderingen -> Impliciete waardenovertuigingen over aard van mens-zijn en maakbaarheid van de mens - De waarde van ideologieën ‣ Niet alleen namen en theorieën, maar ook ideologieën geven perspectief en richting ‣ Ideologie = een complexe configuratie van gedeelde waarden, affecten en overtuigingen die een interpretatiekader van de wereld bieden ‣ Vb. institutioneel-universalistisch paradigma (men gaat ervan uit dat men een zekere kennis heeft en dat men deze kan leren, dus gestandaardiseerd testen) versus participatorisch-selectivistisch paradigma (niet iedereen heeft zelfde leerervaring en eigen ontwikkeling) Methodologieën voor het identificeren van waarden en waardenvertekeningen - Hoe subtiele impact van namen, theorieën en ideologieën op het spoor komen? Kantiaanse, Hegeliaanse en Singeriaanse benaderingen om tot waarden te komen, niet tot consensus komen, maar conflict - Ook waardenimplicaties moeten empirisch ondersteund en rationeel onderbouwd worden
Evidentie als basis voor testgebruik: Construct validiteit + relevantie + utiliteit Construct validiteit: oordeel over relevantie, utiliteit en passendheid alleen in licht van scorebetekenis - Zelfs bij diplomering of voorspellen van jobsucces: achterliggende theorie van curriculum of van job - Correlatie zonder score-interpretatie op zich onvoldoende: vb. predictie van schoolsucces op basis van prestatiemotivatie of volgzaamheid Relevantie en representativiteit ten overstaan van - curriculum / onderwezen stof (vb. geen mechanica in psychologietest) ‣ prestatie: kennis als resultaat van instructie ‣ competentie: kennis en vaardigheid in inhoudelijk gebied ongeacht hoe ze tot stand gekomen is - job 25
Test-criterium relaties: hoe sterk test en het echte criterium (vb. slagen unief) correleren - Ook betrouwbaarheid van de criteriummeting - Ook constructvaliditeit van criteriummeting ‣ construct irrelevantie: criteriumcontaminatie (vb. je meet relatie met baas) ‣ construct onderrepresentatie: criteriumdeficiëntie - Test-criterium relaties meestal georiënteerd op convergerende verbanden, zelden op discriminante evidentie! = mogelijke zwakte (andere constructen, methodevariantie) - Selectie- versus classificatiebeslissingen: ja/nee versus toewijzing aan behandeling - Concurrente versus toekomstige criteria Beslissingsutiliteit - Niet alleen sterkte van test-criterium relatie - Maar ook: ‣
base rate: proportie individuen die potentieel zouden slagen in programma of in job
‣
selection ratio: proportie individuen die boven de predictor cutoff scoren
‣ kosten die de testing met zich mee brengt - Rekening houden met fairheid Validiteitsgeneralisatie - Specifieke validiteit versus gegeneraliseerde validiteit: grote variatie in criteriumpredictorcorrelaties omwille van meetfouten en artefacten (administratieve fouten, té kleine steekproeven, correlaties met niet-continue variabelen, beperking van bereik, onbetrouwbaarheid van het criterium) - Schmidt & Hunter: niet situatie, maar vooral meetfouten en artefacten (r = .50 tussen ‘general mental abilities’ en ‘work sample tests’) - Belang van meta-analysestudies voor cumulatie van kennis (maar confirmation bias)
26
Consequenties als basis voor testgebruik: Sociale consequenties Anticiperen van neveneffecten en bijproducten - Nadelige effecten het gevolg van constructrelevantie of constructirrelevante testvariantie - Vb. meerkeuze prestatietoetsen kunnen leiden tot meer nadruk op geheugen en analytische vaardigheden dan op divergent denken en synthetische vaardigheden - Dus niet alleen bedoelde doelstelling, maar geheel van effecten moeten in rekening worden gebracht Voorgesteld gebruik afzetten tegen alternatieven - Tegenvoorstellen: gebruik van andere assessmentprocedures - Sociale consequenties van gebruik versus niet-gebruik
Implicaties bekijken vanuit verschillende waardenperspectieven, bijvoorbeeld distributieve rechtvaardigheid (vaardigheden, inzet, realisaties, billijkheid, noden, gelijke mogelijkheden, vraag en aanbod op de markt, principe van reciprociteit, algemeen belang, boven een bepaald minimum, gelijkheid)
27
Les 3: Betrouwbaarheid/Precisie Onderscheid tussen systematische en toevalsfouten
Systematische meetfouten: - Construct irrelevante surplus - Validiteitsprobleem
Toevalsfouten - Niet eigen aan meeting of gestandaardiseerde context van meeting - Betrouwbaarheidsprobleem
Oorzaken van onbetrouwbaarheid
Testconstructie: steekproef van inhoud (juist dat land weet hij niet liggen), gedrag, processen
Testafname: - factoren eigen aan testcontext vb. vrijdagavond, het is er koud,.. - factoren eigen aan geteste persoon vb. ziek zijn - factoren eigen aan testleider vb. onzorgvuldigheid
Testscoring en testinterpretatie: hoe het antwoord wordt beoordeeld
Betrouwbaarheid binnen de klassieke testtheorie Basisprincipes van klassieke testtheorie
28
Test-hertestbetrouwbaarheid Twee afnames (niet te kort na elkaar, herinneringeffecten vermijden) Afhankelijk van lengte van het testinterval! Betrouwbaarheid van stabiele kenmerken Foutenbron: testafname Maat: Pearsoncorrelatie (stabiliteitscoëfficiënt)
Parallelle vormen / Alternatieve vormen betrouwbaarheid 1 of 2 afnames Indien er nood is aan verschillende versies Parallelle vormen: zelfde geobserveerde gemiddelden, standaarddeviaties, correlatie met ware score Alternatieve vormen: enkel equivalent in termen van inhoud en itemmoeilijkheid Foutenbron: testconstructie en testafname Maat: Pearsoncorrelatie Interne consistentie
1 afname samenhang tussen items binnen een schaal: evalueren van homogeniteit foutenbron: testcontructie maten: - split-halfbetrouwbaarheid: Spearman-Brown formule (geeft onderschatting)
of
belang van testlengte! hoe meer items opgenomen, hoe betrouwbaarder - Kudor-Richardson 20 voor dichotome items: - Cronbach's alfa voor Likertschalen: indien geen enkel verband: laatste twee = 0 (ondergrens) 29
Interbeoordelaarsbetrouwbaarheid
1 afname overeenkomst tussen beoordelaars en zelfde antwoord foutenbron: scoring en interpretatie maten: - Cohen's kappa: - Pearsoncorrelatie -Intraklasse correlatie
Betrouwbaarheid in functie van aard van de test Homogeniteit versus heterogeniteit van de test Trekken vs toestanden Snelheids- versus krachttests (power test) Criteriumbepaalde tests Betrouwbaarheidskwesties Variabiliteit van de betrouwbaarheid: beperking van bereik
Betrouwbaarheid van scores voor bepaalde populatie. correlaties dalen bij een geselecteerde subgroep. homogene groepen -> minder sterke verbanden en lagere betrouwbaarheden. Betrouwbaarheid moet dus altijd bekeken worden in termen van de doelpopulatie!
regressie naar het gemiddelde
30
Galton: 'extreme' scores hebben de volgende keer de neiging om meer in de richting van het gemiddelde te liggen schatten van de ware score:
)
Grootte van de betrouwbaarheidscoëfficiënten: COTAN (Commissie Nederland) De grootte van de betrouwbaarheid hangt af van twee dingen: wat je aan het meten bent, en in welke context je het meet
Bij belangrijke beslissingen op individueel niveau ‣
r < .80: onvoldoende
‣
.80 <= r < .90: voldoende
‣ r => .90: goed Bij minder belangrijke beslissingen op individueel niveau ‣
r < .70: onvoldoende
‣
.70 <= r < .80: voldoende
‣ r => .80: goed Bij ‘experimenteel’ gebruik (op groepsniveau) ‣
r < .60: onvoldoende
‣
.60 <= r < .70: voldoende
‣
r => .70: goed
Generaliseerbaarheidstheorie Verschillende vormen van betrouwbaarheid relevant voor verschillende aspecten van de test Identificeren van alle facetten die mogelijkerwijze aanleiding geven tot fouten in de meeting en samen onderzoeken in een generaliseerbaarheidsstudie Voorbeeld: betrouwbaarheid van wetenschappenprestaties - Facet 1: 10 items op toeval geselecteerd - Facet 2: 2 tijdstippen op toeval geselecteerd 31
Betrouwbaarheid binnen moderne testtheorie •
Basisprincipes van moderne testtheorie
1PL:
moeilijkheidsgraad: mate van vaardigheid dat je nodig hebt om 50 procent kans te hebben om antwoord juist te hebben
32
2PL:
itemmoeilijkheid én itemdiscriminatie (hoe goed item personen dicrimineert)
3PL:
•
Iteminformatiefunctie (zegt wat de hoeveelheid informatie is die we krijgen, afhankelijk van het vaardigheidsniveau), testinformatiefunctie (som van de iteminformatiefuncties), standardmeetfout
1PL: informatiefunctie
33
testinformatiefunctie
standaardfout van meting:
in KTT: foutscore altijd even groot, ongeacht men nu hoog of laag scoort!
2PL: iteminformatiefunctie:
34
testinformatiefunctie:
standaardfout van meting:
3PL: iteminformatiefunctie:
testinformatiefunctie:
standaardfout van meting:
35
Meetprecisie van individuele scores Betrouwbaarheidsinterval op basis van standaardmeetfout (95% interval)
betrouwbaarheidsinterval op basis van verschilscores:
Voorbeeld IQ-scores - gemiddelde: 100 - standaarddeviatie: 15 - betrouwbaarheid: 0.95
Keuze tussen klassieke en moderne testtheorie KTT Kritiek - Gebruik van somscore ipv gewogen somscore: houdt geen rekening met verschil in discriminatie - Schatting van betrouwbaarheid gevoelig voor homogeniteit van de steekproef - Regressie naar het gemiddelde - Noodzaak van normering - Measurement by fiat: intervalniveau verondersteld, maar niet aangetoond - Prestaties alleen interpreteren binnen test - Standaardmeetfout gelijk op ieder niveau van de vaardigheid Voordeel: eenvoudig en gekend
36
MTT Kritiek - Mathematisch complex - Zelden hogere test-criteriumcorrelatie voor MTT- dan voor KTT-test Voordelen - Valideren interne structuur: unidimensionaliteit wordt getoetst - Specifieke standardmeetfout - Equivaleren: je kan vb. zien of iemand erop vooruit gegaan is binnen een jaar - Bestuderen itemvertekening: nagaan indien verschil in groepen vb. man-vrouw
Betrouwbaarheid en validiteit Betrouwbaarheid als psychometrisch en psychodiagnostisch kernbegrip - Herhaalbaarheid van het meetresultaat - Systematische/constante vs toevalsmeetfouten - Standaardmeetfout: standaarddeviatie van de meetfouten
Betrouwbaarheid als alledaags begrip - Een gewaardeerd kenmerk van een persoon - Een kenmerk waarop mensen te onderscheiden zijn - Verantwoord vaststellen van kenmerken
Verwarring validiteit en betrouwbaarheid
37
Les 4: Fairheid Inleiding Vertaling “fairness” = rechtvaardigheid; redelijkheid; billijkheid; schappelijkheid Fair = eerlijk, oprecht Heeft veel betekenissen, waaronder het creëren van gelijkheid van kansen in onze maatschappij Vorige versie: focus op subgroepen van getesten (geslacht, taal, cultuur, beperkingen, …) Nu: richt zich op alle individuen in de doelpopulatie Fundamentele kwestie Gevoeligheid voor individuele kenmerken en testcontexten opdat de testscores op een valide wijze kunnen worden geïnterpreteerd voor bedoeld gebruik validiteitskwestie Gemeenschappelijke principes in omgang met kenmerken van getesten die kunnen interfereren met de validiteit van de interpretatie van een testscore Validiteitskwestie die aandacht moet krijgen in alle fasen van testontwikkeling tot interpretatie van scores in specifieke contexten Toepassing is afhankelijk van context en specifieke kenmerken van de getesten Opletten voor ongewenste bevoordeling
Algemene visies op fairheid (= 'validiteit op individuele niveau') 1. Fairheid van behandeling gedurende het proces van testen • Mogelijkheden maximaliseren voor personen die test afleggen om aan te tonen welke positie ze innemen op het construct dat de test bedoelt te meten • Traditioneel: standaardiseren van testafname en scoring (vb. zelfde tijdslimieten, zelfde vertrouwdheid met technologie, zelfde technische kwaliteit van apparaten) • Soms is flexibiliteit nodig: vb. vertaling, groter lettertype, schermlezer 2. Fairheid als afwezigheid van meetvertekening Differentieel itemfunctioneren: - Uniforme vertekening - Niet-uniforme vertekening Differentieel testfunctioneren 38
Vergelijkbaarheid van construct Predictieve vertekening
3. Fairheid als toegang tot het construct zoals gemeten Individuele kenmerken van de persoon mogen niet benadelen of bevoordelen bij het laten zien van haar/zijn positie op het construct zoals gemeten Bedoelde versus niet-bedoelde variantie. Voorbeelden: - gezichtsbeperking en grootte van de letters in persoonlijkheidsvragenlijst - zegswijzen en beperkte taalkennis - dyslexie en taalbegrip - wordt complex wanneer meer dan één kenmerk interfereert met testing (vb. oudere niet-Nederlandstalige patiënten) - Let op: vraag is in welke mate het effect behoort tot het bedoelde construct of niet? 4. Fairheid als validiteit van individuele testscore interpretaties voor bedoeld gebruik Niet alleen vraag naar generaliseerbaarheid over subgroepen Ook kijken naar individuele kenmerken van getesten die kunnen interageren met contextuele kenmerken van de testsituatie (kan zeer complex zijn: bijvoorbeeld taaltest bij andere moedertaal) Let op: Fairheid is NIET gelijke (gemiddelde) uitslagen Bij verschillen in gemiddelde uitslagen: meer aandacht voor mogelijke bronnen van vertekening, maar het is geen bewijs van vertekening op zich
39
Bedreigingen van faire en valide interpretaties van test scores 1. Testinhoud Constructirrelevante variantie als gevolg van onaangepaste testinhoud - moeilijke woorden bij test voor kritisch lezen - verschillen in interesse voor testmateriaal - verschillen in herkenning in het testmateriaal - beledigend karakter van items 4. Testcontext Vaagheid van testinstructies Interacties met examinator: stereotypedreiging Taal van testing: meertalige kinderen hebben contextspecifieke taalkennis 3. Testrespons Verschillen in vertrouwdheid / voorkeur voor bepaalde antwoorden (vb. nederigheidsvertekening) Vorm van de antwoorden kunnen additionele vaardigheden vereisen (vb. manuele coördinatie) Verschillende interpretaties van wat een goede wijze van antwoorden is (vb. beknopt of uitgebreid) Kan interageren met scoringssleutel (vb. hoge punten alleen bij extra informatie) 4. Kans om te leren
Hadden de personen de kans om de inhoud en de vaardigheden van de test te kunnen leren? - Recente immigranten - Scholen in achtergestelde buurten (té veel doorverwijzing naar BSO)
Hangt af van context: - Fairheid indien zowel opleiding als testing door zelfde instantie gebeuren - Fairheid niet noodzakelijk in het geding bij toegang tot specialiseerde opleiding / hoger onderwijs Is moeilijk te definiëren en de kwantificeren op het individuele niveau Problematisch bij toekennen van diploma 40
Hoe omgaan met fairheid? 1. Universeel proefopzet (Universal design) test zo ontwikkelen -> fair voor individuen > architectuur en heeft als bedoeling omgevingen zo te ontwikkelen van bij de start dat ze tegemoet komen aan de noden van zoveel mogelijk gebruikers (Ron Mace, 1996) Op voorhand duidelijk specificeren welk construct men precies wenst te meten en voor welke doelgroep de meting precies is bedoeld: duidelijk identificeren welke kenmerken van de geteste kunnen interfereren met de meting van het bedoelde construct (testinhoud, testcontext, testrespons, kans op leren) 2. Bij testconstructie: beoordeling van iteminhoud Opstellen van transparante richtlijnen voor beoordelaars - Vermijden van cognitieve bronnen van constructirrelevante variantie ‣ Woorden uit specifieke contexten die er niet toe doen (vb. met betrekking tot hobby’s of religie) en taal en moeilijkheidsniveau van taal - Vermijden van affectieve bronnen van constructirrelevante variantie ‣ omstreden standpunten, evolutie ‣ verklaring van groepsverschillen ‣ pijn en dood, religie, seks , stereotypen ‣ terminologie voor groepen (vb. people of colour vs coloured people) ‣ representeren van diversiteit in de test - Vermijden van fysische bronnen van constructirrelevantie ‣ visuele weergave / auditieve weergave • Let op: het gaat om beoordelingen door experts, het is niet noodzakelijk dat de items ook effectief vertekend zijn. 3. Bij testvalidering Interne structuuranalyses (zelfde factorstructuur van persoonlijkheid?) Itemvertekeningsanalyses: nagaan of je zelfde meet (kippenvel of goosebumps) Onderzoeken van predictieve vertekening 4. Bij testgebruik adapteren van tests Testaccommodatie: vergelijkbaarheid van de scores blijft behouden (vergroten van het lettertype voor slechtzienden) Testmodificatie: leidt tot niet-vergelijkbare scores die het bedoelde construct veranderen (gebruik van rekenmachine bij dyscalculie)
41
Les 5: Testontwerp en testontwikkeling 4 grote fasen: 1. Testbestek Vandale: “nauwkeurige beschrijving van opzet, uitvoering, te gebruiken materialen, regeling van de werkzaamheden en kosten”. Omschrijving van doel en gepland gebruik Doel van de test Geplande gebruikers: psychologen, leerkrachten, verplegers, … Gepland gebruik: advies, begeleiding, selectie, vormende en beoordelende evaluatie (formative and summative assessment), … Te meten construct en / of inhoudsdomein Bedoelde testpopulatie (geslacht, SES, leeftijd, opleidingsniveau, etnoculturele achtergrond) Mogelijke aanpassingen (testaccommodatie) Voorspellend of beschrijvend gebruik Meten van voorspellende constructen (vb. IQ, consciëntieusheid) Meten van prestatie in domein als predictor van toekomstig succes Norm-gebaseerde, criterium-gebaseerde of ipsatieve interpretaties - Norm-gebaseerd ‣
Vloer en plafondeffecten
‣ Spreiding items afhankelijk van doel - Criterium-gebaseerd ‣ ‣ - Ipsatief ‣
Aantal categorieën Meetprecisie rond drempelwaarden Gevaar voor sociale wenselijkheid
‣ Verplichte keuzeformaat Omschrijving van vereiste inhoud Beschrijving van grootte inhoudsdomein of reikwijdte van het construct Wat hoort er bij en wat niet? (vb. hoort gedrag bij zelfwaardegevoel?) Afbakenen van inhoudsdomein op basis van theorie of analyse van inhoudsdomein (vb. jobvereisten) 42
Omschrijving van vereiste vorm Aard van de items Toegankelijkheid van itemvormen Complexe itemvormen Prestatiebeoordeling (vb. gestandaardiseerde job- of werkproef): specificeren van kritische dimensies Simulaties Portfolio’s Aard van antwoordvorm - Juist/fout - Meerkeuze - Open antwoorden (korte of uitgebreide) Aard van de scoring Testlengte
Percentage items voor elk facet
Evenwicht tussen testlengte en precisie van meting
Ook afhankelijk van welke scores worden gerapporteerd: alleen totaalscore, of ook subscores
Omschrijving van de vereiste psycho-metrische benadering
Klassieke of moderne testtheorie: steekproefgrootte
Beschrijving van psychometrische kenmerken (vb. vorm en grootte van betrouwbaarheid)
Omschrijving van vereiste scoring Scoring van individuele items - A priori responses (meerkeuze items) - Items met kort antwoord - Items met uitgebreid antwoord: ‣
Holistische scoring: bij complexe en sterk gecorreleerde vaardigheden
‣
Analytische scoring: rubrieken, sterkte-zwakte analyse
‣
Beschrijving van noodzakelijke kwalificaties van beoordelaars
Combineren van items in totale testscore 43
Omschrijving van vereiste testafname Papier en potlood / met computer Met of zonder tijdslimieten Accommodatieprocedures Instructies Materiaal Opvolgen van testing Voorkomen van fraude (vooral bij high-stakes) Testbeveiliging Verfijnen van testomschrijvingen Uitwisseling tussen testbestek en testontwikkeling: testomschrijvingen kunnen worden aangepast op basis van resultaten van testontwikkeling Bij criteriumgebaseerde metingen: items gekozen op basis van relatie met criterium (jobprestatie, psychopathologie) nood aan cross-validering Adaptief testen Computer adaptief testen: items geselecteerd en aangeboden op basis van antwoorden op voorgaande items
44
- Voordelen: ‣ Zelfde precisie voor alle getesten: meer items nodig onderaan en bovenaan de dimensie ‣ Minder items moeten worden aangeboden: tot 50% reductie in testtijd - Nadelen: ‣ Alle items moeten eerst worden getest in grote steekproef ‣ Participant kan testverloop moeilijk inschatten - Keuzes ‣ Vast aantal items of vaste meetprecisie ‣ Algoritme om volgorde van items te bepalen
2. Itemontwikkeling en –beoordeling Ontwikkeling van items Expertise in inhoudsdomein Meer items construeren dan nodig Relevantie en representativiteit op basis van gespecifieerde inhoud Rekening houden met universeel opzet Redigeren van items Expertoordelen van items
Kwaliteit van inhoud
Duidelijkheid
Constructirrelevantie
Fairheid (vb. toegankelijkheid, beledigend karakter)
Beoordelen van scoringsrubrieken
Geschiktheid van experts
Pilootstudie try-out op kleine groep nagaan of items begrepen worden zoals bedoeld
45
Veldstudie Veldstudie: try-out op grote groep om psychometrische kenmerken van items te identificeren Belangrijk dat steekproef komt uit beoogde populatie Belangrijk dat er een vergelijkbare context is: Alleenstaande of ingebedde afname Cognitieve labs: luidop-denken protocollen Analyseren van differentieel item functioneren Meeste testen gebaseerd op cumulatief-kwantitatief model: KTT en MTT - twee centrale parameters: moeilijkheidsgraad en onderscheidingsvermogen Itemselectie op basis van klassieke testtheorie - Moeilijkheidsgraad: ‣ p-waarde bij dichotome items ‣ gemiddelde itemscore - Onderscheidingsvermogen ‣ item-gecorrigeerd totaal correlatie (punt-biseriële correlatiecoëfficiënt bij dichotome items) ‣ Item-discriminatie index bij dichotome items: d = (U – L)/N
‣ U: aantal personen die slagen op item bij de top 27% op schaal ‣ L: aantal personen die slagen op item bij laagste 27% op schaal ‣ N: 27% van de totale steekproef (tussen 25% en 30%) - Steekproefgrootte: 200 participanten (maar discussie) Itemselectie op basis van moderne testtheorie - Moeilijkheidsgraad: b-parameter in 2PL (cfr. P of itemgemiddelde)
46
- Onderscheidingsvermogen: a-parameter in 2PL (cfr. Item – gecorrigeerde totaal correlatie) - Steekproefgrootte: 500 participanten voor 2PL (afhankelijk van precies IRT model, ook discussie)
3. Samenstellen en evalueren van testvorme Domeinrepresentatie verzekeren Indien meerdere vormen: zorgen voor gelijkmatige kwaliteit Items vervangen die te gelijkend zijn op elkaar Belang van cross-validering: psychometrische kenmerken bevestigen in onafhankelijke steekproef (validity shrinkage) 4. Ontwikkelen van procedures en materiaal voor afname en scoring Duidelijke instructies Gebruiksvriendelijk testmateriaal Standaardisering van testafname (voorzien van mogelijke testaccomodaties) Specificeren van hardware en softwarevereisten bij computerafname Testbeveiliging 5. Testrevisie: wanneer is revisie nodig? Nieuwe wetenschappelijke inzichten Gedateerd taalgebruik Gedateerd testmateriaal (vb. oud telefoontoestel) Gedateerde normen Veranderde populatie Veranderde curriculum- of jobinhoud
47
Normen, rapportering en rechten Normen, cesuren en scorekoppeling Testscores hebben zelden op zichzelf betekenis: - Norm-gebaseerde interpretaties: vergelijken met duidelijk gedefinieerde populatie - Criterium-gebaseerde interpretatie: ‣ Wat gekend van breder domein ‣ Waarschijnlijkheid van aanwezigheid psychopathologie ‣ Waarschijnlijkheid om toekomstig gedrag te stellen - Van norm- naar criterium-gebaseerde interpretaties en vice versa ‣ Identificeren van proportie best / slecht presterende participanten ‣ Uitgebreid onderzoek over norm-gebaseerd onderzoek kan info geven over wat over een domein gekend is ‣ Uitgebreid onderzoek over criterium-gebaseerde interpretatie kan leiden tot info over verdeling in de populatie - Cesuren: op basis van criterium of normgebaseerde interpretaties - Nood aan scorekoppeling Normen zorgvuldige definitie en beschrijving normgroep representatieve steekproef met voldoende steekproefgrootte (vb. normen RPM gebaseerd op steekproef uit Des Moines?) tijdsgebondenheid van normen (vb. Flynneffect): hernormeren Cesuren
Één of meerdere cesuren (vb. falen/slagen, competentieniveau basis/bekwaam/gevorderd) Op basis van rangorde Op basis van test-criterium verbanden: vals positieven en vals negatieven afwegen op basis van concrete toepassing, fout grootste rond cesuur Op basis van a priori bepaling van standaard: beslissing van experts en verantwoordelijken, belang van betrouwbaarheid van oordelen
Scorekoppeling Koppelen van scores van verschillende testen of testversies
48
Equivaleren: op zelfde schaal brengen van scores op verschillende testversies (parallelle en equivalente versies) - Verschillende versies tezamen afnemen (maar vermoeidheids- en leereffecten) - Verschillende versies bij equivalente steek-proeven (maar geen directe correlatie) - Inbedden van ankeritems (maar volledig domein dekken en mogelijke contexteffecten) - Extern afnemen van ankeritems Verschillende versies nodig bij - vaststellen van ontwikkeling en groei - vergelijken scores nieuwe versie van test met oude versie - bij internationale vergelijkingen van verschillende taalversies - bij verschillende tests voor zelfde construct - computeradaptief testen - vergelijkbaarheid van beoordeling bij verschillende complexe items Gebruik van psychometrische methoden (equivaleren) of expertbeoordelingen Let op: context- en populatiegebonden
Testafname, scoring, rapportering en interpretatie Belang van standaardisering: - Testmateriaal: ook voorbeeldvragen - Afname van test: stellen van vragen, oefenen - Scoring van test: computerscoring, expertscoring (kwaliteitscontrole) - Rapportering: groeps- of individueel niveau, totaalscore of subscores - Interpretatie: rekening houden met ‣ context ‣ bijkomende informatie Soms goede reden om af te wijken van standaardisering (vb. fairheid)
Ondersteunende documentatie voor testen Informatie over: 1. Aard van de test 2. Gebruik waarvoor ontwikkeld (construct en doelgroep) 3. Technische informatie over scoring, interpretatie en evidentie voor validiteit, betrouwbaarheid/ precisie en fairheid 4. Schaalberekening, normering, of bepaling van standaard 5. Richtlijnen voor testafname, rapportering en interpretatie -> Zowel juist als fout gebruik van de test en zowel juiste als foute interpretaties 49
Belang voor testgebruiker: - Beoordelen van waarde van test - Beoordelen van geschiktheid van test voor concrete situatie
Extra informatie voor persoon die test aflegt: - Niet technische omschrijving van test - Belang voor geïnformeerde toestemming - Zorgvuldig omgaan verbergen van ware doelstelling van test
Rechten en verantwoordelijkheden van personen die test afleggen Rechten Test afleggen die voldoet aan kwaliteitscriteria (validiteit, betrouwbaarheid/precisie, fairheid) Op voorhand basisinformatie over: - aard van de test - gebruik van de test - confidentialiteit - Voldoende informatie voor geïnformeerde toestemming (actieve of passieve vorm): vrijwillige deelname (uitzonderingen mogelijk) Voor testdeelname:
- Eventueel aanbieden van oefenmateriaal: moet gelijkaardig zijn als testmateriaal - Eventueel aanbieden van informatie over antwoordstrategieën - Informeren over mogelijkheden voor testaccomodaties Na testdeelname: - Feedback over testprestaties (tenzij men er expliciet afstand van doet voor de testing) - Veiligheid van het individuele testmateriaal
Verantwoordelijkheden
Bereid zijn de test af te leggen Richtlijnen volgen van testleider Eerlijk antwoorden (geen bedrog) Veiligheid van testmateriaal beschermen
50
Rechten en verantwoordelijkheden van testgebruikers Wie zijn de testgebruikers? - Selecteren, afnemen, interpreteren en gebruik maken van testscores - Psychologen, maar ook pedagogen, werkgevers, testontwikkelaars, … Validiteit van interpretaties: - Selecteren van adequate test - Validiteit van score-interpretaties voor bedoeld gebruik (ook fairheid) - Betrouwbaarheid/precisie - Adequaatheid van normen - Mogelijke positieve en negatieve gevolgen van testgebruik - Noodzakelijke kennis en training - Integratie van test- en niet-test informatie Verspreiding van informatie: - Accurate informatie geven over test, testafname, testgebruik, bijhouden van testinformatie en delen van informatie - Informeren over rechten van persoon die test aflegt (in high stakes context) - Informatie over opnieuw afleggen van test (in high stakes context) - Beschermen van privacy (tenzij expliciet anders overeengekomen Testveiligheid en bescherming copyright - Testmateriaal moet veilig bijgehouden worden - Intellectuele eigendomsrechten op psychologische testen moeten gerespecteerd worden (copyright)
51
Les 6: Het diagnostisch proces: Van individuele test naar het doorlopen van de diagnostische cyclus Alledaagse opvattingen Afwijkingen tov gewone patroon: afvragen, 'hoe komt dit?' Zoeken naar oorzaken Wantrouwen tegen alledaagse diagnostiek: afgezet tegen normatieve modellen in psychodiagnostiek: rationaliteit: geheel van consistente uitspraken Individuele verschillen
Verschil in accuraatheid tussen diagnostici? - Narcisme of ernstige zelfonderschatting: deze niet goed geschikt om te diagnosticeren - Buitenstaanders beter dan persoon zelf - Inherent need for cognition (dingen willen weten): beter, maar nog steeds vatbaar voor biases
Impact van ervaring en training: geen verschil met normatief model normatief model doet het beter dan leken én experts Empirische cyclus (De Groot) Nomologisch-deductieve werkwijze 5 fasen: 1. 2. 3. 4. 5. 6. 7.
Begint met vraag Observatie Inductie Deductie Toetsing Evaluatie Voorstel voor nieuw onderzoek
Maar doel is niet toetsen populatie-parameter Hypothesetoetsend model Van Aarle: HTM 1. Oriëntatie op de klacht 2. Probleemidentificatie 52
3. 4. 5. 6.
Genereren onderling onafhankelijke hypothesen (vermijden van foreclosure) Toetsen van hypothesen Formuleren van advies en interventie Evaluatie en vervolgstudie
Hét voorgeschreven model in Nederland
Casus Bart: 11 jaar, groep 6, zusje in groep 5, moeder huisvrouw, vader zelfstandig ondernemer Schooladviesdienst (CLB) ouders: concentratieproblemen, belemmerend? leerkracht: gedragsproblemen, doorverwijzen naar RIAGG (CGGZ) Anamnese: in kaart brengen van klachten Ouders: ‣ Geen problemen bij leren lopen en praten ‣ Huilen uit frustratie ‣ Werkjes slordig als kleuter ‣ Blijven zitten in groep 3, langzaam lezen en schrijven, concentratieproblemen, niet goed overweg met leerkracht ‣ Wilde liever thuisblijven in groep 6, werkte beter achter in de klas ‣ Heeft structuur nodig ‣ Wil alles goed doen, blij met goede resultaten ‣ Toont brede belangstelling ‣ Goede band met vader ‣ Voorbeeldig gedrag op scouting Leraar: ‣ Werkt chaotisch ‣ Zet zich niet in ‣ Straf werkt niet ‣ Gemiddeld leesniveau, onder leeftijdsnorm ‣ Slordig: schrijven rekenen ‣ Goed op wereldoriëntatie ‣ Zoekt contact, maar sluit zich ook af ‣ Conflicten met leeftijdsgenoten: moeilijk fouten toegeven ‣ Advies: contact RIAGG
53
Clustering van klachten door diagnosticus: concentratieproblemen, chaotisch, aandacht vragen, rekenachterstand, lezen niet op niveau, lezen en schrijven slordig, weinig inzet, problemen met klasgenoten, weet niet waar grenzen liggen, op school niet gemotiveerd tot sociale contacten Eerste beeld van de oorzaken: ontoereikende visuele organisatie, ontbreken van planning, gebrekkige fijne motoriek, relatie tot leraar staat onder druk, veel structuur nodig, dwingen helpt niet en leidt tot gebrek aan motivatie, negatief zelfbeeld, mijdt omgang met leeftijdsgenoten Formuleren hypothesen en middelen ter toetsing: 1. Ontoereikende perceptuele organisatie en verminderde concentratie: instrumenten, observatie en toetsingscriteria (+) 2. ADHD: observatie, voorgeschiedenis, ADHD meetinstrument (-) 3. Negatief zelfbeeld: observatie, gesprek, twee vragenlijsten (-) 4. Gebrek aan leermotivatie: vragenlijst (-) 5. Slechte relatie met leerkracht: interview Bart, leerkracht en observatie (+) Uitslag: 1. 2. 3. 4. 5. 6. 7.
Gemiddeld intelligent Perceptuele organisatie uitschieter naar beneden Aandachttekort Slechte relatie met leerkracht Gaat niet graag naar school Normaal zelfbeeld Normaal gemotiveerd
Handelingsadviezen: • • • • • • •
Volgend schooljaar bij andere leraar Nadruk op goede relatie met leraar Afspraken over wanneer Bart vragen mag stellen Planning werk elke dag Verdelen werk in kleine eenheden Korte duidelijke uitleg Vermelden hoe lang opdracht mag duren
Evaluatie na drie maanden: • • • • • •
Normale relatie leerkracht Blijft afdwalen, maar niet problematisch Onder toezicht, werk op tijd klaar Resultaten goed op rekenen na Meer betrokken bij klas en heeft vriend Gaat met plezier naar school
54
Beperkingen diagnosticus bij informatieselectie- en integratie Verwerving of verzameling informatie - Availability heuristiek - Recency & primacy effecten - Selectieve perceptie - Focus op opvallende kenmerken - Geen rekening houden met frequentie (base-rate) - Concrete directe info boven statistieken - Volgorde effecten - Antwoordtendensies: vb. sociale wenselijkheid •
Verwerking informatie - Halo-effect: vb. positief kenmerk generaliseren mooi -> intelligent - Nieuwe niet-kloppende info niet meewegen - (Matige) correlaties niet goed waarnemen (inschatten): .30 - .75 - Groeiprocessen nauwelijks waarnemen (snelle groei onderschatten) - Vuistregels: te veel gebruik van maken, vb. 'als persoon zoveel scoort -> schizofrenie' - Niet representatieve gegevens / té kleine steekproeven - Post-hoc verklaringen: iets niets voorspellen, maar achteraf wel kunnen 'verklaren' - Regressievertekening: extreme observaties bij tweede meting meer naar gemiddelde - Oppervlakkig oordelen onder tijdsdruk - Gevoelig druk anderen - Beroep op consistente info zonder nieuwswaarde
•
Beoordelen van uitkomst - Impact van schaal (zie statistiek 1: schaal van 1-5, 'klein effect', schaal 4-5, 'groot') - Zien wat we willen zien - Illusoire correlaties op basis van impliciete theorie of stereotype - Illusie van controle 55
- Succes aan eigen kunnen, falen aan omstandigheden toeschrijven - Reconstructie uit geheugen
Reacties op beperkingen diagnosticus Trainen van de diagnosticus: - Niet volgen van statistiek (dit helpt niet per se) - Rekening houden met base rate - Availability niet overschatten - Niet genoegen nemen met één verklaring (tegengaan van foreclosure)
Alternatieve modellen voor diagnostisch proces Het lensmodel: samentellen van cues Aantal 'targets' en aantal 'judgements' wijzen niet allemaal op dezelfde cues.
Multiple attritute utility model: attributen en variabelen
56
De regel van Bayes
Vooral bij fenomenen die niet veel voorkomen. (vb. mishandeling) H: mishanding D: blauwe plekken De regel van Bayes bij mishandeling van kinderen P(D/H)=.95 P(H)=.03 P(Hi)=.97 P(D/Hi)=.10 P(H/D)=.227 ! 'maar' 22,7 % mishandeld indien blauwe plekken! Case formulation bij gedragstherapie: functionele gedragsanalyse
Aanval op de normatieve modellen Niet ecologisch valide: kant en klare weddenschappen met alleen kwantificeerbare alternatieven “human judgement is innocent until proven guilty” In sommige contexten kunnen “fast and frugal heuristics” lineaire predictiemodellen verslaan
Vb. Welke stad heeft de meeste inwoners: San Diego of San Antonio? 57
Les 7: Diagnostiek van de persoon Betekenis van het begrip persoon Karakter: ‘charassoo’ = inkerving
Persoon: ‘persona’ - Rol in het theater - Aanzien, reputatie - Kenmerkende eigenschappen die iemand onderscheiden van iemand anders
Individu = atoom: duurzame organisatie van trekken, gedrag, cognities, emoties en motivaties Individuele verschiloriëntatie: weinig aandacht voor ontwikkeling en context
Impliciete theorievorming over de persoon
Hofstee: referendum boven theoretische benadering
Woordenboekbenadering: inventarisatie van persoonsbeschrijvende woorden
‘Lexicale’ of ‘sedimentatie’ hypothese
Allport & Odbert (1932): 18.000 termen uit Webster’s Unabridged Dictionary of the English Language
Cattell (1943): 4000 à 4500 termen, 171 clusters, via correlaties 35 clusters, uiteindelijk Sixteen Personality Factors
Populair tot striemende kritiek van Mischel in 1968, vanaf de jaren 80 terug populair
Big Five: “OCEAN” Openheid, Consciëntieusheid, Extraversie, Aangenaamheid, Neuroticisme NEO-PI van Costa & McCrae (1985)
58
59
Aard van BF Relatie met dagdagelijks gedrag (Mehl et al., 2006) Evidentie voor erfelijkheid (intraclass correlaties voor monozygoten tot .42 en voor dizygoten tot .27) Twee hogere-orde factoren: alfa/stabiliteit (A,C, ES) en bèta/plasticiteit (E, O) - Functie van serotonine- en dopamineproductie Costa & McCrae zien BF als causale latente trekken
60
Zijn het inderdaad VIJF factoren?
Brokken & Land (1981): - 5960 adjectieven uit Grote Van Dale - Wat voor iemand is dat? (1203 termen in 42 categorieën) - Factoranalyse per groep: 143 factoren - 96 triaden (groepjes van 3) - Zeven factoren: Big Five + Agressie & Progressiviteit (bij zelf en partner)
De Raad en Barelds (2007): BF + virtue (deugdzaamheid), competence, hedonism Ashton et al. (2004): BF + honesty-humility, religiosity Effect van adjectieven/zinnen (5), zelfstandige naamwoorden (4: openheid, extraversie, gewetensvolheid en aangenaamheid) en werkwoorden (2: aangenaamheid en emotionele stabiliteit) Factoranalyse + VARIMAX rotatie (simpele structuur) vereist nemen van beslissingen: geen “mechanical truth generator”
Kan BF gegeneraliseerd worden over populaties? Stabiliteit ifv geslacht - Geen structurele verschillen - Gemiddelde verschillen: mannen zijn opener, minder consciëntieus, onaangenamer, assertiever (E) en emotioneel stabieler - Evolutionair/genetische en culturele verklaringen mogelijk Stabiliteit m.b.t. context - Beschrijving kind door ouders: Big Five (70 à 80%) + 9 andere factoren (onafhankelijkheid, rijp voor leeftijd, ziekte en handicaps, regelmaat van eten en slapen, gedrag passend bij geslacht, schoolprestaties, plezier hebben aan contact, relatie met ouders, broers, zussen, en overige familie en restfactor) - California Q-set: Big Five + motorische activiteit en afhankelijkheid of + prikkelbaarheid en positieve activiteit
61
Kan BF gegeneraliseerd worden over culturen?
Filipijnse termen: verantwoordelijkheid, ontwikkelen van sociaal vermogen, emotionele controle, begaan zijn met lot van anderen emotioneel welbevinden later na Procrustes rotatie: Big Five + sociale nieuwsgierigheid, risico nemen, nieuwe uitdagingen aangaan, religiositeit
2090 Russische trektermen in 75 clusters: BF in andere volgorde + 6de onduidelijke factor
Chinese Personality Assessment Inventory: Big Five + interpersonal relatedness (ook in VS)
Los Cinco Grandes bij Castilianen: maar meer termen mbt humor, sociaal/emotioneel engagement, goede geaardheid, onconventioneel zijn
BF bij 5109 adolescenten in 24 landen (De Fruyt et al., 2009)
Culturele verschillen in zelfpresentatie
Verschil tussen culturele groepen in onafhankelijke en onderling afhankelijke zelfconstructie
Correlatie met andere persoonlijkheidsconstructen?
Met 16PF van Cattell, Eysencks Personality Inventory, California Personality Inventory, Jackson Personality Inventory, Tellegens Multidimensional Personality Questionnaire, Attachment styles
Vragenlijsten niet inwisselbaar: r < .70
Voorspellen BF interessant criteriumgedrag?
Waargenomen lichamelijke en geestelijke gezondheid, + en - gevoelens: E, N, en A
As II van DSM-IV persoonlijkheidsstoornissen
Relatie met houding tijdens therapie: E met enthousiasme en C met volgen suggesties
Kick zoeken met E, antisociale uitingen met N, weerspannig gedrag met C
Maar Smedslund: probleem van semantische gelijkenis
Voorspellen BF prestatie en beroepsinteresses?
Prestaties op het werk: C en integriteit
Schoolprestaties: C, E, A en O afhankelijk van studie
Diepe manier van verwerken van informatie: C & O
Beroepsinteresses: Artistiek - O, Ondernemen - E, Sociaal Beroep - E/A, Onderzoeker - O
BF met heel veel verschillende variabelen gecorreleerd. 62
Conclusies Dominantie van 5-factorenmodel Invloed van hypes op de ontwikkeling van de wetenschap Discussie over BF als monolithisch mono-formeel zelf: elke persoon kan gesitueerd worden op een van die 5 dimensies (minder introvert = extraverter) Gevaar voor tautologie: semantische relaties Met heel veel gecorreleerd, maar correlaties klein tot middelmatig: bruikbaar voor beschrijving, maar beperkt voor predictie en controle
Expliciete theorievorming Individuele verschillen: trektheorie Hans J. Eysenck: hiërarchisch persoonlijkheidsmodel Typen: Psychoticisme – Extraversie - Neuroticisme Trekken: vb. sociabiliteit voor E Gewoonten: vb. onderhoudend zijn voor vreemden voor sociabiliteit Situatiespecifieke responsen: vb. vertellen van grapjes op feestje voor onderhoudendheid Gebaseerd op biologische en genetische verschillen + socialisatie: Extraversie: conditioneerbaarheid (zenuwstelsel) Neuroticisme: vegetatieve prikkelbaarheid (limbisch systeem en hypothalamus) Psychoticisme: verschillen in evenwicht androgeen-oestrogeenhormonen Invloed van context niet overschatten. Raymond B. Cattell Kijken naar Life data, Test data en Questionnaire data (L, T, Q data) Onderscheid tussen oppervlakte- en dieptetrekken 16 primaire dieptetrekken Komen samen in vijf hogere-orde trekken
63
Descriptors of Low Range
Primary Factor
Descriptors of High Range
Warmth (A)
Warm, outgoing, attentive to others, kindly, easy-going, participating, likes people
Concrete thinking, lower general mental capacity, less intelligent, unable to handle abstract problems
Reasoning (B)
Abstract-thinking, more intelligent, bright, higher general mental capacity, fast learner
Reactive emotionally, changeable, affected by feelings, emotionally less stable, easily upset
Emotional Stability (C)
Emotionally stable, adaptive, mature, faces reality calmly
Impersonal, distant, cool, reserved, detached, formal, aloof
Deferential, cooperative, avoids conflict, submissive, humble, obedient, easily led, docile, accommodating
Dominance (E)
Dominant, forceful, assertive, aggressive, competitive, stubborn, bossy Lively, animated, spontaneous, enthusiastic, happy go lucky, cheerful, expressive, impulsive
Serious, restrained, prudent, taciturn, introspective, silent
Liveliness (F)
Expedient, nonconforming, disregards rules, self-indulgent
Rule Consciousness (G)
Rule-conscious, dutiful, conscientious, conforming, moralistic, staid, rule bound
Shy, threat-sensitive, timid, hesitant, intimidated
Social Boldness (H)
Socially bold, venturesome, thick skinned, uninhibited
Utilitarian, objective, unsentimental, tough minded, self-reliant, no-nonsense, rough
Sensitivity (I)
Sensitive, aesthetic, sentimental, tender minded, intuitive, refined
Trusting, unsuspecting, accepting, unconditional, easy
Vigilance (L)
Vigilant, suspicious, skeptical, distrustful, oppositional
Grounded, practical, prosaic, solution oriented, steady, conventional Forthright, genuine, artless, open, guileless, naive, unpretentious, involved Self-Assured, unworried, complacent, secure, free of guilt, confident, selfsatisfied Traditional, attached to familiar, conservative, respecting traditional ideas
Abstractedness (M) Privateness (N) Apprehension (O) Openness to Change (Q1)
Abstract, imaginative, absent minded, impractical, absorbed in ideas Private, discreet, nondisclosing, shrewd, polished, worldly, astute, diplomatic Apprehensive, self doubting, worried, guilt prone, insecure, worrying, self blaming Open to change, experimental, liberal, analytical, critical, free thinking, flexibility
Group-oriented, affiliative, a joiner and follower dependent
Self-Reliance (Q2)
Self-reliant, solitary, resourceful, individualistic, self-sufficient
Tolerates disorder, unexacting, flexible, undisciplined, lax, self-conflict, impulsive, careless of social rules, uncontrolled
Perfectionism (Q3)
Perfectionistic, organized, compulsive, self-disciplined, socially precise, exacting will power, control, self-sentimental
Relaxed, placid, tranquil, torpid, patient, composed low drive
Tension (Q4)
Tense, high energy, impatient, driven, frustrated, over wrought, time driven.
64
Ontwikkelingsbenadering 19de-eeuwse idee: gedragingen worden in de loop van de tijd steeds beter en bereiken een evenwichtig eindpunt Stadiumtheorieën - Verschillende gedragingen in één categorie ‣ Één onderliggende structuur ‣ Één geheel van betekenis ‣ Empirische samenhang - Sequentieel en cumulatief ‣ Vaste volgorde: vb. orale, anale, fallische, genitale en latentiefase ‣ Evolutie van eenvoudig naar complex - Onderscheid tussen sterkere en zwakkere organismische theorievorming - Weinig empirisch onderzoek - Stadia van de psychosociale ontwikkeling volgens Erikson ‣ Acht stadia ‣ Elk stadium bevat een crisis, oplossing leidt tot volgend stadium, niet oplossing leidt tot stagnatie ‣ Vooral theoretisch kader ‣ Alleen empirisch onderzoek naar identiteit-rolverwarring: identity, foreclosure, confusion, moratorium
65
- Ego-ontwikkeling volgens Loevinger ‣ Ego is het centrale thema van de ontwikeling ‣ Zeven mijlpalen in vier domeinen ‧
Controle van impulsen
‧
Karakterontwikkeling
‧
Doelgerichte inzet
‧
Sociale interactie en cognitieve stijl
‣ Zinaanvultest (ZALC) ‣ Loevingers H
66
Contextbenadering Mechanistisch model - Richting van ontwikkeling is neutraal - Persoon past zich aan aan omgeving Herwaardering (vb. depressie i.f.v. recente sociale gebeurtenissen en interacties) Context: stimuli, gebeurtenissen, situaties, training op gedragswijzen Rotter: - Gedragspotentiaal = verwachting van bekrachtiging x waarde van bekrachtiging - Interne versus externe locus of control: persoonlijk verleden van bekrachtiging Bandura: - Wederzijdse beïnvloeding van gedrag en situatie: leergeschiedenis individu leidt tot ‘zelfsysteem’ - Self-efficacy
Integratie van expliciete theorievorming Stabiliteit van individuele verschillen in de persoonlijkheid
Soorten stabiliteit: - Homotypische stabiliteit ‣ Absolute of niveaustabiliteit (normatieve stabiliteit op groepsniveau) ‣ Differentiële of rangordestabiliteit ‣ Ipsatieve stabiliteit - Heterotypische stabiliteit / coherentie
Roberts & DelVecchio (2001): metastudie rangordestabiliteit stijgt met leeftijd .31 in kindertijd .54 in adolescentie .64 op 30-jarige leeftijd .74 bij 50-70-jarigen Robins et al. (2001): studenten 67
- Normatief: N daalt redelijk, ACO nemen licht toe - Absoluut: tussen 73% (N) en 91% (O) - Rangorde: tussen .53 (N) en .71 (O) - Structureel: zelfde structuur stabiliteit, maar niet gelijk aan 1 Caspi (2000) - Alle driejarige inwoners - Typen van Block ‣ Ego resilients minste kans op psychiatrische problematiek en criminaliteit op 21 jaar ‣ Overcontrolled meer internaliserende problemen ‣ Undercontrolled meer externaliserende problemen Stams et al. (2002) - Geadopteerde kinderen - Hechtingsstijl op jonge leeftijd voorspelt sociale aanpassing op 7-jarige leeftijd In metastudie gemiddelde stabiliteit van .55 met gemiddeld interval van 9.5 jaar, met verschillen voor - leeftijd - tijd - methode Stabiliteit geldt niet voor iedereen (20 à 25%) Conclusie: evidentie voor stabiliteit, maar niet absoluut. Evenzeer evidentie voor instabiliteit Kritiek op trektheorie: Persoon-situatie debat Mischel (1968): R² < .10 -> er is veel minder stabiliteit in gedrag dan men voorspelde - Funder (2001): .15 < r < .40 = geringe tot gemiddelde effect grootte - Robuustheid van trekken: trekken belangrijker dan gewijzigde omstandigheden voor voorspelling gedrag, ze voorspellen toch gedrag, meer dan situaties (exp. ASO -> unief) - Geen betere instrumenten ontwikkeld door situationisten Balans van persoon-situatiedebat - Nadruk op trekken sluit geen verandering op basis van plaats en tijd uit 68
- Er bestaat geen goede situatietaxonomie (= verschillende situaties waarin mensen zich kunnen bevinden; oneindig!) - Studie van interactie is geen hoofdstroom geworden - Wetenschap heeft niet als doel te voorspellen wat iemand zal doen in eender welke concrete situatie.
Alternatieve theorievorming Kelly -> rooster invullen, kwantitatieve gegevens Persoon is onderzoeker Constructensysteem over sociale wereld: uniciteit van persoon, ongeveer = sociaal constructivisme, maar Kelly heeft wel een methode: RRC Role Repertory Contruct: eigen keuze van rollen, personen en kenmerken Factoranalyse met de hand, cluster-analyse, hiërarchische klassenanalyse Geen betrouwbaarheid in klassieke zin Zelfconfrontatiemethode van Hermans
Diagnosticus is helper Waardengebieden en belevingen (affecten) Patronen van affecten en correlaties tussen waardengebieden Veranderingen in waardengebieden en belevingen Unieke van persoon: geen standaard waardengebieden
4 soorten gevoelens: - zelf-waarde - verlangen naar contact - positieve - negatieve
69
Csikszentmihalyi Succesvolle persoonlijkheidsontwikkeling ‘Flow’ of bevlogenheid: met overtuiging en plezier opgaan in taak; volledige concentratie, geen tijdsbesef: de tijd vliegt Persoonlijkheidsontwikkeling = toename in complexiteit. Balans tussen: - Agency (dingen willen doen) & communion (focussen op relaties) - Subjective involvement (van op afstand) & detached objectivity (subjetief) - Divergent (focus op creativiteit) en convergent denken (heel rigoreus) - Rust en onrust - Speelsheid en discipline - Introversie en extraversie - Traditioneel en vooruitstrevend Uitvoerig interview 70
Antithetische aspecten van zelfdefinities (Van Halen, 2002) Onzekerheid, mensen kennen zichzelf niet noodzakelijk, en weten dat soms ook zelf Ik vind het moeilijk om mezelf te zijn / te kennen / te beschrijven omdat … Leeftijdseffect: zelfbeschrijvingsproblemen het hoogst in adolescentie, beter hoe ouder Narratieve oriëntatie: Persoon brengt zelf structuur aan via levensverhaal , je laat mensen vertellen over hun leven. Keuze van verhaaltypen: - Frye: roman (moeilijkheden overwinnen, uiteindelijk wel slagen), komedie (heel relativerend, eigen in vraag durven stellen), tragedie (<-> roman, maakt niet uit, uiteindelijk sluit het slecht af), satire (zeer kritisch over allerlei waarheden) - Elsbree: huis bouwen, gevecht aangaan, reis maken, lijden verdragen, streven naar vervolmaking Ontwikkelingstaken (vanuit samenleving) Periode of traject vb. opleiding psychologie, Master behalen (5 jaar) Jury of publiek (slagen voor vakken) Gecontroleerd en doelgeoriënteerd gebruik van persoonlijke, sociale en materiële bronnen, bij psychologie vooral persoonlijke en sociale bronnen Toekennen van recht tot handelen Persoon als sociale constructie Sociaal constructivisme: gebruik van alledaagse psychologische begrippen om groeps- of persoonlijke belangen te dienen
‘Circumstantial evidence’ - Kinderen die geplaatst worden in tehuis: plaatsing is uitdaging of plaats die ze toegewezen krijgen want slachtoffer van omstandigheden - Werkende moeders geloven meer in biologische maturatie, niet-werkende moeders geloven dan vooral dat wat een kind zal worden, een gevolg is van de opvoeding - Schrijven van biografie: mensen streven naar consistentie in levensverhaal, verbanden leggen
71
Operationalisering en meten van typerend gedrag van de persoon Afbeelden van individuele verschillen Grote Vijf: exploratorische factoranalyse + eenvoudige structuur (VARIMAX-rotatie) ZIE SLIDES 59 - 62
Eenvoudige structuur of circumplex (=onderliggend twee dimensies)? - Wiggins: circumplex op basis van nurturance en dominance - Abridged 5 Factor Circumplex: 10 circumplexen (geen hogere predictieve validiteit)
72
Exploratorische (op voorhand geen hypotheses) of confirmatorische factoranalyse (wel hypotheses): Grote Vijf zeer stabiel met EFA met Procrustesrotatie, maar niet bevestigd met CFA -> grote discussie over methode (met EFA vindt je altijd oplossing), maar vinden in heel veel groepen, talen..allemaal verband met Big Five
Topologische weergave (indien niet tevreden met EFA/CFA): geometrische representatie van persoonlijkheids-facetten in 2 dimensies met multidimensionale schalering, daarom misshien EFA niet goed, we gaan ervan uit dat we onafhankelijke constructen hebben, maar ze zijn niet onafhankelijk!
•
Afbeelden van persoonlijkheid via testtheorie - Meestal klassieke testtheorie - IRT
Afbeelden van ontwikkeling via IRT (vb. ZALC), maar geen stadia
73
Les 8: "Psychodiagnostiek in een notendop" (Schittekatte) Deel 1 les: Testen: - gaan we nog heel veel mee te maken hebben, en er zijn er heel veel! - kwaliteit: er zijn ook heel veel 'slechte' testen - testen adapteren: 'maar' 2 jaar werk, maar ontwikkelen: 10 jaar! Vlaamse COTAN: commissie Vlaamse kwaliteit (hij is daar voorzitter van) IQ, gedrag en aandacht, dit zijn de drie meest gebruikte vragenlijsten (voor kinderen) Testotheek Gent, niet enkel database maar ook een dienst. Heel veel slechte testen, het internet staat er vol van. Testen www. is een site waar de betrouwbare te vinden zijn. Een 30 à 40-tal. CBCL Onderdiagnosticeert! Meet niet goed, moest "een eigen meetlat" krijgen, niet zelfde als Amerikaanse of Nederlandse kinderen. SDQ: heel goed, in heel veel talen beschikbaar, gratis op internet en wetenschappelijk ok! Brengt gedrag van jongeren in beeld. Broertje van CBCL, maar dan gratis! Scheelt over landen heen, maar hangt ook af van rapportage, van wat men wil toegeven. (vb. Japan) TEA-Ch 'sky search', subtest waar je twee dezelfde soorten ruimteschepen moet zoeken, en die omcirkelen. Australische kinderen waren de standaard, die waren heel snel, maar de manier waarop ze het deden was niet goed. Vlaamse kinderen daarentegen (vooral meisjes) waren in vergelijking met hen heel traag, en wouden heel accuraat zijn. Dus, ze waren 'aandachtsgestoord'. Maar het is een Australische meetlat! Nu een Vlaamse versie ervan. Sterktes Gebaseerd op recente aandachtstheorieën
Zwaktes Relatie met IQ uit te klaren
Verscheiden profielen (visueel, auditief, motorisch..) Aantrekkelijkheid Factoren geconfirmeerd Mogelijkheid voor observatie
'Twijfels' rond testen van de jongste en de oudste kinderen Stift, chrono en tabel 8 Geen factor scores! Psychometrisch onderzoek in eigen cultuur is onmisbaar!
74
DST: Dyslexie Screening Test. Vooral de nonsensezinnen zijn belangrijk, daar val je als dyslecticus door de mand. CELF: Clinical Evaluation of Language Fundamentals . Als er iets scheelt met taal. Taalproblemen. SRS: Social Responsiveness Scale: screeningsinstrument dat sociale beperkingen bij autismespectrum-stoornissen in kaart brengen, geschikt om te differentiëren binnen ASS.
WPPSI III: Wechsler Preschool and Primary Scale of Intelligence. Zeer duur! • • • • •
Opvolger WPPSI-R, Flynn (Flynn-effect: IQ-score verhoogt telkens per generatie) Vlaamse normering ism. Lessius Hogeschool Validering met SON + 5 klinische groepen Leeftijdsbereik 2 ½ - 8 jaar (5 – 14 subtests) Verdwenen subtests: Rekenen, Zinnen, Geometrische figuren, Doolhoven en Dierenhuis (CHC –model !!!) • 6 nieuwe subtests, veel nieuwe items, 4 FS • Publicatie Ned. ≠ VL "Vloeiende intelligentie" Item uit subtest Matrix Redeneren
Aanvullende recente info over IQ-testen in schoolcontext Touch - screen project (I-PAD, Boom) CHC-model & CLB, project Thomas More WISC-V -> 2017
WISC-V 10 kernsubtests 75
11 extra subtests, nog een keuze maken welke in de Nederlandstalige versie
Structuur WAIS - IV
-> een veel gedifferentieerder beeld dan enkel 'Tim heeft een IQ van 100.'
76
g = algemene intelligentie IQ wordt gemeten op allemaal verschillede subtesten Elke intelligentietest die nu bestaan, meet maar een aantal g's, nooit allemaal. 'Echte' IQ is niet zomaar te meten. De 'fluid' kan je al meten op 7 verschillende manieren.
VFD: Vlaams Forum voor Diagnostiek, doel: kwaliteit van testen omhoog krijgen. VKD (Vlaams Kwaliteitscentrum voor Diagnostiek) heeft een rondvraag gedaan in 2002, en men was maar tevreden over 59 % van de testen in verband met de normen! 2011: nog eens een rondvraag, 500 testen in de omgang (!) wat blijkt: 1/4 zou niet mogen gebruikt worden in real life In 12 sectoren (vb. CLB, GGZ..) -> WISC III, TEA-Ch en CBCL bovenaan aan meest gebruikte tests! Dus intelligentie, gedrag en aandacht. Intelligentieschalen: WISC, WPPSI en WAIS (30, waarvan slechts 8 goed) Klinische schalen: CBCL, MMPI..enorme diversiteit! (81) Persoonlijkheidstest: ZAT (zinaanvultest, gemaakt in 1947, update in 1967..) Rorschach: projectieve test, vb. 'ik geloof in..' en dan aanvullen, maar deze zijn ambigue!
77
Conclusie: We beschikken over een uitgebreide update van het testgebruik in Vlaanderen (anno '10-'11) Bij het in kaart brengen blijkt: > enorme diversiteit nl. > 500 tests!! Kwaliteit (meetpretentie & psychometrische kenmerken) maximum acceptabel bij 1/4 gehanteerde tests én kwaliteit primeert vaak niet bij de keuze van ‘n test “Gehechtheid aan ‘oude’ tests” (en ook duur!) “Roep” naar recente én Vlaamse normen “Foute meetlatten” ook voor “populaire” tests vb. WISC voor wie niet geaccultureerd is Persoonlijkheid “verouderd” instrumentarium (update 1967!)
BFP: Belgische Federatie van Psychologen, gaat kwaliteit van testen inschatten 3 belangrijkste eigenschappen kwaliteit: normen, validiteit en betrouwbaarheid “a” Algemene intelligentietest “s” Specifieke intelligentietest -> (theoretische basis: CHC-model)
78
Hertesten intelligentiematen IQ is een stabiele maat Foute medische of psychopathologische diagnoses, uitgesproken motivatie- of emotionele problemen Impact hertest op korte termijn, kenmerkend sterke stijging performaal gedeelte Advies minstens één jaar bij voorkeur twee te wachten voor hertest met dezelfde test Kenmerken psychodiagnostiek in het algemeen Meerwaarde aan het begeleidingsproces door objectief wetenschappelijke bonus, mits - Aansluiting bij uitgangsvraag - Een waardevolle test - Passend bij de geteste - Correct afgenomen, verwerkt, geïnterpreteerd en ingebed in geheel van vaststellingen en observaties (opleidingen, o.a. PAV) -> Van kwantitieve meting naar kwalitatieve integratie -> Niet testen om te testen Wetenschappelijke criteria van de testen Project ‘OLB-diagnostiek’ (OLB = onderwijs-loopbaan-begeleiding)
Ondersteuning bij de studiekeuze van de leerlingen, einde tweede jaar SO.
Op zoek naar psychosociale factoren in succesvolle versus vastlopende schoolloopbanen.
Verzamelen van recente Vlaamse normen
bij niet-copyrighted instrumenten! (de meeste metingen dateren van bijna 20 jaar terug!)
79
Deel 2 les: Waarom een WISC-IIINL ? Actualiseren - van de normen ‣
WISC-R = 1986 (1980)
‣
Flynn-effect
‣
Laatste in Europa
- van de inhoud van subtesten en scoringsregels + nieuwe subtest “Symbolen Vergelijken” + verhogen attractiviteit Belangrijke punten
betrouwbaarheidsinterval! niet: mijn IQ is 110, maar mijn IQ ligt tussen 105 en 115. gedragsobservaties: opschrijven van gedrag, vb. hoeveel het praatte, beperkingen zicht..
Items
onvolledige items: aanvullen met zeggen wat ontbreekt vb. goudvis -> kiewen plaatjes in juiste volgorde zetten (logica) blokjes: patronen nabouwen puzzel maken met geknipte stukken vb. voetbal symbolen vergelijken: zit een van deze twee symbolen in dit rijtje?
Normering WISC-IIINL Afname bij 1229, 6-16 jarigen: per leeftijd minstens 100 kinderen - Representatieve steekproef -> geslacht, regio, schooltype, urbanisatie,..allemaal even veel! (> 30 Vlaamse en 65 Nederlandse scholen) - Opgeleide testleiders Normen ontwikkeld (per 4 maand, J/M, Ndl.-VL, model cfr. SON-R) Test is eigenlijk niet gemaakt om de 'onderste' IQ van de populatie meten.
80
Betrouwbaarheid WISC-IIINL
Homogeniteits- & interne consistentie coëfficiënten ( & split-half, FL & DH ) Interbeoordelaarsbetrouwbaarheid ( r > .90) om scoring optimaal te krijgen Test-hertest betrouwbaarheid
Validiteit WIS-IIINL Factor-analyses: nieuwe derde factor! - Verbaal begrip (INF + OV + WO + BG) - Perceptuele organisatie (OT + PO + BP + FL) - ‘Vrijheid van afleidbaarheid’ (RE + SU + CR) verdwenen - ! Nieuwe factor: ‘Verwerkingssnelheid’ (SU + SV) Congruente validiteit Schoolprestaties (Nederlands & Wiskunde): significante samenhang met IQ (r .37 - .53) Opmerkelijke verschillen Jongens (INF, REK, BP) vs. meisjes (CR, SUB, SV) Oudste kind Allochtonen: - verschil neemt af - SES & verblijfsduur - hoog opgeleide ouders -> straks meer eigen onderzoek.. Vlaanderen- Nederland en feitenkennis: Vlamingen weten meer dingen zoals hoofdsteden Specifieke groepen vb. rilatine experiment: indien je rilatine neemt; 10 IQ punten hoger! allochtonen: grote verschillen, elk jaar, tussen allochtonen en autochtonen. Hoe komt dit? Sociaal Economische Status, opvoeding, beroep ouders..
81
Aculturatieschaal: Onderzoeksdoel: - Theoretisch en psychometrisch goed evaluatie-instrument ontwikkelen - Vier principes 1. Twee dimensionaal model als referentiepunt 2. Gebruik maken van (twee-) uitspraken methode 3. Waardengeladenheid vermijden 4. Psychometrische kwaliteiten onderzoeken Problemen bij het testen van kinderen met een allochtoon-ethnische achtergrond Etnisch culturele verschillen Ongeschikte testinhoud bv. vertrouwdheid Taal (“droom” om taalniveau inschatten, vw. nu 2 tot 6 jaar verblijf hier..) Voorlopige conclusies allochtonen-onderzoek Eindelijk onderzoek van dit soort..maar 1ste stap (interpretaties nog ‘open’) Verschillen groot, vooral VIQ, maar ook PIQ, minst gevoelig factor: verwerkingssnelheid Aanwijzinging dat onderdelen van de WISC-IIINL cultuur-gevoelig zijn: - vooral invloed op talige subtests en VIQ - eerste indicaties van verbanden met acculturatie Extra.. Invloed van afname thuis of op school! ( + RILATINE, ZOMER, OCHTEND) Intelligentie meten
De analytische component - Logisch en abstract redenen, cognitieve vaardigheden; met nieuwigheden omgaan
De praktische component - Goed of minder presteren in alledaagse situaties
De emotionele en sociale component - Beeld omgaan anderen en in allerhande sociale situaties 82
Les 9: Het vaststellen en analyseren van de intelligentie, cognitie, geschiktheid en prestatie van de cliënt Begrippen Intelligentie, cognitie, geschiktheid en prestatie Intelligentie: algemeen cognitief mentaal vermogen, of geheel van cognitieve mentale vermogens - Algemeen dieperliggend vermogen tot inzicht in en begrip van het dagelijks leven, helpt beslissen wat gedaan moet worden - Omvat redeneervermogen, plannen, probleemoplossen, abstract denken, begrijpen van complexe ideeën, snelheid van leren, leren van ervaringen (ook uit het hoofd leren en specifieke schoolse vaardigheden) - Niet: creativiteit, karakter, persoonlijkheid Cognitie: leren kennen van fysische en sociale wereld & processen van informatieverwerking (experimentele benadering) Geschiktheid (aptitude): vermogen om op een bepaald domein te presteren na doelgerichte training Prestatie: wat verworven is na het volgen van een curriculum Intelligentie, geschiktheid en prestatie ‘maximum performance’ constructen: niet wat mensen typisch doen, maar wat ze (zouden) kunnen! Wel gevoelig voor angst.
Impliciete theorievorming Impliciete persoonlijkheidstheorie van intelligentie: onderliggend prototypisch concept Nevo (1993): bestuderen van objectieve regels voor correctheid - Correspondentie met algemeen aanvaarde kennis - Staat in de boeken - Ik weet het antwoord gewoon: sluit niet aan bij klassieke benadering IQ test, geen sterk criterium, het is iets intuïtief - Je kunt er achter komen door goed te kijken of luisteren - Logische procedure of wiskundige regel Conventionele en wetenschappelijke argumenten
83
Sternberg et al. (1981): de ideaal intelligente persoon volgens 500 leken en 150 experts - Leken: practical problem solving ability, verbal ability, social compentence - Experts: verbal intelligence, problem solving ability, en practical intelligence
Sternberg (1995): impliciete persoonlijkheidstheorie van ‘intelligentie’, ‘wijsheid’ en ‘creativiteit’ - 100 termen gegenereerd door proffen in kunstgeschiedenis, filosofie, fysica en economie - Elk kenmerk beoordeeld op prototypicaliteit voor de drie concepten (9-punten schaal) door studenten en proffen - Sorteertaak: drie bipolaire dimensies via Multidimensionale Schaalmethoden (R²=.82) 1) vaardigheid om praktische problemen op te lossen versus verbale vaardigheid 2) intellectuele balans en integratie versus doelgericht 3) contextuele intelligentie versus ‘fluid thougth’
84
- Redelijke overeenkomst tussen intelligentie en wijsheid, weinig overeenkomst tussen intelligentie en creativiteit - Creativiteit bevat ook: kennis van inhoudelijk vakgebied, zelfsturende denkstijl, tolerantie voor onzekerheid, hoge motivatie Pas op: onderzoek naar gepercipieerde facetten van intelligentie, niet naar intelligentie op zich Cultuurspecificiteit: - onderzoek van Berry en Bennett (1992) bij de Cree (hebben eigen schrift) ‣
20 termen gerelateerd aan intelligentie bij 60 personen
‣
Stapeltjes met gelijke termen
‣
Twee dimensies: • Wijs/denkt hard/schenkt aandacht/heeft richtingsgevoel/toont respect vs dom/gek/backward thinking • Volhardend/stevig/moedig vs begrijpt nieuwe dingen/is religieus
‣
Geïnterpreteerd ifv sociale organisatie
- Chewa in Zambia: sociale verantwoordelijkheid, samenwerking, gehoorzaamheid - Yang en Sternberg bij Taiwanezen (1997): 5 factoren 1. Algemene cognitieve factor 2. Interpersoonlijke intelligentie 3. Intrapersoonlijke intelligentie 4. Intellectuele zelfbewustheid 5. Intellectuele bescheidenheid Westerse en niet-Westerse leken verschillen op zelfde manier van experts (sociaal) 85
Zelfinschatting van intelligentie - overschatting - mannen schatten zichzelf hoger in dan vrouwen (vooral op wiskunde en ruimtelijke taken) - hoger scoren dan grootouders en beetje lager dan kinderen Geen onderzoek naar alledaagse opvattingen over geschiktheden Geen onderzoek naar alledaagse opvattingen over prestatie, maar: - examens en proefwerken - niet valide of betrouwbaar, maar schooladvies hangt voor 87% samen met IQ-test - formatieve functie - Centraal Instituut voor Toetsontwikkeling (Cito) (Nederland) & College Admission Tests
Expliciete theorievorming Psychometrische intelligentie-opvattingen
Spearman's G (1923) - Prestaties = algemene factor G + specifieke factor S - Positieve correlaties tussen alle intelligentietaken: ‣
Positive manifold: zeer diverse subtaken correleren allemaal positief!
‣
1 grote factor
- ‘indifference of indicator’: als er maar 1 factor is, maakt het niet uit welke subtest je opneemt in intelligentiebatterij - ondanks 1 mentaal vermogen, toch 3 invullingen, onderliggende principes: ‣ Apprehension of experience: leren uit ervaring ‣ Eduction of relations: inductief redeneren ‣ Eduction of correlates: deductief redeneren - 20 jaar later: Raven Progressive Matrices: Raven heeft theorie van Spearman proberen operationaliseren inductief regels achterhalen
86
Thurstones ‘Primary Mental Abilities’ (1941) -> er zijn verschillende mentale vermogens, hoe kon Spearman dan 1 factor vinden? Niet, hij vond Spearman zijn test factor-onzuiver. (Om vb. blokpatronen na te maken, was er eerst een verbale instructie, maar dus om taak te volbrengen, moest men ook verbaal de uitleg begrijpen.) - Factoranalyse op 56 tests - Zeven groepjes van tests met hoge lading op telkens één factor! ‣ verbaal inzicht (verbal comprehension) vb. betekenis ‣ woordvlotheid (word fluency) vb. woorden met 'b' ‣ rekenkundig inzicht (number facility) ‣ visueel-ruimtelijk inzicht (spatial visualization) ‣ associatief geheugen (associative memory) ‣ waarnemingssnelheid (perceptual speed) ‣ logisch redeneren (reasoning) 7 relatief onafhankelijke subtesten. De correlaties tussen testen laag, dus klopt -> meerdere factoren. Maar wanneer hij een representatieve steekproef uit de populatie nam, bleken de correlaties toch hoog genoeg, iets lager dan andere, maar nog steeds significant positief (positive manifold) - Homogene groepen: minder variabiliteit, dus minder verbanden vaststellen - Lagere intelligentie: subtesten hanger sterker samen, dus ook minder variabiliteit •
Guilfords ‘Structure of Intellect’(1967) - 120 soorten intelligentie: 5 x 4 x 6 (opdelen aan de hand van 3 criteria): ‣ Operaties: wat doet de respondent cognitie (identificeren probleem, weten wat aan de hand is), geheugen (informatie opslaan), divergente productie (verschillende antwoorden verzinnen op vraag), convergentie productie (maar 1 correcte oplossing mogelijk), evaluatie (oplossing op probleem evalueren) ‣ Inhoud: aard van materiaal of informatie waarop de operaties worden uitgevoerd figuratief (visueel materiaal vb. Raven), symbolisch (met tekens, hebben wel betekenis), semantisch (begrijpen van woorden), gedrag (wat mensen doen) ‣ Producten: de vorm waarin de informatie wordt verwerkt door respondent eenheden (iets op zichzelf), klassen (dingen die iets met elkaar delen), relaties (verbanden leggen), systemen (eenheden en klassen samen), transformaties (tekst met fouten verbeteren), implicaties (gevolgtrekking) - Onderzoek gestimuleerd naar divergent denken: creativiteitsonderzoek 87
Vernons hiërarchisch model (1960): tussenmodel - Spearmans G (is er nog, maar niet voldoende) - Twee brede groepsfactoren: verbal-educational, spacial-mechanical - Kleinere groepsfactoren: verbaal, nummer, … - Specifieke factoren - Hiërarchische factoranalyse: 1ste , 2de , 3de orde factoren, oblieke rotatie ‘Definitieve’ factoranalyse van intelligentietests door Carroll (1993) - Systematische ordening van alle intelligentieonderzoek vanaf jaren 30 - Factoranalyse als methode - Three stratum theory of cognitive abilities ‣ Stratum I: specifieke cognitieve begaafdheden ‣ Stratum II: brede cognitieve begaafdheden ‧
Verbaal vermogen
‧
Redeneervermogen
‧
Geheugen en leren
‧
Ruimtelijk inzicht
‧
Auditieve perceptie
‧
Vermogen kenmerken van zaken en personen uit geheugen op te halen
‧
Cognitieve snelheid
‧
Verwerkingssnelheid
‣ Stratum III: g
88
Informatieverwerkingsbenadering Componentieel model voor analoog redeneren: - Opsplitsen van globale taak in subtaken - Meten van elk van de subtaken
1. 2. 3. 4. 5.
Encoderen: coderen van de attributen (groot, blij, man, zwarte hoed) Inferentie van relatie tussen A en B: blij naar droevig, man naar vrouw Mapping (afbeelden) relatie A en C: van groot naar klein Toepassen van AB-relatie op CD: droevig, klein, vrouw met zwarte hoed Produceren van correct antwoord: subcomponenten
‣
Genereren van kandidaat
‣
Vergelijken tussen alternatieven
‣
Proces van verantwoording indien ze niet matchen 89
Decompositie van reactietijd (twee vormen): 1. Eerst deel van probleem presenteren en dan pas beginnen meten of variëren van onderdelen 2. Afstanden variëren tussen onderdelen (meer of minder attributen) WAT IS DE BASISASSUMPTIE VAN DEZE BENADERING? Onderscheid tussen performatiecomponenten en metacomponenten Metacomponenten: - Herkennen van bestaan van probleem - Beslissen over de aard van het probleem - Selecteren van lagere-orde processen op het op te lossen - Selecteren van strategie om deze componenten te combineren - Selecteren van mentale representatie waarop zowel de componenten als de strategieën kunnen werken - Toewijzen van mentale bronnen - Monitoren van de probleemoplossing (tijdens) - Evalueren van probleemoplossing (na) Elementaire cognitieve taken - Reactietijdtaak: variatie in reactietijd correleert -.23 (negatief, want reatietijd; hoe minder tijd nodig, hoe 'slimmer') met IQ (houten blok met lichtjes en knopjes: wanneer lichtje brandt, op bijhorend knopje duwen) - Inspectietijdtaak: correlatie met IQ tussen -.30 (studenten) en -.50 (homogene groep) (focussen op bolletje, en dan verschijnt er heel kort ofwel A ofwel B. Daarna zeggen welk lijnstuk het langst was, het linker of het rechter. Tijd dat je het te zien krijgt, vermindert telkens, tot je het niet meer kan zeggen)
- Lexicale toegang: correleert -.30 met verbaal IQ - Gecombineerde ECT’s correleren tussen -.50 en -.70 met g-factor: belang van snelheid
90
Hersenbenadering Hebb (1949): IQ-verschillen gaan terug op het centrale zenuwstelsel - Intelligentie A: efficiënt metabolisme in de hersenen - Intelligentie B: intelligent gedrag in leven -> interesse psychologen! - Intelligentie C: intelligentie zoals gemeten met IQ-test Das en Naglieri: IQ test op basis van werk van Luria (Cognitive Assessment System) - Gelijktijdig coderen vb. 'kies plaatje met cirkel links naast kegel' Opeenvolgend coderen vb. woorden voorgelezen, in zelfde volgorde reproduceren - Aandacht vb. bepaalde code zoeken in complex geheel - Planning vb. verschillende stappen zorgvuldig organiseren (vooral prefrontaal) EEG (kijken naar elektrische informatie die door hersenen loopt) & EVP (stimulus aanbieden, en kijken hoe hersenen reageren): kleine maar stabiele verbanden met IQ Twee hypotheses, contradictorisch maar beiden mogelijk: 1) intelligente mensen kunnen meer informatie aan, hebben vb. meer zuurstof nodig in hersenen, en gaan meer elektrisch reageren 2) intelligente mensen hebben efficiëntere hersenen: minder verbruiken =juist GESCHIKTHEID Vaardigheidstaxonomie van Fleishman (1975) -> niet in klassieke testen, maar specifiek - Cognitieve: Oral Comprehension, Written Comprehension, Oral Expression, Written Expression, Fluency of Ideas, Originality, Memorization, Problem Sensitivity, Mathematical Reasoning, Number Facility, Deductive Reasoning, Inductive Reasoning, Information Ordering, Category Flexibility, Speed of Closure, Flexibility of Closure, Spatial Orientation, Visualization, Perceptual Speed, Control Precision - Psychomotorische: Multilimb Coordination, Response Orientation, Rate Control, Reaction Time, Arm-Hand Steadiness, Manual Dexterity, Finger Dexterity, WristFinger Speed, Speed of Limb Movement, Selective Attention, Time Sharing - Perceptuele: Near Vision, Far Vision, Visual Color Discrimination, Night Vision, Peripheral Vision, Depth Perception, Glare Sensitivity, General Hearing, Auditory Attention, Sound Localization, Speech Hearing, Speech Clarity - Fysische: Static Strength, Explosive Strength, Dynamic Strength, Trunk Strength, Extent Flexibility, Dynamic Flexibility, Gross Body Coordination, Gross Body Equilibrium, Stamina CHC-model: zoals nu gebruikt door de CLB’s PRESTATIE-TOETSEN -> niet aan theorie gebonden
91
Ontwikkelingspsychologische benadering
Piaget: ontwikkeling van menselijke intelligentie - Van biologische wezen tot formele denker: assimilatie (omgevingsinformatie neemt men op in bestaande cognitieve structuren die aanwezig zijn in de persoon) en accommodatie (eigen mentale representaties passen zich aan aan de nieuwe complexere informatie die men heeft gekregen) - Vier grote ontwikkelingsstadia ‣ Sensi-motorisch stadium (info halen uit buitenwereld ‣ Preoperationeel stadium (beeld ontwikkeld van omgeving, 1 aspect verwerken) ‣ Concreet operationele stadium (al meerdere aspecten verwerken) ‣ Formeel operationele stadium (hypotheses formuleren, weerleggen/bevestigen) - Onderzocht via specifieke taken zoals conservatietaken (glazen-water)
Sociale context
Gedragsgenetische studies: - Erfelijkheid: +/- 50% - Verschillen binnen gezinnen belangrijker dan verschillen tussen gezinnen
Relatie IQ-inkomen: .31-.37
92
Zeer hoge correlatie op landsniveau tussen schoolprestatie en IQ (Lynn & Vanhanen, 2002): - 86 landen - Wiskunde, wetenschappen, lezen - Correlatie van .917 - Belang van scholing
Effecten van interventies: alleen bij langdurige interventies Relatie met school- en beroepssucces: .50 = best single predictor (:indien maar 1 test mag)
Intelligentie en cognitie: integratie of confrontatie van theoretische oriëntaties? Individuele verschillen en ontwikkeling Mate van stabiliteit: - Absolute stabiliteit: ‣ Tot volwassenheid: stijging ‣ In volwassenheid – ouderdom: Gf neemt af, Gc blijft lang stabiel (schattingen verschillen afhankelijk van onderzoeksopzet
Door Flinn-effect: verwarring tussen cohorteffect en leeftijdseffect. Wanneer je cohort-effect meeneemt, (cross-sectioneel, dus zelfde batterij bij verschillende cohorten) daalt de intelligentie lichtjes vanaf 65 jaar. Wanneer je dat niet meeneemt, dus longitudinaal, daalt IQ sneller. Maar hangt af van welke intelligentie je bevraagt. 93
- Rangorde stabiliteit: zeer stabiel vanaf begin van lagere school - Heterotypische stabiliteit: ‣ Weinig verbanden met ontwikkeling in baby/peutertijd met Bayley’s schalen ‣ Substantieel verband met habituatie (vb. speelgoed -> nieuw speelgoed) bij baby's (r = .37) ‣ Weinig onderzoek naar structurele en ipsatieve stabiliteit Demetriou en Efklides (1987) - Niet resultaat van exploratieve analyse, maar past in veronderstelde organisatie van menselijke intellectuele vermogens (vgl. Thurstone’s PMA-traditie) - Neo-Piagetiaans: ‘genetisch’ karakter (stadiumgewijze ontwikkeling) - Multipele factor theorie: psychometrisch ‣ Kwantitatief-relationele capaciteit ‣ Kwalitatief-analytische capaciteit ‣ Ruimtelijk voorstellingsvermogen ‣ Oorzakelijke verbanden vaststellen ‣ Verbale capaciteit ‣ Metacognitieve reflectie - Exploratieve factoranalyse (Case et al., 2001): ‣ Toch ook g-factor Individuele verschillen en sociale context Relatie tussen SAT en prestaties niet toe te schrijven aan SES (Sackett e.a., 2009): - rSAT-prestatie = .47 - rSAT-prestatie.SES = .44 Flynn-effect: (of cohort-effect) - Op basis van rekruten bij dienstplicht & nieuwe normeringen van bestaande instrumenten - Gemiddelde stijging van ongeveer één SD (15 IQ-punten) - Effect het grootste op maten voor Gf
94
- Mogelijke verklaringen: ‧
Testwiseness
‧
Betere voeding
‧
Bestrijding van kinderziektes
‧
Toegenomen SES
‧
Verbeterde scholing, …
-Wordt ook vastgesteld tijdens de babyleeftijd (Bayley- en Griffith-schalen) - Het verschil tussen blank en zwart in VS is echter stabiel gebleven tussen 1954 en 2008 (Rushton & Jensen, 2010)
Alternatieve theorievorming Interindividuele verschillen
Gardners (1983-1984) naturalistische benadering - Multipele intelligenties: linguïstisch, logisch-wiskundig, ruimtelijk, muzikaal, lichamelijk-motorisch, interpersoonlijke, intrapersoonlijk, maar niet onafhankelijk! - Over langere tijd gedragingen in natuurlijke omgeving vaststellen: tests, gesprekken, interviews - Maar geen bruikbare en psychometrisch verantwoorde instrumenten
‘Competenties’ volgens Greenspan en Driscoll - Kwaliteiten van managers en professionals - Oplossen van concrete problemen en bereiken van professionele doelen -Competentie = kwaliteit die personen aanzet tot bereiken van doelen - Vier domeinen van competenties: ‣ Persoonlijke competenties ‣ Affectieve competenties ‣ Alledaagse competenties ‣ Academische competenties - Empirische evidentie? Intelligentie is beste voorspeller van succes op het werk Leerpotentieel & dynamisch testen
95
Succesvolle intelligentie volgens Sternberg - Succesvolle intelligentie = vermogen om succes in het leven te bereiken gegeven je eigen standaarden in een specifieke socio-culturele omgeving - Maximaal benutten van sterke kanten, compenseren van zwakke kanten: balans van analytische, creatieve en praktische vaardigheden - Relatie tussen intelligentie en interne wereld, ervaring van de persoon, externe wereld Emotionele intelligentie (bespreken we later) Sociale context Sociaal constructivisme: kensystemen als symbolische realiteit voor de sociale gemeenschap - Gelijkwaardigheid tussen alledaagse en wetenschappelijke kensystemen - Eén constructie waarnaar wordt gehandeld - Mugny & Carugati (1989): ‣ Omschrijving van algemene en specifieke intelligentie ‣ Hoe wiskunde, talen, tekenen leren ‣ Welke informatiebronnen van belang ‣ Gedragingen van intelligent kind ‣ Hoe intelligentie vaststellen Vier centrale thema’s: (1) waar komen individuele verschillen vandaan (2) relatie met sociale regels van samenleving (3) product van ‘hogere processen’ (4) beïnvloedbaarheid (SES, erfelijkheid) - Sociale representaties functie van bekendheid en sociale identiteit ‣ Minder vertrouwd met thema, meer invullen als ‘natural giftedness’, niet voorspelbaar, mysterieus ‣ Buitenhuiswerkende moeders zagen intelligentie meer als gevolg van biologisch rijpingsproces
96
Operationalisatie en meten Afbeelden van individuele verschillen in intelligentietests Exploratorische factoranalyse - Één factor: G + S (vb. Spearman) - Multipele factoren: principale factoranalyse + orthogonale rotatie naar éénvoudige structuur (=elke intelligentietest heeft hoge lading op één factor, de rest nul; patroon van ladingen verschilt voor elke factor, nullading of hoge lading) (vb. Thurstone) - Hiërarchische factoranalyse (vb. Carroll)
Confirmatorische factoranalyse - A-priori model toetsen met empirische gegevens - Verwachte factorstructuur voorspelling van te observeren variantie-covariantiestructuur - Berlin intelligence structure Gf = processing capacity, snelheid & geheugen Gc = fluency & kennis getoetst bij 9520 studenten -> Maar, niet slechts één model dat bij de gegevens past.
97
Multidimensionale schalering (niet vaak gebruikt) twee punten dicht bij elkaar: hoge corr.
- Afstandsmaat: dij = 1-rij - Tweedimensionale oplossing - Raven (complexere) testen in het midden
Afbeelden van (school)prestaties met klassieke en moderne testtheorie - Klassieke testtheorie ‣ p-waarden ‣ Discriminatie tussen goede en slechte presteerders ‣ Item-test correlaties ‣ Betrouwbaarheid - Moderne testtheorie ‣
Educational Testing Service & Centraal Instituut voor Testontwikkeling
‣
Confirmatorisch: toetsen van interne structuur van de test (unidimensionaliteit)
‣
Twee-parameter logistisch model: moeilijkheidsgraad en discriminerend vermogen
‣
Geen aanwijzingen voor betere predictie (maar standaardmeetfout, differentieel itemfunctioneren, partiële overlap) 98
Les 10: Conceptualiseren en meting van EI Conceptualisering van basisbegrippen Emotionele intelligentie persoonlijkheid en vaardigheid Aanverwante begrippen: sociale intelligentie, praktische intelligentie, alexithymie en psychologische oriëntatie
Introductie Voor het eerst het begrip 'emotionele intelligentie' geïntroduceerd in een wetenschappelijk onderzoek van: Mayer, J. D., DiPaolo, M. T., & Salovey, P. (1990). Perceiving affective content in ambiguous visual stimuli: A component of emotional intelligence. Journal of Personality Assessment, 54, 772-781. En tweede artikel: Salovey, P., & Mayer, J. D. (1990). 'Emotional intelligence. Imagination, Cognition, and Personality', 9, 185-211. Binnen 5 jaar tijd is het begrip enorm in populariteit toegenomen, binnen wetenschappelijk onderzoek, maar ook bij de 'leken', de maatschappij. Goleman, D. (1995) boek: 'Emotional intelligence'. Goleman is een doctor in de psychologie die zich gespecialiseerd had in het populariseren van wetenschappelijk onderzoek in de psychologie. In zijn boek heeft hij heel wat onderzoek rond emoties gepopulariseerd, maar hij overdrijft heel hard. Vb. (IQ gets you hired, EQ gets you promoted'. Hij vond EQ heel belangrijk. Time-magazine, The EQ factor, oktober 1995: psychologisch construct haalde de cover! Metro-dagblad Maar, wijd verspreid concept met zeer veel betekenissen
EQ als persoonlijkheid Goleman, 1995, 5 competenties 1. emoties kennen 2. omgaan met emoties 3. zichzelf motiveren 4. herkennen van emoties in anderen 5. omgaan met relaties maar ook zelfbewustzijn, impulscontrole, uitstel van gratificatie (beloning), en omgaan met stress en angst In 1997, al 25 competenties (vb. politiek bewustzijn, klantoriëntatie, zelfvertrouwen, gewetensvolheid, prestatiedrang) 99
Probleem van afbakening van het concept EQ: Goleman ziet 'inspirerend leiderschap' als onderdeel van EQ, maar het is eerder een EQ die bijdraagt of een onderdeel is van inspirerend leiderschap. Als leider moet je misschien wel een relatief hoog EQ hebben, maar leiderschap is geen deel van EQ.
Alles wat goed is, of kan bijdragen op het werk, is op een of andere manier in het model opgenomen. Output die je zou krijgen als je het instrument invult voor 'Conflict management'.
ECI: Emotional Competence Inventory (Boyatzis, Goleman, & Rhee, 2000) Betrouwbaarheid en validiteit - Zelf- en anderenbeoordeling: betrouwbaarheden tussen .61 en .93 - Studie Spanje: factorstructuur -> slechts één factor! (ipv 4 of 5) Wat zou een verklaring kunnen zijn? - inhoudelijk: we kunnen ze conceptueel onderscheiden, maar in realiteit 1 geheel - hier: typical performance instrument, dus: responsstijlen, vb. sociale wenselijkheid, bij sommige mensen klikt het beter ('fit') tussen student en mentor (bij studie Spanje) Predictieve validiteit: Bijdrage aan winst bij partners in consultancy bedrijf - Hoog vs laag op zelfregulatie: 390% meer (bijdrage winst) - Hoog vs laag op sociale vaardigheden: 110% meer - Hoog vs laag op analytisch redeneren (klassieke intelligentie): 50% meer Kan dit? Nee, claim om te benadrukken dat EQ zogezegd belangrijker is dan IQ, maar niet zo waarschijnlijk als beschreven! 100
Bar-On (1997) EQ-i: Emotional Quotient Inventory (Bar-On, 1997) 5 composietschalen, 15 subschalen 1. Intrapersoonlijk EQ: zelfaandacht, emotioneel zelfbewustzijn, assertiviteit, onafhankelijkheid, zelf-actualisering 2. Interpersoonlijk EQ: empathie, sociale verantwoordelijkheid, interpersoonlijke relaties 3. Stressmanagement EQ: stress tolerantie, impulscontrole 4. Adaptabiliteit EQ: realiteitstesting, flexibiliteit en probleemoplossing 5. Algemeen gemoedstoestand EQ: optimisme en geluk (maar: outcome vs. deel construct?) Uitkomsten: - Geslachtsverschillen: ‣ geen algemene verschillen ‣ vrouwen hoger interpersoonlijk EQ ‣ mannen hoger intrapersoonlijk, stress management en adaptabiliteits EQ - Leeftijd: scores stijgen tot begin 50 - Geen etnische verschillen in de VS - Matige correlatie met positieve impressie: .19 (sociale wenselijkheid, hier in onderzoekscontext. stijgt in jobcontext vb. sollicitatie) - Hoge correlaties tussen subschalen: .50 - Redelijke interne consistentie: .69-.86 - Stabiliteit: .66 / .73 (hertesting) - Slechts 10 factoren in confirmatorische factoranalyse onderscheiden Divergente en convergente validiteit: divergente niet goed! - Afwezigheid van correlaties met IQ-testen (vanuit Bar-On's visie: goed) - Maar: (te) hoge correlatie met persoonlijkheids- en psychopathologievragenlijsten: ‣ r = +.64 tussen EQ-i Zelfaandacht en Emotionele stabiliteit PF16
101
‣ r = -.85 tussen EQ-i Probleemoplossing en Obsessief-Compulsief SCL-90 ‣ r = -.85 tussen EQ-i Interpersoonlijke relaties en Interpersoonlijke sensitiviteit SCL-90 Wat behoort niet tot het concept EI? vb. klantvriendelijkheid wel, wat dan niet? (bijna alles!) Gevaar van herbenoemen persoonlijkheid als EI - Vroeger onderzoek wordt vergeten: herontdekking van het wiel We hebben al vb. neuroticisme gevonden in persoonlijkheidstrek, en we weten de 'gevolgen' op emotioneel vlak, moeten we nu dan nog EI hebben ook? - Niet één onderliggend concept, maar verschillende, soms tegenstrijdige concepten ‣ Prestatiedrang versus gewetensvolheid: we weten, uit onderzoek naar persoonlijkheid, dat mensen die een hoge prestatiedrang hebben, soms de ethiek en deontologie aan de kant schuiven om hun doel te bereiken. Als je beide concepten dus in de EI opneemt, is dat problematisch ‣ Hoog zelfvertrouwen en rekening houden met anderen: zelfde probleem - Pretenties dat EQ > IQ zijn niet hard te maken; magere empirische evidentie! Waaraan moet een goed construct voldoen? 1. Goede operationalisering: overeenkomst tussen concept en meetinstrument 2. Incrementele validiteit: de test moet iets anders meten dan wat reeds bestaat Vb. EI schaal van Schutte et al. (1998): houdt positief verband met punten op einde van het jaar (.32), maar is dit specifiek? Sterk verband met positief gemoed is nog niet voldoende onderzocht EI-concept confronteert met persoonlijkheid
EI als mentaal vermogen Visie van Mayer, Salovey, & Caruso : EI=‘an intelligence that processes and benifits from emotions’ Afzonderlijke vorm van klassieke intelligentie, dus we nog niet gemeten hebben Niet al wat belangrijk of goed is, is intelligentie: probleemoplossing centraal 'Sociaal zijn' versus 'in stand houden sociale relaties' (overtuigen, teambuilding, enz.) Ze baken de termen veel beter af
102
MSCEIT: Mayer, Salovey, and Caruso Emotional Intelligence (1999) EI als unitair concept met vier takken 1. Emotionele perceptie en identificatie: herkennen en invoer van informatie van het emotiesysteem ‣
In gelaatsuitdrukkingen
‣
In landschappen
‣
In abstracte tekeningen
‣
Weinig verbale aspecten
‣ Aanduiden op 5-puntenschaal in welke mate aanwezig 2. Emotionele facilitering van denken: (veel discussie als het wel aparte tak is) gebruik van emoties om cognitieve processen te verbeteren (sceptisch vs optimistisch) ‣
Synesthesiesubschaal belangrijkste (smaak, gevoel, kleur)
‣ Gebruik van emoties bij redeneren en probleemoplossing 3. Emotioneel begrip: cognitieve verwerking (begrijpen) van emoties ‣
Mengvormen
‣
Transities
‣ Progressies 4. Emotiemanagement: management van eigen emoties en die van anderen ‣ Managen van emoties zichzelf ‣ Managen van emoties bij anderen (alle volgende correlaties positief!) - Betrouwbaarheden: .64 tot .88, .94 voor totaal EQ - .36/.45 verbale intelligentie - .05: Raven Progressive Matrices - .46: EQ-i totaalscore - Toename met leeftijd - .36 met EQ-i - .28 met zelfgerapporteerde levenstevredenheid - .31 maximale correlatie met persoonlijkheidsmaten (nl. self-esteem) - Minder zelf- en ander - gerapporteerde agressie bij adolescenten en universiteitsstudenten (rond -.40) - r = .51 tussen EI en rangorde van effectiviteit van teamleiderschap - Het probleem van het juiste antwoord: ‣ Doelcriteria: foto tonen en dan vragen: welke emotie heb je ervaren? kritiek: mensen zijn zich er niet altijd van bewust waarom ze zich zus of zo voelen. ‣ Expertcriteria: aan experts vragen welke emotie iets heeft, maar, wie is expert? emotie-onderzoeker -> labo, maar vaak Asperger ‣ Consensuscriteria: meest gebruikt, je geeft vragen aan grote sample,dus dan grootste gekozen emotie is de 'juiste', maar is de minderheid dan fout? (corr. met expertcrit.!) -> Problematisch (cultureel bepaald?), maar niet arbitrair 103
Gerelateerde constructen Sociale intelligentie vaardigheid van om te gaan met mensen, interpersoonlijke kennis, inzicht in gemoedstoestand en trekken van anderen, correct beoordelen van gevoelens, gemoedstoestanden en motivaties, effectief sociaal functioneren, decoderen van nietverbale cues (gelaatsuitdrukkingen), empathie probleem: substantiële correlatie met IQ (vooral verbaal), behalve voor decoderen van nietverbale cues Praktische intelligentie probleemoplossing in alledaagse situaties, niet geleerd via expliciete instructies, wel door impliciete regels, kennis te onderscheiden van persoonlijkheid empirische evidentie voor bijdrage naast IQ: - Impliciete kennis van business managers: r = .2 tot .4 met loon, jaren ervaring, werken voor topbedrijf, studenten scoren substantieel lager: minder ervaring - Kennis van geneeskundige krachten in Kenia: negatieve correlatie met verbale IQ (Sternberg) -> iets anders gemeten dan klassieke intelligentie! Alexithymie: (TAS) meet net het omgekeerde als de EQ-i van Bar-On belangrijk concept in psychosomatisch onderzoek, komt uit psychoanalytische hoek a – lexos – thymos (Sifneos) = geen woorden hebben voor gevoelens ‘La pensée opératoire’ = operationeel denken, mechanisch denken ‘Hyposymbolization’ = niet in staat zijn om te symboliseren (of mentaliseren) drie pijlers: 1. moeilijkheid met het identificeren van emoties 2. moeilijkheid met het beschrijven van emoties 3. extern georiënteerd denken drie factoren: 2 & 3: Pensée opératoire 1. Moeilijkheden om gevoelens te identificeren (MGI) 2. Moeilijkheden om gevoelens te beschrijven aan anderen (MGB) 3. Extern georiënteerd denken (EGD) Stabiliteit van factorstructuur - Duits, Hindi, Italiaans, Koreaans, Litouws, Portugees, Spaans, Zweeds, Vlaams - Zowel bij klinische als niet-klinische steekproeven 104
Psychologische oriëntatie: ontwikkeld uit vaststelling dat niet iedereen profiteert van een psychoanalyse analyseerbaarheid: geschiktheid voor psychoanalyse vaardigheid om intrapsychische (dynamische) componenten te identificeren en in verband te brengen met zijn of haar problemen twee video’s van patiënt-therapie-interacties: na elke video de vraag “Wat is het probleem van deze vrouw?” - betrouwbaar te scoren - negatief verband met alexithymie: -.68 (TAS-TOT) Verband intrapsychische en interpersoonlijke aspect? Is psychologische oriëntatie positief? “Wiser but sadder”, “Mixed blessing” Onderscheid tussen proces (psychologische oriëntatie) en resultaat (= hoe je functioneert) Onafhankelijk van psychopathologie: hoog op psychologische oriëntatie en veel psychopathologie: analyseerbaarheid Gemakkelijk te veranderen? (Goleman) Maar, psychoanalyse: stabiel, ook na therapie Toch positief? Indirect: via empathie, betere sociale relaties en uitgebreider sociaal netwerk (cfr. schuldgeoriënteerdheid)
Conclusies Wetenschappelijk construct dat (te?) snel is doorgedrongen tot dagelijks taalgebruik: kan alles betekenen (behalve IQ) wat zijn waarde uitholt Andere naam voor persoonlijkheid? Intelligentie mbt. emoties: mentale vaardig-heid in het kader van probleemoplossing
Instrumenten Typical performance TAS20: Moeilijkheid om gevoelens te identificeren, moeilijkheid om gevoelens te beschrijven, extern georiënteerd denken TEIQUE: Trait Emotional Intelligence Questionnaire (omgekeerd; makkelijk) Maximum performance Verkorte ratingversie STEU: Situational Test of Emotional Understanding - STEU en STEM beiden ontwikkeld door MacCann en Robberts (2008), als reactie tegen de MSCEIT: ze vonden dat er een sterke theoretische basis ontbrak. STEU en STEM ontwikkeld op zeer rigoureuze manier, heel theoretisch. - STEU gebaseerd op appraisaltheorie van Roseman -> die theorie geoperationaliseerd. Theorie gaat ervan uit dat we een emotie hebben, wanneer we een situatie waarin we terechtkomen, op een bepaalde manier gaan interpreteren. ('to appraise') 105
Hoe we belangrijke situaties in het leven kunnen interpreteren, kunnen we vatten aan de hand van een aantal dimensies. vb. 'wie heeft het veroorzaakt?', 'hoeveel controle over situatie?' -> elke emotie wordt gekenmerkt door een appraisal-profiel: profiel van inschattingen. vb. item: "Iemand zal zich waarschijnlijk verrast voelen nadat … ? Er iets onverwachts gebeurt. Er iets onbekends gebeurt. Er is ongewoons gebeurt. Er iets engs gebeurt. Er iets onnozels gebeurt." -> verwachting dat eerste antwoord juiste is, omdat centrale appraisal bij verrassing 'unexpectedness'. Zo hebben zij een heel instrument gemaakt, met items die een operationalisering vormen van de theorie van Roseman. Verkorte ratingversie STEM: Situational Test of Emotional Management - niet theorie-gestuurd, maar methode toegepast (heel rigoureus) die veel wordt gebruikt in de bedrijfspsychologie: “situational judgement approach” = experts beoordelen goede reactie
afbeelding: voorbeeld van item. tussen haakjes zijn de scores /5 die experts gaven. - eerst: kritische incidenten gevraagd; gebeurtenissen waarin je een bepaalde emotie ervaart dan: aan experts gevraagd welke verschillende reacties (management, coping) je kunt hebben in zo'n situaties -> voor elk incident een paar emoties voorgesteld - vervolgens opnieuw aan experts deze mogelijke reacties voorgelegd en gevraagd hoe efficiënt de ene of de andere coping is in deze situatie. Verkorte ratingversie GERT: Geneva Emotion Recognition Test - Schlegel, K., Grandjean, D., & Scherer, K. R. (2014). Introducing the Geneva Emotion Recognition Test: An example of Rasch-based test development. Psychological Assessment, 26, 666-672. - Multimodaal: gelaat, stem, houding -> tegen vb. de MSCEIT die enkel met foto's van gelaatsuitdrukkingen werkt: in het echte leven zien we niet enkel de gezichten, maar horen we ook de stem en zien we de 'gesture'
- 14 emoties (!): + de definities worden gegeven, zodat men zelfde idee heeft
106
Trots
Gevoel van overwinning dat volgt op een succes of persoonlijke verwezenlijking
Blijheid Amusement Plezier Opluchting
Gevoel veroorzaakt door iets fantastisch dat onverwacht gebeurde Lachen met iets dat heel grappig is Ervaren van een gevoel van welzijn en zintuigelijk genoegen Gerustgesteld voelen op het einde van of bij de oplossing van een oncomfortabele, onaangename of zelfs gevaarlijke situatie Gefascineerd zijn of de aandacht die getrokken wordt door een persoon of zaak Geconfronteerd worden met een onverwachte of ongewone gebeurtenis (zonder positieve of negatieve connotatie) Angstig of bezorgd zijn over de gevolgen van een situatie die ongunstig kunnen zijn voor zichzelf of een naaste? Geconfronteerd worden met een naderend gevaar dat onze fysieke gezondheid bedreigt Tegenspoed bij een levensprobleem waar geen oplossing voor is, zonder dat men de situatie wil of kan aanvaarden Zich neerslachtig voelen na het verlies van een persoon, plaats of ding Ongenoegen ervaren bij iets of iemand terwijl men er toch kalm bij blijft Extreem ongenoegen veroorzaakt door iemands oneerlijke of vijandige handeling Afkeer veroorzaakt door een onaangenaam object of onaangename omgeving
Interesse Verassing Ongerustheid Angst Wanhoop Verdriet Irritatie Kwaadheid Walging
Studies in kader van psychodiagnostiek (werkcolleges) Onderzoeksvragen 1. Hoe correleren de STEU, STEM, en GERT met elkaar? (zou positief moeten zijn!) 2. Hoe correleren de STEU, STEM, en GERT met TAS-schalen en TEIQue? = correlatie zelfrapportagematen en maximum performance maten -> we verwachten matige corr. (=.30) 3. Wat is het nomologische netwerk? Hoe zit het met persoonlijkheidsvariabele en IQ? Steekproeven Steekproef 1 - 236 vrouwen, 169 mannen - Gemiddelde leeftijd: 35.25 Steekproef 2 - 190 vrouwen, 163 mannen - Gemiddelde leeftijd: 36.04 Instrumenten
Affectintensiteit: affect intensiteit positieve gevoelens, affectintensiteit negatieve gevoelens PANAS (uitgebreid): positief affect, negatief affect + interpersoonlijk affect Rosenberg Self-Esteem Interpersonal Reactivity Index: personal distress, empathic concern, perspective taking, phantasy Dutch Test for Conflict Handling: Avoidance, Compromise, Fight, Problem Solving, Yield HEXACO: Honesty_Humility, Emotionality, Extraversion, Agreeableness, Conscientiousness, Openness to Experience IQ: WIT-S TAS-20, TEIQue-sf, Verkorte rating versie van STEU(60) STEM(60), GERT(70)
107
Resultaten
1. Correlaties tussen STEU, STEM en GERT Redelijk hoog! Tussen de .50 en .60. 2. Correlaties tussen TAS en TEIQue TEIQue correleert negatief met de TAS, vrij hoge correlaties, vooral voor de eerste twee subschalen. -> we meten ongeveer hetzelfde construct 3. Correlaties van STEU, STEM, GERT met TAS en TEIQue - TAS 'difficulty describing feelings' correleert het hoogst met de maximum performance maten, met een correlatie van tussen de -.20 en -.30 (sluit aan bij wat we vinden in literatuur; er is er een, maar niet heel hoog) - met TEIQue wat lagere correlaties (en positief) - met TAS (andere 2 schalen) wat hoger en ook negatief, natuurlijk 4. Factor analyse STEU, STEM, GERT (extra!) - als we één factor uit deze testen trekken, bepalen we 54.66 procent van de totale variantie - er is duidelijk één factor aanwezig - alle drie de subtesten scoren hoog op deze factor 5. Factor analyse TAS en TEIQue (extra!) - ook dominant één factor, enkel de TAS Externally Oriented Thinking laadt wat lager 6. Nomologisch network maximum en typical performance maten - correlaties tussen typical performance - persoonlijkheidsmaten zijn altijd hoger dan de correlaties tussen maximum performance - persoonlijkheidsmaten - bij Rosenberg: hoge correlatie tussen typical performance en zelfwaardegevoel - HEXACO: TEIQue en TAS samen, bekomen we een correlatie van ongeveer .64 met extraversie van de HEXACO. Met maximum performance vrijwel geen correlaties. Discussie STEU, STEM, GERT zijn onderling hoog gecorreleerd en vormen één factor -> wijst in de richtng van een maximum performance EI TAS-schalen en TEIQue-sf zijn onderling hoog gecorreleerd en vormen één factor -> je zou kunnen zeggen, evidentie voor typical performance EI Typical performance EI is matig tot hoog gecorreleerd met zelfrapportage persoonlijkheidsmaten (extraversie in het bijzonder) Maximum performance EI is niet hoog gecorreleerd met zelfrapportage persoonlijkheidsmaten en ook niet met IQ (hoogste met IQ en TAS-schalen) Bevestigt probleem van incrementele validiteit van zelfrapportagematen, maar niet van maximumperformance maten 108