Toegepaste data-analyse: sessie 3

Toegepaste data-analyse: sessie 3 Mixed Models II: Actor-partner model 𝜎𝜎2 𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘

Corr (Yij, Yik) = 𝜎𝜎2 𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘+ 𝜎𝜎2 𝑟𝑟𝑟𝑟𝑟𝑟

Je kan deze data niet modelleren a.d.h.v. lineaire regressie. Er zijn 2 manieren om dit op te lossen, nl. door op te delen in een random effecten model ofwel gebruik te maken van een marginaal model. Bij een random effecten model, ga je het intercept random nemen. Bij het marginaal model ga je dat niet doen, maar ga je de variantie-covariantiestructuur gaan fixeren. In SPSS is er een groot verschil tussen deze beide mogelijkheden. Bij random effecten ga je in het 1ste kadertje “Repeated” leeg laten en wel random effecten toevoegen bij “Random”. Bij het marginaal model ga je de kader “Repeated” invullen en een variantiecovariantiestructuur kiezen. Het kadertje “Random” ga je hier niet invullen. Bij een hiërarchisch model ga je een onderscheid kunnen maken tussen binnen-groep en tussen-groep variantie en ga je dus duidelijk kunnen zeggen waar de variantie vandaan komt. Bij een marginaal model kan je dit niet Je kan random effecten gebruiken bij ongebalanceerde data en marginale modellen niet (enkel gebalanceerde data!).

Bij een actor-partner model ga je kijken naar de dynamieken in een koppel. Wat is het effect van aantrekkelijkheid man op relatietevredenheid man? Wat is het effect van aantrekkelijkheid vrouw op relatietevredenheid vrouw? Maar ook: wat is het effect van aantrekkelijkheid man op relatietevredenheid vrouw? En wat is het effect van de aantrekkelijkheid van de vrouw op de relatietevredenheid van de man. Actoreffecten vs. Partnereffecten.

Two-intercept approach -

Mogelijkheid om effecten apart te schatten Intercept maken voor mannen en één voor vrouwen Twee intercepten maken het mogelijk om de effecten apart te beschouwen

Interaction approach -

Mogelijkheid om te zien of er een verschil is tussen de effecten 1 intercept zegt wat de gemiddelde relatietevredenheid is

1. Maak een nieuwe dataset aan in SPSS volgens de gegevens in de tabel. Let er op dat je per lijn 1 subject weergeeft. Je kunt je baseren op het voorbeeld in de cursus. Hoeveel subjecten zijn er in het totaal? Hoe zijn deze subjecten geclusterd? Wat zijn de variabelen? Sla de dataset op op je H-schijf als TDA relatietevredenheid.sav. Gaan we nu niet doen. Interessant om te bekijken als je zelf voor je thesis nieuwe datasets moet invoeren. Data zien er een beetje vreemd uit: twee keer dezelfde data op een ander lijntje. 2. Maak een figuur waarbij je het verband onderzoekt van respectievelijk de eigen en de ander zijn/haar aantrekkelijkheid op de relatietevredenheid. Doe dit zo wel voor mannen en vrouwen. Is er indicatie voor actor of partner effecten bij mannen en vrouwen? Of interacties?

“Respondent” = geslacht  “1” zijn mannen en “2” zijn vrouwen

Bijna geen actor effect voor de vrouwen. Een klein negatief actor effect voor de mannen.

Voor beide geslachten een positief partner-effect van aantrekkelijkheid. Het gaat om een interactie-effect: voor een man is het belangrijker voor de relatietevredenheid dat zijn partner (vrouw) aantrekkelijk is. [De lijn stijgt stijler]

3. Is er een significant actor effect bij mannen en bij vrouwen? Is er een partnereffect? Toets dit met de Two-intercept approach. Maak gebruik van een random intercept om de correlatie tussen metingen binnen koppels te modelleren. Dit moet je eigenlijk zelf weten dat je dit met deze aanpak moet doen! Immers: je wil apart het effect weten van mannen en van vrouwen. Met één intercept kan je hier niet tussen differentiëren!

Subjects = koppel (want dat is het hoogste niveau) Random effecten model  Repeated wordt leeg gelaten

Geen “Include Intercept” want we willen geen globaal intercept. Wel apart intercept voor mannen en vrouwen, door “Respondent” op te nemen in het model. Bovendien willen we ook het actor- en het partner-effect opnemen, zowel voor mannen als voor vrouwen. Dit is dus een interactie-effect met het geslachtspecifiek intercept.

We hebben wél een random intercept (Include Intercept aanvinken)!

Interpretatie van de Fixed Effects: - Marginaal significant actor-effect bij mannen (p=0.06). - Geen significant actor-effect bij vrouwen. - Significant partner-effect bij mannen - Marginaal significant partner-effect bij vrouwen. Hoe rapporteren? -

Actor-effect mannen: t(29.257)=-1.936, p=.063 Partner-effect mannen: t(26.257)=2.426, p<.05

Als niet significant, exacte p-waarde vermelden. Als wel significant, gewoon vermelden dat p<.05 4. Wat is de correlatie tussen observaties binnen hetzelfde koppel?

𝜎𝜎2 𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘

Corr (Yij, Yik) = 𝜎𝜎2 𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘+ 𝜎𝜎2 𝑟𝑟𝑟𝑟𝑟𝑟 =

1.046 / (1.046+1.55)

5. Zijn de actor en partner effecten significant verschillend tussen mannen en vrouwen. Toets dit met de Interaction Approach. Hoofdeffecten en intercept toevoegen in fixed gedeelte.

Bij random laten we alles staan. Nog steeds een random intercept per koppel.

We zijn op zoek naar een interactie-effect met geslacht. Met betrekking tot het actoreffect, zien we dat er geen significante interactie is met geslacht. Het effect van aantrekkelijkheid van de actor is dus niet afhankelijk van het geslacht en verschilt dus niet tussen mannen en vrouwen. Met betrekking tot het partner effect zien we hetzelfde: de invloed van aantrekkelijkheid van de partner op de relatietevredenheid verschilt niet tussen mannen of vrouwen. 6. Toets nu dezelfde hypothese, maar met de marginale aanpak. Hierbij veronderstellen we geen random effecten maar gaan we de residuele covariantie binnen koppels modelleren. Gebruik hiervoor de meest algemene ‘unstructured’ vorm.

Je wil de variantie covariantiematrix tussen mannen en vrouwen gaan modelleren, dus bij “Repeated” ga je ook het geslacht opgeven.

Meestal is het gegeven of je een hiërarchisch model of een marginaal model moet toepassen. Het is wel zo dat je bij ongebalanceerde en/of onvolledige data enkel het random effecten model kan gebruiken (flexibeler). De output is min of meer hetzelfde. 7. Welke extra assumpties worden gemaakt bij de Random Intercept approach? Je gaat veronderstellen dat de residuele variantie hetzelfde is bij mannen als bij vrouwen. Door het invoeren van het random intercept hou je rekening met de clustering en net hierdoor zal je variantie ook hetzelfde zijn. Structurele vergelijkingsmodellen (SEM)

Taal

SES IQ

Rekenen

Meetgedeelte*

QoL

Structuurgedeelte

inkomen economische status depressie Stress Meetgedeelte *

Tekening proberen maken = het belangrijkste op het examen!! Daarmee begin je altijd! Daarna parameters aanduiden/opschrijven. Daarna pas model fitten in R. Latente variabelen omcirkeld. Geobserveerde variabelen (alles wat in je dataset zit) is omkaderd. Enkel in het structuurgedeelte wordt er een onderscheid gemaakt tussen endogene (er komen pijlen toe) en exogene (er vertrekken pijlen) variabelen. *Meetgedeelte = hoe de latente variabelen gemeten worden

Soorten structurele vergelijkingsmodellen: -

Padanalyse houdt zich enkel bezig met het structuurgedeelte, maar dan enkel met geobserveerde variabelen en niet met latente variabelen. CFA houdt zich enkel bezig met meetgedeelte. SEM houdt zich bezig met beide.

Predictiefouten: we weten dat SES en QoL bijvoorbeeld door allerlei andere zaken worden verklaard, die niet in het model opgenomen zijn. Predictiefouten kunnen bij latente of geobserveerde variabelen voorkomen. Meetfouten: latente variabelen kunnen we niet rechtstreeks gaan meten, maar d.m.v. observeerbare variabelen. Daardoor zal er een bepaalde fout zijn in de mate dat we latente variabelen kunnen gaan meten. (Meetfouten dus enkel bij latente variabelen).

1. Beschouw een model waarbij de vier onafhankelijke variabelen (Intelligence, Siblings, FatherEd en FatherOcc) allen een effect hebben op de drie afhankelijke variabelen (Grades, EducExp en OccupAsp). Stel het model grafisch voor, duid alle te schatten parameters aan en geeft het aantal vrijheidsgraden. Fit het model en bestudeer de output. Is het model adequaat? Zo niet, hoe zou je het model eventueel aanpassen? Intelligence Siblings

Grades

FatherEd Father Occ

∑1

EducExp OccupAsp

∑3

∑2

Correlaties in lavaan automatisch toegevoegd, voor de zuiver endogene variabelen! Elke pijl heeft de naam 𝛾𝛾11, 𝛾𝛾21, … enzovoort. Deze parameters gaan de effecten aanduiden. ∑ is de predictiefout, ofwel de onverklaarde variantie in Grades, op EductExp en OccupAsp. Bovendien zijn er ook correlaties tussen de predictiefouten onderling. De parameters bij deze pijlen kunnen we bijvoorbeeld 𝜑𝜑11, 𝜑𝜑12, … gebruiken. # datapunten - # parameters = 18 – 18 = 0 [p(p+1)]/2 = 18 datapunten

Tussen de aanhalingstekens ‘ ‘ staat het model gespecifieerd. Je gaat aangeven welke pijlen er allemaal toekomen in de variabelen Grades, EducExp en OccupAsp.

Als je een fout hebt gemaakt staat er een + i.p.v. een >. Op dat moment kan je beter stoppen en terug naar je script gaan om te kijken waar je fout zit. Dit doe je door in de console op “Stop” te duwen. Zo vermijd je verdere verwarring.

Door head(data.Kerckhoff) als commando te geven kan je checken of je wel de juiste data hebt. Handig voor op het examen om te garanderen dat je geen vergissingen maakt.

Er is altijd een foutmelding bij lavaan. Niets van aantrekken. We gaan de fit van het model nagaan. Tussen haakjes moet je het model specifiëren (dat we in dit geval gewoon “model” hebben genoemd) en de data. Commando’s echt zo, stap voor stap en eerst in script en dan in console uitvoeren!! Helpt om fouten te voorkomen !!

Voor fit naar de verschillende fitmaten gaan kijken en kijken waar het grootste deel naar wijst (goede of slechte fit). Output  zie feedback 2. Beschouw een alternatief model waarbij er op OccupAsp enkel nog een direct effect is van FatherOcc (niet van de andere exogene variabelen). Laat nu ook de volgende effecten toe: (1) van Grades naar EducExp, (2) van Grades naar OccupAsp, en (3) van OccupAsp naar EducExp. Stel het model grafisch voor. Vergelijk de fit van dit model met het vorige model.

Intelligence Siblings FatherEd Father Occ

Grades

∑1

EducExp OccupAsp

∑3

∑2

Enkel correlaties tussen zuiver endogene variabelen. De enige zuivere endogene variabele is hier EducExp en voor een correlatie heb je minstens 2 variabelen nodig; dus de correlaties tussen de predictiefouten vallen weg. # datapunten - # parameters = 18 – 15 = 3 vrijheidsgraden Voor fit naar de verschillende fitmaten gaan kijken en kijken waar het grootste deel naar wijst (goede of slechte fit). Output  zie feedback

Toegepaste data-analyse: sessie 3

Recommend Documents