Praktijkbundel
Amos 6.0
in de praktijk
Van den Bussche Eva
1
1. Woord vooraf In deze praktijkbundel vind je 2 oefeningen terug die stap voor stap worden uitgewerkt en geïllustreerd met screenshots. De oefeningen zijn gebaseerd op bestaande, real-life databestanden uit onderzoek van Els Gheldof en Petra De Vlieger (UGent). Ik wil hen dan ook bedanken voor het gebruik van hun bestanden. Alle persoonlijke gegevens en overbodige variabelen werden uit de bestanden verwijderd. Deze oefeningen belichten zeker niet het volledige terrein van SEM. De bedoeling van deze praktijkbundel is om vlot te leren werken met de basic tools van Amos, om de output grondig te kunnen interpreteren en om eventueel modellen correct te modificeren. Alle bestanden zijn terug te vinden op de website: http://www.kuleuven-kortrijk.be/~u0050367/Downloads.htm De beste werkwijze is om alle bestanden die u hier vindt eerst en vooral te bewaren in een aparte map op uw persoonlijke schijf of het bureaublad. Je kunt er steeds vanuit gaan dat de databestanden opgekuist zijn (voor meer informatie hierover: zie de handleiding “data management sheet” die ook terug te vinden is op bovenstaande website) en dat er aan de nodige assumpties voldaan werd.
2. Oefening 1: padanalyse 1 Stap 1: A priori theorie
Vanuit de literatuur werd volgend model naar voor geschoven: “This study examined the role of work-related, psychosocial and psychological factors in predicting functional and social disability in 890 working employees. It was tested whether painrelated fear mediated the relationship between NA and (functional and social) disability. Further, it was also assumed that functional disability had a direct effect on social disability. Furthermore, the proposed model tests whether the relationship between NA and (functional and social) disability is also mediated by pain severity. Additionally, it was also assumed that pain-related fear had a direct effect on pain severity”.
1
Gebaseerd op data van Els Gheldof
2
Aangezien alle variabelen waarvan sprake is in deze vooropgestelde theorie werden geoperationaliseerd aan de hand van totaalscores van vragenlijsten, en dus geen enkele van deze begrippen niet rechtstreeks werd gemeten, hebben we hier te maken met een padanalyse. Er zijn in dit model geen latente variabelen, alle variabelen werden rechtstreeks gemeten. We kunnen het model zoals hierboven beschreven als volgt grafisch voorstellen:
Pain-related fear
Functional disability
Pain severity
Social disability
Negative affect
Figuur 1: het te toetsen model
Stap 2: Databestanden voorbereiden
Het databestand EBU1 bestaat uit 890 cases. Volgende variabelen werden gemeten (enkel de uiteindelijke totaalscores worden weergegeven): -
Negative affect (NA)
-
Pain-related fear (TSK)
-
Pain severity (TNOBP7)
-
Functional disability (QBPDQ)
-
Social disability (PDI)
Aangezien we slechts over 1 groot databestand beschikken, zullen we maatregelen moeten treffen om kruisvalidatie mogelijk te maken. Splits hiertoe het databestand random in 2 helften (N1 = 445 en N2 = 445): een calibration sample, waarop we het model gaan opbouwen, en een validation sample, dat we zullen gebruiken om het uiteindelijk model te valideren. De volgorde van het opslaan van bestanden is in deze procedure erg belangrijk.
In SPSS: Data _ Select Cases
3
Random sample of cases _ Sample… Exactly 445 cases from the first of 890 cases Continue _ OK
Figuur 2: Data _ Select Cases
Figuur 3: Select Cases _ Random sample of cases
4
Figuur 4: Random sample of cases _ 445 of 890 cases
Orden vervolgens de data op de nu ingestelde filter en bewaar het bestand.
In SPSS: Data _ Sort Cases Sort by _ Filter OK
Figuur 5: Data _ Sort Cases
Save File
5
Bewaar het bestand nogmaals, maar nu als calibration sample: Save file as _ calibration Selecteer nu alle doorstreepte cases (cases met filter = 0) en delete ze. Bewaar het bestand nogmaals.
Open opnieuw het volledige bestand (EBU1). Bewaar opnieuw maar nu als validation sample: Save File as _ validation. Selecteer nu alle NIET-doorstreepte cases (cases met filter = 1) en delete ze. Bewaar het bestand nogmaals.
Op deze manier hebben we nu 2 nieuwe databestanden gecreëerd: de calibration sample en de validation sample. Merk op dat deze samples random werden geselecteerd. Dit wil zeggen dat de bekomen resultaten voor iedereen anders zullen zijn, aangezien iedereen een andere random sample bekomt. De resultaten in deze oefeningen zijn dus slechts een richtlijn, je eigen resultaten zullen hiervan verschillen. In een volgende stap gaan we de correlatiematrices aanmaken voor zowel de calibration als de validation sample. We gebruiken hiervoor het script “cormatr”. In dit initieel script moeten slecht 2 zaken aangevuld worden: -
een opsomming van de variabelen die we in het model gaan gebruiken. De exacte namen zoals gebruikt in SPSS moeten worden opgegeven en worden telkens gescheiden door een spatie.
-
De plaats (pad) waar we de correlatiematrix willen opslaan op onze computer en de naam die we er aan willen geven.
In SPSS: Open het calibration bestand. Open het script “cormatr”. Vul aan: -
/VARIABLES= tnopb7 tsk qbpdq pdi na
-
/matrix out (“h:\EBU1\cormatrix calibration.sav”) Dit pad en de opgegeven naam zijn uiteraard arbitrair. Maak wel duidelijk dat het om de calibration sample gaat. Het is cruciaal dat je afsluit met de extensie .sav!
RUN ALL
6
Figuur 6: Leeg script venster “cormatr”
Figuur 7: Ingevuld script venster “cormatr”
7
Er werd nu een correlatiematrix gecreëerd voor de calibration sample op de plaats die je hebt gespecificeerd in het pad. Doorloop dezelfde procedure voor de correlatiematrix van de validation sample (verander uiteraard wel de naam van de matrix). Eens beide correlatiematrices correct werden aangemaakt, kunnen alle SPSS schermen gesloten worden. Voor de zekerheid kan je de aangemaakte correlatiematrices altijd nog eens openen. Ze moeten de volgende vorm hebben:
Figuur 8: Voorbeeld van een correlatiematrix in SPSS
Naast de correlaties tussen de verschillende variabelen, worden ook de gemiddelden, standaarddeviaties en aantal valide subjecten per variabele weergegeven. Zo zien we dat er (in dit geval) van onze 445 subjecten nu nog 421 subjecten overblijven. De overige cases zijn gesneuveld door listwise deletion: alle cases die op één van de geselecteerde variabelen een missing value vertonen worden automatisch verwijderd voor volgende analyses.
8
Stap 3: Van start met Amos
Eens de correlatiematrices zijn aangemaakt, kunnen we Amos openen.
Figuur 9: Openingsvenster Amos
We gaan meteen een nieuw bestand openen en dit opslaan op dezelfde plaats waar de correlatiematrices werden bewaard.
In Amos: File _ New File _ Save as _ Model EBU1 OK
Vanaf nu gaan we van start met de opbouw van het model. Dit doen we aan de hand van de calibration sample. De validation wordt achteraf gebruikt voor de validering van het model.
9
Stap 4: Model tekenen
Deze stap kost hoogstwaarschijnlijk het meeste tijd. Het vergt wat inspanning om met de tools van Amos te leren werken. In het begin zullen de modellen er nog slordig uitzien, maar oefening baart kunst. Een overzicht van alle tools kan je vinden in de tekst van Byrne (2001). In deze praktijkbundel zal het logo van de gebruikte tools steeds vermeld worden. Aangezien we bij padanalyse geen latente variabelen hebben, zullen er ook geen cirkels in ons model voorkomen. Het te toetsen model wordt afgebeeld op Figuur 1. Door gebruik te maken van de Amos tools gaan we dit model stap voor stap tekenen. Aangezien een pad-model vaak in de lengte gesitueerd is, is het vaak handig om het tekenblad in landscape te plaatsen:
In Amos: View _ Interface Properties Orientation _ Landscape Apply
Figuur 10: View _ Interface Properties
10
Figuur 11: Orientation _ landscape
Vervolgens kunnen we de 5 rechthoeken voor de 5 variabelen die we in ons model willen opnemen gaan tekenen.
Om het model netjes te houden, kunnen we 1 rechthoek tekenen en deze vervolgens 4 keer kopiëren en verplaatsen naar de gewenste plaats.
11
Vervolgens kunnen de verbanden tussen de 5 variabelen toegevoegd worden aan de figuur, overeenkomstig het beoogde model van Figuur 1.
Aangezien we bij padanalyse de indicatoren als “pseudo-constructen” gaan beschouwen, moeten we ook predictiefouten toevoegen aan het model: een voorspelling van een variabele door een andere kan nooit perfect zijn. Daarom hoort er bij elke variabele die door een ander voorspeld wordt (endogene variabelen, waar dus een pijl toekomt) een predictiefout.
Aan de hand van deze tool kunnen we predictiefouten gaan toevoegen aan het model: klik op de tool en nadien op een endogene variabele. Om de predictiefout te roteren (om het model overzichtelijk te houden) kan je blijven klikken op de endogene variabele tot de plaats van de predictiefout naar wens is.
12
Vervolgens gaan we de namen van de variabelen toevoegen aan het model. Aangezien het enkel gaat om geobserveerde variabelen, moeten we die gaan extraheren uit de correlatiematrix van de calibration sample. Eerst en vooral moeten we dus de juiste correlatiematrix in Amos gaan inladen. Dit doen we aan de hand van volgende tool:
File Name _ cormatrix calibration OK
Figuur 12: Inladen correlatiematrix
Nu kunnen we in Amos een overzicht opvragen van alle variabelen die in het databestand zitten:
Figuur 13: Overzicht variabelen in bestand
13
Door deze variabelen naar de juiste rechthoeken te slepen kunnen we het model vervolledigen. Amos vult standaard niet de naam van de variabele, maar wel de volledige beschrijving in de rechthoeken in, en dit kan soms erg vervelend zijn. Om dit op te lossen kunnen we enkel de namen laten invullen:
View _ Interface Properties Misc _ vink uit: “Display variable labels” Apply
Figuur 14: Vink “Display variable labels” uit
Nu kunnen we het model gaan vervolledigen met de namen van de variabelen op een overzichtelijke manier.
14
Tot slot moeten ook de predictiefouten benoemd worden door er rechts op te klikken en via de “Object Properties” de fouten een naam te geven (p1,…).
Het model is nu volledig getekend:
15
Stap 5: Model fitten
Nu het model getekend is, kunnen overgaan tot het fitten van het model. Vaak is het handig om na het fitten van het model meteen al een overzicht te krijgen van enkele fitmaten. We kunnen hiervoor een titel toevoegen aan ons model. Open hiervoor het bestandje “fitmeas” en kopieer de volledige inhoud.
Figuur 15: “fitmeas” bestand
Keer terug naar Amos en klik op volgende tool:
Klik ergens onderaan op het werkblad van Amos en plak de inhoud van het “fitmeas” bestandje in het venster dat verschijnt door gebruik te maken van Ctrl-V. Druk op OK.
Figuur 16: “fitmeas” bestand plakken als titel in Amos
Gebruik volgende tool om alles mooi op je werkblad te centraliseren:
16
Onderaan je werkblad staat er nu een tekst die straks meteen een overzicht zal bieden van enkele fitmaten.
Vooraleer we uiteindelijk het model kunnen gaan fitten, moeten we nog enkele bijkomende opties aanduiden om een volledige output te krijgen:
View _ Analysis Properties Output _ duid alles aan in de linker kolom.
Figuur 17: output opties aanduiden
Nu al deze voorbereidingen voltooid zijn kunnen we het model gaan fitten op de beschikbare data:
17
Stap 6: Interpretatie
Eens het model gefit werd, wordt er meteen al een heleboel informatie op het model afgebeeld. Om deze gegevens te kunnen bekijken moeten we overgaan van de “Input modus” (waar modellen getekend en gewijzigd worden, databestanden ingegeven worden,…) naar de “Output modus” (waar outputgegevens op het getekende model worden afgebeeld). We kunnen tussen deze 2 modi switchen via volgende tool, waarbij de grijze pijl de input modus voorstelt en de rode pijl de output modus:
Door dus op de rode pijl te klikken, krijgen we de op het model verschillende gegevens te zien. Standaard krijgen we steeds de ongestandaardiseerde data (“Unstandardized”) te zien. Omdat deze data meestal niet zo interessant zijn, omdat ze geen directe vergelijking toelaten, switchen we naar de gestandaardiseerde data (“Standardized”).
Figuur 18: gestandaardiseerde data opvragen
De gestandaardiseerde data staan afgebeeld op onderstaande figuur. Merk opnieuw op dat je eigen outputgegevens er heel anders uit kunnen zien aangezien we random samples hebben genomen uit het volledige bestand!
18
Figuur 19: gestandaardiseerde output
Op de figuur van een padanalyse worden 3 verschillende outputgegevens afgebeeld: 1. Gestandaardiseerde regressiegewichten: dit zijn de cijfers die op de pijlen staan. Deze coëfficiënten hebben dezelfde betekenis als bij gewone regressie: “het effect van a op b”. Voorbeeld: het regressiegewicht van Negatief Affect (NA) op Pain Severity (TNOBP7) bedraagt .10, wat aan de lage kant is. 2. Proporties
verklaarde
variantie:
Van
elk
endogeen
(pseudo)-construct
wordt
ook
weergegeven hoeveel variantie ervan verklaard wordt door de direct en indirecte invloeden van de andere variabelen. Dit zijn de cijfers die boven de endogene constructen staan. Voorbeeld: zo wordt er van de variantie in Pain Severity (TNOBP7) 20% verklaard door de variabelen die er direct en/of indirect op inwerken. 3. Overzicht van enkele fitmaten: Onderaan wordt een beknopt overzicht gegeven van enkele fitmaten: chi2 met bijhorende vrijheidsgraden en p-waarde, GFI, AGFI, RMSEA en pclose.
19
Om na te gaan of dit model goed past bij de data, of er sprake is van een aanvaardbaar model dat aansluit bij de a priori hypotheses, moeten we een aantal zaken bekijken:
1. Zijn alle afgebeelde verbanden ook significant? Uiteraard is dit een belangrijke vraag. Als blijkt dat er verbanden zijn in het model die we theoretisch hadden verwacht, maar die in de praktijk niet opgaan, stemt het model niet overeen met de werkelijkheid. Om dit na te gaan moeten we eerst een uitgebreider outputrapport opvragen aan de hand van volgende tool:
Op die manier verkrijgen we een zeer uitgebreide output. Rechts bovenaan wordt een overzicht getoond van alle onderdelen van deze output. Ik ga enkel de belangrijkste zaken toelichten.
Figuur 20: overzicht output
Om de significantie van de verbanden na te gaan, kijken we naar de sectie “Estimates”. Daar kunnen we onder de tabel “Regression weights ” per verband de p-waarden gaan bekijken. Uit Figuur 21 blijkt dat alle verbanden die we a priori verwachtten ook daadwerkelijk significant zijn, hoewel het effect van NA op TNOBP7 op het randje is (p < .05).
20
Figuur 21: significantie veronderstelde verbanden
2. Heeft het model een aanvaardbare model fit? Naast de significantie van de verbanden, willen we natuurlijk ook weten of ons model een goede fit heeft. Dit wil zeggen dat het goed past bij de data, en dus ook bij de “werkelijkheid”. Hiervoor zijn er zeer veel fitmaten beschikbaar die we kunnen bekijken onder de sectie “Model Fit” van het uitgebreide outputrapport. Ik ga niet in op de theoretische betekenis van de verschillende soorten fitmaten. Hierover bestaat reeds zeer veel documentatie, zoals bijvoorbeeld het boek van Byrne (2001). Naast een groot gamma aan fitmaten bestaan er ook zeer uiteenlopende normen over wanneer een fitmaat wijst op een goede model fit. De normen die ik hieronder hanteer zijn de meest gangbare. Dit zijn vrij soepele normen. In Tabel 1 geef ik enkele van de meest gebruikte fitmaten en hun normen weer.
Fitmaat Chi2(df), p-waarde
Norm 2
Niet significant
GFI (Goodness-of-fit index)
> 0.90
AGFI (Adjusted Goodness-of-fit index)
> 0.85
RMSEA (Root Mean Square Error of Approximation)
< 0.08
CFI (Comparative Fit Index)
> 0.90
Tabel 1: normen van enkele veel gebruikte fitmaten
Als ik deze fitmaten opzoek voor het huidige model bekom ik volgende waarden: 2
Opmerking: in Amos wordt er vaak naar chi2 verwezen als CMIN.
21
Fitmaat
Norm
Waarde
Chi (df), p-waarde
Niet significant
10.30(2), p = 0.006
GFI
> 0.90
0.99
AGFI
> 0.85
0.93
RMSEA
< 0.08
0.099
CFI
> 0.90
0.99
2
Tabel 2: bekomen waarden voor deze fitmaten
Over het algemeen geven deze fitmaten een vrij goede fit weer. Echter, de chi2 waarde en de RMSEA zijn niet OK.
We kunnen dus concluderen dat ons model vrij OK is: alle verbanden zijn significant en fit is op de meeste vlakken aanvaardbaar. Toch is fit van dit model ook niet heel sterk.
Stap 7: Modificatie
Wat modificatie betreft, zijn er voor padanalyse weinig mogelijkheden. We kunnen zeer moeilijk items gaan weglaten, aangezien het vaak slechts om enkele geobserveerde variabelen gaat. Bovendien is er ook geen sprake van meetfouten waartussen covarianties eventueel mogelijk zijn. De enige mogelijkheid is om theoretisch het model te gaan herbekijken en eventueel aan de basis wijzigingen te gaan doen en het alternatieve model te gaan toetsen. De theorie blijft altijd centraal. Elke modificatie die gebeurt, moet te kaderen zijn binnen de theorie. Het herbekijken van het theoretische kader, valt buiten het bestek van deze oefeningen.
Stap 8: Validatie
Als laatste stap gaan we nu het model dat werd opgebouwd op basis van de calibration sample valideren aan de hand van de validation sample. Dit verloopt zeer eenvoudig. Het enige dat we moeten doen is in Amos een andere correlatiematrix specifiëren. Het model blijft volledig ongewijzigd.
Via de volgende tool kunnen we een nieuw databestand aanduiden:
22
In plaats van de calibration correlatiematrix voeren we nu de validation correlatiematrix in. Vervolgens laten we het model opnieuw runnen:
De output voor deze validation sample ziet er als volgt uit:
Figuur 22: output afgebeeld op model
Figuur 23: significantie verbanden
23
Fitmaat
Norm
Waarde
Chi (df), p-waarde
Niet significant
3.70(2), p = 0.16
GFI
> 0.90
0.99
AGFI
> 0.85
0.97
RMSEA
< 0.08
0.045
CFI
> 0.90
0.99
2
Tabel 3: bekomen waarden voor deze fitmaten
Deze model fit is uitstekend. Bovendien zijn ook alle veronderstelde verbanden significant. Dus hoewel de model fit bekomen met de calibration sample wat minder was, wordt duidelijk dat het model wel zeer goed de data fit van de validation sample.
24
3. Oefening 2: Confirmatorische Factoranalyse3 Stap 1: A priori theorie
Deze studie betreft de ontwikkeling van een nieuwe vragenlijst op basis van EFA en CFA: “We report the development of the Pain Solutions (PaSol) questionnaire, an instrument designed to measure assimilative (efforts at changing or solving pain) and accommodative (accepting that pain can not be solved, and changing life goals) responses to the problems associated with pain. Data were collected from 476 adults suffering from chronic pain. Exploratory and confirmatory factor analyses resulted in a 14-item instrument with an adequate oblique four factor structure”: •
Factor I (Solving Pain): 4 items (13-17-19-20)
•
Factor II (Meaningfulness of Life Despite Pain): 5 items (1-4-5-14-22)
•
Factor III (Acceptance of the Insolubility of Pain): 3 items (7-9-16)
•
Factor IV (Belief in a Solution): 2 items (12-23)
De bedoeling is om deze 4-factor structuur te repliceren met CFA.
Stap 2: Databestanden voorbereiden
Het databestand Pasol bestaat uit 476 cases. In het bestand worden enkel de 14 items die na EFA en CFA overbleven weergegeven.
Aangezien we slechts over 1 groot databestand beschikken, zullen opnieuw het databestand random in 2 helften moeten splitsen (N1 = 238 en N2 = 238): een calibration sample, waarop we het model gaan opbouwen, en een validation sample, dat we zullen gebruiken om het uiteindelijk model te valideren. Gebruik dezelfde procedure zoals beschreven in oefening 1. We bekomen dan opnieuw 2 nieuwe databestanden: de calibration sample en de validation sample. Merk opnieuw op dat de bekomen resultaten voor iedereen anders zullen zijn, aangezien iedereen een andere random sample bekomt.
In een volgende stap gaan we de correlatiematrices aanmaken voor zowel de calibration als de validation sample. We gebruiken hiervoor het script “cormatr”. Volg opnieuw dezelfde procedure als in oefening 1.
3
Gebaseerd op data van Petra De Vlieger
25
Stap 3: Van start met Amos
Eens de correlatiematrices zijn aangemaakt, kunnen we Amos openen.
We gaan meteen een nieuw bestand openen en dit opslaan op dezelfde plaats waar de correlatiematrices werden bewaard.
In Amos: File _ New File _ Save as _ Model Pasol OK
Vanaf nu gaan we van start met de opbouw van het model. Dit doen we aan de hand van de calibration sample. De validation wordt achteraf gebruikt voor de validering van het model.
Stap 4: Model tekenen
Aangezien we bij CFA nu wél latente variabelen hebben, zullen er ook cirkels in ons model voorkomen. Door gebruik te maken van de Amos tools gaan we dit model stap voor stap tekenen.
We starten met het tekenen van een leeg model. We repliceren het model zoals beschreven in stap 1: 4 factoren met resp. 4, 5, 3 en 2 items. De latente constructen worden verondersteld van gecorreleerd te zijn. Volgende tools zullen zeker van pas komen:
26
Vervolgens gaan we de namen van de variabelen toevoegen aan het model. De latente factoren en de meetfouten kunnen we arbitrair benoemen, zolang elke naam maar uniek is. We doen dit door opnieuw rechts te klikken op de constructen en meetfouten en de “Object Properties” te selecteren. Onder “Variable Name” kunnen we dan een willekeurige naam ingeven. De namen van de geobserveerde variabelen moeten we opnieuw gaan extraheren uit de correlatiematrix van de calibration sample. Eerst en vooral moeten we dus de juiste correlatiematrix in Amos gaan inladen. Dit doen we aan de hand van volgende tool:
File Name _ cormatrix calibration OK
Nu kunnen we in Amos een overzicht opvragen van alle variabelen die in het databestand zitten:
27
Figuur 24: Overzicht variabelen in bestand
Door deze variabelen naar de juiste rechthoeken te slepen kunnen we het model vervolledigen.
28
Stap 5: Model fitten
Nu het model getekend is, kunnen overgaan tot het fitten van het model. We gaan opnieuw via het “fitmeas” bestandje, een overzicht van de fitmaten opvragen (zie procedure oefening 1). We duiden ook opnieuw de nodige output opties aan. Nu al deze voorbereidingen voltooid zijn kunnen we het model gaan fitten op de beschikbare data:
Stap 6: Interpretatie
Door op de rode pijl te klikken, krijgen we de op het model verschillende gegevens te zien. Standaard krijgen we steeds de ongestandaardiseerde data (“Unstandardized”) te zien. Omdat deze data meestal niet zo interessant zijn, omdat ze geen directe vergelijking toelaten, switchen we naar de gestandaardiseerde data (“Standardized”).
De gestandaardiseerde data staan afgebeeld op onderstaande figuur. Merk opnieuw op dat je eigen output gegevens er heel anders uit kunnen zien aangezien we random samples hebben genomen uit het volledige bestand!
29
Figuur 25: gestandaardiseerde output
Op de figuur van een padanalyse worden 4 verschillende outputgegevens afgebeeld: 1. Gestandaardiseerde regressiegewichten: dit zijn de cijfers die op de pijlen staan. Deze coëfficiënten hebben dezelfde betekenis als bij gewone regressie: “het effect van a op b”. Voorbeeld: het regressiegewicht van Belief op item 23 van de Pasol bedraagt .77. Daaruit blijkt dat dit item een goed item is: het is een goede operationalisering van de subschaal Belief.
30
2. Proporties verklaarde variantie: Van elke indicator wordt ook weergegeven hoeveel variantie ervan verklaard wordt door de latente variabelen. Dit zijn de cijfers die boven de endogene constructen staan. Voorbeeld: zo wordt er van de variantie item 13 van de Pasol 55% verklaard door de Solving Pain subschaal. 3. Correlaties/Covarianties: tussen de latente factoren veronderstelden we correlaties. Deze worden weergegeven op de pijlen. Voorbeeld: De correlatie tussen de Solving Pain en de Belief subschalen bedraagt .51. 4. Overzicht van enkele fitmaten: Onderaan wordt een beknopt overzicht gegeven van enkele fitmaten.
Om na te gaan of dit model goed past bij de data, of er sprake is van een aanvaardbaar model dat aansluit bij de a priori hypotheses, moeten we een aantal zaken bekijken:
1. Zijn alle afgebeelde verbanden ook significant? Procedure: zie oefening 1.
Figuur 26: significantie veronderstelde verbanden
31
2. Heeft het model een aanvaardbare model fit? Naast de significantie van de verbanden, willen we natuurlijk ook weten of ons model een goede fit heeft. Als ik de fitmaten opzoek voor het huidige model bekom ik volgende waarden:
Fitmaat
Norm
Waarde
Chi (df), p-waarde
Niet significant
176.40(71), p= 0.000
GFI
> 0.90
0.90
AGFI
> 0.85
0.85
RMSEA
< 0.08
0.083
CFI
> 0.90
0.92
2
Tabel 4: bekomen waarden voor deze fitmaten
Over het algemeen zijn de fitmaten net op het randje. Een aanpassing lijkt aangewezen.
Stap 7: Modificatie
Om na te gaan of er verbeteringen aan het model kunnen gebeuren, kijken we in de uitgebreide output naar de “Modification Indices”. Hierin worden alle wijzigingen vermeld die doorgevoerd kunnen worden om de model fit te verbeteren. Let op! Niet alle aanpassingen zijn gewenst. Kruisladingen zijn bijvoorbeeld uit den boze: als item 13 niet enkel laadt op Solving Pain, maar ook op Belief, dan geeft dit aan dat dit geen goed item is. Het meet nu niet langer specifiek 1 latent construct. Items worden geacht om één en slechts één latent construct te meten. Wat wel algemeen gedoogd wordt is de toevoeging van covarianties tussen meetfouten, mist dit theoretisch kan verklaard worden. Een dergelijke covariantie tussen 2 meetfouten geeft aan dat de 2 items die met de meetfouten overeenstemmen samen nog iets anders meten, dat momenteel niet in het model werd opgenomen. Indien theoretisch kan worden verklaard dat het inderdaad zo kan zijn dat beide items samen nog iets anders meten, kan men een dergelijke covariantiepijl tussen meetfouten toevoegen aan het model. De theorie moet echter steeds primeren! We kunnen dus in dit geval de Modification Indices gaan bestuderen. We bekijken enkel de “covariances” en we bekijken enkel de covarianties tussen 2 meetfouten:
32
Figuur 27: Modification indices
Om te beoordelen welke van de door Amos voorgestelde wijzigingen we zullen verkiezen, kijken we naar de MI-waarden. Deze geven aan in hoeverre de chi2-waarde zal dalen als die specifieke wijziging wordt doorgevoerd. Als de chi2-waarde daalt, verbetert de fit van het model. Bijvoorbeeld: als we de covariantie toevoegen tussen e16 en e9, zal de chi2-waarde dalen met 5.042. Uiteraard willen we dat de chi2-waarde zo sterk mogelijk zal dalen, dus kiezen we voor de grootste MI-waarde. De grootste MI-waarde voor een covariantie tussen 2 meetfouten vinden we tussen e1 en e4 (12.710). We gaan dus deze covariantie aan ons model toevoegen en we fitten het model opnieuw:
33
Figuur 28: Model mét covariantie tussen e1 en e4
Als we de fit van dit aangepast model nu opnieuw bekijken, blijkt dat de fit verbeterd is: Fitmaat
Norm
Waarde
Chi2(df), p-waarde
Niet significant
158.04(70), p= 0.000
GFI
> 0.90
0.90
AGFI
> 0.85
0.86
RMSEA
< 0.08
0.077
CFI
> 0.90
0.93
Tabel 5: bekomen waarden voor deze fitmaten
34
Aangezien alle fitmaten, behalve chi2 nu aanvaardbaar zijn, voeren we geen verdere aanpassingen door. Zouden we dit wél willen doen, gaan we opnieuw de covariantie tussen meetfouten selecteren met de hoogste MI-waarde, opnieuw het model fitten en opnieuw de fitmaten bekijken. We voeren dus steeds slecht 1 modificatie per keer door. Want, elke aanpassing kan drastische gevolgen hebben voor de model fit en dus ook voor bijkomende modificaties die nog mogelijk zijn. Voer modificaties dus altijd stap voor stap uit. Verder is het zo dat 3 modificaties meestal als maximum wordt beschouwd. Immers, hoe meer modificaties we doen, hoe moeilijker het model te valideren is op een andere sample. Beperk de modificaties dus zo veel mogelijk.
Stap 8: Validatie
Als laatste stap gaan we nu het model dat werd opgebouwd op basis van de calibration sample valideren aan de hand van de validation sample. Volg dezelfde procedure als in oefening 1. De output voor deze validation sample ziet er als volgt uit:
Figuur 29: output afgebeeld op model
35
Figuur 30: significantie verbanden
Fitmaat
Norm
Waarde
Chi2(df), p-waarde
Niet significant
139.04(70), p = 0.00
GFI
> 0.90
0.92
AGFI
> 0.85
0.88
RMSEA
< 0.08
0.068
CFI
> 0.90
0.94
Tabel 6: bekomen waarden voor deze fitmaten
Deze model fit is goed, behalve de chi2-waarde. Bovendien zijn ook alle veronderstelde verbanden significant. We kunnen dus besluiten dat het model mooi gevalideerd wordt op basis van deze validation sample. Dit geeft aan dat het model robuust is over verschillende samples heen.
36