PEMODELAN PERSAMAAN STRUKTURAL: I. ANALISIS JALUR
Johan Harlan Pusat Studi Informatika Kedokteran Universitas Gunadarma
Pemodelan Persamaan Struktural: I. Analisis Jalur Penulis : Johan Harlan ISBN 978-602-9438-27-7
Cetakan Pertama, Juli 2013
Disain cover : Joko Slameto
Diterbitkan pertama kali oleh Gunadarma Jl. Margonda Raya No. 100, Pondokcina, Depok 16424 Telp. +62-21-78881112, 7863819 Faks. +62-21-7872829 e-mail :
[email protected]
Hak
Cipta
dilindungi
undang-undang.
Dilarang
mengutip
atau
memperbanyak dalam bentuk apapun sebagian atau seluruh isi buku tanpa ijin tertulis dari penerbit.
KATA PENGANTAR Pemodelan persamaan struktural (structural equation modeling; SEM) adalah suatu teknik analisis statistika yang terutama menekankan penilaian model, dapat dianggap sebagai perluasan General Linear Model, disebut juga sebagai second generation multivariate analysis. Analisis SEM dapat dibedakan atas tiga tipe, analisis jalur, analisis faktor konfirmatorik, dan model regresi struktural. Buku ini merupakan buku pertama dalam seri SEM, yang akan membahas mengenai analisis jalur. Pembahasan analisis jalur di sini mencakup pembahasan tentang teori analisis jalur, praktek analisis jalur dengan program komputer statistik Stata, dan interpretasi hasilnya. Pembahasan teori analisis jalur bersifat mendasar, yaitu menyangkut pengetahuan teoretis minimum dari segi Statistika yang dibutuhkan seorang peneliti untuk melakukan analisis PA. Pengetahuan teoretis ini juga sangat penting dan diperlukan sebagai dasar bagi mereka yang ingin mempelajari kedua tipe SEM berikutnya, yaitu analisis faktor konfirmatorik dan model regresi struktural. Praktek analisis jalur yang akan dibahas adalah analisis SEM dengan Stata, suatu paket komputer statistik. Analisis SEM dengan paket komputer statistik Stata ini dapat dilaksanakan dalam mode interaktif maupun mode grafik. Interpretasi hasil analisis jalur dengan Stata yang akan dibahas adalah pemahaman menurut aspek Statistika, sedangkan aspek substantif tetap harus dikaji oleh peneliti sendiri berdasarkan bidang keilmuannya masing-masing. Sebagai prasyarat untuk mempelajari SEM, pembaca diharapkan telah memiliki pengetahuan dasar mengenai analisis regresi (untuk PA) dan analisis faktor (untuk CFA), walaupun dalam buku-buku seri SEM ini akan dibahas juga telaah ulang secara singkat mengenai konsep-konsep tersebut.
Jakarta, Juli 2012
Penulis
v
DAFTAR ISI
Kata Pengantar
v
Daftar Isi
vii
Bab 1 Pendahuluan
1
Pengertian Dasar SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
Struktur pada SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Variabel Teramati dan Variabel Laten . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Variabel Endogen dan Eksogen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Beberapa Karakteristik Kekhususan SEM . . . . . . . . . . . . . . . . . . . . . . . . .
4
Program Komputer untuk SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
Lambang SEM dalam Kepustakaan dan Stata . . . . . . . . . . . . . . . . . . . . . .
6
Bab 2 Telaah Ulang Analisis Regresi
9
Model dan Persamaan Regresi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
Data Tak-terstandardisasi dan Terstandardisasi . . . . . . . . . . . . . . . . . . . . .
11
Matriks Kovariansi dan Korelasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
Analisis Regresi dangan Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
Bab 3 Konsep-konsep Dasar Analisis Jalur
19
Analisis Jalur dan Model Struktural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
Asumsi dalam Analisis Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
Parameter dan Derajat Bebas Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
Tipe Model Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
Identifikasi Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
Ukuran Sampel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
Hubungan Antar-Variabel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
Bab 4 Estimasi Parameter
25
Parameter Model Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
Estimasi Efek pada Model Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
Dekomposisi Efek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
vii
Uji Sobel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
Notasi Jalur SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
Estimasi Koefisien Jalur SEM dengan Stata . . . . . . . . . . . . . . . . . . . . . . . .
34
Bab 5 Uji Hipotesis dan Penilaian Model
49
Uji Hipotesis pada SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
Klasifikasi Statistik Suai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
Macam Statistik Suai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
50
Estimasi Statistik Suai SEM dengan Stata . . . . . . . . . . . . . . . . . . . . . . . . .
54
Model Ekivalen pada Analisis Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
Bab 6 Pemodelan SEM dalam Mode Grafik pada Stata
63
Graphical User Interface pada Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63
Analisis SEM dengan Mode Grafik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65
Bab 7 Model Struktural Non-Rekursif
68
Tipe Model Struktural Non-Rekursif . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
Identifikasi pada Mode Non-Rekursif . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
Kondisi Order . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69
Kondisi Rank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
70
Efek Tak Langsung pada Model Non-Rekursif . . . . . . . . . . . . . . . . . . . . .
71
Korelasi Ganda Kuadrat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
Analisis Model Non-Rekursif dengan Stata . . . . . . . . . . . . . . . . . . . . . . . .
74
Bab 8 Struktur Rerata
80
Analisis Nilai Rerata pada SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
Identifikasi Struktur Rerata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
81
Estimasi Struktur Rerata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
82
Bab 9 Sampling Ganda
84
Penggunaan Sampling Ganda pada SEM . . . . . . . . . . . . . . . . . . . . . . . . . .
84
Analisis Sampel Ganda pada Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
Variabel Moderator dan Efek Interaksi . . . . . . . . . . . . . . . . . . . . . . . . . . . .
87
viii
Kepustakaan
89
Lampiran 1 Koefisien Korelasi
90
Lampiran 2 Analisis Regresi Linear dengan Stata
97
Lampiran 3 Beberapa Nilai-Nilai Statistik Suai pada Analisis SEM
111
Lampiran 4 Uji Hipotesis pada SEM
113
ix
Bab 1. Pendahuluan
BAB 1 PENDAHULUAN Pengertian Dasar SEM Pemodelan persamaan struktural (structural equation modeling; SEM) bukan merupakan suatu teknik statistika tunggal seperti analisis variansi, analisis regresi, dan sebagainya, melainkan mengacu kepada suatu kelompok prosedur yang saling berkaitan (a family of related procedures). SEM dikenal pula sebagai „analisis multivariat generasi kedua‟ (second generation multivariate analysis). Istilah lain untuk SEM ialah pemodelan kausal (causal modeling). Dalam kenyataannya SEM hanyalah berguna untuk menunjang dugaan keberadaan hubungan kausal, karena tidak ada teknik statistika yang dapat membuktikan kausalitas dalam rancangan studi observasional. SEM umumnya digunakan untuk rancangan studi observasional, namun jika diperlukan dapat pula digunakan dalam rancangan studi eksperimental. Dikenal dua tipe model dalam SEM yaitu model struktural dan model pengukuran. Model struktural mengkaji struktur hubungan antara variabel teramati, sedangkan model pengukuran menekankan pengukuran variabel laten dengan menggunakan indikator. Berdasarkan tipe pemodelan tersebut SEM dapat dibagi menjadi tiga bagian, yaitu analisis jalur, analisis faktor konfirmatorik, dan model regresi struktural. Analisis jalur (path analysis; PA) merupakan model struktural untuk variabel teramati (lihat contoh pada diagram 1.1), sedang analisis faktor konfirmatorik (confirmatory factor analysis; CFA) adalah model pengukuran untuk variabel laten (contoh pada diagram 1.2). Model regresi struktural (structural regression model; model SR) adalah sintesis antara model struktural dengan model pengukuran, merupakan gabungan antara analisis jalur dengan CFA (contoh pada diagram 1.3). Dalam buku ini pembahasan selanjutnya adalah mengenai analisis jalur. Walaupun analisis jalur hanya merupakan sebagian dari keseluruhan metode statistika yang ada dalam SEM dan juga merupakan teknik statistika yang tertua dalam SEM, pemahaman mengenai analisis jalur sangat penting dan merupakan dasar utama untuk mempelajari SEM secara keseluruhan.
1
Bab 1. Pendahuluan
Gambar 1.1 Contoh model jalur
Gambar 1.2 Contoh model analisis faktor konfirmatorik
Gambar 1.3 Contoh model regresi struktural 2
Bab 1. Pendahuluan
Struktur pada SEM Bagian model persamaan struktural yang merepresentasikan hipotesis tentang variansi dan kovariansi adalah struktur kovariansi, sedangkan jika rerata juga dianalisis bersama dengan kovariansi, maka model persamaan struktural memiliki baik struktur kovariansi maupun struktur rerata, dengan struktur rerata merepresentasikan estimasi rerata faktor. Salah satu kelebihan SEM ialah dapat diestimasinya rerata variabel laten, yang tak dapat dilakukan pada teknik analisis statistik lainnya. Misalnya dalam ANOVA (analisis variansi), estimasi hanya dapat dilakukan untuk rerata variabel teramati. Walaupun demikian, dalam kebanyakan analisis SEM struktur rerata tak dibutuhkan dan rerata tak dianalisis.
Variabel Teramati dan Variabel Laten Variabel dalam SEM dibedakan menjadi variabel teramati dan variabel laten. Variabel teramati (observed variable) adalah variabel yang nilai datanya dapat diukur secara langsung oleh peneliti dan nilainya ada pada basis-data penelitian. Contohnya antara lain yaitu tinggi badan, berat badan, dan sebagainya. Variabel teramati dapat berupa variabel kategorik nominal, kategorik ordinal, ataupun kontinu. Dalam contoh pada gambar 1.1, X 1 , X 2 , Y1 , Y2 , Y3 , dan Y4 adalah variabel-variabel teramati. Variabel laten (variabel tak-teramati; unobserved variable) yang adakalanya disebut juga sebagai konstruk (construct) atau faktor, adalah variabelnya yang nilai datanya tidak diperoleh melalui pengukuran langsung oleh peneliti, tetapi diukur secara tidak langsung melalui beberapa variabel teramati yang disebut juga sebagai indikator. Misalnya untuk variabel laten prestasi belajar (achievement) siswa SD, indikatornya adalah (hasil tes) kemampuan membaca, kemampuan menulis, dan kemampuan berhitung. Variabel laten dalam SEM selalu merupakan variabel kontinu. Dalam contoh pada gambar 1.2, A dan B adalah variabel-variabel laten. Variabel laten tak digunakan dalam analisis jalur yang akan dibahas di sini. Konstruk dapat menjadi variabel teramati jika nilai-nilainya diperoleh dari indikator-tunggal (single-indicator).
Variabel Endogen dan Eksogen Variabel eksogen (variabel independen) adalah variabel yang sama sekali tidak menerima efek variabel lain, sedangkan variabel endogen adalah variabel yang menerima efek satu atau lebih variabel lain. Efek antar variabel ini dapat terjadi dari suatu variabel 3
Bab 1. Pendahuluan
eksogen ke suatu variabel endogen ataupun dari suatu variabel endogen ke variabel endogen lain. Dalam pengertian ini variabel mediator (variabel perantara) dianggap sebagai variabel endogen, sedangkan suku pengganggu (disturbance) adalah variabel eksogen. Tiap variabel endogen memiliki suku pengganggu, yang selalu merupakan variabel laten. Variabel endogen dalam SEM dapat berperan sebagai variabel dependen maupun independen. Dalam contoh pada gambar 1.1, X 1 dan X 2 adalah variabel eksogen, sedangkan Y1 , Y2 , Y3 , dan Y4 adalah variabel endogen. Y1 dan Y2 merupakan variabel mediator. Istilah variabel eksogen (independen) menyatakan bahwa nilai-nilai variabel ini dapat bervariasi dengan bebas sehingga memiliki nilai variansi tertentu, sedangkan variabel endogen tidak dapat bervariasi dengan bebas sehingga tidak memiliki variansi. Dalam contoh pada gambar 1.1 tampak bahwa hanya variabel eksogen X 1 dan X 2 yang memiliki variansi. Variabel endogen Y1 , Y2 , Y3 , dan Y4 tidak memiliki variansi, yang memiliki variansi adalah suku pengganggu (disturbances) untuk keempat variabel endogen tersebut. Suku pengganggu pada model struktural SEM merepresentasikan galat pengukuran (measurement error) variabel endogennya beserta variabel independen yang tak diperhitungkan (omitted causes) dalam model. Dua variabel eksogen yang memiliki asosiasi tak-teranalisis (unanalyzed association) dapat bervariasi bersama (ber-kovariansi), sehingga pasangan variabel eksogen demikian memiliki nilai kovariansi tertentu. Pada contoh gambar 1.1 diperlihatkan adanya korelasi antara variabel eksogen X 1 dan X 2 . Perhatikan bahwa dalam SEM semua variabel eksogen dianggap saling berkorelasi walaupun tak digambarkan dalam model.
Beberapa Karakteristik Kekhususan SEM SEM memiliki beberapa karakteristik khusus yang membedakannya dari teknik statistika lainnya, yaitu: -
SEM bukan merupakan teknik statistika tunggal, namun merupakan kumpulan sejumlah teknik statistika yang berkaitan, terutama analisis regresi dan analisis faktor.
-
SEM mengkaji model a priori, yaitu model yang sudah harus ada dan dibuat peneliti sebelum dimulainya pengumpulan dan analisis data. Model boleh diperbaiki dalam tahap analisis, tetapi tidak boleh baru dibuat setelah data ada dan sepenuhnya dikembangkan hanya berdasarkan data yang diperoleh peneliti. Implikasinya yaitu peneliti harus memiliki dasar yang kokoh dalam bidang substansi keilmuannya. 4
Bab 1. Pendahuluan
-
Dalam tahap analisis jika diperlukan untuk memenuhi persyaratan statistika, model boleh direvisi, tetapi proses revisi model tidak boleh bertentangan dengan pengetahuan teoretis di bidang substansi penelitian.
-
SEM dapat mengkaji lebih daripada satu model dan model yang ternyata dapat menjelaskan data dengan baik berdasarkan analisis SEM juga mungkin lebih daripada satu.
-
SEM dapat menganalisis variabel teramati maupun variabel laten. Sebagian besar teknik statistika dibuat untuk menganalisis variabel teramati. Ada juga teknik statistika yang dikhususkan untuk menganalisis variabel laten, tetapi SEM dapat menganalisis kedua tipe variabel tersebut bersama-sama.
-
SEM adalah teknik sampel besar. Untuk memperoleh hasil yang terpercaya, ukuran sampel minimum ideal yang dianjurkan adalah 20 kali jumlah parameter, misalnya model dengan 10 parameter dianjurkan menggunakan sampel berukuran 200.
-
Estimasi pada SEM umumnya dilakukan dengan metode maximum likelihood (ML) yang merupakan metode informasi-penuh (full-information method) yang menganalisis seluruh persamaan dalam model sekaligus, berbeda misalnya dengan metode kuadrat terkecil yang dapat dianggap sebagai metode informasi-parsial (partial-information method) karena dalam tiap tahap hanya menganalisis satu persamaan.
-
SEM kurang memberi penekanan pada uji statistik dalam pengertian sebagai uji parameter dalam Statistika Umum. Didapatkan berbagai alasan yang menyebabkan uji statistik demikian menjadi kurang penting dalam SEM, yang terutama yaitu karena SEM dimaksudkan untuk meng-evaluasi keseluruhan model secara global, sedangkan uji statistik sebagai uji parameter hanya menyangkut detil spesifik dalam model. Alasan teknis lainnya yaitu karena SEM merupakan teknik sampel besar, sedangkan secara teoretis sampel besar dapat mengakibatkan efek trivial dapat menjadi „sangat bermakna‟ secara statistik. Uji statistik yang lazim dilakukan dalam SEM memiliki tujuan berbeda, yaitu „pengujian model‟ antara lain dengan memperbandingkan matriks kovariansi data dengan matriks kovariansi yang diprediksi oleh model yang diajukan peneliti, walaupun ada juga uji statistik untuk pengujian parameter yang dianggap kurang penting.
Program Komputer untuk SEM Program statistik komputer untuk SEM telah dikenal sejak paruh kedua 1970-an, walaupun pada waktu itu program SEM yang dikenal secara luas hanyalah LISREL (Linear
5
Bab 1. Pendahuluan
Structural Relationships) yang dikembangkan oleh Jöreskog & Sörbom yang menggunakan mode interaktif. Dalam perkembangan selanjutnya dikenal pula AMOS (Analysis of Moment Structures) yang dikembangkan oleh SPSS Inc sebagai program aplikasi yang berdiri sendiri. AMOS memiliki kemudahan karena dapat dijalankan dalam mode grafik dengan menggunakan GUI (Graphical User Interface), walaupun dapat juga dijalankan dengan mode batch. Sekarang dikenal juga berbagai prosedur SEM yang merupakan bagian program statistik komputer komprehensif, misalnya: -
Prosedur CALIS/TCALIS (Covariance Analysis and Linear Structural Equations) pada SAS/STAT
-
Prosedur RAMONA (Reticular Action Model or Near Approximation) pada SYSTAT.
-
Prosedur SEPATH (Structural Equation Modeling and Path Analysis) pada STATISTICA. Berbagai prosedur ini umumnya harus dijalankan dalam mode batch (kecuali
SEPATH). Prosedur terbaru yang dibahas dalam buku ini yaitu prosedur sem (structural equation modeling) yang didapatkan pada program statistik STATA. Prosedur sem ini baru didapatkan pada STATA versi 12 yang diluncurkan pada tahun 2011. Prosedur sem pada STATA 12 ini dapat dijalankan dengan mode grafik maupun interaktif.
Lambang SEM dalam Kepustakaan dan Stata Berikut ini diperlihatkan beberapa lambang yang lazim dipergunakan untuk notasi SEM dalam kepustakaan dan dipergunakan pula dalam Stata: 1.
Variabel: a.
Variabel teramati: Variabel teramati dinyatakan dengan lambang empat persegi panjang (“
”) atau
bujur sangkar (“ ”). Nama variabel dituliskan dalam empat persegi panjang atau bujur sangkar itu. Seluruh variabel yang ada pada basis-data adalah variabel teramati. Pada Stata, nama variabel teramati seluruhnya ditulis dengan huruf kecil. b.
Variabel laten: Variabel laten digambarkan dengan lambang elips (“
”) atau lingkaran (“
”).
Nama variabel dituliskan dalam elips atau lingkaran itu. Pada model jalur, hanya suku pengganggu yang merupakan variabel laten. 6
Bab 1. Pendahuluan
Pada Stata, penulisan nama variabel laten diawali dengan huruf besar, kecuali untuk suku pengganggu (butir 1.c) c.
Suku pengganggu: Suku pengganggu ada untuk setiap variabel endogen, merupakan variabel laten yang memiliki variansi, sedangkan variabel endogen itu sendiri tidak memiliki variansi. Pada Stata, variabel laten untuk sebuah variabel endogen dinamakan sebagai “e.nama_var_endogen”, misalnya untuk variabel endogen “sistolik”, nama suku pengganggunya adalah “e.sistolik”. Walaupun merupakan variabel laten, penulisan nama suku pengganggu tidak diawali dengan huruf besar.
2.
Efek antar-variabel: a.
Efek searah: Efek searah suatu variabel terhadap variabel lainnya dinyatakan dengan lambang anak panah searah (“→”). Misalnya, efek searah variabel X terhadap variabel Y dinyatakan sebagai X → Y. Nilai yang dituliskan dekat anak panah pada model awal menyatakan nilai kendala yang ditentukan peneliti pada penyusunan model ataupun estimasi yang diperoleh dari data sampel sebagai koefisien regresi atau koefisien jalur. Pada pemodelan Stata, efek searah variabel X terhadap Y dituliskan sebagai “sem (Y <− X)” atau “sem (X −> Y)”.
b.
Efek resiprokal: Efek resiprokal antar dua variabel dinyatakan dengan lambang anak panah bolakbalik (“ Y1
”). Misalnya, efek resiprokal antar variabel Y1 dan Y2 dinyatakan sebagai
Y2 .
Pada pemodelan Stata, hubungan resiprokal antar variabel Y1 dan Y2 dituliskan sebagai “sem (Y2 <− Y1) (Y1 <− Y2)” 3.
Variansi: Variansi suatu variabel eksogen dinyatakan dengan lambang anak panah berkepalaganda, yang berawal dan berakhir pada variabel yang sama (“ ”). Dalam SEM, semua variabel eksogen dan suku pengganggu memiliki variansi, sedangkan variabel endogen tidak memiliki variansi.
7
Bab 1. Pendahuluan
Pada pemodelan Stata dengan mode interaktif, keberadaan variansi tidak perlu dicantumkan, walaupun diasumsikan semua variabel eksogen dan suku pengganggu memiliki variansi. 4.
Kovariansi dan korelasi: Kovariansi atau korelasi dinyatakan dengan lambang anak panah berkepala-ganda, yang berawal dan berakhir pada dua variabel berbeda (“
”).
Kovariansi diasumsikan selalu ada antar variabel eksogen, walaupun tidak digambarkan dalam model. Selain itu, kovariansi mungkin ada (tidak selalu, tergantung model peneliti) antar suku pengganggu. Kovariansi tidak ditemukan antar variabel endogen. Secara statistik, kovariansi dalam SEM disebut sebagai asosiasi takteranalisis (unanalyzed association) atas dasar asumsi bahwa pada kovariansi antar dua variabel terdapat variabel ketiga yang tak diketahui dan tak dianalisis yang menimbulkan efek terhadap kedua variabel yang berkovariansi sekaligus. Pada Stata, kovariansi dituliskan sebagai “cov(var1*var2), misalnya kovariansi antar variabel eksogen “usia” dan “pendidikan” dituliskan sebagai “cov(usia*pendidikan), sedangkan kovariansi antar suku pengganggu “e.sistolik” dan “e.kolesterol” dituliskan sebagai “cov(e.sistolik*e.kolesterol).
8
Bab 2. Telaah Ulang Analisis Regresi
BAB 2 TELAAH ULANG ANALISIS REGRESI Model dan Persamaan Regresi Pemahaman tentang analisis regresi merupakan prasyarat untuk mempelajari analisis jalur (path analysis; PA). Analisis regresi adalah suatu teknik statistika untuk mengkaji hubungan antara satu atau lebih variabel independen kontinu dengan satu variabel dependen kontinu. Analisis regresi dapat berupa regresi sederhana (simple regression) jika hanya ada satu variabel independen atau regresi ganda (multiple regression) jika didapatkan lebih daripada satu variabel independen. Kadang-kadang analisis regresi juga digunakan untuk variabel independen yang berskala kategorik, yang dinyatakan dalam bentuk variabel indikator yang hanya bernilai nol atau satu. Model dan persamaan garis regresi sederhana masing-masing dinyatakan sebagai:
dan
yi = 0 + 1 xi + i
(2.1)
yˆ = 0 + 1 x
(2.2)
0 : intersep (intercept); konstante
1 : kemiringan (slope); koefisien regresi xi
: variabel independen; regresor; prediktor
yi : variabel dependen; outcome; kriterion
i : suku galat (error); residual Estimasinya yang diperoleh dari data sampel masing-masing adalah:
dan
yi = b0 + b1 xi + ei
(2.1.a)
yˆ = b0 + b1 x
(2.2.a)
dengan b0 sebagai
estimator
untuk 0 ( ˆ0 = b0 ) dan b1 sebagai estimator untuk 1
ˆ b . 1
1
Model dan persamaan garis regresi ganda (dengan 2 variabel independen X 1 dan X 2 ) masing-masing dinyatakan sebagai:
dan
yi = 0 + 1 x1i + 2 x2i + i
(2.3)
yˆ = 0 + 1 x1 + 2 x2
(2.4) 9
Bab 2. Telaah Ulang Analisis Regresi
Estimasinya masing-masing adalah:
dan
yi = b0 + b1 x1i + b2 x2i + ei
(2.3.a)
yˆ = b0 + b1 x1 + b2 x2
(2.4.a)
Estimasi koefisien regresi pada regresi sederhana maupun ganda dilakukan dengan metode kuadrat terkecil (ordinary least square; OLS). Salah satu asumsi yang penting bagi OLS ialah tidak adanya korelasi antara variabel independen dengan suku residual variabel dependen.
Contoh 2.1: Misalkan dimiliki data hipotetis seperti terlihat pada tabel 2.1. Hasil regresi y terhadap
x1 diperlihatkan pada tabel 2.2.a, sedangkan hasil regresi y terhadap x1 dan x2 diperlihatkan pada tabel 2.2.b.
Tabel 2.1 Contoh data hipotetis untuk analisis regresi No
y
1 2 3 4 5 6 7 8 9 10 Rerata SD
116 152 134 132 130 118 136 108 108 128 y = 126.2
x1 49 48 55 49 50 52 48 59 59 52 x1 = 52.1
x2 240 209 210 171 255 232 147 268 231 199 x2 = 216.2
s y = 13.77
s1 = 4.23
s2 = 37.18
Tabel 2.2 Hasil analisis regresi untuk data hipotetis tabel 2.1 a. Model regresi sederhana: y = 0 + 1 x1 + Konstante x1
b 245.42 –2.29
SE(b) 42.84 0.82
B –0.70 2
n = 10; R = 0.49
10
t 5.73 –2.79
Nilai-p < 0.001 0.024
Bab 2. Telaah Ulang Analisis Regresi
b. Model regresi ganda: y = 0 + 1 x1 + 2 x2 + Konstante x1
b 242.97 –1.81
SE(b) 43.15 0.97
x2
–0.11
0.11
B –0.55
t 5.63 –1.87
Nilai-p 0.001 0.104
–0.28
–0.96
0.371
2
n = 10; R = 0.55
Data Tak-terstandardisasi dan Terstandardisasi Data seperti pada tabel 2.1 dinyatakan sebagai sebagai data dalam bentuk takterstandardisasi (unstandardized). Data tak-standardisasi x dapat diubah menjadi data terstandardisasi (standardized) z yang memiliki rerata nol dan standar deviasi satu dengan rumus transformasi: z=
x
(2.5)
Misalkan z y adalah bentuk terstandardisasi untuk variabel y dan z1 adalah bentuk terstandardisasi untuk variabel x1 , maka regresi z y terhadap z1 akan menghasilkan model dan persamaan garis regresi:
dan
z yi = B1 z1i + zei
(2.6)
zˆ y = B1 x1
(2.7)
B (beta) : Koefisien regresi untuk bentuk terstandardisasi
Garis regresi untuk bentuk terstandardisasi ini selalu melalui titik pangkal [0 ; 0], sehingga suku konstante selalu bernilai sama dengan nol (tidak ada suku konstante). Nilai k dan estimasinya bk dalam analisis regresi dinamakan koefisien regresi, sedangkan nilai Bk (beta) dalam analisis jalur disebut koefisien jalur (ada yang menyebutnya hanya sebagai path / jalur). Perhatikan bahwa ada kepustakaan yang menamakan k juga sebagai koefisien jalur, namun di sini istilah koefisien jalur hanya digunakan untuk Bk (beta). Untuk model regresi ganda dengan 2 prediktor seperti pada tabel 2.2.b, beta dapat diperoleh dari persamaan:
s B1 = b1 1 sy
dan
s B2 = b2 2 sy
11
(2.8)
Bab 2. Telaah Ulang Analisis Regresi
s1 : standar deviasi x1 s2 : standar deviasi x2
Contoh 2.2: Lihat kembali data hipotetis pada tabel 2.1. Dengan transformasi z y = ; dan z2 =
y y x x ; z1 = 1 1 s1 sy
x2 x2 diperoleh data terstandardisasi seperti terlihat pada tabel 2.3. s2
Berdasarkan hasil analisis regresi pada tabel 2.2, diperoleh model regresi takstandardisasi dan terstandardisasi seperti yang ditampilkan pada tabel 2.4.
Tabel 2.3 Contoh data dalam bentuk tak-terstandardisasi dan bentuk terstandardisasi No 1 2 3 4 5 6 7 8 9 10 Rerata SD
y 116 152 134 132 130 118 136 108 108 128 126.2 13.77
x1 49 48 55 49 50 52 48 59 59 52 52.1 4.23
x2 240 209 210 171 255 232 147 268 231 199 216.2 37.18
zy
–0.74 1.87 0.57 0.42 0.28 –0.60 0.71 –1.32 –1.32 0.13 0.00 1.00
z1 –0.73 –0.97 0.69 –0.73 –0.50 –0.02 –0.97 1.63 1.63 –0.02 0.00 1.00
z2 0.64 –0.19 –0.17 –1.22 1.04 0.42 –1.86 1.39 0.40 –0.46 0.00 1.00
Tabel 2.4 Model regresi untuk data tak-terstandardisasi dan terstandardisasi beserta estimasinya
Regresi sederhana Regresi ganda
Model
Tak-terstandardisasi y = 0 + 1 x1 +
Terstandardisasi z y = B1 z1 + z
Estimasi
y = 245.42– 2.29 x1 + e
z y = –0.70 z1 + ze
Model
y = 0 + 1 x1 + 2 x2 +
z y = B1 z1 + B2 z2 + z
Estimasi
y = 242.97– 1.81 x1 – 0.11 x2 + e
z y = –0.55 z1 – 0.28 z2 + ze
12
Bab 2. Telaah Ulang Analisis Regresi
Matriks Kovariansi dan Korelasi Variansi variabel random x dan kovariansi antara variabel random x dan y masingmasing adalah:
Var x = E x x
(2.8)
Cov x ; y = E x x y y
(2.9)
2
Estimasi dari data sampel adalah:
i xi x
2
ˆ x = Var
ˆ x ; y= Cov
(2.8.a)
n 1
i xi x yi y
(2.9.a)
n 1
Jika variabel random x dan y masing-masing dikonversi menjadi bentuk terstandardisasi
z x dan z y , maka korelasi antara x dan y sama dengan kovariansi antara z x dan z y :
Corr x ; y = Cov z x ; z y
(2.10)
Korelasi antara x dan y dapat juga diperoleh dari persamaan:
Corr x ; y =
Cov x ; y
(2.11)
x y
Estimasi dari data sampel adalah:
ˆ x ; y = Corr
ˆ x ; y Cov sx s y
(2.11.a)
Contoh 2.3: Lihat data hipotetis pada tabel 2.1 dan bentuk terstandardisasinya pada tabel 2.3. Matriks kovariansi dan korelasinya untuk data tak-standardisasi diperlihatkan pada tabel 2.5, sedangkan matriks kovariansi dan korelasi untuk data terstandardisasi disajikan pada tabel 2.6. Perhatikan bahwa untuk data terstandardisasi, matriks kovariansinya identik dengan matriks korelasi.
13
Bab 2. Telaah Ulang Analisis Regresi
Tabel 2.5 Matriks kovariansi dan korelasi untuk data tak-terstandardisasi Matriks kovariansi x1
y y x1 x2
189.73 –40.91 –293.60
Matriks korelasi
17.88 82.20
x2
y x1 x2
1382.40
y
x1
x2
1.00 –0.70 –0.57
1.00 0.52
1.00
Tabel 2.6 Matriks kovariansi dan korelasi untuk data terstandardisasi Matriks kovariansi zy zy
1.00
z1
–0.70 –0.57
z2
z1
1.00 0.52
Matriks korelasi zy
z2 zy
1.00
z1
–0.70 –0.57
z2
1.00
z1
z2
1.00 0.52
1.00
Analisis Regresi dengan Stata Terdapat beberapa cara untuk membuat file data Stata, cara yang termudah ialah dengan membuat file basis-data dalam Excel, yang kemudian di-“import” ke dalam Stata. Selanjutnya akan diperlihatkan prosedur analisis regresi dalam Stata dengan perintah regress.
Contoh 2.4 (Membuat file data Stata): Masukkan data hipotetis hubungan antara tekanan darah sistolik (y), usia (x1), dan kadar kolesterol serum (x2) yang ada pada tabel 2.1 pada lembar isian (spreadsheet) Excel. Simpan data pada folder D:\SEM\Data dengan nama sistolik.xls. Perintah Stata: Ambil file Excel sistolik.xls untuk dibuka dalam format Stata, selanjutnya simpan data dalam format data Stata: . import excel using “D:\SEM\Data\sistolik.xls”, firstrow . label variable y "tekanan darah sistolik" . label variable x1 "usia" . label variable x2 "kadar kolesterol serum" . save “D:\SEM\Data\sistolik.dta” file D:\SEM\Data\sistolik.dta saved
14
Bab 2. Telaah Ulang Analisis Regresi
Perintah “import” adalah perintah Stata untuk mengambil file data dalam format non-Stata (umumnya file Excel) dan dibuka dalam format Stata. Perintah “label” adalah perintah untuk memberi „label‟ bagi variabel tertentu. Setelah itu file masih harus disimpan dalam format Stata dengan perintah “save” untuk memudahkan penggunaannya pada sesi lebih lanjut.
Contoh 2.5 (Analisis regresi dengan Stata): Perintah Stata: . use “D:\SEM\Data\sistolik.dta”, clear . regress y x1
y x1 _cons
Coef. −2.288378 245.4245
Std. Err. .8197659 42.8362
t −2.79 5.73
P>| t| 0.024 0.000
[ 95% Conf. Interval] −4.178762 −.3979942 146.644 344.2049
Perintah “regress” adalah perintah Stata untuk melaksanakan analisis regresi linear, baik sederhana maupun ganda. Perintah “regress” diikuti oleh nama variabel dependen, dan selanjutnya disusul oleh nama variabel independen. . regress y x1 x2
y x1 x2 _cons
Coef. −1.805473 −.1050276 242.9721
Std. Err. .9670317 .1099716 43.14995
t −1.87 −0.96 5.63
15
P>| t| 0.104 0.371 0.001
[ 95% Conf. Interval] −4.09214 .4811937 −.3650691 .155014 140.9387 345.0055
Bab 2. Telaah Ulang Analisis Regresi
Contoh 2.6 (Analisis regresi terstandardisasi dengan Stata): Perintah Stata: . use “D:\SEM\Data\sistolik.dta”, clear . regress y x1, beta
y x1 _cons
Coef. −2.288378 245.4245
Std. Err. .8197659 42.8362
t −2.79 5.73
P>| t| 0.024 0.000
Beta −.7024456 .
Perintah “use” adalah perintah Stata untuk membuka file data Stata (file dengan ekstensi *.dta). Opsi “,clear” pada perintah “use” setelah nama dan jalur (path) file yang akan dibuka merupakan perintah untuk menghapus semua isi file data Stata terakhir yang masih terbuka dan ada dalam memori komputer. Opsi “, beta” pada perintah “regress” setelah nama variabel independen merupakan perintah untuk menampilkan koefisien beta, yaitu koefisien regresi terstandardisasi. . regress y x1 x2, beta
y x1 x2 _cons
Coef. −1.805473 −.1050276 242.9721
Std. Err. .9670317 .1099716 43.14995
t −1.87 −0.96 5.63
P>| t| 0.104 0.371 0.001
Contoh 2.7 (Regresi linear, contoh pada manual Stata): File data: auto.dta Variabel: variable name weight foreign mpg
variable label Weight (lbs.) Cartype Miliage (mpg)
16
Beta −.554212 −.283497 .
Bab 2. Telaah Ulang Analisis Regresi
Model:
Persamaan: mpg = α + β1weight + β2weight2 + β3foreign + ε1
Perintah regress (analisis regresi linear): . sysuse auto . regress mpg weight c.weight#c.weight foreign Source
SS
df
MS
Model Residual
1689.15372 754.30574
3 70
563.05124 10.7757963
Total
2443.45946
73
33.4720474
Number of obs F(3,70) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
74 52.25 0.0000 0.6913 0.6781 3.2827
mpg weight
Coef. −.0165729
Std. Err. .0039692
t −4.18
P>|t| 0.000
[95% Conf. Interval] −.0244892 −.0086567
c.weight#c.weight
1.59e-06
6.25e-07
2.55
0.013
3.45e-07
2.84e-06
foreign _cons
−2.2035 56.53884
1.059246 6.197383
−2.08 9.12
0.041 0.000
−4.3161 44.17855
−.0909002 68.89913
mpg weight
Coef. −.0165729
Std. Err. .0039692
t −4.18
P>|t| 0.000
Beta −2.226321
c.weight#c.weight
1.59e-06
6.25e-07
2.55
0.013
1.32654
foreign _cons
−2.2035 56.53884
1.059246 6.197383
−2.08 9.12
0.041 0.000
−.17527 .
. regress, beta
Perintah “sysuse” adalah perintah untuk membuka file data Stata yang dipasok oleh provider Stata dan disimpan dalam basis-data Stata pada saat meng-install program Stata. Dengan perintah “sysuse” cukup dituliskan nama file yang akan dibuka tanpa perlu menuliskan jalurnya. Pada perintah “regress” pertama di atas nama variabel dependen dan independennya harus ditulis lengkap, namun dalam perintah “regress” kedua yang 17
Bab 2. Telaah Ulang Analisis Regresi
disertai opsi “, beta” nama-nama variabel tidak usah dituliskan lagi, asal perintah “regress” kedua langsung diberikan setelah perintah “regress” pertama tanpa diselingi perintah Stata lainnya. Pembahasan lebih rinci tentang perintah-perintah Stata untuk analisis regresi linear dapat dilihat pada Lampiran 2.
18
Bab 3. Konsep-konsep Dasar Analisis Jalur
BAB 3 KONSEP-KONSEP DASAR ANALISIS JALUR Analisis Jalur dan Model Struktural Model struktural dalam SEM adalah model yang menggambarkan struktur hubungan antara sejumlah variabel teramati. Variabel teramati (observed variables) adalah variabel yang nilainya ada dalam himpunan-data (dataset). Dalam model ini tidak dipentingkan cara pengukuran yang dilakukan untuk memperoleh nilai-nilai untuk variabel tersebut. Berdasarkan arahnya, efek antar-variabel dibedakan menjadi efek searah dan efek resiprokal. Efek searah adalah efek yang terjadi secara searah antara variabel kausal (sebab) dengan variabel efek (akibat), misalnya efek searah variabel X terhadap variabel Y (X → Y). Efek resiprokal adalah efek yang terjadi secara dua-arah antar dua variabel, misalnya efek resiprokal antara variabel Y1 dan Y2 ( Y1
Y2 ). Pada efek resiprokal ini tidak dapat dibedakan
variabel mana yang merupakan variabel kausal atau variabel efek.
Asumsi dalam Analisis Jalur Asumsi-asumsi dalam analisis jalur dapat dibagi menjadi dua kelompok: 1.
Asumsi teoretis: Asumsi kausalitas yang tergantung pada terpenuhinya persyaratan berikut: a.
Model dispesifikasikan dengan benar.
b.
Ada hubungan teramati dan dapat diukur (observed and measurable relationship) antara variabel independen X dan variabel dependen Y (ada korelasi antara X dan Y).
c.
Ada urutan temporal: variabel independen X secara temporal harus terjadi mendahului variabel dependen Y.
d.
Tidak ada hubungan palsu (nonspurious relationship) antara variabel independen X dan variabel dependen Y (hubungan teramati, dapat diukur, dan temporal antara X dan Y tidak hilang dengan pengendalian terhadap efek variabel-variabel lain).
2.
Asumsi statistika: a.
Asumsi yang terkait dengan regresi ganda: asumsi normalitas, homoskedastisitas, dan linearitas.
19
Bab 3. Konsep-konsep Dasar Analisis Jalur
b.
Besar hubungan antara dua variabel independen yang berkorelasi satu sama lain dan tak-teranalisis direpresentasikan oleh koefisien korelasinya.
c.
Pengukuran variabel endogen sekurang-kurangnya berskala interval.
d.
Pengukuran variabel eksogen bersifat bebas-galat.
e.
Arah hubungan kausal terspesifikasi dengan benar: apakah X menyebabkan Y (X → Y), Y menyebabkan X (Y → X), atau terdapat hubungan resiprokal (X
f.
Bentuk
distribusi
diketahui:
Bentuk
distribusi
Y).
probabilitas
parameter
dispesifikasikan.
Parameter dan Derajat Bebas Model Pada model struktur kovariansi (SEM tanpa analisis rerata), parameter-nya adalah efek langsung terhadap variabel endogen serta variansi dan kovariansi variabel eksogen. Efek langsung yang dimaksud adalah efek yang besarnya yaitu nilai parameternya harus diestimasi. Dengan demikian maka jumlah parameter q dapat ditentukan dengan menghitung jumlah lambang →,
, dan
dalam diagram SEM, yaitu jumlah efek langsung
searah (koefisien regresi), variansi, dan kovariansi. Parameter model dapat bersifat bebas, terfiksasi, ataupun terkendala. Parameter bebas (free parameter) harus diestimasi berdasarkan data yang ada. Parameter terfiksasi (fixed parameter) dispesifikasikan nilainya sama dengan konstante tertentu. Parameter terkendala (constrained parameter) harus diestimasi dalam batasan tertentu, namun nilainya tidak terfiksasi sama dengan konstante tertentu. Dalam perhitungan jumlah parameter di atas, parameter terfiksasi tidak diikutsertakan. Dua parameter yang dikendalakan memiliki nilai yang sama tetapi tidak difiksasikan besar nilainya, diperhitungkan sebagai satu parameter dalam menghitung jumlah parameter. Dalam pembahasan selanjutnya, istilah „terfiksasi‟ dan „terkendala‟ ini akan seringkali saling dipertukarkan dengan pengertian yang sama. Jika menyatakan jumlah variabel teramati dalam model, maka banyak nilai pada diagonal matriks kovariansi dan di bawahnya, yang menyatakan banyak nilai variansi dan kovariansi tak-berulang (nonredundant covariances; kovariansi unik) adalah: + ( − 1) + ( − 2) + . . . + 1
Banyak nilai ini dinamakan juga sebagai jumlah titik data (number of data points) untuk model struktur kovariansi, yaitu: p=
1
(3.1)
2
20
Bab 3. Konsep-konsep Dasar Analisis Jalur
p : jumlah pengamatan : jumlah variabel teramati dalam model
Selisih antara jumlah titik data dengan jumlah parameter merupakan derajat bebas model, yaitu: df M = p – q
(3.2)
df M : derajat bebas model
q
: jumlah parameter yang diestimasi Jumlah titik data p merupakan jumlah parameter maksimal yang dapat diestimasi dalam
suatu model persamaan struktural. Kline (2005) menamakan jumlah titik data ini sebagai jumlah pengamatan (number of observations) bagi struktur kovariansi yang berbeda dengan ukuran sampel n. Ada pula yang menyebutkannya sebagai jumlah moment sampel (number of sample moments). Pada program Stata istilah „jumlah pengamatan‟ memiliki pengertian yang sama dengan „ukuran sampel‟ N (lambang ukuran sampel pada Stata), sedangkan jumlah titik data dinamakan sebagai momen derajat-dua (second-order moments).
Tipe Model Jalur Didapatkan dua tipe dasar model jalur yaitu model rekursif dan model non-rekursif. Model rekursif adalah model jalur dengan seluruh hubungan antar-variabelnya bersifat searah (efek searah) yang tidak membentuk loop tertutup dan seluruh suku pengganggunya tak saling berkorelasi. Contoh model rekursif diperlihatkan pada gambar 3.1.a. Model non-rekursif adalah model jalur yang memiliki sekurang-kurangnya satu loop tertutup atau hubungan antar-variabel dua-arah (efek resiprokal) dan/atau suku pengganggu yang saling berkorelasi. Contoh model non-rekursif diperlihatkan pada gambar 3.1.b. Selain itu masih didapatkan model jalur yang bersifat rekursif parsial (gambar 3.2).
21
Bab 3. Konsep-konsep Dasar Analisis Jalur
Gambar 3.1 (a) Contoh model rekursif (kiri); (b) Contoh model non-rekursif (kanan)
Gambar 3.2 Contoh model rekursif parsial: (a) Pola bebas-busur (dianggap rekursif; kiri) dan (b) Pola busur (dianggap non-rekursif; kanan)
Pola bebas-busur (bow-free pattern) seperti pada gambar 3.2 kiri adalah pola dengan korelasi antara dua suku pengganggu tanpa adanya jalur antara variabel endogennya. Dalam estimasi parameter, pola ini dapat diperlakukan seperti model rekursif. Pada pola busur (bow pattern; gambar 3.2 kanan), korelasi antara dua suku pengganggu disertai dengan jalur antara kedua variabel endogennya.
Identifikasi Model Sebuah model jalur dikatakan teridentifikasi (identified) jika secara teoretis dimungkinkan untuk memperoleh estimasi yang unik bagi setiap parameter. Persyaratan untuk identifikasi model SEM ialah: (1) Jumlah titik data lebih besar atau sama dengan jumlah parameter yang diestimasi ( df M > 0), dan (2) Variabel laten (tidak ada yang
22
Bab 3. Konsep-konsep Dasar Analisis Jalur
dianalisis pada model jalur) sekurang-kurangnya berskala interval. Berdasarkan status identifikasinya, model jalur dibedakan menjadi: 1.
Kurang-teridentifikasi (under-identified): df M < 0
2.
Tepat-teridentifikasi (just-identified): df M = 0
3.
Lebih-teridentifikasi (over-identified): df M > 0 Model yang tepat-teridentifikasi, yang disebut juga sebagai model jenuh hanya
memiliki sedikit kegunaan, walaupun sesuai sempurna dengan data. Kegunaannya yaitu hanya untuk mengestimasi koefisien regresi dan koefisien jalur. Jika model kurangteridentifikasi, estimasi parameter tak dapat dilakukan dan peneliti dianjurkan untuk memperbaiki model dengan mengurangi jumlah parameter yang hendak diestimasi. Hanya pada model yang lebih-teridentifikasi analisis SEM disarankan diteruskan. Model rekursif secara teoretis akan selalu teridentifikasi, namun dapat menjadi kurang
teridentifikasi
secara
empirik
(empirical
under-identified)
karena
adanya
multikolinearitas. Estimasi parameter untuk model kurang-teridentifikasi dengan program statistik komputer akan menyebabkan berlangsungnya proses iteratif secara terus menerus tanpa konvergensi. Cara mengatasinya adalah menghentikan program dan mengulangi proses estimasi dengan terlebih dahulu menentukan batasan jumlah iterasi. Adakalanya tidak mudah untuk menentukan status identifikasi bagi model yang rumit. Dalam hal ini Brown (2006) menganjurkan untuk menjalankan program statistik komputer dan membiarkan program komputer yang menentukan status identifikasi model.
Ukuran Sampel Perhatikan bahwa pada sebagian literatur tentang SEM, istilah „ukuran sampel‟ (jumlah anggota sampel) memiliki pengertian yang berbeda dengan istilah „jumlah pengamatan„ (Kline, 2005). Seperti halnya dengan teknik statistika lainnya, sampel besar akan menghasilkan estimasi dengan galat sampling (sampling error) lebih kecil daripada yang dihasilkan oleh sampel kecil. Perhitungan ukuran sampel minimum yang dibutuhkan dapat dilakukan berdasarkan analisis kekuatan (power analysis) yang diinginkan, namun secara kasar ukuran sampel dapat dibedakan menjadi: - Sampel kecil: N < 100 - Sampel sedang: 100 < N < 200 - Sampel besar: N > 200
23
Bab 3. Konsep-konsep Dasar Analisis Jalur
Ukuran sampel minimum yang dibutuhkan juga dapat dihitung secara kasar dengan rasio 10 : 1 terhadap jumlah parameter yang diestimasi, misalnya model jalur dengan 20 parameter akan membutuhkan ukuran sampel minimum sebesar 200 kasus. Jackson (2003) menganjurkan rasio ukuran sampel minimum ideal : parameter model sebesar 20 : 1 untuk estimasi maximum likelihood.
Hubungan Antar-Variabel Hubungan antara variabel terdiri atas efek kausal dan asosiasi non-kausal. Efek kausal adalah efek yang diasumsikan menyatakan kausalitas (hubungan sebab-akibat) antar dua variabel, dapat berupa efek langsung ataupun efek tak-langsung. Efek langsung (direct effect) adalah efek kausal hipotetis suatu variabel terhadap variabel kedua yang terjadi secara langsung tanpa melalui variabel ketiga. Efek searah suatu variabel terhadap variabel lainnya dinyatakan dengan lambang anak panah (“→”). Misalnya, efek langsung variabel X terhadap variabel Y dinyatakan sebagai X → Y. Besarnya efek searah dinyatakan sebagai koefisien regresi (tak-terstandardisasi) atau koefisien jalur (terstandardisasi). Efek tak-langsung (indirect effect) adalah efek kausal hipotetis suatu variabel terhadap variabel kedua yang terjadi melalui satu atau lebih variabel mediator (intervening variables). Misalnya, efek tak langsung variabel X terhadap variabel Y2 yang terjadi melalui variabel mediator Y1 dinyatakan sebagai X → Y1 → Y2 . Jika bX 1 menyatakan koefisien regresi X terhadap Y1 dan b12 menyatakan koefisien regresi Y1 terhadap Y2 , maka besar efek taklangsung (tak-terstandardisasi) X terhadap Y2 adalah bX 1 . b12 . Dalam bentuk terstandardisasi jika p X 1 menyatakan koefisien jalur X terhadap Y1 dan p12 menyatakan koefisien jalur Y1 terhadap Y2 , maka besar efek tak-langsung terstandardisasi X terhadap Y2 adalah p X 1 . p12 . Asosiasi non-kausal adalah hubungan suatu variabel dengan variabel kedua yang terjadi melalui variabel ketiga yang berkorelasi namun asosiasinya tak-teranalisis dengan variabel pertama, dinyatakan sebagai X 1
X 2 →Y atau X 1
24
X 2 → Y1 → . . . → Yk
BAB 4 ESTIMASI PARAMETER Parameter Model Jalur Untuk menjelaskan dasar-dasar perhitungan estimasi pada SEM, digunakan contoh model jalur Illness oleh Roth et al (1989) yang dalam bentuk penyederhanaan dapat diperlihatkan seperti pada gambar 4.1.
Gambar 4.1 Contoh model jalur Illness (Roth et al, 1989)
Dengan teknik statistika regresi ganda, model di atas dapat diuraikan menjadi tiga model regresi ganda: Fit = A3 + B13 Exe + B23 Hard + D3
(4.1)
Str = A4 + B14 Exe + B24 Hard + B34 Fit + D4
(4.2)
Ill = A5 + B15 Exe + B25 Hard + B35 Fit + B45 Str + D5
(4.3)
Keterangan: 1-Exe: Exercise; 2-Hard: Hardiness; 3-Fit: Fitness; 4-Str: Stress; 5-Ill: Illness. Dalam notasi SEM, gambaran model jalur di atas biasanya disajikan lebih lengkap seperti terlihat pada gambar 4.2, dengan beberapa tambahan: a.
Variansi untuk tiap variabel eksogen (Exe dan Hard)
b.
Korelasi antar variabel eksogen (antara Exe dengan Hard)
c.
Suku pengganggu (disturbance) untuk tiap variabel endogen ( DFi , DSt , dan DIl ).
d.
Variansi untuk tiap suku pengganggu (variansi DFi , DSt , dan DIl ). 25
e.
Koefisien jalur tiap suku pengganggu ke variabel endogennya yang terfiksasi menjadi bernilai sama dengan 1 ( DFi → Fit, DSt → Str, dan DIl → Ill). Anak panah yang terputus-putus dimaksudkan untuk menyatakan perkiraan bahwa
koefisien regresi atau koefisien jalurnya bernilai sama dengan nol.
Gambar 4.2 Contoh model jalur Illness dalam notasi SEM
Estimasi matriks kovariansi dan korelasi data Illness yang diperoleh dengan metode ML (maximum likelihood) dari sampel yang terdiri atas 373 orang mahasiswa diperlihatkan pada tabel 4.1. Perhatikan bahwa dengan teknik statistika standar, variansi populasi 2 diestimasikan dengan variansi sampel s populasi diestimasikan sebagai S 2
2
2
xi x = n 1
xi x = n
2
, tetapi dengan metode ML variansi
2
. Untuk sampel besar, nilai s 2 dan S 2
dapat dianggap sama, namun untuk sampel kecil S 2 merupakan estimator yang bias negatif bagi variansi populasi 2 . Juga untuk kovariansi sampel, estimasi tak biasnya adalah cov( x1 ; x2 ) =
x1i x1 x2i x2 , n 1
diestimasikan sebagai Cov ( x1 ; x2 ) =
namun dengan metode ML kovariansi populasi
x1i x1 x2i x2 n
26
Akibat penggunaan S
2
xi x = n
2
sebagai estimasi variansi populasi yaitu:
-
Nilai estimasi rerata variabel terstandardisasi tidak sama dengan nol.
-
Untuk model regresi terstandardisasi, nilai estimasi intersep tidak sama dengan nol.
Tabel 4.1 Estimasi matriks kovariansi dan korelasi data Illness a. Matriks kovariansi Variabel 1. Exe 2. Hard 3. Fit 4. Str 5. Ill
Variabel 1. Exe 2. Hard 3. Fit 4. Str 5. Ill SD
Exe 4422.25 –75.81 954.41 –222.78 –332.39
Hard
Fit
Str
Ill
1444.00 97.89 –585.58 –379.88
1354.24 –320.53 –666.79
4489.00 1423.29
3903.75
Str
Ill
1.00 0.34 67.00
1.00 62.48
b. Matriks korelasi Hard Fit
Exe 1.00 –0.03 0.39 –0.05 –0.08 66.50
1.00 0.07 –0.23 –0.16 38.00
1.00 –0.13 –0.29 36.80
Perhatikan bahwa kedua matriks ini saling berkaitan, dari matriks kovariansi dapat diperoleh matriks korelasi, sebaliknya dari matrik korelasi dan nilai-nilai standar deviasi dapat dihitung matriks kovariansi.
Contoh 4.1: Dari nilai Cov (Exe ; Fit) = 954.41, Var (Exe) = 4422.25, dan Var (Fit) = 1354.24 dapat dihitung nilai Corr (Exe ; Fit): Corr (Exe ; Fit) =
=
Cov Exe ; Fit SD Exe SD Fit
954.41
4422.25 1354.24
= 0.39
Atau nilai Cov (Hard ; Str) dapat dihitung dari Corr (Hard ; Str) = –0.23, SD (Hard) = 38.00, dan SD (Str) = 67.00:
27
Cov (Hard ; Str) = Corr (Hard ; Str) . SD (Hard) . SD (Str) = (–0.23)(38.00)(67.00) = –585.58
Estimasi Efek pada Model Jalur Estimasi nilai-nilai koefisien jalur yang dilakukan dengan metode maximum likelihood memerlukan proses iteratif, sehingga umumnya tak dapat dilakukan secara manual, tetapi membutuhkan program komputer untuk menyelesaikannya. Pada program statistik komputer demikian, sebagai masukan (input) dapat diisikan nilai-nilai tiap variabel teramati yang ada pada dataset, namun dapat juga diberikan matriks kovariansi atau korelasi (disertai standar deviasi tiap variabel).
Gambar 4.3 Model jalur Illness dengan nilai-nilai estimasi koefisien regresi (atas) dan koefisien jalurnya (bawah) 28
Sebagai contoh, untuk data Illness di atas menghasilkan estimasi nilai-nilai koefisien regresi (tak-terstandardisasi; atas) dan koefisien korelasi (terstandardisasi; bawah) seperti terlihat pada gambar 4.3, sedangkan hasil penilaian kemaknaannya diperlihatkan pada tabel 4.2.
Tabel 4.2 Estimasi parameter tak-terstandardisasi dan terstandardisasi model jalur Illness a. Efek langsung
Parameter
bij
SE bij
pij
Exe → Fit Hard → Fit Exe → Str Hard → Str Fit → Str Exe → Ill Hard → Ill Fit → Ill Str → Ill
.217** .079 –.014 –.393** –.198 .032 –.121 –.442** .271**
.026 .046 .055 .089 .099 .048 .079 .087 .045
.392 .082 −.014 −.223 −.109 .034 −.074 −.260 .291
b. Variansi dan kovariansi Parameter
Var (X)
SE (X)
Var (Z)
Exe Hard Exe Hard
DFit
4410.39** 1440.13** −75.607 1136.16**
323.39 105.60 130.73 83.31
1.000 1.000 −.030 .841
DStr
4181.00**
306.57
.934
DIll
3178.98**
233.09
.817
*: p < .05; **: p < .01 Sumber: Roth et al (1989); N = 373
Interpretasi terhadap nilai-nilai estimasi pada model jalur Illness tersebut ialah: 1.
Besar efek langsung adalah sama dengan koefisien regresi pada model takterstandardisasi dan koefisien jalur (nilai beta) pada model terstandardisasi. Untuk contoh di atas, efek langsung b13 = 0.217 pada gambar 4.3 atas adalah estimasi koefisien regresi Exe ke Fit (Exe → Fit), sedangkan efek langsung p13 = 0.392 pada gambar 3 bawah adalah estimasi koefisien jalur Exe ke Fit.
29
2.
Variansi suku pengganggu pada model tak terstandardisasi merupakan estimasi bagi variansi variabel endogen yang berkaitan yang tak dijelaskan oleh variabel eksogen yang merupakan prediktornya. Untuk contoh pada gambar 4.3 atas, variansi suku pengganggu DFi sebesar 1136.16 adalah estimasi variansi Fit yang tak dijelaskan oleh Exe dan Hard. Estimasi variansi Fit seluruhnya, termasuk yang dijelaskan oleh Exe dan Hard, adalah 1354.24 (matriks 1.a).
3.
Untuk model terstandardisasi, variansi variabel eksogen selalu sama bernilai 1, sedangkan variansi suku pengganggu merupakan estimasi proporsi variansi variabel endogen yang berkaitan yang tak dijelaskan oleh variabel eksogen prediktornya. Untuk contoh pada gambar 4.3 bawah, variansi suku pengganggu DFi sebesar 0.841 adalah estimasi proporsi variansi Fit yang tak dijelaskan oleh Exe dan Hard. Nilai ini 2 2 sama besarnya dengan 1 – RFi , RFi adalah koefisien determinasi Fit pada regresinya
terhadap Exe dan Hard.
Dekomposisi Efek Koefisien korelasi adalah ukuran kekuatan hubungan terstandardisasi antara dua variabel kontinu. Pada SEM, hubungan antara variabel dapat dibedakan menjadi efek kausal dan asosiasi non-kausal. Efek kausal adalah efek yang diasumsikan menyatakan kausalitas (hubungan sebab-akibat) antar dua variabel, dapat berupa efek langsung ataupun efek taklangsung. Efek langsung (direct effect) adalah efek kausal hipotetis suatu variabel terhadap variabel kedua yang terjadi secara langsung tanpa melalui variabel ketiga. Efek searah suatu variabel terhadap variabel lainnya dinyatakan dengan lambang anak panah (“→”). Misalnya, efek langsung variabel x terhadap variabel y digambarkan sebagai x → y. Besarnya efek searah dinyatakan sebagai koefisien regresi (tak-terstandardisasi) atau koefisien jalur (terstandardisasi). Efek tak-langsung (indirect effect) adalah efek kausal hipotetis suatu variabel terhadap variabel kedua yang terjadi melalui satu atau lebih variabel mediator (intervening variables). Efek tak langsung variabel x terhadap variabel y2 yang terjadi melalui variabel mediator y1 dalam hubungan x → y1 → y2 adalah: bx 2 = bx1 . b12
(4.4)
30
bx 2
: efek tak-langsung (tak-terstandardisasi) x terhadap y2
bx1
: efek langsung (tak-terstandardisasi) x terhadap y1 (koefisien regresi x ke y1 )
b12
: efek langsung (tak-terstandardisasi) y1 terhadap y2 (koefisien regresi y1 ke y2 ) Dengan kondisi yang sama, untuk bentuk terstandardisasi diperoleh: p x 2 = p x1 . p12
(4.5)
p x 2 : efek tak-langsung (terstandardisasi) x terhadap y2 p x1 : efek langsung (terstandardisasi) x terhadap y1 (koefisien jalur x ke y1 ) p12
: efek langsung (terstandardisasi) y1 terhadap y2 (koefisien jalur y1 ke y2 ) Asosiasi non-kausal adalah hubungan suatu variabel dengan variabel kedua yang
terjadi melalui variabel ketiga yang berkorelasi namun asosiasinya tak-teranalisis dengan variabel pertama, digambarkan sebagai atau x1
x2 → y1 → . . . → yk . Dalam hubungan x1
x2 → y, asosiasi non kausal antara x1 dengan y adalah:
a1 y = r12 . p2 y
(4.6)
a1 y
: asosiasi non-kausal antara x1 dengan y
r12
: korelasi (asosiasi tak-teranalisis) antara x1 dengan x2
p2 y : efek langsung (terstandardisasi) x2 terhadap y (koefisien jalur x2 ke y )
Contoh 4.2: Hubungan antara Exe dengan Ill (terstandardisasi) dapat dijabarkan sebagai berikut: 1.
Efek kausal langsung (Exe → Ill):
2.
Efek kausal tak-langsung:
0.0340
- Exe → Fit → Ill
: (0.392)(–0.260)
= –0.1019
- Exe → Str → Ill
: (–0.014)(0.291)
= –0.0041
- Exe → Fit → Str → Ill : (0.392)(–0.109)(0.291)
= –0.0124
Jumlah efek kausal tak-langsung
–0.1184
Jumlah efek kausal adalah
–0.0844
31
3.
Asosiasi non-kausal: - Exe
Hard → Ill
: (–0.030)(–0.074)
= 0.0022
- Exe
Hard → Fit → Ill
: (–0.030)(0.082)(–0.260)
= 0.0006
- Exe
Hard → Str → Ill
: (–0.030)(–0.223)(0.291)
= 0.0019
- Exe
Hard → Fit → Str → Ill : (–0.030)(0.082)(–0.109)(0.291) = 0.0001
Jumlah asosiasi non-kausal
0.0049 –0.0795
Besar hubungan seluruhnya antara Exe dengan Ill adalah:
Hubungan antara Exe dengan Ill sebesar –0.0795 ini adalah sama dengan koefisien korelasi antara Exe dengan Ill, yaitu –0.08 (dengan pembulatan, tabel 4.1.b).
Uji Sobel Uji Sobel adalah uji statistik untuk efek tak-langsung tak terstandardisasi antar dua variabel yang terjadi melalui satu variabel mediator. Misalkan dalam hubungan x → y1 → y2 , b1 menyatakan koefisien regresi x ke y1 dengan standard error SE1 dan b2 menyatakan
koefisien regresi y1 ke y2 dengan standard error SE2 , maka statistik penguji untuk uji hipotesis H 0 : 12 = 0 adalah: Z uji =
b12 SE12
(4.7)
yang berdistribusi Z (normal standar) dengan: SE12 =
b2 SE1 b1 SE2 2
2
2
2
(4.8)
b12 = b1. b2 : Efek tak-langsung (tak-terstandardisasi) x terhadap y2 SE12
: Standard error ( b1. b2 ) Uji Sobel ini memiliki akurasi yang memadai untuk sampel berukuran besar.
Contoh 4.3: Lihat kembali model jalur Illness pada gambar 4.3. Misalkan hendak diuji hipotesis H 0 : 12 = 0 dengan 12 menyatakan efek tak-langsung (tak-terstandardisasi) Exe terhadap Ill melalui Exe → Fit → Ill dalam populasi. Estimasinya dari data sampel adalah b12 yang nilainya diperoleh sebagai hasil perkalian b1 b2 , b1 menyatakan koefisien regresi Fit terhadap Exe dan b2 menyatakan koefisien regresi Ill terhadap Fit. 32
b1 = 0.217
b2 = –0.442
SE1 = 0.026
SE2 = 0.087
(Nilai SE1 dan SE2 diperoleh dari keluaran program statistik komputer) b12 = ( b1 )( b2 )
= (0.217)(–0.442) = –0.096 SE12 =
= Z uji =
=
b2 SE1 b1 SE2 2
2
2
0.442 0.026 2
2
2
0.217 0.087 = 0.022 2
2
b12 SE12 0.096 = –4.34 0.022
Notasi Jalur SEM “sem path notation” merupakan sintaks perintah untuk diagram jalur (command syntax for path diagrams). Sintaks-nya adalah: sem paths . . . [, covariance() variance() means() [group()]] Jalur (paths) menspesifikasikan arah jalur antar variabel model peneliti. Model yang akan disesuaikan sepenuhnya dideskripsikan oleh “paths, covariance(), variance(), and means()”. Sintaks unsur-unsur ini dimodifikasikan (digeneralisasikan) apabila opsi “group()” dispesifikasikan. Jalur untuk regresi sederhana dituliskan sebagai: (vardep <− varind) atau (varind −>vardep) vardep
: variabel dependen
varind
: variabel independen
Misalnya: (y <− x) atau (x −> y) Perhatikan bahwa: - Variabel laten dinamai dengan huruf besar untuk huruf pertamanya - Variabel teramati dinamai dengan huruf kecil untuk huruf pertamanya
33
Jalur untuk regresi ganda dituliskan sebagai: (vardep<− varind1) (vardep<− varind2) (vardep<− varind3) atau: (varind1 −>vardep) (varind2 −>vardep)(varind3 −>vardep) atau: (vardep −>varind1 varind2 varind3) atau: (varind1 varind2 varind3 −>vardep) Misalnya: (y <− x1 ) (y <− x 2 ) (y <− x 3 ) Penulisan suku galat bersifat opsional, sehingga (y <− x) dapat dibaca atau boleh dituliskan sebagai: (y <− x e.y) e.y
: suku pengganggu (disturbance) Jika koefisien jalur suku galat difiksasikan bernilai sama dengan satu, maka keadaan ini
dituliskan sebagai: (y <− x e.y@1) Fiksasi juga dapat diberlakukan terhadap koefisien jalur salah satu prediktor, misalnya p2Y = 2: (y <− x1 x 2 @2 x 3 ) Kendala dapat diberikan sedemikian hingga koefisien jalur prediktor X 2 bernilai sama dengan koefisien jalur prediktor X 3 (tanpa menspesifikasi nilainya): (y <− x1 x 2 @b x 3 @b)
Estimasi Koefisien Jalur SEM dengan Stata Pada analisis sem dapat digunakan file data Stata yang memuat nilai-nilai invididual variabel teramati bagi tiap anggota sampel, namun dapat pula digunakan file data statistik ringkasan (summary statistics data; ssd) yang hanya memuat statistik ringkasan seperti rerata, standar deviasi, kovariansi, atau korelasi. Dalam contoh berikut akan diperlihatkan prosedur pembuatan file data statistik ringkasan untuk model illness (gambar 4.1) dengan menggunakan data tabel korelasi 4.1.b.
34
Contoh 4.4 (Membuat file data statistik ringkasan): Perintah ssd (summary statistics data): . clear all . ssd init exe hard fit stress ill Summary statistics data initialized. Next use, in any order, ssd set observations (required) It is best to do this first. ssd set means (optional) Default setting is 0. ssd set variances or ssd set sd (optional) Use this only if you have set or will set correlations and, even then, this is optional but highly recommended. Default setting is 1. ssd set covariances or ssd set correlations (required)
. ssd set observations 384 (value set) Status: observations: means: variances or sd: covariances or correlations:
set unset unset unset
(required to be set)
. ssd set sd 66.50 38.00 36.80 67.00 62.48 (values set) Status: observations: means: variances or sd: covariances or correlations:
set unset set unset
(required to be set)
. ssd set correlations 1.00 \ −.03 1.00 \ .39 .07 1.00 \ −.05 −.23 −.13 1.00 \ −.08 −.16 −.29 .34 1.00 (values set) Status: observations: means: variances or sd: covariances or correlations:
set unset set set
. label variable exe "exercise" . label variable hard "hardiness"
35
. label variable fit "fitness" . label variable stress “stress” . label variable ill "illness" . save "D:\SEM\Data\illness.dta"
Perintah “ssd init” adalah perintah Stata untuk memulai pembuatan file ssd (summary statistics data), yaitu file Stata yang tidak berisikan data lengkap, melainkan hanya memuat jumlah anggota sampel dan matriks kovariansi atau korelasi. File ssd juga dapat diisi dengan nilai-nilai rerata dan/atau variansi atau standar deviasi yang bersifat opsional. Perintah “ssd init” disertai dengan nama-nama variabel dalam file ssd yang akan dibuat. Pembuatan file ssd dilanjutkan dengan perintah “ssd set observations” yang bersifat wajib untuk memasukkan data jumlah anggota sampel, perintah “ssd set means” yang bersifat opsional untuk memasukkan nilai-nilai rerata, perintah “ssd set variances” atau “ssd set sd” yang bersifat opsional untuk memasukkan nilai-nilai variansi atau standar deviasi, serta perintah “ssd set covariances” atau “ssd set correlations” yang bersifat wajib untuk memasukkan nilai-nilai matriks kovariansi atau korelasi. Berikutnya dengan Data Editor dapat dilihat isi file sebagaimana tersaji di bawah ini. Tampak bahwa file tidak memuat data individu anggota sampel, melainkan data ringkasannya. Baris pertama (_type 1) seharusnya menampilkan nilai-nilai rerata variabel, tetapi di sini kosong karena memang tidak dimasukkan. Baris kedua (_type 2) memuat nilainilai standar deviasi, sedangkan baris ketiga sampai dengan ketujuh menampilkan matriks korelasi.
36
Contoh 4.5 (Membuat file ssd dari file data individual): File ssd dapat diperoleh sebagai konversi file data individual. Pembuatan file ssd ini terbagi atas 2 tahap, yaitu tahap persiapan dan tahap konversi data. Tahap persiapan dimaksudkan untuk mempersiapkan data yang ada dalam file data individual sebelum pelaksanaan konversi. Langkah-langkah untuk tahap persiapan terdiri atas: 1.
Buang variabel pada file data individual yang tak dibutuhkan untuk menganalisis file ssd.
2.
Pastikan tidak ada variabel „string‟ dalam data tersisa.
3.
Pastikan tidak ada nilai hilang (missing values) dalam data tersisa.
4.
Pastikan semua variabel ada dalam skala yang wajar. Dianjurkan rasio rerata variabel terbesar dengan variabel terkecil tidak melebihi 1000 atau 10,000. Jika ditemukan keadaan demikian, dilakukan penskalaan untuk memperkecil nilai-nilai variabel terbesar.
5.
Variabel baru yang mungkin akan dibutuhkan sebagai hasil transformasi variabel lama harus dibuat pada tahap ini. Setelah dilakukan konversi menjadi file ssd tidak dapat lagi dilakukan penambahan variabel baru.
6.
Susun kembali variabel dalam urutan logis untuk mempermudah pengguna file ssd memahami data.
7.
Simpan data yang sudah siap untuk dikonversi ini dalam bentuk file data individual biasa. File ini mungkin masih dibutuhkan suatu waktu kelak.
37
Pelaksanaannya diperlihatkan pada contoh berikut: . use “D:\SEM\Data\honolulu.dta” . keep bb tb usia glukosa kolest sistolik . summarize Variable bb tb usia glukosa kolest sistolik
Obs 100 100 100 100 100 100
Mean 64.22 161.75 53.67 152.14 216.96 130.1
Std.Dev. 8.610048 5.596491 5.101109 54.75584 38.85844 21.20677
Min 47 150 46 58 134 92
Max 91 175 67 442 382 208
. gen bmi = bb/((tb/100)^2) . label var bmi “indeks massa tubuh” . order usia bb tb bmi . save “D:\SEM\Data\honolulu_raw.dta” file D:\SEM\Data\honolulu_raw.dta saved
Tahap berikutnya adalah konversi data dengan langkah-langkah sebagai berikut: 1.
Konversi file data individual yang telah dipersiapkan menjadi file ssd.
2.
Lihat dan periksa file ssd yang dihasikan.
3.
Simpan file ssd. Pelaksanaannya diperlihatkan sebagai lanjutan contoh di atas:
. use “D:\SEM\Data\honolulu_raw.dta” . ssd build _all (data in memory now summary statistics data; you can use ssd describe and ssd list to describe and list results.)
. ssd describe Summary statistics data obs: vars:
100 7 (_dta has notes)
variable name
variable label
usia bb tb bmi glukosa kolest sistolik
Usia Berat Badan Tinggi Badan Indeks Massa Tubuh Kadar Glukosa Kadar Kolesterol Tekanan Darah Sistolik
. ssd list Observations = 100
38
Means: usia 53.67
bb 64.22
tb 161.75
bmi 24.548406
glukosa 152.14
kolest 216.96
sistolik 130.1
Variances implicitly defined; they are the diagonal of the covariance matrix. Covariances: usia 26.021313 −10.138788 −7.2247475 −1.5991521 60.470909 21.552323 23.992929
bb
tb
bmi
glukosa
kolest
sistolik
74.132929 18.520202 22.384707 25.110303 9.6957576 −5.2949495
31.320707 −2.6120988 −33.186869 −61.414141 −4.9646465
9.3197763 19.655521 22.584735 −.54070781
2998.2024 717.3996 307.4404
1509.9782 155.17576
449.72727
. save “D:\SEM\Data\honolulu_ss.dta” file D:\SEM\Data\honolulu_ss.dta saved
Contoh 4.6 (Regresi linear ganda dengan SEM, contoh pada manual Stata): Regresi linear ganda (multiple linear regression) adalah analisis regresi linear dengan variabel independen lebih daripada satu. File data: auto.dta (lihat kembali contoh 2.7) Variabel: variable name weight foreign mpg
variable label Weight (lbs.) Cartype Miliage (mpg)
Model:
Persamaan: mpg = α + β1weight + β2weight2 + β3foreign + ε1
Perintah sem (structural equation modeling): . generate weight2 = weight^2
39
. sem (mpg <− weight weight2 foreign) Endogenous variables Observed: mpg
Exogenous variables Observed: weight weight2 foreign Fitting target model: Iteration 0: Iteration 1:
log likelihood = −1909.8206 log likelihood = −1909.8206
Structural equation model Estimation method = ml Log likelihood = −1909.8206
Number of obs
Coef.
OIM Std. Err.
z
P>|z|
weight weight2 foreign _cons
−.0165729 1.59e-06 −2.2035 56.53884
.0038604 6.08e-07 1.03022 6.027559
−4.29 2.62 −2.14 9.38
0.000 0.009 0.032 0.000
e.mpg
10.19332
1.675772
=
74
[95% Conf. Interval]
Structural mpg <− −.0241392 4.00e-07 −4.222695 44.72504
−.0090067 2.78e.-06 −.1843056 68.35264
7.385485
14.06865
Variance LR test of model vs. Saturated: chi2(1)
=
0.00,
Prob > chi2 = 1.000
. sem, standardized Structural equation model Estimation method = ml Log likelihood = −1909.8206
Number of obs
Coef.
OIM Std. Err.
z
P>|z|
weight weight2 foreign _cons
−2.226321 1.32654 −.17527 9.839209
.4950378 .498261 .0810378 .9686872
−4.50 2.66 −2.16 10.16
0.000 0.008 0.031 0.000
e.mpg
.308704
.0482719
=
74
[95% Conf. Interval]
Structural mpg <− −3.196577 .3499662 −.3341011 7.940617
−1.256064 2.303113 −.0164389 11.7378
.2272168
.4194152
Variance LR test of model vs. saturated: chi2(1)
=
0.00,
Prob > chi2 = 1.000
Catatan: -
Nilai estimasi koefisien analisis regresi (“regress”) tepat sama dengan hasil structural equation modeling (“sem”).
-
Nilai estimasi standard error analisis regresi sedikit berbeda dengan hasil structural equation modeling. Pada “regress” digunakan pembagi N – k – 1 = 74 – 3 – 1 = 70, sedangkan pada “sem” digunakan pembagi N = 74, sehingga pada “regress” 40
diperoleh SE foreign sebesar 1.06, sedangkan pada sem SE foreign adalah 1.03. Dengan demikian hasil perhitungan interval konfidensinya juga sedikit berbeda. -
Pada “regress” yang dilaporkan adalah statistik t, sedangkan pada “sem” dilaporkan statistik z.
Contoh 4.7 (Regresi yang seolah tak-berkaitan, manual Stata): Regresi yang seolah tak berkaitan (seemingly unrelated regression; SUR) adalah dua atau lebih regresi linear terpisah, tetapi suku pengganggunya berkorelasi. Dua atau lebih regresi mungkin, namun tak selalu harus, memiliki variabel eksogen bersama. File data: auto.dta Variabel: variable name mpg displacement foreign length price weight
variable label Miliage (mpg) Displacement (cu. in) Cartype Length (in.) Price Weight (lbs.)
Model:
Persamaan: price = α1 + β11foreign + β12mpg + β13displacement + ε1 weight = α2 + β21foreign + β22length + ε2
Perintah sem (structural equation modeling): . sem (price <− foreign mpg displacement) >
(weight <− foreign length),
>
cov (e.price*e.weight)
41
Endogenous variables Observed: price weight Exogenous variables Observed: foreign mpg displacement length Fitting target model: Iteration 0: Iteration 1: Iteration 2: Iteration 3: Iteration 4: Iteration 5:
log log log log log log
likelihood likelihood likelihood likelihood likelihood likelihood
= = = = = =
−2150.9983 −2138.5739 −2133.3461 −2133.1979 −2133.1956 −2133.1956
Structural equation model Estimation method = ml Log likelihood = −2133.1956 Standardized Structural price <− foreign mpg displace~t _cons Structural weight <− foreign length _cons Variance e.price e.weight Covariance e.price e.weight
Number of obs
=
74
Coef.
OIM Std. Err.
z
P>|z|
2940.929 −105.0163 17.22083 4129.866
724.7311 57.93461 4.5941 1984.253
4.06 −1.81 3.75 2.08
0.000 0.070 0.000 0.037
1520.482 −218.566 8.216558 240.8022
4361.376 8.53347 26.2251 8018.931
−153.2515 30.73507 −2711.096
76.21732 1.584743 312.6813
−2.01 19.39 −8.67
0.044 0.000 0.000
−.302.6347 27.62903 −3323.94
−3.868275 33.84111 −2098.252
4732491 60253.09
801783.1 9933.316
3395302 43616.45
6596312 83235.44
209268
73909.54
64407.92
354128
LR test of model vs. saturated: chi2(3)
=
2.83 38.86,
0.005
[95% Conf. Interval]
Prob > chi2 = 0.0000
Contoh 4.8 (Data masukan dengan matriks korelasi): Pada contoh diperlihatkan pemasukan data statistik ringkasan untuk analisis SEM dalam bentuk matriks korelasi menurut Romney et al (1992) seperti terlihat pada tabel 4.3, yang dapat dianalisis dalam bentuk model psikosomatik ataupun model medik konvensional (gambar 4.4) Tabel 4.3 Matriks korelasi model jalur pemulihan pasca bedah jantung 1. 2. 3. 4. 5.
Variabel Low Morale Illness Symptoms Neurological Dysfunction Poor Relationships Diminished SES
1 1.00 .53 .15 .52 .30
Sumber: Romney et al (1992); N = 469
42
2
3
4
5
1.00 .18 .29 .34
1.00 −.05 .23
1.00 .09
1.00
Gambar 4.4 Model jalur alternatif non-hirarkis untuk model pemulihan pasca bedah jantung. Atas: Model psikosomatik; Bawah: Model medik konvensional (Kline, 2005) Perintah sem (input data korelasi): . clear all . ssd init morale illness neuro relation ses Summary statistics data initialized. Next use, in any order, ssd set observations (required) It is best to do this first. ssd set means (optional) Default setting is 0. ssd set variances or ssd set sd (optional) Use this only if you have set or will set correlations and, even then, this is optional but highly recommended. Default setting is 1. ssd set covariances or ssd set correlations (required)
. ssd set observations 469 (value set) Status: observations:
set
means: unset
43
variances or sd: unset covariances or correlations: unset (required to be set)
. ssd set correlations 1.00 \ .53 1.00 \ .15 .18 1.00 \ .52 .29 -.05 1.00 \ .30 .34 .23 .09 1.00 (values set) Status: observations: means:
set unset
variances or sd:
unset
covariances or correlations:
set
. label variable morale "Low Morale" . label variable illness "Illness Symptoms" . label variable neuro "Neurological Dysfunction" . label variable relation "Poor Relationships" . label variable ses "Diminished SES" . save "D:\SEM\Data\cardiac_surgery.dta" file D:\SEM\SEM\Data\cardiac_surgery.dta saved
. ssd describe Summary statistics data from D:\SEM\Data\cardiac_surgery.dta obs: vars:
469 5
19 April 2012 19:02
variable name morale illness neuro relation ses
variable label Low Morale Illness Symptoms Neurological Dysfunctions Poor Relationships Dimisnished SES
. ssd list Observations = 469 Means undefined; assumed to be 0 Variances undefined; assumed to be 1 Correlations: morale 1 .53 .15 .52 .3
illness
neuro
relation
ses
1 .18 .29 .34
1 −.05 .23
1 .09
1
44
Perbandingan kedua model, yaitu model psikosomatik dan model medik konvensional dapat dilakukan dengan uji rasio likelihood (lihat petunjuk pada lampiran 4). Dua model jalur ekivalen lainnya untuk data pemulihan pasca bedah jantung ini diperlihatkan pada gambar 4.5.
Gambar 4.5 Dua model jalur ekivalen untuk data pemulihan pasca bedah jantung (Kline, 2005)
Contoh 4.9 (Dekomposisi efek): Pada contoh ini diperlihatkan pengestimasian efek langsung, efek tak langsung, dan efek total sebuah prediktor terhadap outcome-nya. Perhatikan bahwa dalam kepustakaan cara ini juga disebutkan sebagai pengestimasian efek variabel mediator, karena efek tak langsung dengan sendirinya terjadi melalui variabel mediator (variabel perantara). File data yang digunakan adalah cardiac_surgery.dta dengan model medik konvensional (gambar 4.4 bawah). . use "D:\SEM\Data\cardiac_surgery.dta", clear . sem (ses <− illness neuro) (morale <− illness ses) (relation <− neuro morale) Endogenous variables Observed: ses morale relation Exogenous variables Observed: illness neuro Fitting target model: Iteration 0: Iteration 1:
log likelihood = −3118.3779 log likelihood = −3118.3779
Structural equation model
45
Estimation method Log likelihood
= ml = −3118.3779
Number of obs
=
469
Coef.
OIM Std. Err.
z
P>|z|
.3085986 .1744523
.0434047 .0434047
7.11 4.02
0.000 0.000
.223527 .0893806
.3936702 .2595239
.1354591 .4839439
.0411649 0411649
3.29 11.76
0.001 0.000
.0547773 .4032621
.2161408 .5646257
.5396419 −.1309463
.0394322 .0394322
13.69 −3.32
0.009 0.001
.4623563 −.208232
.6169276 −.0536606
.8531295 .7013733 .711319
.0557113 .0458013 .0464508
.7506363 .6171118 .6258625
.9696174 .7971402 .8084438
[95% Conf. Interval]
Structural ses <− illness neuro morale <− ses illness relation <− morale neuro Variance e.ses e.morale e.relation
LR test of model vs. saturated: chi2(3)
=
3.25,
Prob > chi2 = 0.3553
Tampak pada model medik konvensional terdapat dua variabel mediator, yaitu ses sebagai mediator dalam efek ill terhadap morale [ill → ses → morale], serta ses dan morale dalam efek neuro terhadap relation [neuro → ses → morale → relation].
Perintah sem dilanjutkan dengan perintah estat teffect untuk memperoleh estimasi efek langsung dan tak langsung. . estat teffects Direct effects Coef.
OIM Std. Err.
z
P>|z|
.3085986 .1744523
.0434047 .0434047
7.11 4.02
0.000 0.000
.223527 .0893806
.3936702 .2595239
.1354591 .4839439 0
.0411649 .0411649 (no path)
3.29 11.76
0.001 0.000
.0547773 .4032621
.2161408 .5646257
0 .5396419 0 −.1309463
(no path) .0394322 (no path) .0394322
13.69
0.000
.4623563
.6169276
−3.32
0.001
−.208232
−.0536606
[95% Conf. Interval]
Structural ses <− illness neuro morale <− ses illness neuro relation <− ses morale illness neuro
46
Indirect effects Coef.
OIM Std. Err.
0 0
(no path) (no path)
0 .0418025 .0236311
(no path) .0139981 .0092812
.0730994 0 .2837148 .0127524
.0222143 (no path) .0296103 .0050945
Coef.
z
P>|z|
[95% Conf. Interval]
2.99 2.55
0.003 0.011
.0143667 .0054403
.0692382 .0418219
3.29
0.001
.0295601
.1166387
9.58 2.50
0.000 0.012
.2256796 .0027674
.34175 .0227373
OIM Std. Err.
z
P>|z|
.3085986 .1744523
.0434047 .0434047
7.11 4.02
0.000 0.000
.223527 .0893806
.3936702 .2595239
.1354591 .5257464 .0236311
.0411649 .0391778 .0092812
3.29 13.42 2.55
0.001 0.000 0.011
.0547773 .4489593 .0054403
.2161408 .6025335 .0418219
.0730994 .5396419 .2837148 −.1181939
.0222143 .0394322 .0296103 .0396211
3.29 13.69 9.58 −2.98
0.001 0.000 0.000 0.003
.0295601 .4623563 .2256796 −.1958498
.1166387 .6169276 .34175 −.0405381
Structural ses <− illness neuro morale <− ses illness neuro relation <− ses morale illness neuro
Total effects [95% Conf. Interval]
Structural ses <− illness neuro morale <− ses illness neuro relation <− ses morale illness neuro
Diperoleh efek total ill terhadap morale adalah .5257464, terdiri atas efek langsung .4839439 dan efek tak langsung .0418025, sehingga proporsi efek total yang termediasi adalah (.0418025)/(.5257464) = 0.08. Efek total neuro terhadap relation adalah −.1181939, terdiri atas efek langsung −.1309463 dan efek tak langsung .0127524; proporsi efek total yang termediasi adalah (.0127524)/( −.1181939) = −0.11. Jika hasil-hasil di atas terlalu panjang dan yang hendak diketahui hanya besar efek langsung, efek tak langsung, dan efek total antar variabel, dapat digunakan perintah matrix list seperti di bawah ini: . sem (ses <− illness neuro) (morale <− illness ses) (relation <− neuro morale) . quietly estat teffects
47
. matrix list r(indirect)
r (indirect) [1, 9] morale: o. ses 0
morale:
morale:
illness .04180248
neuro .02363114
r (direct) [1, 9] ses:
ses:
morale:
morale:
illness .30859859
neuro .17445225
ses .13545907
illness .48394392
morale: o. neuro 0
morale: ses .13545907
morale: illness .52574639
morale: neuro .02363114
r1
ses: o. illness 0
ses: o. neuro 0
relation: o. ses .07309939
relation:
relation:
relation:
morale 0
illness .28371481
neuro .01275235
. matrix list r(direct)
r1
relation: o. ses 0
relation: morale .53964194
relation: o. illness 0
relation: neuro −.13094629
. matrix list r(total) r (total) [1, 9] ses: illness r1 .30859859
ses: neuro .17445225
48
relation: ses .07309939
relation: morale .53964194
relation: illness .28371481
relation: neuro −.11819394
BAB 5 UJI HIPOTESIS DAN PENILAIAN MODEL Uji Hipotesis pada SEM Uji hipotesis pada SEM tidak bertujuan untuk menguji kemaknaan statistik hubungan antar variabel seperti pada analisis regresi. Tujuan uji hipotesis pada SEM adalah untuk mengevaluasi konsistensi model peneliti dengan data sampel. Permasalahan dalam uji hipotesis pada SEM ialah: 1
Terdapat berbagai statistik-suai (fit statistics) yang ditampilkan oleh program komputer pada analisis SEM, dan jumlah statistik-suai ini semakin bertambah serta bervariasi dalam perjalanan waktu, namun: -
Tidak ada satu ukuran tunggal yang dapat digunakan untuk mengevaluasi konsistensi model dengan data sampel secara menyeluruh, tiap jenis statistik hanya menilai aspek suai tertentu.
-
Nilai statistik-suai menyatakan rata-rata kesesuaian model dengan data. Mungkin terjadi bahwa sebagian model memiliki kesuaian baik dan ada bagian model yang tak sesuai dengan data.
-
Statistik-suai tidak menginformasikan apakah model peneliti bermakna secara teoretis.
2.
Model harus dikembangkan peneliti secara a-priori berdasarkan pengetahuan teoretisnya. Model jenuh pasti akan sesuai secara sempurna dengan data, namun model demikian tak bernilai secara ilmiah. Di sisi lain, dapat dikembangkan lebih daripada satu model yang sama baiknya kesesuaiannya dengan data (model ekivalen), dan pengetahuan substantif penelitilah yang akan menentukan model mana yang lebih bermakna secara teoretis.
Klasifikasi Statistik Suai Statistik suai (fit statistics) adalah statistik yang mengindikasikan kesesuaian rata-rata ataupun menyeluruh (average or overall fit) sebuah model. Statistik suai dibedakan dalam dua kelompok, yaitu statistik penguji model dan indeks-suai aproksimasi. Statistik penguji model (model test statistics) adalah statistik untuk menguji ada tidaknya perbedaan yang bermakna secara statistik antara matriks kovariansi model peneliti dengan matriks kovariansi sampel. Statistik penguji model umumnya adalah statistik ‘keburukan-suai’, yaitu semakin 49
besar nilai statistik, semakin buruk kesesuaian model dengan data. Hasil uji yang bermakna secara statistik (p < 0.05) menunjukkan ketidaksesuaian model dengan data. Model peneliti dapat diterima jika hipotesis nol tidak ditolak, yang mengindikasikan tidak ditemukannya perbedaan yang bermakna secara statistik antara matriks kovariansi model peneliti dengan matriks kovariansi sampel. Hanya satu statistik penguji model yang akan dibahas di bawah ini, yaitu khi-kuadrat model (model chi-square). Indeks suai aproksimasi (approximate fit indexes) adalah ukuran kontinu untuk menilai keterkaitan antara model peneliti dengan data yang ada.
Macam Statistik Suai 1.
Khi-kuadrat model (model chi-square): Khi-kuadrat model adalah khi-kuadrat rasio-likelihood model peneliti vs model jenuh:
2 = 2 log Ls log L ˆ ms
(5.1)
yang berdistribusi khi-kuadrat dengan derajat bebas sama dengan df ms ; df ms = df s − df m log Ls
: log likelihood model jenuh dengan metode maximum likelihood
log L ˆ : log likelihood model peneliti
df s
: derajat bebas model jenuh
df m
: derajat bebas model peneliti
Khi-kuadrat model dinamakan juga khi-kuadrat rasio likelihood atau rasio likelihood 2 umum. Jika ms = 0, maka model sesuai sempurna dengan data (perfectly fits the data),
yaitu matriks korelasi dan kovariansi prediksi sama dengan yang diamati. Di bawah 2 hipotesis nol yang menyatakan model peneliti sesuai sempurna dalam populasi, ms
secara aproksimasi berdistribusi khi-kuadrat sentral. Khi-kuadrat model adalah statistik suai (fit statistic), sehingga penerimaan hipotesis nol 2 akan mendukung model yang diajukan peneliti, namun ms lebih tepat disebut sebagai 2 indeks „keburukan-suai‟ (badness-of-fit) karena semakin besar nilai ms , semakin buruk
kesesuaian model dengan data.
50
2.
Akar rerata kuadrat galat aproksimasi (root mean square error of approximation; RMSEA): RMSEA =
2 ms df ms Ndf ms
(5.2)
yang secara aproksimasi berdistribusi khi-kuadrat non-sentral dengan parameter nonsentralitas . ˆms adalah estimator bagi parameter non-sentralitas : 2 ˆms = ms df ms
(5.3)
Jika data terbagi atas G subkelompok dengan nilai parameter yang berbeda antar subkelompok, maka RMSEA adalah: RMSEA =
2 ms df ms G Ndf ms
(5.2.a)
Interpretasi kasar bagi RMSEA yaitu: -
RMSEA < 0.05: Aproksimasi kesesuaian baik (close approximate fit)
-
0.05 < RMSEA < 0.08: Galat aproksimasi masih dapat diterima (reasonable error of approximation)
-
RMSEA > 0.10: Kesesuaian buruk (poor fit).
2 RMSEA juga merupakan indeks „keburukan-suai‟ seperti halnya ms .
Interpretasi terhadap interval konfidensi 90% untuk RMSEA adalah sebagai berikut: -
Jika batas bawah interval kurang daripada 0.05, maka hipotesis H 0 : RMSEA < 0.05−yang menyatakan bahwa model peneliti memiliki aproksimasi kesesuaian yang baik dalam populasi−tidak ditolak.
-
Jika batas atas interval tidak lebih daripada 0.10, maka hipotesis H 0 : RMSEA > 0.10−yang menyatakan bahwa kesesuaian model dalam populasi buruk−ditolak.
-
Jika batas bawah interval kurang daripada 0.05 dan batas atas interval lebih daripada 0.10, maka diperoleh hasil yang kontroversial, sehingga dibutuhkan ukuran sampel yang lebih besar untuk mendapatkan hasil yang lebih akurat.
3.
Akar rerata kuadrat residual terstandardisasi (standardized root mean square residual; SRMR): Akar rerata kuadrat residual (root mean square residual; RMR) adalah ukuran rerata nilai mutlak residual kovariansi. Residual kovariansi adalah selisih antara matriks kovariansi teramati dengan matriks kovariansi yang diprediksikan. RMR merupakan 51
indeks „keburukan-suai‟, RMR = 0 mengindikasikan kesesuaian model yang sempurna, selanjutnya semakin besar nilai RMR semakin buruk kesesuaiannya. Pada akar rerata kuadrat residual terstandardisasi (SRMR), residual adalah selisih antara matriks korelasi teramati dengan matriks korelasi prediksi. Nilai SRMR yang kurang daripada 0.10 umumnya dianggap cukup baik. 4.
Indeks suai komparatif (comparative fit index; CFI): Indeks suai komparatif merupakan salah satu indeks-suai inkremental (incremental fit index), yaitu ukuran untuk menilai perbaikan relatif kesesuaian model peneliti dibandingkan dengan model dasar (baseline model). Model dasar (model independen; model nol) adalah model dengan asumsi bahwa kovariansi populasi antar variabel teramati bernilai sama dengan nol. Berdasarkan asumsi ini, maka: 2 bs2 > ms
(5.4)
bs2 : khi-kuadrat rasio-likelihood model dasar vs model jenuh; bs2 = 2 log Ls log Lb 2 2 Semakin besar nilai selisih ( bs – ms ), semakin baik model peneliti dibandingkan
dengan model dasar. Rumus indeks suai komparatif yang digunakan Stata 12 adalah:
2 ms df ms CFI = 1 – 2 max bs2 dfbs , ms df ms
(5.5)
Nilai CFI yang lebih daripada 0.90 mengindikasikan model peneliti memiliki kesesuaian yang cukup baik. Walaupun demikian, CFI = 1 tidak menyatakan kesesuaian model yang 2 sempurna, melainkan hanya menunjukkan bahwa ms < df ms .
Dalam kenyataannya, pada kebanyakan bidang aplikasi SEM asumsi kovariansi nol secara ilmiah tak plausibel, sehingga model peneliti seperti apapun selalu menunjukkan kesesuaian yang lebih baik dibandingkan dengan model nol. 5.
Kriteria informasi Akaike (Akaike information criterion; AIC) dan kriteria informasi Bayes (Bayesian information criterion; BIC): Dalam kepustakaan ditemukan beberapa rumus yang berbeda untuk menghitung AIC. Rumus yang digunakan Stata 12 untuk AIC dan BIC masing-masing adalah:
2 log L ˆ + N df
AIC = 2 log L ˆ + 2 df m
(5.6)
BIC =
(5.7)
m
52
AIC dan BIC adalah indeks-suai prediktif, digunakan dalam seleksi antar model nonhirarkis yang diestimasi dari data yang sama. Model yang dipilih adalah model dengan nilai AIC dan BIC terkecil, yang relatif memiliki kesesuaian lebih baik dan parameter lebih sedikit. AIC adalah indeks-suai prediktif yang lebih baru dibandingkan dengan BIC. 6.
Indeks Tucker-Lewis (TLI): Indeks Tucker-Lewis adalah:
bs2 TLI =
2 dfbs ms df ms
bs2
(5.8)
dfbs 1
Indeks Tucker-Lewis adalah indeks-suai inkremental seperti halnya CFI, namun CFI merupakan indeks-suai inkremental yang lebih baru dibandingkan dengan TLI. 7.
Koefisien determinasi (CD) dan koefisien korelasi-ganda kuadrat Bentler-Raykov (mc2): Kedua ukuran ini merupakan ukuran kebaikan-suai pada tingkat persamaan (equationlevel goodness-of-fit). Untuk model rekursif, koefisien determinasi dan koefisien korelasi-ganda kuadrat Bentler-Raykov keduanya bernilai sama, yaitu kuadrat nilai koefisien korelasi ganda (multiple-correlation coefficient; mc) dan diinterpretasikan sebagai proporsi variansi variabel dependen yang dijelaskan oleh prediktornya: CD = mc2 = mc2
(5.9)
Pada model non-rekursif, CD dan mc2 memiliki nilai berbeda, bahkan CD dapat bernilai negatif. Untuk model non-rekursif dianjurkan untuk menggunakan mc2 = mc2 sebagai ukuran kebaikan-suai pada tingkat persamaan. Pada tabel 5.1 diperlihatkan beberapa nilai statistik suai hasil analisis SEM terhadap kedua model jalur alternatif non-hirarkis pemulihan pasca bedah jantung (gambar 4.4 pada bab 4). Nilai-nilai statistik suai ini digunakan untuk memilih yang terbaik di antara kedua model. Tampak bahwa kesesuaian menyeluruh (overall fit) model medik konvensional lebih baik daripada model psikosomatik, walaupun model psikosomatik bersifat lebih parsimoni. Selain itu, nilai AIC model medik konvensional juga lebih kecil daripada nilai AIC model psikosomatik.
53
Tabel 5.1 Beberapa nilai statistik suai untuk perbandingan model jalur alternatif non-hirarkis pemulihan pasca bedah jantung Indeks
Model Psikosomatik
Model Medik Konvensional
2 ms
40.488
3.245
df ms
5
3
0.000
0.355
0.123 (0.090-0.159)
0.013 (0.000-0.080)
AIC
6293.999
6260.756
CFI
0.907
0.999
SRMR
0.065
0.016
p RMSEA (90% CI)
Estimasi Statistik Suai SEM dengan Stata Pada contoh-contoh di bawah ini akan diperlihatkan prosedur perolehan beberapa statistik suai pada Stata.
Contoh 5.1 (Estimasi statistik-suai dan kebaikan-suai, manual Stata): File data: auto.dta (lihat kembali contoh 4.6) Model: Lihat contoh 4.6. Perintah sem: . sysuse auto . estat gof, stats (all) Fit statistic
Value
Description
chi2_ms (0)
0.000
model vs. saturated
p > chi2
.
chi2_bs (9)
248.985
p > chi2
0.000
Likelihood ratio
baseline vs. saturated
Population error RMSEA
0.000
90% CI, lower bound
0.000
upper bound
.
pclose
1.000
Root mean squared error of approximation
Probability RMSEA <= 0.05
54
Information criteria AIC
3827.641
Akaike‟s information criterion
BIC
3836.858
Bayesian information criterion
Baseline comparison CFI
1.000
Comparative fit index
TLI
1.036
Tucker-Lewis index
SRMR
0.000
Standardized root mean squared residuals
CD
0.691
Coefficient of determination
Size of residuals
. estat eqgof Equation-level goodness of fit Variance depvars
fitted
predicted
residuals
R-squared
mc
mc2
33.01972
22.8264
10.19332
.691296
.8314421
.691296
observed mpg overall mc
.691296
= correlation between depvar and its prediction
mc2 = mc^2 is the Bentler-Raykov squared multiple correlation coefficient
Perintah “estat” (postestimation statistics) mencakup beberapa perintah Stata untuk melakukan sejumlah perhitungan tertentu setelah melakukan proses estimasi. Perintah “estat gof” adalah perintah Stata untuk melakukan uji kebaikan-suai (goodness-of-fit). Dengan perintah “estat gof” akan disajikan hasil uji rasio likelihood. Opsi “, stats(all)” menambahkan tampilan dengan nilai RMSEA berikut interval konfidensi 90% dan nilai p-nya, kriteria informasi Akaike dan Bayes (AIC dan BIC), kedua indeks-suai komparatif (CFI) dan indeks Tucker-Lewis (TLI), serta SRMR dan CD (koefisien determinasi). Perintah “estat eqgof” (equation level goodness-of-fit statistics) adalah perintah Stata untuk membandingkan nilai-nilai variansi yang diprediksi oleh model peneliti dengan variansi sesungguhnya, serta memperoleh proporsi variabel endogen yang dijelaskan oleh prediktornya. Pada perintah “estat eqgof” akan dinyatakan nilai-nilai variansi sesungguhnya, variansi prediksi, dan residualnya. Selanjutnya ditampilkan pula nilai-nilai koefisien determinasi (R-squared), koefisien korelasi (mc), dan koefisien korelasi ganda kuadrat 55
Bentler-Raykov (mc2), yang nilainya digunakan sebagai pengganti R-squared pada model jalur non-rekursif.
Contoh 5.2 (Model jenuh dan model dasar): Lihat kembali model Illness pada gambar 4.1. Pada model jalur ini terdapat 4 variabel teramati, Exercise, Hardiness, Fitness, Stress, dan Illness, dua di antaranya merupakan variabel endogen yaitu Exercise dan Hardiness. Dengan model peneliti pada gambar 4.2, diperoleh hasil analisis sem sebagai berikut: . use "D:\SEM\Data\illness.dta", clear . sem (fit <− exe) (stress <− hard) (ill <− fit stress) Endogenous variables Observed: fit stress ill Exogenous variables Observed: exe hard Fitting target model: Iteration 0: Iteration 1:
log likelihood = −10237.61 log likelihood = −10237.61
Structural equation model Estimation method = ml Log likelihood = −10237.61
Number of obs
=
384
Coef.
OIM Std. Err.
z
P>|z|
exe
.2158195
.0260036
8.30
0.000
.1648535
.2667856
hard
−.4055263
.0875636
−4.63
0.000
−.5771478
−.2339049
fit
−.4244997
.0792709
−5.36
0.009
−.5798678
−.2691316
stress
.2867521
.0435398
6.59
0.000
.2014156
.3720887
e.fit
1145.27
82.65273
994.2089
1319.283
e.stress
4240.46
306.0289
3681.144
4884.759
e.ill
3204.201
231.2433
2781.567
3691.05
[95% Conf. Interval]
Structural fit <− stress <− ill <−
Variance
LR test of model vs. saturated: chi2(5)
=
11.44,
56
Prob > chi2 = 0.0434
. estat gof Fit statistic
Value
Description
Likelihood ratio chi2_ms (5)
11.435
p > chi2
0.043
chi2_bs (9)
170.492
p > chi2
0.000
model vs. saturated
baseline vs. saturated
Pada kolom Description tampak adanya istilah “model” (model peneliti), „saturated” (model jenuh), dan “baseline” (model dasar). Jumlah parameter pada model peneliti adalah 10, terdiri atas 4 efek langsung, 5 variansi, dan 1 kovariansi. Dengan 5 variabel teramati, jumlah titik data adalah (5)(6)/2 = 15, sehingga derajat bebas model peneliti di atas adalah 15 – 10 = 5 (lebih-teridentifikasi). Log likelihhood model peneliti adalah −10237.61. Model jenuh adalah model mereproduksikan secara sempurna seluruh nilai variansi dan kovariansi. Perintah untuk menghasilkan model jenuh pada Stata adalah sebagai berikut: . sem (<− exe hard fit stress ill) Exogenous variables Observed: exe hard fit stress ill Fitting target model: log likelihood = −10231.893 log likelihood = −10231.893
Iteration 0: Iteration 1:
Structural equation model Estimation method = ml Log likelihood = −10231.893
Number of obs
=
384
Coef.
OIM Std. Err.
exe
4410.734
318.3173
3828.959
5080.904
hard
1440.24
103.9403
1250.272
1659.071
fit
1350.713
97.47934
1172.554
1555.942
stress
4477.31
323.122
3886.753
5157.596
ill
3893.584
280.9952
3380.021
4485.179
hard
−75.61258
128.6775
−0.59
0.557
−327.8158
176.5906
fit
951.9226
133.6954
7.12
0.000
689.8844
1213.961
stress
−222.1949
227.06
−0.98
0.328
−667.2242
222.8345
ill
−331.528
212.1534
−1.56
0.118
−747.3409
84.28496
Standardized
z
P>|z|
[95% Conf. Interval]
Variance
Covariance exe
57
Covariance hard fit
97.63308
71.35013
1.37
0.171
−42.2106
237.4768
stress
−584.0551
132.9701
−4.39
0.000
−844.6716
−323.4385
ill
−378.8891
122.3814
−3.10
0.002
−618.7523
−139.0259
stress
−319.6933
126.5504
−2.53
0.012
−567.7276
−71.65897
ill
−665.0501
121.85
−5.46
0.000
−903.8717
−426.2286
ill
1419.588
225.0464
6.31
0.000
978.5051
1860.671
Covariance fit
Covariance stress
LR test of model vs. saturated: chi2(0)
=
0.00,
Prob > chi2 =
.
Pada model jenuh, dengan 5 variabel teramati jumlah titik data tetap 15. Jumlah parameter juga 15, terdiri atas 5 variansi dan 10 kovariansi, sehingga derajat bebas pada model jenuh selalu sama dengan nol (tepat teridentifikasi). Model jenuh ini akan mereproduksi seluruh nilai-nilai variansi dan kovariansi secara sempurna, dalam arti kata matriks kovariansi yang dihasilkan model jenuh akan tepat sama dengan matriks kovariansi data sampel. Log likelihood model jenuh adalah −10231.893. Untuk menguji seberapa baik model peneliti dibandingkan dengan model jenuh, ukurannya adalah minus dua kali selisih log likehood kedua model; −2*(−10237.61 − −10231.893) = 11.435 yang berdistribusi khi-kuadrat dengan derajat bebas 5 – 0 = 5 (p = 0.043). Model dasar (baseline model) pada Stata adalah model yang mencakup variansi seluruh variabel teramati beserta kovariansi antar variabel eksogen teramati (menurut model peneliti). Perhatikan bahwa dalam versi Stata ini model dasar tidak sama dengan model nol. Dalam model peneliti, variabel eksogen adalah Exercise dan Hardiness, sehingga kovariansi pada model dasar hanya kovariansi antara kedua variabel ini. Dengan analisis sem diperoleh: . sem (<− exe hard fit stress ill), covstr (exe fit stress ill, diagonal) covstr (hard fit stress ill, diagonal) Exogenous variables Observed: exe hard fit stress ill
58
Fitting target model: log likelihood = −10317.139 log likelihood = −10317.139
Iteration 0: Iteration 1:
Structural equation model Estimation method = ml Log likelihood = −10317.139 ( 1) ( 2) ( 3) ( 4) ( 5) ( 6) ( 7) ( 8) ( 9)
Number of obs
=
384
[cov(exe,fit)]_cons = 0 [cov(exe,stress)]_cons = 0 [cov(exe,ill)]_cons = 0 [cov(hard,fit)]_cons = 0 [cov(hard,stress)]_cons = 0 [cov(hard,ill)]_cons = 0 [cov(fit,stress)]_cons = 0 [cov(fit,ill)]_cons = 0 [cov(stress,ill)]_cons = 0
Coef.
OIM Std. Err.
exe
4410.734
318.3173
3828.959
5080.904
hard
1440.24
103.9403
1250.272
1659.071
fit
1350.713
97.47934
1172.554
1555.942
stress
4477.31
323.122
3886.753
5157.596
ill
3893.584
280.9952
3380.021
4485.179
hard
−75.61258
128.6775
−327.8158
176.5906
fit
0
(constrained)
stress
0
(constrained)
ill
0
(constrained)
fit
0
(constrained)
stress
0
(constrained)
ill
0
(constrained)
stress
0
(constrained)
ill
0
(constrained)
ill
0
(constrained)
Standardized
z
P>|z|
[95% Conf. Interval]
Variance
Covariance exe −0.59
Covariance hard
Covariance fit
Covariance stress
59
0.557
LR test of model vs. saturated: chi2(9)
=
170.49,
Prob > chi2 = 0.0000
Pada model dasar, jumlah titik data adalah 15, sedangkan jumlah parameter 6, yaitu lima variansi dan satu kovariansi. Derajat bebas model adalah 15 – 6 = 9. Log likelihood model dasar adalah −10317.139. Untuk menguji seberapa baik model dasar dibandingkan dengan model jenuh, dihitung minus dua kali selisih log likelihood kedua model, yaitu −2*(−10317.139 − −10231.893) = 170.492 yang berdistribusi khi-kuadrat dengan derajat bebas 9 – 0 = 9 (p < 0.001). Walaupun model peneliti tidak sesuai sepenuhnya dengan model jenuh ( 2 = 11.435; p = 0.043), kesesuaiannya ini masih jauh lebih baik daripada kesesuaian model dasar dengan model jenuh ( 2 = 170.492; p < 0.001).
Contoh 5.3 (Estimasi statistik-suai dan kebaikan-suai, manual Stata): File data: auto.dta (lihat kembali contoh 4.7) Model: Lihat model pada contoh 4.7 Perintah sem: . estat gof, stats (all)
Fit statistic
Value
Description
Likelihood ratio chi2_ms (3)
38.864
p > chi2
0.000
chi2_bs (9)
264.817
p > chi2
0.000
model vs. saturated
baseline vs. saturated
Population error RMSEA
0.402
90% CI, lower bound
0.295
upper bound
0.519
pclose
0.000
Root mean squared error of approximation
Probability RMSEA <= 0.05
Information criteria AIC
4286.391
Akaike‟s information criterion
BIC
4309.432
Bayesian information criterion
Baseline comparison
60
CFI
0.860
Comparative fit index
TLI
0.579
Tucker-Lewis index
SRMR
0.046
Standardized root mean squared residuals
CD
0.932
Coefficient of determination
Size of residuals
. estat eqgof Equation-level goodness of fit Variance depvars
fitted
predicted
residuals
R-squared
mc
mc2
7478595 581472.1
2746103 521219
4732491 60253.09
.3671951 .8963784
.6059663 .9467726
.3671951 .8963784
observed price weight overall mc
.931919
= correlation between depvar and its prediction
mc2 = mc^2 is the Bentler-Raykov squared multiple correlation coefficient
Model Ekivalen pada Analisis Jalur Di bagian awal bab ini telah disinggung mengenai model ekivalen, yang harus dipertimbangkan oleh peneliti setelah peneliti membuktikan bahwa model yang diajukannya memiliki kesesuaian yang cukup dengan data sampel. Model ekivalen adalah model yang dibangun sebagai hasil perombakan terhadap model peneliti, memiliki matriks korelasi atau kovariansi prediksi yang tepat sama dengan model peneliti, namun dengan konfigurasi jalur berbeda antar variabel yang sama. Model ekivalen dapat diperoleh berdasarkan aturan pergantian Lee-Hershberger melalui saling substitusi antara Y1 → Y2, Y2 → Y1, D1
D2, atau efek resiprokal terkendali-sama (equality-constrained resiprocal effect) Y1 Y2 (Hersberger, 1994). Pada efek resiprokal terkendali-sama Y1
Y2 terkendali sama besarnya dengan efek Y2 → Y1.
61
Y2, besar efek Y1 →
Gambar 5.1 Contoh empat model jalur ekivalen (Romney et al, 1992)
Perhatikan bahwa substitusi dengan efek resiprokal akan membuat suatu model rekursif menjadi non-rekursif, sehingga substitusi ini hanya boleh dilakukan jika model baru yang dihasilkan oleh substitusi tetap teridentifikasi. Substitusi juga tidak boleh mengakibatkan dihasilkannya suatu model baru yang non-plausibel. Model jalur sederhana mungkin hanya memiliki beberapa versi ekivalen, namun model yang kompleks mungkin memiliki ratusan atau bahkan ribuan versi ekivalennya. Walaupun demikian, yang perlu dipertimbangkan oleh peneliti hanyalah beberapa versi ekivalen yang secara substantif dinilai bermakna. Contoh suatu model original dengan tiga versi ekivalennya yang dibentuk menurut aturan pergantian Lee-Hersberger tanpa disertai suku pengganggunya diperlihatkan pada gambar 5.1 (Romney et al, 1992).
62
BAB 6 PEMODELAN SEM DALAM MODE GRAFIK PADA STATA Graphical User Interface pada Stata Pemodelan SEM yang dilakukan pada Stata dalam pembahasan terdahulu dilakukan dalam mode interaktif. Selain dalam mode interaktif, pemodelan SEM pada Stata dapat pula dilakukan dalam mode grafik seperti halnya pada AMOS. Pemodelan SEM dalam mode grafik pada Stata dimulai dengan membuka jendela SEM Builder dengan mengklik perintah pada menu: Statistics > SEM (structural equation modeling) > Model building and estimation, maka akan diperoleh jendela (kanvas) sebagai berikut:
Gambar 6.1. Jendela SEM Builder Selain Standard Toolbar seperti yang didapatkan pada semua program berbasis Windows, di atas kanvas dan di bawah Standard Toolbar terdapat Contextual Toolbar, sedangkan di sisi kiri kanvas terdapat Tools Toolbar (lihat gambar 6.2). 63
Tools Toolbar akan langsung muncul pada saat kanvas SEM Builder terbuka, sedangkan Contextual Toolbar baru tampak Tools Toolbar mulai digunakan dalam pemodelan.
Gambar 6.2. Contextual Toolbar (atas) dan Tools Toolbar (kiri)
Pada Tools Toolbar terdapat beberapa lambang, beberapa di antaranya yang digunakan dalam analisis jalur SEM yaitu: : Observed
Variable
teramati (Lambang
Tool, digunakan untuk melambangkan variabel
yang digunakan untuk variabel laten tidak digunakan pada
analisis jalur). : Path Tool, digunakan untuk menyatakan jalur (efek langsung) : Covariance Tool, digunakan untuk menyatakan kovariansi (asosiasi takteramati) : Regression Component Tool, digunakan untuk menyatakan himpunan variabel teramati yang terdiri atas 1 variabel dependen dan sekumpulan variabel independen yang masing-masing hanya memiliki efek langsung ke variabel dependen : Select
Tool, digunakan untuk menghentikan (deselect) efek klik kiri
sebelumnya terhadap salah satu Tool pada Tools Toolbar ataupun memilih (men-select) area yang diinginkan pada kanvas. Selanjutnya dengan Edit > 64
Undo dapat dihapus/dibatalkan perintah terakhir yang pernah diberikan terhadap area tersebut. : Text Tool, digunakan untuk menuliskan label/teks lainnya pada kanvas.
: Merupakan Tool untuk memiliki salah satu di antara daftar nama variabel teramati untuk ditempatkan dalam lambang ,
, dan
.
lain : Merupakan Tools yang digunakan untuk menspesifikasikan fiksasi
nilai atau kendala bagi μ, σ2, ataupun parameter lainnya. : Merupakan Tools untuk memutar arah lambang suku pengganggu.
Analisis SEM dengan Mode Grafik Berikut akan diperlihatkan kembali contoh analisis jalur dengan SEM yang sebelumnya dalam bab terdahulu telah dikerjakan dengan mode interaktif, namun sekarang akan dikerjakan dengan mode grafik.
Contoh 6.1 (Model jalur auto): Lihat kembali contoh 4.6. Buka file auto.dta
dan generate variabel
weight2=weight^2, lalu buka kanvas SEM Builder dengan mengklik Statistics > SEM (Structural Equation Modeling) pada menu Standard Toolbar. Langkah-langkah selanjutnya adalah: 1.
Klik lambang
pada Tools Toolbar, klik kiri pada kanvas untuk meletakkan
lambang empat persegi panjang tersebut pada tempat yang dikehendaki dalam kanvas. Klik
pada Contextual Toolbar dan pilih nama variabel
weight, yang akan muncul dalam lambang 2.
.
Ulangi langkah 1 untuk variabel weight2, foreign, dan mpg dengan mengacu kepada model dalam contoh 4.6.
3.
Klik lambang
(Path Tool), gambarkan efek langsung tersebut dari variabel
weight menuju ke mpg. Penggambaran jalur ini menetapkan status weight sebagai variabel eksogen dan mpg sebagai variabel endogen, sehingga secara otomatis akan untuk variabel endogen mpg.
memunculkan suku pengganggu (error) 4.
Ulangi langkah 3 untuk penggambaran efek langsung weight2 dan foreign ke mpg. 65
5.
Penggambaran model dengan 1 variabel dependen tanpa adanya efek tak-langsung seperti pada model jalur auto di atas (model regresi ganda) dapat juga dilakukan sekaligus dengan mengklik lambang
. Dengan mengklik lambang
akan muncul
menu untuk mengisi nama-nama variabel dependen dan independen dalam model. Setelah menu selesai diisi, klik OK untuk kembali ke kanvas SEM Builder. 6.
Jika penggambaran model telah selesai, klik lambang estimate
pada
Contextual Toolbar atau Estimation pada Standard Toolbar. 7.
Hasil estimasi dalam bentuk tak terstandardisasi yang dapat dilihat langsung pada kanvas adalah (gambar 6.3):
Gambar 6.3 Model jalur auto pada kanvas SEM Builder -
Rerata dan variansi masing-masing variabel eksogen (independen), tercantum dalam masing-masing lambang
-
untuk variabel eksogen tersebut.
weight: rerata 3.0e+03 dan variansi 6.0e+05
weight2: rerata 9.7e+06 dan variansi 2.3e+13
foreign: rerata .3 dan variansi .21
Efek langsung tak terstandardisasi masing-masing variabel eksogen terhadap variabel endogen, tercantum di atas masing-masing lambang jalur
efek weight → mpg -1.7e-02
efek weight2 → mpg 1.6e-06
efek foreign → mpg -2.2
66
.
-
Intersep untuk model regresi ganda, tercantum dalam lambang
untuk variabel
endogen (dependen). -
intersep model regresi ganda 57
Variansi suku pengganggu untuk variabel endogen, tercantum di samping lambang suku pengganggu
8.
Untuk
.
Variansi ε1 10 mengganti
hasil
dalam
bentuk
tak-terstandardisasi
menjadi
bentuk
terstandardisasi, klik View > Standardized Estimates pada Standard Toolbar. 9.
Hasil dalam bentuk penyajian yang lebih rinci dapat dilihat pada jendela Result pada Stata.
67
BAB 7 MODEL STRUKTURAL NON-REKURSIF Tipe Model Struktural Non-Rekursif Dua tipe model struktural non-rekursif yang lazim ditemukan ialah model dengan lingkar umpan-balik dan model dengan semua kemungkinan korelasi pengganggu. Pada model dengan lingkar umpan-balik (feedback loop) selalu didapatkan lingkar umpan-balik, baik berupa lingkar umpan-balik langsung (direct feedback loop) seperti Y1
Y2 , maupun
lingkar umpan-balik tak-langsung (indirect feedback loop), misalnya Y1 → Y2 → Y3 → Y1 . Model dengan semua kemungkinan korelasi pengganggu (all possible disturbance correlations) adalah model dengan semua korelasi yang mungkin antar suku pengganggu. Pada sebuah model struktural non-rekursif, lingkar umpan-balik mungkin didapatkan bersama-sama dengan semua kemungkinan korelasi pengganggu. Dalam contoh pada gambar 7.1, didapatkan baik lingkar umpan-balik tak-langsung Y1 → Y2 → Y3 → Y1 , maupun semua kemungkinan korelasi pengganggu, Corr ( D1 ; D2 ), Corr ( D2 ; D3 ), serta Corr ( D1 ; D3 ).
Gambar 7.1 Contoh model non-rekursif dengan lingkar umpan-balik dan semua kemungkinan korelasi pengganggu
Identifikasi pada Model Non-Rekursif Model rekursif akan selalu teridentifikasi, jika jumlah titik data lebih besar daripada jumlah parameter bebas dan seluruh variabel laten sekurang-kurangnya berskala interval.
68
Sebaliknya, model non-rekursif mungkin tak teridentifikasi walaupun jumlah observasi lebih besar daripada jumlah parameter bebas dan seluruh variabel laten berskala interval. Persyaratan identifikasi pada model struktural non-rekursif dibedakan menjadi syarat perlu (necessary condition) dan syarat cukup (sufficient condition). Syarat perlu pada model non-rekursif dinamakan kondisi order (order condition) dan syarat cukup dinamakan kondisi rank (rank condition).
Kondisi Order Kondisi order terpenuhi, jika untuk setiap variabel endogen, jumlah variabel eksklusinya sama dengan atau lebih besar daripada jumlah seluruh variabel endogen dikurangi satu: nexc > nend − 1
(7.1)
nexc : jumlah variabel eksklusi suatu variabel endogen tertentu nend : jumlah seluruh variabel endogen
Variabel eksklusi (excluded variable) suatu variabel endogen adalah variabel dalam model yang tidak memiliki efek langsung (direct effect) terhadap variabel endogen tersebut (bukan merupakan prediktornya). Kondisi order (order condition) merupakan syarat perlu (necessary condition) bagi identifikasi suatu model, namun bukan merupakan syarat cukup (sufficient condition).
Contoh 7.1 (Kondisi order): Lihat contoh model non-rekursif pada gambar 7.1. Pada model tersebut jumlah variabel endogen nend = 3, yaitu Y1 , Y2 , dan Y3 ; sehingga nend − 1 = 2. Selanjutnya diperoleh: -
Untuk variabel endogen Y1 terdapat nexc = 3 variabel eksklusi, yaitu X 2 , X 3 , dan Y2 , sehingga nexc > 2.
-
Untuk variabel endogen Y2 terdapat nexc = 3 variabel eksklusi, yaitu X 1 , X 3 , dan Y3 , sehingga nexc > 2.
-
Untuk variabel endogen Y3 terdapat nexc = 3 variabel eksklusi, yaitu X 1 , X 2 , dan Y1 , sehingga nexc > 2. Dengan demikian maka untuk seluruh variabel endogen dipenuhi syarat nexc > nend − 1,
sehingga kondisi order untuk model ini terpenuhi. 69
Kondisi Rank Kondisi rank terpenuhi untuk suatu variabel endogen, jika rank matriks reduksinya sama dengan atau lebih besar daripada jumlah seluruh variabel endogen dikurangi satu: rk > nend − 1 rk
(7.2)
: rank matriks reduksi variabel endogen ke-k Model dinyatakan teridentifikasi jika kondisi rank terpenuhi untuk seluruh variabel
endogen dalam model.
Prosedur penentuan rank matriks reduksi variabel endogen: 1.
Buat matriks sistem, yaitu matriks yang menyajikan variabel endogen sebagai variabel baris dan prediktor (termasuk variabel endogen) sebagai variabel kolom. Nilai “1” menyatakan adanya efek langsung prediktor terhadap variabel endogen, sedangkan entri lain seluruhnya diberi nilai “0”. Nilai “1” juga diberikan untuk entri suatu variabel endogen terhadap variabel endogen itu sendiri.
2.
Untuk variabel endogen pertama pada baris teratas, coret semua entri pada baris pertama serta entri pada kolom setiap nilai “1”.
3.
4.
Pada matriks sisanya, hapus baris yang: -
seluruh entrinya bernilai “0”
-
tepat sama dengan salah satu baris lainnya
-
sama dengan hasil penjumlahan dua baris lainnya
Matriks tersisa adalah matriks reduksi untuk variabel endogen pertama. Rank matriks sistem sama dengan jumlah baris tersisa pada matriks reduksi.
5.
Ulangi prosedur untuk variabel kedua, ketiga, dan seterusnya.
Contoh 7.2 (Kondisi rank): Lihat contoh kembali model non-rekursif pada gambar 7.1. Pada contoh ini hanya akan diperlihatkan penentuan rank matriks reduksi untuk variabel endogen Y1 dengan langkahlangkah berikut:
70
1.
Matriks sistem adalah: Y1 Y2 Y3
2.
X2 0
X3 0
Y1 1
Y2 0
Y3 1
0 0
1 0
0 1
1 0
1 1
0 1
Coret semua entri pada baris pertama serta entri pada kolom setiap nilai “1”. Y1 Y2 Y3
3.
X1 1
X1 1
X2 0
X3 0
Y1 1
Y2 0
Y3 1
0 0
1 0
0 1
1 0
1 1
0 1
Pada matriks sisanya, tidak ada baris yang perlu dihapus: Y2
X2 1
X3 0
Y2 1
Y3
0
1
1
Matriks pada No. 3 di atas yang merupakan matriks reduksi bagi variabel endogen Y1 memiliki dua baris, sehingga rank-nya adalah rk = 2. Karena nend − 1 = 2, maka persyaratan rk > nend − 1 terpenuhi bagi variabel endogen Y1 . Selanjutnya prosedur yang sama masih
harus diulangi untuk variabel endogen Y2 dan Y3 .
Efek Tak-langsung pada Model Non-Rekursif Misalkan dimiliki model rekursif dengan lingkar umpan-balik langsung Y1 Misalkan pula efek terstandardisasi Y1 terhadap Y2
adalah
Y2 .
p12 = 0.40 dan efek
terstandardisasi Y2 terhadap Y1 adalah p21 = 0.20. Maka lingkar umpan-balik Y1
Y2 maka
menghasilkan efek tak-langsung Y1 → Y2 → Y1 , Y1 → Y2 → Y1 → Y2 → Y1 , Y1 → Y2 → Y1 → Y2 → Y1 → Y2 → Y1 , dan seterusnya yang akan merupakan siklus berulang tak berhingga secara teoretis. Besar efeknya adalah p12 . p21 + p12 . p21 . p12 . p21 + p12 . p21 . p12 . p21 . p12 . p21 + . . . ,
dan seterusnya, yang nilainya adalah (0.40)(0.20) + (0.40)(0.20)(0.40)(0.20) +
(0.40)(0.20) (0.40)(0.20)(0.40)(0.20) + . . . dengan kelanjutan yang dengan cepat akan mendekati nol, sehingga diasumsikan mencapai keseimbangan.
71
Korelasi Ganda Kuadrat Pada model rekursif, koefisien determinasi dan koefisien korelasi-ganda kuadrat Bentler-Raykov memiliki nilai yang sama dan keduanya dapat dipakai sebagai ukuran proporsi variansi variabel dependen yang dijelaskan oleh prediktornya. Sebaliknya, pada model non-rekursif keduanya memiliki nilai yang berbeda, sebagai ukuran proporsi variansi variabel dependen yang dijelaskan oleh prediktornya dianjurkan hanya menggunakan koefisien korelasi-ganda kuadrat Bentler-Raykov.
Contoh 7.3: Misalkan dimiliki data longitudinal karakteristik 84 orang ibu di masa muda mereka, yaitu agression, withdrawal, education, dan maternal age, serta karakteristik anak mereka 10-15 tahun sesudahnya, yaitu internalization dan externalization (Cooperman, 1996). Data diberikan dalam matriks korelasi beserta standar deviasi untuk tiap variabel (tabel 7.1). Model jalur non-rekursif untuk data ini diperlihatkan pada gambar 7.2.
Tabel 7.1 Data korelasi model jalur non-rekursif hubungan transgenerasi pada permasalahan penyesuaian diri Variabel Karakteristik ibu 1. aggression 2. withdrawal 3. education 4. maternal age Karakteristik anak 5. internalization 6. externalization SD
1
2
3
4
1.00 .19 −.16 −.37
1.00 −.20 −.06
1.00 .36
1.00
−.06 .13 1.09
−.05 −.06 1.03
−.03 −.09 2.17
−.25 −.28 2.33
5
6
1.00 .41 .28
1.00 .36
Sumber: Cooperman (1996); N = 84
Dengan adanya 6 variabel (4 karakteristik ibu dan 2 karakteristik anak), didapatkan jumlah titik data p = (6)(7)/2 = 21. Jumlah parameter bebas yang diestimasi q = 19, terdiri atas 2 variansi variabel eksogen, 4 variansi suku pengganggu, 3 kovariansi antar variabel eksogen dan antar suku pengganggu, serta 10 efek langsung. Derajat bebas model adalah df M = 21 – 19 = 2. Walaupun derajat bebas model df M > 0, untuk model non-rekursif masih harus diperiksa kondisi order dan rank yang ternyata terpenuhi, sehingga model ini dapat dinyatakan teridentifikasi (atau tepatnya, lebih-teridentifikasi).
72
Gambar 7.2 Model jalur non-rekursif hubungan transgenerasi pada permasalahan penyesuaian diri Hasil analisis SEM dengan program komputer diperlihatkan pada tabel 7.2. Interpretasinya antara lain yaitu, wanita yang sifat agresinya (aggression) satu SD di atas rerata cenderung melahirkan anak pertama pada usia (age) kurang-lebih sepertiga SD (−.380) di bawah rerata. Ibu yang melahirkan anak pertama pada usia (age) satu SD di atas rerata diasosiasikan memiliki tingkat pendidikan (education) kurang-lebih sepertiga SD (.340) di atas rerata. Tingkat pendidikan (education) juga dipengaruhi oleh sifat menutup diri (withdrawal), wanita yang nilai withdrawal-nya satu SD di atas rerata memiliki tingkat education kurang-lebih dua persepuluh (−.180) di bawah rerata. Kemaknaan statistik di sini tidak terlalu diperhatikan karena kekuatan analisis statistik (statistical power) yang dapat diperkirakan rendah dengan ukuran sampel yang kecil (N = 84).
Tabel 7.2 Estimasi parameter model jalur non-rekursif hubungan transgenerasi pada permasalahan penyesuaian diri a. Efek langsung
Parameter
bij
SE bij
pij
aggr → age educ → age with → educ age → educ aggr → ext educ → ext age → ext with → int educ → int age → int
−.812** −.065 –.378 .317 .032 .003 –.039* –.005 .008 −.033*
.304 .648 .215 .256 .035 .019 .018 .027 .015 .014
−.380 −.061 −.180 .340 .097 .015 −.248 −.018 .065 −.275
73
b. Variansi dan kovariansi pengganggu Parameter Dage
Var (D)
SE (D)
Var (Z)
4.904*
2.480
.457
Deduc
3.949**
.613
.839
.304
2.874
.069
Dext
.120**
.019
.923
Dint
.073**
.011
.936
.035**
.011
.379
Deduc
Dage
Dext
Dint
*: p < .05; **: p < .01
Analisis Model Non-Rekursif dengan Stata Seperti telah dijelaskan di atas, analisis model non-rekursif pada SEM hanya boleh dilakukan setelah kondisi order dan rank terpenuhi, serta model teridentifikasi.
Contoh 7.4 (Model struktural non-rekursif, manual Stata): File data: sem_sm1.dta Variabel: variable name r_intel r_parasp r_ses r_occasp r_educasp f_intel f_parasp f_ses f_occasp f_educasp
variable label respondent's intelligence respondent's parental aspiration respondent's family socioeconomic status respondent's occupational aspiration respondent's educational aspiration friend's intelligence friend's parental aspiration friend's family socioeconomic status friend's occupational aspiration friend's educational aspiration
The data contain 329 boys with information on five variables and the same information for each boy’s best friend.
Model:
74
Persamaan: f_occasp = α1 + β11r_ses + β12f_ses + β13f_intel + β14r_occasp + ε1 r_occasp = α2 + β21r_intel + β22r_ses + β23f_ses + β24f_occasp + ε2
Perintah sem: . use http://www.stata-press.com/data/r12/sem_sm1 . sem (r_occasp <− f_occasp r_intel r_ses f_ses) >
(f_occasp <− r_occasp f_intel f_ses r_ses),
>
cov (e.r_occasp*e.f_occasp) standardized
Endogenous variables Observed: r_occasp f_occasp Exogenous variables Observed: r_intel r_ses f_ses f_intel Fitting target model: log likelihood = −2617.0489 log likelihood = −2617.0489
Iteration 0: Iteration 1:
Structural equation model Estimation method = ml Log likelihood = −2617.0489
Number of obs
=
329
Coef.
OIM Std. Err.
z
P>|z|
f_occasp
.2773441
.1281904
2.16
0.031
.0260956
.5285926
r_intel
.2854766
.05
5.71
0.000
.1874783
.3834748
r_ses
.1570082
.0520841
3.01
0.003
.0549252
.2590912
f_ses
.0973327
.060153
1.62
0.106
−.020565
.2152304
r_occasp
.2118102
.156297
1.36
0.175
−.0945264
.5181467
r_ses
.0794194
.0587732
1.35
0.177
−.0357739
.1946127
f_ses
.1681772
.0537199
3.13
0.002
.062888
.2734663
f_intel
.3693682
.0525924
7.02
0.000
.2662891
.4724474
Variance e.r_occasp
.6889244
.0399973
.6148268
.7719519
e.f_occasp
.6378539
.039965
.5641425
.7211964
−.2325666
.2180087
−.6598558
.1947227
Standardized
[95% Conf. Interval]
Structural r_occ~p <−
Structural f_occ~p <−
Covariance e.r_occasp e.f_occasp
LR test of model vs. saturated: chi2(1)
=
−1.07 0.00,
75
0.286
Prob > chi2 =
.
Contoh 7.5 (Estimasi statistik-suai dan kebaikan-suai, manual Stata): File data: sem_sm1.dta (lihat kembali contoh 7.4) Model: Lihat model pada contoh 7.4 Perintah sem: . estat gof, stats (all) Fit statistic
Value
Description
Likelihood ratio chi2_ms (3) p > chi2 chi2_bs (9) p > chi2
38.864 0.000 264.817 0.000
Population error RMSEA 90% CI, lower bound upper bound pclose
0.402 0.295 0.519 0.000
Information criteria AIC BIC
4286.391 4309.432
Baseline comparison CFI TLI
0.860 0.579
Comparative fit index Tucker-Lewis index
Size of residuals SRMR CD
0.046 0.932
Standardized root mean squared residuals Coefficient of determination
model vs. saturated baseline vs. saturated
Root mean squared error of approximation
Probability RMSEA <= 0.05 Akaike’s information criterion Bayesian information criterion
. estat eqgof Equation-level goodness of fit
depvars
fitted
Variance predicted
residuals
R-squared
mc
mc2
observed price
7478595
2746103
4732491
.3671951
.6059663
.3671951
weight
581472.1
521219
60253.09
.8963784
.9467726
.8963784
overall
.931919
mc = correlation between depvar and its prediction mc2 = mc^2 is the Bentler-Raykov squared multiple correlation coefficient
76
Contoh 7.6 (Input data korelasi): Perintah sem: . clear all . ssd init aggression withdrawal education age internal external Summary statistics data initialized. Next use, in any order, ssd set observations (required) It is best to do this first. ssd set means (optional) Default setting is 0. ssd set variances or ssd set sd (optional) Use this only if you have set or will set correlations and, even then, this is optional but highly recommended. Default setting is 1. ssd set covariances or ssd set correlations (required)
. ssd set observations 84 (value set) Status: observations:
set
means: unset variances or sd: unset covariances or correlations: unset (required to be set)
. ssd set means .51 .47 10.87 20.57 .08 .15 (values set) Status: observations: means:
set set
variances or sd: unset covariances or correlations: unset (required to be set)
. ssd set sd 1.09 1.03 2.17 2.33 .28 .36 (values set) Status: observations: means:
set set
variances or sd: set covariances or correlations: unset (required to be set)
. ssd set correlations 1.00 \ .19 1.00 \ -.16 -.20 1.00 \ -.37 -.06 .36 1.00 \ -.06 -.05 -.03 -.25 1.00 \ .13 .06 -.09 -.28 .41 1.00 (values set)
77
Status: observations: means:
set set
variances or sd: set covariances or correlations:
set
. label variable aggression "maternal aggression" . label variable withdrawal "maternal withdrawal" . label variable education "maternal education" . label variable age "maternal age" . label variable internal "child internalization" . label variable external "child externalization" . save "D:\SEM\Data\transgenerational_relation.dta" file D:\SEM\Data\transgenerational_relation.dta saved
Contoh 7.7: Pada contoh ini diperlihatkan hasil estimasi parameter untuk data pada contoh 7.6. Perintah sem: . clear all . use "D:\SEM\Data\transgenerational_relation.dta" . sem (age <− aggression education) (education <− withdrawal age) (external <− aggression age education) (internal <− withdrawal age education), cov(aggression*withdrawal e.age*e.education e.external*e.internal) Endogenous variables Observed: age education external internal Exogenous variables Observed: aggression withdrawal Fitting target model: Iteration 0: Iteration 1: Iteration 2: Iteration 3:
log likelihood = -637.52633 log likelihood = -637.2952 log likelihood = -637.29471 log likelihood = -637.29471
Structural equation model
Number of obs
Estimation method = ml Log likelihood
= -637.29471
78
=
84
Coef.
OIM Std. Err.
z
P>|z|
Structural age <− education aggression _cons
−.065209 −.8116886 21.69278
.6445339 .3021317 7.115742
−0.10 −2.69 3.05
0.919 0.007 0.002
−1.328472 −1.403856 7.746185
1.198054 −.2195214 35.63938
education <− age withdrawal _cons
.3168497 −.3783538 4.530227
.2547603 .2133176 5.262017
1.24 −1.77 0.86
0.214 0.076 0.389
−.1824713 −.7964486 −5.783138
.8161708 .039741 14.84359
−.0386485 .002547 .0315864 .9012039
.0183447 .0186604 .035112 .3729462
−2.11 0.14 0.90 2.42
0.035 0.891 0.368 0.016
−.0746035 −.0340266 −.0372318 .1702429
−.0026935 .0391206 .1004046 1.632165
age education aggression _cons
−.0329934 .008388 −.0052084 .6699444
.0135667 .0148052 .0272522 .2710048
−2.43 0.57 −0.19 2.47
0.015 0.571 0.848 0.013
−.0595835 −.0206297 −.0586217 .1387848
−.0064032 .0374056 .0482049 1.201104
aggression withdrawal
.51 .47
.1182187 .1117113
4.31 4.21
0.000 0.000
.2782956 .2510499
.7417044 .6889501
4.845168 3.901594 .1183555 .0721754 1.173956 1.04827
2.435842 .602466 .0183256 .0111497 .1811453 .1617516
1.808752 2.882727 .0873761 .0533207 .867578 .7746937
12.97893 5.280568 .1603187 .0976974 1.588529 1.418458
.3003766
2.82262
0.11
0.915
−5.231856
5.832609
.0350529
.0109452
3.20
0.001
.0136006
.0565052
.2107736
.1232037
1.71
0.087
−.0307012
.4522484
[95% Conf. Interval]
external <− age education aggression _cons internal <−
Mean
Variance e.age e.education e.external e.internal aggression withdrawal Covariance e.age e.education e.external e.internal aggression withdrawal
LR test of model vs. saturated: chi2(2)
=
2.99,
79
Prob > chi2 = 0.2237
BAB 8 STRUKTUR RERATA Analisis Nilai Rerata pada SEM Dalam SEM pada umumnya yang dianalisis adalah kovariansi dan bukan rerata. Jika masukan data untuk analisis SEM adalah file data individual, maka nilai-nilai rerata sampel dapat diperoleh dengan menambahkan opsi [, means(nama_vars)] pada jalur SEM (perintah sem paths; lihat kembali pembahasan Notasi Jalur SEM pada bab 4). Pada umumnya sebagai masukan data untuk analisis SEM tidak digunakan file data individual, melainkan file ssd (summary statistics data; data statistik ringkasan) dengan struktur kovariansi yang memuat nilai-nilai matriks kovariansi (atau korelasi) variabel teramati. Untuk analisis rerata dengan SEM digunakan struktur rerata dengan menambahkan 1 baris rerata dan 1 baris variansi sebagai dua baris pertama pada matriks kovariansi (atau korelasi) semula. Sebagai contoh, pada tabel 8.1.a dapat dilihat matriks korelasi yang ada pada file ssd untuk struktur kovariansi data Illness (lihat kembali tabel 4.1), sedangkan tabel 8.1.b menunjukkan isi file ssd untuk struktur reratanya.
Tabel 8.1 Matriks korelasi data Illness a. Struktur kovariansi Variabel 1. Exe 2. Hard 3. Fit 4. Str 5. Ill
Exe 1.00 –0.03 0.39 –0.05 –0.08
Hard –0.03 1.00 0.07 –0.23 –0.16
Fit 0.39 0.07 1.00 –0.13 –0.29
Str –0.05 –0.23 –0.13 1.00 0.34
Ill –0.08 –0.16 –0.29 0.34 1.00
Str 4.80 4489.00 –0.05 –0.23 –0.13 1.00 0.34
Ill 716.70 3903.75 –0.08 –0.16 –0.29 0.34 1.00
b. Struktur rerata
1. 2. 3. 4. 5.
Rerata Variansi Exe Hard Fit Str Ill
Exe 40.90 4422.25 1.00 –0.03 0.39 –0.05 –0.08
Hard 0.00 1444.00 –0.03 1.00 0.07 –0.23 –0.16 80
Fit 67.10 1354.24 0.39 0.07 1.00 –0.13 –0.29
Dengan analisis rerata pada SEM dapat dilakukan uji hipotesis terhadap nilai rerata, tetapi pembahasan mengenai struktur rerata di sini sangat terbatas karena analisis rerata pada SEM terutama ditujukan untuk menguji hipotesis tentang variabel laten pada analisis faktor konfirmatorik dan model regresi struktural. Nilai rerata variabel eksogen pada program Stata dapat diperoleh dengan perintah sem path, means(var_exo).
Misalkan X adalah variabel eksogen, Y adalah variabel endogen, dan
hubungan antara X dan Y dinyatakan dengan model regresi: Y = b0 + b1 X + DY maka rerata variabel endogen Y adalah:
Y = b0 + b1 X
(8.1)
Identifikasi Struktur Rerata Analisis struktur rerata pada SEM berbeda dengan analisis struktur kovariansinya, sehingga penilaian identifikasi struktur rerata harus dilakukan sendiri, terpisah dari penilaian identifikasi struktur kovariansinya. Sebuah dataset dapat memiliki struktur kovariansi yang lebih-teridentifikasi dengan struktur rerata yang kurang-teridentifikasi, ataupun sebaliknya. Jika sebuah file ssd memiliki variabel teramati, matriks struktur kovariansinya memiliki jumlah titik data ( + 1)/2. Penambahan baris rerata dan baris variansi pada struktur rerata akan menambahkan sebanyak nilai informasi sesuai dengan banyak nilai rerata (lihat contoh pada tabel 8.1.b), sedangkan baris variansi tak menambah informasi karena nilai-nilainya sudah tercakup dalam matriks kovariansi semula. Maka diperoleh banyak nilai rerata, nilai variansi, dan nilai kovariansi tak-berulang yang dinamakan sebagai jumlah titik data p untuk struktur rerata yaitu: p=
3
(8.2)
2
Jumlah parameter q pada struktur rerata sama dengan jumlah parameter pada struktur kovariansinya (jumlah efek langsung, variansi, dan kovariansi), ditambah dengan jumlah rerata variabel eksogen dan jumlah intersep efek langsung. Jumlah intersep efek langsung ini sama banyaknya dengan jumlah efek langsung (jalur; paths). Seperti halnya dengan identifikasi struktur kovariansi, sebuah struktur rerata dinyatakan lebih-teridentifikasi jika p > q; tepat-teridenfikasi jika p = q; dan kurang-teridentifikasi jika p < q.
81
Estimasi Struktur Rerata Estimasi parameter, uji hipotesis, dan penilaian model pada struktur rerata dapat dilakukan dengan metode yang sama seperti untuk struktur kovariansi. Walaupun demikian, tidak semua indeks suai terstandardisasi untuk struktur kovariansi dapat dihitung untuk struktur rerata. Contohnya yaitu indeks suai inkremental CFI (comparative fit index) yang mengukur perbaikan relatif kesesuaian model peneliti dengan model dasar. Pada struktur rerata, pada model dasar diasumsikan seluruh kovariansi dan rerata terkendala dengan nilai nol, asumsi yang sangat tak realistis. Karena estimasi rerata pada SEM hanya dapat dilakukan untuk variabel endogen, penggunaan struktur rerata pada analisis jalur sangat terbatas. Analisis struktur rerata terutama digunakan dan akan dibahas lebih lanjut pada analisis faktor konfirmatorik.
Contoh 8.1: . use “D:\SEM\Data\rokok.dta . sem (sistolik <− usia kolesterol), cov(usia*kolesterol) var(e.sistolik usia kolesterol) > means(usia kolesterol) Endogenous variables Observed: sistolik Exogenous variables Observed: usia kolesterol Fitting target model: Iteration 0: Iteration 1:
log likelihood = −618.89285 log likelihood = −618.89285
Structural equation model Estimation method = ml Log likelihood = −618.89285
Number of obs
=
50
Coef.
OIM Std. Err.
z
P>|z|
usia kolesterol _cons
−.0922103 .0652989 118.1628
.7810589 .0686759 41.05388
−0.12 0.95 2.88
0.906 0.342 0.004
−1.623058 −.0693033 37.69871
1.438637 .1999011 198.627
usia kolesterol Variance e.sistolik usia kolesterol Covariance usia kolesterol
52.34 212.92
.5385982 6.125543
97.18 34.76
0.000 0.000
51.28437 200.9142
53.39563 224.9258
429.0054 14.5044 1876.114
85.80107 2.90088 375.2227
289.8828 9.800753 1267.707
634.8967 21.46545 2776.511
28.7272
23.68001
−17.68478
75.13918
[95% Conf. Interval]
Structural sistolik <−
Mean
LR test of model vs. saturated: chi2(0)
=
1.21 0.00,
82
0.225
Prob > chi2 =
.
Kovariansi antar variabel eksogen pada sem diasumsikan selalu ada, nilai kovariansi antara
usia
dengan
kolesterol
akan
tetap
ditampilkan, walaupun
opsi
“,
cov(usia*kolesterol” tak dituliskan, demikian pula halnya variansi suku pengganggu e.sistolik akan selalu tercantum walaupun opsi “var(e.sistolik)” tak diberikan.
Sebalik rerata usia dan kolesterol hanya akan ditampilkan jika ada opsi “, means(usia kolesterol)”. Variansi usia dan kolesterol hanya akan ditampilkan jika ada opsi “, means(usia kolesterol)” dan/atau “, var(usia kolesterol)”. Perhatikan bahwa
variabel endogen tak memiliki variansi, selain itu opsi “, means(nama_var)” hanya dapat digunakan untuk variabel eksogen.
.
83
BAB 9 SAMPLING GANDA Penggunaan Sampling Ganda pada SEM Sampling ganda praktis selalu digunakan pada rancangan studi eksperimental, yang memperbandingkan kelompok-kelompok perlakuan. Sampling ganda digunakan pada studi observasional jika anggota sampel diperoleh dari dua atau lebih subpopulasi yang berbeda. Yang menjadi pertanyaan di sini ialah: 1.
Ada tidaknya perbedaan parameter model antar kelompok.
2.
Ada tidaknya moderasi kelompok terhadap hubungan dalam model, atau dengan kata lain ada tidaknya interaksi antara kelompok dengan prediktor. Sebagai contoh data, diperlihatkan matriks kovariansi 50 responden yang terbagi atas 2
kelompok, grup 1 (perokok, tabel 8.1 atas) dan grup 2 (non-perokok, tabel 8.1 bawah).
Tabel 9.1 Matriks kovariansi 50 responden Studi Jantung Honolulu A. Grup 1: Perokok (N = 25) Variabel sistolik usia kolesterol Means SD
sistolik 628.63 1.3 189.43 129.28 25.07
usia
sistolik 272.67 −.43 73.53 125.2 16.51
usia
17.92 19.79 52.4 4.23
kolesterol
2895.5 209.8 53.81
B. Grup 2: Non-perokok (N = 25) Variabel sistolik usia kolesterol Means SD
84
12.29 40.45 52.28 3.51
kolesterol
992.79 216.04 31.51
Analisis Sampel Ganda pada Stata Analisis data pada tabel 9.1 diperlihatkan pada contoh 9.1 berikut.
Contoh 9.1: . use rokok_ssd.dta . sem (sistolik <− usia kolesterol), group(group) Endogenous variables Observed: sistolik Exogenous variables Observed: usia kolesterol Fitting target model: Iteration 0: Iteration 1:
log likelihood = −611.30609 log likelihood = −611.30609
Structural equation model Grouping variable = group Estimation method = ml Log likelihood = −611.30609
Number of obs Number of groups
= =
50 2
Coef.
OIM Std. Err.
z
P>|z|
1 2
.0002977 −.3219241
1.177281 1.000138
0.00 −0.32
1.000 0.748
−2.307131 −2.282158
2.307726 1.63831
1 2
.0654202 .0871804
.0926163 .1112774
0.71 0.78
0.480 0.433
−.1161044 −.1309194
.2469448 .3052802
1 2
115.5392 123.1957
63.23401 49.005
1.83 2.51
0.068 0.012
−8.397133 27.1477
239.4756 219.2438
1 2
591.5876 255.4763
167.3262 72.25962
339.8309 146.7556
1029.853 444.7407
[95% Conf. Interval]
Structural sistolik <− usia
kolesterol
_cons
Variance e.sistolik
LR test of model vs. saturated: chi2(0)
=
0.00,
Prob > chi2 = .
. estat ggof Group-level fit statistics group 1 2
N
SRMR
CD
chi2
df
p>chi2
25 25
0.000 0.000
0.020 0.024
0.000 0.000
0 0
. .
85
. estat ginvariant Tests for group invariance of parameters chi2 Structural sistolik <− usia kolesterol _cons Variance e.sistolik
Wald Test df
p>chi2
chi2
Score Test df
p>chi2
0.044 0.023 0.009
1 1 1
0.8348 0.8805 0.9238
. . .
. . .
. . .
3.401
1
0.0652
.
.
.
Contoh 9.2: . use rokok_ssd.dta . sem (sistolik <− usia kolesterol), group(group) ginvariant(all) Endogenous variables Observed: sistolik Exogenous variables Observed: usia kolesterol Fitting target model: Iteration 0: log likelihood = −613.78589 Iteration 1: log likelihood = −613.76882 Iteration 2: log likelihood = −613.76881 Structural equation model Grouping variable = group Estimation method = ml Log likelihood = −613.76881
Number of obs Number of groups
= =
50 2
( 1) [sistolik]1bn.group#c.usia − [sistolik]2.group#c.usia = 0 ( 2) [sistolik]1bn.group#c.kolesterol − [sistolik]2.group#c.kolesterol = 0 ( 3) [var(e.sistolik)]1bn.group − [var(e.sistolik)]2.group = 0 ( 4) [sistolik]1bn.group − [sistolik]2.group = 0
Coef.
OIM Std. Err.
z
P>|z|
[*]
−.0920975
.7810625
−0.12
0.906
−1.622952
1.438757
[*]
.0652956
.068762
0.95
0.342
−.0693072
.1998984
[*]
118.1576
41.054
2.88
0.004
37.69328
198.622
[95% Conf. Interval]
Structural sistolik <− usia kolesterol _cons
86
Variance e.sistolik [*]
429.0085
85.80156
289.8851
634.9009
Note: [*] identifies parameter estimates constrained to be equal across groups. LR test of model vs. saturated: chi2(4) =
4.93, Prob > chi2 = 0.2950
Opsi [group(groupname)] pada perintah sem path akan menghasilkan estimasi parameter per kelompok, selanjutnya pengujian kesamaan parameter antar kelompok (between groups) dilakukan dengan melanjutkan perintah sem path, group(groupname) tersebut dengan perintah estat ginvariant.
Sebaliknya jika model dijadikan terkendala dengan kesamaan parameter lintas kelompok (across group), estimasi parameter serta pengujiannya dilakukan sekaligus dengan perintah sem path, group(groupname) ginvariant(all).
Variabel Moderator dan Efek Interaksi Efek interaksi didasarkan atas keberadaan variabel moderator, yaitu variabel yang mempengaruhi arah dan/atau kekuatan hubungan antara suatu prediktor dengan kriterion. Kemaknaan variabel moderator kontinu dapat diuji dengan memasukkannya dalam model. Sebagai contoh, pada model jalur dalam gambar 9.1 dapat dilihat bahwa variabel W merupakan variabel moderator, baik dalam hubungan antara prediktor X dengan kriterion M maupun hubungan antara prediktor X dengan kriterion Y. Pengendalian efek interaksi sekaligus pengujian kemaknaannya dilakukan dengan memasukkan variabel W serta variabel hasil perkalian X dengan W sebagai prediktor tambahan dalam hubungan antara prediktor X dengan kriterionnya.
Gambar 9.1 Contoh model jalur dengan variabel moderator kontinu
87
Jika variabel moderator W berskala kategorik, baik dikotomi ataupun ordinal, kategori W dapat dijadikan dasar pengelompokan sampel dalam Stata, selanjutnya analisis SEM hubungan antara prediktor X dengan kedua kriterionnya M dan Y dilakukan per kelompok dengan memperlakukannya sebagai sampel ganda, tanpa perlu membentuk variabel hasil perkalian antara X dangan W. Estimasi parameter hubungan antara X dengan M dan Y berikut pengujian efek interaksi antara X dengan W dilakukan dengan perintah sem path, group(groupname)
yang disusul dengan perintah estat ginvariant seperti pada contoh 9.1.
Contoh 9.3 (Interaksi dengan variabel moderator kontinu): . use D:\SEM\Data\bankloan.dta . gen age_emp=age*employ . sem (income <− age employ age_emp) Endogenous variables Observed: income Exogenous variables Observed: age employ age_emp Fitting target model: Iteration 0: Iteration 1:
log likelihood = −14287.748 log likelihood = −14287.748
Structural equation model Estimation method = ml Log likelihood = −14287.748
Number of obs
Coef.
OIM Std. Err.
z
P>|z|
age employ age_emp _cons
−.0980292 −2.774291 .1438937 26.35535
.1936215 .7536995 .0183936 6.531747
−0.51 −3.68 7.82 4.03
0.613 0.000 0.000 0.000
e.income
809.6697
39.27475
Standardized Structural income <−
=
850
[95% Conf. Interval] −.4775203 −4.251515 .1078429 13.55336
.2814619 −1.297067 .1799445 39.15734
736.2385
890.4247
Variance LR test of model vs. Saturated: chi2(0)
=
0.00,
88
Prob > chi2 =
.
KEPUSTAKAAN Hershberger SL, 1994, ‘The specification of equivalent models before the collection of data’, in Latent variables analysis, eds A von Eye, CC Clogg, Sage, Thousand Oaks, CA, pp 68-105. Jackson JL, Dezee K, Douglas K, Shimeall W, 2005, Introduction to Structural Equation Modeling (Path
Analysis),
SGIM
Precourse
PA08,
viewed
8
May
2012,
www.sgim.org/userfiles/file/AMHandouts/AM05/handouts/pa08.pdf> Kenny DA, 2011, Path Analysis, viewed 10 May 2012,
_______, 2011, Measuring Model Fit, viewed 10 May 2012, Kline RB, 2005, Principles and Practice of Structural Equation Modeling, 2nd edn, The Guildford Press, New York. _______, 2011, Principles and Practice of Structural Equation Modeling, 3 rd edn, The Guildford Press, New York. Kupek E, 2006, ‘Beyond logistic regression: structural equation modelling for binary variables and its application to investigating unobserved confounders’, BMC Medical Research Methodology, vol 6, no 13. MacCallum RC, Austin JT, 2000, ‘Applications of Structural Equation Modeling in Psychological Research’, Annu Rev Psychol, no 51, pp 201-226. Moss S, 2009, Fit indices for structural equation modeling, Psychlopedia, viewed 6 May 2012, viewed 8 May 2012, Norris AE, 2005a, ‘Path Analysis’, in Statistical Methods for Health Care Research, 5th edn, ed BA Munro, Lippincott Williams & Wilkins, Philadelphia, pp 377-403 _______, 2005b, ‘Structural Equation Modeling’, in Statistical Methods for Health Care Research, 5th edn, ed BA Munro, Lippincott Williams & Wilkins, Philadelphia, pp 405-434. Newsom J, 2012, Some Clarifications and Recommendations on Fit Indices, USP 655, SEM Jason Newsom's
SEM
Class,
viewed
12
May
2012,
newsom/semclass/ho_fit.pdf> Romney DM, Jenkins CD, Bynner JM, 1992, ‘A structural analysis of health-related quality of life dimensions’, Human Relations, no 45, pp 165-176. StataCorp LP, 2011, Stata Structural Equation Modeling: Reference Manual Release 12, Stata Press, Lakeway Drive, College Station, Texas. Suhr
D,
nd,
Step
your
way
through
Path
Analysis,
viewed
12
May
2012,
Wuensch KL, 2009, An introduction to Structural Equation Modeling (SEM), Dept of Psychology, East Carolina University, Greenville, NC USA.
89
Lampiran 1
KOEFISIEN KORELASI Data masukan (input data) yang lazim digunakan untuk analisis SEM adalah matriks kovariansi atau korelasi. Korelasi yang dimaksud adalah korefisien korelasi Pearson yang merepresentasikan korelasi antara dua variabel kontinu. Dalam keadaan tertentu dapat juga digunakan beberapa bentuk korelasi lain, yaitu: 1.
Korelasi biserial-titik (point-biserial correlation): Misalkan dimiliki variabel random X yang berskala dikotomi (X = 0, 1), dan variabel
random Y yang berskala kontinu, maka korelasi biserial-titik (point-biserial correlation) antara X dan Y adalah:
rpb =
y1 y0
y
n1n0 y1 y0 = y n2
pq
(I.1)
rpb : koefisien korelasi biserial-titik y1 : rerata Y untuk X = 1 y0 : rerata Y untuk X = 0
y : standar deviasi (populasi) Y; jika y tak diketahui diganti dengan estimasi sampelnya n
: ukuran sampel
n1 : ukuran sampel kelompok untuk X = 1 n0 : ukuran sampel kelompok untuk X = 0
p
: proporsi anggota sampel untuk X = 1; p = n1 /n
q
: proporsi anggota sampel untuk X = 0; q = n0 /n
Perintah Stata: pbis bvar cvar [if] [in]
Contoh I.1: Berikut ini diperlihatkan perhitungan korelasi biserial-titik antara variabel default yang berskala dikotomi dengan variabel income yang berskala kontinu pada file bankloan.dta. . use D:\SEM\Data\bankloan.dta, clear . pbis default income (obs= 700)
90
Np= 183
p= 0.26
Nq= 517
q= 0.74
Coef.= −0.0709
t= −1.8784
P>|t| = 0.0607
df = 698
Diperoleh koefisien korelasi biserial titik rpb = −0.0709. Seandainya digunakan perintah untuk koefisien korelasi Pearson, diperoleh hasil yang hampir sama: . corr default income (obs=700)
default income
2.
default 1.0000 −0.0710
income 1.0000
Korelasi biserial rank (rank biserial correlation): Korelasi biserial rank adalah korelasi antara variabel dikotomi dengan variabel ordinal.
Misalkan dimiliki variabel random X yang berskala dikotomi dan variabel random Y yang berskala ordinal, maka korelasi biserial rank antara X dan Y adalah: rrb =
2 y1 y0
(I.2)
n
rrb : korelasi biserial rank
y1 : rerata ranking Y untuk X = 1 y0 : rerata ranking Y untuk X = 0
n
: jumlah pasangan data
3.
Koefisien phi (phi coefficient) Koefisien phi adalah ukuran asosiasi antara dua variabel dikotomi. Lihat tabel 2×2 di
bawah ini: X=1 X=0 Jumlah
Y=1 a c m1
Y=0 b d m0
Koefisien korelasi phi antara X dan Y adalah:
91
Jumlah n1 n0
ˆ =
ad bc n1n0 m1m0
(I.3)
Perintah Stata: phi catvar1 catvar2 [if exp] [in range] [, options]
Contoh I.2: Contoh ini memperlihatkan koefisien korelasi phi antara variabel sex dan nktt, keduanya berskala kategorik, dari file tension-type.dta. . use D:\SEM\Data\tension-type.dta, clear . phi sex nktt Jenis
Nyeri Kepala
kelamin
Tipe-Tegang
responden
0
1
Total
0
29
36
65
1
81
72
153
Total
110
108
218
Pearson chi2(1) =
1.2650
Pr = 0.261
phi = Cohen's w = fourfold point correlation = 0.0762 phi-squared = 0.0058
Dengan perintah corr untuk menghitung koefisien korelasi Pearson diperoleh: . corr sex nktt (obs=218) sex sex
1.0000
nktt
-0.0762
nktt
1.0000
Walaupun nilai korelasi phi praktis sama atau hampir sama dengan korelasi Pearson, perhitungannya dengan perintah phi selalu menghasilkan nilai positif, sehingga tandanya dianjurkan untuk diberikan berdasarkan koefisien Pearson.
4.
Korelasi order rank Spearman (Spearman’s rank order correlation): Korelasi order rank Spearman adalah korelasi antara dua variabel yang berskala
ordinal. Jika tidak ada ties, koefisien korelasi Spearman adalah:
92
rs = 1
(I.4)
n n2 1
di = R xi R yi
dengan
6 di2
(I.4.a)
: koefisien korelasi Spearman
R xi : ranking xi R yi : ranking yi n
: ukuran sampel
Perintah Stata: spearman varlist [if] [in] [, options]
Contoh I.3: Perintah spearman yang akan diperlihatkan di sini adalah untuk menghitung korelasi antara variabel mpg dengan rep78 pada file auto.dta. . use D:\SEM\Data\auto.dta, clear . spearman mpg rep78 Number of obs =
69
Spearman's rho =
0.3098
Test of Ho: mpg and rep78 are independent Prob > |t| =
0.0096
Dengan perintah corr, didapatkan nilai korelasi Pearson yang agak berbeda: . corr mpg rep78 (obs=69) mpg
5.
mpg
1.0000
rep78
0.4023
rep78
1.0000
Korelasi biserial (biserial correlation) Korelasi biserial adalah korelasi antara variabel random kontinu X dan variabel random
dikotomi Y, variabel Y merupakan hasil kategorisasi dikotomi dari sebuah variabel kontinu. Diasumsikan X dan Y yang melatarbelakangi Y dikotomi keduanya kontinu dan berdistribusi normal. 93
rb = rb
y1 y0 pq . y Z
(I.5)
: koefisien biserial
y1 : rerata Y untuk kelompok X = 1 y0 : rerata Y untuk kelompok X = 0
y : standar deviasi (populasi) Y; jika y tak diketahui diganti dengan estimasi sampelnya p
: proporsi Y untuk X = 1
q
: proporsi Y untuk X = 0
Z
: Nilai Z pada titik pisah (cut-off point) kategorisasi dikotomi variabel X
6.
Korelasi tetrakorik (tetrachoric correlation): Korelasi tetrakorik adalah korelasi antara dua variabel dikotomi X dan Y, keduanya
merupakan hasil kategorisasi dari dua variabel kontinu yang berdistribusi normal. Korelasi tetrakorik antara X dan Y adalah: rtet = cos
( I.6)
1 bc ad
Perintah Stata: tetrachoric varlist [if] [in] [, options]
Contoh I.4: Perintah tetrachoric di sini adalah untuk menghitung korelasi tetrakorik antara variabel RS074
dengan RS075 pada file familyvalues.dta.
. use D:\SEM\Data\familyvalues.dta, clear . tetrachoric RS074 RS075 Number of obs =
3300
Tetrachoric rho =
0.0679
Std error =
0.0302
Test of Ho: RS074 and RS075 are independent 2-sided exact P =
0.0278
94
Dengan perintah corr untuk korelasi Pearson diperoleh: . corr RS074 RS075 (obs=3300) RS074 RS074
1.0000
RS075
0.0390
7.
RS075
1.0000
Korelasi poliserial (polyserial correlation): Merupakan generalisasi korelasi biserial, yaitu korelasi antara variabel random kontinu
X dan variabel kategorik Y yang berskala ordinal sebagai hasil kategorisasi sebuah variabel kontinu. Diasumsikan X dan Y yang melatarbelakangi Y ordinal keduanya kontinu dan berdistribusi normal. Perintah Stata (sama dengan No. 8): polychoric varlist [if exp] [in range] [, options]
8.
Korelasi polikorik (polychoric correlation): Merupakan generalisasi korelasi tetrakorik, yaitu korelasi variabel random X dan
variabel random Y, keduanya berskala ordinal sebagai hasil kategorisasi dua variabel kontinu yang berdistribusi normal. Perhitungan korelasi poliserial dan polikorik relatif rumit, sehingga biasanya dilakukan dengan menggunakan program komputer. Perintah Stata (sama dengan No. 7): polychoric varlist [if exp] [in range] [, options]
Contoh I.5: Dalam contoh ini digunakan kembali file auto.dta untuk menghitung korelasi polikorik antara variabel rep78 dengan foreign. . use D:\SEM\Data\auto.dta . polychoric rep78 foreign Variables :
rep78 foreign
Type :
polychoric
Rho
= .80668063
S.e.
= .07631278
Goodness of fit tests: Pearson G2 = .43127118, Prob( >chi2(3)) = .93370947 LR X2
= .38898869, Prob( >chi2(3)) = .94250766
95
Dengan perintah corr diperoleh nilai korelasi Pearson yang agak jauh berbeda: . corr rep78 foreign (obs=69) rep78 rep78
1.0000
foreign
0.5922
foreign
1.0000
Skema penggunaan koefisien korelasi untuk berbagai skala variabel diperlihatkan pada tabel I. Pada tabel I.A variabel kategoriknya berskala kategorik murni dalam arti kata bukan hasil kategorisasi suatu variabel kontinu, sedangkan tabel I.2 adalah skema jika untuk tiap variabel kategorik ada variabel kontinu berdistribusi normal yang melatarbelakanginya, dengan kata lain variabel kategoriknya adalah hasil kategorisasi suatu variabel kontinu.
Tabel I. Skema korelasi untuk berbagai skala pengukuran variabel A. Variabel kategorik tidak dilatarbelakangi oleh variabel kontinu X Dikotomi Ordinal Kontinu
Y Ordinal Korelasi biserial rank Korelasi Spearman Korelasi Spearman
Dikotomi Koefisien phi Korelasi biserial rank Korelasi biserial titik
Kontinu Korelasi biserial titik Korelasi Spearman Korelasi Pearson
B. Variabel kategorik dilatarbelakangi oleh variabel kontinu X Dikotomi Ordinal Kontinu
Y Ordinal Korelasi polikorik Korelasi polikorik Korelasi poliserial
Dikotomi Korelasi tetrakorik Korelasi polikorik Korelasi biserial
96
Kontinu Korelasi biserial Korelasi poliserial Korelasi Pearson
Lampiran 2
ANALISIS REGRESI LINEAR DENGAN STATA Perintah: regress regress depvar [indepvars] [if] [in] [, options] options noconstant level (#) beta robust
Description suppress constant term set confidence level; default is level (95) report standardized beta coefficients tipe standard error yang dianjurkan heteroskedastisitas
untuk
dipilih jika
ada
Variabel indikator Variabel indikator adalah variabel yang bernilai biner (0 dan 1), digunakan untuk merepresentasikan variabel katagorik dalam model regresi. Variabel indikator diperoleh sebagai hasil operasi i. (lihat bawah) terhadap suatu variabel kategorik, dinyatakan sebagai i.varname. Variabel kategorik dan kontinu Semua variabel yang tidak bernilai biner (0 dan 1) dan tidak berada dalam suku interaksi dalam model akan diperlakukan sebagai variabel kontinu, kecuali mendapatkan operator i. (lihat bawah). Semua variabel yang berada dalam suku interaksi akan diperlakukan sebagai variabel kategorik, kecuali mendapat operator c. (lihat bawah). Operator i. dan c. Operator i. bagi suatu variabel, yaitu i.varname, menyatakan bahwa data pada variabel tersebut adalah data kategorik, dan i.varname adalah variabel indikatornya. Operator c. bagi suatu variabel, yaitu c.varname, menyatakan bahwa suatu variabel berskala kontinu. Operator # dan ## Operator # (palang; cross) dan ## (palang faktorial; factorial cross) digunakan terhadap pasangan variabel. Operator # menyatakan interaksi dan mengimplikasikan semua variabel dalam suku interaksi sebagai variabel indikator, kecuali mendapat operator c. Operasi ## menyatakan interaksi faktorial.
97
Contoh II.1: grup
: variabel grup (nilai grup lebih daripada 2) diperlakukan sebagai variabel kontinu (walaupun data sebenarnya kategorik)
i.grup
: variabel indikator untuk variabel grup
seks
: variabel seks diperlakukan sebagai variabel kategorik karena sudah bernilai biner.
i.seks
: operator i. tak diperlukan, i.seks pengertiannya sama dengan seks.
usia
: variabel usia diperlakukan sebagai variabel kontinu
c.usia
: operator c. tak diperlukan, c.usia pengertiannya sama dengan usia.
grup#seks
: menyatakan interaksi antara 2 variabel kategorik, grup dan seks
i.grup#i.seks
: operator i. tak diperlukan, semua variabel dalam suku interaksi diperlakukan sebagai variabel kategorik
grup#c.usia
: menyatakan interaksi antara variabel kategorik grup dengan variabel kontinu usia.
Operator c. bagi usia harus ada supaya usia diperlakukan sebagai
variabel kontinu. i.grup#c.usia
: operator i. bagi variabel grup tak diperlukan, pengertiannya sama dengan grup#c.usia.
grup##seks
: menyatakan interaksi antara variabel kategorik grup dan seks disertai pemasukan variabel i.grup dan seks (di luar suku interaksi) dalam model
grup##c.usia
: menyatakan interaksi antara variabel kategorik grup dan variabel kontinu usia disertai pemasukan variabel i.grup dan usia dalam model.
Contoh II.2: - Buka file honolulu.dta: . use “D:\SEM\Data\honolulu.dta” - Regresikan sistolik terhadap usia dan kolesterol: . regress sistolik usia kolesterol - Masukkan suku interaksi antara usia dengan kolesterol: . regress sistolik usia kolesterol c.usia#c.kolesterol - Perhatikan bahwa tanpa operator c. pada interaksi, usia dan kolesterol akan diperlakukan sebagai variabel kategorik dengan kategori yang sangat banyak, sehingga analisis regresi tak dapat dilakukan. - Regresikan sistolik terhadap usia dan seks: . regress sistolik usia seks
98
- Variabel seks tidak memerlukan operator i. karena bernilai biner (0 dan 1), sehingga dengan sendirinya sudah dianggap sebagai variabel kategorik. - Masukkan suku interaksi antara usia dengan seks: . regress sistolik usia seks c.usia#seks - Variabel usia memerlukan operator c. pada suku interaksi, sedangkan variabel seks tidak memerlukan operator i. - Regresikan sistolik terhadap usia dan tk_pend: . regress sistolik usia i.tk_pend - Variabel tk_pend adalah variabel kategorik, sehingga memerlukan operator i. - Masukkan suku interaksi antara usia dan tk_pend: . regress sistolik usia i.tk_pend c.usia#tk_pend - Perhatikan bahwa pada suku interaksi, usia memerlukan operator c., sebaliknya tk_pend tidak lagi memerlukan operator i. - Regresikan kembali sistolik terhadap usia, kolesterol, dan interaksinya: . regress sistolik usia kolesterol usia#kolesterol - Regresi terakhir ini menggunakan rancangan faktorial, sehingga perintahnya dapat juga dituliskan sebagai: . regress usia##kolesterol
Contoh II.3: Misalkan hendak diregresikan variabel mpg terhadap variabel rep78 pada file auto.dta.
Variabel mpg sebagai variabel dependen merupakan variabel kontinu, sedangkan
variabel rep78 sebagai variabel independen juga akan diperlakukan sebagai variabel kontinu, kecuali jika diberikan operator i. . use “D:\SEM\Data\auto.dta” . regress mpg i.rep78
99
Tampak bahwa operator i menghasilkan pembentukan 4 (5 – 1) variabel indikator untuk variabel semula rep78 yang memiliki 5 taraf, yang diberi nama variabel nomor 2 s.d. 5 di bawah nama rep78. Perintah lama xi memberi hasil yang sama, hanya dengan penamaan yang berbeda: . xi: regress mpg i.rep78 i.rep78
_I.rep78_1-5
(naturally coded; _I.rep78_1 omitted)
Grafik Model Regresi Diagram tebar (scatter diagram) variabel dependen dengan satu variabel independen dapat dituliskan dengan perintah twoway (scatter depvar indepvar); garis regresi ditampilkan dengan perintah twoway (lfit depvar indepvar); sedangkan diagram tebar dapat ditampilkan bersama-sama dengan perintah twoway (scatter depvar indepvar) (lfit depvar indepvar). Garis regresi dapat juga digambarkan bersama pita interval konfidensinya dengan mengganti perintah lfit menjadi lfitci.
100
Contoh II.4: - Buka kembali file honolulu.dta: . use “D:\SEM\Data\honolulu.dta” - Tampilkan grafik diagram tebar kolesterol (sumbu X) dan sistolik (sumbu Y):
100
120
140
160
Tekanan Darah Sistolik
180
200
. twoway (scatter sistolik kolesterol)
150
200
250 300 Kadar Kolesterol
350
400
- Perlihatkan diagram garis regresi sistolik terhadap kolesterol:
120
130
Fitted values
140
150
. twoway (lfit sistolik kolesterol)
150
200
250 300 Kadar Kolesterol
- Garis regresinya disertai pita interval konfidensi 95%: . twoway (lfitci sistolik kolesterol)
101
350
400
160 140 120 100
150
200
250 300 Kadar Kolesterol 95% CI
350
400
Fitted values
- Diagram tebar kolesterol dan sistolik digambarkan bersama garis regresinya:
100
120
140
160
180
200
. twoway (scatter sistolik kolesterol) (lfit sistolik kolesterol)
150
200
250 300 Kadar Kolesterol
Tekanan Darah Sistolik
350
400
Fitted values
- Gambaran garis regresi disertai pita interval konfidensi 95%:
100
120
140
160
180
200
. twoway (scatter sistolik kolesterol) (lfitci sistolik kolesterol)
150
200
250 300 Kadar Kolesterol Tekanan Darah Sistolik Fitted values
102
350 95% CI
400
Uji Normalitas Secara kasar normalitas suatu variabel dapat dinilai dengan menggunakan grafik univariat variabel tersebut, dengan perintah . stem varname
Diagram batang-dan-daun (stem-and-leaf)
. graph box varname
Diagram kotak-dan-titik (box-and-whisker plot)
. histogram varname
Grafik histogram
. pnorm varname
Diagram probabilitas normal terstandardisasi
Uji statistik normalitas suatu variabel dapat dilakukan dengan uji Shapiro Wilk, dengan perintah: . swilk varname Contoh II.5: Buka file highschool.dta. . use “D:\SEM\Data\highschool.dta . stem write Stem-and-leaf plot for write (writing score) 3* 3t 3f 3s 3. 4* 4t 4f 4s 4. 5* 5t 5f 5s 5. 6* 6t 6f 6s
| | | | | | | | | | | | | | | | | | |
1111 3333 55 66777 899999 0001111111111 223 4444444444445 66666666677 99999999999 00 2222222222222223 44444444444444444555 777777777777 9999999999999999999999999 00001111 2222222222222222223333 5555555555555555 7777777
. graph box read
103
80 70 60 30
40
50
reading score
0
1
2
Density
3
4
. histogram race
1
2
3
4
race
0.00
0.25
0.50
Normal F[(math-m)/s]
0.75
1.00
. pnorm math
0.00
0.25
0.50 Empirical P[i] = i/(N+1)
0.75
1.00
. swilk math Shapiro-Wilk W test for normal data Variable math
Obs 200
W 0.98024
V 2.947
104
z 2.487
Prob>z 0.00644
Uji Heteroskedastisitas Asumsi homoskedastisitas mempersyaratkan variansi distribusi variabel dependen adalah sama untuk setiap nilai variabel independen. Uji keberadaan heteroskedastisitas dapat dilakukan dengan dua perintah Stata: . estat hettest [varlist] atau: . estat imtest
yang dilakukan segera setelah perintah pemodelan regress depvar [indepvars]. Contoh II.6: Buka file auto.dta dengan model regresi linear dan hasil seperti pada contoh 2.7. . sysuse auto . regress mpg weight c.weight#c.weight foreign . estat hettest weight c.weight#c.weight foreign Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: weight c.weight#c.weight foreign chi2(3)
=
29.17
Prob > chi2
=
0.0000
. estat imtest Cameron & Trivedi's decomposition of IM-test Source Heteroskedasticity Skewness Kurtosis Total
chi2 11.95 7.54 1.71 21.19
df 7 3 1 11
p 0.1023 0.0566 0.1915 0.0315
Uji Multikolinearitas Salah satu ukuran untuk menilai keberadaan multikolineritas adalah perhitungan nilai VIF (variance inflation factor). Multikolinearitas dianggap ada jika VIF terbesar lebih daripada 10 (ada juga mengambil batas atas 30). Perintah Stata untuk menghitung VIF adalah: . estat vif yang dilakukan segera setelah perintah regress depvar [indepvars], atau cukup dengan: . vif 105
Jika intersep hendak diperlakukan sebagai salah satu variabel independen dan ikut dihitung nilai VIF-nya, perintah Stata adalah: . estat vif, uncentered Contoh II.7: Buka file bodyfat.dta, regresikan variabel bodyfat terhadap tricep, thigh, dan midarm. . use “D:\SEM\Data\bodyfat.dta . regress bodyfat tricep thigh midarm
. estat vif Variable triceps thigh midarm Mean VIF
VIF 708.84 564.34 104.61 459.26
1/VIF 0.001411 0.001772 0.009560
Residual Residual (galat) adalah selisih suatu nilai prediktor dengan nilai prediksinya berdasarkan model regresi: ei = Yi − Yˆi
Residual terstandardisasi (standardized residuals; rstandard) adalah es i =
s
ei 1 hi
s : akar rerata galat kuadrat (the root of MSE) hi :
leverage untuk titik ke-i (lihat bawah) Residual Studentized (jacknifed residuals; rstudent) adalah: ri =
s i
ei 1 hi
106
si
: akar rerata galat kuadrat jika pengamatan ke-i dihilangkan
Leverage Titik prediktor yang nilainya menyimpang jauh dari reratanya dinyatakan sebagai titik pengamatan dengan leverage tinggi atau titik leverage. lvr2plot adalah grafik yang menggambarkan leverage (sumbu Y) terhadap kuadrat residual (sumbu X). Pada sisi kiri atas grafik akan didapatkan titik-titik dengan leverage yang tinggi, sedangkan di sisi kanan bawah grafik adalah titik-titik dengan residual absolut yang besar. Perintah lvr2plot diberikan segera setelah perintah regress: . regress depvar [indepvar1, indepvar2, . . .] . lvr2plot Jika untuk titik yang ada pada grafik ingin disertakan nilai variabel independennya, perintahnya adalah: . lvr2plot, ml (indepvar) Informasi pada plot leverage vs residual-kuadrat ini dapat diringkas menjadi satu statistik, antara lain berupa DFITS dan Cook’s Distance. DFITs ke-i adalah: DFITsi = ri
hi 1 hi
ri
: residual Studentized
hi
: leverage Cook’s Distance untuk pengamatan ke-i adalah: 2 hi 1 s(i ) 1 ei2 2 Di = DFITs = i 2 2 p s 1 hi 2 p s
p
: jumlah variabel independen (termasuk konstante)
s 2 : rerata galat kuadrat (mean square error; MSE)
s(2i ) : rerata galat kuadrat jika pengamatan ke-i dihilangkan Ukuran yang paling langsung menunjukkan pengaruh suatu titik terhadap model regresi adalah DFBETAs. DFBETAs dihitung untuk pengamatan ke-i setiap variabel independen. Rumus untuk leverage dan DFBETAs dinyatakan dalam bentuk operasi matriks, tak dilampirkan di sini.
107
Perintah predict Perintah predict adalah perintah memprediksi nilai-nilai tertentu berdasarkan model yang ada pada perintah regress. Perintah ini diberikan segera setelah perintah regress, hasilnya prediksinya akan langsung berada pada basis-data. Beberapa di antaranya yaitu: . predict depvar_hat
Prediksi nilai variabel dependen berdasarkan model regresi
. predict e if e(sample)
Prediksi nilai-nilai residual
. predict l, leverage
Prediksi nilai-nilai leverage, yang mengukur pengaruh pengamatan ke-i terhadap koefisien regresi
. predict c, cooksd
Prediksi nilai Cook’s D, yang mengukur pengaruh pengamatan
ke-i
terhadap
model
regresi
secara
keseluruhan atau nilai-nilai prediksi. . predict rstu, rstu
Prediksi nilai residual Studentized
. predict dfits, dfits
Prediksi
nilai
pengamatan
DFITs,
ke-i
yang
mengukur
terhadap
model
pengaruh
regresi
secara
keseluruhan . predict dfbeta, dfbeta
Prediksi nilai DFBETAs, yang mengukur pengaruh pengamatan ke-i terhadap koefisien regresi suatu variabel independen tertentu
Beberapa perintah plot lain Selain perintah lvr2plot, beberapa perintah plot lain untuk menilai kesesuaian model dengan data adalah: . acprplot varind
plot augmented component-plus-residual, seperti cprplot, tetapi
dalam
model
penuh
(dan
residual
parsial)
ditambahkan variabel X 2j beserta koefisien regresinya, digunakan untuk mengecek asumsi normalitas. . avplot varind
plot added variable X, yaitu grafik residual variabel dependen
diregresikan
terhadap
seluruh
variabel
independen kecuali X dengan residual X diregresikan terhadap seluruh variabel independen lain, digunakan untuk mengecek asumsi linearitas. . avplots
plot added variabel untuk seluruh p variabel independen (p buah grafik). 108
. cprplot varind
plot
component-plus-residual,
ei b j X ji
yaitu
grafik
antara
yang diperoleh dari model penuh (full model)
diregresikan terhadap variabel independen X j , digunakan untuk mengecek asumsi linearitas. . rvfplot
plot residual-versus-fitted, yaitu grafik residual terhadap nilai-nilai prediksi variabel dependen, digunakan untuk mengecek asumsi homoskedastisitas.
. rvpplot
plot
residual-versus-predictor,
yaitu
grafik
residual
terhadap nilai-nilai salah satu variabel independen.
Ridge Regression Ridge regression adalah tipe pengestimasian model regresi yang dianjurkan jika terdapat multikolinearitas. Perintah Stata adalah: . ridgereg depvar indvars [if] [in], model(orr|grr1|grr2|grr3) Opsi model adalah sebagai berikut, yang harus dipilih salah satu: model(orr)
Ordinary Ridge Regression
model(grr1)
Generalized Ridge Regression
model(grr2)
Iterative Generalized Ridge Regression
model(grr3)
Adaptive Generalized Ridge Regression
Jika opsi model tidak dispesifikasi, perintah ridgereg akan menghasilkan estimasi OLS (Ordinary Least Square) biasa.
Contoh II.8: Lihat kembali file bodyfat.dta pada contoh II.7. Pada contoh II.7 terlihat adanya multikolinearitas antar ketiga variabel independen tricep, thigh, dan midarm dengan nilai VIF yang sangat tinggi. Dengan ridge regression diperoleh hasil estimasi sebagai berikut. . use “D:\SEM\Data\bodyfat.dta” . ridgereg bodyfat tricep thigh midarm, model(grr1) Variable
Obs
Mean
Std. Dev.
Min
Max
__00005F
20
1
0
1
1
* Generalized Ridge Regression bodyfat = triceps + thigh + midarm
109
110
LAMPIRAN 3
BEBERAPA NILAI-NILAI STATISTIK SUAI PADA ANALISIS SEM Statistik suai (fit statistics) yang ada dalam kepustakaan serta dilaporkan pada berbagai program statistik komputer sangat beragam. Beberapa yang lazim digunakan dan dilaporkan pada estimasi parameter SEM dengan Stata disajikan pada tabel berikut.
Statistik RMSEA
Interpretasi Indeks berbasis-non-sentralitas, merupakan indeks ‘keburukan-suai’ dengan interpretasi sebagai berikut: - RMSEA < 0.05: Aproksimasi kesesuaian baik - 0.05 < RMSEA < 0.08: Galat aproksimasi masih dapat diterima - RMSEA > 0.10: Kesesuaian buruk Interval konfidensi 90% untuk RMSEA adalah - Batas bawah interval < 0.05: H 0 : RMSEA < 0.05 (aproksimasi kesesuaian model baik) tidak ditolak. - Batas atas interval tidak > 0.10: H 0 : RMSEA > 0.10 (kesesuaian model buruk) ditolak. - Batas bawah interval < 0.05 & batas atas interval > 0.10 hasil kontroversial
pclose
pclose (p of close fit) adalah nilai p satu-sisi untuk uji H 0 : RMSEA = 0.05 vs H A : RMSEA > 0.05. - Jika p > 0.05, disimpulkan kesesuaian model ‘mendekati’ (close) - Jika p < 0.05, disimpulkan kesesuaian model lebih buruk daripada ‘close fitting’
AIC
Indeks suai mutlak / indeks prediktif-suai: Memperbandingkan matriks kovariansi model peneliti dengan matrik kovariansi data. Nilai AIC yang lebih kecil mengindikasikan kesesuaian yang lebih baik, model sesuai terbaik adalah model dengan AIC terkecil
111
Statistik BIC
Interpretasi Indeks suai mutlak / indeks presiktif-suai seperti AIC, namun BIC sangat menekankan parsimoni.
CFI
Merupakan indeks berbasis-non-sentralitas, menilai perbaikan relatif kesesuaian model peneliti dibandingkan dengan model dasar, yaitu model dengan asumsi semua kovariansi bernilai sama dengan nol. Nilai CFI berkisar antara 0 s.d. 1. Kesesuaian dianggap baik jika CFI > 0.95.
TLI
Indeks suai-relatif: Memperbanding model peneliti dengan model nol, yang menyatakan semua korelasi bernilai nol. Nilai TLI dapat berkisar antara sedikit lebih kecil daripada 1 s.d. lebih besar daripada 1. Kesesuaian dianggap baik jika TLI > 0.95.
SRMR
Ukuran kesuaian mutlak, merupakan selisih terstandardisasi antara matriks korelasi data dengan matriks korelasi prediksi. - SRMR = 0 menyatakan kesesuaian sempurna - SRMR < 0.8 dianggap menunjukkan kesesuaian baik
112
Lampiran 4
UJI HIPOTESIS PADA SEM Pada estimasi parameter SEM, secara otomatis dilaporkan hasil uji Z untuk menilai kemaknaan efek langsung setiap prediktor terhadap kriterionnya. Dalam bab 4 juga telah dibahas uji Sobel untuk menilai signifikansi efek tak langsung antara dua variabel yang terjadi melalui satu variabel mediator. Beberapa uji hipotesis lainnya adalah: 1.
Uji rasio likelihood untuk memperbandingkan nilai-nilai (kovariansi) prediksi model peneliti dengan nilai-nilai (kovariansi) data sampel (disebut juga model jenuh). Hasil uji ini secara otomatis dilaporkan pada pemodelan dan estimasi parameter [perintah sem (vardep <− varindep1, varindep 2, . . .)].
2.
Uji rasio likelihood untuk memperbandingkan dua model. Hasil estimasi kedua model harus terlebih dahulu disimpan sebelum dapat diperbandingkan, dengan perintah: . sem path1 . estimates store A . sem path2 . estimates store B . lrtest A B
3.
Uji Wald untuk memperbandingkan nilai parameter antar kelompok (between groups) pada sampel ganda, dengan perintah: . sem path . estat ginvariant
113