PEMODELAN PERSAMAAN STRUKTURAL: I. ANALISIS JALUR

PEMODELAN PERSAMAAN STRUKTURAL: I. ANALISIS JALUR

Johan Harlan Pusat Studi Informatika Kedokteran Universitas Gunadarma

Pemodelan Persamaan Struktural: I. Analisis Jalur Penulis : Johan Harlan ISBN 978-602-9438-27-7

Cetakan Pertama, Juli 2013

Disain cover : Joko Slameto

Diterbitkan pertama kali oleh Gunadarma Jl. Margonda Raya No. 100, Pondokcina, Depok 16424 Telp. +62-21-78881112, 7863819 Faks. +62-21-7872829 e-mail : [email protected]

Hak

Cipta

dilindungi

undang-undang.

Dilarang

mengutip

atau

memperbanyak dalam bentuk apapun sebagian atau seluruh isi buku tanpa ijin tertulis dari penerbit.

KATA PENGANTAR Pemodelan persamaan struktural (structural equation modeling; SEM) adalah suatu teknik analisis statistika yang terutama menekankan penilaian model, dapat dianggap sebagai perluasan General Linear Model, disebut juga sebagai second generation multivariate analysis. Analisis SEM dapat dibedakan atas tiga tipe, analisis jalur, analisis faktor konfirmatorik, dan model regresi struktural. Buku ini merupakan buku pertama dalam seri SEM, yang akan membahas mengenai analisis jalur. Pembahasan analisis jalur di sini mencakup pembahasan tentang teori analisis jalur, praktek analisis jalur dengan program komputer statistik Stata, dan interpretasi hasilnya. Pembahasan teori analisis jalur bersifat mendasar, yaitu menyangkut pengetahuan teoretis minimum dari segi Statistika yang dibutuhkan seorang peneliti untuk melakukan analisis PA. Pengetahuan teoretis ini juga sangat penting dan diperlukan sebagai dasar bagi mereka yang ingin mempelajari kedua tipe SEM berikutnya, yaitu analisis faktor konfirmatorik dan model regresi struktural. Praktek analisis jalur yang akan dibahas adalah analisis SEM dengan Stata, suatu paket komputer statistik. Analisis SEM dengan paket komputer statistik Stata ini dapat dilaksanakan dalam mode interaktif maupun mode grafik. Interpretasi hasil analisis jalur dengan Stata yang akan dibahas adalah pemahaman menurut aspek Statistika, sedangkan aspek substantif tetap harus dikaji oleh peneliti sendiri berdasarkan bidang keilmuannya masing-masing. Sebagai prasyarat untuk mempelajari SEM, pembaca diharapkan telah memiliki pengetahuan dasar mengenai analisis regresi (untuk PA) dan analisis faktor (untuk CFA), walaupun dalam buku-buku seri SEM ini akan dibahas juga telaah ulang secara singkat mengenai konsep-konsep tersebut.

Jakarta, Juli 2012

Penulis

v

DAFTAR ISI

Kata Pengantar

v

Daftar Isi

vii

Bab 1 Pendahuluan

1

Pengertian Dasar SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1

Struktur pada SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3

Variabel Teramati dan Variabel Laten . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3

Variabel Endogen dan Eksogen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3

Beberapa Karakteristik Kekhususan SEM . . . . . . . . . . . . . . . . . . . . . . . . .

4

Program Komputer untuk SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5

Lambang SEM dalam Kepustakaan dan Stata . . . . . . . . . . . . . . . . . . . . . .

6

Bab 2 Telaah Ulang Analisis Regresi

9

Model dan Persamaan Regresi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

Data Tak-terstandardisasi dan Terstandardisasi . . . . . . . . . . . . . . . . . . . . .

11

Matriks Kovariansi dan Korelasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

Analisis Regresi dangan Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

14

Bab 3 Konsep-konsep Dasar Analisis Jalur

19

Analisis Jalur dan Model Struktural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

Asumsi dalam Analisis Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

Parameter dan Derajat Bebas Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20

Tipe Model Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

Identifikasi Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

Ukuran Sampel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

Hubungan Antar-Variabel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24

Bab 4 Estimasi Parameter

25

Parameter Model Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25

Estimasi Efek pada Model Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

28

Dekomposisi Efek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

30

vii

Uji Sobel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

Notasi Jalur SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

33

Estimasi Koefisien Jalur SEM dengan Stata . . . . . . . . . . . . . . . . . . . . . . . .

34

Bab 5 Uji Hipotesis dan Penilaian Model

49

Uji Hipotesis pada SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

49

Klasifikasi Statistik Suai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

49

Macam Statistik Suai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

50

Estimasi Statistik Suai SEM dengan Stata . . . . . . . . . . . . . . . . . . . . . . . . .

54

Model Ekivalen pada Analisis Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61

Bab 6 Pemodelan SEM dalam Mode Grafik pada Stata

63

Graphical User Interface pada Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

63

Analisis SEM dengan Mode Grafik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

65

Bab 7 Model Struktural Non-Rekursif

68

Tipe Model Struktural Non-Rekursif . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

68

Identifikasi pada Mode Non-Rekursif . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

68

Kondisi Order . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

69

Kondisi Rank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

70

Efek Tak Langsung pada Model Non-Rekursif . . . . . . . . . . . . . . . . . . . . .

71

Korelasi Ganda Kuadrat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

72

Analisis Model Non-Rekursif dengan Stata . . . . . . . . . . . . . . . . . . . . . . . .

74

Bab 8 Struktur Rerata

80

Analisis Nilai Rerata pada SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

80

Identifikasi Struktur Rerata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

81

Estimasi Struktur Rerata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

82

Bab 9 Sampling Ganda

84

Penggunaan Sampling Ganda pada SEM . . . . . . . . . . . . . . . . . . . . . . . . . .

84

Analisis Sampel Ganda pada Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85

Variabel Moderator dan Efek Interaksi . . . . . . . . . . . . . . . . . . . . . . . . . . . .

87

viii

Kepustakaan

89

Lampiran 1 Koefisien Korelasi

90

Lampiran 2 Analisis Regresi Linear dengan Stata

97

Lampiran 3 Beberapa Nilai-Nilai Statistik Suai pada Analisis SEM

111

Lampiran 4 Uji Hipotesis pada SEM

113

ix

Bab 1. Pendahuluan

BAB 1 PENDAHULUAN Pengertian Dasar SEM Pemodelan persamaan struktural (structural equation modeling; SEM) bukan merupakan suatu teknik statistika tunggal seperti analisis variansi, analisis regresi, dan sebagainya, melainkan mengacu kepada suatu kelompok prosedur yang saling berkaitan (a family of related procedures). SEM dikenal pula sebagai „analisis multivariat generasi kedua‟ (second generation multivariate analysis). Istilah lain untuk SEM ialah pemodelan kausal (causal modeling). Dalam kenyataannya SEM hanyalah berguna untuk menunjang dugaan keberadaan hubungan kausal, karena tidak ada teknik statistika yang dapat membuktikan kausalitas dalam rancangan studi observasional. SEM umumnya digunakan untuk rancangan studi observasional, namun jika diperlukan dapat pula digunakan dalam rancangan studi eksperimental. Dikenal dua tipe model dalam SEM yaitu model struktural dan model pengukuran. Model struktural mengkaji struktur hubungan antara variabel teramati, sedangkan model pengukuran menekankan pengukuran variabel laten dengan menggunakan indikator. Berdasarkan tipe pemodelan tersebut SEM dapat dibagi menjadi tiga bagian, yaitu analisis jalur, analisis faktor konfirmatorik, dan model regresi struktural. Analisis jalur (path analysis; PA) merupakan model struktural untuk variabel teramati (lihat contoh pada diagram 1.1), sedang analisis faktor konfirmatorik (confirmatory factor analysis; CFA) adalah model pengukuran untuk variabel laten (contoh pada diagram 1.2). Model regresi struktural (structural regression model; model SR) adalah sintesis antara model struktural dengan model pengukuran, merupakan gabungan antara analisis jalur dengan CFA (contoh pada diagram 1.3). Dalam buku ini pembahasan selanjutnya adalah mengenai analisis jalur. Walaupun analisis jalur hanya merupakan sebagian dari keseluruhan metode statistika yang ada dalam SEM dan juga merupakan teknik statistika yang tertua dalam SEM, pemahaman mengenai analisis jalur sangat penting dan merupakan dasar utama untuk mempelajari SEM secara keseluruhan.

1

Bab 1. Pendahuluan

Gambar 1.1 Contoh model jalur

Gambar 1.2 Contoh model analisis faktor konfirmatorik

Gambar 1.3 Contoh model regresi struktural 2

Bab 1. Pendahuluan

Struktur pada SEM Bagian model persamaan struktural yang merepresentasikan hipotesis tentang variansi dan kovariansi adalah struktur kovariansi, sedangkan jika rerata juga dianalisis bersama dengan kovariansi, maka model persamaan struktural memiliki baik struktur kovariansi maupun struktur rerata, dengan struktur rerata merepresentasikan estimasi rerata faktor. Salah satu kelebihan SEM ialah dapat diestimasinya rerata variabel laten, yang tak dapat dilakukan pada teknik analisis statistik lainnya. Misalnya dalam ANOVA (analisis variansi), estimasi hanya dapat dilakukan untuk rerata variabel teramati. Walaupun demikian, dalam kebanyakan analisis SEM struktur rerata tak dibutuhkan dan rerata tak dianalisis.

Variabel Teramati dan Variabel Laten Variabel dalam SEM dibedakan menjadi variabel teramati dan variabel laten. Variabel teramati (observed variable) adalah variabel yang nilai datanya dapat diukur secara langsung oleh peneliti dan nilainya ada pada basis-data penelitian. Contohnya antara lain yaitu tinggi badan, berat badan, dan sebagainya. Variabel teramati dapat berupa variabel kategorik nominal, kategorik ordinal, ataupun kontinu. Dalam contoh pada gambar 1.1, X 1 , X 2 , Y1 , Y2 , Y3 , dan Y4 adalah variabel-variabel teramati. Variabel laten (variabel tak-teramati; unobserved variable) yang adakalanya disebut juga sebagai konstruk (construct) atau faktor, adalah variabelnya yang nilai datanya tidak diperoleh melalui pengukuran langsung oleh peneliti, tetapi diukur secara tidak langsung melalui beberapa variabel teramati yang disebut juga sebagai indikator. Misalnya untuk variabel laten prestasi belajar (achievement) siswa SD, indikatornya adalah (hasil tes) kemampuan membaca, kemampuan menulis, dan kemampuan berhitung. Variabel laten dalam SEM selalu merupakan variabel kontinu. Dalam contoh pada gambar 1.2, A dan B adalah variabel-variabel laten. Variabel laten tak digunakan dalam analisis jalur yang akan dibahas di sini. Konstruk dapat menjadi variabel teramati jika nilai-nilainya diperoleh dari indikator-tunggal (single-indicator).

Variabel Endogen dan Eksogen Variabel eksogen (variabel independen) adalah variabel yang sama sekali tidak menerima efek variabel lain, sedangkan variabel endogen adalah variabel yang menerima efek satu atau lebih variabel lain. Efek antar variabel ini dapat terjadi dari suatu variabel 3

Bab 1. Pendahuluan

eksogen ke suatu variabel endogen ataupun dari suatu variabel endogen ke variabel endogen lain. Dalam pengertian ini variabel mediator (variabel perantara) dianggap sebagai variabel endogen, sedangkan suku pengganggu (disturbance) adalah variabel eksogen. Tiap variabel endogen memiliki suku pengganggu, yang selalu merupakan variabel laten. Variabel endogen dalam SEM dapat berperan sebagai variabel dependen maupun independen. Dalam contoh pada gambar 1.1, X 1 dan X 2 adalah variabel eksogen, sedangkan Y1 , Y2 , Y3 , dan Y4 adalah variabel endogen. Y1 dan Y2 merupakan variabel mediator. Istilah variabel eksogen (independen) menyatakan bahwa nilai-nilai variabel ini dapat bervariasi dengan bebas sehingga memiliki nilai variansi tertentu, sedangkan variabel endogen tidak dapat bervariasi dengan bebas sehingga tidak memiliki variansi. Dalam contoh pada gambar 1.1 tampak bahwa hanya variabel eksogen X 1 dan X 2 yang memiliki variansi. Variabel endogen Y1 , Y2 , Y3 , dan Y4 tidak memiliki variansi, yang memiliki variansi adalah suku pengganggu (disturbances) untuk keempat variabel endogen tersebut. Suku pengganggu pada model struktural SEM merepresentasikan galat pengukuran (measurement error) variabel endogennya beserta variabel independen yang tak diperhitungkan (omitted causes) dalam model. Dua variabel eksogen yang memiliki asosiasi tak-teranalisis (unanalyzed association) dapat bervariasi bersama (ber-kovariansi), sehingga pasangan variabel eksogen demikian memiliki nilai kovariansi tertentu. Pada contoh gambar 1.1 diperlihatkan adanya korelasi antara variabel eksogen X 1 dan X 2 . Perhatikan bahwa dalam SEM semua variabel eksogen dianggap saling berkorelasi walaupun tak digambarkan dalam model.

Beberapa Karakteristik Kekhususan SEM SEM memiliki beberapa karakteristik khusus yang membedakannya dari teknik statistika lainnya, yaitu: -

SEM bukan merupakan teknik statistika tunggal, namun merupakan kumpulan sejumlah teknik statistika yang berkaitan, terutama analisis regresi dan analisis faktor.

-

SEM mengkaji model a priori, yaitu model yang sudah harus ada dan dibuat peneliti sebelum dimulainya pengumpulan dan analisis data. Model boleh diperbaiki dalam tahap analisis, tetapi tidak boleh baru dibuat setelah data ada dan sepenuhnya dikembangkan hanya berdasarkan data yang diperoleh peneliti. Implikasinya yaitu peneliti harus memiliki dasar yang kokoh dalam bidang substansi keilmuannya. 4

Bab 1. Pendahuluan

-

Dalam tahap analisis jika diperlukan untuk memenuhi persyaratan statistika, model boleh direvisi, tetapi proses revisi model tidak boleh bertentangan dengan pengetahuan teoretis di bidang substansi penelitian.

-

SEM dapat mengkaji lebih daripada satu model dan model yang ternyata dapat menjelaskan data dengan baik berdasarkan analisis SEM juga mungkin lebih daripada satu.

-

SEM dapat menganalisis variabel teramati maupun variabel laten. Sebagian besar teknik statistika dibuat untuk menganalisis variabel teramati. Ada juga teknik statistika yang dikhususkan untuk menganalisis variabel laten, tetapi SEM dapat menganalisis kedua tipe variabel tersebut bersama-sama.

-

SEM adalah teknik sampel besar. Untuk memperoleh hasil yang terpercaya, ukuran sampel minimum ideal yang dianjurkan adalah 20 kali jumlah parameter, misalnya model dengan 10 parameter dianjurkan menggunakan sampel berukuran 200.

-

Estimasi pada SEM umumnya dilakukan dengan metode maximum likelihood (ML) yang merupakan metode informasi-penuh (full-information method) yang menganalisis seluruh persamaan dalam model sekaligus, berbeda misalnya dengan metode kuadrat terkecil yang dapat dianggap sebagai metode informasi-parsial (partial-information method) karena dalam tiap tahap hanya menganalisis satu persamaan.

-

SEM kurang memberi penekanan pada uji statistik dalam pengertian sebagai uji parameter dalam Statistika Umum. Didapatkan berbagai alasan yang menyebabkan uji statistik demikian menjadi kurang penting dalam SEM, yang terutama yaitu karena SEM dimaksudkan untuk meng-evaluasi keseluruhan model secara global, sedangkan uji statistik sebagai uji parameter hanya menyangkut detil spesifik dalam model. Alasan teknis lainnya yaitu karena SEM merupakan teknik sampel besar, sedangkan secara teoretis sampel besar dapat mengakibatkan efek trivial dapat menjadi „sangat bermakna‟ secara statistik. Uji statistik yang lazim dilakukan dalam SEM memiliki tujuan berbeda, yaitu „pengujian model‟ antara lain dengan memperbandingkan matriks kovariansi data dengan matriks kovariansi yang diprediksi oleh model yang diajukan peneliti, walaupun ada juga uji statistik untuk pengujian parameter yang dianggap kurang penting.

Program Komputer untuk SEM Program statistik komputer untuk SEM telah dikenal sejak paruh kedua 1970-an, walaupun pada waktu itu program SEM yang dikenal secara luas hanyalah LISREL (Linear

5

Bab 1. Pendahuluan

Structural Relationships) yang dikembangkan oleh Jöreskog & Sörbom yang menggunakan mode interaktif. Dalam perkembangan selanjutnya dikenal pula AMOS (Analysis of Moment Structures) yang dikembangkan oleh SPSS Inc sebagai program aplikasi yang berdiri sendiri. AMOS memiliki kemudahan karena dapat dijalankan dalam mode grafik dengan menggunakan GUI (Graphical User Interface), walaupun dapat juga dijalankan dengan mode batch. Sekarang dikenal juga berbagai prosedur SEM yang merupakan bagian program statistik komputer komprehensif, misalnya: -

Prosedur CALIS/TCALIS (Covariance Analysis and Linear Structural Equations) pada SAS/STAT

-

Prosedur RAMONA (Reticular Action Model or Near Approximation) pada SYSTAT.

-

Prosedur SEPATH (Structural Equation Modeling and Path Analysis) pada STATISTICA. Berbagai prosedur ini umumnya harus dijalankan dalam mode batch (kecuali

SEPATH). Prosedur terbaru yang dibahas dalam buku ini yaitu prosedur sem (structural equation modeling) yang didapatkan pada program statistik STATA. Prosedur sem ini baru didapatkan pada STATA versi 12 yang diluncurkan pada tahun 2011. Prosedur sem pada STATA 12 ini dapat dijalankan dengan mode grafik maupun interaktif.

Lambang SEM dalam Kepustakaan dan Stata Berikut ini diperlihatkan beberapa lambang yang lazim dipergunakan untuk notasi SEM dalam kepustakaan dan dipergunakan pula dalam Stata: 1.

Variabel: a.

Variabel teramati: Variabel teramati dinyatakan dengan lambang empat persegi panjang (“

”) atau

bujur sangkar (“ ”). Nama variabel dituliskan dalam empat persegi panjang atau bujur sangkar itu. Seluruh variabel yang ada pada basis-data adalah variabel teramati. Pada Stata, nama variabel teramati seluruhnya ditulis dengan huruf kecil. b.

Variabel laten: Variabel laten digambarkan dengan lambang elips (“

”) atau lingkaran (“

”).

Nama variabel dituliskan dalam elips atau lingkaran itu. Pada model jalur, hanya suku pengganggu yang merupakan variabel laten. 6

Bab 1. Pendahuluan

Pada Stata, penulisan nama variabel laten diawali dengan huruf besar, kecuali untuk suku pengganggu (butir 1.c) c.

Suku pengganggu: Suku pengganggu ada untuk setiap variabel endogen, merupakan variabel laten yang memiliki variansi, sedangkan variabel endogen itu sendiri tidak memiliki variansi. Pada Stata, variabel laten untuk sebuah variabel endogen dinamakan sebagai “e.nama_var_endogen”, misalnya untuk variabel endogen “sistolik”, nama suku pengganggunya adalah “e.sistolik”. Walaupun merupakan variabel laten, penulisan nama suku pengganggu tidak diawali dengan huruf besar.

2.

Efek antar-variabel: a.

Efek searah: Efek searah suatu variabel terhadap variabel lainnya dinyatakan dengan lambang anak panah searah (“→”). Misalnya, efek searah variabel X terhadap variabel Y dinyatakan sebagai X → Y. Nilai yang dituliskan dekat anak panah pada model awal menyatakan nilai kendala yang ditentukan peneliti pada penyusunan model ataupun estimasi yang diperoleh dari data sampel sebagai koefisien regresi atau koefisien jalur. Pada pemodelan Stata, efek searah variabel X terhadap Y dituliskan sebagai “sem (Y <− X)” atau “sem (X −> Y)”.

b.

Efek resiprokal: Efek resiprokal antar dua variabel dinyatakan dengan lambang anak panah bolakbalik (“ Y1

”). Misalnya, efek resiprokal antar variabel Y1 dan Y2 dinyatakan sebagai

Y2 .

Pada pemodelan Stata, hubungan resiprokal antar variabel Y1 dan Y2 dituliskan sebagai “sem (Y2 <− Y1) (Y1 <− Y2)” 3.

Variansi: Variansi suatu variabel eksogen dinyatakan dengan lambang anak panah berkepalaganda, yang berawal dan berakhir pada variabel yang sama (“ ”). Dalam SEM, semua variabel eksogen dan suku pengganggu memiliki variansi, sedangkan variabel endogen tidak memiliki variansi.

7

Bab 1. Pendahuluan

Pada pemodelan Stata dengan mode interaktif, keberadaan variansi tidak perlu dicantumkan, walaupun diasumsikan semua variabel eksogen dan suku pengganggu memiliki variansi. 4.

Kovariansi dan korelasi: Kovariansi atau korelasi dinyatakan dengan lambang anak panah berkepala-ganda, yang berawal dan berakhir pada dua variabel berbeda (“

”).

Kovariansi diasumsikan selalu ada antar variabel eksogen, walaupun tidak digambarkan dalam model. Selain itu, kovariansi mungkin ada (tidak selalu, tergantung model peneliti) antar suku pengganggu. Kovariansi tidak ditemukan antar variabel endogen. Secara statistik, kovariansi dalam SEM disebut sebagai asosiasi takteranalisis (unanalyzed association) atas dasar asumsi bahwa pada kovariansi antar dua variabel terdapat variabel ketiga yang tak diketahui dan tak dianalisis yang menimbulkan efek terhadap kedua variabel yang berkovariansi sekaligus. Pada Stata, kovariansi dituliskan sebagai “cov(var1*var2), misalnya kovariansi antar variabel eksogen “usia” dan “pendidikan” dituliskan sebagai “cov(usia*pendidikan), sedangkan kovariansi antar suku pengganggu “e.sistolik” dan “e.kolesterol” dituliskan sebagai “cov(e.sistolik*e.kolesterol).

8

Bab 2. Telaah Ulang Analisis Regresi

BAB 2 TELAAH ULANG ANALISIS REGRESI Model dan Persamaan Regresi Pemahaman tentang analisis regresi merupakan prasyarat untuk mempelajari analisis jalur (path analysis; PA). Analisis regresi adalah suatu teknik statistika untuk mengkaji hubungan antara satu atau lebih variabel independen kontinu dengan satu variabel dependen kontinu. Analisis regresi dapat berupa regresi sederhana (simple regression) jika hanya ada satu variabel independen atau regresi ganda (multiple regression) jika didapatkan lebih daripada satu variabel independen. Kadang-kadang analisis regresi juga digunakan untuk variabel independen yang berskala kategorik, yang dinyatakan dalam bentuk variabel indikator yang hanya bernilai nol atau satu. Model dan persamaan garis regresi sederhana masing-masing dinyatakan sebagai:

dan

yi =  0 + 1 xi +  i

(2.1)

yˆ =  0 + 1 x

(2.2)

 0 : intersep (intercept); konstante

1 : kemiringan (slope); koefisien regresi xi

: variabel independen; regresor; prediktor

yi : variabel dependen; outcome; kriterion

 i : suku galat (error); residual Estimasinya yang diperoleh dari data sampel masing-masing adalah:

dan

yi = b0 + b1 xi + ei

(2.1.a)

yˆ = b0 + b1 x

(2.2.a)

dengan b0 sebagai

estimator

untuk  0 ( ˆ0 = b0 ) dan b1 sebagai estimator untuk 1

 ˆ  b  . 1

1

Model dan persamaan garis regresi ganda (dengan 2 variabel independen X 1 dan X 2 ) masing-masing dinyatakan sebagai:

dan

yi =  0 + 1 x1i +  2 x2i +  i

(2.3)

yˆ =  0 + 1 x1 +  2 x2

(2.4) 9


Estimasinya masing-masing adalah:

dan

yi = b0 + b1 x1i + b2 x2i + ei

(2.3.a)

yˆ = b0 + b1 x1 + b2 x2

(2.4.a)

Estimasi koefisien regresi pada regresi sederhana maupun ganda dilakukan dengan metode kuadrat terkecil (ordinary least square; OLS). Salah satu asumsi yang penting bagi OLS ialah tidak adanya korelasi antara variabel independen dengan suku residual variabel dependen.

Contoh 2.1: Misalkan dimiliki data hipotetis seperti terlihat pada tabel 2.1. Hasil regresi y terhadap

x1 diperlihatkan pada tabel 2.2.a, sedangkan hasil regresi y terhadap x1 dan x2 diperlihatkan pada tabel 2.2.b.

Tabel 2.1 Contoh data hipotetis untuk analisis regresi No

y

1 2 3 4 5 6 7 8 9 10 Rerata SD

116 152 134 132 130 118 136 108 108 128 y = 126.2

x1 49 48 55 49 50 52 48 59 59 52 x1 = 52.1

x2 240 209 210 171 255 232 147 268 231 199 x2 = 216.2

s y = 13.77

s1 = 4.23

s2 = 37.18

Tabel 2.2 Hasil analisis regresi untuk data hipotetis tabel 2.1 a. Model regresi sederhana: y =  0 + 1 x1 +  Konstante x1

b 245.42 –2.29

SE(b) 42.84 0.82

B –0.70 2

n = 10; R = 0.49

10

t 5.73 –2.79

Nilai-p < 0.001 0.024


b. Model regresi ganda: y =  0 + 1 x1 +  2 x2 +  Konstante x1

b 242.97 –1.81

SE(b) 43.15 0.97

x2

–0.11

0.11

B –0.55

t 5.63 –1.87

Nilai-p 0.001 0.104

–0.28

–0.96

0.371

2

n = 10; R = 0.55

Data Tak-terstandardisasi dan Terstandardisasi Data seperti pada tabel 2.1 dinyatakan sebagai sebagai data dalam bentuk takterstandardisasi (unstandardized). Data tak-standardisasi x dapat diubah menjadi data terstandardisasi (standardized) z yang memiliki rerata nol dan standar deviasi satu dengan rumus transformasi: z=

x

(2.5)



Misalkan z y adalah bentuk terstandardisasi untuk variabel y dan z1 adalah bentuk terstandardisasi untuk variabel x1 , maka regresi z y terhadap z1 akan menghasilkan model dan persamaan garis regresi:

dan

z yi = B1 z1i + zei

(2.6)

zˆ y = B1 x1

(2.7)

B (beta) : Koefisien regresi untuk bentuk terstandardisasi

Garis regresi untuk bentuk terstandardisasi ini selalu melalui titik pangkal [0 ; 0], sehingga suku konstante selalu bernilai sama dengan nol (tidak ada suku konstante). Nilai  k dan estimasinya bk dalam analisis regresi dinamakan koefisien regresi, sedangkan nilai Bk (beta) dalam analisis jalur disebut koefisien jalur (ada yang menyebutnya hanya sebagai path / jalur). Perhatikan bahwa ada kepustakaan yang menamakan  k juga sebagai koefisien jalur, namun di sini istilah koefisien jalur hanya digunakan untuk Bk (beta). Untuk model regresi ganda dengan 2 prediktor seperti pada tabel 2.2.b, beta dapat diperoleh dari persamaan:

s  B1 = b1  1   sy   

dan

s  B2 = b2  2   sy   

11

(2.8)


s1 : standar deviasi x1 s2 : standar deviasi x2

Contoh 2.2: Lihat kembali data hipotetis pada tabel 2.1. Dengan transformasi z y = ; dan z2 =

y y x x ; z1 = 1 1 s1 sy

x2  x2 diperoleh data terstandardisasi seperti terlihat pada tabel 2.3. s2

Berdasarkan hasil analisis regresi pada tabel 2.2, diperoleh model regresi takstandardisasi dan terstandardisasi seperti yang ditampilkan pada tabel 2.4.

Tabel 2.3 Contoh data dalam bentuk tak-terstandardisasi dan bentuk terstandardisasi No 1 2 3 4 5 6 7 8 9 10 Rerata SD

y 116 152 134 132 130 118 136 108 108 128 126.2 13.77

x1 49 48 55 49 50 52 48 59 59 52 52.1 4.23

x2 240 209 210 171 255 232 147 268 231 199 216.2 37.18

zy

–0.74 1.87 0.57 0.42 0.28 –0.60 0.71 –1.32 –1.32 0.13 0.00 1.00

z1 –0.73 –0.97 0.69 –0.73 –0.50 –0.02 –0.97 1.63 1.63 –0.02 0.00 1.00

z2 0.64 –0.19 –0.17 –1.22 1.04 0.42 –1.86 1.39 0.40 –0.46 0.00 1.00

Tabel 2.4 Model regresi untuk data tak-terstandardisasi dan terstandardisasi beserta estimasinya

Regresi sederhana Regresi ganda

Model

Tak-terstandardisasi y =  0 + 1 x1 + 

Terstandardisasi z y = B1 z1 + z

Estimasi

y = 245.42– 2.29 x1 + e

z y = –0.70 z1 + ze

Model

y =  0 + 1 x1 +  2 x2 + 

z y = B1 z1 + B2 z2 + z

Estimasi

y = 242.97– 1.81 x1 – 0.11 x2 + e

z y = –0.55 z1 – 0.28 z2 + ze

12


Matriks Kovariansi dan Korelasi Variansi variabel random x dan kovariansi antara variabel random x dan y masingmasing adalah:

Var  x  = E  x   x 

(2.8)

Cov  x ; y  = E  x   x   y   y 

(2.9)

2

Estimasi dari data sampel adalah:

i  xi  x 

2

ˆ  x = Var

ˆ  x ; y= Cov

(2.8.a)

n 1

i  xi  x  yi  y 

(2.9.a)

n 1

Jika variabel random x dan y masing-masing dikonversi menjadi bentuk terstandardisasi

z x dan z y , maka korelasi antara x dan y sama dengan kovariansi antara z x dan z y :



Corr  x ; y  = Cov z x ; z y



(2.10)

Korelasi antara x dan y dapat juga diperoleh dari persamaan:

Corr  x ; y  =

Cov  x ; y 

(2.11)

 x y

Estimasi dari data sampel adalah:

ˆ  x ; y = Corr

ˆ  x ; y Cov sx s y

(2.11.a)

Contoh 2.3: Lihat data hipotetis pada tabel 2.1 dan bentuk terstandardisasinya pada tabel 2.3. Matriks kovariansi dan korelasinya untuk data tak-standardisasi diperlihatkan pada tabel 2.5, sedangkan matriks kovariansi dan korelasi untuk data terstandardisasi disajikan pada tabel 2.6. Perhatikan bahwa untuk data terstandardisasi, matriks kovariansinya identik dengan matriks korelasi.

13


Tabel 2.5 Matriks kovariansi dan korelasi untuk data tak-terstandardisasi Matriks kovariansi x1

y y x1 x2

189.73 –40.91 –293.60

Matriks korelasi

17.88 82.20

x2

y x1 x2

1382.40

y

x1

x2

1.00 –0.70 –0.57

1.00 0.52

1.00

Tabel 2.6 Matriks kovariansi dan korelasi untuk data terstandardisasi Matriks kovariansi zy zy

1.00

z1

–0.70 –0.57

z2

z1

1.00 0.52

Matriks korelasi zy

z2 zy

1.00

z1

–0.70 –0.57

z2

1.00

z1

z2

1.00 0.52

1.00

Analisis Regresi dengan Stata Terdapat beberapa cara untuk membuat file data Stata, cara yang termudah ialah dengan membuat file basis-data dalam Excel, yang kemudian di-“import” ke dalam Stata. Selanjutnya akan diperlihatkan prosedur analisis regresi dalam Stata dengan perintah regress.

Contoh 2.4 (Membuat file data Stata): Masukkan data hipotetis hubungan antara tekanan darah sistolik (y), usia (x1), dan kadar kolesterol serum (x2) yang ada pada tabel 2.1 pada lembar isian (spreadsheet) Excel. Simpan data pada folder D:\SEM\Data dengan nama sistolik.xls. Perintah Stata: Ambil file Excel sistolik.xls untuk dibuka dalam format Stata, selanjutnya simpan data dalam format data Stata: . import excel using “D:\SEM\Data\sistolik.xls”, firstrow . label variable y "tekanan darah sistolik" . label variable x1 "usia" . label variable x2 "kadar kolesterol serum" . save “D:\SEM\Data\sistolik.dta” file D:\SEM\Data\sistolik.dta saved

14


Perintah “import” adalah perintah Stata untuk mengambil file data dalam format non-Stata (umumnya file Excel) dan dibuka dalam format Stata. Perintah “label” adalah perintah untuk memberi „label‟ bagi variabel tertentu. Setelah itu file masih harus disimpan dalam format Stata dengan perintah “save” untuk memudahkan penggunaannya pada sesi lebih lanjut.

Contoh 2.5 (Analisis regresi dengan Stata): Perintah Stata: . use “D:\SEM\Data\sistolik.dta”, clear . regress y x1

y x1 _cons

Coef. −2.288378 245.4245

Std. Err. .8197659 42.8362

t −2.79 5.73

P>| t| 0.024 0.000

[ 95% Conf. Interval] −4.178762 −.3979942 146.644 344.2049

Perintah “regress” adalah perintah Stata untuk melaksanakan analisis regresi linear, baik sederhana maupun ganda. Perintah “regress” diikuti oleh nama variabel dependen, dan selanjutnya disusul oleh nama variabel independen. . regress y x1 x2

y x1 x2 _cons

Coef. −1.805473 −.1050276 242.9721

Std. Err. .9670317 .1099716 43.14995

t −1.87 −0.96 5.63

15

P>| t| 0.104 0.371 0.001

[ 95% Conf. Interval] −4.09214 .4811937 −.3650691 .155014 140.9387 345.0055


Contoh 2.6 (Analisis regresi terstandardisasi dengan Stata): Perintah Stata: . use “D:\SEM\Data\sistolik.dta”, clear . regress y x1, beta

y x1 _cons

Coef. −2.288378 245.4245

Std. Err. .8197659 42.8362

t −2.79 5.73

P>| t| 0.024 0.000

Beta −.7024456 .

Perintah “use” adalah perintah Stata untuk membuka file data Stata (file dengan ekstensi *.dta). Opsi “,clear” pada perintah “use” setelah nama dan jalur (path) file yang akan dibuka merupakan perintah untuk menghapus semua isi file data Stata terakhir yang masih terbuka dan ada dalam memori komputer. Opsi “, beta” pada perintah “regress” setelah nama variabel independen merupakan perintah untuk menampilkan koefisien beta, yaitu koefisien regresi terstandardisasi. . regress y x1 x2, beta

y x1 x2 _cons

Coef. −1.805473 −.1050276 242.9721

Std. Err. .9670317 .1099716 43.14995

t −1.87 −0.96 5.63

P>| t| 0.104 0.371 0.001

Contoh 2.7 (Regresi linear, contoh pada manual Stata): File data: auto.dta Variabel: variable name weight foreign mpg

variable label Weight (lbs.) Cartype Miliage (mpg)

16

Beta −.554212 −.283497 .


Model:

Persamaan: mpg = α + β1weight + β2weight2 + β3foreign + ε1

Perintah regress (analisis regresi linear): . sysuse auto . regress mpg weight c.weight#c.weight foreign Source

SS

df

MS

Model Residual

1689.15372 754.30574

3 70

563.05124 10.7757963

Total

2443.45946

73

33.4720474

Number of obs F(3,70) Prob > F R-squared Adj R-squared Root MSE

= = = = = =

74 52.25 0.0000 0.6913 0.6781 3.2827

mpg weight

Coef. −.0165729

Std. Err. .0039692

t −4.18

P>|t| 0.000

[95% Conf. Interval] −.0244892 −.0086567

c.weight#c.weight

1.59e-06

6.25e-07

2.55

0.013

3.45e-07

2.84e-06

foreign _cons

−2.2035 56.53884

1.059246 6.197383

−2.08 9.12

0.041 0.000

−4.3161 44.17855

−.0909002 68.89913

mpg weight

Coef. −.0165729

Std. Err. .0039692

t −4.18

P>|t| 0.000

Beta −2.226321

c.weight#c.weight

1.59e-06

6.25e-07

2.55

0.013

1.32654

foreign _cons

−2.2035 56.53884

1.059246 6.197383

−2.08 9.12

0.041 0.000

−.17527 .

. regress, beta

Perintah “sysuse” adalah perintah untuk membuka file data Stata yang dipasok oleh provider Stata dan disimpan dalam basis-data Stata pada saat meng-install program Stata. Dengan perintah “sysuse” cukup dituliskan nama file yang akan dibuka tanpa perlu menuliskan jalurnya. Pada perintah “regress” pertama di atas nama variabel dependen dan independennya harus ditulis lengkap, namun dalam perintah “regress” kedua yang 17


disertai opsi “, beta” nama-nama variabel tidak usah dituliskan lagi, asal perintah “regress” kedua langsung diberikan setelah perintah “regress” pertama tanpa diselingi perintah Stata lainnya. Pembahasan lebih rinci tentang perintah-perintah Stata untuk analisis regresi linear dapat dilihat pada Lampiran 2.

18

Bab 3. Konsep-konsep Dasar Analisis Jalur

BAB 3 KONSEP-KONSEP DASAR ANALISIS JALUR Analisis Jalur dan Model Struktural Model struktural dalam SEM adalah model yang menggambarkan struktur hubungan antara sejumlah variabel teramati. Variabel teramati (observed variables) adalah variabel yang nilainya ada dalam himpunan-data (dataset). Dalam model ini tidak dipentingkan cara pengukuran yang dilakukan untuk memperoleh nilai-nilai untuk variabel tersebut. Berdasarkan arahnya, efek antar-variabel dibedakan menjadi efek searah dan efek resiprokal. Efek searah adalah efek yang terjadi secara searah antara variabel kausal (sebab) dengan variabel efek (akibat), misalnya efek searah variabel X terhadap variabel Y (X → Y). Efek resiprokal adalah efek yang terjadi secara dua-arah antar dua variabel, misalnya efek resiprokal antara variabel Y1 dan Y2 ( Y1

Y2 ). Pada efek resiprokal ini tidak dapat dibedakan

variabel mana yang merupakan variabel kausal atau variabel efek.

Asumsi dalam Analisis Jalur Asumsi-asumsi dalam analisis jalur dapat dibagi menjadi dua kelompok: 1.

Asumsi teoretis: Asumsi kausalitas yang tergantung pada terpenuhinya persyaratan berikut: a.

Model dispesifikasikan dengan benar.

b.

Ada hubungan teramati dan dapat diukur (observed and measurable relationship) antara variabel independen X dan variabel dependen Y (ada korelasi antara X dan Y).

c.

Ada urutan temporal: variabel independen X secara temporal harus terjadi mendahului variabel dependen Y.

d.

Tidak ada hubungan palsu (nonspurious relationship) antara variabel independen X dan variabel dependen Y (hubungan teramati, dapat diukur, dan temporal antara X dan Y tidak hilang dengan pengendalian terhadap efek variabel-variabel lain).

2.

Asumsi statistika: a.

Asumsi yang terkait dengan regresi ganda: asumsi normalitas, homoskedastisitas, dan linearitas.

19


b.

Besar hubungan antara dua variabel independen yang berkorelasi satu sama lain dan tak-teranalisis direpresentasikan oleh koefisien korelasinya.

c.

Pengukuran variabel endogen sekurang-kurangnya berskala interval.

d.

Pengukuran variabel eksogen bersifat bebas-galat.

e.

Arah hubungan kausal terspesifikasi dengan benar: apakah X menyebabkan Y (X → Y), Y menyebabkan X (Y → X), atau terdapat hubungan resiprokal (X

f.

Bentuk

distribusi

diketahui:

Bentuk

distribusi

Y).

probabilitas

parameter

dispesifikasikan.

Parameter dan Derajat Bebas Model Pada model struktur kovariansi (SEM tanpa analisis rerata), parameter-nya adalah efek langsung terhadap variabel endogen serta variansi dan kovariansi variabel eksogen. Efek langsung yang dimaksud adalah efek yang besarnya yaitu nilai parameternya harus diestimasi. Dengan demikian maka jumlah parameter q dapat ditentukan dengan menghitung jumlah lambang →,

, dan

dalam diagram SEM, yaitu jumlah efek langsung

searah (koefisien regresi), variansi, dan kovariansi. Parameter model dapat bersifat bebas, terfiksasi, ataupun terkendala. Parameter bebas (free parameter) harus diestimasi berdasarkan data yang ada. Parameter terfiksasi (fixed parameter) dispesifikasikan nilainya sama dengan konstante tertentu. Parameter terkendala (constrained parameter) harus diestimasi dalam batasan tertentu, namun nilainya tidak terfiksasi sama dengan konstante tertentu. Dalam perhitungan jumlah parameter di atas, parameter terfiksasi tidak diikutsertakan. Dua parameter yang dikendalakan memiliki nilai yang sama tetapi tidak difiksasikan besar nilainya, diperhitungkan sebagai satu parameter dalam menghitung jumlah parameter. Dalam pembahasan selanjutnya, istilah „terfiksasi‟ dan „terkendala‟ ini akan seringkali saling dipertukarkan dengan pengertian yang sama. Jika  menyatakan jumlah variabel teramati dalam model, maka banyak nilai pada diagonal matriks kovariansi dan di bawahnya, yang menyatakan banyak nilai variansi dan kovariansi tak-berulang (nonredundant covariances; kovariansi unik) adalah:  + ( − 1) + ( − 2) + . . . + 1

Banyak nilai ini dinamakan juga sebagai jumlah titik data (number of data points) untuk model struktur kovariansi, yaitu: p=

   1

(3.1)

2

20


p : jumlah pengamatan  : jumlah variabel teramati dalam model

Selisih antara jumlah titik data dengan jumlah parameter merupakan derajat bebas model, yaitu: df M = p – q

(3.2)

df M : derajat bebas model

q

: jumlah parameter yang diestimasi Jumlah titik data p merupakan jumlah parameter maksimal yang dapat diestimasi dalam

suatu model persamaan struktural. Kline (2005) menamakan jumlah titik data ini sebagai jumlah pengamatan (number of observations) bagi struktur kovariansi yang berbeda dengan ukuran sampel n. Ada pula yang menyebutkannya sebagai jumlah moment sampel (number of sample moments). Pada program Stata istilah „jumlah pengamatan‟ memiliki pengertian yang sama dengan „ukuran sampel‟ N (lambang ukuran sampel pada Stata), sedangkan jumlah titik data dinamakan sebagai momen derajat-dua (second-order moments).

Tipe Model Jalur Didapatkan dua tipe dasar model jalur yaitu model rekursif dan model non-rekursif. Model rekursif adalah model jalur dengan seluruh hubungan antar-variabelnya bersifat searah (efek searah) yang tidak membentuk loop tertutup dan seluruh suku pengganggunya tak saling berkorelasi. Contoh model rekursif diperlihatkan pada gambar 3.1.a. Model non-rekursif adalah model jalur yang memiliki sekurang-kurangnya satu loop tertutup atau hubungan antar-variabel dua-arah (efek resiprokal) dan/atau suku pengganggu yang saling berkorelasi. Contoh model non-rekursif diperlihatkan pada gambar 3.1.b. Selain itu masih didapatkan model jalur yang bersifat rekursif parsial (gambar 3.2).

21


Gambar 3.1 (a) Contoh model rekursif (kiri); (b) Contoh model non-rekursif (kanan)

Gambar 3.2 Contoh model rekursif parsial: (a) Pola bebas-busur (dianggap rekursif; kiri) dan (b) Pola busur (dianggap non-rekursif; kanan)

Pola bebas-busur (bow-free pattern) seperti pada gambar 3.2 kiri adalah pola dengan korelasi antara dua suku pengganggu tanpa adanya jalur antara variabel endogennya. Dalam estimasi parameter, pola ini dapat diperlakukan seperti model rekursif. Pada pola busur (bow pattern; gambar 3.2 kanan), korelasi antara dua suku pengganggu disertai dengan jalur antara kedua variabel endogennya.

Identifikasi Model Sebuah model jalur dikatakan teridentifikasi (identified) jika secara teoretis dimungkinkan untuk memperoleh estimasi yang unik bagi setiap parameter. Persyaratan untuk identifikasi model SEM ialah: (1) Jumlah titik data lebih besar atau sama dengan jumlah parameter yang diestimasi ( df M > 0), dan (2) Variabel laten (tidak ada yang

22


dianalisis pada model jalur) sekurang-kurangnya berskala interval. Berdasarkan status identifikasinya, model jalur dibedakan menjadi: 1.

Kurang-teridentifikasi (under-identified): df M < 0

2.

Tepat-teridentifikasi (just-identified): df M = 0

3.

Lebih-teridentifikasi (over-identified): df M > 0 Model yang tepat-teridentifikasi, yang disebut juga sebagai model jenuh hanya

memiliki sedikit kegunaan, walaupun sesuai sempurna dengan data. Kegunaannya yaitu hanya untuk mengestimasi koefisien regresi dan koefisien jalur. Jika model kurangteridentifikasi, estimasi parameter tak dapat dilakukan dan peneliti dianjurkan untuk memperbaiki model dengan mengurangi jumlah parameter yang hendak diestimasi. Hanya pada model yang lebih-teridentifikasi analisis SEM disarankan diteruskan. Model rekursif secara teoretis akan selalu teridentifikasi, namun dapat menjadi kurang

teridentifikasi

secara

empirik

(empirical

under-identified)

karena

adanya

multikolinearitas. Estimasi parameter untuk model kurang-teridentifikasi dengan program statistik komputer akan menyebabkan berlangsungnya proses iteratif secara terus menerus tanpa konvergensi. Cara mengatasinya adalah menghentikan program dan mengulangi proses estimasi dengan terlebih dahulu menentukan batasan jumlah iterasi. Adakalanya tidak mudah untuk menentukan status identifikasi bagi model yang rumit. Dalam hal ini Brown (2006) menganjurkan untuk menjalankan program statistik komputer dan membiarkan program komputer yang menentukan status identifikasi model.

Ukuran Sampel Perhatikan bahwa pada sebagian literatur tentang SEM, istilah „ukuran sampel‟ (jumlah anggota sampel) memiliki pengertian yang berbeda dengan istilah „jumlah pengamatan„ (Kline, 2005). Seperti halnya dengan teknik statistika lainnya, sampel besar akan menghasilkan estimasi dengan galat sampling (sampling error) lebih kecil daripada yang dihasilkan oleh sampel kecil. Perhitungan ukuran sampel minimum yang dibutuhkan dapat dilakukan berdasarkan analisis kekuatan (power analysis) yang diinginkan, namun secara kasar ukuran sampel dapat dibedakan menjadi: - Sampel kecil: N < 100 - Sampel sedang: 100 < N < 200 - Sampel besar: N > 200

23


Ukuran sampel minimum yang dibutuhkan juga dapat dihitung secara kasar dengan rasio 10 : 1 terhadap jumlah parameter yang diestimasi, misalnya model jalur dengan 20 parameter akan membutuhkan ukuran sampel minimum sebesar 200 kasus. Jackson (2003) menganjurkan rasio ukuran sampel minimum ideal : parameter model sebesar 20 : 1 untuk estimasi maximum likelihood.

Hubungan Antar-Variabel Hubungan antara variabel terdiri atas efek kausal dan asosiasi non-kausal. Efek kausal adalah efek yang diasumsikan menyatakan kausalitas (hubungan sebab-akibat) antar dua variabel, dapat berupa efek langsung ataupun efek tak-langsung. Efek langsung (direct effect) adalah efek kausal hipotetis suatu variabel terhadap variabel kedua yang terjadi secara langsung tanpa melalui variabel ketiga. Efek searah suatu variabel terhadap variabel lainnya dinyatakan dengan lambang anak panah (“→”). Misalnya, efek langsung variabel X terhadap variabel Y dinyatakan sebagai X → Y. Besarnya efek searah dinyatakan sebagai koefisien regresi (tak-terstandardisasi) atau koefisien jalur (terstandardisasi). Efek tak-langsung (indirect effect) adalah efek kausal hipotetis suatu variabel terhadap variabel kedua yang terjadi melalui satu atau lebih variabel mediator (intervening variables). Misalnya, efek tak langsung variabel X terhadap variabel Y2 yang terjadi melalui variabel mediator Y1 dinyatakan sebagai X → Y1 → Y2 . Jika bX 1 menyatakan koefisien regresi X terhadap Y1 dan b12 menyatakan koefisien regresi Y1 terhadap Y2 , maka besar efek taklangsung (tak-terstandardisasi) X terhadap Y2 adalah bX 1 . b12 . Dalam bentuk terstandardisasi jika p X 1 menyatakan koefisien jalur X terhadap Y1 dan p12 menyatakan koefisien jalur Y1 terhadap Y2 , maka besar efek tak-langsung terstandardisasi X terhadap Y2 adalah p X 1 . p12 . Asosiasi non-kausal adalah hubungan suatu variabel dengan variabel kedua yang terjadi melalui variabel ketiga yang berkorelasi namun asosiasinya tak-teranalisis dengan variabel pertama, dinyatakan sebagai X 1

X 2 →Y atau X 1

24

X 2 → Y1 → . . . → Yk

BAB 4 ESTIMASI PARAMETER Parameter Model Jalur Untuk menjelaskan dasar-dasar perhitungan estimasi pada SEM, digunakan contoh model jalur Illness oleh Roth et al (1989) yang dalam bentuk penyederhanaan dapat diperlihatkan seperti pada gambar 4.1.

Gambar 4.1 Contoh model jalur Illness (Roth et al, 1989)

Dengan teknik statistika regresi ganda, model di atas dapat diuraikan menjadi tiga model regresi ganda: Fit = A3 + B13 Exe + B23 Hard + D3

(4.1)

Str = A4 + B14 Exe + B24 Hard + B34 Fit + D4

(4.2)

Ill = A5 + B15 Exe + B25 Hard + B35 Fit + B45 Str + D5

(4.3)

Keterangan: 1-Exe: Exercise; 2-Hard: Hardiness; 3-Fit: Fitness; 4-Str: Stress; 5-Ill: Illness. Dalam notasi SEM, gambaran model jalur di atas biasanya disajikan lebih lengkap seperti terlihat pada gambar 4.2, dengan beberapa tambahan: a.

Variansi untuk tiap variabel eksogen (Exe dan Hard)

b.

Korelasi antar variabel eksogen (antara Exe dengan Hard)

c.

Suku pengganggu (disturbance) untuk tiap variabel endogen ( DFi , DSt , dan DIl ).

d.

Variansi untuk tiap suku pengganggu (variansi DFi , DSt , dan DIl ). 25

e.

Koefisien jalur tiap suku pengganggu ke variabel endogennya yang terfiksasi menjadi bernilai sama dengan 1 ( DFi → Fit, DSt → Str, dan DIl → Ill). Anak panah yang terputus-putus dimaksudkan untuk menyatakan perkiraan bahwa

koefisien regresi atau koefisien jalurnya bernilai sama dengan nol.

Gambar 4.2 Contoh model jalur Illness dalam notasi SEM

Estimasi matriks kovariansi dan korelasi data Illness yang diperoleh dengan metode ML (maximum likelihood) dari sampel yang terdiri atas 373 orang mahasiswa diperlihatkan pada tabel 4.1. Perhatikan bahwa dengan teknik statistika standar, variansi populasi  2 diestimasikan dengan variansi sampel s populasi  diestimasikan sebagai S 2

2

2

  xi  x  = n 1

  xi  x  = n

2

, tetapi dengan metode ML variansi

2

. Untuk sampel besar, nilai s 2 dan S 2

dapat dianggap sama, namun untuk sampel kecil S 2 merupakan estimator yang bias negatif bagi variansi populasi  2 . Juga untuk kovariansi sampel, estimasi tak biasnya adalah cov( x1 ; x2 ) =

  x1i  x1  x2i  x2  , n 1

diestimasikan sebagai Cov ( x1 ; x2 ) =

namun dengan metode ML kovariansi populasi

  x1i  x1  x2i  x2  n

26

Akibat penggunaan S

2

  xi  x  = n

2

sebagai estimasi variansi populasi yaitu:

-

Nilai estimasi rerata variabel terstandardisasi tidak sama dengan nol.

-

Untuk model regresi terstandardisasi, nilai estimasi intersep tidak sama dengan nol.

Tabel 4.1 Estimasi matriks kovariansi dan korelasi data Illness a. Matriks kovariansi Variabel 1. Exe 2. Hard 3. Fit 4. Str 5. Ill

Variabel 1. Exe 2. Hard 3. Fit 4. Str 5. Ill SD

Exe 4422.25 –75.81 954.41 –222.78 –332.39

Hard

Fit

Str

Ill

1444.00 97.89 –585.58 –379.88

1354.24 –320.53 –666.79

4489.00 1423.29

3903.75

Str

Ill

1.00 0.34 67.00

1.00 62.48

b. Matriks korelasi Hard Fit

Exe 1.00 –0.03 0.39 –0.05 –0.08 66.50

1.00 0.07 –0.23 –0.16 38.00

1.00 –0.13 –0.29 36.80

Perhatikan bahwa kedua matriks ini saling berkaitan, dari matriks kovariansi dapat diperoleh matriks korelasi, sebaliknya dari matrik korelasi dan nilai-nilai standar deviasi dapat dihitung matriks kovariansi.

Contoh 4.1: Dari nilai Cov (Exe ; Fit) = 954.41, Var (Exe) = 4422.25, dan Var (Fit) = 1354.24 dapat dihitung nilai Corr (Exe ; Fit): Corr (Exe ; Fit) =

=

Cov  Exe ; Fit  SD  Exe  SD  Fit 

954.41

 4422.25 1354.24 

= 0.39

Atau nilai Cov (Hard ; Str) dapat dihitung dari Corr (Hard ; Str) = –0.23, SD (Hard) = 38.00, dan SD (Str) = 67.00:

27

Cov (Hard ; Str) = Corr (Hard ; Str) . SD (Hard) . SD (Str) = (–0.23)(38.00)(67.00) = –585.58

Estimasi Efek pada Model Jalur Estimasi nilai-nilai koefisien jalur yang dilakukan dengan metode maximum likelihood memerlukan proses iteratif, sehingga umumnya tak dapat dilakukan secara manual, tetapi membutuhkan program komputer untuk menyelesaikannya. Pada program statistik komputer demikian, sebagai masukan (input) dapat diisikan nilai-nilai tiap variabel teramati yang ada pada dataset, namun dapat juga diberikan matriks kovariansi atau korelasi (disertai standar deviasi tiap variabel).

Gambar 4.3 Model jalur Illness dengan nilai-nilai estimasi koefisien regresi (atas) dan koefisien jalurnya (bawah) 28

Sebagai contoh, untuk data Illness di atas menghasilkan estimasi nilai-nilai koefisien regresi (tak-terstandardisasi; atas) dan koefisien korelasi (terstandardisasi; bawah) seperti terlihat pada gambar 4.3, sedangkan hasil penilaian kemaknaannya diperlihatkan pada tabel 4.2.

Tabel 4.2 Estimasi parameter tak-terstandardisasi dan terstandardisasi model jalur Illness a. Efek langsung

 

Parameter

bij

SE bij

pij

Exe → Fit Hard → Fit Exe → Str Hard → Str Fit → Str Exe → Ill Hard → Ill Fit → Ill Str → Ill

.217** .079 –.014 –.393** –.198 .032 –.121 –.442** .271**

.026 .046 .055 .089 .099 .048 .079 .087 .045

.392 .082 −.014 −.223 −.109 .034 −.074 −.260 .291

b. Variansi dan kovariansi Parameter

Var (X)

SE (X)

Var (Z)

Exe Hard Exe Hard

DFit

4410.39** 1440.13** −75.607 1136.16**

323.39 105.60 130.73 83.31

1.000 1.000 −.030 .841

DStr

4181.00**

306.57

.934

DIll

3178.98**

233.09

.817

*: p < .05; **: p < .01 Sumber: Roth et al (1989); N = 373

Interpretasi terhadap nilai-nilai estimasi pada model jalur Illness tersebut ialah: 1.

Besar efek langsung adalah sama dengan koefisien regresi pada model takterstandardisasi dan koefisien jalur (nilai beta) pada model terstandardisasi. Untuk contoh di atas, efek langsung b13 = 0.217 pada gambar 4.3 atas adalah estimasi koefisien regresi Exe ke Fit (Exe → Fit), sedangkan efek langsung p13 = 0.392 pada gambar 3 bawah adalah estimasi koefisien jalur Exe ke Fit.

29

2.

Variansi suku pengganggu pada model tak terstandardisasi merupakan estimasi bagi variansi variabel endogen yang berkaitan yang tak dijelaskan oleh variabel eksogen yang merupakan prediktornya. Untuk contoh pada gambar 4.3 atas, variansi suku pengganggu DFi sebesar 1136.16 adalah estimasi variansi Fit yang tak dijelaskan oleh Exe dan Hard. Estimasi variansi Fit seluruhnya, termasuk yang dijelaskan oleh Exe dan Hard, adalah 1354.24 (matriks 1.a).

3.

Untuk model terstandardisasi, variansi variabel eksogen selalu sama bernilai 1, sedangkan variansi suku pengganggu merupakan estimasi proporsi variansi variabel endogen yang berkaitan yang tak dijelaskan oleh variabel eksogen prediktornya. Untuk contoh pada gambar 4.3 bawah, variansi suku pengganggu DFi sebesar 0.841 adalah estimasi proporsi variansi Fit yang tak dijelaskan oleh Exe dan Hard. Nilai ini 2 2 sama besarnya dengan 1 – RFi , RFi adalah koefisien determinasi Fit pada regresinya

terhadap Exe dan Hard.

Dekomposisi Efek Koefisien korelasi adalah ukuran kekuatan hubungan terstandardisasi antara dua variabel kontinu. Pada SEM, hubungan antara variabel dapat dibedakan menjadi efek kausal dan asosiasi non-kausal. Efek kausal adalah efek yang diasumsikan menyatakan kausalitas (hubungan sebab-akibat) antar dua variabel, dapat berupa efek langsung ataupun efek taklangsung. Efek langsung (direct effect) adalah efek kausal hipotetis suatu variabel terhadap variabel kedua yang terjadi secara langsung tanpa melalui variabel ketiga. Efek searah suatu variabel terhadap variabel lainnya dinyatakan dengan lambang anak panah (“→”). Misalnya, efek langsung variabel x terhadap variabel y digambarkan sebagai x → y. Besarnya efek searah dinyatakan sebagai koefisien regresi (tak-terstandardisasi) atau koefisien jalur (terstandardisasi). Efek tak-langsung (indirect effect) adalah efek kausal hipotetis suatu variabel terhadap variabel kedua yang terjadi melalui satu atau lebih variabel mediator (intervening variables). Efek tak langsung variabel x terhadap variabel y2 yang terjadi melalui variabel mediator y1 dalam hubungan x → y1 → y2 adalah: bx 2 = bx1 . b12

(4.4)

30

bx 2

: efek tak-langsung (tak-terstandardisasi) x terhadap y2

bx1

: efek langsung (tak-terstandardisasi) x terhadap y1 (koefisien regresi x ke y1 )

b12

: efek langsung (tak-terstandardisasi) y1 terhadap y2 (koefisien regresi y1 ke y2 ) Dengan kondisi yang sama, untuk bentuk terstandardisasi diperoleh: p x 2 = p x1 . p12

(4.5)

p x 2 : efek tak-langsung (terstandardisasi) x terhadap y2 p x1 : efek langsung (terstandardisasi) x terhadap y1 (koefisien jalur x ke y1 ) p12

: efek langsung (terstandardisasi) y1 terhadap y2 (koefisien jalur y1 ke y2 ) Asosiasi non-kausal adalah hubungan suatu variabel dengan variabel kedua yang

terjadi melalui variabel ketiga yang berkorelasi namun asosiasinya tak-teranalisis dengan variabel pertama, digambarkan sebagai atau x1

x2 → y1 → . . . → yk . Dalam hubungan x1

x2 → y, asosiasi non kausal antara x1 dengan y adalah:

a1 y = r12 . p2 y

(4.6)

a1 y

: asosiasi non-kausal antara x1 dengan y

r12

: korelasi (asosiasi tak-teranalisis) antara x1 dengan x2

p2 y : efek langsung (terstandardisasi) x2 terhadap y (koefisien jalur x2 ke y )

Contoh 4.2: Hubungan antara Exe dengan Ill (terstandardisasi) dapat dijabarkan sebagai berikut: 1.

Efek kausal langsung (Exe → Ill):

2.

Efek kausal tak-langsung:

0.0340

- Exe → Fit → Ill

: (0.392)(–0.260)

= –0.1019

- Exe → Str → Ill

: (–0.014)(0.291)

= –0.0041

- Exe → Fit → Str → Ill : (0.392)(–0.109)(0.291)

= –0.0124

Jumlah efek kausal tak-langsung

–0.1184

Jumlah efek kausal adalah

–0.0844

31

3.

Asosiasi non-kausal: - Exe

Hard → Ill

: (–0.030)(–0.074)

= 0.0022

- Exe

Hard → Fit → Ill

: (–0.030)(0.082)(–0.260)

= 0.0006

- Exe

Hard → Str → Ill

: (–0.030)(–0.223)(0.291)

= 0.0019

- Exe

Hard → Fit → Str → Ill : (–0.030)(0.082)(–0.109)(0.291) = 0.0001

Jumlah asosiasi non-kausal

0.0049 –0.0795

Besar hubungan seluruhnya antara Exe dengan Ill adalah:

Hubungan antara Exe dengan Ill sebesar –0.0795 ini adalah sama dengan koefisien korelasi antara Exe dengan Ill, yaitu –0.08 (dengan pembulatan, tabel 4.1.b).

Uji Sobel Uji Sobel adalah uji statistik untuk efek tak-langsung tak terstandardisasi antar dua variabel yang terjadi melalui satu variabel mediator. Misalkan dalam hubungan x → y1 → y2 , b1 menyatakan koefisien regresi x ke y1 dengan standard error SE1 dan b2 menyatakan

koefisien regresi y1 ke y2 dengan standard error SE2 , maka statistik penguji untuk uji hipotesis H 0 : 12 = 0 adalah: Z uji =

b12 SE12

(4.7)

yang berdistribusi Z (normal standar) dengan: SE12 =

 b2   SE1   b1   SE2  2

2

2

2

(4.8)

b12 = b1. b2 : Efek tak-langsung (tak-terstandardisasi) x terhadap y2 SE12

: Standard error ( b1. b2 ) Uji Sobel ini memiliki akurasi yang memadai untuk sampel berukuran besar.

Contoh 4.3: Lihat kembali model jalur Illness pada gambar 4.3. Misalkan hendak diuji hipotesis H 0 : 12 = 0 dengan 12 menyatakan efek tak-langsung (tak-terstandardisasi) Exe terhadap Ill melalui Exe → Fit → Ill dalam populasi. Estimasinya dari data sampel adalah b12 yang nilainya diperoleh sebagai hasil perkalian b1 b2 , b1 menyatakan koefisien regresi Fit terhadap Exe dan b2 menyatakan koefisien regresi Ill terhadap Fit. 32

b1 = 0.217

b2 = –0.442

SE1 = 0.026

SE2 = 0.087

(Nilai SE1 dan SE2 diperoleh dari keluaran program statistik komputer) b12 = ( b1 )( b2 )

= (0.217)(–0.442) = –0.096 SE12 =

= Z uji =

=

 b2   SE1   b1   SE2  2

2

2

 0.442   0.026  2

2

2

 0.217  0.087  = 0.022 2

2

b12 SE12 0.096 = –4.34 0.022

Notasi Jalur SEM “sem path notation” merupakan sintaks perintah untuk diagram jalur (command syntax for path diagrams). Sintaks-nya adalah: sem paths . . . [, covariance() variance() means() [group()]] Jalur (paths) menspesifikasikan arah jalur antar variabel model peneliti. Model yang akan disesuaikan sepenuhnya dideskripsikan oleh “paths, covariance(), variance(), and means()”. Sintaks unsur-unsur ini dimodifikasikan (digeneralisasikan) apabila opsi “group()” dispesifikasikan. Jalur untuk regresi sederhana dituliskan sebagai: (vardep <− varind) atau (varind −>vardep) vardep

: variabel dependen

varind

: variabel independen

Misalnya: (y <− x) atau (x −> y) Perhatikan bahwa: - Variabel laten dinamai dengan huruf besar untuk huruf pertamanya - Variabel teramati dinamai dengan huruf kecil untuk huruf pertamanya

33

Jalur untuk regresi ganda dituliskan sebagai: (vardep<− varind1) (vardep<− varind2) (vardep<− varind3) atau: (varind1 −>vardep) (varind2 −>vardep)(varind3 −>vardep) atau: (vardep −>varind1 varind2 varind3) atau: (varind1 varind2 varind3 −>vardep) Misalnya: (y <− x1 ) (y <− x 2 ) (y <− x 3 ) Penulisan suku galat bersifat opsional, sehingga (y <− x) dapat dibaca atau boleh dituliskan sebagai: (y <− x e.y) e.y

: suku pengganggu (disturbance) Jika koefisien jalur suku galat difiksasikan bernilai sama dengan satu, maka keadaan ini

dituliskan sebagai: (y <− x e.y@1) Fiksasi juga dapat diberlakukan terhadap koefisien jalur salah satu prediktor, misalnya p2Y = 2: (y <− x1 x 2 @2 x 3 ) Kendala dapat diberikan sedemikian hingga koefisien jalur prediktor X 2 bernilai sama dengan koefisien jalur prediktor X 3 (tanpa menspesifikasi nilainya): (y <− x1 x 2 @b x 3 @b)

Estimasi Koefisien Jalur SEM dengan Stata Pada analisis sem dapat digunakan file data Stata yang memuat nilai-nilai invididual variabel teramati bagi tiap anggota sampel, namun dapat pula digunakan file data statistik ringkasan (summary statistics data; ssd) yang hanya memuat statistik ringkasan seperti rerata, standar deviasi, kovariansi, atau korelasi. Dalam contoh berikut akan diperlihatkan prosedur pembuatan file data statistik ringkasan untuk model illness (gambar 4.1) dengan menggunakan data tabel korelasi 4.1.b.

34

Contoh 4.4 (Membuat file data statistik ringkasan): Perintah ssd (summary statistics data): . clear all . ssd init exe hard fit stress ill Summary statistics data initialized. Next use, in any order, ssd set observations (required) It is best to do this first. ssd set means (optional) Default setting is 0. ssd set variances or ssd set sd (optional) Use this only if you have set or will set correlations and, even then, this is optional but highly recommended. Default setting is 1. ssd set covariances or ssd set correlations (required)

. ssd set observations 384 (value set) Status: observations: means: variances or sd: covariances or correlations:

set unset unset unset

(required to be set)

. ssd set sd 66.50 38.00 36.80 67.00 62.48 (values set) Status: observations: means: variances or sd: covariances or correlations:

set unset set unset

(required to be set)

. ssd set correlations 1.00 \ −.03 1.00 \ .39 .07 1.00 \ −.05 −.23 −.13 1.00 \ −.08 −.16 −.29 .34 1.00 (values set) Status: observations: means: variances or sd: covariances or correlations:

set unset set set

. label variable exe "exercise" . label variable hard "hardiness"

35

. label variable fit "fitness" . label variable stress “stress” . label variable ill "illness" . save "D:\SEM\Data\illness.dta"

Perintah “ssd init” adalah perintah Stata untuk memulai pembuatan file ssd (summary statistics data), yaitu file Stata yang tidak berisikan data lengkap, melainkan hanya memuat jumlah anggota sampel dan matriks kovariansi atau korelasi. File ssd juga dapat diisi dengan nilai-nilai rerata dan/atau variansi atau standar deviasi yang bersifat opsional. Perintah “ssd init” disertai dengan nama-nama variabel dalam file ssd yang akan dibuat. Pembuatan file ssd dilanjutkan dengan perintah “ssd set observations” yang bersifat wajib untuk memasukkan data jumlah anggota sampel, perintah “ssd set means” yang bersifat opsional untuk memasukkan nilai-nilai rerata, perintah “ssd set variances” atau “ssd set sd” yang bersifat opsional untuk memasukkan nilai-nilai variansi atau standar deviasi, serta perintah “ssd set covariances” atau “ssd set correlations” yang bersifat wajib untuk memasukkan nilai-nilai matriks kovariansi atau korelasi. Berikutnya dengan Data Editor dapat dilihat isi file sebagaimana tersaji di bawah ini. Tampak bahwa file tidak memuat data individu anggota sampel, melainkan data ringkasannya. Baris pertama (_type 1) seharusnya menampilkan nilai-nilai rerata variabel, tetapi di sini kosong karena memang tidak dimasukkan. Baris kedua (_type 2) memuat nilainilai standar deviasi, sedangkan baris ketiga sampai dengan ketujuh menampilkan matriks korelasi.

36

Contoh 4.5 (Membuat file ssd dari file data individual): File ssd dapat diperoleh sebagai konversi file data individual. Pembuatan file ssd ini terbagi atas 2 tahap, yaitu tahap persiapan dan tahap konversi data. Tahap persiapan dimaksudkan untuk mempersiapkan data yang ada dalam file data individual sebelum pelaksanaan konversi. Langkah-langkah untuk tahap persiapan terdiri atas: 1.

Buang variabel pada file data individual yang tak dibutuhkan untuk menganalisis file ssd.

2.

Pastikan tidak ada variabel „string‟ dalam data tersisa.

3.

Pastikan tidak ada nilai hilang (missing values) dalam data tersisa.

4.

Pastikan semua variabel ada dalam skala yang wajar. Dianjurkan rasio rerata variabel terbesar dengan variabel terkecil tidak melebihi 1000 atau 10,000. Jika ditemukan keadaan demikian, dilakukan penskalaan untuk memperkecil nilai-nilai variabel terbesar.

5.

Variabel baru yang mungkin akan dibutuhkan sebagai hasil transformasi variabel lama harus dibuat pada tahap ini. Setelah dilakukan konversi menjadi file ssd tidak dapat lagi dilakukan penambahan variabel baru.

6.

Susun kembali variabel dalam urutan logis untuk mempermudah pengguna file ssd memahami data.

7.

Simpan data yang sudah siap untuk dikonversi ini dalam bentuk file data individual biasa. File ini mungkin masih dibutuhkan suatu waktu kelak.

37

Pelaksanaannya diperlihatkan pada contoh berikut: . use “D:\SEM\Data\honolulu.dta” . keep bb tb usia glukosa kolest sistolik . summarize Variable bb tb usia glukosa kolest sistolik

Obs 100 100 100 100 100 100

Mean 64.22 161.75 53.67 152.14 216.96 130.1

Std.Dev. 8.610048 5.596491 5.101109 54.75584 38.85844 21.20677

Min 47 150 46 58 134 92

Max 91 175 67 442 382 208

. gen bmi = bb/((tb/100)^2) . label var bmi “indeks massa tubuh” . order usia bb tb bmi . save “D:\SEM\Data\honolulu_raw.dta” file D:\SEM\Data\honolulu_raw.dta saved

Tahap berikutnya adalah konversi data dengan langkah-langkah sebagai berikut: 1.

Konversi file data individual yang telah dipersiapkan menjadi file ssd.

2.

Lihat dan periksa file ssd yang dihasikan.

3.

Simpan file ssd. Pelaksanaannya diperlihatkan sebagai lanjutan contoh di atas:

. use “D:\SEM\Data\honolulu_raw.dta” . ssd build _all (data in memory now summary statistics data; you can use ssd describe and ssd list to describe and list results.)

. ssd describe Summary statistics data obs: vars:

100 7 (_dta has notes)

variable name

variable label

usia bb tb bmi glukosa kolest sistolik

Usia Berat Badan Tinggi Badan Indeks Massa Tubuh Kadar Glukosa Kadar Kolesterol Tekanan Darah Sistolik

. ssd list Observations = 100

38

Means: usia 53.67

bb 64.22

tb 161.75

bmi 24.548406

glukosa 152.14

kolest 216.96

sistolik 130.1

Variances implicitly defined; they are the diagonal of the covariance matrix. Covariances: usia 26.021313 −10.138788 −7.2247475 −1.5991521 60.470909 21.552323 23.992929

bb

tb

bmi

glukosa

kolest

sistolik

74.132929 18.520202 22.384707 25.110303 9.6957576 −5.2949495

31.320707 −2.6120988 −33.186869 −61.414141 −4.9646465

9.3197763 19.655521 22.584735 −.54070781

2998.2024 717.3996 307.4404

1509.9782 155.17576

449.72727

. save “D:\SEM\Data\honolulu_ss.dta” file D:\SEM\Data\honolulu_ss.dta saved

Contoh 4.6 (Regresi linear ganda dengan SEM, contoh pada manual Stata): Regresi linear ganda (multiple linear regression) adalah analisis regresi linear dengan variabel independen lebih daripada satu. File data: auto.dta (lihat kembali contoh 2.7) Variabel: variable name weight foreign mpg

variable label Weight (lbs.) Cartype Miliage (mpg)

Model:

Persamaan: mpg = α + β1weight + β2weight2 + β3foreign + ε1

Perintah sem (structural equation modeling): . generate weight2 = weight^2

39

. sem (mpg <− weight weight2 foreign) Endogenous variables Observed: mpg

Exogenous variables Observed: weight weight2 foreign Fitting target model: Iteration 0: Iteration 1:

log likelihood = −1909.8206 log likelihood = −1909.8206

Structural equation model Estimation method = ml Log likelihood = −1909.8206

Number of obs

Coef.

OIM Std. Err.

z

P>|z|

weight weight2 foreign _cons

−.0165729 1.59e-06 −2.2035 56.53884

.0038604 6.08e-07 1.03022 6.027559

−4.29 2.62 −2.14 9.38

0.000 0.009 0.032 0.000

e.mpg

10.19332

1.675772

=

74

[95% Conf. Interval]

Structural mpg <− −.0241392 4.00e-07 −4.222695 44.72504

−.0090067 2.78e.-06 −.1843056 68.35264

7.385485

14.06865

Variance LR test of model vs. Saturated: chi2(1)

=

0.00,

Prob > chi2 = 1.000

. sem, standardized Structural equation model Estimation method = ml Log likelihood = −1909.8206

Number of obs

Coef.

OIM Std. Err.

z

P>|z|

weight weight2 foreign _cons

−2.226321 1.32654 −.17527 9.839209

.4950378 .498261 .0810378 .9686872

−4.50 2.66 −2.16 10.16

0.000 0.008 0.031 0.000

e.mpg

.308704

.0482719

=

74


Structural mpg <− −3.196577 .3499662 −.3341011 7.940617

−1.256064 2.303113 −.0164389 11.7378

.2272168

.4194152

Variance LR test of model vs. saturated: chi2(1)

=

0.00,

Prob > chi2 = 1.000

Catatan: -

Nilai estimasi koefisien analisis regresi (“regress”) tepat sama dengan hasil structural equation modeling (“sem”).

-

Nilai estimasi standard error analisis regresi sedikit berbeda dengan hasil structural equation modeling. Pada “regress” digunakan pembagi N – k – 1 = 74 – 3 – 1 = 70, sedangkan pada “sem” digunakan pembagi N = 74, sehingga pada “regress” 40

diperoleh SE foreign sebesar 1.06, sedangkan pada sem SE foreign adalah 1.03. Dengan demikian hasil perhitungan interval konfidensinya juga sedikit berbeda. -

Pada “regress” yang dilaporkan adalah statistik t, sedangkan pada “sem” dilaporkan statistik z.

Contoh 4.7 (Regresi yang seolah tak-berkaitan, manual Stata): Regresi yang seolah tak berkaitan (seemingly unrelated regression; SUR) adalah dua atau lebih regresi linear terpisah, tetapi suku pengganggunya berkorelasi. Dua atau lebih regresi mungkin, namun tak selalu harus, memiliki variabel eksogen bersama. File data: auto.dta Variabel: variable name mpg displacement foreign length price weight

variable label Miliage (mpg) Displacement (cu. in) Cartype Length (in.) Price Weight (lbs.)

Model:

Persamaan: price = α1 + β11foreign + β12mpg + β13displacement + ε1 weight = α2 + β21foreign + β22length + ε2

Perintah sem (structural equation modeling): . sem (price <− foreign mpg displacement) >

(weight <− foreign length),

>

cov (e.price*e.weight)

41

Endogenous variables Observed: price weight Exogenous variables Observed: foreign mpg displacement length Fitting target model: Iteration 0: Iteration 1: Iteration 2: Iteration 3: Iteration 4: Iteration 5:

log log log log log log

likelihood likelihood likelihood likelihood likelihood likelihood

= = = = = =

−2150.9983 −2138.5739 −2133.3461 −2133.1979 −2133.1956 −2133.1956

Structural equation model Estimation method = ml Log likelihood = −2133.1956 Standardized Structural price <− foreign mpg displace~t _cons Structural weight <− foreign length _cons Variance e.price e.weight Covariance e.price e.weight

Number of obs

=

74

Coef.

OIM Std. Err.

z

P>|z|

2940.929 −105.0163 17.22083 4129.866

724.7311 57.93461 4.5941 1984.253

4.06 −1.81 3.75 2.08

0.000 0.070 0.000 0.037

1520.482 −218.566 8.216558 240.8022

4361.376 8.53347 26.2251 8018.931

−153.2515 30.73507 −2711.096

76.21732 1.584743 312.6813

−2.01 19.39 −8.67

0.044 0.000 0.000

−.302.6347 27.62903 −3323.94

−3.868275 33.84111 −2098.252

4732491 60253.09

801783.1 9933.316

3395302 43616.45

6596312 83235.44

209268

73909.54

64407.92

354128

LR test of model vs. saturated: chi2(3)

=

2.83 38.86,

0.005


Prob > chi2 = 0.0000

Contoh 4.8 (Data masukan dengan matriks korelasi): Pada contoh diperlihatkan pemasukan data statistik ringkasan untuk analisis SEM dalam bentuk matriks korelasi menurut Romney et al (1992) seperti terlihat pada tabel 4.3, yang dapat dianalisis dalam bentuk model psikosomatik ataupun model medik konvensional (gambar 4.4) Tabel 4.3 Matriks korelasi model jalur pemulihan pasca bedah jantung 1. 2. 3. 4. 5.

Variabel Low Morale Illness Symptoms Neurological Dysfunction Poor Relationships Diminished SES

1 1.00 .53 .15 .52 .30

Sumber: Romney et al (1992); N = 469

42

2

3

4

5

1.00 .18 .29 .34

1.00 −.05 .23

1.00 .09

1.00

Gambar 4.4 Model jalur alternatif non-hirarkis untuk model pemulihan pasca bedah jantung. Atas: Model psikosomatik; Bawah: Model medik konvensional (Kline, 2005) Perintah sem (input data korelasi): . clear all . ssd init morale illness neuro relation ses Summary statistics data initialized. Next use, in any order, ssd set observations (required) It is best to do this first. ssd set means (optional) Default setting is 0. ssd set variances or ssd set sd (optional) Use this only if you have set or will set correlations and, even then, this is optional but highly recommended. Default setting is 1. ssd set covariances or ssd set correlations (required)

. ssd set observations 469 (value set) Status: observations:

set

means: unset

43

variances or sd: unset covariances or correlations: unset (required to be set)

. ssd set correlations 1.00 \ .53 1.00 \ .15 .18 1.00 \ .52 .29 -.05 1.00 \ .30 .34 .23 .09 1.00 (values set) Status: observations: means:

set unset

variances or sd:

unset

covariances or correlations:

set

. label variable morale "Low Morale" . label variable illness "Illness Symptoms" . label variable neuro "Neurological Dysfunction" . label variable relation "Poor Relationships" . label variable ses "Diminished SES" . save "D:\SEM\Data\cardiac_surgery.dta" file D:\SEM\SEM\Data\cardiac_surgery.dta saved

. ssd describe Summary statistics data from D:\SEM\Data\cardiac_surgery.dta obs: vars:

469 5

19 April 2012 19:02

variable name morale illness neuro relation ses

variable label Low Morale Illness Symptoms Neurological Dysfunctions Poor Relationships Dimisnished SES

. ssd list Observations = 469 Means undefined; assumed to be 0 Variances undefined; assumed to be 1 Correlations: morale 1 .53 .15 .52 .3

illness

neuro

relation

ses

1 .18 .29 .34

1 −.05 .23

1 .09

1

44

Perbandingan kedua model, yaitu model psikosomatik dan model medik konvensional dapat dilakukan dengan uji rasio likelihood (lihat petunjuk pada lampiran 4). Dua model jalur ekivalen lainnya untuk data pemulihan pasca bedah jantung ini diperlihatkan pada gambar 4.5.

Gambar 4.5 Dua model jalur ekivalen untuk data pemulihan pasca bedah jantung (Kline, 2005)

Contoh 4.9 (Dekomposisi efek): Pada contoh ini diperlihatkan pengestimasian efek langsung, efek tak langsung, dan efek total sebuah prediktor terhadap outcome-nya. Perhatikan bahwa dalam kepustakaan cara ini juga disebutkan sebagai pengestimasian efek variabel mediator, karena efek tak langsung dengan sendirinya terjadi melalui variabel mediator (variabel perantara). File data yang digunakan adalah cardiac_surgery.dta dengan model medik konvensional (gambar 4.4 bawah). . use "D:\SEM\Data\cardiac_surgery.dta", clear . sem (ses <− illness neuro) (morale <− illness ses) (relation <− neuro morale) Endogenous variables Observed: ses morale relation Exogenous variables Observed: illness neuro Fitting target model: Iteration 0: Iteration 1:


Structural equation model

45

Estimation method Log likelihood

= ml = −3118.3779

Number of obs

=

469

Coef.

OIM Std. Err.

z

P>|z|

.3085986 .1744523

.0434047 .0434047

7.11 4.02

0.000 0.000

.223527 .0893806

.3936702 .2595239

.1354591 .4839439

.0411649 0411649

3.29 11.76

0.001 0.000

.0547773 .4032621

.2161408 .5646257

.5396419 −.1309463

.0394322 .0394322

13.69 −3.32

0.009 0.001

.4623563 −.208232

.6169276 −.0536606

.8531295 .7013733 .711319

.0557113 .0458013 .0464508

.7506363 .6171118 .6258625

.9696174 .7971402 .8084438


Structural ses <− illness neuro morale <− ses illness relation <− morale neuro Variance e.ses e.morale e.relation


=

3.25,

Prob > chi2 = 0.3553

Tampak pada model medik konvensional terdapat dua variabel mediator, yaitu ses sebagai mediator dalam efek ill terhadap morale [ill → ses → morale], serta ses dan morale dalam efek neuro terhadap relation [neuro → ses → morale → relation].

Perintah sem dilanjutkan dengan perintah estat teffect untuk memperoleh estimasi efek langsung dan tak langsung. . estat teffects Direct effects Coef.

OIM Std. Err.

z

P>|z|

.3085986 .1744523

.0434047 .0434047

7.11 4.02

0.000 0.000

.223527 .0893806

.3936702 .2595239

.1354591 .4839439 0

.0411649 .0411649 (no path)

3.29 11.76

0.001 0.000

.0547773 .4032621

.2161408 .5646257

0 .5396419 0 −.1309463

(no path) .0394322 (no path) .0394322

13.69

0.000

.4623563

.6169276

−3.32

0.001

−.208232

−.0536606


Structural ses <− illness neuro morale <− ses illness neuro relation <− ses morale illness neuro

46

Indirect effects Coef.

OIM Std. Err.

0 0

(no path) (no path)

0 .0418025 .0236311

(no path) .0139981 .0092812

.0730994 0 .2837148 .0127524

.0222143 (no path) .0296103 .0050945

Coef.

z

P>|z|


2.99 2.55

0.003 0.011

.0143667 .0054403

.0692382 .0418219

3.29

0.001

.0295601

.1166387

9.58 2.50

0.000 0.012

.2256796 .0027674

.34175 .0227373

OIM Std. Err.

z

P>|z|

.3085986 .1744523

.0434047 .0434047

7.11 4.02

0.000 0.000

.223527 .0893806

.3936702 .2595239

.1354591 .5257464 .0236311

.0411649 .0391778 .0092812

3.29 13.42 2.55

0.001 0.000 0.011

.0547773 .4489593 .0054403

.2161408 .6025335 .0418219

.0730994 .5396419 .2837148 −.1181939

.0222143 .0394322 .0296103 .0396211

3.29 13.69 9.58 −2.98

0.001 0.000 0.000 0.003

.0295601 .4623563 .2256796 −.1958498

.1166387 .6169276 .34175 −.0405381


Total effects [95% Conf. Interval]


Diperoleh efek total ill terhadap morale adalah .5257464, terdiri atas efek langsung .4839439 dan efek tak langsung .0418025, sehingga proporsi efek total yang termediasi adalah (.0418025)/(.5257464) = 0.08. Efek total neuro terhadap relation adalah −.1181939, terdiri atas efek langsung −.1309463 dan efek tak langsung .0127524; proporsi efek total yang termediasi adalah (.0127524)/( −.1181939) = −0.11. Jika hasil-hasil di atas terlalu panjang dan yang hendak diketahui hanya besar efek langsung, efek tak langsung, dan efek total antar variabel, dapat digunakan perintah matrix list seperti di bawah ini: . sem (ses <− illness neuro) (morale <− illness ses) (relation <− neuro morale) . quietly estat teffects

47

. matrix list r(indirect)

r (indirect) [1, 9] morale: o. ses 0

morale:

morale:

illness .04180248

neuro .02363114

r (direct) [1, 9] ses:

ses:

morale:

morale:

illness .30859859

neuro .17445225

ses .13545907

illness .48394392

morale: o. neuro 0

morale: ses .13545907

morale: illness .52574639

morale: neuro .02363114

r1

ses: o. illness 0

ses: o. neuro 0

relation: o. ses .07309939

relation:

relation:

relation:

morale 0

illness .28371481

neuro .01275235

. matrix list r(direct)

r1

relation: o. ses 0

relation: morale .53964194

relation: o. illness 0

relation: neuro −.13094629

. matrix list r(total) r (total) [1, 9] ses: illness r1 .30859859

ses: neuro .17445225

48

relation: ses .07309939

relation: morale .53964194

relation: illness .28371481

relation: neuro −.11819394

BAB 5 UJI HIPOTESIS DAN PENILAIAN MODEL Uji Hipotesis pada SEM Uji hipotesis pada SEM tidak bertujuan untuk menguji kemaknaan statistik hubungan antar variabel seperti pada analisis regresi. Tujuan uji hipotesis pada SEM adalah untuk mengevaluasi konsistensi model peneliti dengan data sampel. Permasalahan dalam uji hipotesis pada SEM ialah: 1

Terdapat berbagai statistik-suai (fit statistics) yang ditampilkan oleh program komputer pada analisis SEM, dan jumlah statistik-suai ini semakin bertambah serta bervariasi dalam perjalanan waktu, namun: -

Tidak ada satu ukuran tunggal yang dapat digunakan untuk mengevaluasi konsistensi model dengan data sampel secara menyeluruh, tiap jenis statistik hanya menilai aspek suai tertentu.

-

Nilai statistik-suai menyatakan rata-rata kesesuaian model dengan data. Mungkin terjadi bahwa sebagian model memiliki kesuaian baik dan ada bagian model yang tak sesuai dengan data.

-

Statistik-suai tidak menginformasikan apakah model peneliti bermakna secara teoretis.

2.

Model harus dikembangkan peneliti secara a-priori berdasarkan pengetahuan teoretisnya. Model jenuh pasti akan sesuai secara sempurna dengan data, namun model demikian tak bernilai secara ilmiah. Di sisi lain, dapat dikembangkan lebih daripada satu model yang sama baiknya kesesuaiannya dengan data (model ekivalen), dan pengetahuan substantif penelitilah yang akan menentukan model mana yang lebih bermakna secara teoretis.

Klasifikasi Statistik Suai Statistik suai (fit statistics) adalah statistik yang mengindikasikan kesesuaian rata-rata ataupun menyeluruh (average or overall fit) sebuah model. Statistik suai dibedakan dalam dua kelompok, yaitu statistik penguji model dan indeks-suai aproksimasi. Statistik penguji model (model test statistics) adalah statistik untuk menguji ada tidaknya perbedaan yang bermakna secara statistik antara matriks kovariansi model peneliti dengan matriks kovariansi sampel. Statistik penguji model umumnya adalah statistik ‘keburukan-suai’, yaitu semakin 49

besar nilai statistik, semakin buruk kesesuaian model dengan data. Hasil uji yang bermakna secara statistik (p < 0.05) menunjukkan ketidaksesuaian model dengan data. Model peneliti dapat diterima jika hipotesis nol tidak ditolak, yang mengindikasikan tidak ditemukannya perbedaan yang bermakna secara statistik antara matriks kovariansi model peneliti dengan matriks kovariansi sampel. Hanya satu statistik penguji model yang akan dibahas di bawah ini, yaitu khi-kuadrat model (model chi-square). Indeks suai aproksimasi (approximate fit indexes) adalah ukuran kontinu untuk menilai keterkaitan antara model peneliti dengan data yang ada.

Macam Statistik Suai 1.

Khi-kuadrat model (model chi-square): Khi-kuadrat model adalah khi-kuadrat rasio-likelihood model peneliti vs model jenuh:



 

2 = 2 log Ls  log L ˆ  ms

(5.1)

yang berdistribusi khi-kuadrat dengan derajat bebas sama dengan df ms ; df ms = df s − df m log Ls

: log likelihood model jenuh dengan metode maximum likelihood



log L ˆ : log likelihood model peneliti

df s

: derajat bebas model jenuh

df m

: derajat bebas model peneliti

Khi-kuadrat model dinamakan juga khi-kuadrat rasio likelihood atau rasio likelihood 2 umum. Jika  ms = 0, maka model sesuai sempurna dengan data (perfectly fits the data),

yaitu matriks korelasi dan kovariansi prediksi sama dengan yang diamati. Di bawah 2 hipotesis nol yang menyatakan model peneliti sesuai sempurna dalam populasi,  ms

secara aproksimasi berdistribusi khi-kuadrat sentral. Khi-kuadrat model adalah statistik suai (fit statistic), sehingga penerimaan hipotesis nol 2 akan mendukung model yang diajukan peneliti, namun  ms lebih tepat disebut sebagai 2 indeks „keburukan-suai‟ (badness-of-fit) karena semakin besar nilai  ms , semakin buruk

kesesuaian model dengan data.

50

2.

Akar rerata kuadrat galat aproksimasi (root mean square error of approximation; RMSEA): RMSEA =



2    ms  df ms  Ndf ms  

    

(5.2)

yang secara aproksimasi berdistribusi khi-kuadrat non-sentral dengan parameter nonsentralitas  . ˆms adalah estimator bagi parameter non-sentralitas  : 2 ˆms =  ms  df ms

(5.3)

Jika data terbagi atas G subkelompok dengan nilai parameter yang berbeda antar subkelompok, maka RMSEA adalah: RMSEA =





2    ms  df ms G     Ndf ms    

(5.2.a)

Interpretasi kasar bagi RMSEA yaitu: -

RMSEA < 0.05: Aproksimasi kesesuaian baik (close approximate fit)

-

0.05 < RMSEA < 0.08: Galat aproksimasi masih dapat diterima (reasonable error of approximation)

-

RMSEA > 0.10: Kesesuaian buruk (poor fit).

2 RMSEA juga merupakan indeks „keburukan-suai‟ seperti halnya  ms .

Interpretasi terhadap interval konfidensi 90% untuk RMSEA adalah sebagai berikut: -

Jika batas bawah interval kurang daripada 0.05, maka hipotesis H 0 : RMSEA < 0.05−yang menyatakan bahwa model peneliti memiliki aproksimasi kesesuaian yang baik dalam populasi−tidak ditolak.

-

Jika batas atas interval tidak lebih daripada 0.10, maka hipotesis H 0 : RMSEA > 0.10−yang menyatakan bahwa kesesuaian model dalam populasi buruk−ditolak.

-

Jika batas bawah interval kurang daripada 0.05 dan batas atas interval lebih daripada 0.10, maka diperoleh hasil yang kontroversial, sehingga dibutuhkan ukuran sampel yang lebih besar untuk mendapatkan hasil yang lebih akurat.

3.

Akar rerata kuadrat residual terstandardisasi (standardized root mean square residual; SRMR): Akar rerata kuadrat residual (root mean square residual; RMR) adalah ukuran rerata nilai mutlak residual kovariansi. Residual kovariansi adalah selisih antara matriks kovariansi teramati dengan matriks kovariansi yang diprediksikan. RMR merupakan 51

indeks „keburukan-suai‟, RMR = 0 mengindikasikan kesesuaian model yang sempurna, selanjutnya semakin besar nilai RMR semakin buruk kesesuaiannya. Pada akar rerata kuadrat residual terstandardisasi (SRMR), residual adalah selisih antara matriks korelasi teramati dengan matriks korelasi prediksi. Nilai SRMR yang kurang daripada 0.10 umumnya dianggap cukup baik. 4.

Indeks suai komparatif (comparative fit index; CFI): Indeks suai komparatif merupakan salah satu indeks-suai inkremental (incremental fit index), yaitu ukuran untuk menilai perbaikan relatif kesesuaian model peneliti dibandingkan dengan model dasar (baseline model). Model dasar (model independen; model nol) adalah model dengan asumsi bahwa kovariansi populasi antar variabel teramati bernilai sama dengan nol. Berdasarkan asumsi ini, maka: 2 bs2 >  ms

(5.4)

bs2 : khi-kuadrat rasio-likelihood model dasar vs model jenuh; bs2 = 2 log Ls  log Lb  2 2 Semakin besar nilai selisih ( bs –  ms ), semakin baik model peneliti dibandingkan

dengan model dasar. Rumus indeks suai komparatif yang digunakan Stata 12 adalah:





2   ms  df ms CFI = 1 –  2  max bs2  dfbs ,  ms  df ms 







   

(5.5)

Nilai CFI yang lebih daripada 0.90 mengindikasikan model peneliti memiliki kesesuaian yang cukup baik. Walaupun demikian, CFI = 1 tidak menyatakan kesesuaian model yang 2 sempurna, melainkan hanya menunjukkan bahwa  ms < df ms .

Dalam kenyataannya, pada kebanyakan bidang aplikasi SEM asumsi kovariansi nol secara ilmiah tak plausibel, sehingga model peneliti seperti apapun selalu menunjukkan kesesuaian yang lebih baik dibandingkan dengan model nol. 5.

Kriteria informasi Akaike (Akaike information criterion; AIC) dan kriteria informasi Bayes (Bayesian information criterion; BIC): Dalam kepustakaan ditemukan beberapa rumus yang berbeda untuk menghitung AIC. Rumus yang digunakan Stata 12 untuk AIC dan BIC masing-masing adalah:

 2 log L ˆ  + N df

AIC = 2 log L ˆ + 2 df m

(5.6)

BIC =

(5.7)

m

52

AIC dan BIC adalah indeks-suai prediktif, digunakan dalam seleksi antar model nonhirarkis yang diestimasi dari data yang sama. Model yang dipilih adalah model dengan nilai AIC dan BIC terkecil, yang relatif memiliki kesesuaian lebih baik dan parameter lebih sedikit. AIC adalah indeks-suai prediktif yang lebih baru dibandingkan dengan BIC. 6.

Indeks Tucker-Lewis (TLI): Indeks Tucker-Lewis adalah:

 bs2  TLI =

 

2 dfbs   ms df ms



 bs2





(5.8)

dfbs  1

Indeks Tucker-Lewis adalah indeks-suai inkremental seperti halnya CFI, namun CFI merupakan indeks-suai inkremental yang lebih baru dibandingkan dengan TLI. 7.

Koefisien determinasi (CD) dan koefisien korelasi-ganda kuadrat Bentler-Raykov (mc2): Kedua ukuran ini merupakan ukuran kebaikan-suai pada tingkat persamaan (equationlevel goodness-of-fit). Untuk model rekursif, koefisien determinasi dan koefisien korelasi-ganda kuadrat Bentler-Raykov keduanya bernilai sama, yaitu kuadrat nilai koefisien korelasi ganda (multiple-correlation coefficient; mc) dan diinterpretasikan sebagai proporsi variansi variabel dependen yang dijelaskan oleh prediktornya: CD = mc2 = mc2

(5.9)

Pada model non-rekursif, CD dan mc2 memiliki nilai berbeda, bahkan CD dapat bernilai negatif. Untuk model non-rekursif dianjurkan untuk menggunakan mc2 = mc2 sebagai ukuran kebaikan-suai pada tingkat persamaan. Pada tabel 5.1 diperlihatkan beberapa nilai statistik suai hasil analisis SEM terhadap kedua model jalur alternatif non-hirarkis pemulihan pasca bedah jantung (gambar 4.4 pada bab 4). Nilai-nilai statistik suai ini digunakan untuk memilih yang terbaik di antara kedua model. Tampak bahwa kesesuaian menyeluruh (overall fit) model medik konvensional lebih baik daripada model psikosomatik, walaupun model psikosomatik bersifat lebih parsimoni. Selain itu, nilai AIC model medik konvensional juga lebih kecil daripada nilai AIC model psikosomatik.

53

Tabel 5.1 Beberapa nilai statistik suai untuk perbandingan model jalur alternatif non-hirarkis pemulihan pasca bedah jantung Indeks

Model Psikosomatik

Model Medik Konvensional

2  ms

40.488

3.245

df ms

5

3

0.000

0.355

0.123 (0.090-0.159)

0.013 (0.000-0.080)

AIC

6293.999

6260.756

CFI

0.907

0.999

SRMR

0.065

0.016

p RMSEA (90% CI)

Estimasi Statistik Suai SEM dengan Stata Pada contoh-contoh di bawah ini akan diperlihatkan prosedur perolehan beberapa statistik suai pada Stata.

Contoh 5.1 (Estimasi statistik-suai dan kebaikan-suai, manual Stata): File data: auto.dta (lihat kembali contoh 4.6) Model: Lihat contoh 4.6. Perintah sem: . sysuse auto . estat gof, stats (all) Fit statistic

Value

Description

chi2_ms (0)

0.000

model vs. saturated

p > chi2

.

chi2_bs (9)

248.985

p > chi2

0.000

Likelihood ratio

baseline vs. saturated

Population error RMSEA

0.000

90% CI, lower bound

0.000

upper bound

.

pclose

1.000

Root mean squared error of approximation

Probability RMSEA <= 0.05

54

Information criteria AIC

3827.641

Akaike‟s information criterion

BIC

3836.858

Bayesian information criterion

Baseline comparison CFI

1.000

Comparative fit index

TLI

1.036

Tucker-Lewis index

SRMR

0.000

Standardized root mean squared residuals

CD

0.691

Coefficient of determination

Size of residuals

. estat eqgof Equation-level goodness of fit Variance depvars

fitted

predicted

residuals

R-squared

mc

mc2

33.01972

22.8264

10.19332

.691296

.8314421

.691296

observed mpg overall mc

.691296

= correlation between depvar and its prediction

mc2 = mc^2 is the Bentler-Raykov squared multiple correlation coefficient

Perintah “estat” (postestimation statistics) mencakup beberapa perintah Stata untuk melakukan sejumlah perhitungan tertentu setelah melakukan proses estimasi. Perintah “estat gof” adalah perintah Stata untuk melakukan uji kebaikan-suai (goodness-of-fit). Dengan perintah “estat gof” akan disajikan hasil uji rasio likelihood. Opsi “, stats(all)” menambahkan tampilan dengan nilai RMSEA berikut interval konfidensi 90% dan nilai p-nya, kriteria informasi Akaike dan Bayes (AIC dan BIC), kedua indeks-suai komparatif (CFI) dan indeks Tucker-Lewis (TLI), serta SRMR dan CD (koefisien determinasi). Perintah “estat eqgof” (equation level goodness-of-fit statistics) adalah perintah Stata untuk membandingkan nilai-nilai variansi yang diprediksi oleh model peneliti dengan variansi sesungguhnya, serta memperoleh proporsi variabel endogen yang dijelaskan oleh prediktornya. Pada perintah “estat eqgof” akan dinyatakan nilai-nilai variansi sesungguhnya, variansi prediksi, dan residualnya. Selanjutnya ditampilkan pula nilai-nilai koefisien determinasi (R-squared), koefisien korelasi (mc), dan koefisien korelasi ganda kuadrat 55

Bentler-Raykov (mc2), yang nilainya digunakan sebagai pengganti R-squared pada model jalur non-rekursif.

Contoh 5.2 (Model jenuh dan model dasar): Lihat kembali model Illness pada gambar 4.1. Pada model jalur ini terdapat 4 variabel teramati, Exercise, Hardiness, Fitness, Stress, dan Illness, dua di antaranya merupakan variabel endogen yaitu Exercise dan Hardiness. Dengan model peneliti pada gambar 4.2, diperoleh hasil analisis sem sebagai berikut: . use "D:\SEM\Data\illness.dta", clear . sem (fit <− exe) (stress <− hard) (ill <− fit stress) Endogenous variables Observed: fit stress ill Exogenous variables Observed: exe hard Fitting target model: Iteration 0: Iteration 1:



Number of obs

=

384

Coef.

OIM Std. Err.

z

P>|z|

exe

.2158195

.0260036

8.30

0.000

.1648535

.2667856

hard

−.4055263

.0875636

−4.63

0.000

−.5771478

−.2339049

fit

−.4244997

.0792709

−5.36

0.009

−.5798678

−.2691316

stress

.2867521

.0435398

6.59

0.000

.2014156

.3720887

e.fit

1145.27

82.65273

994.2089

1319.283

e.stress

4240.46

306.0289

3681.144

4884.759

e.ill

3204.201

231.2433

2781.567

3691.05


Structural fit <− stress <− ill <−

Variance


=

11.44,

56

Prob > chi2 = 0.0434

. estat gof Fit statistic

Value

Description

Likelihood ratio chi2_ms (5)

11.435

p > chi2

0.043

chi2_bs (9)

170.492

p > chi2

0.000

model vs. saturated


Pada kolom Description tampak adanya istilah “model” (model peneliti), „saturated” (model jenuh), dan “baseline” (model dasar). Jumlah parameter pada model peneliti adalah 10, terdiri atas 4 efek langsung, 5 variansi, dan 1 kovariansi. Dengan 5 variabel teramati, jumlah titik data adalah (5)(6)/2 = 15, sehingga derajat bebas model peneliti di atas adalah 15 – 10 = 5 (lebih-teridentifikasi). Log likelihhood model peneliti adalah −10237.61. Model jenuh adalah model mereproduksikan secara sempurna seluruh nilai variansi dan kovariansi. Perintah untuk menghasilkan model jenuh pada Stata adalah sebagai berikut: . sem (<− exe hard fit stress ill) Exogenous variables Observed: exe hard fit stress ill Fitting target model: log likelihood = −10231.893 log likelihood = −10231.893

Iteration 0: Iteration 1:


Number of obs

=

384

Coef.

OIM Std. Err.

exe

4410.734

318.3173

3828.959

5080.904

hard

1440.24

103.9403

1250.272

1659.071

fit

1350.713

97.47934

1172.554

1555.942

stress

4477.31

323.122

3886.753

5157.596

ill

3893.584

280.9952

3380.021

4485.179

hard

−75.61258

128.6775

−0.59

0.557

−327.8158

176.5906

fit

951.9226

133.6954

7.12

0.000

689.8844

1213.961

stress

−222.1949

227.06

−0.98

0.328

−667.2242

222.8345

ill

−331.528

212.1534

−1.56

0.118

−747.3409

84.28496

Standardized

z

P>|z|


Variance

Covariance exe

57

Covariance hard fit

97.63308

71.35013

1.37

0.171

−42.2106

237.4768

stress

−584.0551

132.9701

−4.39

0.000

−844.6716

−323.4385

ill

−378.8891

122.3814

−3.10

0.002

−618.7523

−139.0259

stress

−319.6933

126.5504

−2.53

0.012

−567.7276

−71.65897

ill

−665.0501

121.85

−5.46

0.000

−903.8717

−426.2286

ill

1419.588

225.0464

6.31

0.000

978.5051

1860.671

Covariance fit

Covariance stress


=

0.00,

Prob > chi2 =

.

Pada model jenuh, dengan 5 variabel teramati jumlah titik data tetap 15. Jumlah parameter juga 15, terdiri atas 5 variansi dan 10 kovariansi, sehingga derajat bebas pada model jenuh selalu sama dengan nol (tepat teridentifikasi). Model jenuh ini akan mereproduksi seluruh nilai-nilai variansi dan kovariansi secara sempurna, dalam arti kata matriks kovariansi yang dihasilkan model jenuh akan tepat sama dengan matriks kovariansi data sampel. Log likelihood model jenuh adalah −10231.893. Untuk menguji seberapa baik model peneliti dibandingkan dengan model jenuh, ukurannya adalah minus dua kali selisih log likehood kedua model; −2*(−10237.61 − −10231.893) = 11.435 yang berdistribusi khi-kuadrat dengan derajat bebas 5 – 0 = 5 (p = 0.043). Model dasar (baseline model) pada Stata adalah model yang mencakup variansi seluruh variabel teramati beserta kovariansi antar variabel eksogen teramati (menurut model peneliti). Perhatikan bahwa dalam versi Stata ini model dasar tidak sama dengan model nol. Dalam model peneliti, variabel eksogen adalah Exercise dan Hardiness, sehingga kovariansi pada model dasar hanya kovariansi antara kedua variabel ini. Dengan analisis sem diperoleh: . sem (<− exe hard fit stress ill), covstr (exe fit stress ill, diagonal) covstr (hard fit stress ill, diagonal) Exogenous variables Observed: exe hard fit stress ill

58

Fitting target model: log likelihood = −10317.139 log likelihood = −10317.139


Structural equation model Estimation method = ml Log likelihood = −10317.139 ( 1) ( 2) ( 3) ( 4) ( 5) ( 6) ( 7) ( 8) ( 9)

Number of obs

=

384

[cov(exe,fit)]_cons = 0 [cov(exe,stress)]_cons = 0 [cov(exe,ill)]_cons = 0 [cov(hard,fit)]_cons = 0 [cov(hard,stress)]_cons = 0 [cov(hard,ill)]_cons = 0 [cov(fit,stress)]_cons = 0 [cov(fit,ill)]_cons = 0 [cov(stress,ill)]_cons = 0

Coef.

OIM Std. Err.

exe

4410.734

318.3173

3828.959

5080.904

hard

1440.24

103.9403

1250.272

1659.071

fit

1350.713

97.47934

1172.554

1555.942

stress

4477.31

323.122

3886.753

5157.596

ill

3893.584

280.9952

3380.021

4485.179

hard

−75.61258

128.6775

−327.8158

176.5906

fit

0

(constrained)

stress

0

(constrained)

ill

0

(constrained)

fit

0

(constrained)

stress

0

(constrained)

ill

0

(constrained)

stress

0

(constrained)

ill

0

(constrained)

ill

0

(constrained)

Standardized

z

P>|z|


Variance

Covariance exe −0.59

Covariance hard

Covariance fit

Covariance stress

59

0.557


=

170.49,

Prob > chi2 = 0.0000

Pada model dasar, jumlah titik data adalah 15, sedangkan jumlah parameter 6, yaitu lima variansi dan satu kovariansi. Derajat bebas model adalah 15 – 6 = 9. Log likelihood model dasar adalah −10317.139. Untuk menguji seberapa baik model dasar dibandingkan dengan model jenuh, dihitung minus dua kali selisih log likelihood kedua model, yaitu −2*(−10317.139 − −10231.893) = 170.492 yang berdistribusi khi-kuadrat dengan derajat bebas 9 – 0 = 9 (p < 0.001). Walaupun model peneliti tidak sesuai sepenuhnya dengan model jenuh (  2 = 11.435; p = 0.043), kesesuaiannya ini masih jauh lebih baik daripada kesesuaian model dasar dengan model jenuh (  2 = 170.492; p < 0.001).

Contoh 5.3 (Estimasi statistik-suai dan kebaikan-suai, manual Stata): File data: auto.dta (lihat kembali contoh 4.7) Model: Lihat model pada contoh 4.7 Perintah sem: . estat gof, stats (all)

Fit statistic

Value

Description

Likelihood ratio chi2_ms (3)

38.864

p > chi2

0.000

chi2_bs (9)

264.817

p > chi2

0.000

model vs. saturated


Population error RMSEA

0.402

90% CI, lower bound

0.295

upper bound

0.519

pclose

0.000


Probability RMSEA <= 0.05

Information criteria AIC

4286.391

Akaike‟s information criterion

BIC

4309.432

Bayesian information criterion

Baseline comparison

60

CFI

0.860

Comparative fit index

TLI

0.579

Tucker-Lewis index

SRMR

0.046

Standardized root mean squared residuals

CD

0.932

Coefficient of determination

Size of residuals

. estat eqgof Equation-level goodness of fit Variance depvars

fitted

predicted

residuals

R-squared

mc

mc2

7478595 581472.1

2746103 521219

4732491 60253.09

.3671951 .8963784

.6059663 .9467726

.3671951 .8963784

observed price weight overall mc

.931919

= correlation between depvar and its prediction

mc2 = mc^2 is the Bentler-Raykov squared multiple correlation coefficient

Model Ekivalen pada Analisis Jalur Di bagian awal bab ini telah disinggung mengenai model ekivalen, yang harus dipertimbangkan oleh peneliti setelah peneliti membuktikan bahwa model yang diajukannya memiliki kesesuaian yang cukup dengan data sampel. Model ekivalen adalah model yang dibangun sebagai hasil perombakan terhadap model peneliti, memiliki matriks korelasi atau kovariansi prediksi yang tepat sama dengan model peneliti, namun dengan konfigurasi jalur berbeda antar variabel yang sama. Model ekivalen dapat diperoleh berdasarkan aturan pergantian Lee-Hershberger melalui saling substitusi antara Y1 → Y2, Y2 → Y1, D1

D2, atau efek resiprokal terkendali-sama (equality-constrained resiprocal effect) Y1 Y2 (Hersberger, 1994). Pada efek resiprokal terkendali-sama Y1

Y2 terkendali sama besarnya dengan efek Y2 → Y1.

61

Y2, besar efek Y1 →

Gambar 5.1 Contoh empat model jalur ekivalen (Romney et al, 1992)

Perhatikan bahwa substitusi dengan efek resiprokal akan membuat suatu model rekursif menjadi non-rekursif, sehingga substitusi ini hanya boleh dilakukan jika model baru yang dihasilkan oleh substitusi tetap teridentifikasi. Substitusi juga tidak boleh mengakibatkan dihasilkannya suatu model baru yang non-plausibel. Model jalur sederhana mungkin hanya memiliki beberapa versi ekivalen, namun model yang kompleks mungkin memiliki ratusan atau bahkan ribuan versi ekivalennya. Walaupun demikian, yang perlu dipertimbangkan oleh peneliti hanyalah beberapa versi ekivalen yang secara substantif dinilai bermakna. Contoh suatu model original dengan tiga versi ekivalennya yang dibentuk menurut aturan pergantian Lee-Hersberger tanpa disertai suku pengganggunya diperlihatkan pada gambar 5.1 (Romney et al, 1992).

62

BAB 6 PEMODELAN SEM DALAM MODE GRAFIK PADA STATA Graphical User Interface pada Stata Pemodelan SEM yang dilakukan pada Stata dalam pembahasan terdahulu dilakukan dalam mode interaktif. Selain dalam mode interaktif, pemodelan SEM pada Stata dapat pula dilakukan dalam mode grafik seperti halnya pada AMOS. Pemodelan SEM dalam mode grafik pada Stata dimulai dengan membuka jendela SEM Builder dengan mengklik perintah pada menu: Statistics > SEM (structural equation modeling) > Model building and estimation, maka akan diperoleh jendela (kanvas) sebagai berikut:

Gambar 6.1. Jendela SEM Builder Selain Standard Toolbar seperti yang didapatkan pada semua program berbasis Windows, di atas kanvas dan di bawah Standard Toolbar terdapat Contextual Toolbar, sedangkan di sisi kiri kanvas terdapat Tools Toolbar (lihat gambar 6.2). 63

Tools Toolbar akan langsung muncul pada saat kanvas SEM Builder terbuka, sedangkan Contextual Toolbar baru tampak Tools Toolbar mulai digunakan dalam pemodelan.

Gambar 6.2. Contextual Toolbar (atas) dan Tools Toolbar (kiri)

Pada Tools Toolbar terdapat beberapa lambang, beberapa di antaranya yang digunakan dalam analisis jalur SEM yaitu: : Observed

Variable

teramati (Lambang

Tool, digunakan untuk melambangkan variabel

yang digunakan untuk variabel laten tidak digunakan pada

analisis jalur). : Path Tool, digunakan untuk menyatakan jalur (efek langsung) : Covariance Tool, digunakan untuk menyatakan kovariansi (asosiasi takteramati) : Regression Component Tool, digunakan untuk menyatakan himpunan variabel teramati yang terdiri atas 1 variabel dependen dan sekumpulan variabel independen yang masing-masing hanya memiliki efek langsung ke variabel dependen : Select

Tool, digunakan untuk menghentikan (deselect) efek klik kiri

sebelumnya terhadap salah satu Tool pada Tools Toolbar ataupun memilih (men-select) area yang diinginkan pada kanvas. Selanjutnya dengan Edit > 64

Undo dapat dihapus/dibatalkan perintah terakhir yang pernah diberikan terhadap area tersebut. : Text Tool, digunakan untuk menuliskan label/teks lainnya pada kanvas.

: Merupakan Tool untuk memiliki salah satu di antara daftar nama variabel teramati untuk ditempatkan dalam lambang ,

, dan

.

lain : Merupakan Tools yang digunakan untuk menspesifikasikan fiksasi

nilai atau kendala bagi μ, σ2, ataupun parameter lainnya. : Merupakan Tools untuk memutar arah lambang suku pengganggu.

Analisis SEM dengan Mode Grafik Berikut akan diperlihatkan kembali contoh analisis jalur dengan SEM yang sebelumnya dalam bab terdahulu telah dikerjakan dengan mode interaktif, namun sekarang akan dikerjakan dengan mode grafik.

Contoh 6.1 (Model jalur auto): Lihat kembali contoh 4.6. Buka file auto.dta

dan generate variabel

weight2=weight^2, lalu buka kanvas SEM Builder dengan mengklik Statistics > SEM (Structural Equation Modeling) pada menu Standard Toolbar. Langkah-langkah selanjutnya adalah: 1.

Klik lambang

pada Tools Toolbar, klik kiri pada kanvas untuk meletakkan

lambang empat persegi panjang tersebut pada tempat yang dikehendaki dalam kanvas. Klik

pada Contextual Toolbar dan pilih nama variabel

weight, yang akan muncul dalam lambang 2.

.

Ulangi langkah 1 untuk variabel weight2, foreign, dan mpg dengan mengacu kepada model dalam contoh 4.6.

3.

Klik lambang

(Path Tool), gambarkan efek langsung tersebut dari variabel

weight menuju ke mpg. Penggambaran jalur ini menetapkan status weight sebagai variabel eksogen dan mpg sebagai variabel endogen, sehingga secara otomatis akan untuk variabel endogen mpg.

memunculkan suku pengganggu (error) 4.

Ulangi langkah 3 untuk penggambaran efek langsung weight2 dan foreign ke mpg. 65

5.

Penggambaran model dengan 1 variabel dependen tanpa adanya efek tak-langsung seperti pada model jalur auto di atas (model regresi ganda) dapat juga dilakukan sekaligus dengan mengklik lambang

. Dengan mengklik lambang

akan muncul

menu untuk mengisi nama-nama variabel dependen dan independen dalam model. Setelah menu selesai diisi, klik OK untuk kembali ke kanvas SEM Builder. 6.

Jika penggambaran model telah selesai, klik lambang estimate

pada

Contextual Toolbar atau Estimation pada Standard Toolbar. 7.

Hasil estimasi dalam bentuk tak terstandardisasi yang dapat dilihat langsung pada kanvas adalah (gambar 6.3):

Gambar 6.3 Model jalur auto pada kanvas SEM Builder -

Rerata dan variansi masing-masing variabel eksogen (independen), tercantum dalam masing-masing lambang

-

untuk variabel eksogen tersebut.



weight: rerata 3.0e+03 dan variansi 6.0e+05



weight2: rerata 9.7e+06 dan variansi 2.3e+13



foreign: rerata .3 dan variansi .21

Efek langsung tak terstandardisasi masing-masing variabel eksogen terhadap variabel endogen, tercantum di atas masing-masing lambang jalur 

efek weight → mpg -1.7e-02



efek weight2 → mpg 1.6e-06



efek foreign → mpg -2.2

66

.

-

Intersep untuk model regresi ganda, tercantum dalam lambang

untuk variabel

endogen (dependen).  -

intersep model regresi ganda 57

Variansi suku pengganggu untuk variabel endogen, tercantum di samping lambang suku pengganggu 

8.

Untuk

.

Variansi ε1 10 mengganti

hasil

dalam

bentuk

tak-terstandardisasi

menjadi

bentuk

terstandardisasi, klik View > Standardized Estimates pada Standard Toolbar. 9.

Hasil dalam bentuk penyajian yang lebih rinci dapat dilihat pada jendela Result pada Stata.

67

BAB 7 MODEL STRUKTURAL NON-REKURSIF Tipe Model Struktural Non-Rekursif Dua tipe model struktural non-rekursif yang lazim ditemukan ialah model dengan lingkar umpan-balik dan model dengan semua kemungkinan korelasi pengganggu. Pada model dengan lingkar umpan-balik (feedback loop) selalu didapatkan lingkar umpan-balik, baik berupa lingkar umpan-balik langsung (direct feedback loop) seperti Y1

Y2 , maupun

lingkar umpan-balik tak-langsung (indirect feedback loop), misalnya Y1 → Y2 → Y3 → Y1 . Model dengan semua kemungkinan korelasi pengganggu (all possible disturbance correlations) adalah model dengan semua korelasi yang mungkin antar suku pengganggu. Pada sebuah model struktural non-rekursif, lingkar umpan-balik mungkin didapatkan bersama-sama dengan semua kemungkinan korelasi pengganggu. Dalam contoh pada gambar 7.1, didapatkan baik lingkar umpan-balik tak-langsung Y1 → Y2 → Y3 → Y1 , maupun semua kemungkinan korelasi pengganggu, Corr ( D1 ; D2 ), Corr ( D2 ; D3 ), serta Corr ( D1 ; D3 ).

Gambar 7.1 Contoh model non-rekursif dengan lingkar umpan-balik dan semua kemungkinan korelasi pengganggu

Identifikasi pada Model Non-Rekursif Model rekursif akan selalu teridentifikasi, jika jumlah titik data lebih besar daripada jumlah parameter bebas dan seluruh variabel laten sekurang-kurangnya berskala interval.

68

Sebaliknya, model non-rekursif mungkin tak teridentifikasi walaupun jumlah observasi lebih besar daripada jumlah parameter bebas dan seluruh variabel laten berskala interval. Persyaratan identifikasi pada model struktural non-rekursif dibedakan menjadi syarat perlu (necessary condition) dan syarat cukup (sufficient condition). Syarat perlu pada model non-rekursif dinamakan kondisi order (order condition) dan syarat cukup dinamakan kondisi rank (rank condition).

Kondisi Order Kondisi order terpenuhi, jika untuk setiap variabel endogen, jumlah variabel eksklusinya sama dengan atau lebih besar daripada jumlah seluruh variabel endogen dikurangi satu: nexc > nend − 1

(7.1)

nexc : jumlah variabel eksklusi suatu variabel endogen tertentu nend : jumlah seluruh variabel endogen

Variabel eksklusi (excluded variable) suatu variabel endogen adalah variabel dalam model yang tidak memiliki efek langsung (direct effect) terhadap variabel endogen tersebut (bukan merupakan prediktornya). Kondisi order (order condition) merupakan syarat perlu (necessary condition) bagi identifikasi suatu model, namun bukan merupakan syarat cukup (sufficient condition).

Contoh 7.1 (Kondisi order): Lihat contoh model non-rekursif pada gambar 7.1. Pada model tersebut jumlah variabel endogen nend = 3, yaitu Y1 , Y2 , dan Y3 ; sehingga nend − 1 = 2. Selanjutnya diperoleh: -

Untuk variabel endogen Y1 terdapat nexc = 3 variabel eksklusi, yaitu X 2 , X 3 , dan Y2 , sehingga nexc > 2.

-

Untuk variabel endogen Y2 terdapat nexc = 3 variabel eksklusi, yaitu X 1 , X 3 , dan Y3 , sehingga nexc > 2.

-

Untuk variabel endogen Y3 terdapat nexc = 3 variabel eksklusi, yaitu X 1 , X 2 , dan Y1 , sehingga nexc > 2. Dengan demikian maka untuk seluruh variabel endogen dipenuhi syarat nexc > nend − 1,

sehingga kondisi order untuk model ini terpenuhi. 69

Kondisi Rank Kondisi rank terpenuhi untuk suatu variabel endogen, jika rank matriks reduksinya sama dengan atau lebih besar daripada jumlah seluruh variabel endogen dikurangi satu: rk > nend − 1 rk

(7.2)

: rank matriks reduksi variabel endogen ke-k Model dinyatakan teridentifikasi jika kondisi rank terpenuhi untuk seluruh variabel

endogen dalam model.

Prosedur penentuan rank matriks reduksi variabel endogen: 1.

Buat matriks sistem, yaitu matriks yang menyajikan variabel endogen sebagai variabel baris dan prediktor (termasuk variabel endogen) sebagai variabel kolom. Nilai “1” menyatakan adanya efek langsung prediktor terhadap variabel endogen, sedangkan entri lain seluruhnya diberi nilai “0”. Nilai “1” juga diberikan untuk entri suatu variabel endogen terhadap variabel endogen itu sendiri.

2.

Untuk variabel endogen pertama pada baris teratas, coret semua entri pada baris pertama serta entri pada kolom setiap nilai “1”.

3.

4.

Pada matriks sisanya, hapus baris yang: -

seluruh entrinya bernilai “0”

-

tepat sama dengan salah satu baris lainnya

-

sama dengan hasil penjumlahan dua baris lainnya

Matriks tersisa adalah matriks reduksi untuk variabel endogen pertama. Rank matriks sistem sama dengan jumlah baris tersisa pada matriks reduksi.

5.

Ulangi prosedur untuk variabel kedua, ketiga, dan seterusnya.

Contoh 7.2 (Kondisi rank): Lihat contoh kembali model non-rekursif pada gambar 7.1. Pada contoh ini hanya akan diperlihatkan penentuan rank matriks reduksi untuk variabel endogen Y1 dengan langkahlangkah berikut:

70

1.

Matriks sistem adalah: Y1 Y2 Y3

2.

X2 0

X3 0

Y1 1

Y2 0

Y3 1

0 0

1 0

0 1

1 0

1 1

0 1

Coret semua entri pada baris pertama serta entri pada kolom setiap nilai “1”. Y1 Y2 Y3

3.

X1 1

X1 1

X2 0

X3 0

Y1 1

Y2 0

Y3 1

0 0

1 0

0 1

1 0

1 1

0 1

Pada matriks sisanya, tidak ada baris yang perlu dihapus: Y2

X2 1

X3 0

Y2 1

Y3

0

1

1

Matriks pada No. 3 di atas yang merupakan matriks reduksi bagi variabel endogen Y1 memiliki dua baris, sehingga rank-nya adalah rk = 2. Karena nend − 1 = 2, maka persyaratan rk > nend − 1 terpenuhi bagi variabel endogen Y1 . Selanjutnya prosedur yang sama masih

harus diulangi untuk variabel endogen Y2 dan Y3 .

Efek Tak-langsung pada Model Non-Rekursif Misalkan dimiliki model rekursif dengan lingkar umpan-balik langsung Y1 Misalkan pula efek terstandardisasi Y1 terhadap Y2

adalah

Y2 .

p12 = 0.40 dan efek

terstandardisasi Y2 terhadap Y1 adalah p21 = 0.20. Maka lingkar umpan-balik Y1

Y2 maka

menghasilkan efek tak-langsung Y1 → Y2 → Y1 , Y1 → Y2 → Y1 → Y2 → Y1 , Y1 → Y2 → Y1 → Y2 → Y1 → Y2 → Y1 , dan seterusnya yang akan merupakan siklus berulang tak berhingga secara teoretis. Besar efeknya adalah p12 . p21 + p12 . p21 . p12 . p21 + p12 . p21 . p12 . p21 . p12 . p21 + . . . ,

dan seterusnya, yang nilainya adalah (0.40)(0.20) + (0.40)(0.20)(0.40)(0.20) +

(0.40)(0.20) (0.40)(0.20)(0.40)(0.20) + . . . dengan kelanjutan yang dengan cepat akan mendekati nol, sehingga diasumsikan mencapai keseimbangan.

71

Korelasi Ganda Kuadrat Pada model rekursif, koefisien determinasi dan koefisien korelasi-ganda kuadrat Bentler-Raykov memiliki nilai yang sama dan keduanya dapat dipakai sebagai ukuran proporsi variansi variabel dependen yang dijelaskan oleh prediktornya. Sebaliknya, pada model non-rekursif keduanya memiliki nilai yang berbeda, sebagai ukuran proporsi variansi variabel dependen yang dijelaskan oleh prediktornya dianjurkan hanya menggunakan koefisien korelasi-ganda kuadrat Bentler-Raykov.

Contoh 7.3: Misalkan dimiliki data longitudinal karakteristik 84 orang ibu di masa muda mereka, yaitu agression, withdrawal, education, dan maternal age, serta karakteristik anak mereka 10-15 tahun sesudahnya, yaitu internalization dan externalization (Cooperman, 1996). Data diberikan dalam matriks korelasi beserta standar deviasi untuk tiap variabel (tabel 7.1). Model jalur non-rekursif untuk data ini diperlihatkan pada gambar 7.2.

Tabel 7.1 Data korelasi model jalur non-rekursif hubungan transgenerasi pada permasalahan penyesuaian diri Variabel Karakteristik ibu 1. aggression 2. withdrawal 3. education 4. maternal age Karakteristik anak 5. internalization 6. externalization SD

1

2

3

4

1.00 .19 −.16 −.37

1.00 −.20 −.06

1.00 .36

1.00

−.06 .13 1.09

−.05 −.06 1.03

−.03 −.09 2.17

−.25 −.28 2.33

5

6

1.00 .41 .28

1.00 .36

Sumber: Cooperman (1996); N = 84

Dengan adanya 6 variabel (4 karakteristik ibu dan 2 karakteristik anak), didapatkan jumlah titik data p = (6)(7)/2 = 21. Jumlah parameter bebas yang diestimasi q = 19, terdiri atas 2 variansi variabel eksogen, 4 variansi suku pengganggu, 3 kovariansi antar variabel eksogen dan antar suku pengganggu, serta 10 efek langsung. Derajat bebas model adalah df M = 21 – 19 = 2. Walaupun derajat bebas model df M > 0, untuk model non-rekursif masih harus diperiksa kondisi order dan rank yang ternyata terpenuhi, sehingga model ini dapat dinyatakan teridentifikasi (atau tepatnya, lebih-teridentifikasi).

72

Gambar 7.2 Model jalur non-rekursif hubungan transgenerasi pada permasalahan penyesuaian diri Hasil analisis SEM dengan program komputer diperlihatkan pada tabel 7.2. Interpretasinya antara lain yaitu, wanita yang sifat agresinya (aggression) satu SD di atas rerata cenderung melahirkan anak pertama pada usia (age) kurang-lebih sepertiga SD (−.380) di bawah rerata. Ibu yang melahirkan anak pertama pada usia (age) satu SD di atas rerata diasosiasikan memiliki tingkat pendidikan (education) kurang-lebih sepertiga SD (.340) di atas rerata. Tingkat pendidikan (education) juga dipengaruhi oleh sifat menutup diri (withdrawal), wanita yang nilai withdrawal-nya satu SD di atas rerata memiliki tingkat education kurang-lebih dua persepuluh (−.180) di bawah rerata. Kemaknaan statistik di sini tidak terlalu diperhatikan karena kekuatan analisis statistik (statistical power) yang dapat diperkirakan rendah dengan ukuran sampel yang kecil (N = 84).

Tabel 7.2 Estimasi parameter model jalur non-rekursif hubungan transgenerasi pada permasalahan penyesuaian diri a. Efek langsung

 

Parameter

bij

SE bij

pij

aggr → age educ → age with → educ age → educ aggr → ext educ → ext age → ext with → int educ → int age → int

−.812** −.065 –.378 .317 .032 .003 –.039* –.005 .008 −.033*

.304 .648 .215 .256 .035 .019 .018 .027 .015 .014

−.380 −.061 −.180 .340 .097 .015 −.248 −.018 .065 −.275

73

b. Variansi dan kovariansi pengganggu Parameter Dage

Var (D)

SE (D)

Var (Z)

4.904*

2.480

.457

Deduc

3.949**

.613

.839

.304

2.874

.069

Dext

.120**

.019

.923

Dint

.073**

.011

.936

.035**

.011

.379

Deduc

Dage

Dext

Dint

*: p < .05; **: p < .01

Analisis Model Non-Rekursif dengan Stata Seperti telah dijelaskan di atas, analisis model non-rekursif pada SEM hanya boleh dilakukan setelah kondisi order dan rank terpenuhi, serta model teridentifikasi.

Contoh 7.4 (Model struktural non-rekursif, manual Stata): File data: sem_sm1.dta Variabel: variable name r_intel r_parasp r_ses r_occasp r_educasp f_intel f_parasp f_ses f_occasp f_educasp

variable label respondent's intelligence respondent's parental aspiration respondent's family socioeconomic status respondent's occupational aspiration respondent's educational aspiration friend's intelligence friend's parental aspiration friend's family socioeconomic status friend's occupational aspiration friend's educational aspiration

The data contain 329 boys with information on five variables and the same information for each boy’s best friend.

Model:

74

Persamaan: f_occasp = α1 + β11r_ses + β12f_ses + β13f_intel + β14r_occasp + ε1 r_occasp = α2 + β21r_intel + β22r_ses + β23f_ses + β24f_occasp + ε2

Perintah sem: . use http://www.stata-press.com/data/r12/sem_sm1 . sem (r_occasp <− f_occasp r_intel r_ses f_ses) >

(f_occasp <− r_occasp f_intel f_ses r_ses),

>

cov (e.r_occasp*e.f_occasp) standardized

Endogenous variables Observed: r_occasp f_occasp Exogenous variables Observed: r_intel r_ses f_ses f_intel Fitting target model: log likelihood = −2617.0489 log likelihood = −2617.0489



Number of obs

=

329

Coef.

OIM Std. Err.

z

P>|z|

f_occasp

.2773441

.1281904

2.16

0.031

.0260956

.5285926

r_intel

.2854766

.05

5.71

0.000

.1874783

.3834748

r_ses

.1570082

.0520841

3.01

0.003

.0549252

.2590912

f_ses

.0973327

.060153

1.62

0.106

−.020565

.2152304

r_occasp

.2118102

.156297

1.36

0.175

−.0945264

.5181467

r_ses

.0794194

.0587732

1.35

0.177

−.0357739

.1946127

f_ses

.1681772

.0537199

3.13

0.002

.062888

.2734663

f_intel

.3693682

.0525924

7.02

0.000

.2662891

.4724474

Variance e.r_occasp

.6889244

.0399973

.6148268

.7719519

e.f_occasp

.6378539

.039965

.5641425

.7211964

−.2325666

.2180087

−.6598558

.1947227

Standardized


Structural r_occ~p <−

Structural f_occ~p <−

Covariance e.r_occasp e.f_occasp


=

−1.07 0.00,

75

0.286

Prob > chi2 =

.

Contoh 7.5 (Estimasi statistik-suai dan kebaikan-suai, manual Stata): File data: sem_sm1.dta (lihat kembali contoh 7.4) Model: Lihat model pada contoh 7.4 Perintah sem: . estat gof, stats (all) Fit statistic

Value

Description

Likelihood ratio chi2_ms (3) p > chi2 chi2_bs (9) p > chi2

38.864 0.000 264.817 0.000

Population error RMSEA 90% CI, lower bound upper bound pclose

0.402 0.295 0.519 0.000

Information criteria AIC BIC

4286.391 4309.432

Baseline comparison CFI TLI

0.860 0.579

Comparative fit index Tucker-Lewis index

Size of residuals SRMR CD

0.046 0.932

Standardized root mean squared residuals Coefficient of determination

model vs. saturated baseline vs. saturated


Probability RMSEA <= 0.05 Akaike’s information criterion Bayesian information criterion

. estat eqgof Equation-level goodness of fit

depvars

fitted

Variance predicted

residuals

R-squared

mc

mc2

observed price

7478595

2746103

4732491

.3671951

.6059663

.3671951

weight

581472.1

521219

60253.09

.8963784

.9467726

.8963784

overall

.931919

mc = correlation between depvar and its prediction mc2 = mc^2 is the Bentler-Raykov squared multiple correlation coefficient

76

Contoh 7.6 (Input data korelasi): Perintah sem: . clear all . ssd init aggression withdrawal education age internal external Summary statistics data initialized. Next use, in any order, ssd set observations (required) It is best to do this first. ssd set means (optional) Default setting is 0. ssd set variances or ssd set sd (optional) Use this only if you have set or will set correlations and, even then, this is optional but highly recommended. Default setting is 1. ssd set covariances or ssd set correlations (required)

. ssd set observations 84 (value set) Status: observations:

set

means: unset variances or sd: unset covariances or correlations: unset (required to be set)

. ssd set means .51 .47 10.87 20.57 .08 .15 (values set) Status: observations: means:

set set

variances or sd: unset covariances or correlations: unset (required to be set)

. ssd set sd 1.09 1.03 2.17 2.33 .28 .36 (values set) Status: observations: means:

set set

variances or sd: set covariances or correlations: unset (required to be set)

. ssd set correlations 1.00 \ .19 1.00 \ -.16 -.20 1.00 \ -.37 -.06 .36 1.00 \ -.06 -.05 -.03 -.25 1.00 \ .13 .06 -.09 -.28 .41 1.00 (values set)

77

Status: observations: means:

set set

variances or sd: set covariances or correlations:

set

. label variable aggression "maternal aggression" . label variable withdrawal "maternal withdrawal" . label variable education "maternal education" . label variable age "maternal age" . label variable internal "child internalization" . label variable external "child externalization" . save "D:\SEM\Data\transgenerational_relation.dta" file D:\SEM\Data\transgenerational_relation.dta saved

Contoh 7.7: Pada contoh ini diperlihatkan hasil estimasi parameter untuk data pada contoh 7.6. Perintah sem: . clear all . use "D:\SEM\Data\transgenerational_relation.dta" . sem (age <− aggression education) (education <− withdrawal age) (external <− aggression age education) (internal <− withdrawal age education), cov(aggression*withdrawal e.age*e.education e.external*e.internal) Endogenous variables Observed: age education external internal Exogenous variables Observed: aggression withdrawal Fitting target model: Iteration 0: Iteration 1: Iteration 2: Iteration 3:

log likelihood = -637.52633 log likelihood = -637.2952 log likelihood = -637.29471 log likelihood = -637.29471

Structural equation model

Number of obs

Estimation method = ml Log likelihood

= -637.29471

78

=

84

Coef.

OIM Std. Err.

z

P>|z|

Structural age <− education aggression _cons

−.065209 −.8116886 21.69278

.6445339 .3021317 7.115742

−0.10 −2.69 3.05

0.919 0.007 0.002

−1.328472 −1.403856 7.746185

1.198054 −.2195214 35.63938

education <− age withdrawal _cons

.3168497 −.3783538 4.530227

.2547603 .2133176 5.262017

1.24 −1.77 0.86

0.214 0.076 0.389

−.1824713 −.7964486 −5.783138

.8161708 .039741 14.84359

−.0386485 .002547 .0315864 .9012039

.0183447 .0186604 .035112 .3729462

−2.11 0.14 0.90 2.42

0.035 0.891 0.368 0.016

−.0746035 −.0340266 −.0372318 .1702429

−.0026935 .0391206 .1004046 1.632165

age education aggression _cons

−.0329934 .008388 −.0052084 .6699444

.0135667 .0148052 .0272522 .2710048

−2.43 0.57 −0.19 2.47

0.015 0.571 0.848 0.013

−.0595835 −.0206297 −.0586217 .1387848

−.0064032 .0374056 .0482049 1.201104

aggression withdrawal

.51 .47

.1182187 .1117113

4.31 4.21

0.000 0.000

.2782956 .2510499

.7417044 .6889501

4.845168 3.901594 .1183555 .0721754 1.173956 1.04827

2.435842 .602466 .0183256 .0111497 .1811453 .1617516

1.808752 2.882727 .0873761 .0533207 .867578 .7746937

12.97893 5.280568 .1603187 .0976974 1.588529 1.418458

.3003766

2.82262

0.11

0.915

−5.231856

5.832609

.0350529

.0109452

3.20

0.001

.0136006

.0565052

.2107736

.1232037

1.71

0.087

−.0307012

.4522484


external <− age education aggression _cons internal <−

Mean

Variance e.age e.education e.external e.internal aggression withdrawal Covariance e.age e.education e.external e.internal aggression withdrawal


=

2.99,

79

Prob > chi2 = 0.2237

BAB 8 STRUKTUR RERATA Analisis Nilai Rerata pada SEM Dalam SEM pada umumnya yang dianalisis adalah kovariansi dan bukan rerata. Jika masukan data untuk analisis SEM adalah file data individual, maka nilai-nilai rerata sampel dapat diperoleh dengan menambahkan opsi [, means(nama_vars)] pada jalur SEM (perintah sem paths; lihat kembali pembahasan Notasi Jalur SEM pada bab 4). Pada umumnya sebagai masukan data untuk analisis SEM tidak digunakan file data individual, melainkan file ssd (summary statistics data; data statistik ringkasan) dengan struktur kovariansi yang memuat nilai-nilai matriks kovariansi (atau korelasi) variabel teramati. Untuk analisis rerata dengan SEM digunakan struktur rerata dengan menambahkan 1 baris rerata dan 1 baris variansi sebagai dua baris pertama pada matriks kovariansi (atau korelasi) semula. Sebagai contoh, pada tabel 8.1.a dapat dilihat matriks korelasi yang ada pada file ssd untuk struktur kovariansi data Illness (lihat kembali tabel 4.1), sedangkan tabel 8.1.b menunjukkan isi file ssd untuk struktur reratanya.

Tabel 8.1 Matriks korelasi data Illness a. Struktur kovariansi Variabel 1. Exe 2. Hard 3. Fit 4. Str 5. Ill

Exe 1.00 –0.03 0.39 –0.05 –0.08

Hard –0.03 1.00 0.07 –0.23 –0.16

Fit 0.39 0.07 1.00 –0.13 –0.29

Str –0.05 –0.23 –0.13 1.00 0.34

Ill –0.08 –0.16 –0.29 0.34 1.00

Str 4.80 4489.00 –0.05 –0.23 –0.13 1.00 0.34

Ill 716.70 3903.75 –0.08 –0.16 –0.29 0.34 1.00

b. Struktur rerata

1. 2. 3. 4. 5.

Rerata Variansi Exe Hard Fit Str Ill

Exe 40.90 4422.25 1.00 –0.03 0.39 –0.05 –0.08

Hard 0.00 1444.00 –0.03 1.00 0.07 –0.23 –0.16 80

Fit 67.10 1354.24 0.39 0.07 1.00 –0.13 –0.29

Dengan analisis rerata pada SEM dapat dilakukan uji hipotesis terhadap nilai rerata, tetapi pembahasan mengenai struktur rerata di sini sangat terbatas karena analisis rerata pada SEM terutama ditujukan untuk menguji hipotesis tentang variabel laten pada analisis faktor konfirmatorik dan model regresi struktural. Nilai rerata variabel eksogen pada program Stata dapat diperoleh dengan perintah sem path, means(var_exo).

Misalkan X adalah variabel eksogen, Y adalah variabel endogen, dan

hubungan antara X dan Y dinyatakan dengan model regresi: Y = b0 + b1 X + DY maka rerata variabel endogen Y adalah:

Y = b0 + b1 X

(8.1)

Identifikasi Struktur Rerata Analisis struktur rerata pada SEM berbeda dengan analisis struktur kovariansinya, sehingga penilaian identifikasi struktur rerata harus dilakukan sendiri, terpisah dari penilaian identifikasi struktur kovariansinya. Sebuah dataset dapat memiliki struktur kovariansi yang lebih-teridentifikasi dengan struktur rerata yang kurang-teridentifikasi, ataupun sebaliknya. Jika sebuah file ssd memiliki  variabel teramati, matriks struktur kovariansinya memiliki jumlah titik data  ( + 1)/2. Penambahan baris rerata dan baris variansi pada struktur rerata akan menambahkan sebanyak  nilai informasi sesuai dengan banyak nilai rerata (lihat contoh pada tabel 8.1.b), sedangkan baris variansi tak menambah informasi karena nilai-nilainya sudah tercakup dalam matriks kovariansi semula. Maka diperoleh banyak nilai rerata, nilai variansi, dan nilai kovariansi tak-berulang yang dinamakan sebagai jumlah titik data p untuk struktur rerata yaitu: p=

   3

(8.2)

2

Jumlah parameter q pada struktur rerata sama dengan jumlah parameter pada struktur kovariansinya (jumlah efek langsung, variansi, dan kovariansi), ditambah dengan jumlah rerata variabel eksogen dan jumlah intersep efek langsung. Jumlah intersep efek langsung ini sama banyaknya dengan jumlah efek langsung (jalur; paths). Seperti halnya dengan identifikasi struktur kovariansi, sebuah struktur rerata dinyatakan lebih-teridentifikasi jika p > q; tepat-teridenfikasi jika p = q; dan kurang-teridentifikasi jika p < q.

81

Estimasi Struktur Rerata Estimasi parameter, uji hipotesis, dan penilaian model pada struktur rerata dapat dilakukan dengan metode yang sama seperti untuk struktur kovariansi. Walaupun demikian, tidak semua indeks suai terstandardisasi untuk struktur kovariansi dapat dihitung untuk struktur rerata. Contohnya yaitu indeks suai inkremental CFI (comparative fit index) yang mengukur perbaikan relatif kesesuaian model peneliti dengan model dasar. Pada struktur rerata, pada model dasar diasumsikan seluruh kovariansi dan rerata terkendala dengan nilai nol, asumsi yang sangat tak realistis. Karena estimasi rerata pada SEM hanya dapat dilakukan untuk variabel endogen, penggunaan struktur rerata pada analisis jalur sangat terbatas. Analisis struktur rerata terutama digunakan dan akan dibahas lebih lanjut pada analisis faktor konfirmatorik.

Contoh 8.1: . use “D:\SEM\Data\rokok.dta . sem (sistolik <− usia kolesterol), cov(usia*kolesterol) var(e.sistolik usia kolesterol) > means(usia kolesterol) Endogenous variables Observed: sistolik Exogenous variables Observed: usia kolesterol Fitting target model: Iteration 0: Iteration 1:



Number of obs

=

50

Coef.

OIM Std. Err.

z

P>|z|

usia kolesterol _cons

−.0922103 .0652989 118.1628

.7810589 .0686759 41.05388

−0.12 0.95 2.88

0.906 0.342 0.004

−1.623058 −.0693033 37.69871

1.438637 .1999011 198.627

usia kolesterol Variance e.sistolik usia kolesterol Covariance usia kolesterol

52.34 212.92

.5385982 6.125543

97.18 34.76

0.000 0.000

51.28437 200.9142

53.39563 224.9258

429.0054 14.5044 1876.114

85.80107 2.90088 375.2227

289.8828 9.800753 1267.707

634.8967 21.46545 2776.511

28.7272

23.68001

−17.68478

75.13918


Structural sistolik <−

Mean


=

1.21 0.00,

82

0.225

Prob > chi2 =

.

Kovariansi antar variabel eksogen pada sem diasumsikan selalu ada, nilai kovariansi antara

usia

dengan

kolesterol

akan

tetap

ditampilkan, walaupun

opsi

“,

cov(usia*kolesterol” tak dituliskan, demikian pula halnya variansi suku pengganggu e.sistolik akan selalu tercantum walaupun opsi “var(e.sistolik)” tak diberikan.

Sebalik rerata usia dan kolesterol hanya akan ditampilkan jika ada opsi “, means(usia kolesterol)”. Variansi usia dan kolesterol hanya akan ditampilkan jika ada opsi “, means(usia kolesterol)” dan/atau “, var(usia kolesterol)”. Perhatikan bahwa

variabel endogen tak memiliki variansi, selain itu opsi “, means(nama_var)” hanya dapat digunakan untuk variabel eksogen.

.

83

BAB 9 SAMPLING GANDA Penggunaan Sampling Ganda pada SEM Sampling ganda praktis selalu digunakan pada rancangan studi eksperimental, yang memperbandingkan kelompok-kelompok perlakuan. Sampling ganda digunakan pada studi observasional jika anggota sampel diperoleh dari dua atau lebih subpopulasi yang berbeda. Yang menjadi pertanyaan di sini ialah: 1.

Ada tidaknya perbedaan parameter model antar kelompok.

2.

Ada tidaknya moderasi kelompok terhadap hubungan dalam model, atau dengan kata lain ada tidaknya interaksi antara kelompok dengan prediktor. Sebagai contoh data, diperlihatkan matriks kovariansi 50 responden yang terbagi atas 2

kelompok, grup 1 (perokok, tabel 8.1 atas) dan grup 2 (non-perokok, tabel 8.1 bawah).

Tabel 9.1 Matriks kovariansi 50 responden Studi Jantung Honolulu A. Grup 1: Perokok (N = 25) Variabel sistolik usia kolesterol Means SD

sistolik 628.63 1.3 189.43 129.28 25.07

usia

sistolik 272.67 −.43 73.53 125.2 16.51

usia

17.92 19.79 52.4 4.23

kolesterol

2895.5 209.8 53.81

B. Grup 2: Non-perokok (N = 25) Variabel sistolik usia kolesterol Means SD

84

12.29 40.45 52.28 3.51

kolesterol

992.79 216.04 31.51

Analisis Sampel Ganda pada Stata Analisis data pada tabel 9.1 diperlihatkan pada contoh 9.1 berikut.

Contoh 9.1: . use rokok_ssd.dta . sem (sistolik <− usia kolesterol), group(group) Endogenous variables Observed: sistolik Exogenous variables Observed: usia kolesterol Fitting target model: Iteration 0: Iteration 1:


Structural equation model Grouping variable = group Estimation method = ml Log likelihood = −611.30609

Number of obs Number of groups

= =

50 2

Coef.

OIM Std. Err.

z

P>|z|

1 2

.0002977 −.3219241

1.177281 1.000138

0.00 −0.32

1.000 0.748

−2.307131 −2.282158

2.307726 1.63831

1 2

.0654202 .0871804

.0926163 .1112774

0.71 0.78

0.480 0.433

−.1161044 −.1309194

.2469448 .3052802

1 2

115.5392 123.1957

63.23401 49.005

1.83 2.51

0.068 0.012

−8.397133 27.1477

239.4756 219.2438

1 2

591.5876 255.4763

167.3262 72.25962

339.8309 146.7556

1029.853 444.7407


Structural sistolik <− usia

kolesterol

_cons

Variance e.sistolik


=

0.00,

Prob > chi2 = .

. estat ggof Group-level fit statistics group 1 2

N

SRMR

CD

chi2

df

p>chi2

25 25

0.000 0.000

0.020 0.024

0.000 0.000

0 0

. .

85

. estat ginvariant Tests for group invariance of parameters chi2 Structural sistolik <− usia kolesterol _cons Variance e.sistolik

Wald Test df

p>chi2

chi2

Score Test df

p>chi2

0.044 0.023 0.009

1 1 1

0.8348 0.8805 0.9238

. . .

. . .

. . .

3.401

1

0.0652

.

.

.

Contoh 9.2: . use rokok_ssd.dta . sem (sistolik <− usia kolesterol), group(group) ginvariant(all) Endogenous variables Observed: sistolik Exogenous variables Observed: usia kolesterol Fitting target model: Iteration 0: log likelihood = −613.78589 Iteration 1: log likelihood = −613.76882 Iteration 2: log likelihood = −613.76881 Structural equation model Grouping variable = group Estimation method = ml Log likelihood = −613.76881

Number of obs Number of groups

= =

50 2

( 1) [sistolik]1bn.group#c.usia − [sistolik]2.group#c.usia = 0 ( 2) [sistolik]1bn.group#c.kolesterol − [sistolik]2.group#c.kolesterol = 0 ( 3) [var(e.sistolik)]1bn.group − [var(e.sistolik)]2.group = 0 ( 4) [sistolik]1bn.group − [sistolik]2.group = 0

Coef.

OIM Std. Err.

z

P>|z|

[*]

−.0920975

.7810625

−0.12

0.906

−1.622952

1.438757

[*]

.0652956

.068762

0.95

0.342

−.0693072

.1998984

[*]

118.1576

41.054

2.88

0.004

37.69328

198.622


Structural sistolik <− usia kolesterol _cons

86

Variance e.sistolik [*]

429.0085

85.80156

289.8851

634.9009

Note: [*] identifies parameter estimates constrained to be equal across groups. LR test of model vs. saturated: chi2(4) =

4.93, Prob > chi2 = 0.2950

Opsi [group(groupname)] pada perintah sem path akan menghasilkan estimasi parameter per kelompok, selanjutnya pengujian kesamaan parameter antar kelompok (between groups) dilakukan dengan melanjutkan perintah sem path, group(groupname) tersebut dengan perintah estat ginvariant.

Sebaliknya jika model dijadikan terkendala dengan kesamaan parameter lintas kelompok (across group), estimasi parameter serta pengujiannya dilakukan sekaligus dengan perintah sem path, group(groupname) ginvariant(all).

Variabel Moderator dan Efek Interaksi Efek interaksi didasarkan atas keberadaan variabel moderator, yaitu variabel yang mempengaruhi arah dan/atau kekuatan hubungan antara suatu prediktor dengan kriterion. Kemaknaan variabel moderator kontinu dapat diuji dengan memasukkannya dalam model. Sebagai contoh, pada model jalur dalam gambar 9.1 dapat dilihat bahwa variabel W merupakan variabel moderator, baik dalam hubungan antara prediktor X dengan kriterion M maupun hubungan antara prediktor X dengan kriterion Y. Pengendalian efek interaksi sekaligus pengujian kemaknaannya dilakukan dengan memasukkan variabel W serta variabel hasil perkalian X dengan W sebagai prediktor tambahan dalam hubungan antara prediktor X dengan kriterionnya.

Gambar 9.1 Contoh model jalur dengan variabel moderator kontinu

87

Jika variabel moderator W berskala kategorik, baik dikotomi ataupun ordinal, kategori W dapat dijadikan dasar pengelompokan sampel dalam Stata, selanjutnya analisis SEM hubungan antara prediktor X dengan kedua kriterionnya M dan Y dilakukan per kelompok dengan memperlakukannya sebagai sampel ganda, tanpa perlu membentuk variabel hasil perkalian antara X dangan W. Estimasi parameter hubungan antara X dengan M dan Y berikut pengujian efek interaksi antara X dengan W dilakukan dengan perintah sem path, group(groupname)

yang disusul dengan perintah estat ginvariant seperti pada contoh 9.1.

Contoh 9.3 (Interaksi dengan variabel moderator kontinu): . use D:\SEM\Data\bankloan.dta . gen age_emp=age*employ . sem (income <− age employ age_emp) Endogenous variables Observed: income Exogenous variables Observed: age employ age_emp Fitting target model: Iteration 0: Iteration 1:



Number of obs

Coef.

OIM Std. Err.

z

P>|z|

age employ age_emp _cons

−.0980292 −2.774291 .1438937 26.35535

.1936215 .7536995 .0183936 6.531747

−0.51 −3.68 7.82 4.03

0.613 0.000 0.000 0.000

e.income

809.6697

39.27475

Standardized Structural income <−

=

850

[95% Conf. Interval] −.4775203 −4.251515 .1078429 13.55336

.2814619 −1.297067 .1799445 39.15734

736.2385

890.4247

Variance LR test of model vs. Saturated: chi2(0)

=

0.00,

88

Prob > chi2 =

.

KEPUSTAKAAN Hershberger SL, 1994, ‘The specification of equivalent models before the collection of data’, in Latent variables analysis, eds A von Eye, CC Clogg, Sage, Thousand Oaks, CA, pp 68-105. Jackson JL, Dezee K, Douglas K, Shimeall W, 2005, Introduction to Structural Equation Modeling (Path

Analysis),

SGIM

Precourse

PA08,

viewed

8

May

2012,

www.sgim.org/userfiles/file/AMHandouts/AM05/handouts/pa08.pdf> Kenny DA, 2011, Path Analysis, viewed 10 May 2012, _______, 2011, Measuring Model Fit, viewed 10 May 2012, Kline RB, 2005, Principles and Practice of Structural Equation Modeling, 2nd edn, The Guildford Press, New York. _______, 2011, Principles and Practice of Structural Equation Modeling, 3 rd edn, The Guildford Press, New York. Kupek E, 2006, ‘Beyond logistic regression: structural equation modelling for binary variables and its application to investigating unobserved confounders’, BMC Medical Research Methodology, vol 6, no 13. MacCallum RC, Austin JT, 2000, ‘Applications of Structural Equation Modeling in Psychological Research’, Annu Rev Psychol, no 51, pp 201-226. Moss S, 2009, Fit indices for structural equation modeling, Psychlopedia, viewed 6 May 2012, viewed 8 May 2012, Norris AE, 2005a, ‘Path Analysis’, in Statistical Methods for Health Care Research, 5th edn, ed BA Munro, Lippincott Williams & Wilkins, Philadelphia, pp 377-403 _______, 2005b, ‘Structural Equation Modeling’, in Statistical Methods for Health Care Research, 5th edn, ed BA Munro, Lippincott Williams & Wilkins, Philadelphia, pp 405-434. Newsom J, 2012, Some Clarifications and Recommendations on Fit Indices, USP 655, SEM Jason Newsom's

SEM

Class,

viewed

12

May

2012,

newsom/semclass/ho_fit.pdf> Romney DM, Jenkins CD, Bynner JM, 1992, ‘A structural analysis of health-related quality of life dimensions’, Human Relations, no 45, pp 165-176. StataCorp LP, 2011, Stata Structural Equation Modeling: Reference Manual Release 12, Stata Press, Lakeway Drive, College Station, Texas. Suhr

D,

nd,

Step

your

way

through

Path

Analysis,

viewed

12

May

2012,

Wuensch KL, 2009, An introduction to Structural Equation Modeling (SEM), Dept of Psychology, East Carolina University, Greenville, NC USA.

89

Lampiran 1

KOEFISIEN KORELASI Data masukan (input data) yang lazim digunakan untuk analisis SEM adalah matriks kovariansi atau korelasi. Korelasi yang dimaksud adalah korefisien korelasi Pearson yang merepresentasikan korelasi antara dua variabel kontinu. Dalam keadaan tertentu dapat juga digunakan beberapa bentuk korelasi lain, yaitu: 1.

Korelasi biserial-titik (point-biserial correlation): Misalkan dimiliki variabel random X yang berskala dikotomi (X = 0, 1), dan variabel

random Y yang berskala kontinu, maka korelasi biserial-titik (point-biserial correlation) antara X dan Y adalah:

rpb =

y1  y0

y

n1n0 y1  y0 = y n2

pq

(I.1)

rpb : koefisien korelasi biserial-titik y1 : rerata Y untuk X = 1 y0 : rerata Y untuk X = 0

 y : standar deviasi (populasi) Y; jika  y tak diketahui diganti dengan estimasi sampelnya n

: ukuran sampel

n1 : ukuran sampel kelompok untuk X = 1 n0 : ukuran sampel kelompok untuk X = 0

p

: proporsi anggota sampel untuk X = 1; p = n1 /n

q

: proporsi anggota sampel untuk X = 0; q = n0 /n

Perintah Stata: pbis bvar cvar [if] [in]

Contoh I.1: Berikut ini diperlihatkan perhitungan korelasi biserial-titik antara variabel default yang berskala dikotomi dengan variabel income yang berskala kontinu pada file bankloan.dta. . use D:\SEM\Data\bankloan.dta, clear . pbis default income (obs= 700)

90

Np= 183

p= 0.26

Nq= 517

q= 0.74

Coef.= −0.0709

t= −1.8784

P>|t| = 0.0607

df = 698

Diperoleh koefisien korelasi biserial titik rpb = −0.0709. Seandainya digunakan perintah untuk koefisien korelasi Pearson, diperoleh hasil yang hampir sama: . corr default income (obs=700)

default income

2.

default 1.0000 −0.0710

income 1.0000

Korelasi biserial rank (rank biserial correlation): Korelasi biserial rank adalah korelasi antara variabel dikotomi dengan variabel ordinal.

Misalkan dimiliki variabel random X yang berskala dikotomi dan variabel random Y yang berskala ordinal, maka korelasi biserial rank antara X dan Y adalah: rrb =

2  y1  y0 

(I.2)

n

rrb : korelasi biserial rank

y1 : rerata ranking Y untuk X = 1 y0 : rerata ranking Y untuk X = 0

n

: jumlah pasangan data

3.

Koefisien phi (phi coefficient) Koefisien phi adalah ukuran asosiasi antara dua variabel dikotomi. Lihat tabel 2×2 di

bawah ini: X=1 X=0 Jumlah

Y=1 a c m1

Y=0 b d m0

Koefisien korelasi phi antara X dan Y adalah:

91

Jumlah n1 n0

ˆ =

ad  bc n1n0 m1m0

(I.3)

Perintah Stata: phi catvar1 catvar2 [if exp] [in range] [, options]

Contoh I.2: Contoh ini memperlihatkan koefisien korelasi phi antara variabel sex dan nktt, keduanya berskala kategorik, dari file tension-type.dta. . use D:\SEM\Data\tension-type.dta, clear . phi sex nktt Jenis

Nyeri Kepala

kelamin

Tipe-Tegang

responden

0

1

Total

0

29

36

65

1

81

72

153

Total

110

108

218

Pearson chi2(1) =

1.2650

Pr = 0.261

phi = Cohen's w = fourfold point correlation = 0.0762 phi-squared = 0.0058

Dengan perintah corr untuk menghitung koefisien korelasi Pearson diperoleh: . corr sex nktt (obs=218) sex sex

1.0000

nktt

-0.0762

nktt

1.0000

Walaupun nilai korelasi phi praktis sama atau hampir sama dengan korelasi Pearson, perhitungannya dengan perintah phi selalu menghasilkan nilai positif, sehingga tandanya dianjurkan untuk diberikan berdasarkan koefisien Pearson.

4.

Korelasi order rank Spearman (Spearman’s rank order correlation): Korelasi order rank Spearman adalah korelasi antara dua variabel yang berskala

ordinal. Jika tidak ada ties, koefisien korelasi Spearman adalah:

92

rs = 1 



(I.4)



n n2  1

di = R  xi   R  yi 

dengan



6 di2

(I.4.a)

: koefisien korelasi Spearman

R  xi  : ranking xi R  yi  : ranking yi n

: ukuran sampel

Perintah Stata: spearman varlist [if] [in] [, options]

Contoh I.3: Perintah spearman yang akan diperlihatkan di sini adalah untuk menghitung korelasi antara variabel mpg dengan rep78 pada file auto.dta. . use D:\SEM\Data\auto.dta, clear . spearman mpg rep78 Number of obs =

69

Spearman's rho =

0.3098

Test of Ho: mpg and rep78 are independent Prob > |t| =

0.0096

Dengan perintah corr, didapatkan nilai korelasi Pearson yang agak berbeda: . corr mpg rep78 (obs=69) mpg

5.

mpg

1.0000

rep78

0.4023

rep78

1.0000

Korelasi biserial (biserial correlation) Korelasi biserial adalah korelasi antara variabel random kontinu X dan variabel random

dikotomi Y, variabel Y merupakan hasil kategorisasi dikotomi dari sebuah variabel kontinu. Diasumsikan X dan Y yang melatarbelakangi Y dikotomi keduanya kontinu dan berdistribusi normal. 93

rb = rb

y1  y0 pq . y Z

(I.5)

: koefisien biserial

y1 : rerata Y untuk kelompok X = 1 y0 : rerata Y untuk kelompok X = 0

 y : standar deviasi (populasi) Y; jika  y tak diketahui diganti dengan estimasi sampelnya p

: proporsi Y untuk X = 1

q

: proporsi Y untuk X = 0

Z

: Nilai Z pada titik pisah (cut-off point) kategorisasi dikotomi variabel X

6.

Korelasi tetrakorik (tetrachoric correlation): Korelasi tetrakorik adalah korelasi antara dua variabel dikotomi X dan Y, keduanya

merupakan hasil kategorisasi dari dua variabel kontinu yang berdistribusi normal. Korelasi tetrakorik antara X dan Y adalah: rtet = cos



( I.6)

1  bc ad

Perintah Stata: tetrachoric varlist [if] [in] [, options]

Contoh I.4: Perintah tetrachoric di sini adalah untuk menghitung korelasi tetrakorik antara variabel RS074

dengan RS075 pada file familyvalues.dta.

. use D:\SEM\Data\familyvalues.dta, clear . tetrachoric RS074 RS075 Number of obs =

3300

Tetrachoric rho =

0.0679

Std error =

0.0302

Test of Ho: RS074 and RS075 are independent 2-sided exact P =

0.0278

94

Dengan perintah corr untuk korelasi Pearson diperoleh: . corr RS074 RS075 (obs=3300) RS074 RS074

1.0000

RS075

0.0390

7.

RS075

1.0000

Korelasi poliserial (polyserial correlation): Merupakan generalisasi korelasi biserial, yaitu korelasi antara variabel random kontinu

X dan variabel kategorik Y yang berskala ordinal sebagai hasil kategorisasi sebuah variabel kontinu. Diasumsikan X dan Y yang melatarbelakangi Y ordinal keduanya kontinu dan berdistribusi normal. Perintah Stata (sama dengan No. 8): polychoric varlist [if exp] [in range] [, options]

8.

Korelasi polikorik (polychoric correlation): Merupakan generalisasi korelasi tetrakorik, yaitu korelasi variabel random X dan

variabel random Y, keduanya berskala ordinal sebagai hasil kategorisasi dua variabel kontinu yang berdistribusi normal. Perhitungan korelasi poliserial dan polikorik relatif rumit, sehingga biasanya dilakukan dengan menggunakan program komputer. Perintah Stata (sama dengan No. 7): polychoric varlist [if exp] [in range] [, options]

Contoh I.5: Dalam contoh ini digunakan kembali file auto.dta untuk menghitung korelasi polikorik antara variabel rep78 dengan foreign. . use D:\SEM\Data\auto.dta . polychoric rep78 foreign Variables :

rep78 foreign

Type :

polychoric

Rho

= .80668063

S.e.

= .07631278

Goodness of fit tests: Pearson G2 = .43127118, Prob( >chi2(3)) = .93370947 LR X2

= .38898869, Prob( >chi2(3)) = .94250766

95

Dengan perintah corr diperoleh nilai korelasi Pearson yang agak jauh berbeda: . corr rep78 foreign (obs=69) rep78 rep78

1.0000

foreign

0.5922

foreign

1.0000

Skema penggunaan koefisien korelasi untuk berbagai skala variabel diperlihatkan pada tabel I. Pada tabel I.A variabel kategoriknya berskala kategorik murni dalam arti kata bukan hasil kategorisasi suatu variabel kontinu, sedangkan tabel I.2 adalah skema jika untuk tiap variabel kategorik ada variabel kontinu berdistribusi normal yang melatarbelakanginya, dengan kata lain variabel kategoriknya adalah hasil kategorisasi suatu variabel kontinu.

Tabel I. Skema korelasi untuk berbagai skala pengukuran variabel A. Variabel kategorik tidak dilatarbelakangi oleh variabel kontinu X Dikotomi Ordinal Kontinu

Y Ordinal Korelasi biserial rank Korelasi Spearman Korelasi Spearman

Dikotomi Koefisien phi Korelasi biserial rank Korelasi biserial titik

Kontinu Korelasi biserial titik Korelasi Spearman Korelasi Pearson

B. Variabel kategorik dilatarbelakangi oleh variabel kontinu X Dikotomi Ordinal Kontinu

Y Ordinal Korelasi polikorik Korelasi polikorik Korelasi poliserial

Dikotomi Korelasi tetrakorik Korelasi polikorik Korelasi biserial

96

Kontinu Korelasi biserial Korelasi poliserial Korelasi Pearson

Lampiran 2

ANALISIS REGRESI LINEAR DENGAN STATA Perintah: regress regress depvar [indepvars] [if] [in] [, options] options noconstant level (#) beta robust

Description suppress constant term set confidence level; default is level (95) report standardized beta coefficients tipe standard error yang dianjurkan heteroskedastisitas

untuk

dipilih jika

ada

Variabel indikator Variabel indikator adalah variabel yang bernilai biner (0 dan 1), digunakan untuk merepresentasikan variabel katagorik dalam model regresi. Variabel indikator diperoleh sebagai hasil operasi i. (lihat bawah) terhadap suatu variabel kategorik, dinyatakan sebagai i.varname. Variabel kategorik dan kontinu Semua variabel yang tidak bernilai biner (0 dan 1) dan tidak berada dalam suku interaksi dalam model akan diperlakukan sebagai variabel kontinu, kecuali mendapatkan operator i. (lihat bawah). Semua variabel yang berada dalam suku interaksi akan diperlakukan sebagai variabel kategorik, kecuali mendapat operator c. (lihat bawah). Operator i. dan c. Operator i. bagi suatu variabel, yaitu i.varname, menyatakan bahwa data pada variabel tersebut adalah data kategorik, dan i.varname adalah variabel indikatornya. Operator c. bagi suatu variabel, yaitu c.varname, menyatakan bahwa suatu variabel berskala kontinu. Operator # dan ## Operator # (palang; cross) dan ## (palang faktorial; factorial cross) digunakan terhadap pasangan variabel. Operator # menyatakan interaksi dan mengimplikasikan semua variabel dalam suku interaksi sebagai variabel indikator, kecuali mendapat operator c. Operasi ## menyatakan interaksi faktorial.

97

Contoh II.1: grup

: variabel grup (nilai grup lebih daripada 2) diperlakukan sebagai variabel kontinu (walaupun data sebenarnya kategorik)

i.grup

: variabel indikator untuk variabel grup

seks

: variabel seks diperlakukan sebagai variabel kategorik karena sudah bernilai biner.

i.seks

: operator i. tak diperlukan, i.seks pengertiannya sama dengan seks.

usia

: variabel usia diperlakukan sebagai variabel kontinu

c.usia

: operator c. tak diperlukan, c.usia pengertiannya sama dengan usia.

grup#seks

: menyatakan interaksi antara 2 variabel kategorik, grup dan seks

i.grup#i.seks

: operator i. tak diperlukan, semua variabel dalam suku interaksi diperlakukan sebagai variabel kategorik

grup#c.usia

: menyatakan interaksi antara variabel kategorik grup dengan variabel kontinu usia.

Operator c. bagi usia harus ada supaya usia diperlakukan sebagai

variabel kontinu. i.grup#c.usia

: operator i. bagi variabel grup tak diperlukan, pengertiannya sama dengan grup#c.usia.

grup##seks

: menyatakan interaksi antara variabel kategorik grup dan seks disertai pemasukan variabel i.grup dan seks (di luar suku interaksi) dalam model

grup##c.usia

: menyatakan interaksi antara variabel kategorik grup dan variabel kontinu usia disertai pemasukan variabel i.grup dan usia dalam model.

Contoh II.2: - Buka file honolulu.dta: . use “D:\SEM\Data\honolulu.dta” - Regresikan sistolik terhadap usia dan kolesterol: . regress sistolik usia kolesterol - Masukkan suku interaksi antara usia dengan kolesterol: . regress sistolik usia kolesterol c.usia#c.kolesterol - Perhatikan bahwa tanpa operator c. pada interaksi, usia dan kolesterol akan diperlakukan sebagai variabel kategorik dengan kategori yang sangat banyak, sehingga analisis regresi tak dapat dilakukan. - Regresikan sistolik terhadap usia dan seks: . regress sistolik usia seks

98

- Variabel seks tidak memerlukan operator i. karena bernilai biner (0 dan 1), sehingga dengan sendirinya sudah dianggap sebagai variabel kategorik. - Masukkan suku interaksi antara usia dengan seks: . regress sistolik usia seks c.usia#seks - Variabel usia memerlukan operator c. pada suku interaksi, sedangkan variabel seks tidak memerlukan operator i. - Regresikan sistolik terhadap usia dan tk_pend: . regress sistolik usia i.tk_pend - Variabel tk_pend adalah variabel kategorik, sehingga memerlukan operator i. - Masukkan suku interaksi antara usia dan tk_pend: . regress sistolik usia i.tk_pend c.usia#tk_pend - Perhatikan bahwa pada suku interaksi, usia memerlukan operator c., sebaliknya tk_pend tidak lagi memerlukan operator i. - Regresikan kembali sistolik terhadap usia, kolesterol, dan interaksinya: . regress sistolik usia kolesterol usia#kolesterol - Regresi terakhir ini menggunakan rancangan faktorial, sehingga perintahnya dapat juga dituliskan sebagai: . regress usia##kolesterol

Contoh II.3: Misalkan hendak diregresikan variabel mpg terhadap variabel rep78 pada file auto.dta.

Variabel mpg sebagai variabel dependen merupakan variabel kontinu, sedangkan

variabel rep78 sebagai variabel independen juga akan diperlakukan sebagai variabel kontinu, kecuali jika diberikan operator i. . use “D:\SEM\Data\auto.dta” . regress mpg i.rep78

99

Tampak bahwa operator i menghasilkan pembentukan 4 (5 – 1) variabel indikator untuk variabel semula rep78 yang memiliki 5 taraf, yang diberi nama variabel nomor 2 s.d. 5 di bawah nama rep78. Perintah lama xi memberi hasil yang sama, hanya dengan penamaan yang berbeda: . xi: regress mpg i.rep78 i.rep78

_I.rep78_1-5

(naturally coded; _I.rep78_1 omitted)

Grafik Model Regresi Diagram tebar (scatter diagram) variabel dependen dengan satu variabel independen dapat dituliskan dengan perintah twoway (scatter depvar indepvar); garis regresi ditampilkan dengan perintah twoway (lfit depvar indepvar); sedangkan diagram tebar dapat ditampilkan bersama-sama dengan perintah twoway (scatter depvar indepvar) (lfit depvar indepvar). Garis regresi dapat juga digambarkan bersama pita interval konfidensinya dengan mengganti perintah lfit menjadi lfitci.

100

Contoh II.4: - Buka kembali file honolulu.dta: . use “D:\SEM\Data\honolulu.dta” - Tampilkan grafik diagram tebar kolesterol (sumbu X) dan sistolik (sumbu Y):

100

120

140

160

Tekanan Darah Sistolik

180

200

. twoway (scatter sistolik kolesterol)

150

200

250 300 Kadar Kolesterol

350

400

- Perlihatkan diagram garis regresi sistolik terhadap kolesterol:

120

130

Fitted values

140

150

. twoway (lfit sistolik kolesterol)

150

200


- Garis regresinya disertai pita interval konfidensi 95%: . twoway (lfitci sistolik kolesterol)

101

350

400

160 140 120 100

150

200

250 300 Kadar Kolesterol 95% CI

350

400

Fitted values

- Diagram tebar kolesterol dan sistolik digambarkan bersama garis regresinya:

100

120

140

160

180

200

. twoway (scatter sistolik kolesterol) (lfit sistolik kolesterol)

150

200


Tekanan Darah Sistolik

350

400

Fitted values

- Gambaran garis regresi disertai pita interval konfidensi 95%:

100

120

140

160

180

200

. twoway (scatter sistolik kolesterol) (lfitci sistolik kolesterol)

150

200

250 300 Kadar Kolesterol Tekanan Darah Sistolik Fitted values

102

350 95% CI

400

Uji Normalitas Secara kasar normalitas suatu variabel dapat dinilai dengan menggunakan grafik univariat variabel tersebut, dengan perintah . stem varname

Diagram batang-dan-daun (stem-and-leaf)

. graph box varname

Diagram kotak-dan-titik (box-and-whisker plot)

. histogram varname

Grafik histogram

. pnorm varname

Diagram probabilitas normal terstandardisasi

Uji statistik normalitas suatu variabel dapat dilakukan dengan uji Shapiro Wilk, dengan perintah: . swilk varname Contoh II.5: Buka file highschool.dta. . use “D:\SEM\Data\highschool.dta . stem write Stem-and-leaf plot for write (writing score) 3* 3t 3f 3s 3. 4* 4t 4f 4s 4. 5* 5t 5f 5s 5. 6* 6t 6f 6s

| | | | | | | | | | | | | | | | | | |

1111 3333 55 66777 899999 0001111111111 223 4444444444445 66666666677 99999999999 00 2222222222222223 44444444444444444555 777777777777 9999999999999999999999999 00001111 2222222222222222223333 5555555555555555 7777777

. graph box read

103

80 70 60 30

40

50

reading score

0

1

2

Density

3

4

. histogram race

1

2

3

4

race

0.00

0.25

0.50

Normal F[(math-m)/s]

0.75

1.00

. pnorm math

0.00

0.25

0.50 Empirical P[i] = i/(N+1)

0.75

1.00

. swilk math Shapiro-Wilk W test for normal data Variable math

Obs 200

W 0.98024

V 2.947

104

z 2.487

Prob>z 0.00644

Uji Heteroskedastisitas Asumsi homoskedastisitas mempersyaratkan variansi distribusi variabel dependen adalah sama untuk setiap nilai variabel independen. Uji keberadaan heteroskedastisitas dapat dilakukan dengan dua perintah Stata: . estat hettest [varlist] atau: . estat imtest

yang dilakukan segera setelah perintah pemodelan regress depvar [indepvars]. Contoh II.6: Buka file auto.dta dengan model regresi linear dan hasil seperti pada contoh 2.7. . sysuse auto . regress mpg weight c.weight#c.weight foreign . estat hettest weight c.weight#c.weight foreign Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: weight c.weight#c.weight foreign chi2(3)

=

29.17

Prob > chi2

=

0.0000

. estat imtest Cameron & Trivedi's decomposition of IM-test Source Heteroskedasticity Skewness Kurtosis Total

chi2 11.95 7.54 1.71 21.19

df 7 3 1 11

p 0.1023 0.0566 0.1915 0.0315

Uji Multikolinearitas Salah satu ukuran untuk menilai keberadaan multikolineritas adalah perhitungan nilai VIF (variance inflation factor). Multikolinearitas dianggap ada jika VIF terbesar lebih daripada 10 (ada juga mengambil batas atas 30). Perintah Stata untuk menghitung VIF adalah: . estat vif yang dilakukan segera setelah perintah regress depvar [indepvars], atau cukup dengan: . vif 105

Jika intersep hendak diperlakukan sebagai salah satu variabel independen dan ikut dihitung nilai VIF-nya, perintah Stata adalah: . estat vif, uncentered Contoh II.7: Buka file bodyfat.dta, regresikan variabel bodyfat terhadap tricep, thigh, dan midarm. . use “D:\SEM\Data\bodyfat.dta . regress bodyfat tricep thigh midarm

. estat vif Variable triceps thigh midarm Mean VIF

VIF 708.84 564.34 104.61 459.26

1/VIF 0.001411 0.001772 0.009560

Residual Residual (galat) adalah selisih suatu nilai prediktor dengan nilai prediksinya berdasarkan model regresi: ei = Yi − Yˆi

Residual terstandardisasi (standardized residuals; rstandard) adalah es i =



s

ei 1  hi



s : akar rerata galat kuadrat (the root of MSE) hi :

leverage untuk titik ke-i (lihat bawah) Residual Studentized (jacknifed residuals; rstudent) adalah: ri =

 s  i

ei 1  hi

 106

si



: akar rerata galat kuadrat jika pengamatan ke-i dihilangkan

Leverage Titik prediktor yang nilainya menyimpang jauh dari reratanya dinyatakan sebagai titik pengamatan dengan leverage tinggi atau titik leverage. lvr2plot adalah grafik yang menggambarkan leverage (sumbu Y) terhadap kuadrat residual (sumbu X). Pada sisi kiri atas grafik akan didapatkan titik-titik dengan leverage yang tinggi, sedangkan di sisi kanan bawah grafik adalah titik-titik dengan residual absolut yang besar. Perintah lvr2plot diberikan segera setelah perintah regress: . regress depvar [indepvar1, indepvar2, . . .] . lvr2plot Jika untuk titik yang ada pada grafik ingin disertakan nilai variabel independennya, perintahnya adalah: . lvr2plot, ml (indepvar) Informasi pada plot leverage vs residual-kuadrat ini dapat diringkas menjadi satu statistik, antara lain berupa DFITS dan Cook’s Distance. DFITs ke-i adalah: DFITsi = ri

hi 1  hi

ri

: residual Studentized

hi

: leverage Cook’s Distance untuk pengamatan ke-i adalah: 2 hi 1 s(i ) 1 ei2 2 Di = DFITs = i 2 2 p s 1  hi 2 p s

p

: jumlah variabel independen (termasuk konstante)

s 2 : rerata galat kuadrat (mean square error; MSE)

s(2i ) : rerata galat kuadrat jika pengamatan ke-i dihilangkan Ukuran yang paling langsung menunjukkan pengaruh suatu titik terhadap model regresi adalah DFBETAs. DFBETAs dihitung untuk pengamatan ke-i setiap variabel independen. Rumus untuk leverage dan DFBETAs dinyatakan dalam bentuk operasi matriks, tak dilampirkan di sini.

107

Perintah predict Perintah predict adalah perintah memprediksi nilai-nilai tertentu berdasarkan model yang ada pada perintah regress. Perintah ini diberikan segera setelah perintah regress, hasilnya prediksinya akan langsung berada pada basis-data. Beberapa di antaranya yaitu: . predict depvar_hat

Prediksi nilai variabel dependen berdasarkan model regresi

. predict e if e(sample)

Prediksi nilai-nilai residual

. predict l, leverage

Prediksi nilai-nilai leverage, yang mengukur pengaruh pengamatan ke-i terhadap koefisien regresi

. predict c, cooksd

Prediksi nilai Cook’s D, yang mengukur pengaruh pengamatan

ke-i

terhadap

model

regresi

secara

keseluruhan atau nilai-nilai prediksi. . predict rstu, rstu

Prediksi nilai residual Studentized

. predict dfits, dfits

Prediksi

nilai

pengamatan

DFITs,

ke-i

yang

mengukur

terhadap

model

pengaruh

regresi

secara

keseluruhan . predict dfbeta, dfbeta

Prediksi nilai DFBETAs, yang mengukur pengaruh pengamatan ke-i terhadap koefisien regresi suatu variabel independen tertentu

Beberapa perintah plot lain Selain perintah lvr2plot, beberapa perintah plot lain untuk menilai kesesuaian model dengan data adalah: . acprplot varind

plot augmented component-plus-residual, seperti cprplot, tetapi

dalam

model

penuh

(dan

residual

parsial)

ditambahkan variabel X 2j beserta koefisien regresinya, digunakan untuk mengecek asumsi normalitas. . avplot varind

plot added variable X, yaitu grafik residual variabel dependen

diregresikan

terhadap

seluruh

variabel

independen kecuali X dengan residual X diregresikan terhadap seluruh variabel independen lain, digunakan untuk mengecek asumsi linearitas. . avplots

plot added variabel untuk seluruh p variabel independen (p buah grafik). 108

. cprplot varind

plot

component-plus-residual,

 ei  b j X ji 

yaitu

grafik

antara

yang diperoleh dari model penuh (full model)

diregresikan terhadap variabel independen X j , digunakan untuk mengecek asumsi linearitas. . rvfplot

plot residual-versus-fitted, yaitu grafik residual terhadap nilai-nilai prediksi variabel dependen, digunakan untuk mengecek asumsi homoskedastisitas.

. rvpplot

plot

residual-versus-predictor,

yaitu

grafik

residual

terhadap nilai-nilai salah satu variabel independen.

Ridge Regression Ridge regression adalah tipe pengestimasian model regresi yang dianjurkan jika terdapat multikolinearitas. Perintah Stata adalah: . ridgereg depvar indvars [if] [in], model(orr|grr1|grr2|grr3) Opsi model adalah sebagai berikut, yang harus dipilih salah satu: model(orr)

Ordinary Ridge Regression

model(grr1)

Generalized Ridge Regression

model(grr2)

Iterative Generalized Ridge Regression

model(grr3)

Adaptive Generalized Ridge Regression

Jika opsi model tidak dispesifikasi, perintah ridgereg akan menghasilkan estimasi OLS (Ordinary Least Square) biasa.

Contoh II.8: Lihat kembali file bodyfat.dta pada contoh II.7. Pada contoh II.7 terlihat adanya multikolinearitas antar ketiga variabel independen tricep, thigh, dan midarm dengan nilai VIF yang sangat tinggi. Dengan ridge regression diperoleh hasil estimasi sebagai berikut. . use “D:\SEM\Data\bodyfat.dta” . ridgereg bodyfat tricep thigh midarm, model(grr1) Variable

Obs

Mean

Std. Dev.

Min

Max

__00005F

20

1

0

1

1

* Generalized Ridge Regression bodyfat = triceps + thigh + midarm

109

110

LAMPIRAN 3

BEBERAPA NILAI-NILAI STATISTIK SUAI PADA ANALISIS SEM Statistik suai (fit statistics) yang ada dalam kepustakaan serta dilaporkan pada berbagai program statistik komputer sangat beragam. Beberapa yang lazim digunakan dan dilaporkan pada estimasi parameter SEM dengan Stata disajikan pada tabel berikut.

Statistik RMSEA

Interpretasi Indeks berbasis-non-sentralitas, merupakan indeks ‘keburukan-suai’ dengan interpretasi sebagai berikut: - RMSEA < 0.05: Aproksimasi kesesuaian baik - 0.05 < RMSEA < 0.08: Galat aproksimasi masih dapat diterima - RMSEA > 0.10: Kesesuaian buruk Interval konfidensi 90% untuk RMSEA adalah - Batas bawah interval < 0.05: H 0 : RMSEA < 0.05 (aproksimasi kesesuaian model baik) tidak ditolak. - Batas atas interval tidak > 0.10: H 0 : RMSEA > 0.10 (kesesuaian model buruk) ditolak. - Batas bawah interval < 0.05 & batas atas interval > 0.10 hasil kontroversial

pclose

pclose (p of close fit) adalah nilai p satu-sisi untuk uji H 0 : RMSEA = 0.05 vs H A : RMSEA > 0.05. - Jika p > 0.05, disimpulkan kesesuaian model ‘mendekati’ (close) - Jika p < 0.05, disimpulkan kesesuaian model lebih buruk daripada ‘close fitting’

AIC

Indeks suai mutlak / indeks prediktif-suai: Memperbandingkan matriks kovariansi model peneliti dengan matrik kovariansi data. Nilai AIC yang lebih kecil mengindikasikan kesesuaian yang lebih baik, model sesuai terbaik adalah model dengan AIC terkecil

111

Statistik BIC

Interpretasi Indeks suai mutlak / indeks presiktif-suai seperti AIC, namun BIC sangat menekankan parsimoni.

CFI

Merupakan indeks berbasis-non-sentralitas, menilai perbaikan relatif kesesuaian model peneliti dibandingkan dengan model dasar, yaitu model dengan asumsi semua kovariansi bernilai sama dengan nol. Nilai CFI berkisar antara 0 s.d. 1. Kesesuaian dianggap baik jika CFI > 0.95.

TLI

Indeks suai-relatif: Memperbanding model peneliti dengan model nol, yang menyatakan semua korelasi bernilai nol. Nilai TLI dapat berkisar antara sedikit lebih kecil daripada 1 s.d. lebih besar daripada 1. Kesesuaian dianggap baik jika TLI > 0.95.

SRMR

Ukuran kesuaian mutlak, merupakan selisih terstandardisasi antara matriks korelasi data dengan matriks korelasi prediksi. - SRMR = 0 menyatakan kesesuaian sempurna - SRMR < 0.8 dianggap menunjukkan kesesuaian baik

112

Lampiran 4

UJI HIPOTESIS PADA SEM Pada estimasi parameter SEM, secara otomatis dilaporkan hasil uji Z untuk menilai kemaknaan efek langsung setiap prediktor terhadap kriterionnya. Dalam bab 4 juga telah dibahas uji Sobel untuk menilai signifikansi efek tak langsung antara dua variabel yang terjadi melalui satu variabel mediator. Beberapa uji hipotesis lainnya adalah: 1.

Uji rasio likelihood untuk memperbandingkan nilai-nilai (kovariansi) prediksi model peneliti dengan nilai-nilai (kovariansi) data sampel (disebut juga model jenuh). Hasil uji ini secara otomatis dilaporkan pada pemodelan dan estimasi parameter [perintah sem (vardep <− varindep1, varindep 2, . . .)].

2.

Uji rasio likelihood untuk memperbandingkan dua model. Hasil estimasi kedua model harus terlebih dahulu disimpan sebelum dapat diperbandingkan, dengan perintah: . sem path1 . estimates store A . sem path2 . estimates store B . lrtest A B

3.

Uji Wald untuk memperbandingkan nilai parameter antar kelompok (between groups) pada sampel ganda, dengan perintah: . sem path . estat ginvariant

113

PEMODELAN PERSAMAAN STRUKTURAL: I. ANALISIS JALUR

Recommend Documents