Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014
ROBUST STANDARD ERRORS DENGAN SATORRA-BENTLER SCALED TEST STATISTIC UNTUK MENGATASI NONNORMALITAS DALAM ANALISIS STRUCTURAL EQUATION MODELING (SEM) (ROBUST STANDARD ERRORS WITH SATORRA-BENTLER SCALED TEST STATISTIC TO NONNORMALITY IN STRUCTURAL EQUATION MODELING (SEM) ANALYSIS)
1,2,3
Andina Ishmah Almira 1 , I Made Tirta 2 , Dian Anggraeni3 Jurusan Matematika, Fakultas Ilmu Pengetahuan Alam, Universitas Jember Jln. Kalimantan 37, Jember 68121 2 E-mail:
[email protected] Abstrak Nonnormalitas dalam analisis Structural Equation Modeling (SEM) berpotensi menyebabkan hasil yangmenyesatkan. Salah satu metode uji statistik yang dapat digunakan untuk mengatasi hal tersebut adalah robust standard errors (SErobust) dengan Satorra-Bentler scaled test statistic (TSB). Metode tersebut akan diuji pada beberapaukuran sampel dan distribusi data yang bervariasi. SErobust dan TSB yang dihasilkan akan dibandingkan dengan standard error dan uji statistik Maximum Likelihood (SEML dan TML). Selain itu ukuran Goodness of Fit (GOF) darikedua metode juga akan ditampilkan. Kedua metode bekerja dengan baik pada data normal. Sementara pada datanonnormal, ML menghasilkan SEML yang jauh lebih kecil daripada SErobust. SE yang kecil berarti underestimate dancenderung menolak model yang benar pada data nonnormal. Hal tersebut menyebabkan muncul nilai scaling corrections factor (SCF) yang berdampak pada uji statistik model. SCF untuk data normal bernilai mendekati 1, halini menunjukkan bahwa data berdistribusi normal dan tidak membutuhkan banyak koreksi. Sedangkan SCF untukdata nonnormal bernilai cukup besar, yang membuat TSB lebih kecil dan lebih mendekati nilai χ2 yang diharapkandaripada TML. Hal tersebut baik, karena menunjukkan bahwa robust standard errors dengan Satorra-Bentler scaled test statistic dapat menghasilkan p-value yang lebih besar, yang berarti metode tersebut cenderung menerima model yang benar dan dapat menghindari kesalahan tipe 1. Ukuran sampel data sangat berpengaruh pada hasil penelitian. Hasil penelitian yang baik terjadi pada ukuran sampel yang tidak terlalu kecil. Kata Kunci: nonnormalitas, robust standard error, Satorra-Bentler test statistic, Structural Equation Modeling Abstract Nonnormality in Structural Equation Modeling (SEM) analysis has potentially lead to misleading results. Onestatistical testing method that can be used to overcome this problem is robust standard errors (SErobust) with
22
Andina Ishmah Almira, et. al.
Robust Standard Errors Dengan........................
Satorra-Bentler scaled test statistic (TSB). The method was examined under varying conditions of sample size and datadistribution. SErobust and TSB will compared with the standard error and statistical tests of the Maximum Likelihood(SEML and TML). The Goodness of Fit (GOF) of both methods will also be displayed. Both methods work equally wellon normal data. While on nonnormal data, ML produces SEML that smaller than SErobust. The smaller SE meansunderestimate and have a tendency to reject the specified model on nonnormal data. There are scaling correctionfactor (SCF) as the effect of it. SCF for normal data have an amount that close to 1, it shows that data havenormally distributed and didn't need correction. On the other hand, the SCF of nonnormal data is large enough, itmakes TSB smaller and closer to the expected value of χ2 than TML . This is good because it shows that robuststandard errors with Satorra-Bentler scaled test statistic can produces a large p-value, it means the method tends toaccept the specified model and avoid type 1 errors. Sample size of data affected the results. The best result wasshowed by the larger sample size. Keywords: nonnormality, robust standard error, Satorra-Bentler test statistic, Structural Equation Modeling
1 Pendahuluan Structural Equation Modeling (SEM) adalah analisis statistika yang mampu menyelesaikan permasalahan pengukuran dan penjelasan hubungan kausal antar variabel, baik teramati maupun tidak (laten). SEM merupakan analisis yang cukup populer dan banyak diterapkan dalam ilmu sosial dan perilaku (social and behavioral science) seperti di bidang psikologi, ekonomi, dan pendidikan. Metode Maximum Likelihood (ML) yang berdasarkan asumsi distribusi normal, adalah metode estimasi yang sebagian besar digunakan oleh peneliti SEM [1]. Metode tersebut membutuhkan variabel teramati yang berdistribusi normal multivariat. Permasalahan akan muncul apabila data tidak berdistribusi normal multivariat. Pelanggaran dari asumsi distribusi normal tersebut akan berpotensi menghasilkan hasil yang menyesatkan [2]. Solusi alternatif yang dapat digunakan adalah dengan memilih metode yang tidak memerlukan asumsi normalitas data. Metode tersebut antara lain adalah Asymtotically Distribution-Free (ADF) estimation, Satorra-Bentler scaled test statistic & robuststandard errors, serta bootstrapping. Penelitian ini membandingkan analisis SEM menggunakan metode ML dan robust standard errors dengan Satorra-Bentler scaled test statistic pada ukuran sampel dan distribusi data yang bervariasi. Data yang digunakan berupa data simulasi yang dibangkitkan dari dua jenis distribusi, masing- masing dengan tiga ukuran sampel yang berbeda. Selain untuk mengetahui konsep serta hasil dari kedua metode estimasi. Tujuan dari penelitian ini adalah juga untuk mengetahui metode yang lebih tepat untuk mengatasi nonnormalitas dalam SEM dengan membandingkan seperangkat komponen yang dihasilkan dari kedua metode, yaitu standard error (SErobustdan SEML), nilai uji statistik (TSBdan TML), dan nilai Goodness of Fit (GOF). Dalam literatur SEM, beberapa peneliti telah memperluas metode ML untuk menghasilkan standard errors (SEs) yang asimtotik dan baik untuk sebarang distribusi (dengan terbatas empat momen order), dan dimana rescaled teststatistic digunakan untuk evaluasi keseluruhan model [3]. Standard errors (SEs) penduga ML (MLE) didasarkan pada matriks kovarian yang diperoleh dengan menginverskan matriks
23
Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014
informasi yang disesuaikan. Robust standard error menggantikan matriks kovarian tersebut dengan tipe matriks kovarian sandwich [3]. Ketika robust SE digunakan, uji statistik Satorra-Bentler akan dipasangkan untuk evaluasi keseluruhan model. Ide dari uji statistik Satorra-Bentler (TSB) adalah memodifikasi uji statistik standard (TML) agar lebih mendekati distribusi χ2 dengan memberikan nilai yang merefleksikan derajat kurtosis [3]. Nilai tersebut adalah nilai koreksi (scalingcorrection factor). Metode tersebut sudah terdapat dalam program komputeruntuk SEM (seperti LISREL, EQS, dan R) dan tidak terlalurumit untuk digunakan. Penelitian ini menggunakan bantuanprogram R versi 3.0.2 dengan paket lavaan yangdikembangkan oleh [3] dan paket semPlot yangdikembangkan oleh [4]. Penjelasan selanjutnya akanmembahas tentang metode penelitian, hasil analisis darimetode robust standard errors dengan Satorra-Bentlerscaled test statistic dan maximum likelihood, dan beberapavisualisasi hasil analisis dalam bentuk yang representatif.
2 Metode Penelitian 2.1 Data Penelitian Data yang digunakan pada penelitian ini adalah data simulasi. Model data yang akan dibangkitkan terdiri atas satu variabel laten eksogen (Ksi1 ) dan dua variabel laten endogen (Eta1 dan Eta2 ). Setiap variabel laten diukur oleh tiga variabel teramati. Variabel teramati x 1 sampai x 3 mengukur Ksi1 , variabel teramati y1 sampai y3 mengukur Eta1 , dan variabel y4 sampai y6 mengukur Eta2 . Penelitian dilakukan terhadap enam jenis data yang dibangkitkan dari dua jenis distribusi (normal dan nonnormal), masingmasing distribusi memiliki tiga ukuran sampel yang berbeda yaitu 30, 60, dan 105. Data normal memiliki nilai skewness=0 dan kurtosis=0 sedangkan data nonnormal memiliki skewness=3 dan kurtosis=7. Penentuan nilai skewness dan kurtosis merujuk pada penelitian [2]. Penelitian menggunakan model data yang dispesifikkan dengan benar artinya model yang diestimasi dalam sampel sesuai dengan model yang ada dalam populasi. Model ini ditunjukkan pada Gambar 1.
Gambar 1 Model Jalur Model Simulasi
24
Andina Ishmah Almira, et. al.
Robust Standard Errors Dengan........................
2.2 Metode Penelitian Penelitian ini menggunakan program R versi 3.0.2 dengan paket lavaan 0.5-16 untuk simulasi dan analisis data. Visualisasi jaringan berupa diagram jalur, struktur kovarian, dan struktur kovarian residual ditampilkan untuk mendukung interpretasi dari analisis data. Visualisasi tersebut dikerjakan dengan paket semPlot.
2.3 Langkah Penelitian Langkah penelitian yang dilakukan adalahsebagai berikut: 1 Menentukan model. Model yang telah ditentukan menjadi dasar dari data yang digunakan dalampenelitian ini, yaitu terdiri atas tiga variabel laten dantiga indikator pada setiap variabel laten. 2 Membangkitkan data. Data dibangkitkan menggunakan metode yang diajukan oleh Vale & Maurelli. Peubah acak berdistribusi nonnormal multivariat dapat dibangkitkan menggunakan gabungan dari prosedur matriks dekomposisi dan metode Fleishman [5]. 3 Mengidentifikasi model menggunakan persamaan berikut: dfm=(( p+q)( p+q+1)/2)−t Dimana, p dan q adalah jumlah variabel teramati eksogen dan endogen, sedangkan t adalah jumlah parameter bebas model. 4 Mengestimasi parameter dilakukan dengan dua metode. Pertama metode Maximum Likelihood (ML) dan yang kedua adalah metode ML yang disertai dengan metode uji statistik robust standard errors dengan Satorra - Bentler scaled test statistic. Penerapan metode ini dalam paket lavaan yaitu dengan mengatur estimator = “ML” dan estimator = “MLM”. Oleh karena itu untuk penjelasan selanjutnya, metode tersebut akan disingkat menjadi MLM. 5 Menguji keseluruhan model dengan uji statistik ML (TML) untuk metode ML dan uji statistik Satorra-Bentler (TSB) untuk metode MLM serta beberapa ukuran GOF. 6 Menyajikan visualisasi jaringan dan menarik kesimpulan.
3 Hasil Penelitian 3.1 Gambaran Data Data nonnormal menjadi salah satu kasus khusus dalam analisis SEM dan merupakan permasalahan yang akan dibahas dalam penelitian ini. Salah satu metode untuk menyelesaikan permasalahan tersebut adalah robuststandard errors dengan Satorra-Bentler scaled test statistic. Metode ini diterjemahkan dalam paket lavaan sebagai metode MLM (Maximum Likelihood Mean adjusted). Sebelum penjelasan mengenai konsep dan hasil analisis, berikut adalah gambaran data yang diperoleh .
25
Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014
(a) (a)
Data Normal N = 105
(b) Data NonNormal N = 105
Gambar 2 Boxplot Data Penelitian Kenormalan data dapat dilihat dari boxplot yang ditunjukkan oleh Gambar 2(a). Pada data normal, whisker bagian atas dan bawah memiliki panjang yang sama. Gambaran data nonnormal yang dibangkitkan dapat dilihat pada Gambar 2(b). Boxplot menampilkan adanya outliers di bagian atas disertai dengan whisker bagian atas yang lebih panjang (positive skewness). Sebelum melakukan estimasi, model terlebih dahulu diidentifikasi. Langkah ini bertujuan untuk mengetahui apakah model termasuk kategori model under-identified, just-identified, atau over-identified. Hal tersebut ditentukan oleh derajat bebas model (dfm). Derajat bebas yang dihasilkan adalah 24 (lebih besar dari 0) yang berarti model tergolong over-identified, sehingga model dapat diestimasi. [2] menyebutkan bahwa derajat bebas tersebut merupakan nilai harapan uji chi-squared (E(χ2)=24), nilai tersebut akan dikoreksi dengan nilai uji chi-squared yang didapatkan dari hasil analisis untuk mendapatkan persentase bias.
3.2 Robust Standard Errors Jumlah parameter bebas dalam penelitian ini adalah sebanyak 21 parameter dimana setiap parameter memiliki standard error. Ketika data berdistribusi normal, nilai standard error yang dihasilkan dengan metode ML lebih besar daripada metode MLM (SEML>SErobust) akan tetapi selisih keduanya tidak terlalu jauh. Pada N=30, selisih terbesar dimiliki oleh standard error γ21 yaitu sebesar 0,085 dengan SEML=0,338 dan SErobust=0,253. Pada saat N=60, selisih terbesar adalah standard error 𝜆𝑥31 yaitu 0,064 dengan SEML=0,473 dan SErobust=0,537. Selisih standarderror 𝜆𝑥31 juga merupakan selisih terbesar pada saat N=105, yaitu 0,049 dengan SEMLdan SErobustmasing- masing 0,459 dan 0,410. Berdasarkan hasil analisis didapatkan bahwa sebagian besar SErobustlebih kecil daripada SEML, akan tetapi terdapat pula beberapa nilai SErobustyang lebih besar. Pada saat N=30, terdapat 9 SErobustyang lebih besar daripada SEML. Data normal dengan N=60 hanya memiliki 5 sedangkan pada saat N=105 jumlah tersebut meningkat menjadi 8 SErobustyang lebih besar. Hal ini berarti ML dan MLM berjalan sama baik ketika diterapkan pada data normal. Hasil kedua metode hampir sama dalam mengukur standard error.
26
Andina Ishmah Almira, et. al.
Robust Standard Errors Dengan........................
Hal yang berbeda terjadi ketika data tidak memenuhi asumsi normalitas. Pada saat N=105, SErobustseluruh lebih besar daripada SEML. Namun saat N=30 dan N=60 masih terdapat 3 dan 2 SErobustyang lebih kecil daripada SEML. Dalam kasus ini metode ML menghasilkan standard errors yang lebih kecil daripada metode MLM (SEML<SErobust). Selisih terbesar kedua standard error tersebut pada N=30, 60, dan 105 berturut-turut 2 adalah 0,604 dari γ21 , 0,553 dari 𝜎𝛿1 , dan 0,316 dari 𝜎𝛿25 . Selisih tersebut lebih besardaripada selisih standard error ketika data berdistribusi normal. Pada data nonnormal hasil dari metode MLM sangat berbeda dengan metode ML. Metode MLM menghasilkan standard error yang lebih besar dengan selisih yang jauh berbeda. Nilai tersebut lebih baik sebab standard error yang besar akan mengakibatkan semakin besar pula peluang model diterima.
3.3 Satorra-Bentler Scaled Test Statistic Tabel 1 dan Tabel 2 menampilkan perbandingan nilai TMLdan TSBdari keseluruhan sampel data. TMLadalah nilai ujistatistik yang dihasilkan metode ML. Sedangkan TSBadalah Satorra-Bentler scaled test statistic. Pada paket lavaan,nilai ini dihasilkan dari metode MLM. Tabel 1. Perbandingan hasil uji statistik χ2 data normal
Data normal dengan univariat skewness dan kurtosis (0,0). TML= Uji Statistik Maximum Likelihood; TSB= Uji Statistik Satorra-Bentler rescaled; SCF = Scaling correction factor. Data normal dengan N=105, menghasilkan SCF=1,062, hal tersebut menunjukkan data berdistribusi normal multivariat sehingga nilai antara TMLdan TSBtidak jauh berbeda (tidak membutuhkan koreksi). Berbeda dengan data nonnormal pada Tabel 2, SCF menunjukkan angka 1,616 pada saat N=105. Skala koreksi tersebut membantu menghasilkan nilai χ2 yang lebih kecil dan mendekati nilai χ2 yang diharapkan sehingga tidak menolak model yang benar terlalu banyak. Data normal dengan ukuran sampel 30 dan 60 menghasilkan nilai TML yang lebih kecil dan p-value yanglebih besar dari TSB, hal tersebut lebih baik sebab nilai TML lebih mendekati nilai χ2 yang diharapkan. Namun pada datanonnormal TMLberjalan buruk dan menjauhi nilai yangdiharapkan. Akibatnya bias yang dihasilkan menjadi lebihbesar, misalnya pada data normal N=60 nilai bias sebesar54% dan bertambah menjadi 133%
27
Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014
saat data tidak normal.Ketidaknormalan data menyebabkan nilai bias meningkatapabila menggunakan metode ML. Tabel 2. Perbandingan hasil uji statistik χ2 data nonnormal
Data nonnormal dengan univariat skewness dan kurtosis (3,7). TML= Uji Statistik Maximum Likelihood; TSB= Uji Statistik Satorra-Bentler rescaled; SCF = Scaling correction factor. Uji statistik Satorra-Bentler menunjukkan hasil yang bagus, baik pada data normal maupun data nonnormal. Pada data normal N=30 dan N=60, TSBlebih besar daripada TML dan p-value yang dihasilkan lebih kecil. Namun selisih keduanya tidak jauh berbeda. Pada N=105 TSBlebih baik dengan menunjukkan nilai χ2 yang lebih kecil dan p-value yang lebih besar. Ketika asumsi normalitas tidak terpenuhi, pada setiap ukuran sampel data, nilai TSBlebih kecil dibandingkan TML. Sedangkan p-value yang dihasilkan lebih besar daripada metode ML. Hasil dua kriteria uji tersebut menunjukkan metode MLM lebih tepat diterapkan pada data nonnormal dibandingkan metode ML.
3.4 Goodness of Fit (GOF) Hasil pengujian model ditampilkan dalam Tabel 3, ukuran kriteria Goodness of Fit (GOF) yang dihasilkan menentukan apakah model cukup baik mendeskripsikan data dan hubungan antar variabel. Beberapa GOF pada tabel dipengaruhi oleh nilai χ2 yang dihasilkan dan ukuran sampel. Kedua metode (ML dan MLM) menghasilkan nilai yang sama yaitu pada ukuran sampel 30 dan 60 model tidak termasuk good fit maupun acceptable fit berdasarkan ukuran CFI, TLI, dan RMSEA. Namun pada saat N=105 semua kriteria GOF menunjukkan bahwa model baik. Hanya data normal dengan 105 sampel yang memenuhi kriteria CFI, TLI, dan RMSEA.
28
Andina Ishmah Almira, et. al.
Robust Standard Errors Dengan........................
Tabel 3. Hasil GOF pada seluruh sampel data
Seperti halnya data normal, pada data nonnormal, uji CFI, TLI, dan RMSEA untuk data dengan N=30 dan N=60 tidak menunjukkan model baik atau diterima. Sedangkan pada N=105 menggunakan metode ML dan MLM, keseluruhan GOF menunjukkan model baik dan diterima.
3.5 Analisis Data Nonnormal dengan N=105 Berdasarkan hasil analisis data yang telah dilakukan pada pembahasan sebelumnya, didapatkan trend/alur bahwa analisis SEM pada data nonnormal memberikan hasil yang lebih baik apabila dikerjakan dengan metode MLM daripada ML dan hasil terbaik adalah ketika data tersebut berkuran N=105. Hal tersebut dapat dilihat dari robust standard error yang dihasilkan, Tabel 4 menunjukkan nilai estimasi parameter beserta standard errornya. Perbedaan terbesar dapat dilihat pada standard error 𝜎𝛿25 , SEML=0,230 dan SErobust=0,546, nilai tersebut mencapai 2kalinya. Meskipun standard error yang dihasilkanberdasarkan metode ML berarti selang kepercayaan lebihpendek, selang yang lebih pendek tersebut adalahmisleading result karena ketidaknormalan data (lihat pada[1]).
29
Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014
Untuk lebih memastikan hal tersebut, akan dilakukan analisis dengan 100 kali pengulangan terhadap datanonnormal N=105. Tabel 5 menyajikan hasil dari pengulangan tersebut, nilai yang didapat adalah rata-rata nilai χ2 teramati, nilai yang diharapkan, persentase bias, dan persentase penolakan model (reject) pada p<0,05 untuk uji statistik χ2 ML ( TML ) dan SB ( TSB ). Persentase bias didapatkan dengan mengurangkan nilai χ2 teramati dengan E( χ2) kemudian dibagi dengan nilai E( χ2) [2]. Tabel 5. Hasil estimasi data nonnormal N=105 dengan 100 kali pengulangan
Berdasarkan Tabel 5 terlihat bahwa Satorra-Bentler χ2 menghasilkan bias jauh kecil (9%) daripada yang dihasilkan oleh ML χ2 (45%). Di bawah kondisi nonnormal untuk N=105, TMLmenolak 44% model yang dispesifikasi dengan benar sedangkan TSBhanya 11%. Hal ini sesuai dengan teori bahwa dengan menggunakan ML χ2 sebagai ukuran model fit dalam kondisi data nonnormal akan menyebabkan tingkat kesalahan tipe 1 meningkat untuk model penolakan. Akibatnya, dalam praktek penelitian, kemungkinan besar
30
Andina Ishmah Almira, et. al.
Robust Standard Errors Dengan........................
terjadi kekeliruan, model akan ditolak atau dimodifikasi karena distribusi dari variabel teramati tidak normal daripada karena model tersebut tidak benar (seperti pada [2]). Hasil yang didapatkan dengan 100 kali ulangan konsisten dengan hasil analisis sebelumnya yang hanya menggunakan satu ulangan. Hasil sama-sama menunjukkan bahwa metode robust standard errors dengan Satorra-Bentler scaled teststatistic mampu mengatasi data nonnormal pada analisis SEM. Namun memang diperlukan ukuran sampel yang tidak terlalu kecil. Hal ini sesua i dengan penelitian yang menyatakan bahwa standard error asimtotik tetap konsisten meskipun data tidak normal akan tetapi dengan ukuran sampel yang tidak terlalu kecil [6]. Selanjutnya hasil analisis data nonnormal N=105 dapat divisualisasikan dalam bentuk diagram jalur seperti pada Gambar 3.
Gambar 3. Diagram jalur analisis SEM dari data nonnormal dengan N=105 Koefisien jalur pada gambar merupakan nilai penduga parameter seperti pada Tabel 4. Ketebalan edge disesuaikan dengan besar kecilnya koefisien jalur, hal ini membantu mengetahui hubungan antar variabel dan variabel yang paling berpengaruh. Nilai koefisen jalur merupakan hasil estimasi parameter seperti yang terdapat pada tabel 4.4. Beberapa nilai peduga parameter yang dihasilkan ada yang mendekati nilai yang ditetapkan ada pula yang tidak. Nilai yang ditetapkan adalah seperti yang terdapat pada Gambar 1.Adapun perbedaan yang terlalu jauh tersebut kemungkinan disebabkan oleh proses simulasi data sebab perbedaan metode ML dan MLM tidak berpengaruh pada estimasi parameter.
3.6 Visualisasi Jaringan Analisis SEM Program R memiliki paket khusus untuk memvisualkan hasil SEM melalui visualisasi jaringan, paket tersebut diantaranya adalah semPlot. Paket semPlotmerupakan penyempurnaan dari paket qgraph. Visualisasi SEM yang dapat
31
Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014
dilakukan oleh kedua paket tersebut diantaranya adalah diagram jalur, struktur korelasi dan kovarian, serta residual kovarian. Pada penelitian ini digunakan paket semPlotuntuk menggambar diagram jalur yang ditunjukkan pada Gambar 2. Selain itu dapat pula disajikan visualisasi struktur kovarian maupun korelasi dari data. Matriks kovarian dan korelasi memiliki struktur yang sama meskipun nilai yang terdapat pada kedua matriks berbeda. Gambar 4 adalah visualisasi dari struktur kovarian data normal dengan N=105. Gambar tersebut menampilkan observed covarianmatrix (Gambar 3(a)) dan implied covarian matrix (Gambar 3(b)).
Gambar 4. Struktur kovarian dari data normal N=105 Sedangkan struktur kovarian dari data nonnormal (observed dan implied) dengan N=105, ditunjukkan pada Gambar 5. Visualisasi ini memudahkan peneliti untuk membandingkan kedekatan hasil analisis (observedcovarian) dengan model yang dihipotesiskan (impliedcovarian). Gambar 4 dan 5 memperlihatkan bahwa kedua kovarian data mempunyai struktur yang hampir sama, hal ini berarti model yang dispesifikasi sesuai dengan data. Hal itulah yang menjadi tujuan dari analisis SEM, untuk mendapatkan model yang sesuai dengan data yang diamati.
Gambar 5. Struktur kovarian dari data nonnormal N=105 Dengan melihat Gambar 4 atau Gambar 5 mungkin masih terdapat kesulitan dalam menentukan perbedaan antara observed covarian dan implied covarian. Gambar 6 berikut ini menyajikan visualisasi yang lebih jelas mengenaiperbedaan kedua matriks
32
Andina Ishmah Almira, et. al.
Robust Standard Errors Dengan........................
kovarian yaitu melalui matriks kovarian residual (observed-implied). Tujuan dari analisisSEM sesuai dengan hipotesis null yaitu matriks kovarianpopulasi (data yang teramati) sama dengan matriks kovariansampel (data yang dianalisis), sehingga analisis tersebut baikapabila perbedaan antara kedua matriks sedikit atau edgesemakin tipis. Sementara ketebalan edge menunjukkankovarian residual antar variabel yang besar.
Pada Gambar 6 (b) terlihat bahwa kovarian antara variabel y1 dan y5 adalah yang paling besar. Hal ini sejalan dengan Gambar 5 (a) dan (b) yang memperlihatkan perbedaan ketebalan edge antara y1 dan y5 . Berdasarkan hasil estimasi parameter, factor loading dari y5 adalah 0,44 sementara factor loading y5 yang ditetapkan pada simulasi data adalah 0,7. Perbedaan nilai ini menjelaskan bahwa model yang dianalisis tidak sesuai dengan model data yang dihipotesiskan, inilah yang menyebabkan besarnya kovarian residual antara y5 dan y1 pada Gambar 6 dan juga perbedaan yang terlihat pada Gambar 5.
4 Penutup 4.1 Kesimpulan Berdasarkan hasil analisis data dan pembahasan yang telah diuraikan, didapatkan kesimpulan sebagai berikut. 1. Pada data yang berdistribusi normal, metode Maximum Likelihood (ML) berjalan baik. Namun apabila asumsinormalitas data tidak terpenuhi, metode ML lebih tepatdigantikan oleh metode MLM. 2. Metode MLM berjalan baik pada semua kondisi data (normal maupun tidak normal). Pada data nonnormal, metode MLM memberikan peluang menerima model yang benar lebih besar daripada metode ML 3. Ukuran sampel data sangat berpengaruh pada hasil simulasi. Metode ML dan MLM menunjukkan hasil terbaik pada saat N=105. Hal ini menandakan bahwa kedua metode membutuhkan ukuran sampel yang tidak terlalu kecil. 4. Visualisasi jaringan (network visualization) pada analisis SEM menggunakan paket semPlot memberi gambaran data yang baik melalui diagram jalur dan struktur kovarian. Keduanya menunjukkan bahwa hasil analisis sesuai dengan
33
34
Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014
data yang ditetapkan. Visualisasi menginterpretasikan hasil analisis.
ini
memudahkan
peneliti
dalam
4.2 Saran Peneliti selanjutnya dapat meneliti kemampuan metode Satorra-Bentler scaled test statistic dan robust standarderrors apabila diterapkan pada misspecified model dimana model yang dianalisis dalam sampel tidak sesuai dengan model data populasi. Peneliti selanjutnya juga dapat menggunakan metode lain untuk mengatasi permasalahan tersebut diantara dengan menggunakan uji statistik Yuan - Bentler dan metode bootstrap.
Ucapan Terima Kasih Penulis mengucapkan terima kasih kepada Bapak Dr. Alfian Futuhul Hadi, S.Si., M.Si dan Bapak Kosala Dwidja Purnomo, S.Si, M.Si yang telah memberikan saran-saran untuk penyempurnaan karya ilmiah ini.
Daftar Pustaka [1] Epskamp, S. 2014. semPlot: Unified Visualizations of Structural Equation Models. [online]. http://www.sachaepskamp.com. [1 April 2014] [2] Curran, P.J., Finch, J.F., & West, S.G. 1996. The Robustness of Test Statistics to nonnormality and Specification Error in Confirmatory Factor Analysis. Psychological Methods. Vol. 1, No. 1, 16-29. [3] Rosseel, Y. 2012. lavaan: An R Package for Structural Equation Modeling. Journal of Statistical Software, Vol 48, Issue 2. [4] Vale, C. D. & Maurelli, V. A. 1983. Simulating Multivariate Nonnormal Distributions. Psychometrika. Vol 48, No. [5] Yuan, K., Bentler, P. M., & Zhang, W. 2005. The Effect of Skewness and Kurtosis on mean and Covariance Structure Analysis: The Univariate Case and Its Multivariate Implication. Sociological Methods andResearch. Vol. 34:2. [6] Yuan, K. & Hayashi, K. 2006. Standard Errors in Covariance Structure Models: Asymtotics Versus Bootstrap. British Journal of Mathematical andStatistical Psychology, 00, 1-22.