Analisis Multivariat Analisis multivariat adalah teknik yang digunakan untuk melihat hubungan antara dua set variabel. Dua set variabel dapat terdiri dari: (1) satu set variabel akibat (dependent variable) dengan satu set variabel prediktor (independent variable); (2) dua set variabel keseluruhan tanpa membedakan akibat dan prediktornya. Analisis multivariat yang digunakan untuk menilai hubungan satu set variabel akibat dengan satu set variabel prediktor disebut dengan metode dependensi. Analisis multivariat yang digunakan untuk menilai dimensi struktur data, tanpa membedakan akibat dan prediktor dikenal sebagai metode interdependensi. Teknik analisis multivariat yang dipilih didasarkan pada: (1) Skala variabel: numerik atau kategorik (2) Membedakan variabel akibat dan prediktor, atau tidak membedakan. (3) Melibatkan: satu variabel akibat, atau lebih dari satu variabel akibat Metode dependensi digunakan untuk melihat secara simultan hubungan variabel prediktor dengan variabel akibatnya. X3 X2
X4
X1
X5
Y
Metode interdependensi digunakan untuk melihat dimensi struktur data (underlying structure). X4 X1
X2
X3 X5
X6
X9 X7
X8 X10
X11
1
Diskriminan Regresi logistik
Regresi linier Anova Ancova
Regresi Cox
Waktu
Kategorik Numerik Manova
Numerik Kanonik
Kategorik Numerik
Numerik
2
Log linier
Kategorik Numerik Nonmetric MultiDimensional Scaling
Metode Interdependensi
PCA FA Metric Cluster MultiDimensional Scaling
Dua atau lebih variabel akibat
Numerik
Satu variabel akibat
Metode Dependensi
Analisis Multivariat
Pemodelan Satu hal yang penting dalam analisis multivariat adalah bagaimana memilih variabel independen sehingga terbentuklah sebuah model yang paling sesuai menjelaskan/menggambarkan variabel dependen yang sesungguhnya dalam populasi. Dalam pembuatan model seringkali dijumpai pandangan yang kurang tepat yaitu memasukkan semua/sebanyak mungkin variabel independen ke dalam model. Alasannya dengan memasukkan sebanyak mungkin variabel independen ke dalam model maka variabel dependen diharapkan dapat diprediksi/diestimasi dengan sempurna. Penambahan variabel independen tidak selalu meningkatkan kemampuan prediksi/estimasi variabel independen terhadap variabel dependen, sebab makin banyak variabel independen (lebihlebih variabel yang tidak relevan) mengakibatkan makin besarnya nilai standard error. Di samping itu model dengan banyak variabel seringkali malah menyulitkan dalam interpretasi. Pada prinsipnya pemodelan dapat digunakan dalam dua hal: a. model prediksi, dengan tujuan untuk memperoleh model yang terdiri dari beberapa variabel independen yang dianggap terbaik untuk memprediksi kejadian variabel dependen. Pada pemodelan ini semua variabel independen dianggap penting. Bentuk kerangka konsepnya: X1 X2 X3
Y
b. model estimasi, dengan tujuan mengestimasi secara valid hubungan satu variabel independen utama dengan variabel dependen dengan mengontrol beberapa variabel konfounding. Bentuk kerangka konsepnya:
X1
Y
X2 X3 X4
Langkah-langkah pemodelan a. Lakukan analisis bivariat untuk menentukan variabel yang menjdai kandidat model. Masing-masing variabel independen dihubungkan dengan variabel dependen (analisis bivariat). Bila hasil uji pada analisis bivariat mempunyai nilai p < 0,25 maka variabel tersebut masuk dalam model multivariat.
3
b. Lakukan analisis secara bersamaan. Ada beberapa metode untuk melakukan pemilihan variabel independen dalam analisis multivariat, yaitu: a. ENTER, memasukkan semua variabel independen dengan serentak satu langkah, tanpa melewati kriteria kemaknaan statistik tertentu. b. FORWARD, memasukkan satu per satu variabel independen hasil pengkorelasian variabel dan memenuhi kriteria kemaknaan statistik untuk masuk dalam model, sampai semua variabel yang memenuhi kriteria tersebut masuk dalam model. Variabel yang masuk pertama kali adalah variabel yang mempunyai nilai p paling kecil. c. BACKWARD, memasukkan semua variabel ke dalam model tetapi kemudian satu per satu variabel independen dikeluarkan dari model berdasarkan kriteria kemaknaan statistik tertentu. Variabel yang pertama kali dikeluarkan adalah variabel yang mempunyai nilai p paling besar. d. STEPWISE, merupakan kombinasi antara metode backward dan forward. Dimulai dari tanpa variabel sama sekali di dalam model, lalu satu per satu variabel dimasukkan ke dalam model dan dikeluarkan dari model dengan kriteria tertentu. e. REMOVE, mengeluarkan semua variabel independen dengan serentak satu langkah tanpa melewati kriteria kemaknaan statistik tertentu. c. Pengujian adanya kolinearitas. Kolinearitas terjadi bila antar variabel independen terjadi saling hubungan yang kuat (r > 0,8). d. Pengujian interaksi. Interaksi merupakan keadaan dimana hubungan antara satu variabel independen dengan dependen berbeda menurut tingkat variabel independen yang lain. Jika ditemukan adanya interaksi antar variabel independen, maka nilai koefisien harus dilaporkan secara terpisah menurut strata dari variabel tersebut. e. Pemeriksaan konfounding, dengan cara mengeluarkan variabel konfounding satu per satu dimulai dari variabel yang memiliki nilai p terbesar. Bila setelah dikeluarkan diperoleh selisih koefisien antara sebelum dan sesudah variabel konfounding dikeluarkan lebih besar dari 10% maka variabel tersebut dinyatakan sebagai konfounding dan harus tetap dalam model.
4
Melakukan diagnostik regresi linier a. Melakukan pengujian terhadap kelima asumsi. b. Melakukan pengujian adanya kolinearitas. Kolinearitas terjadi bila antar variabel independen terjadi saling hubungan yang kuat. Untuk mengetahui dapat dilihat dari nilai koefisien korelasi r. Bila nilai r > 0,8 maka terjadi kolinearitas. Selain itu dapat diketahui dari nilai VIF atau tolerance. Bila nilai VIF > 10 atau tolerance sekitar 1 maka model terjadi kolinearitas. c. Melakukan analisis interaksi. Setelah memperoleh model yang memuat variabel-variabel penting, maka langkah selanjutnya adalah memeriksa adanya interaksi antar variabel independen. Interaksi merupakan keadaan dimana hubungan antara satu variabel independen dengan dependen berbeda menurut tingkat variabel independen yang lain. d. Penilaian reliabilitas model. Model regresi yang sudah terpilih perlu dicek reliabilitasnya dengan cara membagi (split) sampel ke dalam dua kelompok. Untuk masing-masing sampel dibuat model dengan variabel yang sama, kemudian bandingkan antara model 1 dan model 2, bila hasilnya sama/hampir sama maka model regresi reliabel. Bila model reliabel maka seluruh sampel dapat digunakan untuk pembuatan model.
5
ANALISIS REGRESI LINIER GANDA Asumsi yang digunakan dalam regresi linier ganda disingkat dengan HEILGauss, sebagai berikut: a. Homocedasticity: varian nilai variabel Y sama untuk semua nilai X. Homocedasticity dapat diketahui dengan melakukan pembuatan plot residual. Bila titik sebaran tidak berpola tertentu dan menyebar merata di sekitar garis titik nol residual maka dapat disebut varian homogen pada setiap nilai X. b. Eksistensi (variabel random): untuk setiap nilai variabel X, variabel Y adalah variabel random yang mempunyai mean dan varian tertentu. Asumsi ini berkaitan dengan teknik pengambilan sampel. Asumsi eksistensi dilihat dari nilai variabel residual model, bila residual menunjukkan adanya nilai mean dan sebaran maka asumsi terpenuhi. c. Independensi: suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai dari tiap-tiap individu saling berdiri sendiri. Asumsi inidilihat dari nilai uji Durbin Watson, bila nilai Durbin Watson antara -2 s/d +2 berarti asumsi independensi terpenuhi. d. Liniaritas: nilai mean dari variabel Y untuk suatu kombinasi dari X1, X2, ..., Xk terletak pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk mengetahui asumsi liniaritas dapat diketahui dari uji Anova (overall F test). Bila hasilnya signifikan maka model berbentuk linier. e. Gauss = normalitas: variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X. Dapat diketahui dari Normal P-P Plot residual. Bila data menyebar di sekitar garis diagonal dan mengikuti arah garis diagonalnya, maka asumsi normalitas terpenuhi.
6