BAB 1
PENDAHULUAN
1.1 Latar Belakang
Model Loglinier adalah salah satu kasus khusus dari general linier model untuk data yang berdistribusi poisson. Model loglinier juga disebut sebagai suatu model statistik yang berguna untuk menentukan depedensi (kecenderungan) antara beberapa variabel yang berskala kategorik. Variabel didefinisikan sebagai suatu yang beragam atau bervariasi dan skala kategorik merupakan transformasi fungsi nilai dari empat skala ukuran observasi yang ada yaitu skala nominal, ordinal, rasio dan interval. Dengan pendekatan loglinier angka – angka dalam sel dapat disusun dalam tabel kontingensi. Tabel kontingensi digunakan jika terdapat lebih dari satu variabel kategorik, yang mana biasanya data disajikan dalam daftar baris dan kolom. Variabel kategorik yang ada dianalisis dengan mengambil nilai logaritma natural dari frekuensi untuk setiap sel dalam tabel kontingensi. Dari tabel kontingensi yang terbentuk, model loglinier akan menggambarkan pola asosiasi atau hubungan yang terjadi antar variabel. Model loglinier tidak hanya dapat digunakan untuk menganalisis hubungan yang terjadi antar dua variabel kategorik, tetapi juga dapat digunakan untuk mengevaluasi tabel kontingensi multifaktor yang meliputi tiga variabel atau lebih.
Model loglinier sangat bergantung pada jumlah variabel yang akan dianalisis. Penggunaan variabel yang dibahas pada penulisan ini dikelompokkan pada dua jenis yaitu variabel dependen dan variabel independen. Variabel dependen adalah variabel yang keberadaannya dipengaruhi oleh variabel lainnya. Sedangkan variabel independen yaitu variabel yang bebas (tidak dipengaruhi oleh variabel lainnya).
Universitas Sumatera Utara
Analisis loglinier digunakan untuk menganalisis pola hubungan antar sekelompok variabel kategorik yang mencakup mulai dari asosiasi satu variabel, asosiasi dua variabel, asosiasi tiga variabel atau lebih, baik secara simultan maupun secara parsial. Pola hubungan antar variabel dapat dilihat dari interaksi antar variabel itu sendiri, termasuk kemungkinan adanya hubungan sebab akibat atau hubungan kausal diantara variabel – variabel yang ada.
Dalam model loglinier, terdapat suatu asumsi bahwa semua variabel yang diselidiki mempunyai status yang sama sebagai suatu variabel dependen. Dengan kata lain, tidak ada pembedaan yang dibuat antara variabel dependen dan variabel independen karena model loglinier hanya menunjukkan depedensi (kecenderungan) antar variabel. Andaikan terdapat pembedaan yang dibuat antara satu atau lebih variabelnya yang diperlakukan sebagai variabel independen dan variabel lainnya sebagai variabel dependen, maka penggunaan analisis yang sesuai ialah dengan analisis Regresi Logistik. Analisis Regresi Logistik digunakan untuk memprediksi variabel yang bersifat kategorik (biasanya dikotomis) oleh seperangkat variabel independen (Jeansonne, 2002).
Analisis model loglinier bergantung pada jumlah variabel dependen yang termuat di dalamnya. Untuk penulisan ini akan diuraikan tentang model loglinier yang membahas analisis hubungan antara tiga variabel yang disebut dengan analisis trivariat. Model seperti ini disebut juga sebagai model loglinier tiga faktor. Model loglinier tiga faktor memuat semua parameter yang mungkin dan tidak dapat dimasuki oleh parameter – parameter lainnya. Model seperti ini disebut sebagai model lengkap. Secara umum model loglinier tiga faktor dapat ditulis sebagai berikut (Agresti, 1990): XYZ log mˆ ijk iX Yj Zk ijXY ikXZ YZjk ijk
Setelah jumlah variabel kategorik diselidiki, pembentukan model loglinier penting untuk diteliti yang berguna untuk menentukan kecocokan model yang memperhatikan ada atau tidaknya interaksi antar variabel. Hal ini menjadi penting
Universitas Sumatera Utara
karena tidak semua interaksi faktor model baik tingkat 2-faktor maupun 3-faktor yang ada pada model lengkap menjadi signifikan dalam suatu model yang dihasilkan. Tentunya akan menjadi suatu permasalahan jika semua interaksi dimasukkan secara sekaligus dalam model tanpa mengetahui terlebih dahulu kecocokan dari interaksi faktor model yang ada sebelum membentuk suatu model yang memang tepat dan signifikan setelah melalui uji kecocokan modelnya.
Dalam hal ini akan dilakukan teknik pemodelan loglinier yang akan digunakan sebagai perbandingan dalam pemilihan metode yang lebih baik dalam membentuk model permasalahan. Jenis prosedur yang penulis gunakan dalam penyelesaian pemodelan loglinier terbagi pada dua jenis, yaitu prosedur yang memakai metode Hirarkis Backward dan prosedur pemodelan yang menggunakan metode Forward.
Untuk keperluan analisis data yang memuat hubungan tiga variabel dengan menggunakan skala kategorik difokuskan pada bagaimana penentuan model dengan melakukan pengujian terhadap interaksi faktor model baik tingkat 2-faktor maupun 3faktor dengan menggunakan uji goodness of fit model G 2 untuk menguji kecocokan modelnya. Pengolahan data dilakukan dengan software SPSS 15.0 for Windows.
1.2 Rumusan Masalah
Masalah yang akan dibahas dalam penulisan ini ialah melakukan prosedur pemodelan loglinier menggunakan metode Hirarkis Backward dan metode Forward, kemudian membandingkan kedua metode dalam hal mendapatkan suatu model akhir yang menggambarkan hubungan antar variabel yang diselidiki.
1.3 Batasan Masalah
Ruang lingkup dari penulisan ini dibatasi pada melakukan suatu teknik pemodelan loglinier menggunakan metode Hirarkis Backward dan metode Forward dengan uji rasio likelihood G 2 untuk menguji kecocokan modelnya.
Universitas Sumatera Utara
1.4 Tujuan Penelitian
Tujuan penulisan ini adalah melakukan prosedur pemodelan loglinier menggunakan metode Hirarkis Backward dan metode Forward dan membandingkan kedua metode tersebut untuk dipilih sebagai metode yang yang lebih baik dalam membentuk model.
1.5 Kontribusi Penelitian Hasil penulisan ini adalah: 1. Dapat menerapkan analisis tabel kontingensi dan metode pemodelan loglinier yang ada untuk penyelesaian permasalahan yang berkaitan dengan berbagai bidang kehidupan agar lebih mudah diolah, sehingga jelas tujuannya.
2. Dengan penulisan ini penulis berharap dapat menambah referensi bagi pembaca yang dapat digunakan sebagai alat untuk mengklasifikasikan data yang ingin diteliti dalam memutuskan suatu masalah.
1.6 Metodologi Penelitian
Dalam penulisan ini penulis melakukan studi dengan meneliti buku-buku yang membahas mengenai model loglinier dan metode Hirarkis Backward dan Forward dalam hal pemodelannya, yaitu: 1. Mengumpulkan dan mempelajari buku-buku yang berkaitan dengan materi penulisan. 2. Menentukan jumlah variabel kategorik yang akan diselidiki sebelum dilakukan prosedur pemodelan. 3. Menguraikan perbedaan penyelesaian pemodelan loglinier menggunakan metode yang ada.
Universitas Sumatera Utara
4. Pemodelan dilakukan
melalui
suatu proses seleksi sampai model akhir
terbentuk yang mana setiap kali variabel dihapus maupun ditambahkan pada model, dilakukan pengujian terhadap interaksi faktor model baik tingkat 2-faktor maupun
3-faktor
menggunakan
uji
rasio likelihood G 2 dan
melihat p-value yang dihasilkan untuk menguji kecocokan modelnya. 5. Menyelesaikan contoh permasalahan untuk
memilih metode yang lebih
baik dalam membentuk suatu model.
1.7 Tinjauan Pustaka
Model loglinier merupakan perluasan bentuk logaritma natural dari frekuensi untuk setiap sel sama dengan mean (konstan, mu) ditambah parameter lambda untuk memperkirakan pengaruh independen pertama, ditambah dengan lambda untuk setiap independen lain, ditambah lambda untuk semua efek interaksi baik itu efek interaksi 2-faktor, 3-faktor ataupun efek interaksi untuk order yang lebih tinggi sesuai dengan jumlah independen sehingga model seperti ini sering disebut juga sebagai model lengkap (chass.ncsu.edu, 3 Oktober 2010).
Secara umum model lengkap untuk tiga variabel kategorik dapat ditulis sebagai berikut (Agresti, 1990):
XYZ log mˆ ijk iX Yj Zk ijXY ikXZ YZjk ijk
(1)
dengan: log mˆ ijk
=
Logaritma dari frekuensi sel ijk
=
konstanta atau rata – rata logaritma seluruh sel ijk
iX
=
Parameter pengaruh variabel pertama yang ke-i terhadap model
Yj
=
Parameter pengaruh variabel kedua yang ke-j terhadap model
Zk
=
Parameter pengaruh variabel ketiga yang ke-k terhadap model
ijXY
=
Parameter pengaruh interaksi variabel pertama yang ke-i dengan
Universitas Sumatera Utara
variabel kedua yang ke-j terhadap model
ikXZ
=
Parameter pengaruh interaksi variabel pertama yang ke-i dan variabel ketiga yang ke-k terhadap model
YZjk
= Parameter pengaruh interaksi variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model
ijkXYZ = Parameter pengaruh interaksi variabel pertama yang ke-i, variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model
Dengan pendekatan loglinier angka – angka dalam sel dapat disusun dalam tabel kontingensi. Friendly (2000) menyatakan tabel kontingensi digunakan ketika terdapat lebih dari satu variabel kategorik, yang mana biasanya data disajikan dalam daftar baris dan kolom. Bentuk penyajian dalam daftar baris dan kolom ini biasanya disebut daftar kontingensi. Analisis tabel kontingensi ini merupakan teknik penyusunan data yang cukup sederhana untuk melihat hubungan antar variabel dalam satu tabel. Untuk menginterpretasikan data pada tabel kontingensi, salah satu yang dapat digunakan adalah dengan uji Chi-Square.
Uji Chi-Square dilambangkan dengan 2 , yang digunakan untuk mengetahui adanya hubungan antara variabel yang diukur signifikan atau tidak. Dalam hal ini analisis variabel yang diukur sebanyak tiga variabel atau yang disebut sebagai analisis trivariat. Hipotesis yang berlaku untuk ketiga variabel yang independen dengan asumsi tidak terdapat interaksi antar variabel, yaitu: H 0 : Pijk Pi.. P. j . P..k H 1 : Pijk Pi.. P. j . P..k
Statistik uji Chi-Square yang digunakan untuk menguji hubungan antar variabel dapat dirumuskan sebagai berikut: 2
i
j
k
Y
ijk
2 mˆ ijk
(2)
mˆ ijk
Sedangkan uji Rasio Likelihood untuk model independen juga dapat dirumuskan:
Universitas Sumatera Utara
Yijk G 2 2 Yijk ln mˆ i j k ijk
(3)
dengan: Yijk = Observasi pada variabel i, j, dan k mˆ ijk = Frekuensi yang diharapkan untuk Yijk
degree of freedom adalah (I-1)(J-1)(K-1) dan diambil = 0,05
Kriteria uji: Tolak H0 jika 2 atau G 2 hitung 2 df ; dan terima H0 jika 2 hitung < 2 df ; dengan kata lain model log mˆ ijk iX Yj Zk diterima.
Pencarian Solusi
Pencarian solusi permasalahan pemodelan loglinier dapat dilakukan dengan menentukan suatu model secara fleksibel dan mendalam serta memilih variabel independen secara inklusif dengan tepat. Hal ini memungkinkan untuk menemukan variabel independen yang terbaik yang dapat dipakai serta melihat pada kecocokan model yang memperhatikan ada atau tidaknya interaksi antar variabel. Dalam hal ini dapat menggunakan beberapa metode yang akan digunakan sebagai perbandingan dalam pemilihan metode yang lebih baik dalam membentuk suatu model akhir. Metode – metode itu diantaranya adalah metode iteratif Hirarkis Backward, Forward dan lain – lain.
1) Metode Hirarkis Backward
Pemodelan loglinier dengan metode Hirarkis Backward akan membentuk model hirarkis yang menyatakan hubungan dalam kumpulan data dengan tepat. Dilakukan
Universitas Sumatera Utara
dengan menyeleksi model lengkap dan mulai menghapus interaksi yang lebih tinggi sampai uji kecocokan dari model menjadi tidak dapat diterima lagi berdasarkan standar probabilitas atau p-value yang diadopsi oleh penyidik. Model lengkap mencakup semua kemungkinan efek interaksi baik itu efek interaksi 2-faktor maupun 3-faktor sesuai dengan jumlah variabel yang diselidiki dalam penelitian ini. Dimana setiap kali variabel dihapus dilakukan uji statistik untuk menentukan akurasi prediksinya dengan membandingkan uji rasio likelihood G 2 dengan 2 df ; (Chapter 14, 2 November 2010).
2) Metode Forward
Penggunaan metode forward yang digunakan dalam penelitian ini menggunakan dua cara yang berbeda namun prinsipnya hampir sama.
Agresti (1990) menjelaskan
pengerjaan metode ini dimulai dengan dibentuknya model independen dan menambahkan istilah interaksi yang lebih kompleks sampai suatu hasil uji fit diterima yang tidak dapat ditingkatkan dengan menambahkan peraturan lebih lanjut. Dengan kata lain, metode ini memilih variabel terlemah hingga terkuat secara bertahap.
Friel (2005) menjelaskan pemodelan loglinier dengan metode forward dilakukan dengan dibentuknya model sederhana (model order nol) kemudian menambahkan efek order pertama, order kedua, dan order ketiga untuk diuji kecocokan datanya.
Universitas Sumatera Utara