BAB I PENDAHULUAN 1.1 Latar Belakang Di dalam aspek kehidupan ini, banyak ditemui permasalahan yang berkaitan dengan data. Baik dalam bidang ekonomi, sosial, budaya, politik, sejarah, kesehatan, dan lain-lain. Dari data tersebut dapat diperoleh informasi yang cukup berarti guna mengambil suatu keputusan tepat dalam menyelesaikan permasalahan. Pengolahan data merupakan salah satu kegiatan dalam proses suatu penelitian, dari hasil pengolahan tersebut didapatkan beberapa informasi yang penting untuk kemudian dapat diambil suatu keputusan dalam permasalahan. Salah satu contoh penggunaan metode statistika yang populer dalam pengolahan data ialah analisis regresi, karena metode tersebut sering digunakan dalam penelitian di berbagai bidang. Analisis ini menghubungkan antara variabel dependen (variabel bergantung) dengan satu atau lebih variabel independen (variabel bebas atau prediktor). Selain tujuan tersebut, analisis ini dapat membentuk persamaan tertentu yang menggambarkan bagaimana besarnya pengaruh prediktor terhadap variabel dependennya. Misalnya dalam bidang ekonomi ingin diketahui bagaimana pengaruh promosi suatu produk terhadap hasil penjualan produk tersebut dalam beberapa tahun terakhir ini, jika terdapat hubungan yang positif antara keduanya maka dengan meningkatkan kegiatan promosi dari produk tersebut dapat menaikkan hasil penjualan produk itu sendiri. Melalui analisis regresi yang tepat dan sesuai dengan data dapat membantu dalam mengambil suatu kebijakan serta mampu menyelesaikan suatu permasalahan. Dalam bidang kesehatan umumnya variabel dependennya berupa outcome atau respon dari suatu penelitian dan variabel independennya ialah kategori kelompok perlakuan (biasanya terdapat 2 kelompok perlakuan: kelompok yang diberikan perlakuan itu sendiri dan kelompok kontrol). Namun terkadang dalam bidang kesehatan dan epidemiologi diperlukan model yang lebih fleksibel terkait jenis data yang digunakan dalam penelitian dan hubungan antarvariabel seperti yang diinginkan 1
dalam penelitian dibandingkan dengan model regresi yang standar. Dilakukan perluasan dari model regresi yang ada, yaitu pada variabel respon tidak dibatasi hanya untuk data kontinu dan berdistribusi normal namun juga dapat menjadi data kategorik atau data yang berdistribusi selain distribusi normal. Perluasan seperti itu dimungkinkan melalui kelas distribusi probabilitas yang lebih umum yaitu disebut keluarga eksponensial (exponential family). Model regresi yang dapat digunakan pada data dengan distribusi dari keluarga eksponensial dinamakan dengan Model Linear Terumumkan (Generalized Linear Model atau disingkat dengan GLM). Model Linear Terumumkan mempunyai tiga komponen utama, yaitu pertama: variabel dependen merupakan variabel random dengan distribusi yang berasal dari keluarga eksponensial, kedua: variabel independen bersifat linear, dan ketiga: mempunyai link function (fungsi penghubung) yang menghubungkan ekspektasi dari variabel dependen dengan variabel independennya. Dalam mengestimasi parameter yang terdapat dalam Model Linear Terumumkan (MLT) dapat digunakan beberapa metode seperti dalam model regresi, dapat digunakan metode estimasi dengan Metode Kuadrat Terkecil (MKT), metode Maksimum Likelihood (ML), atau metode-metode estimasi yang lain. Dalam penelitian bidang kesehatan, ketika metode yang digunakan lebih mengarah kepada repson untuk diteliti maka respon akan menjadi dasar untuk memodelkan regresinya. Artinya, jika diketahui jenis data dan distribusi dari respon maka dari itu dapat ditentukan model regresi mana yang sesuai dan fungsi penghubung yang digunakan dalam modelnya. Namun terkadang peneliti dapat bekerja dengan lebih baik jika mengarah pada proses perlakuannya (variabel prediktor) terlebih dahulu sehingga bisa saja variabel tersebut menjadi dasar dalam memodelkan regresinya. Namun, tidak semua peneliti memiliki alasan yang kuat untuk menjadikan prediktor atau respon sebagai dasar dari suatu model regresi sehingga itu menyebabkan estimasi Doubly Robust (DR) atau Robust Ganda menarik untuk dibahas. Pada estimasi Robust Ganda dibutuhkan satu model untuk respon dan satu model untuk prediktor. Agar diperoleh estimator yang konsisten, cukup dengan
3
salah satu dari kedua model tersebut benar, tidak harus kedua modelnya benar. Dengan demikian estimator Robust Ganda memberikan keuntungan kepada peneliti yaitu hanya dengan salah satu model pada regresi saja (model regresi dengan respon sebagai target dasar atau model regresi dengan prediktor sebagai target dasar) dapat membuat suatu kesimpulan yang valid. 1.2 Tujuan Penelitian Tujuan yang ingin dicapai dari penulisan skripsi ini adalah : 1. mempelajari dan memahami metode estimasi Robust Ganda pada Model
Linear Terumumkan (MLT); 2. melakukan estimasi parameter pada Model Linear Terumumkan (MLT)
dengan menggunakan metode Robust Ganda; 3. mengaplikasikan metode estimasi Robust Ganda pada Model Linear
Terumumkan (MLT) untuk menyelesaikan permasalahan pada studi kasus. 1.3 Manfaat Penelitian Manfaat dari penulisan skripsi ini adalah : 1. menambah pengetahuan mengenai statistika dalam bidang epidemiologi
dan kesehatan terutama pada Model Linear Terumumkan (MLT) serta metode estimasi parameternya; 2. memperkenalkan metode estimasi Robust Ganda pada Model Linear
Terumumkan (MLT) sebagai metode alternatif dalam mengestimasi parameter; 3. memperoleh model persamaan dari metode Robust Ganda yang dapat
menerangkan pengaruh prediktor terhadap variabel respon.
1.4 Pembatasan Masalah
Berdasarkan latar belakang masalah maka penulis membatasi penulisan skripsi ini hanya pada pembahasan dan melakukan estimasi parameter menggunakan metode Robust Ganda pada Model Linear Terumumkan dengan kasus pada model regresi dimana variabel prediktornya terdiri atas dua kategori yaitu kelompok perlakuan dan kelompok kontrol. Studi kasus dilakukan dengan menggunakan data skripsi Irma Maulida tentang “Pengaruh Obat Kumur Triclosan 0,3% terhadap Penurunan Kadar Dimethyl Sulfide Oral Pasien di RSGM Prof. Soedomo”. Pembatasan masalah sangat diperlukan agar pembahasan yang disampaikan jelas dan fokus pada tujuan. 1.5 Tinjauan Pustaka Banyak buku dan jurnal yang membahas mengenai metode estimasi Robust Ganda dalam analisis statistika. Seperti pada tahun 1999, Robins dalam tulisannya “Robust Estimation in Sequentially Ignorable Missing Data and Causal Inference Models” telah mengembangkan metode baru untuk mengestimasi data hilang yang terabaikan melalui metode estimasi robust secara berturut-turut berdasarkan hubungan sebab-akibat. Kemudian di tahun 2005, Robins dan Bang mengenalkan estimator Robust Ganda pada data hilang dengan model yang sama dengan sebelumnya melalui tulisannya “Doubly Robust Estimation in Missing Data and Causal Inference Models”. Kemudian bersama Tchetgen dan Rotnitzky pada tahun 2010, Robins mengenalkan estimator Robust Ganda pada model lain yang bersifat semiparametrik melalui tulisannya yang berjudul “on Doubly Robust Estimation in a Semiparametrik Odds Ratio Model”. Metode estimasi ini, ternyata mendorong peneliti lain di bidang epidemiologi dan biostatistik untuk mengembangkannya seperti Sjӧlander dan Vansteelandt (2011) melalui tulisannya “Doubly Robust Estimation of Attributable Fractions”. Pengembangan metode ini terus berlanjut hingga tahun 2013 dimana Sjӧlander bersama Orsini dan Belloco menghasilkan karya tulis dengan judul “Doubly Robust Estimation in Generalized Linear Model” maka jurnal ini pula yang menjadi referensi utama penulis dalam membahas tema skripsi ini yaitu estimator Robust Ganda pada
5
Model Linear Terumumkan. Pada beberapa buku juga penulis mencari referensi mengenai pembahasan Model Linear Terumumkan (MLT) secara umum, salah satunya buku berjudul “Generalized Linear Models” (second edition) yang dikarang oleh McCullagh dan Nelder (1989). 1.6 Metode Penelitian Metode penelitian yang digunakan dalam skripsi ini adalah berdasarkan studi literatur melalui sumber-sumber resmi seperti jurnal dan buku yang berisi teori-teori berkaitan dengan tema skripsi ini. Sumber lain dari penulisan ini juga diperoleh melalui situs-situs pendukung yang tersedia di internet. Analisis data dilakukan dengan bantuan paket program Microsoft Excel 2010, SPSS 17.0 dan R versi 3.0.1 untuk estimasi parameter model regresi pada Model Linear Terumumkan dengan metode Robust Ganda. 1.7 Sistematika Penulisan Skripsi ini disusun dengan sistematika penulisan sebagai berikut BAB I
PENDAHULUAN Bab pendahuluan membahas tentang latar belakang masalah yang diambil, tujuan penulisan, manfaat penulisan, pembatasan masalah, tinjauan pustaka, metode penelitian dan sistematika penulisan.
BAB II DASAR TEORI Bab ini membahas tentang teori-teori yang berhubungan dengan tema skripsi ini, khususnya teori-teori yang berhubungan dengan estimasi Robust Ganda pada Model Linear Terumumkan. Diantaranya adalah analisis regresi linear sederhana, analisis regresi linear ganda, Metode Kuadrat Terkecil (MKT) dalam menentukan estimasi pada regresi, distribusi keluarga eksponensial, Model Linear Terumumkan (MLT), dan sebagainya.
BAB III METODE ESTIMASI ROBUST GANDA PADA MODEL LINEAR TERUMUMKAN Bab ini merupakan pokok dari permasalahan dan pembahasan dalam skripsi ini, yaitu estimasi Robust Ganda pada Model Linear Terumumkan. BAB IV STUDI KASUS Pada bab ini dibahas tentang aplikasi metode estimasi Robust Ganda pada Model Linear Terumumkan untuk studi kasus menentukan model regresi pada data skripsi Irma Maulida tentang “Pengaruh Obat Kumur Triclosan 0,3% terhadap Penurunan Kadar Dimethyl Sulfide Oral Pasien di RSGM Prof. Soedomo” dengan pengolahan data menggunakan software statistik R versi 3.0.1 BAB V PENUTUP Bab ini merupakan kesimpulan yang diperoleh dari hasil pembahasan pada bab-bab sebelumnya dan juga memberikan saran untuk perkembangan tema skripsi ini pada khususnya serta perkembangan ilmu statistika secara umum.