BAB I PENDAHULUAN 1.1
Latar Belakang Analisis statistika pada dasarnya merupakan suatu analisis terhadap
sampel yang kemudian hasilnya akan digeneralisasi untuk menggambarkan suatu karakteristik populasi. Tujuan dasar dari analisis statistika adalah ”Extracting all the information from the data” (Shao dan Tu, 1995), untuk menarik kesimpulan populasi dari data yang telah digeneralisasi. Dalam analisis statistika, peneliti biasanya dihadapkan pada tiga pertanyaan yang mendasar (Efron dan Tibshirani, 1993), yakni pertama: bagaimana seharusnya cara peneliti mengumpulkan data, kedua: bagaimana cara menganalisis dan menarik kesimpulan berdasarkan data yang telah dikumpulkan, ketiga: seberapa akurat kesimpulan yang diambil berdasarkan data. Dalam hal ini, pertanyaan terakhir tersebut mengarah pada bagian dari suatu proses yang dikenal sebagai inferensi statistika. Sebagai contoh, kita dapat menggunakan mean dari sampel untuk menggambarkan atau mengestimasi ukuran pusat data. Bila data sampel berukuran kecil sedangkan data populasi berukuran besar, mungkin saja sampel tersebut tidak mewakili populasi, sehingga estimasi rata-rata yang dihasilkan mempunyai tingkat keakuratan yang rendah. Dengan kata lain, kita akan sulit untuk mengetahui tingkat akurasi dari statistik yang digunakan. Dalam hal ini, masalah estimasi menjadi sangatlah penting sebagai indikasi akurasi dari estimator karena estimator apapun yang kita gunakan mungkin memiliki kesalahan. Tingkat relativitas akurasi dapat diukur dengan variansi, bias, rata-rata kesalahan kuadrat, dan lain-lain. Seiring perkembangan teknologi komputer dua dekade belakangan ini yang sangatlah cepat. Komputer generasi terbaru telah memiliki kekuatan dan kecepatan tinggi yang secara bersamaan mendorong perkembangan metodemetode statistika dalam menghitung keakuratan dari sebuah estimator. Hal ini dibuat untuk mengaplikasikan ide-ide teori statistika secara fleksibel, cepat, mudah dan dengan asumsi matematika yang minimum. Sekarang komputer lebih
1
2
intensif dan diandalkan untuk pengerjaan metode statistika, sehingga metode tersebut menjadi lebih luas aplikasinya (Shao dan Tu, 1995). Jackknife merupakan salah satu metode estimasi inferensi statistika yang berbasis komputer. Salah satu prinsip kerjanya menggunakan komputer dalam membangkitkan data dari sampel asli yang berukuran kecil untuk mendapatkan sampel tiruan/bayangan. Data hasil analisis Jackknife dapat digunakan untuk menggantikan data real sehingga masalah-masalah dalam dunia nyata dapat diselesaikan. Tujuan utama penggunaan metode Jackknife adalah untuk memperoleh estimasi yang sebaik-baiknya berdasarkan data yang minimal dengan bantuan komputer. Metode Jackknife merupakan teknik resampling nonparametrik yang bertujuan untuk menentukan estimasi bias, standar error dan interval konfidensi dari parameter populasi seperti mean, rasio, median, proporsi, koefisien korelasi/koefisien regresi tanpa menggunakan asumsi distribusi. Menurut Shao dan Tu (1995), pada tahun 1949 Quenouille telah memperkenalkan metode Jackknife untuk mengestimasi bias dari suatu estimator dengan menghapus suatu observasi dari sampel asli. Sampel yang didapat digunakan untuk menghitung nilai estimator. Metode Jackknife juga dapat digunakan pada data berpasangan untuk keperluan rasio dan dalam kasus model regresi. Selain itu, model Jackknife juga cukup popular dalam menyelesaikan masalah estimasi parameter dengan tingkat akurasi yang baik. Salah satu model regresi yang paling banyak manfaat dan cukup sering digunakan dalam metode statistika adalah model regresi logistik. Model regresi logistik merupakan salah satu bentuk analisis regresi untuk mengetahui suatu hubungan sebab akibat (kausalitas) apabila variabel respon Y hanya memiliki 2 kemungkinan nilai/hasil atau data bersifat dikotomus. Dalam regresi logistik, variabel respon Y yang demikian lebih tepat dikatakan sebagai variabel indikator dan hasil dari kejadian tersebut dapat didekati oleh distribusi Binomial. Metode yang dipakai untuk menyelesaikan masalah regresi logistik, yakni dengan mencari model yang sangat baik untuk menggambarkan masalah kausalitas, adalah metode Maximum Likelihood Estimation (MLE) dimana proses penaksiran parameter
3
didahului oleh pembentukan fungsi likelihood. Namun dalam pendekatan estimasi menggunakan MLE, terdapat kelemahan-kelemahan yang diantaranya dibutuhkan sampel besar untuk mendapatkan estimator variansi yang tepat dan informasi distribusi dari variabel random yang digunakan. Dilema yang sering dihadapi peneliti dalam pemodelan regresi logistik adalah sulitnya memperoleh data kualitatif yang benar-benar mencerminkan populasi, padahal seorang peneliti dituntut harus mampu memberikan model dengan tingkat akurasi prediksi optimal. Dalam hal ini, guna memperoleh prediksi yang optimal, biasanya peneliti memasukkan sebanyak mungkin variabel prediktor. Namun semakin banyak prediktor, model menjadi semakin labil yang ditandai dengan tingginya galat baku. Jika dipaksakan, hasil inferensi yang diperoleh menjadi tidak akurat. Selain itu, model yang banyak mengandung variabel akan semakin sulit diinterpretasikan dan lebih banyak biaya yang harus dikeluarkan untuk memperoleh data. Maka dari itu, seringkali seorang peneliti hanya mampu mengadakan penelitian dengan jumlah sampel yang sedikit dan variabel prediktor yang tidak terlalu besar. Hal ini kemudian menimbulkan permasalahan
dimana
hasil
penelitian
menjadi
tidak
bisa
benar-benar
mereprentasikan populasi yang sebenarnya atau dengan kata lain akan terjadi bias. Oleh karena itu, dengan sampel yang minimum masalah regresi logistik diharapkan dapat diselesaikan dengan menggunakan metode Jackknife. Berdasarkan uraian latar belakang di atas, timbul beberapa permasalahan yang dapat dituliskan sebagai berikut : 1. Bagaimana kinerja metode Jackknife dalam mengestimasi parameter model regresi logistik. 2. Bagaimana hasil estimasi parameter model regresi logistik dengan menggunakan metode Jackknife dalam kasus jumlah data yang kecil. 3. Bagaimana tingkat akurasi hasil estimasi parameter model regresi logistik yang didapat menggunakan metode Jackknife dalam kasus jumlah data yang kecil.
4
1.2
Pembatasan Masalah Pembatasan masalah sangat diperlukan untuk menjamin keabsahan dalam
kesimpulan yang akan diperoleh nantinya. Dalam karya tulis ini, pembahasan akan difokuskan pada aplikasi metode Jackknife untuk mengestimasi parameter regresi logistik dengan variabel dependen/respon Y berupa data dikotomus (biner). Statistik yang akan digunakan sebagai parameter tingkat akurasi dari penduga parameter regresi logistik adalah standar error. Skripsi ini hanya akan menyajikan penduga dari statistik tersebut menggunakan metode Jackknife. Di samping itu, untuk mendukung perolehan hasil dengan mudah, analisis dilakukan dengan menggunakan paket program statistika, yaitu software R. Sehingga pembahasan akan meliputi hasil komputasi dari metode Jackknife yang akan digunakan untuk menyelesaikan masalah pada bab pembahasan.
1.3
Tujuan Penulisan Dari rumusan masalah di atas, tujuan yang ingin dicapai dalam penulisan
skripsi ini adalah : 1. Mengetahui kinerja metode Jackknife dalam mengestimasi parameter model regresi logistik. 2. Mengetahui hasil estimasi parameter model regresi logistik dengan menggunakan metode Jackknife dalam kasus jumlah data yang kecil. 3. Mengetahui tingkat akurasi hasil estimasi parameter model regresi logistik yang didapat menggunakan metode Jackknife dalam kasus jumlah data yang kecil.
1.4
Manfaat Penulisan Penulisan skripsi ini diharapkan akan memberikan manfaat, antara lain :
1. Memperluas wawasan mengenai aplikasi statistika khususnya dalam bentuk regresi logistik dimana regresi logistik sangat besar peranannya dalam berbagai penelitian baik di bidang kesehatan, keuangan, industri, dan lain-lain.
5
2. Dapat memperoleh estimasi dari parameter regresi logistik menggunakan metode yang berbeda dari yang biasa dilakukan yakni resampling dengan menggunakan metode Jackknife. 3. Dapat mengetahui estimasi parameter regresi logistik dan tingkat akurasinya yang didapat dengan menggunakan model resample Jackknife. 4. Dapat menentukan probabilitas dari suatu kasus regresi logistik dimana data variabel independennya bersifat biner/dikotomus yang selanjutnya dapat digunakan untuk mengambil suatu keputusan. 5. Menambah wacana ilmu pengetahuan yang kemudian dapat dikembangkan ke tingkat yang lebih lanjut.
1.5
Tinjauan Pustaka Sebuah teknik resampling sederhana telah jauh digunakan sebelum metode
bootstrap ditemukan, yaitu resampling Jackknife. Metode Jackknife pertama kali ditemukan oleh Quenouille (1949) yang digunakan untuk memperkirakan bias dari suatu estimator dengan menghapus beberapa observasi sampel. Kemudian pada tahun 1958, Tukey membuat metode Jackknife menjadi sesuatu yang lebih berharga karena Tukey mengemukakan pendapatnya bahwa Jackknife juga dapat digunakan untuk membangun variansi dari suatu estimator. Metode Jackknife ini dapat dibagi berdasarkan banyaknya data yang dihapus menjadi jackknife terhapus-1 dan jackknife terhapus-d (Efron dan Tibshirani, 1993). Secara umum sampel jackknife dapat diperoleh melalui sampel berukuran n-d dari distribusi 𝐽 empiris 𝐹𝑛 (𝑥) tanpa pengembalian, diperoleh 𝑋1𝐽 , 𝑋2𝐽 , … , 𝑋𝑛−𝑑 . Untuk selanjutnya
analisis statistik dilakukan berdasarkan pada sampel Jackknife berukuran 𝑛 − 𝑑 tersebut. Penelitian tentang penggunaan metode Jackknife pernah dilakukan untuk beberapa kasus. Seperti pada kasus pendugaan area kecil oleh J.N.K Rao pada tahun 2007, dalam artikelnya yang diberi judul “Jackknife and Bootstrap Methods for Small Area Estimation”. Dalam penelitian tersebut, Rao (2007) menjelaskan mengenai estimasi MSE untuk metode Jackknife dan Bootstrap dalam kasus area yang kecil yang kemudian dilanjutkan dengan mengoreksi bias dari estimator
6
tersebut. Masih dalam tahun yang sama, penelitian mengenai Jackknife selanjutnya oleh Sahinler dan Topuz (2007) dalam jurnal penelitiannya yang berjudul “Bootstrap and Jackknife Resampling Algorithms for Estimation of Resgression Parameters”, membahas mengenai algoritma resampling Bootstrap dan Jackknife untuk keperluan estimasi parameter regresi. Berdasarkan suatu contoh yang diselesaikan menggunakan metode bootstrap residual dan Jackknife terhapus-1, dapat disimpulkan bahwa pada dasarnya Jackknife mampu mereduksi bias. Sedangkan berdasarkan histogram dari estimator, distribusi estimator dengan pendekatan Bootstrap maupun Jackknife akan mendekati Distribusi Normal. Pola Jackknife secara spesifik untuk model regresi logistik telah dibahas oleh Ilouno dan Mbegbu (2012) dalam penelitiannya yang berjudul “Jackknife Algorithm for The Estimation of Logistic Regression Parameters”, dengan memberikan algoritma dan ilustrasi metode Jackknife untuk penyelesaian kasus data real di Rumah Sakit Umum Onitsha, Anambra, Nigeria. Dalam penelitian tersebut, usia ibu, paritas (jumlah kelahiran hidup sebelumnya), dan jenis kelamin bayi dianggap sebagai variabel independen untuk mengetahui efeknya pada masa kehamilan. Pada tahun berikutnya, 2013, Ilouno dan Mbegbu kembali mengembangkan penelitiannya mengenai Jackknife dalam artikelnya yang berjudul “A Jackknife Approach to Error-Reduction in Nonlinear Regression Estimation” dengan memberikan algoritma untuk Jackknife terhapus-1 dan terhapus-d dalam mengestimasi parameter regresi nonlinear. Variabel independen yang digunakan dalam contoh kasus regresi nonlinear tersebut adalah jumlah hari rawat inap dan variabel dependennya adalah nilai indeks prognosis.
1.6
Metode Penulisan Metode penulisan pada skripsi ini diawali dengan mempelajari
pembentukan model regresi logistik dan resampling menggunakan metode Jackknife berdasarkan studi literatur, yaitu dengan sumber dari buku-buku perpustakaan, jurnal-jurnal, artikel, penelitian-penelitian terdahulu, atau situs-situs di internet yang mendukung penulisan skripsi ini. Kemudian dilanjutkan dengan penyelesaian suatu kasus model regresi logistik menggunakan metode Jackknife.
7
Penyelesaian untuk kasus yang dihadapi dalam skripsi ini menggunakan bantuan software R.
1.7
Sistematika Penulisan Sistematika dari penulisan skripsi ini adalah sebagai berikut :
BAB I
PENDAHULUAN Bab ini membahas tentang latar belakang, pembatasan masalah, tujuan penulisan, manfaat penulisan, tinjauan pustaka, metode penulisan, dan sistematika penulisan.
BAB II
DASAR TEORI Bab ini membahas teori penunjang yang digunakan dalam pembahasan dan berkaitan dengan pokok permasalahan.
BAB III
ESTIMASI
PARAMETER
MODEL REGRESI
LOGISTIK
MENGGUNAKAN METODE JACKKNIFE Bab ini membahas mengenai prosedur estimasi parameter model regresi logistik dengan menggunakan metode Jackknife. BAB IV
STUDI KASUS Bab ini membahas penggunaan regresi logistik dengan estimasi parameter menggunakan metode Jackknife untuk melihat pengaruh rasio keuangan terhadap tingkat resiko kebangkrutan perusahaan perbankan di Indonesia. Pada bab ini juga dibahas analisis untuk hasil yang diperoleh.
BAB V
PENUTUP Bab ini merupakan penutup dalam penulisan skripsi, berisi kesimpulan dan saran.