BAB I PENDAHULUAN
1.1
Latar Belakang Masalah Analisis regresi merupakan teknik statistik untuk investigasi dan pemodelan
hubungan antar variabel. Hubungan antara dua variabel dapat dilihat dengan analisis regresi yang menyatakan keeratan hubungan antar keduanya. Dimana variabel independent mempengaruhi variabel dependent secara linear. Salah satu metode yang digunakan untuk menduga parameter-parameter dalam persamaan regresi adalah metode Ordinary Least Square (OLS). Secara matematis penentuan parameter regresi ini dengan cara meminimumkan jumlah kuadrat dari residualnya (Walpole, 1995). Metode OLS menghasilkan penduga yang memenuhi syarat-syarat sebagai penduga yang baik yakni memenuhi Best, Linear, Unbiased Estimator (BLUE) jika semua asumsi klasik yang berkaitan dengan residual terpenuhi. Namun pada kenyataannya asumsi normalitas dan homoskedastisitas seringkali tidak terpenuhi ketika terdapat data pencilan atau outlier. Jika terdapat pencilan, maka data tidak berbentuk simetris sehingga nilai mean menjadi sangat peka dengan adanya outlier tersebut sehingga metode OLS kurang tepat digunakan. Namun pada akhirnya meskipun telah dilakukan transformasi data sering kali parameter yang dihasilkan masih bias. Kemudian berkembanglah metode Median Regression dengan pendekatan Least Absolute Deviation (LAD) yang dikembangkan dengan mengganti pendekatan rata-rata pada OLS menjadi median. Permasalahannya adalah metode median regression hanya dapat melihat dua kelompok data yang dibagi pada nilai tengahnya saja dan ketika terdapat data yang berbentuk lonceng tidak simetris atau kemiringan (titik pusat) data bukan terletak pada mediannya melainkan pada potongan kuantil tertentu. Maka metode ini juga dirasa kurang tepat untuk digunakan.
1
2
Selanjutnya dikembangkan metode regresi kuantil yang tidak membutuhkan asumsi error dalam model dan estimatornya bersifat tegar (robust) terhadap pencilan (outlier) pada variabel dependen. Regresi kuantil secara bertahap muncul sebagai pendekatan yang komprehensif untuk analisis statistik model respon linear dan non linear. Metode model regresi kuantil berbasis Bayesian untuk data independen telah luas pendekatannya untuk regresi kuantil. Pada praktiknya, permasalahan yang terkadang ditemui oleh seorang peneliti salah satunya adalah ketika data variabel respon tidak lengkap atau sering disebut tersensor. Hal ini bisa disebabkan oleh berbagai alasan, seperti kehilangan informasi yang disebabkan oleh faktor-faktor di luar kontrol, ketidakinginan beberapa unit sampel untuk menyediakan informasi yang diinginkan, kegagalan pihak investigator untuk menghimpun informasi yang benar dan sebagainya. Regresi dengan variabel dependent yang terbatas demikian ini disebut dengan regresi Tobit. Dalam model Tobit standar, nilai batas bawahnya adalah 0 (nol). Pada model regresi untuk variabel respon tersensor yang demikian menghasilkan error yang tidak diketahui distribusinya dengan rata-rata errornya tidak sama dengan nol, maka estimator standar metode kuadrat terkecil menghasilkan estimasi yang bias. Estimator regresi dengan kasus di atas, diusulkan oleh Tobin (1958) dan sering disebut sebagai regresi Tobit. Namun, estimator Tobit memiliki kelemahan yaitu menghasilkan estimasi yang bias untuk error yang tidak normal. Dengan demikian jika menggunakan metode regresi kuantil dalam regresi Tobit mungkin akan memberikasn hasil yang lebih baik. Secara umum, pendekatan Bayesian untuk regresi kuantil Tobit perlu menentukan kemungkinan dan pendekatan umum dengan menggunakan Asymmetric Laplace Distribution. Bayes memperkenalkan suatu metode yang diperlukan untuk mengestimasi parameter yang akan diestimasi dengan memanfaatkkan informasi awal dan bentuk distribusi awal (prior) dari suatu populasi yang dikenal dengan metode Bayesian. Informasi ini kemudian digabungkan dengan informasi dari sampel yang digunakan dalam mengestimasi parameter populasi. Pada metode Bayesian, peneliti harus menentukan distribusi
3
prior dari parameter yang ditaksir. Distribusi prior ini dapat berasal dari data penelitian sebelumnya atau berdasarkan intuisi seorang peneliti. Setelah informasi dari data yang didapat dari pengambilan sampel digabungkan dengan informasi prior dari parameter, akan didapat distribusi posterior dari parameter. Rataan dari distribusi posterior ini yang akan menjadi parameter regresi dengan metode Bayesian. Secara analitik, memperoleh marginal posterior merupakan suatu hal yang sulit. Dalam model yang rumit, mengintegralkan parameter dari distribusi posterior bersama atau bahkan menentukan kenormalan dari distribusi posterior secara umum adalah hal yang tidak mungkin. Terlebih lagi menghitung fungsi distribusi posterior dari parameter itu sulit dilakukan. Metode Bayesian mengatasi hal ini dengan bantuan algoritma MCMC (Markov Chain Monte Carlo). MCMC (Markov Chain Monte Carlo) dapat dengan mudah digunakan untuk mendapatkan distribusi posterior bahkan dalam situasi yang kompleks. Penulisan tugas akhir dengan judul “Pemilihan Model untuk Regresi Kuantil Tobit dengan Menggunakan Gibbs Sampling” ini mengemukakan kombinasi antara regresi kuantil Tobit dan metode Bayesian. Serta mengkombinasikan antara inferensi Bayesian dengan bantuan algoritma Gibbs sampling.
1.2
Pembatasan Masalah Pembatasan masalah sangat diperlukan dalam penulisan skripsi ini agar
terfokus pada suatu poin saja dan tidak terjadi penyimpangan dari tujuan semula. Model regresi kuantil tobit memiliki ruang lingkup yang sangat luas untuk dibahas. Oleh karena itu, dalam skripsi ini hanya akan dibahas estimasi parameter model Regresi Kuantil Tobit dengan metode Bayesian dengan algoritma Gibbs sampling.
1.3
Tujuan Penulisan Skripsi yang berjudul “Pemilihan Model untuk Regresi Kuantil Tobit
dengan Menggunakan Gibbs Sampling” pada dasarnya bertujuan untuk : 1. mempelajari model regresi kuantil tobit;
4
2. mempelajari metode Bayesian dan mengimplementasikannya dengan algoritma Gibbs sampling untuk mengestimasi parameter model regresi kuantil Tobit; 3. mengaplikasikan regresi kuantil Tobit untuk menganalisis faktor apa saja yang mempengaruhi seseorang bertani.
1.4
Tinjauan Pustaka Model regresi merupakan model yang paling sering digunakan dalam bidang
ekonometri. Regresi kuantil dikenalkan oleh Koenker dan Basset pada tahun 1978. Regresi ini berguna untuk menganalisis sejumlah data yang bentuknya tidak simetris dan juga berguna jika distribusi tidak homogen. Regresi kuantil adalah regresi yang tegar (robust) terhadap data pencilan (outlier). Pada tahun 2001 Keming Yu dan Rana A. Moyeed mempopulerkan metode bayesian pada regresi kuantil. Mereka memperkenalkan gagasan regresi kuantil menggunakan fungsi likelihood yang didasarkan pada Asymmetric Laplace Distribution. Penggunaan distribusi ini merupakan cara alami dan efektif untuk pemodelan regresi kuantil bayesian. Yu dan Moyeed juga memperkenalkan regresi kuantil bayesian menggunakan algoritma MCMC untuk inferensi posteriornya. Dalam metodenya mereka menggunakan algoritma MetropolisHasting untuk menganalisis kuantil bayesian. Pada tahun 2003, Tsionas mengembangkan regresi kuantil Bayesian dengan algoritma Gibbs sampling. Selanjutnya tahun 2009, Hiedo Kozumi dan Kobayashi mengembangkan regresi kuantil Bayesian menggunakan Asymmetric Laplace Distribution dan mengemukakan metode MCMC dengan bantuan algoritma Gibbs sampling yang berdasarkan pada mixture representation dari Asymmetric Laplace Distribution. Mereka memaparkan bahwa dengan menggunakan kondisi tersebut, densitas dari posterior akan sangat mudah dikerjakan. Sementara itu, masalah regresi kuantil Tobit juga telah dipertimbangkan oleh Yu and Stander pada tahun 2007
dan
telah
mendapatkan
serangkaian
pendekatan
semiparametrik untuk memperkirakan regresi kuantil bersyarat.
parametrik
dan
5
1.5
Metode Penulisan Metode yang digunakan dalam penulisan skripsi ini adalah studi literatur
yang didapat dari perpustakaan, buku-buku, jurnal-jurnal, dan situs-situs internet yang berhubungan dengan tema skripsi ini. Pengerjaan skripsi ditunjang oleh perangkat lunak (software) R 3.0.0.
1.6
Sistematika Penulisan Skripsi ini disusun dengan sistematika penulisan sebagai berikut :
BAB I
PENDAHULUAN Bab ini membahas latar belakang masalah, pembatasan masalah, tujuan penulisan, metode penulisan, dan sistematika penulisan.
BAB II
DASAR TEORI Bab ini membahas tentang teori-teori yang menunjang pembahasan pada bab-bab berikutnya.
BAB III
PEMILIHAN MODEL DALAM REGRESI KUANTIL TOBIT Bab ini berisi pembahasan mengenai penggunaan metode Bayesian dalam mengestimasi parameter model regresi kuantil Tobit dengan menggunakan algoritma Gibbs sampling.
BAB IV
STUDI KASUS Bab ini menjelaskan studi kasus yang dilakukan, estimasi parameter regresi logistik, regresi tobit, dan regresi kuantil tobit. Data yang digunakan adalah data sekunder yang bersumber dari Kantor Balai Desa Serang, Karangreja, Purbalingga. Data menunjukan hubungan pekerjaan bertani dengan faktor-faktor yang terdapat dalam data.
BAB V
PENUTUP Bab ini membahas tentang kesimpulan dari materi yang telah dibahas dari skripsi ini. Serta saran dan kekurangan dari hasil pembahasan yang bisa diberikan sebagai bahan acuan untuk penelitan lanjutan.