BAB I PENDAHULUAN 1.1.
Latar Belakang Berawal dari kebutuhan analisis data untuk memprediksi suatu nilai bila
diberikan suatu nilai-nilai variabel prediktor ( ) pada beberapa kasus, maka metode regresi pun semakin berkembang. Analisis Regresi merupakan alat statistik yang banyak digunakan di berbagai bidang. Analisis tersebut bertujuan untuk mengetahui hubungan sebab-akibat antara satu variabel dengan variabel yang lain. Ada beberapa metode yang digunakan untuk menduga parameterparameter dalam persamaan regresi, salah satunya yang paling sering digunakan adalah metode Ordinary Least Square (OLS). Secara matematik, penentuan parameter regresi ini dengan cara meminimumkan jumlah kuadrat dari residualnya (Walpole dan Myers, 1986). Dalam metode OLS, diharuskan memenuhi asumsiasumsi yang ada sehingga hasil estimasinya memenuhi sifat Best, Linear, Unbiased Estimator (BLUE). Namun metode OLS dikenal peka terhadap penyimpangan asumsi pada data, jika data tidak memenuhi salah satu asumsi, maka penduga OLS tidak lagi baik digunakan. Asumsi normalitas dan homoskedastisitas seringkali tidak terpenuhi ketika data mengandung pencilan (outlier). Jika data mengandung pencilan (outlier), maka data tidak lagi berbentuk simetris sehingga nilai mean menjadi sangat peka dengan adanya data outlier dan kurang tepat digunakan. Terkadang untuk mengatasi hal tersebut, peneliti akan melakukan transformasi terhadap data dengan maksud agar asumsi terpenuhi. Namun seringkali asumsi tersebut tidak terpenuhi meskipun telah dilakukan transformasi yang pada akhirnya mengakibatkan dugaan berbias. Kemudian berkembanglah metode Median Regression dengan pendekatan Least Absolute Deviation (LAD) yang dikembangkan dengan mengganti pendekatan rata-rata pada OLS menjadi median. Permasalahannya adalah metode median regression hanya dapat melihat dua kelompok data yang yang dibagi pada nilai tengahmya saja dan ketika terdapat data yang berbentuk lonceng tidak
1
2
simetris atau kemiringan (titik pusat) data bukan terletak pada mediannya melainkan pada potongan kuantil tertentu. Maka pendekatan median dirasa kurang untuk mengatasi permasalahan tersebut. Selanjutnya dikembangkan metode regresi kuantil yang pada umumnya dipakai dalam kasus ekonometrika. Regresi kuantil tidak membutuhkan asumsi error dalam model dan estimatornya bersifat tegar terhadap pencilan (outlier) pada variabel respon. Pendekatannya adalah memisahkan atau membagi data yang dicurigai ada perbedaan nilai taksiran pada kuantil-kuantil tertentu. Dalam penarikan sampel, biasanya diperoleh informasi parameter yang akan diestimasi. Jika informasi tersebut ingin dimasukkan dalam analisis data, maka metode estimasi yang digunakan tidak memungkinkan untuk memasukkan informasi tersebut. Oleh karena itu diperlukan metode estimasi lain dengan melibatkan parameter yang akan diestimasi. Bayes
memperkenalkan
suatu
metode
yang
diperlukan
untuk
mengestimasi parameter yang akan diestimasi dengan memanfaatkan informasi awal dan bentuk distribusi awal (prior) dari suatu populasi yang dikenal dengan metode Bayesian. Informasi ini kemudian digabungkan dengan informasi dari sampel yang digunakan dalam mengestimasi parameter populasi. Pada metode Bayesian, peneliti harus menentukan distribusi prior dari parameter yang ditaksir. Distribusi prior ini dapat berasal dari data penelitian sebelumnya atau berdasarkan intuisi seorang peneliti. Dugaan penentuan distribusi parameter sangatlah subyektif (Hogg dan Craig, 1978). Setelah informasi dari data yang didapat dari pengambilan sampel digabungkan dengan informasi prior dari parameter, akan didapat distribusi posterior dari parameter. Rataan dari distribusi posterior ini yang akan menjadi parameter regresi dengan metode Bayesian. Secara analitik, memperoleh marginal posterior merupakan suatu hal yang sulit. Dalam model yang rumit, mengintegralkan parameter dari distribusi posterior bersama atau bahkan menentukan kenormalan dari distribusi posterior secara umum adalah hal yang tidak mungkin. Terlebih lagi menghitung fungsi distribusi posterior dari parameter itu sulit dilakukan. Metode Bayesian mengatasi
3
hal ini dengan bantuan algoritma MCMC (Markov Chain Monte Carlo). MCMC (Markov Chain Monte Carlo) dapat dengan mudah digunakan untuk mendapatkan ditribusi poterior bahkan dalam situasi yang kompleks. Penulisan tugas akhir dengan judul “Analisis Bayesian untuk Regresi Kuantil dengan Menggunakan Algoritma Gibbs Sampling” ini mengemukakan kombinasi antara regresi kuantil dan metode Bayesian. Serta, mengkombinasikan antara inferensi Bayesian dengan bantuan algoritma Gibbs sampling.
1.2.
Pembatasan Masalah Model regresi kuantil memiliki lingkup yang sangat luas untuk dibahas.
Batasan masalah dalam skripsi ini sangat diperlukan agar tidak terjadi penyimpangan dengan tujuan awal dan penyelesaian masalah lebih terkonsentrasi. Oleh karena itu, dalam skripsi ini hanya akan dibahas estimasi parameter model Regresi Kuantil dengan metode Bayesian melalui metode Markov Chain Monte Carlo (MCMC) dengan algoritma Gibbs sampling.
1.3.
Tujuan Penulisan Skripsi yang berjudul “Analisis Bayesian untuk Regresi Kuantil dengan
Menggunakan Algoritma Gibbs Sampling” pada dasarnya bertujuan untuk :
1. Mempelajari model regresi kuantil. 2. Mempelajari metode Bayesian dan mengimplementasikannya melalui metode Markov Chain Monte Carlo dengan algoritma Gibbs sampling untuk mengestimasi parameter model regresi kuantil. 3. Mengaplikasikan regresi kuantil Bayesian untuk menganalisis faktor apa saja yang mempengaruhi harga emas.
1.4.
Tinjauan Pustaka Model regresi merupakan model yang paling sering digunakan dalam
bidang ekonometri. Regresi kuantil dikemukakan oleh Koenker dan Basset pada tahun 1978. Regresi ini berguna untuk menganalisis sejumlah data yang bentuknya tidak simetris dan juga berguna jika distribusi data tidak homogen. Regresi kuantil juga bersifat tegar (robust) terhadap pencilan (outlier). Pendekatan
4
metode regresi kuantil dengan memisahkan atau membagi data menjadi dua atau lebih kelompok dimana dicurigai adanya perbedaan nilai dugaan pada kuantilkuantil tertentu. Pada tahun 2001 Keming Yu dan Rana A. Moyeed mempopulerkan metode Bayesian pada regesi kuantil. Keming Yu dan Rana A. Moyeed memperkenalkan gagasan regresi kuantil menggunakan fungsi likelihood yang didasarkan pada asymmetric Laplace distribution. Penggunaan distribusi ini merupakan cara alami dan efektif untuk pemodelan regresi kuantil Bayesian. Yu dan Moyeed memperkenalkan regresi kuantil Bayesian menggunakan metode Markov Chain Monte Carlo (MCMC) untuk inferensi posteriornya. Dalam metodenya
mereka
menggunakan
algoritma
Metropolis-Hasting
untuk
menganalisis regresi kuantil bayesian. Pada tahun 2002, Tsionas mengembangkan regresi kuantil Bayesian dengan algoritma Gibbs sampling. Selanjutnya tahun 2009, Hiedo Kozumi dan Kobayashi mengembangkan regresi kuantil Bayesian menggunakan asymmetric Laplace distribution dan mengemukakan metode MCMC dengan bantuan algoritma Gibbs sampling yang berdasarkan pada mixture representation dari asymmetric
Laplace
distribution.
Mereka
memaparkan
bahwa
dengan
menggunakan kondisi tersebut, desitas dari posterior akan sangat mudah dikerjakan. Pada tahun 2010, Rizon Agustan Sinaga dalam skripsinya membahas mengenai regresi kuantil untuk menjelaskan dispersi dari efek prediktor. Tahun 2013, Latifah Ratnawati dalam skripsinya juga membahas mengenai regresi kuantil dengan menggunakan estimasi Bayesian. Latifah menggunakan metode MCMC dengan menggunakan algoritma Metropolis-Hasting.
1.5.
Metode Penulisan Metode yang digunakan dalam penyusunan skripsi ini adalah studi
literatur yang didapat dari perpustakaan, buku-buku, jurnal-jurnal, dan situs-situs internet yang berhubungan dengan tema skripsi ini. Pengerjaan skripsi ini menggunakan perangkat lunak (software) R 2.15.3.
5
1.6.
Sistematika Penulisan Skripsi ini disusun dengan sistematika penulisan sebagai berikut :
BAB I
PENDAHULUAN Bab ini membahas latar belakang masalah, pembatasan masalah, tujuan penulisan, metode penulisan, dan sistematika penulisan.
BAB II
DASAR TEORI Bab ini membahas tentang teori-teori yang menunjang pembahasan pada bab-bab berikutnya.
BAB III
ANALISIS BAYESIAN UNTUK REGRESI KUANTIL Bab ini berisi pembahasan mengenai penggunakaan metode Bayesian dalam mengestimasi parameter model regresi ruantil dengan menggunakan algoritma Gibbs sampling.
BAB IV
STUDI KASUS Bab ini berisi tentang deskripsi data, estimasi parameter menggunakan metode OLS, regresi kuantil dan metode Bayesian.
BAB V
PENUTUP Pada bab terakhir ini, diberikan beberapa kesimpulan dan saran dari hasil pembahasan pada bab-bab sebelumnya.