1
BAB I PENDAHULUAN 1.1 Latar Belakang Analisis regresi merupakan salah satu analisis statistik yang sering digunakan untuk menyelidiki pola hubungan fungsional antara variabel prediktor dan variabel respon (Budiantara dan Oktaviana, 2011). Informasi mengenai hubungan fungsional antara variabel prediktor dengan variabel respon dapat diperkirakan dengan melihat bentuk pola hubungan pada diagram pencar (scatter plot). Pola hubungan yang terbentuk pada diagram pencar dapat dimanfaatkan untuk mengetahui pendekatan yang sesuai dalam mengestimasi fungsi regresi, yaitu pendekatan parametrik atau nonparametrik. Pendekatan parametrik mengasumsikan bentuk hubungan antara variabel respon dan variabel prediktor diketahui atau diperkirakan dari kurva regresi. Apabila tidak ada informasi apapun tentang bentuk dari kurva regresi, maka pendekatan yang digunakan adalah pendekatan nonparametrik (Hardle, 1990). Menurut Hardle (1989) pendekatan nonparametrik untuk mengestimasi kurva regresi memiliki beberapa tujuan utama, yaitu memberikan metode untuk mengeksplorasi hubungan antara dua variabel secara umum, menghasilkan prediksi dari observasi walaupun dibuat tanpa referensi, serta merupakan metode yang fleksibel untuk mensubstitusi nilai-nilai yang hilang atau interpolasi antara variabel prediktor yang berdekatan. Menurut Haryatmi (2009) perbedaan penting antara metode regresi parametrik dan regresi nonparametrik adalah pada derajat ketergantungan terhadap informasi tentang f yang didapat dari data dan peneliti. Pada regresi nonparametrik data akan mencari bentuk estimasinya sendiri tanpa di pengaruhi oleh subjektifitas dari peneliti, sehingga pendekatan regresi nonparametrik memiliki fleksibilitas yang tinggi (Eubank,1988). Salah satu pendekatan nonparametrik yang banyak digunakan dalam penelitian statistik adalah estimator kernel.
2
Salah satu estimator nonparametrik kernel yang penting dalam mengetimasi fungsi regresi adalah estimator kernel Nadaraya-Watson. Pada umumnya penelitian tentang estimator kernel Nadaraya-Watson masih membahas estimator kernel Nadaraya-Watson dengan bandwidth tertentu (fixed bandwidth). Namun, permasalahan timbul ketika data yang diteliti memiliki distribusi ekor panjang (long-tailed distributions), distribusi multi-mod (multi-mod distributions), dan kasus multivariat. Pada kasus tersebut penggunaan estimator kernel NadarayaWatson memberikan performa yang kurang optimal. Menurut Demir dan Toktamis (2010) pada kasus distribusi ekor panjang (long-tailed distributions) dan distribusi multi-mod (multi-mod distributions) digunakan estimator kernel Nadaraya-Watson dengan variansi bandwidth atau disebut juga estimator kernel Nadaraya-Watson adaptif. Suatu ukuran kebaikan estimator dapat dilihat dari tingkat kesalahannya. Semakin kecil tingkat kesalahannya semakin baik estimasinya. Salah satu ukuran kesalahan dapat dilihat dari nilai MSE (Rata-rata kesalahan kuadrat), semakin kecil nilai MSE semakin baik estimator tersebut. Oleh karena itu, dalam penelitian ini akan dibandingkan kebaikan antara estimator kernel Nadaraya-Watson dan estimator kernel Nadaraya-Watson adaptif dari besarnya nilai Mean Squared Error (MSE) yang dihasilkan. 1.2 Rumusan Masalah Berdasarkan uraian latar belakang diperoleh rumusan masalah yang diangkat adalah: 1. Bagaimana model estimator kernel Nadaraya-Watson adaptif? 2. Bagaimana perbandingan performa antara estimator kernel NadarayaWatson dan estimator kernel Nadaraya-Watson adaptif?
1.3 Tujuan Penulisan Berdasarkan rumusan masalah di atas, tujuan dari penulisan ini adalah: 1. Membentuk model estimator kernel Nadaraya-Watson adaptif.
3
2. Membandingan performa antara estimator kernel Nadaraya-Watson dan estimator kernel Nadaraya-Watson adaptif.
1.4 Manfaat Penulisan Berdasarkan tujuan di atas, manfaat yang diharapkan dari penulisan ini adalah: 1. Secara umum, diharapkan dapat memberikan sumbangan terhadap perkembangan ilmu pengetahuan dan menambah wawasan pengetahuan dalam bidang statistika nonparametrik terutama tentang pengembangan regresi kernel yaitu estimator kernel Nadaraya-Watson adaptif. 2. Secara khusus, diharapkan dapat memodelkan estimator kernel NadarayaWatson adaptif kemudian membandingkannya dengan estimator kernel Nadaraya-Watson, dan dapat digunakan sebagai sarana berpikir kritis dalam melihat fenomena yang berkembang dalam masyarakat dan mengkaitkannya dengan ilmu statistika yang telah dipelajari.
1.5 Tinjauan Pustaka Pembahasan mengenai regresi kernel Nadaraya-Watson telah banyak dibahas dalam beberapa penelitian. Sebelumnya dibahas konsep-konsep dasar pada regresi kernel seperti Walpole (1995) memberikan definisi variabel acak, Bain & Engelhardt (1992) memberika definisi fungsi densitas variabel acak. Hogg, McKean & Craig (2005) menjelaskan mengenai fungsi densitas gabungan, fungsi densitas marginal, rataan bersyarat, serta sifat-sifat estimator. Boor & Conte (2000) menjelaskan mengenai konvergensi, Purcell (1987) memberikan definisi deret Taylor. Referensi secara lengkap mengenai estimator regresi kernel Nadaraya-Watson adaptif dapat dilihat pada Demir dan Toktamis (2010) dimana dijelaskan mengenai estimator kernel adaptif untuk fungsi densitas dan estimator kernel Nadaraya-Watson adaptif untuk fungsi regresi. Adapun pembahasan mengenai estimator kernel Nadaraya-Watson telah dibahas secara lengkap oleh Hardle (1989 & 1990) yang meliputi definisi fungsi kernel, yaitu suatu fungsi yang pada
4
pemanfaatannya diberlakukan pada setiap titik data dan beberapa fungsi kernel yang lain diantaranya kernel uniform, kernel segitiga (triangle), kernel epanechinikov, kernel quartic, dan kernel Gaussian, serta estimasi densitas kernel. Selain itu, terdapat juga Sain (1994) membahas estimasi denstitas kernel adaptif. Sedangkan untuk aplikasi dijelaskan oleh Vita Azizah (2008) yang membahas mengenai aplikasi regresi nonparametrik kernel dalam data finansial.
1.6 Metode Penelitian Metode yang digunakan dalam penelitian ini adalah metode studi literature. Dalam menganalisis model estimator kernel Nadaraya-Watson adaptif digunakan referensi dari jurnal On Adaptive Nadaraya-Watson Kernel Regression Estimators (Hacettepe Journal of Mathematics and Statistics : 2010) dan Adaptive Kernel Density Estimation (Unpublish Ph.D. Thesis, Department of Statistics. Rice University. Texas: 1994). Pada dasarnya estimator kernel Nadaraya-Watson adaptif adalah pengembangan dari estimator kernel Nadaraya-Watson. Oleh karena itu, langkah awal analisis model adalah menentukan estimator kernel Nadaraya-Watson, yaitu menentukan model estimasi kernel yang merupakan suatu metode pendekatan terhadap fungsi densitas yang belum diketahui dengan menggunakan fungsi kernel kemudian mencari model dari estimator kernel Nadaraya-Watson yang merupakan nilai kurva rata-rata pada kondisi tertentu. Selanjutnya menentukan model estimator kernel adaptif dari fungsi densitas dan dilanjutkan dengan model estimator kernel Nadaraya-Watson adaptif dari fungsi regresi. Adapun langkah akhir adalah menghitung ukuran kinerja (performance measures) yaitu dengan mencari nilai Mean Square error (MSE) dan membandingkan nilai tersebut baik pada estimator kernel Nadaraya-Watson maupun pada estimator kernel Nadaraya-Watson adaptif.
1.7 Sistematika Penulisan Untuk mempermudah pembaca dalam memahami tulisan ini, maka tulisan ini akan dibagi ke dalam lima bab sebagai berikut:
5
BAB I PENDAHULUAN Dalam bab ini dijelaskan latar belakang masalah, rumusan masalah, tujuan penulisan, manfaat penulisan, tinjauan pustaka, metodologi penelitian dan sistematika penulisan. BAB II LANDASAN TEORI Dalam bab ini dikemukakan teori-teori yang meliputi definisi, teorema dan contoh, ataupun hal-hal yang mendasari dan mendukung yang menunjang pembahasan tentang estimator regresi kernel Nadaraya-Watson adaptif. BAB III PEMBAHASAN Bab III membahas penjelasan mengenai estimasi densitas kernel, estimasi densitas kernel adaptif, estimator kernel Nadaraya-Watson dan estimator kernel Nadaraya-Watson adaptif. Selanjutnya pada bab ini akan dibahas mengenai statistik dari masing-masing estimator yang meliputi nilai ekspektasi, variansi, dan bias, untuk selanjutnya digunakan dalam mencari nilai Mean Square error (MSE). BAB IV SIMULASI DAN STUDI KASUS Bab IV berisi tentang implementasi estimator kernel Nadaraya-Watson dan estimator kernel Nadaraya-Watson adaptif dengan menggunakan data simulasi ataupun studi kasus pada data yang sama kemudian menghitung ukuran kinerja (performance measures) yaitu dengan mencari nilai Mean Square error (MSE) dan membandingkan nilai tersebut baik pada estimator regresi kernel Nadaraya-Watson maupun estimator regresi kernel Nadaraya-Watson adaptif. BAB V PENUTUP Bab ini berisi tentang kesimpulan yang diperoleh dari hasil pembahasan serta saran sebagai akibat dari kekurangan atau kelebihan dari hasil penelitian yang dilakukan.