BAB I PENDAHULUAN
1.1
Latar Belakang Analisis regresi pada dasarnya adalah studi mengenai ketergantungan
variabel dependen (respon) dengan satu atau lebih variabel independen (variabel penjelas), dengan tujuan untuk mengestimasi atau memprediksi rata-rata populasi atau nilai rata-rata variabel dependen berdasarkan nilai variabel independen yang diketahui (Gujarati, 2006). Analisis regresi dapat diestimasi menggunakan pendekatan parametrik dan nonparametrik. Dalam pendekatan parametrik, bentuk hubungan antara variabel respon dengan variabel penjelas dapat diketahui berdasarkan diagram pencar (linier, kuadratik, eksponensial dan polinomial). Regresi parametrik menyaratkan keadaan pada model regresi mangikuti fungsi distribusi tertentu jika keadaan tersebut tidak terpenuhi maka dapat dilakukan transformasi. Apabila tidak terdapat informasi apapun tentang bentuk fungsi, maka digunakan pendekatan nonparametrik (Hardle,1990). Regresi nonparametrik tidak menyaratkan keadaan pada model regresi mengikuti fungsi distribusi tertentu. Model regresi nonparametrik dapat berbentuk fungsi apapun, baik linear maupun nonlinear. Semua fungsi dapat digunakan untuk pendugaan dalam model regresi. Pendugaan fungsi regresi nonparametrik dilakukan berdasarkan data menggunakan teknik pemulusan salah satunya adalah estimator kernel (Hardle, 1990). Estimator kernel merupakan pengembangan dari estimator histogram. Estimasi densitas kernel adalah suatu metode pendekatan terhadap fungsi densitas yang belum diketahui dengan menggunakan fungsi kernel. Estimator kernel diperkenalkan oleh Rosenblatt (1956) dan Parzen (1962) sehingga disebut estimator densitas kernel Rosenblatt-Parzen (Hardle, 1994). Penghalusan dengan pendekatan kernel sangat tergantung pada fungsi kernel dan bandwidth (Hardle, 1994). Ada beberapa macam fungsi kernel, diantaranya adalah Kernel Gaussian, Kernel Rectangular, Kernel Uniform, Kernel Kuartik dan Kernel Epanechinov. 1
2
Terdapat pula beberapa macam estimator seperti Nadaraya-Watson, Polinimial Lokal, Priestly-Chao dan Gasser-Muller. Estimasi polinomial lokal diperkenalkan oleh Rosenblatt (1956) dan Parzen (1962) dengan memberi bobot pada setiap pengamatan (Hardle, 1990). Estimasi polinomial lokal didasarkan pada prinsip meminimumkan jumlah kuadrat sisaan dengan pembobot fungsi kernel, sedangkan ukuran bobot ditentukan oleh parameter bandwidth. Polinomial lokal merupakan suatu pendekatan yang fleksibel dan efisien dalam metode statistika karena memiliki orde sesuai dengan yang diinginkan. Orde ini yang akan menjadi derajat polinomial lokal yang sesuai bagi fungsi regresi (Fan and Gijbels,1996). Pada skripsi ini penulis akan membahas cara mengestimasi Indeks Massa Tubuh orang dewasa di Kecamatan Mlati, Kabupaten Sleman menggunakan model
regresi
nonparametrik
kernel
dengan
regresi
Polinomial
Lokal
menggunakan fungsi kernel Gaussian serta metode pemilihan bandwidth adalah Bandwidth “Rule of Thumb”, Modified Cross Validation, Biased Cross Validation dan Complete Cross Validation. 1.2
Tujuan Penelitian Penulisan skripsi yang berjudul “Regresi Polinomial Lokal dengan Fungsi
Kernel Gaussian” dimaksudkan sebagai pemenuhan salah satu syarat untuk mencapai derajat sarjana S1 Program Studi Statistika, Jurusan Matematika, Fakulats Matematika dan Ilmu Pengetahuan Alam. Sedangkan tujuan dari penulisan skripsi ini adalah sebagi berikut : a. Untuk memperkenalkan model regresi nonparametrik kernel terutama regresi Polinomial Lokal dengan menggunakan fungsi kernel Gaussian b. Untuk membandingkan berbagai metode pemilihan bandwidth yaitu Bandwidth optimal, Modified Cross Validation, Biased Cross Validation dan Complete Cross Validation c. Mengaplikasikan analisis Regresi Polinomial Lokal ke dalam suatu contoh kasus, yaitu untuk menduga pola hubungan antara Indeks Massa Tubuh orang dewasa terhadap usia.
3
1.3
Pembatasan Masalah Dalam penulisan ini, pembatasan masalah sangat diperlukan untuk
menjamin keabsahan dalam kesimpulan yang diperoleh. Agar tidak terjadi penyimpangan dari tujuan semula dan pemecahan masalah lebih terkonsentrasi, maka pembahasan skripsi ini difokuskan pada model regresi nonparametrik dengan fungsi kernel Gaussian. Regresi nonparametrik yang digunakan dalam skripsi ini adalah regresi polinomial lokal orde dua dengan metode pemilihan bandwidth adalah Bandwidth “Rule of Thumb”, Modified Cross Validation, Biased Cross Validation dan Complete Cross Validation. Variabel yang digunakan dalam studi kasus dalam skripsi ini adalah Indeks Massa Tubuh sebagai variabel respon dan usia sebagai variabel prediktor. Data yang digunakan merupakan data sekunder yang memuat satu prediktor karena fungsi kernel yang dibahas dalam skripsi ini adalah fungsi kernel univariat. Data diambil secara acak pada masyarakat yang berumur 18 sampai 50 tahun di Kecamatan Mlati, Kabupaten Sleman tahun 2015 berupa data usia dan Indeks Massa Tubuh pada orang dewasa laki-laki. 1.4
Tinjauan Pustaka Dalam skripsi ini, penulis menggunakan berbagai macam sumber pustaka.
Teknik-teknik penghalusan dengan fungsi kernel, estimasi densitas kernel univariat maupun multivariate, serta metode-metode pemilihan bandwidth (seperti metode Least Squares Cross validation, Biased Cross-Validation dan metode Plug-in) dibahas oleh Wand dan Jones (1995). Kemudian ada beberapa buku lain yang membahas tentang beberapa macam fungsi kernel pada regresi nonparametrik seperti dalam buku yang berjudul “Applied Nonparamateric Regression” yang ditulis oleh Hardle (1990) dan buku yang berjudul “Spline Smoothing and Nonparamateric Regression” yang ditulis oleh Eubank (1998). Scott dan Terrell (1987) membahas tentang metode pemilihan bandwidth dengan meminimumkan nilai Biased Cross-Validation (BCV) dan CrossValidation (CV). Metode pemilihan bandwidth dengan metode Bandwidth “Rule
4
of Thumb”, Modified Cross Validation, Biased Cross Validation dan Complete Cross Validation dan cara aplikasinya dengan software R dibahas dalam jurnal yang berjudul “Kernel Estimator and Bandwidth Selection for Density and its Derivatives” yang ditulis oleh Guidoum (2015). Sebagai sumber utama adalah buku yang ditulis oleh Takezawa (2006) dengan judul “Introduction to Nonparametric Regression” yang membahas tentang regresi polinomial lokal dengan fungsi kernel Gaussian. Sementara Fan and Gijbels (1996) membahas tentang Estimasi polinomial lokal yang didasarkan pembobot fungsi kernel, dengan ukuran bobot ditentukan oleh parameter bandwidth dan juga membahas tentang orde regresi polinomial lokal yang dipilih sesuai dengan yang diinginkan dalam bukunya yang berjudul “Local Polynomial Modelling and Its Application”. 1.5
Metode Penulisan Metode yang digunakan dalam melakukan penulisan skripsi ini adalah studi
literatur. Sumber literatur yang dipelajari diperoleh dari sumber-sumber resmi, seperti perpustakaan, text book, e-book, dan artikel serta jurnal online yang diperoleh melalui situs-situs yang mendukung di internet.
1.6
Sistematika Penulisan Skripsi ini disusun dengan sistematika penulisan sebagai berikut :
BAB I
PENDAHULUAN Bab ini berisi latar belakang masalah, tujuan penelitian, pembatasan masalah, metode penelitian, tinjauan pustaka, dan sistematika penulisan yang memberikan arah dalam penulisan skripsi ini.
BAB II
DASAR TEORI Bab ini membahas tentang teori-teori yang mendasari pembahasan tentang estimasi berat badan balita menggunakan metode nonparametrik kernel. Teori-teori penunjang tersebut diantaranya
5
adalah variabel random, matriks, fungsi densitas, deret taylor, regresi linear klasik, dan uji normalitas. BAB III
REGRESI POLINOMIAL LOKAL DENGAN FUNGSI KERNEL GAUSSIAN Bab ini membahas tentang pembatasan masalah, yaitu penjelasan mengenai regresi Polinomial Lokal dengan fungsi Kernel Gaussian serta membahas metode pemilihan parameter bandwidth yang optimal diantaranya adalah metode bandwidth “Rule of Thumb”, metode Modified Cross Validation, Biased Cross Validation dan Complete Cross Validation.
BAB IV
STUDI KASUS Bab ini membahas tentang deskripsi data dan contoh penerapan Regresi Polinomial Lokal untuk menentukan estimasi Indeks Massa Tubuh orang dewasa di Kecamatan Mlati, Kabupaten Sleman.
BAB V
KESIMPULAN DAN SARAN Bab ini membahas tentang kesimpulan yang diperoleh dari hasil pembahasan dan saran sebagai akibat dari kekurangan atau kelebihan dari hasil penelitian yang dilakukan.