BAB I PENDAHULUAN
1.1.
Latar Belakang dan Permasalahan Analisis regresi dalam statistika adalah salah satu metode untuk
mengetahui hubungan atau pengaruh antara satu variabel dengan variabel lainnya. Selain itu, analisis ini juga dapat melihat bentuk-bentuk hubungan antar variabel tersebut. Variabel “penyebab” disebut dengan bermacam-macam istilah yaitu variabel penjelas, variabel eksplanatorik, variabel prediktor, variabel independen, atau secara umum kita sebut dengan istilah variabel X (karena seringkali digambarkan dalam grafik sebagai absis). Variabel yang terkena akibat dikenal sebagai variabel yang dipengaruhi, variabel terikat, variabel respon, variabel dependen, atau variabel Y. Analisis regresi adalah salah satu analisis yang paling populer dan luas pemakaiannya. Analisis regresi dipakai secara luas tak hanya oleh seorang statistisi, namun juga oleh para ilmuwan, ekonom, psikolog, sosiolog dan profesi lainnya yang selalu berkepentingan dengan masalah prediksi dan ramalan. Karena selain untuk melihat pengaruh variabel independen (X) terhadap variabel dependen (Y), analisis ini selanjutnya dapat untuk menduga atau memprediksi nilai variabel dependen (Y) berdasarkan variabel independennya (X). Berdasarkan jumlah variabel independennya (X), analisis regresi linear bisa dibedakan menjadi dua macam, yaitu analisis regresi linear sederhana dan analisis regresi linear ganda. Analisis regresi linear sederhana hanya mempunyai satu variabel independen saja. Sedangkan pada analisis regresi ganda, jumlah variabel independennya lebih dari satu. Istilah regresi ini dikemukakan pertama kali oleh Francis Galton (18221911), seorang antropolog dan ahli meteorologi Perancis dalam artikelnya Family Likeness in Stature. Tetapi ada pula yang menyatakan istilah regresi muncul pada pidato Francis Galton di depan Section H of The British Association di Aberdeen
1
2
1855 dan dimuat dalam makalah Regression Toward Mediocrity in Hereditary Stature (Draper and Smith, 1922). Galton membandingkan tinggi badan anak lakilaki dengan tinggi badan ayahnya. Ia menunjukkan bahwa tinggi badan anak lakilaki dari ayah yang tinggi setelah beberapa generasi cenderung mundur (regressed) mendekati nilai tengah populasi. Sekarang istilah regresi diterapkan pada semua jenis peramalan, dan tidak harus berimplikasi suatu regresi mendekati nilai tengah populasi. Pada awal abad XIX, Carl Friederich Gauss mempopulerkan metode kuadrat terkecil (Least Square Method) yang menjadi dasar analisis regresi klasik. Metode kuadrat terkecil adalah salah satu metode penaksiran parameter yaitu metode untuk menduga koefisien regresi. Pada era 1960-an, serangkaian studi yang dikembangkan oleh para statistisi berhasil menunjukkan bahwa dalam banyak kasus, regresi menggunakan teknik kuadrat terkecil (khususnya teknik Ordinary Least Square/OLS) sering memberikan hasil yang kurang tepat. Oleh sebab itu, banyak bermunculan teknik regresi modern yaitu regresi yang digunakan pada kondisi dimana asumsi-asumsi klasik tidak terpenuhi. Beberapa asumsi regresi yang harus dipenuhi ialah : 1. E i 0, i 1, 2,, n 2. Var i 2 , i 1, 2,, n 3. Cov i , j 0, i j 4. Tidak terjadi multikolinearitas. Penaksiran koefisien regresi menggunakan metode kuadrat terkecil terkadang tidak bisa dilakukan karena salah satu asumsi regresi di atas tidak terpenuhi, yaitu multikolinearitas. Multikolinearitas terjadi jika ada hubungan linear antar beberapa atau bahkan semua variabel independen. Multikolinearitas dianggap sebagai suatu kelemahan (black mark) dalam analisi regresi karena menyebabkan penduga dari parameter tidak bersifat BLUE (Best Linear Unbiased Estimator). Oleh karena itu masalah multikolinearitas harus diatasi. Penanganan masalah multikolinearitas ini antara lain dengan analisis komponen utama,
3
mengeluarkan variabel X dan dengan regresi ridge. Dalam analisis regresi ridge ini, penduga atau estimator yang diperoleh merupakan penduga yang bias. Untuk mendapatkan estimasi model pada analisis regresi ridge dapat ditempuh dengan beberapa metode, salah satunya menggunakan Generalized Ridge Regression yang akan dibahas dalam tugas akhir ini.
1.2.
Pembatasan Masalah Dalam penelitian ini, batasan masalah sangat diperlukan untuk menjamin
keabsahan dalam kesimpulan yang diperoleh. Berdasarkan latar belakang masalah dan kajian-kajian pendukung lain, penulis dapat memberikan rumusan dan batasan masalah sehubungan dengan kompleksnya masalah yang akan muncul dalam pembahasan. Dalam skripsi ini akan dibahas lebih lanjut tentang cara penanganan penyimpanagan asumsi klasik masalah multikolinearitas. Salah satunya dengan menggunakan analisis regresi ridge yang memusatkan metode Generalized Ridge Regression dengan menganggap asumsi klasik yang lain terpenuhi.
1.3.
Tujuan Penulisan Tujuan yang ingin dicapai dari penulisan tugas akhir ini adalah :
1. Mengenal penanganan untuk masalah multikolinearitas, salah satunya yaitu dengan menggunakan regresi ridge. 2. Mempelajari metode Generalized Ridge Regression untuk mengatasi masalah multikolinearitas.
1.4.
Manfaat Penulisan Manfaat dari penelitian ini adalah :
1. Menambah khazanah keilmuan statistika terutama dalam analisis data dengan menggunakan metode regresi ridge tergeneralisasi. 2. Memperoleh model persamaan yang menunjukkan adanya hubungan antara variabel dependen dengan variabel independen yang memenuhi salah satu asumsi klasik regresi yaitu no multikolinearitas.
4
1.5.
Tinjauan Pustaka Penulisan penelitian ini berangkat dari beberapa penelitian dengan tema
serupa yang telah dilakukan. Penelitian tersebut salah satunya adalah “Perbandingan Beberapa Metode untuk Menentukan Nilai k pada Regresi Ridge” (Tarigan, 2010) yang membandingkan beberapa metode untuk memilih parameter ridge atau bias konstan. Metode-metode tersebut antara lain metode Hoerl, Kennard dan Baldwin, metode McDonald dan Galarneau, Mallows, serta Lawless dan Wang. Dalam tesisnya, Anggaraati (2012) menambahkan metode lain yang diperkenalkan oleh Dorugade dan Kashid. Metode-metode tersebut masih seputar analisis Ordinary Ridge Regression, yang artinya nilai k yang ditambahkan ke dalam matriks korelasi X ' X adalah sama. M. El-Dereny dan N.I. Rashwan dalam jurnalnya Solving Multicolinearity Problem Using Ridge Regression Models (2011) menjelaskan beberapa jenis metode yang berbeda dari regresi ridge, antara lain dengan Generalized Ridge Regression (GRR), Ordinary Ridge regression (ORR), dan Directed Ridge Regression (DRR). Studi yang dilakukan menunjukkan bahwa estimator dari regresi ridge lebih baik dibanding estimator OLS saat ditemukannya kasus multikolinearitas. Pada tugas akhir ini, penulis mengangkat tema Generalized Ridge Regression yaitu metode pemilihan nilai konstanta bias k yang nantinya ditambahkan
ke
dalam
matriks
korelasi
X 'X
sehingga
permasalahan
multikolinearitas terselesaikan. Nilai k yang ditambahkan dengan metode ini adalah berbeda. 1.6.
Metode Penulisan Metode penulisan dalam pengerjaan penelitian ini adalah berdasarkan
studi literatur yang didapat dari buku-buku dan jurnal-jurnal yang berhubungan dengan tema penelitian. Selain itu terdapat bahan pendukung yaitu dari situs-situs internet. Pengerjaan penulisan penelitian ini juga ditunjang dengan beberapa perangkat lunak diantaranya software R, SAS, SPSS dan Microsoft Excel.
5
1.7.
Sistematika Penulisan Penulisan penelitian ini dibagi menjadi lima bab, yaitu:
BAB I
PENDAHULUAN Bab ini berisikan latar belakang dan permasalahan, pembatasan masalah, tujuan penelitian, manfaat penelitian, tinjauan pustaka, metode penulisan, dan sistematika penulisan.
BAB II
DASAR TEORI Bab ini membahas beberapa teori yang berkaitan dengan pembahasan
pokok
permasalahan
seperti
variabel
random,
ekspektasi, variansi, kovariansi, korelasi, matriks, transpose matriks, matriks invers, matriks identitas, nilai eigen dan vektor eigen, regresi ridge, regresi linear, estimasi kuadrat terkecil, multikolinearitas. BAB III
PEMBAHASAN Bab ini berisi konsep tentang metode Generalized Ridge Regression sebagai salah satu metode dalam regresi Ridge yang dapat digunakan dalam mengatasi permasalahan multikolinearitas.
BAB IV
STUDI KASUS Bab ini berisi tentang aplikasi metode Generalized Ridge Regression dalam mengestimasi koefisien regresi yang bias pada data.
BAB V
PENUTUP Bab ini berisi kesimpulan yang diperoleh dari pembahasan pada bab sebelumnya dan saran atas kekurangan yang muncul dari hasil penelitian yang dilakukan.