BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Analisis regresi adalah suatu analisis yang dilakukan terhadap dua variabel yaitu variabel independen (prediktor) dan variabel dependen (respon) untuk mengetahui apakah ada pengaruh variabel prediktor terhadap variabel respon sehingga variabel respon dapat diduga berdasarkan variabel prediktornya. Berdasarkan jumlah variabel independennya, analisis regresi linier dibagi menjadi dua macam yaitu, analisis regresi linier sederhana dan analisis regresi linier ganda. Pada, analisis regresi linier sederhana, jumlah variabel independen yang digunakan sebagai penduga variabel dependen adalah satu. Sedangkan pada analisis regresi linier ganda, jumlah variabel independen yang digunakan sebagai penduga variabel dependen adalah lebih dari satu. Saat ini, analisis regresi yang lebih sering digunakan adalah analisis regresi linier ganda. Dapat dilihat dari berbagai kejadian yang terjadi dalam kehidupan sehari-hari yaitu suatu peristiwa dapat disebabkan oleh berbagai faktor yang mempengaruhinya. Contohnya, harga produk hasil olahan pabrik dipengaruhi oleh harga impor pasaran, harga impor komoditas, dan harga bahan pokok. Regresi sendiri memiliki sejarah, istilah regresi dikemukakan pertama kali oleh seorang antropolog dan ahli meteorologi Perancis yang bernama Francis Galton dalam artikelnya Family Likeness in Stature. Tetapi ada juga yang menyatakan istilah regresi muncul pada pidato Francis Galton di depan Section H of The British Association di Aberdeen 1855 dan dimuat dalam makalah Regression Toward Mediocrity in Hereditary Stature (Draper dan Smith, 1992). Pada awal abad XIX, Carl Friederich Gauss mempopulerkan metode kuadrat terkecil (Least Square Method) yang menjadi dasar analisis
1
2
regresi klasik. Baru di era 1960-an, serangkaian studi yang dikembangkan oleh para statistisi berhasil menunjukkan bahwa dalam banyak kasus, regresi menggunakan teknik kuadrat terkecil (khususnya teknik Ordinary Least Square / OLS) sering memberikan hasil yang kurang tepat. Oleh sebab itu, banyak bermunculan teknik “regresi modern”, yaitu regresi yang digunakan pada kondisi dimana asumsi-asumsi klasik tidak terpenuhi. Adapun beberapa asumsi regresi yang harus dipenuhi adalah sebagai berikut : 1. 2.
( ) = 0 , i = 1,2, ... , n ( )=
3.
, i = 1,2, ... , n
( , ) = 0 , i ≠j
4. Tidak terjadi multikolinearitas Salah satu penyebab hasil analisis regresi menggunakan metode kuadrat terkecil kurang valid adalah karena tidak terpenuhinya salah satu asumsi regresi klasik yaitu multikolinearitas. Cara untuk menangani penyimpangan asumsi ini adalah dengan menggunakan analisis Regresi Ridge. Dalam analisis Regresi Ridge ini, penduga atau estimator yang diperoleh merupakan penduga yang bias. Sama halnya dengan analisis regresi linier, analisis Regresi Ridge ini juga menggunakan banyak metode untuk mendapatkan estimasi modelnya. Dalam tugas akhir ini, akan dibahas salah satu metode pada Regresi Ridge yaitu dengan menggunakan Two Stages Ridge Regression Estimator untuk menduga nilai beta sebagai koefisien regresi. 1.2 Pembatasan Masalah Dalam penelitian ini, penyimpangan asumsi klasik yang dibahas adalah
terbatas
pada
permasalahan
multikolinearitas.
Penelitian
ini
difokuskan pada cara penanganan masalah multikolinearitas dengan menggunakan Regresi Ridge dan memusatkan metode yang digunakan dalam
3
Regresi Ridge ini terbatas pada Metode Two Stage Ridge Regression dengan menganggap asumsi klasik yang lain terpenuhi. 1.3 Tujuan dan Manfaat Penulisan Tujuan penelitian ini adalah memperkenalkankan sebuah metode dalam Regresi Ridge yang bernama Two Stage Ridge Regression Estimator dalam mengatasi masalah multikolinearitas. Manfaat dari penelitian ini adalah agar untuk selanjutnya dapat dilakukan pengembangan metode dalam regresi Ridge untuk penanganan kasus multikolinearitas pada analisis regresi. 1.4 Tinjauan Pustaka Analisis regresi sudah cukup lama dikenal luas. Gujarati (2003) dalam bukunya Basic Econometrics menyatakan bahwa terdapat beberapa asumsi yang harus dipenuhi pada analisis regresi dengan menggunakan metode Ordinary Least Square antara lain : nilai ekspektasi dari residual adalah nol, homoskedastik, tidak adanya korelasi antar residual, dan tidak adanya multikolinearitas. Dalam buku itu juga dikatakan bahwa estimator hasil dari metode estimasi dengan menggunakan OLS estimator yang BLUE (Best Linear Unbiased Estimator). Salah satu permasalahan yang kadang terjadi pada analisis regresi dengan menggunakan metode OLS adalah tidak terpenuhinya asumsi no multikolinearitas. Multikolinearitas ini terjadi ketika terdapat hubungan yang linear antar variabel prediktor (Montgomery dan Peck, 1982). Untuk permasalahan multikolinearitas ini kemudian muncul analisis regresi dengan menggunakan prosedur Ridge Trace sebagai cara untuk mengatasi terjadinya ill-conditioned dimana korelasi antara beberapa macam prediktor dalam model menyebabkan matriks X’X menyerupai matriks singular, sehingga menghasilkan parameter yang tidak stabil (Hoerl dan Kennard, 1970). Estimator yang dihasilkan regresi ridge ini merupakan estimator yang bias.
4
Seiring berjalannya waktu, metode estimasi pada regresi Ridge ini pun cukup banyak mengalami perkembangan. M. El – Dereny dan N. I. Rashwan dalam jurnalnya Solving Multicolinearity Problem Using Ridge Regression Models (2011) menjelaskan beberapa jenis metode yang berbeda dari regresi Ridge, antara lain Ordinary Ridge Regression (ORR), Generalized Ridge Regression (GRR), dan Directed Ridge Regression (DRR). Studi yang dilakukan dalam jurnal tersebut menunjukkan bahwa estimator hasil dari metode-metode dalam regresi Ridge lebih baik daripada estimator OLS saat ditemukannya kasus multikolinearitas. Terdapat beberapa cara dalam menentukan nilai konstanta bias pada analisis regresi Ridge. Tarigan (2010) dalam skripsinya menjelaskan bahwa ada beberapa cara penentuan konstanta bias k dalam regresi Ridge selain dengan menggunakan Ridge Trace, antara lain dengan metode Hoerl, Kennard dan Baldwin, metode McDonald dan Galarneau, Mallows, serta Lawless dan Wang. Anggarawati (2012) dalam tesisnya menambahkan metode alternatif lain dalam penentuan nilai konstanta bias k pada regresi Ridge yaitu metode pemilihan nilai k yang diperkenalkan oleh Dorugade dan Kashid. Hussain Eledum dan Mustafa Zahri dalam jurnalnya Relaxation Method for Two Stage Ridge Regression Estimator (2013) memperkenalkan metode baru dalam regresi Ridge yang bernama Two Stage Ridge Regression (TR) yang merupakan metode gabungan antara Two Stages Least Squares dan Ordinary Ridge Regression. Dalam jurnal tersebut dilakukan penelitian mengenai hubungan antara produk yang dihasilkan dari sektor manufaktur dengan nilai impor, komoditas kapital, dan bahan mentah yang diimpor pada negara Irak dengan menggunakan metode estimasi TR untuk memperoleh koefisien regresi. 1.5 Metode Penulisan Metode yang digunakan dalam penulisan skripsi ini adalah studi literatur yaitu menggunakan sumber-sumber resmi seperti buku teks, jurnal,
5
dan artike-artikel yang mendukung baik yang diperoleh di perpustakaan maupun di situs-situs internet. 1.6 Sistematika Penulisan Penulisan dalam tugas akhir ini disusun dengan sistematika penulisan sebagai berikut : BAB I PENDAHULUAN Bab
ini
membahas
mengenai
latar
belakang
masalah
dan
permasalahan, pembatasan masalah, tujuan dan manfaat penelitian, tinjauan pustaka, metode penulisan, dan sistematika penulisan. BAB II LANDASAN TEORI Bab ini membahasa tentang teori penunjang yang digunakan pada bab berikutnya yaitu variabel random, ekspektasi, variansi, kovariansi, korelasi, matriks, tranpose matriks, matriks invers, matriks identitas, nilai eigen dan vektor eigen, regresi linier sederhana dan ganda, permasalahan multikolinearitas, serta regresi Ridge. BAB III PEMBAHASAN Bab ini menjelaskan mengenai metode Two Stages Ridge Regression Estimator sebagai salah satu metode dalam regresi Ridge yang dapat digunakan dalam mengatasi permasalahan multikolinearitas. BAB IV STUDI KASUS Bab ini membahas tentang aplikasi Two Stage Ridge Regression Estimator dalam mengestimasi koefisien regresi yang bias. BAB V PENUTUP Pada bab terakhir ini, berisikan kesimpulan dan saran.