BAB I PENDAHULUAN
1.1.
Latar Belakang dan Permasalahan Analisis regresi merupakan salah satu analisis yang paling populer dan luas
pemakaiannya. Analisis regresi dipakai secara luas tak hanya oleh seorang statistisi, namun juga oleh para ilmuwan, ekonom, psikolog, sosiolog dan profesi lainnya yang selalu berkepentingan dengan masalah prediksi dan peramalan. Analisis regresi adalah suatu analisis yang dilakukan terhadap dua variabel yaitu variabel independen (prediktor) dan variabel dependen (respon) untuk mengetahui apakah ada pengaruh variabel prediktor terhadap variabel respon sehingga variabel respon dapat diduga berdasarkan variabel prediktornya. Berdasarkan jumlah variabel independennya, analisis regresi linear dibagi menjadi dua macam yaitu, analisis regresi linear sederhana dan analisis regresi linear ganda. Pada, analisis regresi linear sederhana, jumlah variabel independen yang digunakan sebagai penduga variabel dependen hanya satu, sedangkan pada analisis regresi linear ganda, jumlah variabel independennya lebih dari satu. Saat ini, analisis regresi yang lebih sering digunakan adalah analisis regresi linear ganda. Dapat dilihat dari berbagai kejadian yang terjadi dalam kehidupan sehari-hari yaitu suatu peristiwa dapat disebabkan oleh berbagai faktor yang mempengaruhinya. Contohnya, harga produk hasil olahan pabrik dipengaruhi oleh harga impor pasaran, harga impor komoditas, dan harga bahan pokok. Istilah regresi ini dikemukakan pertama kali oleh Francis Galton, seorang antropolog dan ahli meteorologi Perancis dalam artikelnya Family Likeness in Stature. Tetapi ada pula yang menyatakan istilah regresi muncul pada pidato Francis Galton di depan Section H of The British Association di Aberdeen 1855 dan dimuat dalam makalah Regression Toward Mediocrity in Hereditary Stature (Draper and Smith, 1922). Galton membandingkan tinggi badan anak laki-laki dengan tinggi badan ayahnya. Ia menunjukkan bahwa tinggi badan anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur (regressed) mendekati nilai tengah populasi. Sekarang istilah regresi diterapkan pada semua
1
2
jenis peramalan, dan tidak harus berimplikasi suatu regresi mendekati nilai tengah populasi. Pada awal abad XIX, Carl Friederich Gauss mempopulerkan metode kuadrat terkecil (Least Square Method) yang menjadi dasar analisis regresi klasik. Metode kuadrat terkecil adalah salah satu metode penaksiran parameter yaitu metode untuk menduga koefisien regresi. Pada era 1960-an, serangkaian studi yang dikembangkan oleh para statistisi berhasil menunjukkan bahwa dalam banyak kasus, regresi menggunakan teknik kuadrat terkecil (khususnya teknik Ordinary Least Square) sering memberikan hasil yang kurang tepat. Oleh sebab itu, banyak bermunculan teknik regresi modern yaitu regresi yang digunakan pada kondisi dimana asumsi-asumsi klasik tidak terpenuhi. Beberapa asumsi regresi klasik yang harus dipenuhi ialah : 1. ๐ธ(๐๐ ) = 0 , ๐ = 1,2,3, โฆ , ๐ 2. ๐๐๐(๐๐ ) = ๐ 2 , ๐ = 1,2,3, โฆ , ๐ 3. ๐ถ๐๐ฃ(๐๐ , ๐๐ ) = 0 , ๐ โ ๐ 4. Tidak terjadi multikolinearitas. Pendugaan koefisien regresi menggunakan metode kuadrat terkecil terkadang tidak bisa dilakukan karena salah satu asumsi regresi di atas tidak terpenuhi, dalam hal ini adalah asumsi tidak terjadinya multikolinearitas. Multikolinearitas terjadi jika terdapat hubungan linear antar beberapa atau bahkan semua variabel independen. Penanganan masalah multikolinearitas ini dapat dilakukan dengan berbagai cara, antara lain dengan mengeluarkan variabel ๐, analisis komponen utama (PCA), dan juga dengan regresi ridge. Dalam analisis regresi ridge ini, penduga atau estimator yang diperoleh merupakan penduga yang bias. Untuk mendapatkan estimasi model pada analisis regresi ridge dapat ditempuh dengan beberapa metode, salah satunya menggunakan Directed Ridge Regression yang akan dibahas dalam skripsi ini.
1.2.
Pembatasan Masalah Batasan masalah sangat diperlukan untuk menjamin keabsahan dalam
kesimpulan yang diperoleh. Berdasarkan latar belakang masalah dan kajian-kajian
3
pendukung lain, penulis dapat memberikan rumusan dan batasan masalah sehubungan dengan kompleksnya masalah yang akan muncul dalam pembahasan. Dalam penelitian ini, penyimpangan asumsi klasik yang dibahas adalah terbatas pada permasalahan multikolinearitas. Penelitian ini difokuskan pada cara penanganan masalah multikolinearitas dengan menggunakan Regresi Ridge dan memusatkan metode yang digunakan dalam Regresi Ridge ini terbatas pada Metode Directed Ridge Regression sampai dengan mendapatkan penduga parameter regresi dan menganggap asumsi klasik yang lain terpenuhi.
1.3.
Tujuan dan Manfaat Penelitian Tujuan penelitian ini adalah memperkenalkankan sebuah metode dalam
Regresi Ridge yaitu metode Directed Ridge Regression dalam mengatasi masalah multikolinearitas. Manfaat dari penelitian ini adalah: 1. Memperoleh model persamaan yang menunjukkan adanya hubungan antara variabel dependen dengan variabel independen yang memenuhi salah satu asumsi klasik regresi yaitu no multikolinearitas. 2. Agar selanjutnya dapat dilakukan pengembangan metode dalam regresi Ridge untuk penanganan kasus multikolinearitas pada analisis regresi.
1.4.
Tinjauan Pustaka Penulisan penelitian ini berangkat dari beberapa penelitian dengan tema
serupa yang telah dilakukan. Penelitian tersebut salah satunya adalah โPerbandingan Beberapa Metode untuk Menentukan Nilai k pada Regresi Ridgeโ (Tarigan, 2010) yang membandingkan beberapa metode untuk memilih parameter ridge atau bias konstan. Metode-metode tersebut antara lain metode Hoerl, Kennard dan Baldwin, metode McDonald dan Galarneau, Mallows, serta Lawless dan Wang. Metode-metode tersebut masih seputar analisis Ordinary Ridge Regression, yang menambahkan nilai ๐ yang sama ke dalam matriks korelasi ๐ฟโ๐ฟ. El-Dereny dan Rashwan (2011) dalam jurnalnya โSolving Multicolinearity Problem Using Ridge Regression Modelsโ menjelaskan beberapa jenis metode yang
4
berbeda dari regresi ridge, antara lain dengan Generalized Ridge Regression (GRR), Ordinary Ridge regression (ORR), dan Directed Ridge Regression (DRR). Studi yang dilakukan menunjukkan bahwa estimator dari regresi ridge lebih baik dibanding estimator OLS saat ditemukannya kasus multikolinearitas. Kemudian Puri (2014) dalam skripsinya yang berjudul โAplikasi Generalized Ridge Regression untuk Menangani Masalah Multikolinearitasโ membahas pengembangan terhadap regresi ridge dengan modifikasi yaitu penambahan nilai ๐ yang berbeda ke dalam matriks korelasi ๐ฟโ๐ฟ. Gulkey dan Murphy (1975) dalam jurnalnya โDirected Ridge Regression Technique in Cases of Multicollinearityโ memperkenalkan metode yang dikenal dengan Directed Ridge Regression yang juga akan penulis angkat menjadi tema dalam skripsi ini dimana dilakukan penambahan nilai ๐ yang berbeda ke dalam matriks korelasi ๐ฟโ๐ฟ, namun hanya memilih mengubah elemen diagonal matriks ๐ฟโฒ๐ฟ yang memiliki nilai eigen kecil daripada mengganti semua elemennya.
1.5.
Metode Penulisan Metode penulisan yang digunakan dalam penulisan skripsi ini adalah
berdasarkan studi literatur menggunakan sumber-sumber resmi seperti buku-buku, jurnal, dan artikel-artikel yang mendukung tema penelitian baik yang diperoleh di perpustakaan maupun di situs-situs internet. Pengerjaan penulisan skripsi ini juga ditunjang dengan beberapa perangkat lunak untuk analsis data diantaranya software R dan SPSS.
1.6.
Sistematika Penulisan Penulisan skripsi ini disusun dengan sistematika penulisan sebagai berikut :
BAB I
PENDAHULUAN Bab ini berisikan latar belakang dan permasalahan, pembatasan masalah, tujuan dan manfaat penelitian, tinjauan pustaka, metode penulisan, dan sistematika penulisan.
BAB II
DASAR TEORI
5
Bab ini membahas beberapa teori yang berkaitan dengan pembahasan
pokok
permasalahan
seperti
variabel
random,
ekspektasi, variansi, kovariansi, korelasi, matriks,operasi matriks, transpose matriks, invers matriks, matriks identitas, nilai eigen dan vektor eigen, diagonalisasi, regresi linear, estimasi kuadrat terkecil, multikolinearitas, serta regresi ridge. BAB III
DIRECTED RIDGE REGRESSION Bab ini membahas tentang konsep metode Directed Ridge Regression sebagai salah satu metode dalam regresi ridge yang dapat digunakan dalam mengatasi permasalahan multikolinearitas.
BAB IV
STUDI KASUS Bab ini berisi tentang aplikasi metode Directed Ridge Regression dalam mengestimasi koefisien regresi yang bias pada data.
BAB V
PENUTUP Bab ini berisi kesimpulan yang diperoleh dari pembahasan pada bab sebelumnya dan saran untuk pengembangan dalam penelitian selanjutnya.