BAB I PENDAHULUAN
1.1
Latar Belakang Masalah Analisis regresi merupakan teknik statistik untuk investigasi dan pemodelan
hubungan antar variabel. Hubungan antara dua variabel dapat dilihat dengan analisis regresi atau menggunakan perhitungan koefisien korelasi yang menyatakan keeratan hubungan antar keduanya. Dengan menggunakan model regresi, dapat dihitung besar perubahan pada satu atau lebih dari satu variabel yaitu variabel bebas atau variabel independent atau variabel prediktor dalam kaitannya dengan variabel lain yaitu variabel dependent atau variabel respon, (Kotz,1988). Sebagai contoh seseorang ingin meneliti apakah ada hubungan antara pengeluaran untuk membeli mobil (variabel respon) dengan pendapatan (variabel bebas). Pada praktiknya, permasalahan yang terkadang ditemui oleh seorang peneliti salah satunya adalah ketika data variabel respon tidak lengkap atau sering disebut tersensor. Hal ini bisa disebabkan oleh berbagai alasan, seperti kehilangan informasi yang disebabkan oleh faktor-faktor diluar kontrol, ketidakinginan beberapa unit sampel untuk menyediakan informasi yang diinginkan, kegagalan pihak investigator untuk menghimpun informasi yang benar dan sebagainya. Regresi dengan variabel dependent yang terbatas demikian ini disebut dengan regresi Tobit. Dalam model Tobit standar, nilai batas bawahnya adalah 0 (nol). Pada model regresi untuk variabel respon tersensor yang demikian menghasilkan error yang tidak diketahui distribusinya dengan rata-rata errornya tidak sama dengan nol, maka estimator standar metode kuadrat terkecil akan menghasilkan estimasi yang bias. Untuk model regresi dengan error berdistribusi normal dan homokedastik estimator yang sering digunakan adalah estimator Maximum Likelihood. Hal ini
1
2
menjadi jelas jika asumsi tersebut tidak dipenuhi maka estimator Maximum Likelihood (MLE) juga akan menghasilkan estimasi yang bias. Model Tobit standar dengan variabel dependent tersensor pada 0 (nol) dapat dituliskan sebagai berikut. 0 𝑦𝑦 = � ′ 𝐱𝐱 𝛃𝛃 + ε
, untuk 𝐱𝐱 ′ 𝛃𝛃 + ε < 0 , lainnya
(1.1)
dengan y
: nilai pengamatan variabel dependent
𝐱𝐱
: vektor variabel independent yang diamati
𝜀𝜀
: error
𝛃𝛃
: vektor koefisien regresi yang tidak diketahui
Estimator regresi dengan kasus di atas, diusulkan oleh Tobin (1958) dan sering disebut sebagai regresi Tobit, estimasi konsistensi dari parameter fungsi regresi diusulkan oleh Amemiya (1973) dan Heckman (1967,1979).
Namun,
estimator Tobit memiliki kelemahan yaitu menghasilkan estimasi yang bias untuk error yang tidak normal. Powell (1984,1986) memperkenalkan estimator Censored Least Absolute Deviations (CLAD) dan Symmetrically Censored Least Squares (SCLS) sebagai alternatif dari estimator Tobit. Estimator CLAD memiliki kelebihan yaitu error tidak harus berdistribusi normal. Estimator CLAD merupakan estimator yang memodifikasi metode least absolute deviations (LAD). Metode LAD mengestimasi koefisien regresi dengan meminimalisasi jumlahan absolute residuals. Hampir mirip dengan metode kuadrat terkecil yang menggeneralisasi mean sampel, namun metode LAD dilakukan dengan menggeneralisasi median dari sampel. Jika variabel respon tidak tersensor, fungsi regresi 𝐱𝐱 ′ 𝛃𝛃 berada dibawah kondisi error memiliki median
yang bernilai nol, sehingga metode LAD dapat digunakan untuk mengestimasi koefisien regresi.
3
Sedangkan untuk regresi dengan variabel respon tersensor, median tidak berubah selama variabel bebas tidak tersensor. Komputasi metode Censorel Least Square Deviations (CLAD) dilakukan dengan menghapus estimasi fungsi regresi 𝐱𝐱 ′ 𝛃𝛃
yang tersensor (langkah re-censoring) dan mengestimasi koefisien regresi dengan metode least absolute deviations (langkah regresi).
Metode Symmetrically Censored Least Squares (SCLS) diperkenalkan oleh Powell (1986b) dengan didasarkan dari ide kesimetrisan distribusi error. Jika error diketahui berdistribusi simetris disekitar nol dan variabel respon terobservasi atau tidak tersensor, maka metode standar kuadrat terkecil akan menghasilkan estimator yang konsisten. Namun untuk kasus variabel respon yang tersensor atau terpotong membuat error berdistribusi asimetris. Sehingga dasar dari estimator SCLS adalah membuat data variabel respon tersensor yang memiliki distribusi error yang asimetris menjadi simetris sehingga metode standar kuadrat terkecil dapat digunakan.
1.2
Batasan Masalah Batasan masalah merupakan hal yang sangat penting untuk dilakukan dalam
suatu penulisan agar tidak terjadi penyimpangan dari tujuan yang ingin dicapai. Dalam skripsi ini difokuskan untuk membandingkan metode Censored Least Absolute Deviations (CLAD) dan metode Symmetrically Censored Least Squares (SCLS) untuk model regresi Tobit. Tugas akhir ini hanya akan membahas untuk kasus data tersensor.
1.3
Tujuan Penelitian Tujuan dari penelitian ini adalah: 1. Sebagai salah satu syarat untuk mendapatkan gelar S1 pada Program Studi Statistika, FMIPA UGM.
4
2. Menentukan dan mengidentifikasi model regresi untuk mengestimasi parameter-parameternya untuk regresi semiparametrik dengan variabel respon tersensor (regresi Tobit). 3. Membandingkan estimator Censored Least Absolute Deviations (CLAD) dengan estimator Symmetrically Censored Least Squares (SCLS) untuk model regresi Tobit.
1.4
Manfaat Penelitian Hasil penelitian ini diharapkan dapat memiliki beberapa manfaat: 1. Mengaplikasikan ilmu statistika untuk analisis regresi, terutama regresi semiparametrik dengan variabel respon tersensor (regresi Tobit). 2. Memperkenalkan estimator Censored Least Absolute Deviations (CLAD) dan Symmetrically Censored Least Squares (SCLS) sebagai alternatif dari regresi Tobit. 3. Menambah ilmu pengetahuan.
1.5
Metode Penelitian Metode penelitian yang digunakan penulis adalah studi literatur yang
diperoleh dari jurnal-jurnal ilmiah, perpustakaan, dan sumber-sumber lain yang diperoleh dari internet. Penulis dalam menyelesaikan penelitian ini menggunakan bantuan software STATA/SE 10.0 dan EViews 6. Data yang diambil merupakan data sekunder Survey Angkatan Kerja Nasional (SAKERNAS) 2013 Provinsi Daerah Istimewa Yogyakarta yang diambil dari Badan Pusat Statistik Provinsi Daerah Istimewa Yogyakarta.
1.6
Tinjauan Pustaka Estimator
Censored
Least
Absolute
Deviations
(CLAD)
pertama
diperkenalkan oleh James Powell (1984) dan penelitian selanjutnya memperkenalkan
5
estimator Symmetrically Censored Least Squares (SCLS) (1986) sebagai alternatif dari estimator Tobit untuk regresi semiparametrik dengan variabel respon tersensor. Estimator Censored Least Absolute Deviations (CLAD) memiliki kelebihan yaitu tidak sensitif pada data outlier, mampu menghasilkan estimasi yang robust, dan dapat digunakan untuk data yang non-normal dan data dengan homoskedastisitas yang tidak terpenuhi (heterokedastik). Sedangkan estimator Symmetrically Censored Least Squares (SCLS) memiliki asumsi yang lebih ketat, yaitu error yang berdistribusi simetris disekitar nol, sementara CLAD memperbolehkan perhitungan dengan error yang asimetris. Jolliffe et al. (2000) membahas program untuk mengestimasi estimator Censored Least Absolute Deviations (CLAD) dan estimasi bootstrap yang diimplementasikan dengan software STATA. Powell dan Chay (2001) kembali membahas mengenai estimator Censored Least Absolute Deviations (CLAD), Symmetrically Censored Least Squares (SCLS), dan Identically Censored Least Absolute Deviations (ICLAD) & Identically Censored Least Squares (ICLS) serta membandingkan ketiga metode diatas dalam aplikasi penelitian mengenai pengaruh Title VII of the Civil Rights Act 1964 terhadap pendapatan orang berkulit hitam. Florios et al. (2013) juga membahas komputasi lain yang dapat digunakan dalam menghitung estimator Censored Least Absolute Deviations (CLAD).
1.7
Sistematika Penulisan Sistematika Penulisan yang digunakan dalam penelitian ini adalah sebagai
berikut.
6
BAB I
PENDAHULUAN
Bab ini berisi tentang latar belakang penelitian, tujuan penelitian, manfaat penelitian, pembatasan masalah, metode penelitian, sistematika penulisan laporan, dan tinjauan pustaka.
BAB II
LANDASAN TEORI
Bab ini membahas tentang landasan teori yang relevan dengan penelitian ini yaitu dasar-dasar analisis regresi, penjelasan mengenai regresi parametrik, non parametrik dan semi parametrik, asumsi-asumsi yang harus dipenuhi dalam regresi,regresi Tobit, metode Least Absolute Deviations, bootstrap, dan sifat asimtotis estimator.
BAB III
PERBANDINGAN ESTIMATOR CENSORED LEAST ABSOLUTE DEVIATIONS (CLAD) DAN SYMMETRICALLY CENSORED LEAST SQUARES (SCLS) UNTUK MODEL REGRESI TOBIT
Bab ini membahas tentang definisi, kekonsistenan yang kuat, normal asimtotis, dan estimasi matriks kovariansi asimtotis dari metode Censored Least Absolute Deviations (CLAD) dan definisi, kekonsistenan dan normal asimtotis, kekonsistenan estimasi matriks kovariansi asimtotis dari metode Symmetrically Censored Least Squares (SCLS).
BAB IV
STUDI KASUS DAN PEMBAHASAN HASIL
Bab ini berisi analisis regresi dengan metode Censored Least Absolute Deviations (CLAD) dan metode Symmetrically Censored Least Squares (SCLS)
7
yang
diaplikasikan
pada
penelitian
analisis
partisipasi
perempuan
dalam
perekonomian rumah tangga di kota Yogyakarta serta pembahasan hasil yang didapat dan perbandingan kedua estimator diatas.
BAB V
PENUTUP
Bab ini berisi kesimpulan dari hasil analisis dan saran-saran untuk penelitian selanjutnya.