PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
REGRESI ROBUST DENGAN M-ESTIMASI
MAKALAH Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Sains Program Studi Matematika
Disusun oleh : Agnes Tri Susilawati NIM : 053114001
PROGRAM STUDI MATEMATIKA JURUSAN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2010
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ROBUST REGRESSION WITH M-ESTIMASI
MAKALAH Presented As a Partial Fulfillment of The Requirements To Obtain The Sarjana Sains Degree In Mathematics
By : Agnes Tri Susilawati Student Number : 053114001
MATHEMATICS STUDY PROGRAM DEPARTEMENT OF MATHEMATICS FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY YOGYAKARTA 2010
ii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
v
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Berdirilah dengan teguh, jangan goyah, dan giatlah selalu dalam pekerjaan Tuhan! Sebab dalam persekutuan dengan Tuhan jerih payahmu tidak sia-sia 1 Korintus 15 : 58 Kupersembahkan makalah ini kepada: Tuhan Yesus Kristus yang senantiasa menyertaiku, sumber harapan dan kekuatanku Kedua orangtuaku atas cinta dan doa yang tiada henti Kedua kakakku Mas Robert dan Mbak Chris Serta almamaterku tercinta
vi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ABSTRAK
Outlier adalah pengamatan dengan nilai residual yang besar. Dengan adanya outlier, parameter-parameter dalam model regresi akan menjadi bias, oleh karena itu dibutuhkan regresi yang dapat menghasilkan model regresi yang tidak terpengaruh oleh outlier yaitu regresi robust. Regresi robust adalah alat penting untuk menganalisa data yang dipengaruhi oleh outlier sehingga dihasilkan model yang tidak terpengaruh oleh outlier. Pada makalah ini akan dibahas pendugaan parameter dalam regresi robust dengan menggunakan metode M-Estimasi dengan fungsi bobot Huber. Pada regresi −1 kuadrat terkecil penduga parameter β adalah β = (Χ′Χ ) Χ′Υ sedangkan untuk regresi −1 robust penduga parameter β adalah β = (Χ′Wβ Χ ) Χ′Wβ Υ. Ketika Wβ = 1 model
regresi robust sama dengan model regresi kuadrat terkecil. Kesukaran dalam mendapatkan penduga parameter β regresi robust bahwa Wβ tergantung pada β dan β tergantung pada Wβ , sehingga untuk mendapatkan nilai β digunakan suatu iterasi yang disebut dengan iteratively reweighted least squares (IRLS).
Kata Kunci: outlier, robust, regresi, M-Estimasi, IRLS
vii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ABSTRACT
Outlier is an observation data with big residual value. With attending outlier, some parameters in the regression model can be bias, so that it needs a best regression model without outlier and it is mentioned as a robust regression. The robust regression is an important tool to analyze outlier and then to obtain a regression model without outlier. In this research we describe some predicted parameters for the robust regression using M-Estimation method through a weight formula of Huber. The least squares −1 regression estimators of β are β = (Χ′Χ ) Χ′Υ , whereas the robust regression
−1 estimators of β are β = (Χ′Wβ Χ ) Χ′Wβ Υ. When Wβ = 1 the robust regression model
same as with least square regression model. The difficulty in obtaining of predicted parameter β is reciprocal depending on Wβ , while Wβ depends on β and β depends on Wβ , so that to obtain a value of β we need an iteration calculation using IRLS (iteratively reweighted least squares). Keywords: outlier, robust, regression, M-Estimation, IRLS
viii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ix
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus, atas berkat dan kasih karunianya yang telah diberikan sehingga penulis dapat menyelesaikan makalah yang berjudul “ Regresi Robust dengan M-estimasi”. Dalam proses penulisan makalah ini banyak hambatan yang dialami oleh penulis. Namun, berkat bantuan dan dukungan dari banyak pihak, akhirnya makalah ini dapat terselesaikan. Oleh karena itu penulis ingin mengucapkan terimakasih kepada: 1. Ibu Enny Murwaningtyas, S.Si, M.Si, selaku dosen pembimbing tugas akhir yang telah meluangkan waktu, pikiran, serta sabar dalam membimbing penulis selama penyusunan tugas akhir ini. 2. Yosef Agung Cahyanta, S.T., M.T. selaku Dekan Fakultas Sains dan Teknologi 3. Ibu Lusia Krismiyati Budiasih, S.Si, M. Si, selaku ketua program studi Matematika FST USD Yogyakarta yang telah banyak membantu dan memberikan saran. 4. Romo Prof. Dr. Frans Susilo, SJ, selaku dosen pembimbing akademik yang selalu setia memberikan nasehat dan saran untuk penuslis dan selaku kepala perpustakaan yang telah menyediakan fasilitas dan kemudahan selama penulis kuliah 5. Bapak dan Ibu Dosen Prodi Matematika FST USD Yogyakarta yang telah memberikan bekal ilmu yang sangat berguna bagi penulis.
x
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6. Bapak Zaerilus Tukija dan Ibu Erma Linda Santyas Rahayu yang telah memberikan pelayanan administrasi dan urusan-urusan akademik kepada penulis selama masih kuliah. 7. Perpustakaan USD dan Staf yang telah memberikan fasilitas dan kemudahan kepada penulis. 8. Bapak dan Ibu tercinta: Bapak F. Ngatijan dan Ibu FM. Suryati yang selalu mendoakan penulis, memberikan dukungan yang tak pernah berhenti dalam segala hal. 9. Mas Robert Lujantoro, Mbak Chrispina Lidisia Dwinursari terima kasih karna kalian telah membuat persaudaraan ini indah dan penuh makna, semoga kita dapat selalu menjaganya walau jarak memisahkan kita. 10. Simbah Handoyo Hadisuasono Kakung dan Simbah Handoyo Hadisuasono Putri terima kasih atas doanya sehingga penulis dapat berhasil sampai sekarang ini. 11. Yohan Priyambodo yang telah memberikan seluruh perhatian, pengertian, waktu, kesabaran, nasehat, dan keceriaan buat penulis. Terima kasih pula atas support, doa yang tiada henti untuk penulis, saran, pengetahuan, kebersamaan dan hari-hari yang begitu indah yag telah diberikan kepada penulis. 12. Teman-teman Kost Pink “ Maria Yuli, Maria Pudyanti, Yulia Venty, Fransiska Septiana terima kasih buat kebersamaan kita. 13. Prisca Devi Yudistasari, Wuri Johana Fransisca, Yosepin Artiani, terima kasih atas persahabatan, kenangan, dukungan, semangat, dan perjalanan hidup yang sangat berarti yang kalian berikan untuk penulis.
xi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
14. Teman-teman Matematika angkatan 2005 yang sudah memberikan segala keceriaan dalam melewati kebersamaan selama di Matematika USD. Penulis juga tidak lupa mengucapkan terima kasih kepada semua pihak yang membantu penulis dalam penulisan makalah ini.
Yogyakarta,
Penulis
xii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR ISI
Halaman HALAMAN JUDUL .............................................................................
i
HALAMAN JUDUL (INGGRIS) ........................................................
ii
HALAMAN PERSETUJUAN PEMBIMBING..................................
iii
HALAMAN PENGESAHAN................................................................
iv
PERNYATAAN KEASLIAN KARYA................................................
v
HALAMAN PERSEMBAHAN.............................................................
vi
ABSTRAK..............................................................................................
vii
ABSTRACT............................................................................................
viii
PERNYATAAN PUBLIKASI KARYA ILMIAH..............................
ix
KATA PENGANTAR............................................................................
x
DAFTAR ISI ..........................................................................................
xiii
DAFTAR TABEL...................................................................................
xv
DAFTAR GAMBAR..............................................................................
xvi
DAFTAR LAMPIRAN...........................................................................
xvii
BAB I PENDAHULUAN ..................................................................
1
A.
Latar Belakang Masalah ...............................................
1
B.
Rumusan Masalah .........................................................
2
C.
Batasan Masalah ............................................................
3
D.
Tujuan Penulisan ...........................................................
3
E.
Metode Penulisan ...........................................................
3
F.
Manfaat Penulisan .........................................................
3
xiii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
G.
Sistematika Penulisan ....................................................
4
BAB II REGRESI LINEAR ................................................................
5
A. Metode Maksimum Likelihood.........................................
5
B. Model Regresi Linear Sederhana.....................................
6
C. Metode Kuadrat Terkecil........................................... ......
10
D. Metode Regresi Linear k-Variabel ........................... ......
14
E. Penaksiran Metode Kuadrat Terkecil k-Variabel... ......
16
F. Penaksiran Metode Maksimum Likelihood k-Variabel..
18
BAB III OUTLIER DAN REGRESI ROBUST……………….. …..
20
A. Outlier……………………………………………….. …..
20
B. Regresi Least Absolute Deviation (Regresi L)………..
31
C. M-Estimator……………………………………………..
32
D. Prosedur M-Estimasi……………………………………
36
BAB IV APLIKASI REGRESI ROBUST …………………………..
49
A. Ketenagakerjaan Baja Suatu Negara di Eropa pada tahun 1974 dan 1992…………………………..…..
49
B. Kerugian Penjualan Motor Bekas Suatu Dealer Motor……………………………………………………..
53
BAB V PENUTUP ………………………………………………..........
56
A. Kesimpulan………………………………………............
56
B. Saran……………………………………………………..
58
DAFTAR PUSTAKA …………………………………………………
59
LAMPIRAN……………………………………………………………
61
xiv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR TABEL
Halaman Tabel 3.1
Banyak barang terjual dan harga barang ................…………
24
Tabel 3.2
Kuartil dan Jangkauan.........................................……………
26
Tabel 3.3
Kuartil dan Jangkauan.........................................……………
28
Tabel 3.4
Banyak barang terjual dan harga barang ................…………
41
Tabel 3.5
Model regresi kuadrat terkecil dan model regresi robust........
42
Tabel 3.6
Bentuk kuadrat terkecil dan bentuk regresi robust ………....
43
Tabel 3.7
Banyak barang terjual dan harga barang ................…………
45
Tabel 3.8
Kuartil dan Jangkauan.........................................……………
45
Tabel 3.9
Model regresi kuadrat terkecil dan model regresi robust........
47
Tabel 3.10
Bentuk kuadrat terkecil dan bentuk regresi robust ………....
43
Tabel 4.1
Ketenagakerjaan suatu negara di Eropa tahun 1974 dan 1992
49
Tabel 4.2
Kerugian setiap penjualan motor bekas..................................
53
xv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR GAMBAR
Halaman Gambar 1.1
………………………………………………………………
2
Gambar 3.1a ………………………………………………………………
21
Gambar 3.1b ………………………………………………………………
22
Gambar 3.2a ………………………………………………………………
22
Gambar 3.2b ………………………………………………………………
23
Gambar 3.3
………………………………………………………………
24
Gambar 3.4
………………………………………………………………
25
Gambar 3.5
………………………………………………………………
26
Gambar 3.6a ………………………………………………………………
27
Gambar 3.6b ………………………………………………………………
27
Gambar 3.7a ………………………………………………………………
28
Gambar 3.7b ………………………………………………………………
29
Gambar 3.8a ………………………………………………………………
39
Gambar 3.8b ………………………………………………………………
39
Gambar 3.9
………………………………………………………………
39
Gambar 3.10 ………………………………………………………………
46
Gambar 4.1
………………………………………………………………
51
Gambar 4.2
………………………………………………………………
52
xvi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR LAMPIRAN
Halaman Lampiran A
………………………………………………………………
62
Lampiran B
………………………………………………………………
62
Lampiran C
………………………………………………………………
64
Lampiran D
………………………………………………………………
64
Lampiran E
………………………………………………………………
66
Lampiran F
………………………………………………………………
67
Lampiran G
………………………………………………………………
69
Lampiran H
………………………………………………………………
69
Lampiran I
………………………………………………………………
71
Lampiran J
………………………………………………………………
71
Lampiran K
………………………………………………………………
74
xvii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB I PENDAHULUAN
A.
Latar Belakang Masalah Dalam suatu pengamatan, misalkan Y simbol yang akan digunakan untuk
variabel tak bebas dan X simbol yang akan digunakan untuk variabel bebas, maka rumusan model regresi antara variabel Y dan X adalah: Υi = β 0 + β1Χ i1 + L + β p Χ ip + ε i
dengan: Υi = variabel tak bebas, i = 1,2, K , n Χ ij = variabel bebas, i = 1,2, K , n , j = 1,2,K, p
β = koefisien regresi Χ terhadap Υ
ε i = nilai error (galat)
Dalam regresi linear sederhana pendugaan parameter dapat menggunakan metode kuadrat terkecil, namun ketika distribusi dari ε i tidak normal atau adanya beberapa outlier yang berpengaruh pada model maka metode kuadrat terkecil tidak dapat digunakan karena penduga parameter akan menjadi bias. Oleh karena itu harus digunakan model regresi yang lain. Regresi robust adalah alat penting untuk menganalisa data yang dipengaruhi outlier sehingga dihasilkan model yang tidak terpengaruh oleh outlier. Menurut Staudte dan Snether (1990) outlier adalah suatu observasi yang jauh dari sebagian besar data. Pada regresi linear, outlier adalah pengamatan dengan nilai
1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 2
residual yang besar. Dalam Gambar 1.1 diperlihatkan sekumpulan data dengan titik yang keempat merupakan outlier.
Gambar 1.1. Regresi linear dengan satu outlier Dalam makalah ini metode yang akan dibahas untuk menduga parameter dari model regresi robust adalah M-Estimasi dengan fungsi bobot Huber. Fungsi Huber merupakan fungsi parabola di sekitar titik nol dan meningkat secara linear pada
u > a , dengan a adalah tuning konstan.
B.
Perumusan Masalah
Berdasarkan uraian yang dikemukakan dalam latar belakang diatas, pokok permasalahan dalam makalah ini dapat dirumuskan sebagai berikut: 1. Bagaimana mendeteksi data yang memuat outlier? 2. Apa penduga parameter dari regresi robust dengan M-Estimasi? 3. Bagaimanakah penyelesaian penduga parameter dari regresi robust dengan MEstimasi menggunakan fungsi bobot Huber?
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 3
C.
Batasan Masalah
Pembahasan masalah dalam makalah ini dibatasi pada pembahasan mengenai regresi robust yang digunakan untuk mendapatkan model regresi yang tidak terpengaruh outlier. Untuk menyelesaikan masalah ini akan diduga parameter regresi robust dengan M-Estimasi menggunakan fungsi bobot Huber dengan tuning konstan a = 1.345 . Pemilihan tuning konstan tidak akan dibahas dalam makalah ini. Dalam
makalah ini juga tidak akan dibahas tentang distribusi dari residual, dan sifat BLUE penduga parameter.
D.
Tujuan Penulisan
Tujuan penulisan makalah ini adalah: 1. Memahami outlier dan pendeteksian adanya outlier. 2. Menentukan regresi robust dengan M-Estimasi menggunakan funsi bobot Huber’s
E.
Metode Penulisan
Metode penulisan makalah ini menggunakan metode studi pustaka, yaitu menggunakan buku-buku, jurnal, makalah yang telah dipublikasikan dan dari internet, sehingga tidak ditemukan hal-hal yang baru. Untuk penyelesaian masalah akan digunakan program MATLAB.
F.
Manfaat Penulisan
1. Mendapatkan suatu penduga parameter yang dapat mengurangi pengaruh adanya outlier. 2. Mengetahui langkah kerja dari M-Estimasi menggunakan fungsi bobot Huber.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 4
G.
Sistematika Penulisan
Bab I pendahuluan berisi latar belakang masalah, perumusan masalah, batasan masalah, tujuan penulisan, metode penulisan, dan manfaat penulisan. Bab II berisi tentang model regresi linear sederhana dan regresi berganda, metode kuadrat terkecil, maximum likelihood. Bab III berisi tentang pengertian outlier dan cara pendeteksian adanya outlier, pengertian regresi robust, M-Estimasi, Huber’s M-Estimasi. Bab IV berisi kasus tentang model regresi robust yang akan diselesaikan dengan metode M-Estimasi menggunakan fungsi bobot Huber. Bab V berisi tentang kesimpulan dan saran.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB II REGRESI LINEAR
A. Metode Maksimum Likelihood Dari suatu pengamatan, sejumlah pendekatan dapat diambil untuk memperoleh suatu penduga. Salah satu metode untuk memperoleh sebuah penduga adalah metode maximum likelihood (ML). Misalkan (Χ1 , Χ 2 L, Χ n ) nilai yang diobservasi dalam suatu sampel random yang besarnya n . Maka fungsi likelihood sampel tersebut adalah L(β ) = f (Χ1 , Χ 2 ,L, Χ n ; β )
= f (Χ1; β )f (Χ 2 ; β )Lf (Χ n ; β ) n
= ∏ f (Χ i ; β )
(2.1)
i =1
dengan β adalah suatu parameter yang tidak diketahui. L(β ) adalah fungsi likelihood untuk β , dengan Χ1 , Χ 2 , L , Χ n tetap (fixed). Penduga Maximum Likelihood untuk parameter β adalah nilai βˆ yang memaksimumkan fungsi likelihood L(β ) .
Contoh 2.1: Suatu eksperimen Binomial terdiri dari n percobaan yang menghasilkan observasi (Χ1 , Χ 2 ,K, Χ i ,K, Χ n ) dengan Χi = 1 jika percobaan sukses dan Χ i = 0 jika percobaan gagal. Dengan menggunakan metode maximum likelihood carilah pˆ sebagai penduga dari parameter p. Jawab: L( p ) = p X (1 − p )
n− X
5
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 6
n
dengan X = ∑ Χi banyaknya sukses. Nilai pˆ dicari dengan menurunkan L( p ) terhadap i =1
p kemudian menyamakannya dengan nol. Untuk mencari turunan L( p ) lebih baik diambil lognya (ln = log dengan bilangan pokok e). ln L( p ) = X ln ( p ) + (n − X )ln(1 − p ) ⎛1⎞ ⎛ d ln L( p ) 1 ⎞ ⎟⎟ = X ⎜⎜ ⎟⎟ + (n − X )⎜⎜ − dp ⎝ p⎠ ⎝ 1− p ⎠ ⎛1⎞ ⎛ 1 ⎞ ⎟ 0 = X ⎜⎜ ⎟⎟ + (n − X )⎜⎜ − p p ⎟⎠ − 1 ⎝ ⎠ ⎝ X (n − X ) = p 1− p X (1 − p ) = (n − X ) p X − Xp = np − Xp np = X
Nilai p yang membuat L( p ) maksimum ialah p= =
X n
∑X
i
n
=X
dengan Χi = 1 jika percobaan sukses dan Χ i = 0 jika percobaan gagal. Jadi penduga parameter p dengan menggunakan metode maximum likelihood ialah p=
X n
B. Model Regresi Linear Sederhana Istilah regresi diperkenalkan oleh Francis Galton yang membandingkan tinggi badan anak laki-laki dengan tinggi badan ayahnya. Galton menunjukkan bahwa tinggi badan anak laki-laki dari ayah yang tinggi, setelah beberapa generasi cenderung mundur (regressed) mendekati tinggi rata-rata seluruh populasi. Dengan kata lain, anak laki-laki dari ayah yang badannya sangat tinggi cenderung lebih pendek daripada
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 7
ayahnya, sedangkan anak laki-laki dari ayah yang badannya sangat pendek cenderung lebih tinggi daripada ayahnya. Suatu fungsi dikatakan linear dalam parameter β jika β hanya dengan pangkat satu dan tidak dikalikan atau dibagi dengan parameter lain dan β berderajat satu. Suatu fungsi dikatakan linear dalam variabel X jika X hanya dengan pangkat satu dan tidak dikalikan atau dibagi dengan variabel lain dan f(X) merupakan fungsi polynomial berderajat satu. Dari penafsiran linearitas tersebut, linearitas dalam parameter dapat mengikuti perkembangan teori regresi. Jadi istilah regresi linear akan selalu berarti suatu regresi yang linear dalam parameter β , mungkin linear atau tidak dalam variabel yang menjelaskan X. Persamaan regresi adalah persamaan matematik yang memungkinkan untuk meramalkan nilai-nilai suatu variabel tak bebas dari nilai-nilai satu atau lebih variabel bebas. Beberapa contoh model regresi yang termasuk model regresi linear adalah 1. Υi = β 0 + β1Χ i + ε i 2. Υi = β 0 + β1
1 + εi Χi
3. Υi = β 0 + β1Χ i2 + ε i Suatu regresi akan membicarakan masalah pendugaan atau peramalan nilai variabel tak bebas Υ berdasarkan variabel bebas Χ . Variabel tak bebas diasumsikan bersifat statistik yaitu bahwa variabel tak bebas diambil dari sampel bukan dari populasi dan random yaitu suatu variabel yang nilainya ditentukan oleh hasil suatu eksperimen acak. Variabel bebas diasumsikan nir-stokastik (mempunyai nilai yang tetap dalam pengambilan sampel berulang) yaitu variabel bebas mengambil nilai yang sama dalam berbagai sampel.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 8
Model regresi dari pengamatan
(Χi , Υi ) dalam sampel akan memenuhi
persamaan Υi = β 0 + β1Χ i + ε i
(2.2)
dengan: Υi = variabel tak bebas, i = 1,2,K, n Χ i = variabel bebas, i = 1,2,K, n
β = koefisien regresi Χ terhadap Υ
ε i = nilai error (galat) Asumsi-asumsi regresi linear menurut Gauss: a. Model regresi adalah linear dalam parameter b. ε i berdistribusi normal untuk setiap i c. ε i mempunyai rata-rata 0 untuk setiap i d. Variansi dari ε i = σ 2 untuk semua xi (homokedastisitas) e. Kovariansi ε i dan ε j , i ≠ j adalah 0 f. Variabel-variabel bebas adalah variabel yang nir-stokastik (mempunyai nilai yang tetap) E (Χ i ) = Χ i , ∀i
Akibat dari asumsi d dan asumsi c yaitu: Var (ε i ) = σ 2 , ∀i
( ) = E (ε ) − 0
Var (ε i ) = E ε i − [E (ε i )] 2
σ2
( )
E εi = σ 2 2
2
i
2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 9
Asumsi e dikenal sebagai asumsi tidak adanya korelasi berurutan atau tidak ada autokorelasi (non autokorelasi). Asumsi ini mengakibatkan nilai E (ε i ) dan E (ε j ) saling bebas, hal ini ditunjukkan dalam penjabaran berikut ini:
(
) [ ( ( ))] = E [ε ε −ε E (ε ) − ε E (ε ) + E (ε )E (ε )] = E [ε ε −0 − 0 + 0] = E (ε ε ) = E (ε )E (ε )
Cov ε i ,ε j = E (ε i − E (ε i )) ε j − E ε j i
j
i
j
i
j
i
i
j
j
i
i
j
j
=0
Akibat dari asumsi f adalah: Υi berdistribusi normal untuk setiap i dengan nilai harapan dan variansi:
E (Yi ) = E (β 0 + β1Χ i + ε i )
= E (β 0 ) + E (β1Χ i ) + E (ε i ) = β 0 + β1Χ i + 0 = β 0 + β1Χ i
var(Yi ) = var(β 0 + β1Χ i + ε i )
= var(β 0 ) + var(β1Χ i ) + var(ε i ) = 0 + β 12 var(Χ i ) + σ 2
Bagian var(Χ i ) adalah
var(Χ i ) = E (Χ i − E (Χ i ))
2
= E (Χ i − Χ i )
2
= E (0) =0
2
Substitusikan var(Χ i ) = 0 ke Persamaan diatas menjadi var(Yi ) = 0 + β 12 ⋅ 0 + σ 2 =σ2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 10
C. Metode Kuadrat Terkecil
Metode kuadrat terkecil adalah suatu metode pendugaan parameter dengan n
∑ε
meminimumkan
2 i
(jumlah residual kuadrat) sehingga diperoleh penduga
i =1
parameter βˆ0 dan βˆ1 . Penduga (estimator) dalam pendugaan parameter tersebut adalah aturan bagaimana menghitung nilai dugaan (estimate) berdasarkan pengukuranpengukuran yang terdapat di dalam sampel. Persamaan penduga parameter dalam regresi linear sederhana adalah Υˆ i = βˆ0 + βˆ1Χ i
(2.3)
Dengan mengingat kembali model regresi linear Persamaan (2.2) dan persamaan penduga parameter Persamaan (2.3), dapat dicari suatu nilai residual ε yaitu selisih antara nilai Υ yang diamati dengan nilai Υ yang diduga, yang dapat dinyatakan sebagai berikut:
ε i = Υi −Υˆ i ε i = Υi − βˆ0 − βˆ1Χ i
(2.4)
Gauss dan Legendre (Plackett 1972 dan Stigler 1981) mengatakan bahwa penduga parameter βˆ0 dan βˆ1 dapat dicari dengan metode kuadrat terkecil yaitu: n
min βˆ
∑ε
2 i
(2.5)
i =1
Prinsip kuadrat terkecil memilih βˆ0 dan βˆ1 sedemikian rupa sehingga untuk suatu n
sampel tertentu
∑ε
2 i
sekecil mungkin.
i =1
Penduga parameter βˆ0 diperoleh dengan menurunkan
∑ (Υ − βˆ n
i
i =1
0
− βˆ1Χ i
)
2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 11
secara parsial terhadap βˆ0 dan menyamakan hasil yang diperoleh dengan nol sehingga didapat: n
∂ ∑ ε i2 i =1
∂βˆ0
=
(
∂ n Υi − βˆ0 − βˆ1Χ i ∑ ˆ ∂β 0 i =1 n
(
0 = −2∑ Υi − βˆ0 − βˆ1Χ i i =1
n
(
0 = ∑ Υi − βˆ0 − βˆ1Χ i i =1 n
n
n
i =1
i =1
i =1
)
2
)
)
0 = ∑ Υi − ∑ βˆ0 − ∑ βˆ1Χ i n
n
0 = ∑ Υi − nβˆ0 − βˆ1 ∑ Χ i i =1
i =1
n
n
i =1
i =1
n
n
nβˆ0 = ∑ Υi − βˆ1 ∑ Χ i
βˆ0 =
∑ Υi − βˆ1 ∑ Χi i =1
i =1
n n
βˆ0 =
∑Υ i =1
n
i
n
− βˆ1
∑Χ i =1
i
(2.6)
n
karena n
∑
n
Υi
i =1
n
= Υ dan
∑Χ i =1
n
i
=Χ
maka Persamaan (2.6) dapat ditulis dalam bentuk:
βˆ0 = Υ − βˆ1Χ
(2.7 )
Penduga parameter βˆ 1 diperoleh dengan menurunkan
∑ (Υ − βˆ n
i
0
− βˆ1Χ i
)
2
i =1
secara parsial terhadap βˆ1 dan menyamakan hasil yang diperoleh dengan nol sehingga didapat:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 12
n
∂ ∑ ε i2 i =1
∂βˆ1
=
∂ ∂βˆ
∑ (Υ − βˆ n
1 i =1
− βˆ1Χ i
0
i
)
2
(
n
0 = −2∑ Χ i Υi − βˆ0 − βˆ1Χ i i =1
n
(
0 = ∑ Χ i Υi − βˆ0 − βˆ1Χ i i =1
)
)
n
n
n
i =1
i =1
i =1
(2.8)
0 = ∑ Χ i Υi − βˆ0 ∑ Χ i − βˆ1 ∑ Χ i2 Dengan mensubstitusikan Persamaan (2.7 ) ke Persamaan (2.8) didapatkan:
(
n
)
n
n
0 = ∑ Χ i Υi − Υ − βˆ1Χ ∑ Χ i − βˆ1 ∑ Χ i2 i =1 n
n
i =1
i =1
i =1
i =1
n
n
0 = ∑ Χ i Υi − Υ ∑ Χ i + βˆ1Χ ∑ Χ i − βˆ1 ∑ Χ i2 i =1
i =1
⎛ ⎞ 0 = ∑ Χ i Υi − Υ ∑ Χ i + ⎜ Χ ∑ Χ i − ∑ Χ i2 ⎟ βˆ1 i =1 i =1 i =1 ⎝ i =1 ⎠ n
n
n
n
n n n ⎛ n ⎞ ⎜ Χ ∑ Χ i − ∑ Χ i2 ⎟ βˆ1 = −∑ Χ i Υi + Υ ∑ Χ i i =1 i =1 i =1 ⎝ i =1 ⎠
βˆ1 =
n
n
i =1 n
i =1 n
Υ ∑ Χ i − ∑ Χ i Υi Χ ∑ Χ i − ∑ Χ i2 i =1
i =1
n
n
n 1 Υ Χ − Χ i Υi ∑ i∑ i ∑ n i =1 i =1 i =1 ˆ β1 = n n 1 n Χ i ∑ Χ i − ∑ Χ i2 ∑ n i =1 i =1 i =1 n
βˆ1 =
n
i =1
i =1
i =1
2
n ⎛ n ⎞ ⎜ ∑ Χ i ⎟ − n∑ Χ i2 i =1 ⎝ i =1 ⎠ n
βˆ1 =
n
∑ Υi ∑ Χi − n∑ Χi Υi
n
n
n∑ Χ i Υi − ∑ Υi ∑ Χ i i =1
i =1
i =1
⎛ ⎞ n∑ Χ i2 − ⎜ ∑ Χ i ⎟ i =1 ⎝ i =1 ⎠ n
n
2
Dengan menyelesaikan bagian pembilang Persamaan (2.9) didapat:
(2.9)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 13
n
n
n
n
n
n
n
i =1
i =1
i =1
i =1
i =1
i =1
n
n
n
i =1
i =1
i =1
n∑ Χ i Υi − ∑ Υi ∑ Χ i = n∑ Χ i Υi − ∑ Υi ∑ Χ i + ∑ Υi ∑ Χ i − ∑ Υi ∑ Χ i i =1
n
n
n
= n∑ Χ i Υi − n∑ Υi i =1
∑Χ i =1
n
i =1
n
i
∑Υ
−n
i =1
i
n
n
n
∑ Χi + n2 i =1
n
∑Υ ∑Χ i =1
n
i
i =1
i
n
⎛ ⎞ = n⎜ ∑ Χ i Υi − Χ ∑ Υi − Υ ∑ Χ i + nΧΥ ⎟ i =1 i =1 ⎝ i =1 ⎠ n n n n ⎛ ⎞ = n⎜ ∑ Χ i Υi − ∑ ΧΥi −∑ ΥΧ i + ∑ ΧΥ ⎟ i =1 i =1 i =1 ⎝ i =1 ⎠ n
n
n
= n∑ (Χ i Υi − ΧΥi − ΥΧ i + ΧΥ ) n
i =1
= n∑ (Χ i − Χ )(Υi − Υ ) n
(2.10)
i =1
Dengan menyelesaikan bagian penyebut Persamaan (2.9) didapat: 2
2
n n ⎞ ⎛ n ⎞ ⎛ n ⎛ n ⎞ n∑ Χ i2 − ⎜ ∑ Χ i ⎟ = n∑ Χ i2 − 2⎜ ∑ Χ i ⎟ + ⎜ ∑ Χ i ⎟ i =1 i =1 ⎝ i =1 ⎠ ⎝ i =1 ⎠ ⎝ i =1 ⎠ n
n
= n∑ Χ i2 − 2n
∑Χ i =1
n
i =1
2
n
i
n
∑ Χi + n2
n
∑Χ ∑Χ
i =1
i
i =1
i =1
n
i
n
⎛ ⎞ = n⎜ ∑ Χ i2 − 2 Χ ∑ Χ i + nΧΧ ⎟ i =1 ⎝ i =1 ⎠ n n n ⎛ ⎞ = n⎜ ∑ Χ i2 − ∑ 2 ΧΧ i + ∑ ΧΧ ⎟ i =1 i =1 ⎝ i =1 ⎠ n
n
n
(
= n∑ Χ i2 − 2 ΧΧ i + Χ 2
)
i =1
= n∑ (Χ i − Χ ) n
(2.11)
2
i =1
Dengan mensubstitusikan Persamaan (2.10), dan (2.11) ke Persamaan (2.9) didapat penduga parameter βˆ1 sebagai berikut:
n∑(Χi − Χ)(Υi − Υ) n
βˆ1 =
i =1
n∑(Χi − Χ) n
i =1
2
(2.12)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 14
D. Model Regresi Linear k-Variabel Secara umum model regresi linear dua-tiga variabel, dapat ditulis sebagai model regresi linear k-variabel yang meliputi variabel tak bebas Y dan k − 1 variabel yang menjelaskan X 2 , X 3 ,K, X k dapat ditulis sebagai berikut: Yi = β1 + β 2 X 2i + β 3 X 3i + L + β k X ki + ε i
i = 1,2,3,K, N
(2.13)
dengan k = banyaknya variabel bebas
i = observasi ke-i N = besarnya populasi
Persamaan (2.13) adalah bentuk ringkas untuk sekumpulan N persamaan berikut:
Y1 = β1 + β 2 X 21 + β 3 X 31 + L + β k X k1 + ε1
Y2 = β1 + β 2 X 22 + β 3 X 32 + L + β k X k 2 + ε 2
KKKKKKKKKKKKKKKKK YN = β1 + β 2 X 2 N + β 3 X 3 N + L + β k X kN + ε N
(2.14)
Persamaan diatas dapat ditulis dengan cara lain yang lebih menjelaskan sebagai berikut:
⎡ Y1 ⎤ ⎡1 X 21 ⎢ Y ⎥ ⎢1 X 22 ⎢ 2⎥=⎢ ⎢ M ⎥ ⎢M M ⎢ ⎥ ⎢ ⎣YN ⎦ ⎣1 X 2 N Υ = N ×1
X 31 X 32 M X 3N X N ×k
L X k1 ⎤ ⎡ β1 ⎤ ⎡ ε 1 ⎤ L X k 2 ⎥⎥ ⎢⎢ β 2 ⎥⎥ ⎢⎢ ε 2 ⎥⎥ + M ⎥⎢ M ⎥ ⎢ M ⎥ ⎥⎢ ⎥ ⎢ ⎥ X kN ⎦ ⎣ β k ⎦ ⎣ε N ⎦ β + ε k ×1 N ×1
(2.15)
dengan Υ = vektor kolom N × 1 observasi atas variabel tak bebas Y X = matriks N × k yang memberikan N observasi atas k − 1 variabel X 2 L X k , kolom
pertama yang terdiri dari angka 1 menyatakan unsur intersep.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 15
β = vektor kolom k × 1 dari parameter yang tak diketahui β1 , β 2 ,K, β k
ε = vektor kolom N × 1 dari N gangguan (disturbance) ε i
Asumsi-asumsi dalam k-variabel secara umum sama seperti asumsi dalam model regresi linear sederhana dalam notasi matriks, yaitu: a. ε i berdistribusi normal b. E (ε i ) = 0 dimana ε i dan 0 adalah vektor kolom N × 1 , 0 merupakan vektor nol. c. Var(ε i ) = σ 2I dimana I adalah matriks identitas (identity matrix) N × N d. Cov(ε i , ε j ) = 0 e. Matriks X(N × k ) adalah nir-stokastik, yaitu terdiri dari sekelompok angka yang tetap f. Rank (Derajat) dari X adalah k (banyaknya kolom dalam X ) dan k lebih kecil dari N (banyaknya observasi). g. Tidak ada multikolinearitas sempurna yaitu tidak terdapat hubungan linear sempurna diantara variabel bebas Χ . Asumsi c dapat dijabarkan sebagai berikut: ⎡ ε1 ⎤ ⎢ε ⎥ E (ε i )E ′(ε i ) = E ⎢ 2 ⎥ E [ε 1 , ε 2 , K , ε N ] ⎢M ⎥ ⎢ ⎥ ⎣ε N ⎦ ⎡ ε 12 ε 1ε 2 L ε 1ε N ⎤ ⎢ ⎥ ε 2ε 1 ε 22 L ε 2ε N ⎥ ⎢ =E ⎢ M M M ⎥ ⎢ ⎥ ε N2 ⎦⎥ ⎣⎢ε N ε 1 ε N ε 2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 16
( )
⎡ E ε12 E (ε1ε 2 ) L E (ε1ε N )⎤ ⎥ ⎢ E (ε 2ε1 ) E ε 22 L E (ε 2ε N )⎥ ⎢ = ⎢ M M M ⎥ ⎥ ⎢ E ε N2 ⎦⎥ ⎣⎢ E (ε N ε1 ) E (ε N ε 2 )
( )
( )
⎡σ ⎢ 0 =⎢ ⎢M ⎢ ⎣⎢ 0
2
0
σ
2
L L
M 0
⎤ ⎥ ⎥ ⎥ 2⎥ σ ⎦⎥ 0 0 M
⎡1 0 L 0⎤ ⎢0 1 L 0 ⎥ ⎥ =σ 2⎢ ⎢M M M⎥ ⎥ ⎢ 1⎦ ⎣0 0 = σ 2I N × N Asumsi d ditunjukkan oleh unsur-unsur di luar diagonal utama pada matriks diatas.
E. Penaksiran Metode Kuadrat Terkecil dalam k-variabel Untuk mendapatkan penduga kuadrat terkecil dari β , mula-mula ditulis model regresi sampel k-variabel: Yi = βˆ1 + βˆ2 X 2i + βˆ3 X 3i + L + βˆk X ki + ε i
yang dapat ditulis secara ringkas dalam notasi matriks sebagai
Υ = Xβˆ + ε
(2.16)
dan dalam bentuk matriks adalah ⎡ Y1 ⎤ ⎡1 X 21 ⎢ Y ⎥ ⎢1 X 22 ⎢ 2⎥=⎢ ⎢ M ⎥ ⎢M M ⎢ ⎥ ⎢ ⎣YN ⎦ ⎣1 X 2 N Υ = N ×1
X
L X k1 ⎤ ⎡ β1 ⎤ ⎡ ε 1 ⎤ L X k 2 ⎥⎥ ⎢⎢ β 2 ⎥⎥ ⎢⎢ ε 2 ⎥⎥ + M ⎥⎢ M ⎥ ⎢ M ⎥ ⎥⎢ ⎥ ⎢ ⎥ X kN ⎦ ⎣ β k ⎦ ⎣ε N ⎦ β + ε
N ×k
k ×1 N ×1
X 31 X 32 M X 3N
Seperti dalam model dua-tiga variabel, dalam kasus k-variabel penduga kuadrat terkecil diperoleh dengan meminimumkan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 17
∑ ε = ∑ (Y − βˆ 2 i
dengan
∑ε
2 i
i
1
− βˆ2 X 2i − βˆ3 X 3i − L − βˆk X ki
)
2
(2.17)
adalah jumlah residual kuadrat. Dalam notasi matriks, ini sama dengan
meminimumkan ε′ε karena
ε′ε = [ε 1 ε 2
⎡ ε1 ⎤ ⎢ε ⎥ ε N ]⎢ 2 ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ε N ⎦
= ε 12 + ε 22 + L + ε N2 =
∑ε
2 i
dari (2.16) diperoleh ε = Υ − Xβˆ
(2.18)
Oleh karena itu,
(
)(
)
′ ε ′ε = Υ − Xβˆ Υ − Xβˆ = Υ ′Υ − 2βˆ ′X′Υ + βˆ ′X′Xβˆ
(2.19)
( )
′ Dengan sifat-sifat transpose suatu matriks, yaitu Xβˆ = βˆ ′X′ , dan karena βˆ ′X′Υ adalah
suatu skalar (suatu angka real), bentuk itu sama dengan transposenya Υ′βˆ X . Dari Persamaan (2.19) dengan aturan penurunan matriks, dan menyamakan hasil yang diperoleh dengan nol didapatkan: ∂ (ε′ε ) = −2X′Υ + 2X′Χβˆ ∂βˆ 0 = −2X′Υ + 2X′Χβˆ 2X′Χβˆ = 2X′Υ X′Χβˆ = X′Υ
(2.20)
Dalam Persamaan (2.20) besaran yang diketahui adalah (X′X ) dan X′Υ (perkalian silang antara variabel Χ dan Υ ) dan yang tidak diketahui adalah βˆ . Sekarang dengan menggunakan aljabar matriks, kalau invers dari (X′X ) ada, katakan (X′X )−1 , maka
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 18
dengan mengalikan di muka kedua sisi dari Persamaan (2.20) dengan invers ini, didapatkan:
(X′X )−1 (X′X )βˆ = (X′X )−1 X′Υ
(2.21)
Tetapi karena (X′X )−1 (X′X ) = I suatu matriks identitas derajat (order) k × k , maka didapatkan: −1 Iβˆ = (X′X ) X′Υ
atau −1 βˆ = (X′X ) X′Υ
(2.22)
F. Penaksiran Metode Likelihood dalam k-variabel
Pendugaan parameter model regresi linear sederhana dengan metode maksimum likelihood adalah sebagai berikut: Dengan mengingat kembali model regresi linear Persamaan (2.16), Y berdistribusi normal dengan rata-rata Xβˆ dan variansi σ 2 . Sebagai hasilnya fungsi likelihood L(β ) adalah L(β ) =
σN
(
1 2π
)
N
−
e
(
)(
′ 1 Υ − Xβˆ Υ − Xβˆ 2 σ2
) (2.23)
Pendugaan parameter βˆ diperoleh dengan menurunkan L(β ) terhadap βˆ dan menyamakan hasilnya dengan nol. Untuk memperoleh turunan L(β ) lebih baik diambil lognya (ln = log dengan bilangan pokok e), sehingga Persamaan (2.23) menjadi ⎛ 1 ⎜ ln L(β ) = ln⎜ ⎜ σ N 2π ⎝
(
⎛ = ln⎜ ⎜ ⎝
(
1 2π
)
N
)
N
−
e
(
)(
′ 1 Υ − Xβˆ Υ − Xβˆ 2 σ2
)⎞ ⎟ ⎟⎟ ⎠
⎛ − 1 (Υ − Xβˆ )′ (Υ − Xβˆ ) ⎞ ⎞ 1 ⎟ ⎜ ⎛ ⎞ σ2 ⎟ + ln⎜ ⎟ + ln⎜ e 2 N ⎟⎟ ⎟ ⎝σ ⎠ ⎜ ⎠ ⎠ ⎝
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 19
( ( (
)( )(
) )
′ N 1 ln 2π − N ln σ − Υ − Xβˆ Υ − Xβˆ ln e 2 2 2σ ′ N 1 Υ − Xβˆ Υ − Xβˆ = − ln 2π − N ln σ − 2 2 2σ N 1 Υ′Υ − 2βˆ ′X′Υ + βˆ ′X′Xβˆ = − ln 2π − N ln σ − 2 2σ 2
=−
)
Hasil penurunan ln L(β ) terhadap βˆ adalah
(
)
1 ⎛ N ⎞ Υ′Υ − 2βˆ ′X′Υ + βˆ ′X′Xβˆ ⎟ ∂⎜ − ln 2π − N ln σ − 2 ∂ ln L(β ) 2 2 σ ⎠ = ⎝ ∂βˆ ∂βˆ 1 0= − 2X′Υ + 2X′Χβˆ 2σ 2 1 0 = 2 − X′Υ + X′Χβˆ
(
σ
(
)
)
0 = − X′Υ + X′Χβˆ X′Χβˆ = − X′Υ
(2.24)
Dalam Persamaan (2.24) besaran yang diketahui adalah (X′X ) dan X′Υ (perkalian silang antara variabel Χ dan Υ ) dan yang tidak diketahui adalah βˆ . Sekarang dengan menggunakan aljabar matriks, kalau invers dari (X′X ) ada, katakan (X′X )−1 , maka dengan mengalikan di muka kedua sisi dari Persamaan (2.24) dengan invers ini, didapatkan:
(X′X )−1 (X′X )βˆ = (X′X )−1 X′Υ
(2.25)
Tetapi karena (X′X )−1 (X′X ) = I suatu matriks identitas derajat (order) k × k , maka didapatkan: −1 Iβˆ = (X′X ) X′Υ
atau −1 βˆ = (X′X ) X′Υ
(2.26)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB III OUTLIER DAN REGRESI ROBUST
Dalam suatu pengamatan, misalkan Y simbol yang akan digunakan untuk variabel bebas dan X simbol yang akan digunakan untuk variabel tak bebas, maka rumusan model regresi antara variabel Y dan X adalah:
Υi = β 0 + β1 Χ i1 + L + β p Χ ip + ε i
(3.1)
Menurut asumsi regresi linear ε i berdistribusi normal, namun ketika distribusi dari ε i tidak normal atau adanya beberapa outlier yang berpengaruh pada model, maka penduga kuadrat terkecil menjadi bias sehingga kurang tepat untuk menduga parameter-parameter dalam model regresi tersebut. Oleh karena itu dibutuhkan suatu model regresi dengan parameter-parameter yang tidak terpengaruh oleh outlier. Metode pendekatan alternatif yang berguna untuk mencari parameter-parameter dalam model regresi tersebut adalah regresi robust. Regresi robust yang diperkenalkan oleh Andrews (1972) adalah alat penting untuk menganalisa data yang dipengaruhi oleh outlier sehingga dihasilkan model yang tidak terpengaruh oleh outlier.
A. Outlier Menurut Staudte dan Snether (1990) outlier adalah suatu observasi yang jauh dari sebagian besar data. Pada regresi linear, outlier adalah pengamatan dengan nilai residual yang besar. Munculnya outlier dapat membuat penduga kuadrat terkecil menjadi bias. Munculnya outlier dikarenakan adanya kesalahan dalam memasukkan data, kesalahan pengukuran, analisis, atau kesalahan-kesalahan lainnya. Keberadaan data yang 20
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 21
mengandung outlier akan mengganggu proses analisa data dan harus dihindari dalam banyak hal. Dalam kaitannya dengan analisa regresi, outlier dapat menyebabkan hal-hal berikut : 1. Residual yang besar dari model yang terbentuk atau E (ε i ) ≠ 0 2. Variansi pada data tersebut menjadi lebih besar 3. Taksiran interval memiliki rentang yang lebar Permasalahan dengan data yang memuat outlier adalah: 1. Permasalahan dengan outlier di sumbu y Andaikan (Χ1 , Υ1 ),L, (Χ 5 , Υ5 ) suatu pengamatan sampel dengan suatu garis L yang diperlihatkan dalam Gambar 3.1a. Jika terdapat kesalahan dalam memasukkan data, misalnya nilai Υ4 tinggi yang akan menyebabkan adanya outlier. Maka Gambar 3.1a akan berubah seperti yang diperlihatkan dalam Gambar 3.1b yaitu titik yang keempat menjauh dari posisi aslinya (ditandai oleh lingkaran garis putus-putus). Titik ini disebut suatu outlier di sumbu y, yang mempunyai suatu pengaruh besar dengan garis L, yang sungguh berbeda dari garis L di dalam Gambar 3.1a.
Gambar 3.1. (a) Regresi linear dengan lima data
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 22
Gambar 3.1. (b) Regresi linear dengan satu outlier di sumbu y. 2. Permasalahan dengan outlier di sumbu x Andaikan (Χ1 , Υ1 ), L , (Χ 5 , Υ5 ) suatu pengamatan sampel dengan suatu garis L
yang diperlihatkan dalam Gambar 3.2a. Jika terdapat kesalahan dalam memasukkan data, misalnya nilai Χ1 tinggi yang akan menyebabkan adanya outlier. Maka Gambar 3.2a akan berubah seperti yang diperlihatkan dalam Gambar 3.2b yaitu titik yang pertama menjauh dari posisi aslinya (ditandai oleh lingkaran garis putus-putus). Titik ini disebut suatu outlier di sumbu x, yang mempunyai suatu pengaruh besar dengan garis L, yang sungguh berbeda dari garis L di dalam Gambar 3.2a.
Gambar 3.2. (a) Regresi linear dengan lima data.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 23
Gambar 3.2. (b) Regresi linear dengan satu outlier di sumbu x. Untuk mendeteksi suatu data yang memuat outlier dan menentukan batasan outlier dalam sebuah analisa, akan digunakan 3 metode estimasi yaitu: 1. Metode Grafis (Scatter-plot) Untuk melihat apakah terdapat outlier pada data, dapat dilakukan dengan memplot data. Selain itu, jika sudah didapatkan model regresi maka dapat dilakukan dengan cara memplot antara residual ( ε ) dengan nilai prediksi Υˆ . Jika terdapat satu atau beberapa data yang terletak jauh dari pola kumpulan data keseluruhan maka hal ini mengindikasikan adanya outlier. Metode ini mempunyai kelemahan yaitu keputusan bahwa suatu data merupakan outlier sangat bergantung pada peneliti, karena hanya mengandalkan visualisasi grafis, untuk itu dibutuhkan seseorang yang ahli dan berpengalaman dalam menginterpretasikan gambar tersebut.
Contoh 3.1
Sebuah toko memiliki rincian banyaknya barang yang terjual beserta harganya yang disajikan dalam Tabel 3.1. Dengan X = banyaknya barang yang terjual dan Y = harga barang (dalam ribuan)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 24
Tabel 3.1. Banyak barang yang terjual dan harga barang Observasi 1 2 3 4 5 6 7
X 18 16 15 12 10 7 6
Y 770 785 790 800 810 825 830
Dengan menggunakan Metode Grafis (Scatter-plot), tentukan apakah data tersebut memuat outlier? Jawab: Melalui metode grafis akan diuji apakah data memuat outlier. Dengan menggunakan SPSS, scatter-plot antara nilai X dengan nilai Y ditunjukkan dalam Gambar 3.3. Gambar 3.3. Scatter-plot 830.00
820.00
Y
810.00
800.00
790.00
780.00
770.00
6.00
8.00
10.00
12.00
14.00
16.00
18.00
X
Dari Gambar 3.3. terlihat bahwa tidak ada data yang jauh dari pola kumpulan data keseluruhan. Jadi data tersebut tidak memuat outlier.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 25
Contoh 3.2
Menggunakan Contoh 3.1 dengan mengganti jumlah barang yang terjual pada observasi ke-6 dengan nilai 30. Dengan menggunakan Metode Grafis (Scatter-plot), tentukan apakah data tersebut memuat outlier? Jawab: Melalui metode grafis akan diuji apakah data memuat outlier. Dengan menggunakan SPSS, scatter-plot antara nilai X dengan nilai Y ditunjukkan dalam Gambar 3.4. Gambar 3.4. Scatter-plot 830.00
820.00
Y
810.00
800.00
790.00
780.00
770.00
5.00
10.00
15.00
20.00
25.00
30.00
X
Dari Gambar 3.4. terlihat bahwa data pada observasi ke-6 jauh dari pola kumpulan data keseluruhan. Jadi data tersebut memuat outlier. 2. Boxplot Metode ini merupakan metode yang paling umum yaitu dengan menggunakan nilai kuartil dan jangkauan. Kuartil 1, 2, dan 3 akan membagi sebuah urutan data menjadi empat bagian. Jangkauan (IQR, Interquartile Range) didefinisikan sebagai selisih kuartil satu terhadap kuartil 3, atau IQR = Q3 – Q1. Dalam Gambar 3.5 diberikan skema identifikasi outlier menggunakan IQR atau boxplot. Outlier terletak
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 26
pada nilai yang kurang dari 1.5*IQR terhadap kuartil 1 dan nilai yang lebih dari 1.5*IQR terhadap kuartil 3. Gambar 3.5. Skema identifikasi outlier menggunakan IQR atau boxplot
Contoh 3.3
Dengan menggunakan Boxplot, tentukan apakah data pada Contoh 3.1 memuat outlier? Jawab: Untuk keperluan ini terlebih dahulu dihitung nilai kuartil (Q) 1, 2, dan 3 serta jangkauan (IQR, Interquartile Range) seperti yang tercantum dalam Tabel 3.2 Tabel 3.2. Kuartil dan jangkauan
Q1 Q2 Q3 IQR 1.5*IQR
X 7 12 16 9 13.5
Y 785 800 825 40 60
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 27
Dari Tabel 3.2. outlier terletak pada daerah X < -6.5 dan X > 29.5 atau Y < 725 dan Y > 885. Karena nilai X pada data berada pada nilai -6.5 < X < 29.5 dan nilai Y pada data berada pada nilai 725 < Y < 885, maka dapat disimpulkan bahwa data tersebut tidak memuat outlier. Dengan menggunakan SPSS yang disajikan dalam boxplot akan tampak seperti Gambar 3.6a. dan Gambar 3.6b. 18.00
16.00
14.00
12.00
10.00
8.00
6.00
X
Gambar 3.6a. Boxplot untuk variabel X
830.00
820.00
810.00
800.00
790.00
780.00
770.00
Y
Gambar 3.6b. Boxplot untuk variabel Y Dari Gambar 3.6a. maupun Gambar 3.6b. terlihat tidak ada data yang berada di daerah outlier. Jadi data tersebut tidak memuat outlier.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 28
Contoh 3.4
Dengan menggunakan Boxplot, tentukan apakah data pada Contoh 3.2 memuat outlier? Jawab: Untuk keperluan ini terlebih dahulu dihitung nilai kuartil (Q) 1, 2, dan 3 serta jangkauan (IQR, Interquartile Range) seperti yang tercantum dalam Tabel 3.3 Tabel 3.3. Kuartil dan jangkauan
Q1 Q2 Q3 IQR 1.5*IQR
X 10 15 18 8 12
Y 785 800 825 40 60
Dari Tabel 3.3. outlier terletak pada daerah X < -2 dan X > 30 atau Y < 725 dan Y > 885. Karena nilai X pada observasi ke-6 yaitu X = 30 berada pada daerah outlier maka data tersebut memuat outlier di sumbu X. Dengan menggunakan SPSS yang disajikan dalam boxplot akan tampak seperti Gambar 3.7a. dan Gambar 3.7b. 6 30.00
25.00
20.00
15.00
10.00
5.00
X
Gambar 3.7a. Boxplot untuk variabel X
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 29
830.00
820.00
810.00
800.00
790.00
780.00
770.00
Y
Gambar 3.7b. Boxplot untuk variabel Y Dari Gambar 3.7a. terlihat bahwa data pada observasi ke-6 berada di daerah outlier. Jadi data tersebut memuat outlier di sumbu X. 3. Residual yang distudentkan (Studentized Residual) Umumnya outlier dipengaruhi oleh pengamatan (Υi , X i ) pada penduga kuadrat terkecil yang tergantung pada Υi yang terlalu besar atau terlalu kecil dibandingkan dengan nilai X i . Suatu metode yang sederhana dan efektif untuk mendeteksi outlier adalah analisis residual. Residual banyak memegang peranan penting dalam pengujian model regresi karena residual itu sendiri merupakan sisa pada suatu pengamatan. Residual ke-i didefinisikan sebagai berikut:
ε i = Υi − Υˆ i Umumnya pengamatan yang dicurigai sebagai outlier dikategorikan ke dalam pelanggaran asumsi. Maka lebih tepat jika digunakan analisis residual. Untuk mendeteksi apakah terdapat outlier atau tidak, dapat dilakukan dengan menghitung nilai
ε is sebagai berikut: ε is =
εi s 1 − hi
(3.2)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 30
dengan: n
s = 2
∑ε i =1
2 i
n− p
p adalah banyaknya parameter hi (nilai laverage) adalah ukuran seberapa jauh xi menyimpang dari nilai rata-rata X . Andaikan H matriks orthogonal dari X , dengan elemen diagonalnya h1 , K , hn adalah nilai leverage dari
x1 , K , xn . Matriks
H
memenuhi
H = X′(X′X ) X −1
dan
hi = xi′ (X′X ) xi . −1
Jika ε is > 2 atau ε is < −2 untuk data kecil (n < 30 ) dan ε is > 3.5 atau ε is < −3.5 untuk data besar (n ≥ 30 ) maka data mengandung outlier.
Contoh 3.5 Dengan menggunakan studentized residual, tentukan apakah data pada Contoh 3.1 memuat outlier? Jawab: Dari M-file pada program MATLAB yang ditunjukkan dalam Lampiran A diperoleh nilai
hi = [0.4286 0.2698
0.2143 0.1429 0.1746 0.3413 0.4286] T
ε i = [-3.0952 2.4603 2.7381 -1.4286 -0.8730 -0.0397 0.2381] T s = 2.2800 dengan memasukkan nilai hi , ε i , dan s ke Persamaan (3.2) diperoleh nilai studentized residual sebagai berikut:
ε is = [-1.7959 1.2628 1.3548 -0.6768 -0.4215 -0.0214 0.1381] T
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 31
Karena nilai studentized residual dari data adalah − 2 < ε is < 2 maka dapat diyatakan bahwa data tidak memuat outlier.
Contoh 3.6 Dengan menggunakan studentized residual, tentukan apakah data pada Contoh 3.2 memuat outlier? Jawab: Dari M-file pada program MATLAB yang ditunjukkan dalam Lampiran B diperoleh nilai
hi = [0.1639 0.1443
0.1431 0.1738 0.2228
0.7625 0.3896] T
ε i = [-31.0180 -16.3205 -11.4718 -1.9256 7.7719 25.7972 27.1668] T s = 23.7812 dengan memasukkan nilai hi , ε i , dan s ke Persamaan (3.2) diperoleh nilai studentized residual sebagai berikut:
ε is = [-1.4265 -0.7419 -0.5221 -0.0891 0.3707 2.2258 1.4622] T Karena studentized residual dari data observasi ke-6 adalah 2.2258 > 2 maka dapat dinyatakan bahwa data memuat outlier.
B. Regresi Least Absolute Deviation (Regresi L) Ketika error diasumsikan tidak normal, maka pendugaan parameter β menggunakan metode maximum likelihood dengan kriteria selain kuadrat terkecil. Sebagai contoh andaikan error ε i , i = 1,2, L , n saling bebas dan berdistribusi double
exponensial
f (ε i ) =
1 − εi e 2σ
σ
(3.3)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 32
Fungsi densitas double exponensial mempunyai puncak tertinggi
1 pada ε i = 0 dan 2σ
ε i dapat bernilai negatif atau positif. Maka prinsip maximum likelihood untuk penduga
β akan meminimumkan: n
∑ε i =1
i
yaitu jumlah harga mutlak residual, ini dinamakan regresi L1 , sedangkan metode maximum likelihood dengan kriteria kuadrat terkecil dengan distribusi error
(
f (ε i ) = 2πσ 2
)−1 2 e−ε 2 2σ 2
(3.4)
meminimumkan n
∑ εi
2
i =1
yaitu jumlah kuadrat error, kuadrat terkecil diberi nama regresi L2 . Ada juga metode regresi L p yang meminimumkan n
∑ εi
p
i =1
C. M-ESTIMATOR M-Estimator adalah tipe penduga maximum likelihood. Andaikan error berdistribusi sesuai dengan distribusi fungsi f (ε ) , maka penduga maximum likelihood (MLE) dari β yang ditulis dengan βˆ memaksimumkan besarnya n
∏ f (Yi − x′i β )
i =1
(3.5)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 33
dengan x′i adalah baris ke i dari Χ, i = 1,2, L , n pada model Υ = Χβ + ε. Jika arg max adalah nilai yang memaksimumkan suatu fungsi, maka pernyataan diatas dapat ditulis sebagai ⎛ n ⎞ βˆ = arg max⎜⎜ ∏ f (Yi − x′i β )⎟⎟ ⎝ i =1 ⎠
(3.6)
Jika fungsi densitas f (ε ) selalu bernilai positif yaitu lim f (ε ) > 0 , dan fungsi ε →∞
ln adalah fungsi yang meningkat, maka untuk memaksimumkan f (ε ) sama halnya dengan memaksimumkan ln f (ε ) , sehingga diperoleh ⎡ ⎛ n ⎞⎤ βˆ = arg max ⎢ln⎜ ∏ f (Yi − x′i β )⎟⎥ ⎟⎥ ⎢⎣ ⎜⎝ i = 1 ⎠⎦ = arg max[ln f (Yi − x′iβ ) ⋅ f (Yi − x′iβ ) ⋅ L f (Yi − x′i β )] = arg max[ln f (Yi − x′iβ ) + ln f (Yi − x′iβ ) + L + ln f (Yi − x′i β )] ⎡ n ⎤ = arg max ⎢ ∑ ln f (Yi − x′iβ )⎥ ⎢⎣i = 1 ⎥⎦
(3.7 )
Jika error berdistribusi normal maka Persamaan 3.7 dapat ditulis sebagai berikut:
(
)
⎡n ⎛ 2 ⎞⎤ −1 ′ 2 βˆ = arg max ⎢ ∑ ln⎜ 2πσ 2 2 e−(Yi − xi β ) 2σ ⎟⎥ ⎟⎥ ⎢⎣i =1 ⎜⎝ ⎠⎦ n⎛ 2⎞ −1 ′ 2 = arg max ∑ ⎜ ln 2πσ 2 2 + ln e −(Yi − xi β ) 2σ ⎟ ⎟ i =1⎜⎝ ⎠ n⎛ 1 ⎞ = arg max ∑ ⎜ − ln 2πσ 2 + − (Yi − x′iβ )2 2σ 2 ln e ⎟ ⎠ i =1⎝ 2
(
)
(
)(
(
)
(
)
n⎛ 1 (Y − x′ β )2 ⎞⎟ = arg max ∑ ⎜ − ln 2πσ 2 − i 2i ⎟ 2σ i =1⎜⎝ 2 ⎠ ⎡n 1 n ⎛ (Y − x′ β )2 ⎞⎤ ⎟⎥ = arg max ⎢ ∑ − ln 2πσ 2 + ∑ ⎜ − i 2i ⎜ ⎟⎥ 2 σ ⎢⎣i =1 2 i =1⎝ ⎠⎦
)
(3.8)
Jika σˆ 2 adalah penduga untuk σ 2 , maka nilai tersebut dianggap konstan. Karena nilai ⎤ ⎡ 1 ∑ ⎢⎣− 2 ln(2πσ )⎥⎦ n
2
i =1
dan 2σ 2 merupakan nilai konstan yang akan hilang dalam proses
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 34
pendiferensialan maka untuk memaksimumkan penduga βˆ nilai tersebut dapat diabaikan sehingga ⎡ n 2⎤ βˆ = arg max ⎢ − (Yi − x′i β ) ⎥ ⎦ ⎣ i =1
∑
Jika
arg
min
adalah
nilai
yang
meminimumkan
(3.9) suatu
fungsi,
maka
arg max f ( x ) = arg min[− f ( x )] , sehingga diperoleh
⎡ ⎛ n ⎞⎤ βˆ = arg min ⎢− ⎜⎜ ∑ − (Yi − x′iβ )2 ⎟⎟⎥ ⎠⎦ ⎣ ⎝ i =1 ⎞ ⎛ n = arg min⎜⎜ ∑ (Yi − x′iβ )2 ⎟⎟ ⎠ ⎝ i =1
(3.10)
Jadi penduga βˆ untuk distribusi normal meminimumkan n
2 ∑ (Yi − x′i β )
i =1
(3.11)
Jika error berdistribusi tidak normal, maka pendugaan β mengikuti selain distribusi normal, andaikan error berdistribusi double exponensial maka Persamaan 3.7 dapat ditulis sebagai berikut: ⎡n − Y − x′ β σ ⎞ ⎤ βˆ = arg max ⎢ ∑ ln⎛⎜ (2σ )−1e i i ⎟⎥ ⎠⎦ ⎣i =1 ⎝ ⎡n − Y − x′ β σ ⎞ ⎤ = arg max ⎢ ∑ ⎛⎜ ln (2σ )−1 + ln e i i ⎟⎥ ⎠⎦ ⎣i =1⎝ ⎡n ⎤ = arg max ⎢ ∑ (− ln (2σ ) + (− Yi − x′iβ σ )ln e )⎥ ⎣i =1 ⎦ ⎡n Y − x′iβ ⎤ = arg max ⎢ ∑ − ln (2σ ) − i σ ⎥⎦ ⎣i =1 n ⎛ Y − x′ β ⎞ ⎤ ⎡n i ⎟ = arg max ⎢ ∑ (− ln(2σ )) + ∑ ⎜⎜ − i ⎟⎥ σ i =1⎝ ⎠⎦⎥ ⎣⎢i =1
(3.12)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 35
Jika σˆ adalah penduga untuk σ maka nilai tersebut dianggap konstan. Karena nilai n
∑ [− ln(2σ )] dan σ
i =1
merupakan nilai konstan yang akan hilang dalam proses
pendiferensialan maka untuk memaksimumkan penduga βˆ nilai tersebut dapat
diabaikan sehingga ⎡ n ⎤ βˆ = arg max ⎢ − Yi − x′i β ⎥ ⎣ i =1 ⎦
∑
⎡ ⎛ n ⎞⎤ = arg min ⎢− ⎜⎜ − Yi − x′i β ⎟⎟⎥ ⎠⎦⎥ ⎣⎢ ⎝ i =1
∑
⎛ n ⎞ = arg min⎜⎜ Yi − x′i β ⎟⎟ ⎝ i =1 ⎠
∑
(3.13)
Jadi penduga βˆ untuk distribusi double eksponensial meminimumkan n
∑ Yi − x′i β
(3.14)
i =1
Gagasan ini dapat diperluas, andaikan ρ (u ) adalah suatu fungsi untuk u dan σ Y − x′ β adalah penduga parameter skala, dengan u = i i , dan ρ = − ln f (ε ) maka Persamaan σ
(3. 7) menjadi
(
)
⎡ n ⎤ βˆ = arg max ⎢ ∑ − ρ Y − x′ β ⎥ i i ⎥ ⎢⎣i = 1 ⎦ n ⎡ ⎛ ⎞⎤ = arg min ⎢− ⎜ ∑ − ρ (Yi − x′iβ )⎟⎥ ⎠⎦ ⎣ ⎝ i =1 n ⎡ ⎤ = arg min ⎢∑ ρ (Yi − x′iβ )⎥ ⎣ i =1 ⎦ sehingga dapat didefinisikan suatu penduga βˆ yang meminimumkan n
⎛ Yi − x′i β ⎞ ⎟ σ ⎠
∑ ρ ⎜⎝
i =1
dengan
(3.15)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 36
σ = med
⎛ ε ⎞ ε − med⎜⎜ ⎟⎟ 0,6745 1− h ⎝ 1− h ⎠
⎧ ε n +1 ⎪ 2 ⎪ ⎪ ⎪ dengan med(ε i ) = ⎨ ⎛ ⎞ ⎟ ⎪ ⎜⎜ ⎟ ⎜ ⎟ ⎪ 1 ⎜ε + ε ⎟ ⎜ ⎟ n n ⎪2⎜ ⎟ 1 + ⎟ ⎪ ⎜⎝ 2 2 ⎠ ⎩
untuk n gasal
untuk n genap
Dapat dilihat jika ρ (u ) = u 2 maka kriteria meminimumkan sama dengan Persamaan 3.11, jika ρ (u ) = u maka kriteria meminimumkan sama dengan Persamaan 3.14. Dalam kasus yang specifik ini, ρ (u ) dan distribusi dasar saling terkait. Untuk selanjutnya ρ (u ) akan menggunakan fungsi Huber’s
⎧ 1 2 ⎪⎪ 2 u ρ (u ) = ⎨ ⎪ a u − 1 a2 ⎪⎩ 2
untuk u ≤ a (3.16) untuk u > a
dengan a adalah tuning konstan. Tuning konstan a dalam regresi robust menentukan kerobustan dan efisiensi. Tuning konstan dipilih untuk memberikan variansi asimtotik sehingga didapat effisiensi asimtotik pada distribusi normal. Dengan menggunakan efisiensi asimtotik 95% pada distribusi normal standar diperoleh tuning konstan a = 1.345. Pembahasan tuning konstan tidak dibahas secara mendalam.
D. Prosedur M-Estimasi Estimasi-M meminimumkan penduga β Persamaan (3.15). Jika fungsi pada Persamaan 3.15 diturunkan secara parsial terhadap parameter β j , j = 0,1,2, K , k dan menyamakan hasilnya dengan nol menghasilkan p = k + 1 persamaan berikut
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 37
⎛ Yi − x′i β ⎞ ⎟ = 0, σˆ ⎠
n
∑ x ψ ⎜⎝ ij
i =1
j = 0,1,2, K , k
(3.17)
dengan ψ (u ) = ∂ρ ∂u dan xij adalah entri ke-j dari x′i = (1, xi1, xi 2 , K , xik , ) . Didefinisikan suatu fungsi bobot yaitu:
wiβ =
ψ (Yi − x′i β σˆ ) , Yi − x′i β σˆ
i = 1,2,K, n
(3.18)
Maka bagian kiri dari Persamaan (3.17) dapat ditulis ⎛ Yi -x′i β ⎞ n ⎛ Y -x′β ⎞⎛ Y − x′i β σˆ ⎞ ⎟⎟ x ψ ⎟ = ∑ xij ψ ⎜ i i ⎟⎜⎜ i ∑ ij ⎜ ⎝ σˆ ⎠ i=1 ⎝ σˆ ⎠⎝ Yi − x′i β σˆ ⎠ i =1 ψ (Yi − x′i β σˆ ) 1 n (Yi -x′i β ) = ∑ xij Yi − x′i β σˆ σˆ i=1 n
= =
1 σˆ 1 σˆ
n
∑ x w β (Y -x′β ) i =1
ij
i
i
i
n
∑ xij wiβ Yi − i =1
1 σˆ
n
∑ x w β x′β i =1
ij
i
i
(3.19)
Masukkan Persamaan 3.19 ke Persamaan 3.17 diperoleh n
n
i =1 n
i =1 n
∑ xij wiβ Yi − ∑ xij wiβ x′iβ = 0 ∑ xij wiβ x′iβ = ∑ xij wiβ Yi , j = 0,1,2,K, k
i =1
i =1
(3.20)
Bagian kiri dari Persamaan 3.20 dalam bentuk matriks adalah ⎡ x11 ⎢x ⎢ 21 ⎢ M ⎢ ⎣ xn1
x12 L x1k ⎤ ⎡ w1 x22 L x2k ⎥⎥ ⎢⎢ 0 M M ⎥⎢ M ⎥⎢ xn 2 L xnk ⎦ ⎣ 0
0 ⎤ ⎡ x11 0 ⎥⎥ ⎢⎢ x12 M ⎥⎢ M ⎥⎢ L wn ⎦ ⎣ x1k
0 L w2 L M 0
x21 L xn1 ⎤ ⎡ β1 ⎤ x22 L xn 2 ⎥⎥ ⎢⎢ β 2 ⎥⎥ M M ⎥⎢ M ⎥ ⎥⎢ ⎥ x2k L xnk ⎦ ⎣ β n ⎦
(3.21)
Bagian kanan dari Persamaan 3.20 dalam bentuk matriks adalah ⎡ x11 ⎢x ⎢ 21 ⎢ M ⎢ ⎣ xn1
x12 x22 M xn 2
L x1k ⎤ ⎡ w1 L x2 k ⎥⎥ ⎢⎢ 0 M ⎥⎢ M ⎥⎢ L xnk ⎦ ⎣ 0
0 w2 M 0
0 ⎤ ⎡Y11 Y12 L Y1k ⎤ L 0 ⎥⎥ ⎢⎢Y21 Y22 L Y2 k ⎥⎥ M M ⎥ M ⎥⎢ M ⎥⎢ ⎥ L wn ⎦ ⎣Yn1 Yn 2 L Ynk ⎦ L
(3.22)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 38
Dengan memasukkan Persamaan 3.21 dan 3.22 ke Persamaan 3.20 dalam bentuk matriks dapat ditulis sebagai berikut
Χ′Wβ Χβ = Χ′Wβ Υ
(3.23)
dengan Wβ adalah matriks diagonal n × n dari bobot, dengan elemen-elemen diagonal
(w1β , w2β ,K , wnβ ) . Persamaan ini dikenal sebagai persamaan normal kuadrat terkecil terboboti. Jika invers dari
(Χ′W Χ) β
ada, katakanlah
(Χ′W Χ)
−1
β
,
maka dengan
mengalikan di muka kedua sisi dari (3.23) dengan invers ini didapatkan
(Χ′W Χ) (Χ′W Χ)β = (Χ′W Χ) Iβ = (Χ′W Χ ) β = (Χ′W Χ ) −1
β
β
−1
Χ′Wβ Υ
−1
Χ′Wβ Υ
−1
Χ′Wβ Υ
β β β
(3.24)
Dalam makalah ini Wβ menggunakan bobot kriteria Huber’s. Fungsi bobot Huber’s dapat dicari dengan menurunkan fungsi ρ (u ) Persamaan 3.16 terhadap u, sehingga diperoleh: ⎧ u ⎪ ψ (u ) = ⎨ ⎪ a sgn (u ) ⎩
dengan ψ (u ) =
untuk u ≤ a untuk u > a
du ∂ρ dan sgn (u ) = dimana ∂u du
⎧ −1 ⎪ ⎪ sgn (u ) = ⎨ 0 ⎪ ⎪ ⎩1
jika u < 0 jika u = 0 jika u > 0
Fungsi ρ (u ) dan ψ (u ) Huber disajikan dalam gambar 3.8
(3.25)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 39
Gambar 3.8.a. Fungsi ρ (u ) Huber
1.0 0.5 PSI 0.0 0.5 1.0
3
2
1
1
0
2
3
U
Gambar 3.8.b. Fungsi ψ (u ) Huber Berdasarkan Persamaan (3.18) yaitu Wβ =
ψ (u ) u
, dengan u =
Yi − x′iβ σˆ
maka
fungsi bobot huber’s adalah ⎧ 1 ⎪ ⎪ Wβ = ⎨ a ⎪ ⎪⎩ u
dengan
untuk u ≤ a untuk u > a
1 d (sgn (u )) = u du
Fungsi bobot Huber disajikan dalam gambar 3.9
Gambar 3.9. Fungsi bobot Huber
(3.26)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 40
Fungsi bobot Huber’s merupakan sebuah matriks diagonal (w1β , w2 β ,K, wnβ )
⎡ a⎤ yang tiap elemennya bernilai min ⎢1, ⎥ . Pada umumnya M-Estimasi Huber akan ⎣ u⎦ memberikan bobot yang kecil (bobot wiβ < 1 ) untuk u > a , namun ketika u ≤ a Mestimasi akan memberikan bobot wiβ = 1 . Ketika Wβ = 1 maka βˆ 0 = βˆ 1 = L = βˆ n sehingga model regresi robust sama dengan model regresi kuadrat terkecil. Kesukaran dalam memecahkan masalah pendugaan β adalah bahwa Wβ tergantung pada β dan β tergantung pada Wβ , sehingga untuk mendapatkan nilai β digunakan suatu iterasi. Untuk mencari penduga awal βˆ 0 dapat digunakan penduga kuadrat terkecil, dan untuk mendapatkan bobot awal W0 dapat menggunakan rumus bobot Huber’s dengan nilai u =
σ 0 = med
ε , ε = Y − Xβˆ 0 , h = X i′(X′X )−1 X i dan σ0 1− h
⎛ ε ⎞ ε ⎟⎟ 0,6745 . Selanjutnya − med⎜⎜ 1− h ⎝ 1− h ⎠
masukkan bobot awal W0
ke
Persamaan (3.24) sehingga didapatkan solusi βˆ 1 . −1 βˆ 1 = (Χ′W0 Χ ) Χ′W0 Υ
(3.27)
Pada langkah selanjutnya, dihitung kembali bobot dari W1 dengan menggunakan rumus bobot Persamaan (3.26) tetapi nilai ε menggunakan βˆ 1 sebagai pengganti βˆ 0 yaitu ε = Y − Xβˆ 1 . Pada umumnya, untuk Wq bobot yang diberikan dapat menyelesaikan
(
βˆ q+1 = Χ′Wq Χ
)
−1
Χ′Wq Υ,
q = 0,1,K
(3.28)
Langkah tersebut membutuhkan beberapa iterasi sampai mencapai konvergen, yaitu selisih nilai βˆ q+1 dengan βˆ q mendekati nol.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 41
Prosedur untuk mendapatkan penduga parameter yaitu iterasi yang disebut dengan iteratively reweighted least squares (IRLS), tahapannya adalah: 1. menentukan nilai residual ε 2. Menentukan σˆ 0 dan fungsi pembobot W0 3. Mencari penduga pada iterasi q(q = 1,2, L) dengan weighted least square.
(
βˆ q = Χ′Wq −1Χ
)
−1
Χ′Wq −1Υ
dengan Wq −1 merupakan matriks diagonal dengan elemen diagonalnya adalah wi (q −1) . Sehingga penduga parameter pada iterasi pertama (q = 1)
4. Mengulang tahap 2 dan 3 hingga didapatkan penduga parameter yang konvergen
Contoh 3.6
Sebuah toko memiliki rincian banyaknya barang yang terjual beserta harganya yang disajikan dalam Tabel 3.4. Dengan X = banyaknya barang yang terjual dan Y = harga barang (dalam ribuan) Tabel 3.4. Banyak barang yang terjual dan harga barang Observasi 1 2 3 4 5 6 7
X 18 16 15 12 10 30 6
Y 770 785 790 800 810 825 830
Dengan menggunakan data yang disajikan dalam Tabel 3.4 dan Contoh 3.2, bahwa outlier berada pada sumbu X yaitu pada observasi ke-6. Ambil 5 nilai outlier yang berbeda yaitu 30, 40, 48, 150, dan 150.000. Dengan mengubah-ubah data observasi ke-6 dengan kelima nilai tersebut sedangkan data yang lain tetap, tentukan model
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 42
regresi robust dari masing-masing nilai outlier. Bandingkan model regresi robust dengan model regresi kuadrat terkecil, apakah model regresi robust sama dengan model regresi kuadrat terkecil? Jelaskan! Jawab: Karena outlier berada pada sumbu X yaitu pada observasi ke-6, maka data pada observasi ke-6 akan diubah-ubah dengan nilai 30, 40, 48, 150, dan 150.000, sedangkan data yang lainnya tetap. Untuk mendapatkan model regresi robust dari kelima nilai tersebut digunakan program MATLAB. Dari M-file pada program MATLAB yang secara lengkap diberikan dalam Lampiran B, diperoleh model regresi kuadrat terkecil yang diberikan dalam Tabel 3.5. Dengan menggunakan nilai penduga βˆ 0 model regresi kuadrat terkecil yang dapat dilihat pada Tabel 3.5 diperoleh nilai ε 0 , h0 , dan σˆ 0 yang dapat dilihat pada Lampiran C, selanjutnya untuk mendapatkan penduga βˆ akan dicari dengan menggunakan iterasi yaitu Iteratively Reweighted Least Squares (IRLS) yang tahapan penyelesaiannya diberikan dalam Lampiran B. Untuk mendapatkan penduga βˆ akan digunakan kriteria Huber’s. Model regresi robust dari kelima perubahan nilai outlier diberikan dalam Tabel 3.5 dan bentuk kuadrat terkecil dan bentuk robust ditunjukkan dalam Tabel 3.6. Tabel 3.5.Model Regresi Kuadrat Terkecil dan Model Regresi Robust Data Outlier 30 40 48 150 150000
Regresi Kuadrat Terkecil Yˆ = 803.7408 - 0.1513 X Yˆ = 797.2385 + 0.2507 X Yˆ = 795.6952 + 0.3211 X Yˆ = 795.8804 + 0.1711 X Yˆ = 797.4982 + 0.0002 X
Regresi robust ˆ Y = 850.8747 - 4.1047 X Yˆ = 842.6575 - 3.4602 X Yˆ = 795.6952 +0.3211X Yˆ = 795.8804 + 0.1711 X Yˆ = 797.4982 + 0.0002 X
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 43
Tabel 3.6. Bentuk kuadrat terkecil dan bentuk robust Data Outlier
Bentuk kuadrat terkecil dan bentuk robust 840 data MKT Robust
820
800
30
780
760
740
720 5
10
15
20
25
30
840 data MKT Robust
820
800
780
40
760
740
720
700 5
10
15
20
25
30
35
40
830 data MKT Robust
820
810
48
800
790
780
770 5
10
15
20
25
30
35
40
45
50
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 44
Data Outlier
Bentuk kuadrat terkecil dan bentuk robust 830 data MKT Robust
820
810
150
800
790
780
770 0
50
100
150
830 data MKT Robuist
820
810
150000
800
790
780
770 0
5
10
15 4
x 10
Untuk nilai outlier 30 dan 40 model regresi robust tidak sama dengan model regresi kuadrat terkecil hal ini disebabkan karena nilai bobotnya bukan matriks yang setiap elemennya bernilai satu. Sedangkan untuk nilai outlier 48, 150, 150000 model regresi robust sama dengan model regresi kuadrat terkecil hal ini disebabkan karena nilai bobotnya merupakan matriks yang setiap elemen-elemennya bernilai satu. Nilai bobot untuk masing-masing simulasi diberikan dalam Lampiran C.
Contoh 3.7
Sebuah toko memiliki rincian banyaknya barang yang terjual beserta harganya yang disajikan dalam Tabel 3.7. Dengan X = banyaknya barang yang terjual dan Y = harga barang (dalam ribuan)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 45
Tabel 3.7. Banyak barang yang terjual dan harga barang Observasi 1 2 3 4 5 6 7
X 18 16 15 12 10 7 6
Y 770 785 790 800 810 885 825
Apakah data dalam Tabel 3.7 memuat outlier? Jika ya, ambil 5 nilai outlier yang berbeda yaitu 885, 950, 5000, 9999, dan 9999999. Dengan mengubah-ubah nilai outlier dengan kelima nilai tersebut sedangkan data yang lain tetap, tTentukan model regresi robust dari masing-masing nilai outlier. Bandingkan model regresi robust dengan model regresi kuadrat terkecil, apakah model regresi robust sama dengan model regresi kuadrat terkecil? Jelaskan! Jawab: Untuk mengetahui apakah data dalam Tabel 3.7 memuat outlier atau tidak maka terlebih dahulu dihitung nilai kuartil (Q) 1, 2, dan 3 serta jangkauan (IQR, Interquartile Range) seperti yang tercantum dalam Tabel 3.8 Tabel 3.8. Kuartil dan jangkauan
Q1 Q2 Q3 IQR 1.5*IQR
Y 785 800 825 40 60
Dari Tabel 3.8. outlier terletak pada daerah Y < 725 dan Y > 885. Karena nilai Y pada observasi ke-6 yaitu Y = 885 berada pada daerah outlier maka data tersebut memuat outlier di sumbu Y.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 46
Dengan menggunakan SPSS yang disajikan dalam boxplot akan tampak seperti Gambar 3.10. 900.00
6 880.00
860.00
840.00
820.00
800.00
780.00
760.00
Y
Gambar 3.10. Boxplot untuk variabel Y Dari Gambar 3.10. terlihat bahwa data pada observasi ke-6 berada di daerah outlier. Jadi data tersebut memuat outlier di sumbu Y. Karena outlier berada pada sumbu Y yaitu pada observasi ke-6 maka data pada observasi ke-6 akan diubah-ubah dengan nilai 885, 950, 5000, 9999, dan 9999999 sedangkan data yang lainnya tetap. Untuk mendapatkan model regresi robust dari kelima nilai tersebut akan dibantu dengan program MATLAB. Dari M-file pada program MATLAB yang secara lengkap diberikan dalam Lampiran D, diperoleh model regresi kuadrat terkecil yang diberikan dalam Tabel 3.8. Dengan menggunakan nilai penduga βˆ 0 model regresi kuadrat terkecil yang dapat dilihat pada Tabel 3.9 diperoleh nilai ε 0 , h0 , dan σˆ 0 yang diberikan dalam Lampiran E, selanjutnya untuk mendapatkan penduga βˆ akan dicari dengan menggunakan iterasi yaitu Iteratively Reweighted Least Squares (IRLS) yang tahapan penyelesaiannya diberikan dalam Lampiran D. Untuk mendapatkan penduga βˆ akan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 47
digunakan kriteria Huber’s. Model regresi robust dari kelima simulasi diberikan dalam Tabel 3.9 dan bentuk kuadrat terkecil dan bentuk robust ditunjukkan Dalam Tabel 3.10. Tabel 3.9. Model regresi Kuadrat terkecil dan Model regresi Robust Data Outlier
Regresi Kuadrat Terkecil
Regresi robust
885
Yˆ = 891.6667 - 6.8651 X Yˆ = 931.9048 - 9.4444 X Yˆ = 3439.0 – 170.2 X
Yˆ = 859.5152 - 4.8041 X Yˆ = 859.5152 - 4.8041 X Yˆ = 859.5152 - 4.8041 X
Yˆ = 6533.7 – 368.5 X Yˆ = 6190800 – 396800 X
Yˆ = 859.5152 - 4.8041 X Yˆ = 859.5152 - 4.8041 X
950 5000 9999 9999999
Tabel 3.10 bentuk kuadrat terkecil dan bentuk robust Data Outlier
Bentuk kuadrat terkecil dan bentuk robust 900 data MKT Robust
880
860
840
885 820
800
780
760 6
8
10
12
14
16
18
960 data MKT Robust
940 920 900 880
950
860 840 820 800 780 760 6
8
10
12
14
16
18
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 48
Data Outlier
Bentuk kuadrat terkecil dan bentuk robust 5000 data MKT Robust
4500 4000 3500 3000
5000
2500 2000 1500 1000 500 0 6
8
10
12
14
16
18
10000 data MKT Robust
8000
6000
9999
4000
2000
0
-2000 6
8
10
12
14
16
18
6
10
x 10
data MKT Robust
8
6
9999999
4
2
0
-2 6
8
10
12
14
16
18
Untuk beberapa nilai outlier yang digunakan sebagai simulasi model regresi robust tidak sama dengan model regresi kuadrat terkecil. Oleh karena itu model regresi robust tidak terpengaruh adanya data outlier.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB IV APLIKASI REGRESI ROBUST
A. Ketenagakerjaan Suatu Negara di Eropa pada tahun 1974 dan 1992 Suatu Negara di Eropa ingin mengetahui apakah ketenagakerjaan pada tahun 1974 dan 1992 saling terkait dan saling mempengaruhi. Untuk itu pemerintahan di negara itu mensurvei jumlah ketenagakerjaan tahun 1974 dan 1992 yang dicantumkan dalam Tabel 4.1. Dengan Υ = ketenagakerjaan tahun 1992 dan Χ = ketenagakerjaan tahun 1974. Tentukan model regresi robust data pada Tabel 4.1! Tabel 4.1. Ketenagakerjaan suatu negara di Eropa tahun 1974 dan 1992 (dalam ribuan) Negeri Germany Italy France United Kingdom Spain Belgium Netherlands Luxembourg Portugal Denmark Total ª Terdiri dari Jerman timur
X 232 96 158 194 89 64 25 23 4 2 887
Y 132ª 50 43 41 33 25 16 8 3 1 353
Jawab: Dengan menggunakan model Υ = β 0 + β1Χ + ε
Dari M-File MATLAB yang secara lengkap diberikan dalam Lampiran F, diperoleh persamaan kuadrat terkecil sebagai berikut: Υˆ = −0.3139 + 0.4004 Χ
49
(4.1)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 50
dengan R 2 = 0.7357 dan dari output SPSS yang diberikan dalam Lampiran G korelasi
antara Y dan X tinggi yaitu r = 0.858. Dengan melihat studentized residual yang dicantumkan dalam Lampiran F, pengamatan 1 dan 4 merupakan outlier dengan studentized residual 2.5347 dan -2.0653 yang menunjukkan bahwa nilainya besar. Sekarang perhatikan catatan dibawah Tabel 4.1. Sejak tahun 1992 untuk Jerman menggunakan Jerman Timur (dimana tahun 1974 bukan), mungkin saja terlalu besar. Hal ini dapat disesuaikan dengan faktor perbandingan Jerman Barat dan populasi Jerman di tahun 1992 sebesar
63 63 . Hal ini menggantikan 132 dengan ⋅ 132 = 104 . 80 80
Dari M-File MATLAB yang secara lengkap diberikan dalam Lampiran H, diperoleh persamaan kuadrat terkecil sebagai berikut: Υˆ = 2.8026 + 0.3337 Χ
(4.2)
dengan R 2 = 0.7981 dan dari output SPSS yang diberikan dalam Lampiran I korelasi antara Y dan X tinggi yaitu r = 0.893. Dengan melihat studentized residual yang dicantumkan dalam Lampiran H, pengamatan 1 dan 4 merupakan outlier dengan studentized residual 2.1863 dan -2.1552 yang menunjukkan bahwa nilainya besar. Untuk mendapatkan nilai penduga parameter model regresi robust yang tidak terpengaruh outlier digunakan metode M-Estimasi dengan bobot kriteria Huber’s. Penyelesaian model regresi robust menggunakan bobot kriteria Huber’s dengan ketenagakerjaan tahun 1992 untuk Negara Jerman menggunakan Jerman Barat dan Jerman Timur adalah sebagai berikut: Dengan menggunakan nilai penduga βˆ 0 yang diperoleh dari model kuadrat terkecil dan rumus bobot Persamaan 3.29, serta melakukan analisa dengan bantuan program M-file MATLAB yang dicantumkan dalam Lampiran F diperoleh bobot awal W0 sebagai berikut: [0.2564, 1, 0.6141, 0.3147, 1, 1, 1, 1, 1, 1] T
(4.3)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 51
Dengan
W0
memasukkan
ke
Persamaan
(3.25),
diperoleh
βˆ 1 = [2.1078,0.3686]T . Dengan menggunakan nilai penduga βˆ 1 dan rumus bobot
Persamaan 3.29, serta melakukan analisa dengan bantuan program M-file MATLAB yang dicantumkan dalam Lampiran F diperoleh bobot W1 sebagai berikut: [0.2186, 0.9841, 0.6771, 0.3364, 1, 1, 1, 1, 1, 1] T
(4.4)
Dengan memasukkan W1 ke Persamaan (3.26) dan mengulangi iterasi sampai
mencapai konvergen (dalam M-file yang dicantumkan dalam Lampiran F diperlihatkan bahwa iterasi dilakukan sampai 19 iterasi) diperoleh model regresi robust sebagai berikut: Υˆ = 3.9147 + 0.3027 Χ
(4.5)
Model regresi kuadrat terkecil dan model regresi robust ditunjukkan dalam Gambar 4.1. 140
120
data MKT Robust
100
80
60
40
20
0 0
50
100
150
200
250
Gambar 4.1. Model regresi kuadrat terkecil dan model regresi robust kriteria Huber’s Sekarang dengan memperthatikan catatan di bawah Tabel 4.1, penyelesaian model regresi robust menggunakan bobot kriteria Huber’s dengan ketenagakerjaan tahun 1992 untuk Negara Jerman menggunakan Jerman Timur (dimana tahun 1974 bukan) adalah sebagai berikut. Dengan menggunakan nilai penduga βˆ 0 dari Persamaan 4.2 dan rumus bobot kriteria Huber’s dengan a = 1.345 , serta melakukan analisa
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 52
dengan bantuan program M-file MATLAB yang dicantumkan dalam Lampiran H diperoleh bobot awal W0 sebagai berikut: [0.3573, 0.7109, 0.8221, 0.3624, 1, 1, 1, 1, 1, 1] T
(4.6)
Dengan memasukkan bobot tersebut ke Persamaan (3.25), diperoleh T βˆ 1 = [3.3086, 0.3253] . Dengan menggunakan nilai penduga βˆ 1 dan rumus bobot
kriteria Huber’s dengan a = 1.345 , serta melakukan analisa dengan bantuan program M-file MATLAB yang dicantumkan dalam Lampiran H diperoleh bobot W1 sebagai berikut: [0.3259, 0.6744, 0.8515, 0.3662, 1, 1, 1, 1, 1, 1] T
(4.7)
Dengan memasukkan bobot tersebut ke Persamaan (3.26) dan mengulangi iterasi diatas sampai mencapai konvergen (dalam M-file yang dicantunkan dalam Lampiran H diperlihatkan bahwa iterasi dilakukan sampai 18 iterasi) diperoleh model regresi sebagai berikut
Υˆ = 3.9147 + 0.3027 Χ
(4.8)
Model regresi kuadrat terkecil dan model regresi robust kriteria Huber’s ditunjukkan dalam Gambar 4.2. 120
100
data MKT Robust
80
60
40
20
0 0
50
100
150
200
250
Gambar 4.2. Model regresi kuadrat terkecil dan model regresi robust kriteria Huber’s
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 53
B. Kerugian Penjualan Motor Bekas Suatu Dealer Motor Suatu Dealer motor yang mengalami gulung tikar ingin mengetahui apakah harga jual, harga beli, dan biaya perawatan berpengaruh pada laba / rugi usahanya. Untuk itu pemilik dealer melihat kembali data perusahaan yang dicantumkan dalam Tabel 4.2 dengan Υ = Kerugian yang dialami penjual (dalam %) Χ1 = Harga jual, Χ 2 = Harga beli, dan Χ 3 = Biaya Perawatan . Tentukan model regresi robust yang sesuai dengan data pada Tabel 4.2! Gunakan metode Huber’s, Bisquare, dan Andrew’s! Tabel 4.2. Kerugian setiap penjualan motor bekas Y 29 32 31 35 38 44 41 42 46 45 50 51 48 55 58 59 63 67 62 70 29 32 31 90 38
Χ1 14 18 21 27 167 50 46 42 51 57 77 72 65 82 83 91 106 98 95 109 14 18 21 27 167
Jawab: Dengan menggunakan model
Χ2 20 23 25 32 38 147 46 42 51 57 69 63 59 73 75 81 87 85 84 98 20 23 25 32 38
Χ3 7 10 14 133 26 37 34 31 41 44 60 55 50 63 66 71 84 79 74 91 7 10 14 20 26
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 54
Yi = β1 + β 2 X 2i + β 3 X 3i + L + β k X ki + ε i
i = 1,2,3,K, N
Dari M-File MATLAB yang secara rinci diberikan dalam Lampiran J, diperoleh persamaan kuadrat terkecil sebagai berikut: Υˆ = 22.6275 + 0.1165X1 + 0.1699X 2 + 0.1313Χ 3
(4.9)
dengan R 2 = 0.7260 dan dari output SPSS yang diberikan dalam Lampiran K korelasi antara Y dan Χ1 yaitu r = 0.638, korelasi antara Y dan Χ 2 yaitu r = 0.697, korelasi antara Y dan Χ 3 yaitu r = 0.605. Dengan melihat studentized residual yang dicantumkan dalam Lampiran J, pengamatan 4 pada Χ1 , 6 pada Χ 2 , dan 5 pada Χ 3 merupakan outlier dengan studentized residual -3.9734, -3.9235, dan -3.9567, yang menunjukkan bahwa nilainya besar. Untuk mendapatkan nilai penduga parameter model regresi robust yang tidak terpengaruh outlier digunakan metode M-Estimasi dengan bobot kriteria Huber’s. Penyelesaian model regresi robust kerugian penjualan motor bekas suatu dealer motor dengan metode M-estimasi kriteria Huber’s adalah sebagai berikut. Dengan menggunakan nilai penduga βˆ 0 dari Persamaan 4.13 dan rumus bobot kriteria Huber’s dengan a = 1.345 , serta melakukan analisa dengan bantuan program M-file MATLAB yang secara rinci diberikan dalam Lampiran J diperoleh bobot awal W0 sebagai berikut: [1, 1, 1, 0.1544, 0.1564, 0.1551, 1, 1, 1, 1, 1, 1, 1, 1, 0.9345, 1, 1, 0.4818, 0.9153, 0.6218 ] T Dengan memasukkan bobot tersebut ke Persamaan (3.25), diperoleh T βˆ 1 = [22.6702, 0.1219, 0.1808, 0.1450] . Dengan menggunakan nilai penduga βˆ 1 dan
rumus bobot kriteria Huber’s dengan a = 1.345 , serta melakukan analisa dengan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 55
bantuan program M-file MATLAB yang secara rinci diberikan dalam Lampiran J diperoleh bobot W1 sebagai berikut: [1, 1, 1, 0.1251, 0.1323, 0.1259, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0.6691, 1, 1] T Dengan memasukkan bobot tersebut ke Persamaan (3.26) dan mengulangi iterasi sampai mencapai konvergen (dalam M-file yang dicantumkan dalam Lampiran J diperlihatkan bahwa iterasi dilakukan sampai 264 iterasi) diperoleh model regresi sebagai berikut Υˆ = 23.2265 + 0.0149X1 + 0.1644X 2 + 0.2976 Χ 3
(4.10)
Dengan bobot akhir [1, 1, 1, 0.0524, 1, 0.1214, 1, 1, 1, 1, 0.9382, 1, 1, 1, 1, 1, 1, 0.6740, 1, 1] T
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB V PENUTUP
A. Kesimpulan Outlier adalah pengamatan dengan nilai residual yang besar. Untuk mendeteksi suatu data yang memuat outlier dan menentukan batasannya digunakan: 1. Metode Grafis (Scatter-Plot) 2. Boxplot 3. Residu yang distudentkan (Studentized Residual) Dalam regresi, ketika ε i memuat outlier yang berpengaruh pada model, untuk mendapatkan parameter-parameter dalam model regresi yang tidak terpengaruh oleh outlier dapat menggunakan regresi robust. Regresi robust adalah alat penting untuk menganalisa data yang dipengaruhi oleh outlier sehingga dihasilkan model yang tidak terpengaruh oleh outlier. Penyelesaian parameter-parameter dalam regresi robust menggunakan metode M-Estimasi. Penduga parameter β pada regresi robust adalah −1 β = (Χ′Wβ Χ ) Χ′Wβ Υ
dengan Wβ adalah matriks diagonal n × n dari bobot, dengan elemen-elemen diagonal
(w1β , w2β ,K , wnβ ) .
Fungsi bobot yang digunakan untuk mendapatkan penduga
parameter β adalah fungsi bobot kriteria Huber’s dengan rumus fungsi bobot sebagai berikut:
56
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 57
⎧ 1 ⎪⎪ Wβ = ⎨ a ⎪ ⎪⎩ u
untuk u ≤ a untuk u > a
dengan a adalah tuning konstan, tuning konstan yang digunakan a = 1,345 dan u=
ε ⎛ ε ⎞ ε −1 , dengan σ = med − med⎜⎜ ⎟⎟ 0,6745 , hi = xi′ (X′X ) xi 1− h σ 1− h ⎝ 1− h ⎠ Pada umumnya M-Estimasi Huber akan memberikan bobot yang kecil (bobot
wiβ < 1 ) untuk u > a , namun ketika u ≤ a M-estimasi akan memberikan bobot
wiβ = 1 . Ketika Wβ = 1 maka βˆ 0 = βˆ 1 = L = βˆ n sehingga model regresi robust sama dengan model regresi kuadrat terkecil. Kesukaran dalam mendapatkan penduga parameter β adalah bahwa Wβ
tergantung pada β dan β tergantung pada Wβ ,
sehingga untuk mendapatkan nilai β digunakan suatu iterasi yang disebut dengan iteratively reweighted least squares (IRLS). Dari Contoh 3.6 dengan mengubah-ubah nilai outlier sedangkan data lain tetap, model regresi robust dari kelima nilai yang digunakan berbeda, hal ini disebabkan karena data pada sumbu X sangat berpengaruh pada perubahan nilai ε , h , dan σˆ . Dari Contoh 3.7 dengan mengubah-ubah nilai outlier sedangkan data lain tetap, model regresi robust dari kelima nilai yang digunakan selalu sama, hal ini disebabkan karena perubahan nilai Y tidak mempengaruhi perubahan nilai ε , h , dan σˆ . Adanya nilai outlier yang tinggi pada sumbu X dapat mempengaruhi model regresi robust, hal ini ditunjukkan dengan model regresi robust sama dengan model regresi kuadrat terkecil, sedangkan adanya outlier pada sumbu Y tidak mempengaruhi model regresi yaitu ditunjukkan dengan model regresi robust tidak sama dengan model regresi kuadrat terkecil.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 58
B. Saran Dalam penulisan makalah ini tentunya penulis masih melakukan banyak kesalahan, oleh karena itu kritik dan saran yang membangun sangat diharapkan. Penulis juga menyarankan untuk pembahasan regresi robust menggunakan metode estimasi yang belum dibahas oleh penulis dalam makalah ini.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 59
DAFTAR PUSTAKA
Andrews, dkk. 1972. Robust Estimates of Location. Princeton, NJ: Princeton University Press Berger, R.L. and Casella, G. 2002. Statistical Inference Second Edition. Chen, C. 2002. Robust Regression and Outlier Detection with the ROBUSTREG Procedure, www2.sas.com, Sugi paper 265-27, SAS Institute, Cary, NC Damodar, Gujarati. 1978. Ekonometrika Dasar. Jakarta: Penerbit Erlangga Dodge, Y. and Birkes, D. 1993. Alternative Methods of Regression. New York: John Wiley & Sons, INC Draper, N.R. and Smith. 1998. Applied Regression Analysis Third Edition. New York: Wiley series in probability and statistics ISBN 0-471-17082-8 Galton, F. 1886. “Family Likeness in Stature,” Proceedings of Royal Society, vol. 40, 42-72. London Maronna, R.A., Martin, R.D. and Yohai, V.J. 2006. Robust Statistics: Theory and Methods. New Delhi: John Wiley & Sons, Ltd ISBN: 0-470-01092-4 Plackett, R. L. 1972. Studies in the history of probability and statistics XXIX: The discovery of the method of least squares, Biometrika, 59, 239-251.[Epigraph, 1.1, 3.41 Ripley, B.D. and Venables, W.N. 2002. Modern Applied Statistics With S: Statistics and Computing. New York: Springer Rousseeuw, P.J. 1984. Least Median of Squares Regression, Journal of the American Statistical Association, vol. 79, Number 388: Theory and Methods Section, 871880 Rousseeuw, P.J. and Leroy, A.M. 1987. Robust Regression and Outlier Detection. New York: Wiley series in Applied Probability and Statistics ISBN 0-471-85233-3 Ryan, T.P. 1984. Modern Regression Methods. New York: Wiley series in Probability and Statistics Sawyer, S. 2003. Robust Estimation of Regression Parameters Staudte, R. G, and Sheather, S.J. 1990. Robust Estimation and Testing. New York: Wiley Stigler, S. M. 1981. Gauss and the invention of least squares, Ann. Stat. 9. 465-474. [1.1]
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 60
Supranto, J. 1986. Pengantar Probabilita dan Statistik Induktif Jilid II. Jakarta: Penerbit Erlangga Surjadi, P. A. 1990. Pendahuluan Teori Kemungkinan dan Statistika. Bandung: ITB http: //
[email protected]/2009/12/5/ robust regresi/ http: //
[email protected]/2009/11/22/ robust regression/
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 62
Lampiran A: clear; clc; X = [18; 16; 15; 12; 10; 7; 6] Y = [770; 785; 790; 800; 810; 825; 830] x = [ones(7,1) X]; H = x*inv(x'*x)*x'; h = [H(1); H(9); H(17); H(25); H(33); H(41); H(49)]; bls = regress(Y,x) r = Y-bls(1)-bls(2)*X; s = sqrt(sum(r.^2)./5); Studentized = r./(s*sqrt(1-h));
Lampiran B: Regresi Robust dengan M-Estimasi Kriteria Huber’s Contoh 3.6 clear; clc; X = [18; 16; 15; 12; 10; 30; 6] Y = [770; 785; 790; 800; 810; 825; 830] x = [ones(7,1) X]; [n,p] = size (x); H = x*inv(x'*x)*x'; h = [H(1); H(9); H(17); H(25); H(33); H(41); H(49)]; bls = regress(Y,x) Ytopi = bls(1)+bls(2)*X; r = Y-Ytopi; MSE = sqrt(sum(r.^2)./(n-p)); Studentized = r./(MSE*sqrt(1-h)); Ybar = sum(Y)/n; R = sum((Ytopi-Ybar).^2)/sum((Y-Ybar).^2 )radj = r ./sqrt(1-h); rs = sort(abs(radj-median(radj))); s = median(rs(max(1,p):end)) / 0.6745;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 63
u = radj/s; W = 1.345./max(1.345, abs(u)); bobot = [W(1) 0 0 0 0 0 0; 0 W(2) 0 0 0 0 0; 0 0 W(3) 0 0 0 0; 0 0 0 W(4) 0 0 0; 0 0 0 0 W(5) 0 0; 0 0 0 0 0 W(6) 0; 0 0 0 0 0 0 W(7)]; Beta = inv(x'*bobot*x)*x'*bobot*Y for r = 1:36 r = Y-Beta(1)-Beta(2)*X; radj = r ./sqrt(1-h); rs = sort(abs(radj-median(radj))); s = median(rs(max(1,p):end)) / 0.6745; u = radj/s; W = 1.345./max(1.345, abs(u)); bobot = [W(1) 0 0 0 0 0 0; 0 W(2) 0 0 0 0 0; 0 0 W(3) 0 0 0 0; 0 0 0 W(4) 0 0 0; 0 0 0 0 W(5) 0 0; 0 0 0 0 0 W(6) 0; 0 0 0 0 0 0 W(7)]; Beta = inv(x'*bobot*x)*x'*bobot*Y end scatter(X,Y) hold on plot(X,bls(1)+bls(2)*X,'g:') plot(X,Beta(1)+Beta(2)*X,'r-')
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 64
Lampiran C: Informasi Contoh 3.6 X
30
40
48
150
150000
ε0 -31.0180 -16.3205 -11.4718 1.9256 7.7719 25.7972 27.1668 -31.7509 -16.2495 -10.9988 -0.2468 10.2546 17.7340 31.2573 -31.4744 -15.8323 -10.5112 0.4520 11.0941 13.8936 32.3784 -28.9600 -13.6178 -8.4467 2.0666 12.4087 3.4561 33.0931 -27.5015 -12.5011 -7.5009 2.4996 12.5000 0.0031 32.5007
σ0
35.0849
38.0698
38.6368
37.7344
36.5432
1−h 0.9144 0.9250 0.9257 0.9090 0.8816 0.4874 0.7813 0.9246 0.9254 0.9236 0.9092 0.8918 0.3373 0.8365 0.9258 0.9242 0.9220 0.9097 0.8965 0.2679 0.8577 0.9189 0.9168 0.9157 0.9118 0.9089 0.0715 0.9023 0.9129 0.9129 0.9129 0.9129 0.9129 0.0001 0.9129
u0 -0.9669 -0.5029 -0.3532 -0.0604 0.2513 1.5087 0.9911 -0.9020 -0.4612 -0.3128 -0.0071 0.3020 1.3810 0.9815 -0.8799 -0.4434 -0.2951 0.0129 0.3203 1.3425 0.9771 -0.8352 -0.3936 -0.2445 0.0601 0.3618 1.2805 0.9720 -0.8244 -0.3747 -0.2249 0.0749 0.3747 1.2723 0.9743
W0 1.0000 1.0000 1.0000 1.0000 1.0000 0.8915 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9740 1.0000 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Lampiran D: Regresi Robust dengan M-Estimasi Kriteria Huber’s Contoh 3.7
clear; clc; X = [18; 16; 15; 12; 10; 7; 6] Y = [770; 785; 790; 800; 810; 885; 825] x = [ones(7,1) X];
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 65
[n,p] = size (x); H = x*inv(x'*x)*x'; h = [H(1); H(9); H(17); H(25); H(33); H(41); H(49)]; bls = regress(Y,x) Ytopi = bls(1)+bls(2)*X; r = Y-Ytopi; MSE = sqrt(sum(r.^2)./(n-p)); Studentized = r./(MSE*sqrt(1-h)); Ybar = sum(Y)/n; R = sum((Ytopi-Ybar).^2)/sum((Y-Ybar).^2)radj = r ./sqrt(1-h); rs = sort(abs(radj-median(radj))); s = median(rs(max(1,p):end)) / 0.6745; u = radj/s; W = 1.345./max(1.345, abs(u)); bobot = [W(1) 0 0 0 0 0 0; 0 W(2) 0 0 0 0 0; 0 0 W(3) 0 0 0 0; 0 0 0 W(4) 0 0 0; 0 0 0 0 W(5) 0 0; 0 0 0 0 0 W(6) 0; 0 0 0 0 0 0 W(7)]; Beta = inv(x'*bobot*x)*x'*bobot*Y for r = 1:36 r = Y-Beta(1)-Beta(2)*X; radj = r ./sqrt(1-h); rs = sort(abs(radj-median(radj))); s = median(rs(max(1,p):end)) / 0.6745; u = radj/s W = 1.345./max(1.345, abs(u)); bobot = [W(1) 0 0 0 0 0 0; 0 W(2) 0 0 0 0 0; 0 0 W(3) 0 0 0 0; 0 0 0 W(4) 0 0 0; 0 0 0 0 W(5) 0 0;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 66
0 0 0 0 0 W(6) 0; 0 0 0 0 0 0 W(7)]; Beta = inv(x'*bobot*x)*x'*bobot*Y end scatter(X,Y) hold on plot(X,bls(1)+bls(2)*X,'g:') plot(X,Beta(1)+Beta(2)*X,'r-')
Lampiran E: Informasi Contoh 3.7
5000
ε0 1.9048 3.1746 1.3095 -9.2857 -13.0159 41.3889 -25.4762 8.0952 4.2063 -0.2381 -18.5714 -27.4603 84.2063 -50.2381 1.0e+003 *
9999
0.3938 0.0685 -0.0967 -0.5971 -0.9275 2.7521 -1.5931 1.0e+003 *
Y 885
950
0.8699 0.1478 -0.2157 -1.3113 -2.0383 6.0451 -3.4975
σ0
1−h 0.7559 0.8545 0.8864 0.9258 0.9085 0.8116 0.7559 0.7559 0.8545 0.8864 0.9258 0.9085 0.8116 0.7559
u0 0.1245 0.1835 0.0730 -0.4954 -0.7076 2.5189 -1.6647 0.2904 0.1335 -0.0073 -0.5439 -0.8196 2.8134 -1.8021
W0 1.0000 1.0000 1.0000 1.0000 1.0000 0.5340 0.8080 1.0000 1.0000 1.0000 1.0000 1.0000 0.4781 0.7463
1.1429e+003
0.7559 0.8545 0.8864 0.9258 0.9085 0.8116 0.7559
0.4558 0.0701 -0.0954 -0.5643 -0.8932 2.9668 -1.8439
1.0000 1.0000 1.0000 1.0000 1.0000 0.4534 0.7294
2.5162e+003
0.7559 0.8545 0.8864 0.9258 0.9085 0.8116 0.7559
0.4573 0.0688 -0.0967 -0.5629 -0.8917 2.9600 -1.8388
1.0000 1.0000 1.0000 1.0000 1.0000 0.4544 0.7315
20.2453
36.8775
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 67
Y 9999999
σ0
1−h
u0
2.7469e+006
0.7559 0.8545 0.8864 0.9258 0.9085 0.8116 0.7559
0.4586 0.0676 -0.0978 -0.5617 -0.8904 2.9544 -1.8345
ε0 1.0e+006 * 0.9523 0.1587 -0.2381 -1.4285 -2.2220 6.5868 -3.8092
W0 1.0000 1.0000 1.0000 1.0000 1.0000 0.4552 0.7332
Lampiran F: Regresi Robust Kriteria Huber’s ketenagakerjaan tahun 1992 untuk Negara Jerman menggunakan Jerman Barat dan Jerman Timur clear; clc; X = [232; 96; 158; 194; 89; 64; 25; 23; 4; 2]; Y = [132; 50; 43; 41; 33; 25; 16; 8; 3; 1]; x = [ones(10,1) X]; [n,p] = size (x); H = x*inv(x'*x)*x'; h = [H(1); H(12); H(23); H(34); H(45); H(56); H(67); H(78); H(89); H(100)]; bls = regress(Y,x); Ytopi = bls(1)+bls(2)*X; r = Y-Ytopi; MSE = sqrt(sum(r.^2)./(n-p)); Studentized = r./(MSE*sqrt(1-h)); Ybar = sum(Y)/n; R = sum((Ytopi-Ybar).^2)/sum((Y-Ybar).^2); radj = r ./sqrt(1-h); rs = sort(abs(radj-median(radj))); s = median(rs(max(1,p):end)) / 0.6745; u = radj/s; W = 1.345./max(1.345, abs(u)); bobot = [W(1) 0 0 0 0 0 0 0 0 0; 0 W(2) 0 0 0 0 0 0 0 0; 0 0 W(3) 0 0 0 0 0 0 0;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 68
0 0 0 W(4) 0 0 0 0 0 0; 0 0 0 0 W(5) 0 0 0 0 0; 0 0 0 0 0 W(6) 0 0 0 0; 0 0 0 0 0 0 W(7) 0 0 0; 0 0 0 0 0 0 0 W(8) 0 0; 0 0 0 0 0 0 0 0 W(9) 0; 0 0 0 0 0 0 0 0 0 W(10)]; Beta = inv(x'*bobot*x)*x'*bobot*Y for r = 1:19 r = Y-Beta(1)-Beta(2)*X; radj = r ./sqrt(1-h); rs = sort(abs(radj-median(radj))); s = median(rs(max(1,p):end)) / 0.6745; u = radj/s W = 1.345./max(1.345, abs(u)) bobot = [W(1) 0 0 0 0 0 0 0 0 0; 0 W(2) 0 0 0 0 0 0 0 0; 0 0 W(3) 0 0 0 0 0 0 0; 0 0 0 W(4) 0 0 0 0 0 0; 0 0 0 0 W(5) 0 0 0 0 0; 0 0 0 0 0 W(6) 0 0 0 0; 0 0 0 0 0 0 W(7) 0 0 0; 0 0 0 0 0 0 0 W(8) 0 0; 0 0 0 0 0 0 0 0 W(9) 0; 0 0 0 0 0 0 0 0 0 W(10)]; Beta = inv(x'*bobot*x)*x'*bobot*Y end scatter(X,Y) hold on plot(X,bls(1)+bls(2)*X,'g:') plot(X,Beta(1)+Beta(2)*X,'r-')
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 69
Lampiran G: Korelasi X dan Y ketenagakerjaan tahun 1992 untuk Negara Jerman menggunakan Jerman Barat dan Jerman Timur
Y Y
Pearson Correlation Sig. (2-tailed) Pearson Correlation Sig. (2-tailed)
1
.858(**)
.
.002
10
10
.858(**)
1
.002
.
10
10
N X
X
N
** Correlation is significant at the 0.01 level (2-tailed).
Lampiran H: Regresi Robust Kriteria Huber’s ketenagakerjaan tahun 1992 untuk Negara Jerman menggunakan Jerman Timur (dimana tahun 1974 bukan) clear; clc; X = [232; 96; 158; 194; 89; 64; 25; 23; 4; 2]; Y = [104; 50; 43; 41; 33; 25; 16; 8; 3; 1] x = [ones(10,1) X]; [n,p] = size (x); H = x*inv(x'*x)*x'; h = [H(1); H(12); H(23); H(34); H(45); H(56); H(67); H(78); H(89); H(100)]; bls = regress(Y,x) Ytopi = bls(1)+bls(2)*X; r = Y-Ytopi; MSE = sqrt(sum(r.^2)./(n-p)); Studentized = r./(MSE*sqrt(1-h)); Ybar = sum(Y)/n; R = sum((Ytopi-Ybar).^2)/sum((Y-Ybar).^2); radj = r ./sqrt(1-h); rs = sort(abs(radj-median(radj))); s = median(rs(max(1,p):end)) / 0.6745; u = radj/s; W = 1.345./max(1.345, abs(u)); bobot = [W(1) 0 0 0 0 0 0 0 0 0;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 70
0 W(2) 0 0 0 0 0 0 0 0; 0 0 W(3) 0 0 0 0 0 0 0; 0 0 0 W(4) 0 0 0 0 0 0; 0 0 0 0 W(5) 0 0 0 0 0; 0 0 0 0 0 W(6) 0 0 0 0; 0 0 0 0 0 0 W(7) 0 0 0; 0 0 0 0 0 0 0 W(8) 0 0; 0 0 0 0 0 0 0 0 W(9) 0; 0 0 0 0 0 0 0 0 0 W(10)]; Beta = inv(x'*bobot*x)*x'*bobot*Y for r = 1:19 r = Y-Beta(1)-Beta(2)*X; radj = r ./sqrt(1-h); rs = sort(abs(radj-median(radj))); s = median(rs(max(1,p):end)) / 0.6745; u = radj/s W = 1.345./max(1.345, abs(u)) bobot = [W(1) 0 0 0 0 0 0 0 0 0; 0 W(2) 0 0 0 0 0 0 0 0; 0 0 W(3) 0 0 0 0 0 0 0; 0 0 0 W(4) 0 0 0 0 0 0; 0 0 0 0 W(5) 0 0 0 0 0; 0 0 0 0 0 W(6) 0 0 0 0; 0 0 0 0 0 0 W(7) 0 0 0; 0 0 0 0 0 0 0 W(8) 0 0; 0 0 0 0 0 0 0 0 W(9) 0; 0 0 0 0 0 0 0 0 0 W(10)]; Beta = inv(x'*bobot*x)*x'*bobot*Y end scatter(X,Y) hold on plot(X,bls(1)+bls(2)*X,'g:') plot(X,Beta(1)+Beta(2)*X,'r-')
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 71
Lampiran I: Korelasi X dan Y ketenagakerjaan tahun 1992 untuk Negara Jerman menggunakan Jerman Timur (dimana tahun 1974 bukan)
Y Y
Pearson Correlation Sig. (2-tailed) Pearson Correlation Sig. (2-tailed)
1
.893(**)
.
.000
10
10
.893(**)
1
.000
.
10
10
N X
X
N
** Correlation is significant at the 0.01 level (2-tailed).
Lampiran J: Regresi Robust Dealer Motor clear; clc; x1 = [14; 18; 21; 27; 167; 50; 46; 42; 51; 57; 77; 72; 65; 82; 83; 91; 106; 98; 95; 109] x2 = [20; 23; 25; 32; 38; 147; 46; 42; 51; 57; 69; 63; 59; 73; 75; 81; 87; 85; 84; 98] x3 = [7; 10; 14; 133; 26; 37; 34; 31; 41; 44; 60; 55; 50; 63; 66; 71; 84; 79; 74; 91] Y = [29; 32; 31; 35; 38; 44; 41; 42; 46; 45; 50; 51; 48; 55; 58; 59; 63; 67; 62; 70] Xx = [ x1 x2 x3]; [n,p] = size (Xx); X = [ones(n,1) Xx]; H = X*inv(X'*X)*X'; h = [H(1); H(22); H(43); H(64); H(85); H(106); H(127); H(148); H(169); H(190); H(211); H(232); H(253); H(274); H(295); H(316); H(337); H(358); H(379); H(400)] bls = inv(X'*X)*X'*Y Ytopi = bls(1)+bls(2)*x1+bls(3)*x2+bls(4)*x3; r = Y-Ytopi; MSE = sqrt(sum(r.^2)./(n-p)); Studentized = r./(MSE*sqrt(1-h));
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 72
Ybar = sum(Y)/n; R = sum((Ytopi-Ybar).^2)/sum((Y-Ybar).^2); radj = r ./sqrt(1-h); rs = sort(abs(radj-median(radj))); s = median(rs(max(1,p):end)) / 0.6745; u = radj/s; W = 1.345./max(1.345, abs(u)); bobot = [W(1) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0; 0 W(2) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0; 0 0 W(3) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0; 0 0 0 W(4) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0; 0 0 0 0 W(5) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0; 0 0 0 0 0 W(6) 0 0 0 0 0 0 0 0 0 0 0 0 0 0; 0 0 0 0 0 0 W(7) 0 0 0 0 0 0 0 0 0 0 0 0 0; 0 0 0 0 0 0 0 W(8) 0 0 0 0 0 0 0 0 0 0 0 0; 0 0 0 0 0 0 0 0 W(9) 0 0 0 0 0 0 0 0 0 0 0; 0 0 0 0 0 0 0 0 0 W(10) 0 0 0 0 0 0 0 0 0 0; 0 0 0 0 0 0 0 0 0 0 W(11) 0 0 0 0 0 0 0 0 0; 0 0 0 0 0 0 0 0 0 0 0 W(12) 0 0 0 0 0 0 0 0; 0 0 0 0 0 0 0 0 0 0 0 0 W(13) 0 0 0 0 0 0 0; 0 0 0 0 0 0 0 0 0 0 0 0 0 W(14) 0 0 0 0 0 0; 0 0 0 0 0 0 0 0 0 0 0 0 0 0 W(15) 0 0 0 0 0; 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 W(16) 0 0 0 0; 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 W(17) 0 0 0; 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 W(18) 0 0;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 73
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 W(19) 0; 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 W(20)]; Beta = inv(X'*bobot*X)*X'*bobot*Y for r = 1:264; r = Y-Beta(1)-Beta(2)*x1-Beta(3)*x2-Beta(4)*x3; radj = r ./sqrt(1-h); rs = sort(abs(radj-median(radj))); s = median(rs(max(1,p):end)) / 0.6745; u = radj/s; W = 1.345./max(1.345, abs(u)); bobot = [W(1) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0; 0 W(2) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0; 0 0 W(3) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0; 0 0 0 W(4) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0; 0 0 0 0 W(5) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0; 0 0 0 0 0 W(6) 0 0 0 0 0 0 0 0 0 0 0 0 0 0; 0 0 0 0 0 0 W(7) 0 0 0 0 0 0 0 0 0 0 0 0 0; 0 0 0 0 0 0 0 W(8) 0 0 0 0 0 0 0 0 0 0 0 0; 0 0 0 0 0 0 0 0 W(9) 0 0 0 0 0 0 0 0 0 0 0; 0 0 0 0 0 0 0 0 0 W(10) 0 0 0 0 0 0 0 0 0 0; 0 0 0 0 0 0 0 0 0 0 W(11) 0 0 0 0 0 0 0 0 0; 0 0 0 0 0 0 0 0 0 0 0 W(12) 0 0 0 0 0 0 0 0; 0 0 0 0 0 0 0 0 0 0 0 0 W(13) 0 0 0 0 0 0 0; 0 0 0 0 0 0 0 0 0 0 0 0 0 W(14) 0 0 0 0 0 0; 0 0 0 0 0 0 0 0 0 0 0 0 0 0 W(15) 0 0 0 0 0;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 74
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 W(16) 0 0 0 0; 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 W(17) 0 0 0; 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 W(18) 0 0; 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 W(19) 0; 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 W(20)]; Beta = inv(X'*bobot*X)*X'*bobot*Y end Boxplot(Xx)
Lampiran K: Korelasi antara Y, X1, X2, dan X3 Dealer Motor
Y Y
Pearson Correlation Sig. (2-tailed) N
X1
Pearson Correlation Sig. (2-tailed) N
X2
Pearson Correlation Sig. (2-tailed) N
X3
Pearson Correlation Sig. (2-tailed) N
X1
X2
X3
1
.638(**)
.697(**)
.605(**)
.
.002
.001
.005
20
20
20
20
.638(**)
1
.410
.318
.002
.
.072
.172
20
20
20
20
.697(**)
.410
1
.375
.001
.072
.
.103
20
20
20
20
.605(**)
.318
.375
1
.005
.172
.103
.
20
20
20
20
** Correlation is significant at the 0.01 level (2-tailed).