TINJAUAN PUSTAKA Pencilan Aunuddin (1989) mendefinisikan pencilan sebagai nilai ektstrim yang menyimpang agak jauh dari kumpulan pengamatan lainnya, yang secara kasar berada pada jarak sejauh tiga atau empat kali simpangan baku dari nilai tengahnya. Ryan (1997) mengelompokkan pencilan dalam berbagai tipe: 1. Pencilan-x, yakni pengamatan yang hanya menyimpang pada sumbu x saja. Pengamatan ini disebut juga sebagai titik leverage. 2. Pencilan-y, yakni pengamatan yang menyimpang hanya karena arah peubah tak bebasnya. 3. Pencilan-x,y, yaitu pengamatan yang menyimpang pada keduanya yakni pada peubah x dan peubah y. Gambar 1 mengilustrasikan berbagai jenis pencilan. Elips menggambarkan mayoritas data. Titik A, B, dan C adalah pencilan dalam ruang Y karena nilai-nilai y atau nilai respon secara signifikan berbeda dari keseluruhan data dan merupakan pencilan sisaan. Titik B, C dan D adalah pencilan dalam ruang X, karena nilainilai x pada titik tersebut berbeda dan ini juga disebut sebagai titik leverage. Titik D walaupun terpencil di ruang X, namun bukanlah pencilan sisaan. Titik B dan C adalah titik leverage dan merupakan pencilan sisaan. Titik E merupakan pencilan sisaan.
Gambar 1 Plot jenis pengamatan pencilan.
Semua tipe pencilan yang digambarkan di atas dapat diringkas dalam Tabel 1 berikut. Tabel 1 Ringkasan Jenis Pengamatan Pencilan Titik
Pencilan-Y
Pencilan-X
Pencilan Sisaan
A
√
-
√
B C D E
√
√
√
√
√ -
√ √
√ √ -
√
Titik leverage adalah pengamatan (xp, yp) apabila xp terletak jauh jauh dari sebagian besar xi yang diamati dalam sampel (Rousseeuw 1991). Titik leverage dapat dilihat pada Gambar 2. Titik (xp,yp) adalah titik leverage karena xp terpencil. Namun, (xp,yp) bukan merupakan pencilan regresi karena sesuai dengan pola linier yang ditetapkan oleh titik data lain.
Gambar 2 Ilustrasi Titik Leverage.
Metode Kuadrat Terkecil (MKT) Persamaan regresi linier berganda adalah persamaan regresi dengan satu peubah respon (Y) dengan lebih dari satu peubah penjelas (X1, X2,.............,Xp). Hubungan antara peubah-peubah tersebut dapat dirumuskan dalam bentuk persamaan:
Yi = β0 + β1X1i + β2X2i + … + βpXpi + εi
untuk i = 1, 2, …, n
dengan Yi merupakan pengamatan ke-i (dari n pengamatan) untuk peubah respon dan Xpi merupakan peubah penjelas ke-p dari pengamatan ke-i. Komponen βp merupakan parameter yang belum diketahui dan akan diduga, sedangkan εi merupakan komponen galat yang diasumsikan menyebar normal, bebas dan identik, yang mempunyai nilai tengah 0 dan ragam homogen. Bila ditulis dalam bentuk matriks model umum regresi linier dinyatakan dengan Y = Xβ + ε dengan Y merupakan vektor pengamatan pada peubah respon berukuran (n x 1) dan X adalah matriks berukuran (n x p) dengan p peubah penjelas dan n pengamatan, β adalah vektor koefisien regresi (parameter) berukuran (p x 1) dan ε adalah vektor sisaan berukuran (n x 1). Metode yang sering digunakan oleh para peneliti adalah metode kuadrat terkecil yang dirancang untuk menghasilkan penduga b untuk menduga β, dan nilai dugaan
sehingga
yang meminimumkan jumlah kuadrat sisaan
Penduga M Penduga M pertama kali dikenalkan oleh Huber pada tahun 1964 sebagai alternatif penduga regresi kekar untuk MKT. Metode ini mengganti persamaan (1) menjadi
pada
.
Secara umum penduga M meminimumkan fungsi objektif :
dimana fungsi objektif. Fungsi
memberikan kontribusi pada masing-masing sisaan pada fungsi harus memenuhi sifat berikut:
1.
(e) ≥ 0
2.
(0) = 0
3.
(e) = (-e)
4.
≥
untuk
Misalkan
>
=
adalah turunan dari
, maka untuk
meminimumkan persamaan (2) :
Ditentukan fungsi pembobot
, dan misalkan
maka
persamaan dapat ditulis sebagai berikut
Pembobot dalam penduga M bergantung pada sisaan dan koefisien. Prosedur untuk mendapatkan parameter penduga yaitu iterasi yang disebut dengan kuadrat terkecil tertimbang iteratif (iteratively reweighted least squares/IRLS), tahapanya : 1) Duga parameter regresi b(0) dengan MKT. 2) Pada setiap iterasi t, hitung sisaan
dan gabungkan pembobot
dari iterasi sebelumnya. 3) Penduga parameter kuadrat terkecil terboboti yang baru adalah
dengan X adalah matriks model dengan
adalah baris ke-i, dan
4) Ulangi langkah 2 dan 3 hingga didapatkan penaksiran parameter yang konvergen.
Pada penduga M terdapat banyak macam jenis penimbang yang dapat digunakan, diantaranya adalah:
1. Fungsi penimbang yang disarankan oleh Huber memakai fungsi objektif
dengan
dan fungsi penimbang
Gambar 3 Fungsi objektif untuk fungsi penimbang Huber.
2. Fungsi penimbang yang disarankan oleh Tukey memakai fungsi objektif
dengan
dan fungsi penimbang
Gambar 4 Fungsi objektif untuk fungsi penimbang Tukey (bisquare).
Pengaruh besarnya simpangan e terhadap nilai dugaan dapat dilihat dari perilaku p(e) atau w(e) (Gambar 3 dan 4). Berdasarkan kurva p(e) terlihat bahwa kedua fungsi penimbang tersebut berprilaku mirip rataan dalam selang tertentu di bagian tengah data, di luar batas tersebut pengaruhnya menjadi konstan pada fungsi Huber dan mengecil menuju nol pada penimbang ganda Tukey Aunuddin 1989). Sedangkan dari kurva w(e) terlihat bahwa fungsi Huber memberikan penimbang sebesar satu untuk
dan mengecil pada
. Pada fungsi
Tukey, penimbangnya mengecil setelah e beranjak dari nol dan ketika penimbangnya nol (Fox 2002). Dengan kata lain semakin besar simpangann mutlak ei akan semakin kecil penimbangnya begitu pula sebaliknya dengan harapan memperkecil dampak dari pencilan. Pemilihan konstanta k pada regresi kekar bertujuan menentukan penduga kekar untuk pencilan dan penduga efisien. Bila nilai konstantanya kecil maka model regresi akan lebih kekar tetapi kurang efisien. Sedangkan bila nilai konstantanya besar maka model regresi akan kurang kekar tetapi lebih efisien. Lu (2004) menyatakan bahwa konstanta yang menghasilkan efisiensi 95% dimana galatnya normal serta selalu memberikan perlindungan terhadap pencilan yaitu konstanta sebesar k = 1.345 untuk fungsi penimbang Huber dan sebesar k = 4.685 untuk fungsi penimbang ganda Tukey. Koefisien regresi b yang dihasilkan masing-masing memiliki sebaran. Sebaran ini berfungsi untuk mengetahui ukuran pemusatan dan ukuran penyebaran dari dugaan. Dimana ukuran pemusatan dilihat dari hasil nilai dugaan
yang sama dengan nilai sebenarnya sedangkan ukuran penyebarannya dilihat dari nilai ragam dugaannya. Besar kecilnya nilai ragam ini menjadi petunjuk mengenai tingkat ketelitian dari dugaan yang diperoleh. Beberapa peneliti menyarankan untuk mendekati sebaran koefisien regresi b dengan sebaran asimptotiknya. Hal ini dikarenakan adanya proses iterasi dengan penimbang yang nilainya tergantung pada sisaan yang menjadi sumber kesulitan. untuk menduga
Dengan menggunakan untuk menduga
, dan
maka menghasilkan matrik ragam peragam asimptotik
untuk b adalah
Penduga S Penduga S adalah salah satu penduga yang memiliki efisiensi yang rendah. Penduga ini diperoleh dari minimasi dugaan M skala sisaan. Definisi 1. Misalkan
penduga
dan dengan
Penduga S didefinisikan sebagai dugaan M skala sisaan
vektor sisaan. diperoleh dari
yang merupakan solusi
(Rousseeuw & Yohai 1984). Penduga
S
dapat
dinyatakan
dalam
bentuk
lain,
yaitu
. Bentuk yang terakhir ini bisa representasikan dengan sistem persamaan yang merupakan formula penghitungan simultan pendugaan kekar parameter regresi dan pendugaan kekar skala (Maronna et al. 2006), yaitu:
Besaran
pada sistem persamaan di atas adalah peubah kendali dengan nilai
Sedangkan fungsi asumsi, yaitu
.
merupakan suatu fungsi simetrik yang memenuhi beberapa untuk setiap
dan
differentiable (dapat diturunkan) dan turunannya bersifat kontinu,
,
bersifat ,
dan jika
dan
turunan fungsi
yang memenuhi beberapa asumsi, yakni:
untuk
fungsi terbatas,
dan
maka
fungsi tidak turun dan
untuk
fungsi kontinu, dan
. Sementara fungsi
adalah
,
.
Penduga MM Penduga MM pertama kali dikenalkan oleh Yohai (1987). Penduga MM merupakan kombinasi antara penduga yang mempunyai nilai breakdown tinggi (50%) dengan efisiensi yang tinggi (kurang lebih 95% hampir sama dengan metode kuadrat terkecil). Dalam penelitian ini penduga MM berasal dari gabungan antara penduga S yang mempunyai nilai breakdown tinggi dengan penduga M yang mempunyai efisiensi yang tinggi sehingga penduga ini memenuhi kriteria yang diharapkan untuk suatu penduga kekar. Penduga MM mengacu pada fakta bahwa lebih dari satu prosedur penduga M digunakan untuk menghitung penduga akhir. Mengikuti kasus penduga M, IRLS digunakan untuk mendapatkan penduga. Prosedurnya sebagai berikut: 1. Penduga awal dari koefisien b(1) dan sisaan
diambil dari regresi
dengan resistant tinggi yaitu penduga S. Meskipun penduga harus konsisten, ini tidak perlu efisien. 2. Sisaan
dari penduga awal pada Tahap 1 digunakan untuk menghitung
sisaan penduga M skala, 3. Penduga awal sisaan
. dari Tahap1 dan sisaan skala
dari Tahap 2
digunakan dalam iterasi pertama kuadrat terkecil terboboti untuk menentukan koefisien regresi penduga M.
dimana wi penimbang Huber. 4. Penimbang baru dihitung
, menggunakan sisaan dari WLS awal
(Langkah 3). 5. Menjaga kekonstanan pengukuran sisaan skala dari Langkah 2, Langkah 3 dan 4 dilanjutkan dengan iterasi sampai konvergen.
Efisiensi Efisiensi dari dua penduga adalah rasio dari ukuran sampel yang diperlukan untuk mendapatkan keakuratan yang sama. Jika
dan
masing-
masing adalah penduga tak bias untuk parameter β, maka efisiensi relatif terhadap
adalah
disbanding
jika var (
. Penduga ) < var ( ) atau
dikatakan lebih efisien
(Wackerly et al. 2008).