PERBANDINGAN METODE ESTIMASI- , ESTIMASI- , DAN ESTIMASI-
PADA MODEL REGRESI ROBUST UNTUK
MEMPREDIKSI PRODUKSI KEDELAI DI INDONESIA Jurnal Diajukan kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta untuk Memenuhi Sebagian Persyaratan guna Memperoleh Gelar Sarjana Sains
Oleh Wening Dyah Pratitis NIM 12305144023
PROGRAM STUDI MATEMATIKA JURUSAN PENDIDIKAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI YOGYAKARTA 2016
Perbandingan Metode Estimasi-M .... (Wening Dyah Pratitis) 1
PERBANDINGAN METODE ESTIMASI-๐ด, ESTIMASI-๐บ, DAN ESTIMASI-๐ด๐ด PADA MODEL REGRESI ROBUST COMPARISON OF M-ESTIMATION, S-ESTIMATION, AND MM-ESTIMATION METHODS OF ROBUST REGRESSION Oleh: Wening Dyah Pratitis1), Endang Listyani2) Program Studi Matematika, Jurusan Pendidikan Matematika, FMIPA UNY 1)
[email protected] 2)
[email protected] Abstrak Analisis regresi linier adalah analisis terhadap hubungan satu variabel dependen (๐) dengan satu atau lebih variabel independen (๐). Estimasi parameter yang sering digunakan adalah Metode Kuadrat Terkecil (MKT). MKT memberikan nilai error yang besar apabila data mengandung pencilan. untuk itu diperlukannya model regresi robust yang dapat menangani keberadaan pencilan. Permasalahan yang akan dikaji adalah membandingkan metode estimasi-๐, estimasi-๐, dan estimasi-๐๐ pada model regresi robust. Tujuan dari penelitian ini adalah untuk membandingkan manakah dari ketiga metode estimasi yang paling efektif untuk memprediksi produksi kedelai di Indonesia. Dalam penelitian ini diambil data produksi kedelai sebagai variabel ๐ dan variabel independen yang meliputi luas panen, suhu, curah hujan, kelembaban, dan lama penyinaran. Keefektifan suatu metode dapat dibandingkan dengan melihat nilai ๐
2. Dari hasil pembahasan diperoleh metode estimasi paling efektif untuk memprediksi produksi kedelai di Indonesia adalah metode estimasi-๐ dengan nilai R2 sebesar 97,73%, estimasi๐๐ sebesar 82,22%, dan estimasi-๐ sebesar 67,38%. Kata kunci: analisis regresi, metode kuadrat terkecil, regresi robust, estimasi-๐, estimasi-๐, estimasi-๐๐. Abstract Linear regression analysis is an analysis of the relationship of one dependent variable (Y) with one or more independent variables (X). Frequently used parameter estimation is the Ordinary Least Squares (OLS). OLS is not precise when the data has outlier, it needs robust regression models that can handle the presence of outlier. The issue that will be examined is to compare methods of M-estimation, S- estimation and MM-estimation of robust regression model. The purpose of this study is to compare which of these three methods of estimation is the most effective way to predict the production of soybean in Indonesia. In this study, The Y variable is the soybean production data, and the X variables include crop land area, temperature, precipitation, humidity, and length shines. The effectiveness of a method can be compared by looking at the value of ๐
2. From the results, it is obtained that the most effective estimation methods to predict the production of soybean in Indonesia is S-estimation method with R2 value of 97,73%, MM-estimation of 82,22%, and M-estimation of 67,38%. Keywords: regression analysis, ordinary least square, robust regression, M-estimation, S-estimation, MM-estimation
atau sering disebut Ordinary Least Squares
PENDAHULUAN Analisis
regresi
merupakan
metode
(OLS). Penggunaan metode ini membutuhkan
analisis yang dapat digunakan untuk menganalisis
beberapa asumsi
data dan mengambil kesimpulan yang bermakna
menghasilkan model yang baik, yaitu model
tentang hubungan ketergantungan variabel satu
estimasi linier tidak bias terbaik atau Best Linier
terhadap variabel lainnya Salah satu metode
Unbiased Estimator (BLUE), yaitu tidak terdapat
estimasi
sering
multikolinieritas, homoskedastisitas, dan tidak
digunakan adalah metode kuadrat terkecil (MKT)
terdapat autokorelasi. Masalah yang sering terjadi
dalam
regresi
linier
yang
yang harus dipenuhi untuk
pada data amatan adalah adanya pencilan
2 Jurnal Pendidikan Matematika dan Sains Edisi ... Tahun ..ke.. 20...
(outlier). Keberadaan pencilan pada suatu data
Regresi Linier
dapat mengganggu proses analisis data, sehingga
Regresi linier merupakan suatu metode
pendeteksian pencilan merupakan hal yang sangat
analisis statistik yang mempelajari pola hubungan
penting untuk dilakukan.
antara dua variabel atau lebih menggunakan dapat
model persamaan linier, sehingga salah satu
mengakibatkan estimasi koefisien regresi yang
variabel pada model regresi dapat diduga dari
diperoleh kurang efisien karena memberikan nilai
variabel lainnya.
Adanya
pencilan
dalam
data
error yang besar apabila menggunakan MKT.
Model
regresi
linier
sederhana
ini
Sedangkan tindakan membuang begitu saja suatu
merupakan suatu model regresi dasar yang
pencilan bukanlah tindakan yang tepat karena ada
melibatkan satu variabel independen saja. Bentuk
kalanya pencilan memberikan informasi yang
umum regresi linier sederhana dapat dituliskan
cukup berarti. Oleh karena itu, diperlukan suatu
sebagai berikut:
estimasi yang lebih efisien dalam menangani
๐ฆ๐ = ๐ฝ0 + ๐ฝ1 ๐ฅ๐ + ๐๐
(1)
suatu pencilan yang dikenal dengan regresi robust. Regresi robust merupakan metode regresi
(Draper & Smith, 1998:22) dengan ๐ฆ๐ merupakan
yang digunakan ketika distribusi dari sisaan tidak
variabel dependen pada observasi ke-๐, ๐ฅ๐ adalah
normal dan/atau adanya beberapa pencilan yang
konstanta yang diketahui yaitu nilai variabel
berpengaruh pada model (Ryan, 1997:150).
independen yang diketahui, ๐ฝ0 dan ๐ฝ1 adalah
Regresi robust adalah metode yang penting
untuk
menganalisis
data
yang
parameter
koefisien
regresi,
sedangkan
๐๐
merupakan suatu error.
mengandung pencilan. Untuk menaksir parameter
Menurut Montgomery & Peck (1992:53),
regresi robust dapat digunakan beberapa metode
Model regresi linier berganda dengan ๐ variabel
antara
lain:
๐-estimator,
๐-estimator,
independen adalah sebagai berikut:
๐๐-estimator, Least Median of Squares (LMS), dan Least Trimmed Squares (LTS) (Chen,
๐ฆ๐ = ๐ฝ0 + ๐ฝ1 ๐ฅ๐1 + ๐ฝ2 ๐ฅ๐2 + โฏ + ๐ฝ๐ ๐ฅ๐๐ + ๐๐ atau dapat ditulis
2002:1). ๐ฆ๐ = ๐ฝ0 + โ๐๐=1 ๐ฝ๐ ๐ฅ๐๐ + ๐๐
Pada penelitian ini, akan dibahas regresi robust
dengan
estimasi-๐,
estimasi-๐,
dan
untuk ๐ = 1,2, โฆ , ๐
estimasi-๐๐, serta ditunjukkan estimasi yang
dengan:
paling efektif dengan membandingkan nilai
๐ฆ๐
= nilai variabel dependen pada
koefisien determinasi dari ketiga metode tersebut
observasi ke-๐
untuk memodelkan data pada produksi kedelai di
๐ฝ0 , ๐ฝ1 , โฆ , ๐ฝ๐ = parameter koefisien regresi
Indonesia. Tujuan dari penelitian ini adalah untuk
๐ฅ๐๐
membandingkan keefektifan model melalui nilai ๐
2.
(2)
= nilai variabel independen yang ke-๐ pada observasi ke-๐
๐๐
= random error
Perbandingan Metode Estimasi-M .... (Wening Dyah Pratitis) 3
Parameter ๐ฝ0 , ๐ฝ1 , โฆ , ๐ฝ๐ tidak diketahui Uji Asumsi
dan perlu ditentukan nilai estimasinya. Menurut
Pada penelitian ini, diambil simulasi data
Montgomery
&
Peck
Terkecil
(1992:112),
(MKT)
Metode
dari Badan Pusat Statistika (BPS) dan Dinas
Kuadrat
digunakan
untuk
Pertanian. Data yang diambil adalah data dari 34
mengestimasi koefisien ๐ฝ0 , ๐ฝ1 , ๐ฝ2 , โฆ , ๐ฝ๐ yaitu
propinsi di Indonesia meliputi produksi kedelai
dengan meminimumkan jumlah kuadrat galat.
sebagai variabel dependen, dan beberapa variabel
Fungsi yang meminimumkan adalah: ๐
independen yang meliputi luas area panen, suhu,
๐(๐ฝ0 , ๐ฝ1 , โฆ , ๐ฝ๐ ) = โ ๐๐ 2
curah hujan, kelembaban, dan lama penyinaran.
๐=1
Pada model regresi, perlu dilakukan uji
= โ๐๐=1(๐ฆ๐ โ ๐ฝ0 โ โ๐๐=1 ๐ฝ๐ ๐ฅ๐๐ )
2
(3)
asumsi analisis regresi untuk mengetahui apakah model baik (memenuhi asumsi) atau tidak.
Fungsi ๐ akan diminimalkan dengan menentukan
Asumsi yang memenuhi analisis regresi dengan
turunannya
MKT antara lain: data berdistribusi normal,
memenuhi
homoskedastisitas, non autokorelasi, dan non
๐๐ ๐๐ฝ
terhadap
๐ฝ0 , ๐ฝ1 , โฆ , ๐ฝ๐ ,
harus
= โ2 โ๐๐=1(๐ฆ๐ โ ๐ฝ0 โ โ๐๐=1 ๐ฝ๐ ๐ฅ๐๐ ) = 0
multikolinieritas.
Notasi matriks yang diberikan pada Persamaan
Identifikasi Outlier
(2) adalah ๐ = ๐ฟ๐ท + ๐
Untuk mengidentifikasi adanya outlier, penulis menggunakan pengujian residu Jackknife atau
externally
R-student.
studendized
Menurut
residual
Chatterjee
&
atau Hadi
(1986:380), definisi Jackknife atau biasa juga disebut sebagai R-student, yang dilambangkan dengan ๐ก๐ adalah: ฬ๐) = ๐ก๐ = ๐๐ (๐
dengan
๐๐
(4)
ฬ (๐) โ1 โ โ๐๐ ๐
๐ = ๐ฃ๐๐๐๐๐๐๐ + 1
dan
๐ก๐
berdistribusi ๐ก๐โ๐โ1 jika model asumsi terpenuhi dan ๐๐
~๐(0, ๐2 ๐ผ).
dengan ๐ฆ1 ๐ฆ2 ๐ = [ โฎ ]; ๐ฆ๐
1 1 ๐ = [โฎ 1
๐ฝ1 ๐ฝ2 ๐ฝ = [ ]; โฎ ๐ฝ๐
๐1 ๐2 ๐=[โฎ] ๐๐
๐ฅ11 ๐ฅ21 โฎ ๐ฅ๐1
๐ฅ12 โฆ ๐ฅ22 โฆ โฎ โฑ ๐ฅ๐2 โฆ
๐ฅ1๐ ๐ฅ2๐ โฎ ]; ๐ฅ๐๐
Regresi Robust Regresi robust merupakan metode regresi
Notasi โ๐๐ merupakan elemen
yang digunakan ketika distribusi dari sisaan tidak
diagonal ke-๐ dari matriks hat dan ๐๐ merupakan
normal dan/atau adanya beberapa pencilan yang
residu ke-๐. Metode Kuadrat Terkecil
berpengaruh pada model (Ryan, 1997:150). Metode ini merupakan alat penting untuk
Setelah pengujian asumsi dan outlier,
menganalisa data yang dipengaruhi oleh pencilan
langkah selanjutnya yaitu membuat persamaan
sehingga dihasilkan model yang robust atau
regresi dengan metode kuadrat terkecil.
resistance terhadap pencilan. Estimasi-๐ด
4 Jurnal Pendidikan Matematika dan Sains Edisi ... Tahun ..ke.. 20... k ๏ฆ ๏ถ ๏ง y i ๏ญ ๏ฅ x ij ๏ข j ๏ท j ๏ฝ0 ๏ง ๏ท ๏น๏ง ๏ท ๏ณห s ๏ง๏ง ๏ท๏ท ๏จ ๏ธ w(u i ) ๏ฝ k ๏ฆ ๏ถ ๏ง y i ๏ญ ๏ฅ x ij ๏ข j ๏ท j ๏ฝ0 ๏ง ๏ท ๏ง ๏ท ๏ณห s ๏ง๏ง ๏ท๏ท ๏จ ๏ธ
Menurut Montgomery, Peck, & Vining (2006:372), Estimasi-๐ adalah suatu kelas dari regresi robust yang meminimalkan suatu fungsi residu ๐ sebagai berikut: n
ฬ = min ๏ฒ (e ) ๐ฝ ๏ฅ i ๐ ๐ท
i ๏ฝ1
n k ๏ฆ ๏ถ ฬ = min ๏ง ๏ท ๐ฝ ๏ฒ y ๏ญ x ๏ข ๏ฅ ๏ฅ i ij j ๐ ๏ง ๏ท ๐ท i ๏ฝ1 j ๏ฝ 0 ๏จ ๏ธ
(5)
(8)
๐
karena nilai ๐ข๐ = ๐ฬ๐ sebagai pengganti ๐๐ , ๐
maka persamaan (8) menjadi: Fungsi ๐ merupakan fungsi representasi pembobot dari residu. fungsi ini merupakan gabungan dari MKT dan Least Absolute Value (LAV). Fungsi Huber lebih resisten terhadap outlier daripada MKT. Sehingga fungsi ๐ yang digunakan adalah fungsi objektif Huber dengan persamaan sebagai berikut: 1 2
(๐ข๐ )2
๐(๐ข๐ ) = { 1 ๐|๐ข๐ | โ 2 ๐ 2
, |๐ข๐ | โค ๐
1 ๐(๐ข๐ ) ๐ค๐ = ๐ค(๐ข๐ ) = ={ ๐ (๐ข๐ ) |๐ข๐ |
, |๐ข๐ | > ๐
untuk fungsi pembobot Huber, konstanta yang digunakan adalah ๐ = 1,345 (Fox, 2002:3). Pada umumnya, fungsi ๐ merupakan fungsi yang tidak linear dan Persamaan (7) harus diselesaikan
, |๐ข๐ | โค ๐ , |๐ข๐ | > ๐
dengan menggunakan iteratively reweighted least (6)
squares (IRLS), maka diperoleh k ๏ฆ y ๏ญ xij ๏ข j ๏ง ๏ฅ i n j ๏ฝ0 ๏ง xij๏น ๏ง ๏ฅ ๏ณห s i ๏ฝ1 ๏ง๏ง ๏จ
dengan ๐(๐ข๐ ) adalah fungsi simetris dari residu atau fungsi yang memberikan kontribusi pada masing-masing residu pada fungsi objektif, ๐
dengan ๐ข๐ = ๐ฬ๐ .
๏ถ ๏ท ๏ท ๏ท๏ฝ0 ๏ท๏ท ๏ธ
(9)
sehingga
๐
k ๏ฆ ๏ถ ๏ง x w y ๏ญ x ij ๏ข j ๏ท๏ท ๏ฝ 0 , ๏ฅ ๏ฅ ij i 0 ๏ง i i ๏ฝ1 j ๏ฝ0 ๏จ ๏ธ n
Untuk meminimalkan Persamaan (5), akan digunakan turunan parsial pertama fungsi ๐ terhadap ๐ฝ๐ (๐ = 0, 1, โฆ , ๐) sama dengan 0, sehingga menghasilkan suatu kondisi minimum. Sehingga diperoleh k ๏ฆ y ๏ญ ๏ง i ๏ฅ xij ๏ข j n j ๏ฝ0 ๏ง xij๏น ๏ง ๏ฅ ๏ณห s i ๏ฝ1 ๏ง๏ง ๏จ
dengan
๐ = ๐โฒ
dan
๏ถ ๏ท ๏ท ๏ท๏ฝ0 ๏ท๏ท ๏ธ ๐ฅ๐๐
(7)
merupakan
(10)
dengan ๏ฌ 1 ๏ฏ ๏ฏ k ๏น ๏ฏ ๏ฉ y ๏ญ x ij ๏ข j ๏บ ๏ฅ i ๏ฏ ๏ช j ๏ฝ0 ๏บ ๏ฏ๏ฏ๏น ๏ช ๏ช ๏บ ๏ณห s wi 0 ๏ฝ ๏ญ ๏ช ๏บ ๏ฏ ๏ซ ๏ป ๏ฏ k ๏ฏ y ๏ญ x ๏ข ๏ฅ i ij j ๏ฏ j ๏ฝ0 ๏ฏ ๏ฏ๏ฎ ๏ณห s
k
, y i ๏ฝ ๏ฅ x iหj ๏ข j j ๏ฝ0
(11) k
, y i ๏น ๏ฅ x ij ๏ข j j ๏ฝ0
observasi ke-i pada regressor ke-j dan ๐ฅ๐0 = 1. Berdasarkan definisi, fungsi pembobot ๐ค(๐ข๐ ) dari persamaan (7), yaitu:
Untuk kasus regresi berganda, persamaan (10) menjadi:
Perbandingan Metode Estimasi-M .... (Wening Dyah Pratitis) 5
dengan ๐๐ merupakan residu ke-i dari ๐ฝ k ๏ฆ ๏ถ ๏ง x w y ๏ญ x ij ๏ข j ๏ท๏ท ๏ฝ 0 ๏ฅ ๏ฅ ij i 0 ๏ง i i ๏ฝ1 j ๏ฝ0 ๏จ ๏ธ
ฬ ๐ (๐1 , ๐2 , โฆ , ๐๐ ) didefinisikan sebagai solusi dan ๐
n
n
n
dari: k ๏ฆ y ๏ญ x ij ๏ข j ๏ง ๏ฅ i 1 n ๏ฆ ei ๏ถ 1 n ๏ง j ๏ฝ0 ๏ฅ ๏ฒ๏ง ๏ท ๏ฝ ๏ฅ ๏ฒ n i ๏ฝ1 ๏ง๏จ ๏ณห s ๏ท๏ธ n i ๏ฝ1 ๏ง ๏ณห s ๏ง๏ง ๏จ
k
๏ฅ xij wi 0 y i ๏ญ ๏ฅ๏ฅ x wi 0 ๏ข j ๏ฝ 0 i ๏ฝ1
n
2 ij
i ๏ฝ1 j ๏ฝ 0
k
n
๏ฅ๏ฅ xij2 wi 0 ๏ข j ๏ฝ ๏ฅ xij wi 0 y i i ๏ฝ1 j ๏ฝ 0
(12)
i ๏ฝ1
k ๏ฆ y ๏ญ x ij ๏ข j ๏ง ๏ฅ i 1 n ๏ง j ๏ฝ0 ๏ฅ๏ฒ n i ๏ฝ1 ๏ง ๏ณห s ๏ง๏ง ๏จ
dalam notasi matriks, persamaan (12) di atas menjadi: ๐ฟ๐ป ๐พ๐ ๐ฟ๐ท = ๐ฟ๐ป ๐พ๐ ๐
(13)
dengan ๐พ0 adalah matriks bobot berordo ๐ร๐
dengan
elemen
diagonal
utama
didefinisikan
๐พ =0,1995
sebagai
2011:415).
(11). Persamaan (13) dikenal sebagai persamaan
(๐ฬ๐ ) sehingga menghasilkan
karena itu, estimator satu-langkah (one-step estimator) adalah: ๐ท = (๐ฟ๐ป ๐พ0 ๐ฟ)โ1 ๐ฟ๐ป ๐พ0 ๐ ulang
๐
Persamaan
(17)
(Alma,
dibagi
dengan
2
๐
๏ณห s ๏ฝ
1 nK
n
๏ฅw e i ๏ฝ1
2 i i
(18)
(14)
Salah satu fungsi ๐ (pembobot) untuk
Langkah berikutnya adalah menghitung
Persamaan (17) adalah fungsi Tukey bisquare
bobot
dari
Persamaan
(3.9)
tetapi
ฬ 1 bukan ๐ท ฬ 0 . Pada umumnya, menggunakan ๐ท untuk
(17)
dengan ๐พ merupakan suatu konstanta yang
๐ค10 , ๐ค20 , โฆ , ๐ค๐0 yang diberikan pada Persamaan normal weighted least squares (WLS). Oleh
๏ถ ๏ท ๏ท ๏ท๏ฝK ๏ท๏ท ๏ธ
๏ถ ๏ท ๏ท ๏ท; ๏ท๏ท ๏ธ
๐พ๐
bobot
yang
diberikan
dapat
menyelesaikan: ฬ ๐+1 = (๐ฟ๐ป ๐พ๐ ๐ฟ)โ1 ๐ฟ๐ป ๐พ๐ ๐ ๐ท
(15)
(Rousseeuw & Leroy, 1987). Berikut merupakan fungsi pembobot Tukey bisquare: ๐ข๐2 ๐ข๐4 ๐ข๐6 โ 2+ 4 ๐(๐ข๐ ) = 2 2๐2 6๐ ๐ { 6
๐ข๐๐ก๐ข๐ |๐ข๐ | โค ๐ ๐ข๐๐ก๐ข๐ |๐ข๐ | > ๐
Iterasi terus dilakukan hingga mencapai
dengan ๐(๐ข๐ ) adalah fungsi simetris dari
ฬ ๐+1 dengan konvergen, yaitu hingga selisih nilai ๐ท
residu yaitu fungsi yang memberikan kontribusi
ฬ ๐ mendekati 0. ๐ท
pada masing-masing residu pada fungsi objektif. Turunan dari fungsi ๐ adalah:
Estimasi-๐บ (Scale) Menurut Montgomery, Peck, & Vining, (2006:388), estimasi-๐ akan meminimumkan suatu ukuran skala residu, dapat didefinisikan hasil estimasi dari persamaan berikut: ฬ = min๐ฝ ๐ ฬ ๐ [๐1 (๐ฝ), ๐2 (๐ฝ), โฆ , ๐๐ (๐ฝ)] ๐ฝ ๐
(16)
2๐ข๐3 ๐ข๐5 ๐ข โ + 4 ๐(๐ข๐ ) = ๐โฒ (๐ข๐ ) = { ๐ ๐2 ๐ 0 ๐ข๐ 2 2 = {๐ข๐ (1 โ ( ๐ ) ) 0
, |๐ข๐ | โค ๐ , |๐ข๐ | > ๐
, |๐ข๐ | โค ๐ , |๐ข๐ | > ๐
6 Jurnal Pendidikan Matematika dan Sains Edisi ... Tahun ..ke.. 20...
sehingga diperoleh ๐ค๐ yang merupakan suatu
5) Mengulang langkah 2, 3, 4 diulang (reiterasi
fungsi pembobot iteratively reweighted least
dengan skala residual tetap konstan) sampai
squares (IRLS)
โ๐๐=1|๐๐ (๐) | konvergen,
๐ข 2 ๐ข๐ (1 โ ( ๐๐ ) ) ๐ค๐ (๐ข๐ ) = ๐ข๐ { 0 dengan ๐ข๐ =
๐๐ ๐
2
ฬ ๐ฝ
, |๐ข๐ | โค ๐
(๐+1)
ฬ (๐) mendekati 0, dengan ๐ dengan ๐ฝ ๐
adalah banyaknya iterasi.
, |๐ข๐ | > ๐
dan agar diperoleh breakdown
yaitu selisih nilai
Estimasi-๐๐
didefinisikan
sebagai
berikut ๐
๐๐ ฬ ๐ฝ โ ๐๐๐ โ ๐ ( ) ๐๐ = arg ฬ๐ ๐
point secara konsisten mendektai 50%, maka
๐ฝ
ditetapkan c = 1,547 (Fox, 2002:3). Persamaan
๐=1
๐ ฬ ๐ฝ โ ๐๐๐ โ๐=1 ๐ ( ๐๐ = arg
(17) pada estimasi-S dapat diselesaikan dengan
๐ฆ๐ โโ๐๐=0 ๐ฅ๐๐ ๐ฝ๐ ฬ๐ ๐
๐ฝ
metode IRLS hingga mencapai konvergen.
)
(19)
Untuk meminimunkan Persamaan (19), Estimasi-๐ด๐ด
turunan parsial pertama fungsi ๐ terhadap
Metode estimasi ini dikenalkan oleh Yohai (1987) yang menggabungkan suatu high breakdown point (50%) dengan efisiensi tinggi (95%). Alur dari estimasi-๐๐ dapat diuraikan
๐ฝ๐ (๐ = 0,1, โฆ , ๐) akan sama dengan 0, sehingga menghasilkan minimum.
suatu
Dengan
kondisi
perlu
mendefinisikan
untuk fungsi
pembobot yang sama, Persamaan (19) dapat ditulis sebagai berikut
sebagai berikut: 1) Mengestimasi
koefisien
ฬ ๐ฝ ๐
(1)
,
diperoleh residual ๐๐ (1) yang diambil dari regresi robust dengan high breakdown point. 2) Residual
๐๐ (1)
pada
langkah
pertama
digunakan untuk menghitung skala residual ฬ dan dihitung pula bobot awal estimasi-M, ๐
๐ค๐
โ๐๐=1 ๐ฅ๐๐ ๐ค๐ (๐ฆ๐ โ โ๐๐=0 ๐ฅ๐๐ ๐ฝ๐ ) = 0
sehingga
(1) .
ฬ dari 3) Residual ๐๐ (1) dan skala residual ๐
(20)
Selanjutnya, Persamaan (20) akan diselesaikan ฬ menggunakan IRLS. Estimasi awal koefisien ๐ฝ
(1)
dan ๐๐ (1) , diambil dari regresi robust dengan high breakdown point (estimasi-S). Untuk pembobot permulaan
๐ค๐ (1) = ๐ค(๐๐ (1) ),
maka Persamaan
(20) dapat ditulis sebagai berikut: ๐
langkah (2) digunakan dalam iterasi awal
๐
โ ๐ฅ๐๐ ๐ค๐
dengan metode WLS untuk menghitung
(1)
(๐ฆ๐ โ โ ๐ฅ๐๐ ๐ฝ๐ ) = 0,
๐=1
๐=0
koefisien regresi. ๐
โ ๐ค๐
๐ (1) ( ๐
๐โ1
๐ = 0,1, โฆ , ๐
(1)
ฬ ๐
) ๐ฅ๐ = 0
dengan
dengan ๐ค๐ menggunakan pembobot Huber atau Tukey Bisquare 4) Menghitung bobot baru ๐ค๐ (2) menggunakan residual dari iterasi awal WLS (langkah 3).
(21)
๏น( ๐ค๐
(1)
=
(1) ๐ฆ๐ โ โ๐๐=0 ๐ฅ๐๐ ๐ฝฬ๐ ) ๐ฬ๐
๐ฆ๐ โ
๐ฬ๐ {
1 , ๐๐๐๐ ๐ฆ๐ = โ๐๐=0 ๐ฅ๐๐ ๐ฝฬ๐
๐ (1) , ๐๐๐๐ ๐ฆ๐ ๏น โ ๐ฅ๐๐ ๐ฝฬ๐
(1) โ๐๐=0 ๐ฅ๐๐ ๐ฝฬ๐
๐=0 (1)
Perbandingan Metode Estimasi-M .... (Wening Dyah Pratitis) 7
Untuk kasus regresi berganda, Persamaan
0,118 lebih besar dari 0.05 = ฮฑ, maka residu
(20) menjadi: ๐
nilai signifikansi (Asymp. Sig. 2-Tailed) sebesar
๐
๐ 2
โ โ ๐ฅ๐๐ ๐ค๐
(1)
berdistibusi normal.
๐ฝฬ๐ = โ ๐ค๐ (1) ๐ฅ๐ ๐ฆ๐
๐=1 ๐=0
2.
๐=1
Uji Homoskedastisitas Uji homoskedastisitas dalam hal ini
dalam notasi matriks, Persamaan (20) di atas
menggunakan rank spearman. Berdasar hasil
menjadi: ๐ฟโฒ ๐พ(๐) ๐ฟ๐ท = ๐ฟโฒ ๐พ(๐) ๐
(21)
maka, estimator satu langkah dapat
output SPSS, diperoleh sebagai berikut: Tabel 2. Hasil Uji Homoskedastisitas
ditulis sebagai berikut:
Variabel Independen
ฬ (๐) = (๐ฟโฒ ๐พ(๐) ๐ฟ)โ๐ ๐ฟโฒ๐พ(๐) ๐ ๐ท Pada
langkah
selanjutnya,
(22)
dihitung
(2) kembali bobot dari ๐ค๐ (2) menggunakan ๐ฝฬ๐ dan
skala residual ๐ฬ๐ . Untuk ๐ค๐ (๐) bobot yang diberikan, dapat diperoleh estimator ๐ฝฬ (๐+1) =
X1 (Luas area panen) X2 (Suhu) X3 (Curah Hujan) X4 (Kelembaban) X5 (Lama Penyinaran)
Sig (2-Tailed) Unstandardized Residual 0,059 > 0,05 0,066 > 0,05 0,345 > 0,05 0,258 > 0,05 0,153 > 0,05
dibutuhkan
Pada Tabel 2. diperoleh nilai sig pada
beberapa iterasi hingga โ๐๐=1|๐๐ (๐) | konvergen,
masing-masing variabel independen lebih dari
(๐ฟโฒ ๐พ(๐) ๐ฟ)โ๐ ๐ฟโฒ๐พ(๐) ๐.
Biasanya
(๐) yaitu selisih nilai ๐ฝฬ (๐+1) dengan ๐ฝฬ๐ mendekati
๏ก = 0,05, maka masing-masing variabel tidak terjadi heteroskedastisitas.
0. 3. HASIL EMPIRIK
Uji Non Autokorelasi Berdasar hasil output SPSS, uji Durbin-
Pada penelitian ini, diambil data dari
Watson menghasilkan nilai ๐ sebesar 2,096,
Badan Pusat Statistik dan Dinas Pertanian.
dengan ๐๐ = 1,8076 dan (4 โ ๐๐) = 2,1924.
Produksi kedelai sebagai variabel independen (๐),
Artinya nilai d berada diantara ๐๐ dan (4 โ ๐๐)
dan variabel dependen (๐) meliputi luas area
sehingga dapat disimpulkan bahwa model regresi
panen (๐1), suhu (๐2), curah hujan (๐3),
tidak terdapat autokorelasi.
kelembaban (๐4), dan lama penyinaran (๐5).
4.
Langkah pengolahan data diawali dengan
Uji Non Multikolinieritas Uji
non
multikolinieritas
dilakukan
uji asumsi, pemodelan dengan MKT, uji outlier,
dengan membandingkan nilai tolerance dan VIF.
dan menentukan model estimasi-๐, estimasi-๐,
Berdasar hasil output SPSS, diperoleh hasil uji
dan estimasi-๐๐ serta membandingkan nilai
non multikolinieritas sebagai berikut:
efektifitas antara ketiga metode tersebut.
Tabel 3. Hasil Uji Non Multikolinieritas
Uji Asumsi 1.
Uji Normalitas Berdasar
hasil
output
SPSS,
uji
Kolmogorov-Sminov pada data yang diperoleh
Variabel Independen ๐1 (Luas area panen)
Tolerance
VIF
0,947 > 0,1
1,056 < 10
8 Jurnal Pendidikan Matematika dan Sains Edisi ... Tahun ..ke.. 20...
๐2 (Suhu) ๐3 (Curah Hujan) ๐4 (Kelembaban) ๐5 (Lama Penyinaran)
0,235 > 0,1
4,252 < 10
0,676 > 0,1
1,479 < 10
0,365 > 0,1
R-Student 4 Jateng 2,7478
2
2,740 < 10
0
0,387 > 0,1
0
2,582 < 10
-2
Pada Tabel 3 diperoleh masing-masing nilai tolerance lebih besar dari 0,1 dan nilai VIF kurang dari 10, sehingga dapat diartikan bahwa tidak adanya multikolinieritas antara variabel independen.
-4
10
20
30
Aceh -2,4649 NTB -5,6674
-6 -8
Dari Gambar 1 dapat dilihat bahwa nilai R-student pada observasi keโ๐
Metode Kudrat Terkecil
40
(๐ก๐ ), yaitu
observasi pertama yaitu Provinsi Aceh (๐ก1 ), Jawa
Untuk memudahkan perhitungan, penulis menggunakan program SAS 9.1, diperoleh model regresi yang dapat dibentuk sebagai berikut: ๐ฬ๐๐พ๐ = โ2136,63382 + 1,65022๐1 โ 67,55636๐2
Tengah sebagai observasi ke-13 (๐ก13 ) dan Nusa Tenggara Barat sebagai obsetvasi ke-18 (๐ก18 ) terletak pada daerah penolakan, maka observasi ke-1, ke-13 dan ke-18 merupakan outlier. Dengan
โ 3,78511๐3 + 69,48093๐4
demikian, metode kuadrat terkecil tidak dapat
โ 483,48411๐5
digunakan untuk melihat pengaruh dari variabel independennya.
dengan:
Oleh
karena
itu,
metode
estimasi-๐, estimasi-๐, dan estimasi-๐๐ yang
๐ฬ = Produksi kedelai
akan digunakan untuk menyelesaikan kasus ini.
๐1= Luas area panen
Ketiga metode tersebut akan dibandingkan satu
๐2= Suhu
dengan yang lainnya.
๐3= Curah hujan
Estimasi-๐ด
๐4= Kelembaban
Dengan menggunakan program SAS 9.1,
๐5= Lama Penyinaran
telah diperoleh model regresi sebagai berikut: Uji Outlier Dengan taraf nyata ๏ก = 5%, p = 6 dan ๐ = 34, maka dari tabel distribusi ๐ก telah diperoleh ๐ก๐ผ;(๐โ๐โ1) = 2,5018, sehingga nilai didapatkan 2
โ2,0518 < |๐
โ ๐ ๐ก๐ข๐๐๐๐ก| < 2,0518,
ฬ ๐ = โ1901,65 + 1,6596๐1 โ 211,516๐2 ๐
โ5,0494๐3 + 101,1419๐4 โ 144,070๐5 Estimasi-๐บ Dengan menggunakan bantuan software
dengan
SAS 9.1 untuk menghitung estimasi dalam
menggunakan bantuan software, diperoleh nilai
regresi robust, model regresi yang dapat dibentuk
R-Student sebagai berikut
adalah sebagai berikut:
Gambar 1. Plot Nilai Residu Jackknife untuk Setiap Observasi
๐ฬ๐ = โ960,84 + 1,4424๐1 โ 106,18๐2 โ3,4728๐3 + 58,5809๐4 โ 129,65๐5
Perbandingan Metode Estimasi-M .... (Wening Dyah Pratitis) 9
SIMPULAN DAN SARAN
Estimasi-๐ด๐ด Dengan menggunakan program SAS 9.1,
Simpulan
telah diperoleh model regresi sebagai berikut:
Dari pembahasan yang telah dipaparkan
ฬ ๐๐ = โ967,961 + 1,4452๐1 โ 108,804๐2 ๐
Hasil
penulis, dapat disimpulkan bahwa berdasarkan
โ3,4777๐3 + 58,7784๐4 โ 116,122๐5 .
ketiga metode estimasi, telah diperoleh nilai R-
Perbandingan
square
Estimasi
Parameter
dari
estimasi-๐, nilai
dan
๐
โ ๐ ๐๐ข๐๐๐๐ >
Regresi Robust Estimasi-๐ด, Estimasi-๐บ, dan
estimasi-๐๐,
Estimasi-๐ด๐ด pada Data Produksi Kedelai di
๐
โ ๐ ๐๐ข๐๐๐๐๐ > ๐
โ ๐ ๐๐ข๐๐๐๐
Indonesia Tahun 2014
82,22% > 67,38%. Dengan demikian dapat
Setelah mengetahui model regresi dari
dengan
estimasi-๐,
yaitu
97,73% >
disimpulkan bahwa regresi robust dengan metode
akan
estimasi-S merupakan penaksir yang memberikan
dibandingkan hasil dari ketiga metode estimasi
model paling efektif dari ketiga estimasi tersebut
yaitu antara metode estimasi-๐, estimasi-๐ dan
terhadap data faktor-faktor yang mempengaruhi
estimasi-๐๐. Dengan demikian dapat diketahui
produksi kedelai di Indonesia pada tahun 2014.
metode mana yang memberikan hasil terbaik
Saran
terhadap model.
1. Metode
masing-masing
parameter,
selanjutnya
estimasi-๐,
estimasi-๐,
dan
Tabel 8. Hasil Perbandingan Estimasi Parameter
estimasi-๐๐ merupakan metode yang baik
Regresi Robust antara Estimasi-๐, Estimasi-๐,
dalam menangani masalah pencilan dengan
dan Estimasi-๐๐ pada Data Produksi Kedelai di
memberikan nilai koefisien determinasi yang
Indonesia Tahun 2014
tinggi, namun perlu dipelajari juga metode
Metode
R-Square
estimasi yang lain dan pengaplikasiannya
Estimasi-๐
67,38
dalam menangani pencilan, seperti metode
Estimasi-๐
97,73
๐ฟ๐๐ dan ๐ฟ๐๐.
Estimasi-๐๐
82,22
2. Untuk penelitian selanjutnya, sekiranya dapat
Berdasarkan Tabel 8 di atas dapat dilihat
menggunakan teknik data influence serta bisa
bahwa nilai R-square (๐
2 ), dapat disimpulkan
lebih
bahwa nilai ๐
โ ๐ ๐๐ข๐๐๐๐ > ๐
โ ๐ ๐๐ข๐๐๐๐๐ >
mempengaruhi produksi kedelai di Indonesia
๐
โ ๐ ๐๐ข๐๐๐๐
yaitu
97,73% > 82,22% >
67,38% yang berarti bahwa variansi yang dapat
memperhatikan
faktor-faktor
yang
sehingga dapat menghasilkan model regresi yang lebih baik lagi.
dijelaskan oleh model hasil estimasi-๐๐ yaitu
DAFTAR PUSTAKA
82,22% lebih tinggi dari estimasi-๐ 67,38%, dan
Alma, O. G. (2011). Comparison of Robust Regression Methods in Linear Regression. Int. J. Contemp. Math. Sciences, 409-421.
nilai ๐
2 hasil estimasi-๐ sebesar 97,73% paling tinggi
di
antara
pembandingnya estimasi-๐๐.
model yaitu
kedua estimasi-๐
estimasi dan
Badan Pusat Statistik. (2014). Produksi Kedelai di Indonesia. www.bps.go.id. Diakses
10 Jurnal Pendidikan Matematika dan Sains Edisi ... Tahun ..ke.. 20...
pada tanggal 28 Januari 2016 pukul 20.00 WIB.
Pengaruh Outlier dalam Analisis Regresi Linier. Skripsi. Universitas Negeri Semarang.
Chatterjee, S., & Hadi, A.S. (1986). Influential Observations, High Leverage Points, and Outliers in Linear Regression. Statistical Science, Vol. 1 (3), 379-393.
Montgomery, D.C. & Peck, E.A. (1992). Introduction to Linear Regression Analysis. Toronto: John Wiley & Sons.
Chen, C., (2002). Robust Regression and Detection with The Robustreg Procedure. Sugi Paper 265-27, SAS Institute, Cary NC, www2.sas.com.
Montgomery, D.C., Peck, E.A., & Vining, G.G. (2006). Introduction to Linear Regression Analysis. 4th Ed. Toronto: John Wiley & Sons.
Dinas Tanaman Pangan dan Holtikultura. (2016). Mungkinkah Mewujudkan Swasembada Kedelai?. www.dishantor.rokanhulukab.go.id. Diakses pada tanggal 27 Januari 2016 pukul 20.56 WIB.
Rousseeuw, P.J., & Leroy, A.M. (1987). Robust Regression and Outlier Detection. New York: John Wiley & Sons.
Draper, N.R., & Smith, H. (1998). Applied Regression Analysis. New York: John Wiley and sons. Fox, J. (2002). โRobust Regression. Apendix to An R and S-Plus Companion to Applied Regressionโ. January, 2002. Hanna
Ardiyanti. (2011). Perbandingan Keefektifan Metode Regresi Robust Estimasi-M dan Estimasi-MM karena
Ryan, T.P. (1997). Modern Regression Analysis for Scientists and Engineers. Ghaitersburg: NIST. Yuliana
Susanti., Hasih Pratiwi., & Sri Sulistijowati H. (2013). Optimasi Model Regresi Robust Untuk Memprediksi Produksi Kedelai Di Indonesia. Prosiding Seminar Nasional Matematika dan Pendidikan Matematika, Yogyakarta 9 November 2013, M253-M262.