EFISIENSI ESTIMASI SCALE (S) TERHADAP ESTIMASI LEAST TRIMMED SQUARES (LTS) PADA PRODUKSI PADI DI PROVINSI JAWA TENGAH May Cristanti, Yuliana Susanti, dan Sugiyanto Program Studi Matematika FMIPA UNS ABSTRAK. Metode Kuadrat Terkecil (MKT) merupakan salah satu metode untuk mengestimasi parameter dalam model regresi. Penggunaan metode ini harus memenuhi asumsi-asumsi yang ada. Terdapatnya pencilan menyebabkan salah satu asumsi normalitas tidak terpenuhi sehingga diperlukan suatu metode lain dimana nilai estimasinya tidak banyak dipengaruhi oleh pencilan dalam data, metode tersebut adalah metode regresi robust. Estimasi parameter regresi dalam metode regresi robust antara lain estimasi Scale (S) dan estimasi Least Trimmed Square (LTS). Tujuan dari penelitian ini untuk menentukan efisiensi estimasi S terhadap estimasi LTS pada data produksi padi di Provinsi Jawa Tengah tahun 2015 sebagai indikator untuk menentukan model regresi yang lebih baik. Hasil dari penelitian menunjukkan bahwa estimasi S lebih efisien dibandingkan dengan estimasi LTS karena nilai efisiensi , ∗ = 1,85647 > 1. Kata kunci: regresi robust, estimasi S, estimasi LTS, efisiensi.
1. PENDAHULUAN Padi merupakan tanaman pangan yang dibutuhkan oleh penduduk Indonesia, karena hasil tanaman padi dapat diolah sebagai bahan makanan pokok penduduk di Indonesia. Salah satu provinsi penyangga padi nasional yakni Provinsi Jawa Tengah. Menurut Berita Resmi Statistik [1], produksi padi di Provinsi Jawa Tengah pada tahun 2014 mengalami penurunan sebesar 9,65 juta ton Gabah Kering Giling (GKG) yang disebabkan oleh berkurangnya luas lahan panen akibat banjir dan serangan hama tanaman yang mencapai 44,54 ribu hektar atau 2,41%. Penurunan produksi ini harus mendapatkan perhatian karena hasil produksi padi sangat dibutuhkan bagi penduduk untuk mencukupi kebutuhannya. Oleh karena itu, upaya untuk meningkatkan produksi padi di Jawa Tengah perlu ditingkatkan kembali secara bertahap. Menurut Balai Pengkajian Teknologi Pertanian Jawa Tengah [2] beberapa faktor yang berpengaruh dan perlu diperhatikan dalam upaya peningkatan produksi padi antara lain luas lahan panen, curah hujan, dan jumlah pupuk. Untuk mengetahui hubungan antara produksi padi dengan luas lahan panen, curah hujan, serta jumlah pupuk dapat digunakan regresi linear berganda.
1
Tingkat Efisiensi Estimasi . . .
M. Cristanti, Y. Susanti, Sugiyanto
Analisis regresi linear merupakan suatu analisis yang mempelajari hubungan antara variabel dependen dengan variabel independen. Metode yang digunakan untuk mengestimasi parameter model regresi dengan menggunakan Metode Kuadrat Terkecil (MKT). Pada suatu data dimungkinkan terdapatnya pencilan, yakni suatu data pengamatan yang tidak mengikuti pola sebagian besar data. Terdapatnya pencilan menyebabkan MKT tidak akurat untuk mengestimasi parameter. Oleh karena itu, diperlukan suatu metode regresi yang bersifat robust dimana nilai estimasinya tidak banyak dipengaruhi oleh pencilan dalam data. Regresi robust merupakan regresi yang digunakan ketika suatu data pengamatan terdapat pencilan. Data pencilan seringkali mempunyai pengaruh terhadap estimasi parameter sehingga data tersebut tidak dihilangkan begitu saja. Terdapat beberapa estimasi pada regresi robust antara lain estimasi Scale (S) dan estimasi Least Trimmed Square (LTS), kedua estimasi tersebut diaplikasikan pada data produksi padi di Provinsi Jawa Tengah untuk mengetahui efisiensi yang digunakan sebagai indikator untuk menentukan model mana yang lebih baik. 2. REGRESI ROBUST Model regresi robust diperkenalkan oleh Andrews pada tahun 1972. Menurut Drapper [4] regresi robust ditujukan untuk mengatasi masalah pencilan yang dapat menyebabkan data tidak normal sehingga nilai estimasi dari suatu parameter tidak tepat. Pada penelitian ini digunakan regresi robust estimasi S dan estimasi LTS. a. Estimasi Scale (S) Estimasi S diperkenalkan oleh Rousseeuw dan Yohai pada tahun 1984. Estimasi S didefinisikan = min dengan robust, dan
( ,
,… ,
)
adalah estimator koefisien regresi, ,
,…,
adalah estimator skala
merupakan sisaan.
Estimasi S dapat dilakukan dengan langkah-langkah berikut. 1. Menghitung estimasi parameter 2. Menghitung nilai sisaan
=
dengan menggunakan MKT. −
.
3. Menghitung nilai estimasi skala robust
2
.
Tingkat Efisiensi Estimasi . . .
M. Cristanti, Y. Susanti, Sugiyanto
|
⎧ ⎪ =
⎨ ⎪ ⎩
( )|
− 0,6745
1 0,199
=
4. Menghitung nilai
=
⎨ ⎪ ⎪ ⎩
=1
,
>1
.
5. Menghitung nilai fungsi pembobot ⎧ ⎪ ⎪
,
1− 0 ( )
. ,| | < ,
,| | ≥ ,
=1
>1
6. Menghitung nilai estimasi
dengan metode Iteratively Reweighted
Least Square (IRLS) dengan pembobot
.
7. Mengulangi langkah 2 sampai dengan 6 sehingga diperoleh nilai yang konvergen. 8. Menguji hipotesis untuk mengetahui apakah variabel independen mempunyai pengaruh signifikan terhadap model.
b. Estimasi Least Trimmed Square (LTS) Estimasi Least Trimmed Square (LTS) adalah salah satu metode estimasi parameter regresi robust yang kekar terhadap pencilan. Metode LTS mengestimasi koefisien regresi dengan meminimumkan jumlah kuadrat sisaan dari himpunan bagian data berukuran ℎ pengamatan dengan kuadrat sisaan terkecil. Estimasi LTS didefinisikan sebagai =
()
dengan ℎ = [ /2] + [( + 1)/2], adalah banyaknya parameter,
( )
=
()
−
()
adalah banyaknya pengamatan, adalah kuadrat sisaan yang diurutkan
dari yang terkecil ke yang terbesar. Estimasi LTS dapat dilakukan dengan langkah-langkah sebagai berikut. 1. Mengestimasi koefisien regresi dengan Metode Kuadrat Terkecil (MKT). 3
Tingkat Efisiensi Estimasi . . .
M. Cristanti, Y. Susanti, Sugiyanto
2. Menghitung nilai sisaan
=
−
.
3. Menghitung kuadrat sisaan
dan menghitung nilai ℎ.
4. Menghitung nilai estimasi
.
5. Melakukan estimasi parameter
()
dari ℎ
6. Menentukan kuadrat sisaan 7. Menghitung nilai estimasi
(
dari ℎ ()
( )
pengamatan.
pengamatan.
).
8. Melakukan tahap 5 sampai dengan 7 hingga diperoleh nilai
yang
konvergen. 9. Menguji hipotesis untuk mengetahui apakah variabel independen mempunyai pengaruh signifikan terhadap model.
3. METODE PENELITIAN Penelitian ini merupakan penelitian terapan yaitu penerapan untuk menentukan efisiensi estimasi S terhadap estimasi LTS. Data yang digunakan pada penelitian ini adalah data produksi padi di Provinsi Jawa Tengah tahun 2015, merupakan data sekunder yang diambil dari Dinas Pertanian Tanaman Pangan dan Holtikultura. Data tersebut terdiri atas 4 variabel yakni jumlah produksi padi sebagai variabel dependen , luas lahan panen sebagai variabel independen sebagai variabel independen
, curah hujan
, dan jumlah pupuk sebagai variabel independen
.
Tahapan dalam penelitian ini diawali dengan mengestimasi parameter regresi dengan menggunakan MKT, kemudian menguji asumsi klasik analisis regresi serta mengidentifikasi adanya pencilan dalam data. Jika asumsi kenormalan tidak terpenuhi dan terdapat pencilan, maka dapat digunakan regresi robust untuk mengestimasi parameter regresi yakni dengan estimasi S dan estimasi LTS dengan melakukan pemotongan terhadap himpunan bagian data berukuran ℎ pengamatan dengan kuadrat sisaan terkecil. Kedua estimasi tersebut dilakukan hingga diperoleh nilai parameter regresi yang konvergen, selanjutnya dilakukan uji signifikansi dan menghitung nilai efisiensi untuk menentukan model regresi yang paling efisien dengan melihat nilai Mean Square Error (MSE) terkecil.
4
Tingkat Efisiensi Estimasi . . .
M. Cristanti, Y. Susanti, Sugiyanto
4. HASIL DAN PEMBAHASAN 4.1.
Metode Kuadrat Terkecil. Model regresi linear berganda dengan
menggunakan metode kuadrat terkecil pada data produksi padi di Provinsi Jawa = −9154,09 + 6,4046
Tengah tahun 2015 diperoleh hasil 39,273
dengan
curah hujan, dan 4.2.
adalah produksi padi,
+ 0,05
adalah luas lahan panen,
−
adalah
adalah jumlah pupuk.
Uji Asumsi Klasik. Pada model regresi, diperlukan uji untuk mengetahui
apakah model regresi memenuhi asumsi regresi atau tidak. Uji asumsi klasik yang digunakan dalam model regresi adalah uji normalitas, uji non autokorelasi, uji non heteroskedastisitas, dan uji non multikolinearitas. 1.
Uji Asumsi Normalitas. Pengujian asumsi ini menggunakan uji Anderson Darling. Hipotesis
adalah sisaan berdistribusi normal dan
sisaan tidak berdistribusi normal, dengan keputusan uji >
.
,
adalah
ditolak apabila
= 0,739642. Hasil pengujian diperoleh
1.704292 maka dapat disimpulkan bahwa
sebesar
ditolak yang berarti sisaan tidak
berdistribusi normal. 2.
Uji Asumsi Homoskedastisitas. Pengujian ini dilakukan menggunakan uji korelasi rank Spearman. Hipotesis
: variansi sisaan homogen dan
variansi sisaan tidak homogen, dengan keputusan uji >
ditolak apabila
= 2,048. Hasil pengujian diperoleh bahwa
panen sebesar 1,038 dan hasil
:
luas lahan
curah hujan sebesar 1,756 serta hasil <
jumlah pupuk diperoleh sebesar 1,204. Karena
=
2,048 maka dapat disimpulkan bahwa variansi sisaan homogen. 3.
Uji Asumsi Bebas Autokorelasi. Pengujian asumsi ini menggunakan uji Durbin-Watson. Hipotesis
: tidak terdapat autokorelasi dan
autokorelasi, dengan keputusan pengujian diperoleh 4−
tidak ditolak jika
sebesar 1,70097. Karena
= 2.3502 maka tidak menolak
autokorelasi.
5
<
<4−
: terdapat . Hasil
= 1.6498 <
<
, berarti bahwa tidak terdapat
Tingkat Efisiensi Estimasi . . .
4.
M. Cristanti, Y. Susanti, Sugiyanto
Uji Bebas Multikolinearitas. Pengujian ini menggunakan nilai Variance Inflation Factor (VIF). Hipotesis
: tidak terdapat multikolinearitas dan
terdapat multikolinearitas, dengan keputusan uji
:
ditolak apabila nilai
VIF<10. Hasil pengujian diperoleh nilai VIF luas lahan sebesar 2.554, VIF curah hujan sebesar 1.084, dan VIF jumlah pupuk sebesar 2.662. Karena nilai VIF<10,
ditolak sehingga dapat disimpulkan bahwa tidak terdapat
multikolinearitas.
Identifikasi Pencilan. Identifikasi pencilan terhadap
4.3.
Studentized Deleted Residuals (TRES). Hipotesis
;
)
: tidak terdapat pencilan dan ditolak apabila nilai |
terdapat pencilan, dengan keputusan uji ( ,
menggunakan : |>
= 2.056. Hasil pengujian diperoleh bahwa pada data ke-16 , data ke-26,
dan data ke-27 merupakan pencilan terhadap menggunakan nilai ℎ
dengan keputusan uji
. Identifikasi pencilan terhadap ditolak apabila nilai ℎ >
=
0,267. Hasil perhitungan diperoleh hasil bahwa pada data ke-1, data ke-15, data ke17, dan data ke-19 merupakan data pencilan. 4.4. adalah
Model Regresi Robust Estimasi Scale (S). Model regresi dengan estimasi S = 3110,30 + 6,6366
− 41,314
− 0,2874
dengan interpretasi
bahwa setiap kenaikan satu hektar luas lahan panen akan menaikkan produksi padi sebesar 6,6366 ton, setiap kenaikan satu milimeter kubik curah hujan akan menurunkan produksi padi sebesar 41,314 ton, dan setiap kenaikan satu ton jumlah pupuk akan menurunkan produksi padi sebesar 0,2874 ton. 4.5.
Model Regresi Robust Estimasi Least Trimmed Square (LTS). Model = 12949 + 5,9978
regresi dengan estimasi LTS adalah 0,4828
− 31,69
−
dengan interpretasi bahwa setiap kenaikan satu hektar luas lahan panen
akan menaikkan produksi padi sebesar 5,9978 ton, setiap kenaikan satu milimeter kubik curah hujan akan menurunkan produksi padi sebesar 31,69 ton, dan setiap kenaikan satu ton jumlah pupuk akan menurunkan produksi padi sebesar 0,4828 ton.
6
Tingkat Efisiensi Estimasi . . .
4.6.
M. Cristanti, Y. Susanti, Sugiyanto
Uji simultan F dan uji parsial t. Uji hipotesis simultan digunakan untuk
mengetahui apakah ada variabel independen mempunyai pengaruh signifikan terhadap model. Hipotesis
=
:
=
= 0 (semua variabel independen tidak
berpengaruh secara signifikan terhadap model) dan
:
≠
≠
≠ 0 (paling
tidak ada satu variabel independen yang berpengaruh signifikan terhadap model). Keputusan uji
>
ditolak apabila
diperoleh
( .
, ,
)
untuk model estimasi S sebesar 1965.01 sedangkan untuk >
model estimasi LTS sebesar 9681.07, karena nilai maka
= 2.975. Hasil pengujian
( .
, ,
)
= 2.975
ditolak yang berarti bahwa paling tidak ada satu variabel independen yang
berpengaruh signifikan terhadap model. Selanjutnya akan diuji parsial untuk mengetahui variabel independen yang mempunyai pengaruh signifikan terhadap produksi padi. Hipotesis
:
= 0,
= 1,2,3 (variabel independen tidak
berpengaruh secara signifikan terhadap model) dan
:
≠ 0,
= 1,2,3 (variabel
independen berpengaruh signifikan terhadap model). Kriteria pengambilan keputusan
>
ditolak apabila nilai
( .
; )
= 4.3027. Hasil pengujian
ditunjukkan pada Tabel 1 Tabel 1 Hasil uji t pada parameter regresi robust estimasi S dan estimasi LTS
Estimasi Estimasi S
Estimasi LTS
Variabel Luas lahan panen Curah hujan Jumlah pupuk Luas lahan panen Curah hujan Jumlah pupuk
49.84 0.77 0.96 97.93 2.03 1.36
Kesimpulan Signifikan Tidak Signifikan Tidak Signifikan Signifikan Tidak Signifikan Tidak Signifikan
Berdasarkan Tabel 1 diperoleh kesimpulan bahwa variabel luas lahan panen (
) berpengaruh secara signifikan terhadap model sedangkan variabel curah hujan
(
) dan jumlah pupuk (
) tidak berpengaruh secara signifikan terhadap model baik
pada estimasi S maupun pada estimasi LTS.
4.7.
Efisiensi. Efisiensi suatu estimasi diperlukan untuk mengetahui bahwa
estimasi tersebut merupakan yang terbaik yaitu estimasi dengan MSE( ) terkecil. Nilai MSE
dari estimasi S yakni sebesar 42560473.5848, Nilai 7
(
∗
) dari
Tingkat Efisiensi Estimasi . . .
M. Cristanti, Y. Susanti, Sugiyanto
estimasi LTS yakni sebesar 78935654.7944, sehingga efisiensi dapat diperoleh sebesar
,
∗
= 1,85647. Dengan demikian produksi padi di Provinsi Jawa
Tengah tahun 2015, estimasi S lebih efisien dibanding estimasi LTS. Hal ini dapat dilihat dari nilai
,
∗
= 1,85647 > 1.
5.
KESIMPULAN
Efisiensi estimasi S terhadap estimasi LTS pada produksi padi di Provinsi Jawa Tengah tahun 2015 adalah 1,85647. Hasil ini menjelaskan bahwa estimasi S ,
lebih efisien dibandingkan estimasi LTS karena nilai
∗
= 1,85647 > 1.
Dengan demikian model yang tepat digunakan untuk produksi padi di Jawa Tengah tahun 2015 adalah model estimasi S, yaitu = 3110,30 + 6,6366
− 41,314
− 0,2874
.
DAFTAR PUSTAKA [1] [2]
[3] [4] [5] [6]
[7]
[8]
Badan Pusat Statistik. https://www.jateng.bps.go.id/ (diakses tanggal 20 Juli 2016) Balai Pengkajian Teknologi Pertanian Jawa Tengah http://jateng.litbang.pertanian.go.id/ind/images/artikel/Kem.Pangan4 (diakses tanggal 9 Oktober 2016) Dinas Pertanian Tanaman Pangan dan Holtikultura. http://dinpertantph.jatengprov.go.id/data/ (diakses tanggal 8 Agustus 2016) Drapper, N.R dan Smith, H., 1998, Applied Regression Analysis, John Wiley and Sons, Inc., New York. Montgomery, D.C. and Peck, E.A, 2006, Introduction to Linier Regression Analysis, John Wiley and Sons, New York. Musafirah, 2012, Perbandingan Metode Robust Least Trimmed Squares Dengan Metode Scale Dalam Mengestimasi Parameter Regresi Linear Untuk Data Yang Mengandung Pencilan, Universitas Hasanudin, Makassar. Wijayanti, Lisa Unik, 2015, Analisis Perbandingan Regresi Robust Estimasi-M Huber dan Estimasi-S Dalam Mengatasi Outlier. Universitas Negeri Yogyakarta, Yogyakarta. Wulandari, Sri., 2013, Perbandingan Metode Least Trimmed Squares Dan Penaksir M Dalam Mengatassi Permasalahan Data Pencilan, Vol.1, No.1, pp 73-85, Saintia Matematika.
8