perpustakaan.uns.ac.id
digilib.uns.ac.id
REGRESI ROBUST DENGAN ESTIMASI-GS (GENERALIZED S-ESTIMATION ) PADA PENJUALAN TENAGA LISTRIK DI JAWA TENGAH TAHUN 2010
oleh YURISTA WULANSARI NIM. M 0108073
SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET
commit to user SURAKARTA 2012
i
perpustakaan.uns.ac.id
digilib.uns.ac.id
ABSTRAK Yurista Wulansari, 2012. REGRESI ROBUST DENGAN ESTIMASI-GS (GENERALIZED S-ESTIMATION ) PADA PENJUALAN TENAGA LISTRIK DI JAWA TENGAH TAHUN 2010. Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Sebelas Maret. Tenaga listrik merupakan salah satu kebutuhan vital bagi manusia. Konsumsi tenaga listrik akan meningkat seiring dengan roda perekonomian daerah. Penjualan tenaga listrik dapat diprediksi dengan menggunakan analisis regresi. Dalam data penjualan tenaga listrik di Jawa Tengah tahun 2010 terdapat pencilan sehingga diperlukan model yang tepat untuk melakukan analisis data. Regresi robust adalah model yang tepat untuk mengatasi masalah pencilan tersebut. Jika pencilan terdapat pada variabel dependen (Y ) dan variabel independen (X) maka estimasi-GS tepat digunakan untuk mengestimasi parameter. Tujuan penelitian ini adalah menentukan persamaan regresi untuk estimasi penjualan tenaga listrik di Jawa Tengah tahun 2010 menggunakan model regresi robust estimasi-GS dengan variabel dependen adalah penjualan tenaga listrik sedangkan variabel independen adalah jumlah pelanggan (X1 ), daya tersambung (X2 ), jumlah perusahaan industri (X3 ), jumlah rumah tangga (X4 ), dan jumlah produk domestik regional bruto (X5 ). Dari analisis diperoleh persamaan regresi untuk estimasi penjualan tenaga listrik yaitu Ybi = 2 3.043.071 + 1, 84Xi2 + 109.458Xi3 − 220Xi4 + 12, 0Xi5 , dengan Radjusted = 99, 6% dan variabel jumlah pelanggan (X1 ) tidak signifikan. Kata kunci : tenaga listrik, pencilan, regresi robust, estimasi-GS.
commit to user
iii
perpustakaan.uns.ac.id
digilib.uns.ac.id
ABSTRACT Yurista Wulansari, 2012. ROBUST REGRESSION BY GS-ESTIMATION (GENERALIZED S-ESTIMATION) IN ELECTRICAL ENERGY SALES IN CENTRAL JAVA ON 2010. Faculty of Mathematics and Natural Sciences, Sebelas Maret University. Electrical energy is a vital need as human. The consumption of electricity will always be increasing in line with the increase of the regional economy. The electrical energy sales can be predicted by regression analysis. Data in the electrical energy sales in Central Java on 2010, there are outliers so that an appropriate method is needed to analyze the data. Robust regression is a appropriate model to over with a this outliers problem. If there are outliers in the dependent variable (Y ) and the independent variables (X), then the GS-estimation robust regression is appropriate to be used to estimate parameter. The objective of this research is to determine regression equation estimation of electrical energy sales in Central Java on 2010 using robust regression model GS-estimation with independent variable is the sales of electrical energy while the independent variables are number of costumer (X1 ), power connected (X2 ), number of industry company (X3 ), number of household (X4 ), and product domestic regional gross (X5 ). The regression equation estimation of electrical energy sales obtained based on the analysis result are Ybi = 2 3.043.071 + 1, 84Xi2 + 109.458Xi3 − 220Xi4 + 12, 0Xi5 with Radjusted = 99, 6% and the variables is number of costumer (X1 ) not significant. Key words : electrical energy, outlier, robust regression, GS-estimation.
commit to user
iv
perpustakaan.uns.ac.id
digilib.uns.ac.id
MOTO
”....Sesungguhnya Allah tidak akan mengubah nasib suatu kaum sehingga kaum itu mengubah nasibnya sendiri” (Q.S Ar ro’du: 11)
”Sesungguhnya sesudah kesulitan ada kemudahan maka apabila kamu telah selesai (dari suatu urusan), kerjakanlah dengan sungguh-sungguh (urusan) yang lain dan kepada Tuhanmulah hendaknya kamu berharap” (Q.S Al-Insyirah: 6-8)
commit to user
v
perpustakaan.uns.ac.id
digilib.uns.ac.id
PERSEMBAHAN
Karya ini kupersembahkan untuk Bapak dan Ibuku tercinta atas doa, cinta, nasehat, dan motivasi yang diberikan,
Kakak-kakakku (Mas Tono, Mba Sri, Mas Mardi, Mba Umi, dan Mba Andit) yang telah tanamkan semangat untuk membanggakan Bapak dan Ibu,
Mas Didi atas bantuan, dukungan, dan semangatnya.
commit to user
vi
perpustakaan.uns.ac.id
digilib.uns.ac.id
KATA PENGANTAR
Segala puji syukur penulis panjatkan kepada Allah SWT yang telah memberikan banyak kenikmatan kepada penulis sehingga penulis dapat menyelesaikan skripsi ini dengan judul ”REGRESI ROBUST DENGAN ESTIMASI-GS (GENERALIZED S-ESTIMATION ) PADA PENJUALAN TENAGA LISTRIK DI JAWA TENGAH TAHUN 2010”. Skripsi ini merupakan syarat untuk memenuhi sebagian persyaratan untuk memperoleh gelar sarjana sains Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sebelas Maret Surakarta. Oleh karena itu atas semua bimbingan dan bantuan yang telah diberikan kepada penulis dalam penyusunan skripsi ini, penulis mengucapkan terima kasih kepada 1. Dra. Yuliana Susanti, M.Si dan Dra. Mania Roswitha, M.Si selaku Pembimbing I dan Pembimbing II atas kesediaan dan kesabarannya dalam membimbing dan memotivasi penulis dalam penyusunan skripsi ini, 2. Teman-teman M ath 08 yang telah memberikan dukungan dalam penulisan skripsi ini, 3. Semua pihak yang tidak dapat penulis sebutkan satu persatu yang telah membantu dalam penulisan skripsi ini. Semoga Allah SWT membalas semua kebaikan yang telah mereka berikan selama ini dan semoga skripsi ini dapat memberikan manfaat.
Surakarta, Oktober 2012 Penulis
commit to user
vii
perpustakaan.uns.ac.id
digilib.uns.ac.id
Daftar Isi
I
ABSTRAK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
iii
ABSTRACT
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
iv
MOTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
v
PERSEMBAHAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
vi
KATA PENGANTAR . . . . . . . . . . . . . . . . . . . . . . . . . . .
vii
DAFTAR ISI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
ix
DAFTAR TABEL . . . . . . . . . . . . . . . . . . . . . . . . . . . .
x
DAFTAR GAMBAR . . . . . . . . . . . . . . . . . . . . . . . . . . . .
xi
PENDAHULUAN
1
1.1
Latar Belakang Masalah . . . . . . . . . . . . . . . . . . . . . . .
1
1.2
Perumusan Masalah
. . . . . . . . . . . . . . . . . . . . . . . . .
4
1.3
Tujuan Penelitian . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.4
Manfaat Penelitian . . . . . . . . . . . . . . . . . . . . . . . . . .
4
II LANDASAN TEORI
5
2.1
Tinjauan Pustaka . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
2.2
Landasan teori . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
2.2.1
Model Regresi Linear Berganda . . . . . . . . . . . . . . .
6
2.2.2
Metode Kuadrat Terkecil . . . . . . . . . . . . . . . . . . .
7
2.2.3
Uji Asumsi Analisis Regresi . . . . . . . . . . . . . . . . .
9
2.2.4
Pencilan . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
2.2.5
Estimasi-M . . . .commit . . . .to. user . . . . . . . . . . . . . . . . .
13
2.2.6
Estimasi-S . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
viii
perpustakaan.uns.ac.id
2.2.7 2.3
digilib.uns.ac.id
Estimasi-GS . . . . . . . . . . . . . . . . . . . . . . . . . .
14
Kerangka Pemikiran . . . . . . . . . . . . . . . . . . . . . . . . .
16
III METODE PENELITIAN
17
IV HASIL DAN PEMBAHASAN
19
4.1
Deskripsi Tenaga Listrik di Jawa Tengah . . . . . . . . . . . . . .
19
4.2
Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
4.3
Model Regresi Penjualan Tenaga Listrik di Jawa Tengah . . . . . . . . . . . . . . . . . . . . . . . . . . . .
V PENUTUP
20 30
5.1
Kesimpulan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
5.2
Saran . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
DAFTAR PUSTAKA
31
LAMPIRAN
32
commit to user
ix
perpustakaan.uns.ac.id
digilib.uns.ac.id
Daftar Tabel
4.1
Hasil output uji multikolinearitas . . . . . . . . . . . . . . . . . .
23
4.2
Hasil Uji T RES dan hii . . . . . . . . . . . . . . . . . . . . . . .
24
4.3
Nilai σ bGS dan βbGS tiap iterasi pada estimasi-GS dengan 5 var. indep. 25
4.4
Hasil uji t pada estimasi-GS dengan 5 var. indep. . . . . . . . . .
4.5
Nilai σ bGS dan βbGS tiap iterasi pada estimasi-GS dengan 4 var. indep. 27
4.6
Hasil uji t pada estimasi-GS dengan 4 var. indep. . . . . . . . . .
5.1
Data penjualan tenaga listrik (Y ), jumlah pelanggan (X1 ), daya
26
29
tersambung (X2 ), jumlah perusahaan industri (X3 ), jumlah rumah tangga (X4 ), dan produk domestik regional bruto (X5 ) . . . . . .
commit to user
x
33
perpustakaan.uns.ac.id
digilib.uns.ac.id
Daftar Gambar
4.1
Plot probabilitas dari sisaan . . . . . . . . . . . . . . . . . . . . .
21
4.2
Plot sisaan dengan Yb . . . . . . . . . . . . . . . . . . . . . . . . .
22
commit to user
xi
perpustakaan.uns.ac.id
digilib.uns.ac.id
Daftar Notasi
||
: harga mutlak
Σ
: sigma
β
: parameter/koefisien regresi
βb
: estimasi dari β
βb0
: estimasi β awal menggunakan MKT
βbGS
: estimasi β menggunakan estimasi-GS
c
:
εi
: sisaan random ke-i dari populasi
ei
: sisaan random ke-i dari sampel
ei − ej
: selisih sisaan random ke-ij dari sampel
hii
: nilai leverage untuk kasus ke-i
p
: jumlah variabel independen
ρ()
: fungsi obyektif
rs
: koefisien korelasi rank Spearman
2 Radjusted
: koefisien determinasi ganda yang disesuaikan
s
: standar deviasi
σ bgs
: estimasi skala robust
ui
: skala sisaan
ψ()
:
wi
: fungsi pembobot
∆
: selisih
δ
:
Xi
: variabel independen ke-i
Yi
: variabel dependen ke-i
Ybi
: vektor harga prediksi untuk Y
tuning constant
′
turunan parsial dari ρ terhadap βj atau ρ =
breakdown point
commit to user
xii
∂ρ ∂βj
perpustakaan.uns.ac.id
digilib.uns.ac.id
Bab I PENDAHULUAN 1.1
Latar Belakang Masalah
Tenaga listrik merupakan salah satu kebutuhan vital bagi manusia. Hal ini terjadi karena manusia tidak mungkin bisa melakukan aktifitas tanpa adanya listrik. Kebutuhan tenaga listrik akan meningkat seiring dengan perkembangan ekonomi daerah dan jumlah penduduk. Kondisi ini tentunya harus diantisipasi sedini mungkin agar penyediaan tenaga listrik dapat tersedia dalam jumlah yang cukup dan harga yang memadai. Pemerintah telah mengupayakan program listrik masuk desa untuk meningkatkan taraf hidup masyarakat di pedesaan. Badan Pusat Statistik (BPS) [3] mencatat pada tahun 2010 ada 7.811 desa sudah beraliran listrik dari PT. Perusahaan Listrik Negara (PLN) Persero sebagai sumber energi dengan jumlah pelanggan 3, 65 juta pelanggan. Menurut BPS [3], jumlah tenaga listrik yang terjual selama tahun 2010 sebesar 14, 39 milyar kWh. Tenaga listrik tersebut dimanfaatkan paling banyak oleh rumah tangga mencapai 92, 10%, usaha 4, 70%, sosial 2, 37%, selebihnya untuk industri, kantor pemerintah, penerangan jalan, dan multiguna. Dalam data penjualan tenaga listrik di Jawa Tengah tahun 2010 yang diambil dari BPS terdapat pencilan. Data pencilan (outlier ) adalah pengamatan dengan nilai mutlak sisaan jauh lebih besar daripada sisaan-sisaan lain. Hal ini akan mempengaruhi model regresi yang terbentuk. Data pencilan tersebut tidak boleh dibuang begitu saja karena akan mempengaruhi model prediksi serta menghasilkan sisaan yang besar. Metode yang bersifat robust yaitu tidak terpengaruh oleh perubahan besar pada bagian kecil data atau perubahan kecil pada bagian commit to user besar data. Metode ini dibutuhkan untuk menyelesaikan masalah pencilan tersebut dimana nilai estimasinya tidak banyak dipengaruhi oleh perubahan kecil 1
perpustakaan.uns.ac.id
digilib.uns.ac.id
dalam data. Regresi robust diperkenalkan oleh Andrews [1] sebagai model regresi yang digunakan ketika distribusi dari sisaan tidak normal. Model ini merupakan alat penting untuk menganalisis data yang dipengaruhi oleh pencilan sehingga dihasilkan model yang robust atau resistance terhadap pencilan. Breakdown point dan efficiency merupakan kriteria penting dalam regresi robust. Breakdown point adalah ukuran umum proporsi dari pencilan yang dapat ditangani sebelum pengamatan tersebut mempengaruhi model, sedangkan efficiency adalah taksiran parameter regresi yang mempunyai simpangan baku minimum. Menurut Ryan [13], ada empat kelompok estimasi robust parameter model regresi yaitu estimasi-M, estimasi pengaruh terbatas, estimasi dengan breakdown point tinggi, dan estimasi prosedur dua tahap. Menurut Huber [8], estimasi-M (Maximum Likelihood type) dan estimasi pengaruh terbatas, yang disebut juga estimasi-GM (Generalized M-Estimation), merupakan estimasi robust yang mempunyai breakdown point rendah. Kelompok estimasi dengan breakdown point tinggi sesuai dengan namanya, mempunyai breakdown point tinggi tetapi mempunyai efficiency rendah. Estimasi yang termasuk kelompok ini adalah LTS (Least Trimmed Square), LMS (Least Median Square), dan estimasi-S (Scale). Ketiga estimasi ini diperoleh berdasarkan skala. Sedangkan estimasi prosedur dua tahap adalah kombinasi dua estimasi dari kelompok berbeda. Contoh dari kelompok terakhir ini adalah estimasi-MM yang dibentuk dari kombinasi estimasi-S dan estimasi-M. Estimasi-MM (Method of Moment) mempunyai breakdown point tinggi dan efficiency tinggi sehingga estimasi ini memenuhi kriteria yang diharapkan untuk suatu estimasi robust. Suatu estimasi robust diharapkan menghasilkan estimasi yang tidak terpengaruh oleh pencilan ketika data memuat sisaan dengan pencilan dan memberikan estimasi yang mendekati hasil yang diperoleh dengan Metode Kuadrat Terkecil (M KT ) ketika data tidak begitu jauh menyimpang dari asumsi normalitas. Sifat yang pertama merujuk kepada breakdown point tinggi dan sifat commit to user kedua merujuk kepada efficiency tinggi.
2
perpustakaan.uns.ac.id
digilib.uns.ac.id
Terdapat dua estimasi robust lain selain di atas yaitu estimasi τ dan estimasiGS (Generalized S-Estimation). Kedua estimasi ini mempunyai kesamaan yaitu sama-sama mempunyai breakdown point tinggi karena berdasarkan skala. Estimasi-GS diperkenalkan oleh Croux et al. [5], yang dapat dipandang sebagai perluasan estimasi-S. Estimasi-GS, seperti dijelaskan di atas diestimasi berdasarkan skala. Skala yang digunakan adalah standar deviasi sisaan berpasangan. Estimasi-GS adalah solusi minimisasi estimasi-M dengan sisaan skala berpasangan sedangkan estimasi-S adalah solusi minimisasi estimasi-M sisaan skala. Penelitian regresi robust dengan estimasi-GS mula-mula dilakukan oleh Croux et al. [5] yang menunjukkan bahwa estimasi-GS mempunyai breakdown point sama dengan estimasi-S sebesar 50 %, tetapi efficiency lebih tinggi dari estimasi-S yang diterapkan pada kasus univariate dan ketika variabel dependen dan variabel independen terdapat pencilan. Kemudian penelitian dikembangkan oleh Roelant et al. [11] yang diterapkan pada kasus multivariate. Menurut Katili [9] dalam penelitian mengenai listrik menggunakan analisis faktor dengan 4 variabel independen diperoleh hasil bahwa jumlah pelanggan, tarif penjualan, PDRB dan jumlah produksi listrik berpengaruh signifikan terhadap konsumsi tenaga listrik. Selanjutnya, Artiana [2] dalam penelitian yang sama menggunakan regresi robust estimasi-S dengan 3 variabel independen diperoleh hasil bahwa hanya 2 variabel independen yaitu jumlah pelanggan dan daya tersambung berpengaruh signifikan terhadap penjualan energi listrik. Dalam hal ini, peneliti tertarik untuk mengkaji ulang estimasi-GS dibandingkan estimasi-MM karena estimasi-GS dapat menganalisis pencilan yang muncul pada variabel dependen dan variabel independen sedangkan estimasi-MM hanya pada variabel dependen. Dalam data penjualan tenaga listrik di Jawa Tengah tahun 2010 terdapat pencilan pada variabel dependen dan variabel independen sehingga estimasi-GS cocok digunakan untuk menganalisis data. Penelitian ini adalah menggabungkan hasil penelitian yang dilakukan oleh Roelant et al. [11], Katili commit to user [9], dan Artiana [2] yaitu sebagai studi kasus menggunakan regresi robust dengan
3
perpustakaan.uns.ac.id
digilib.uns.ac.id
estimasi-GS yang diterapkan pada penjualan tenaga listrik di Jawa Tengah tahun 2010. Meskipun diketahui beberapa jenis fungsi pembobot, namun dalam penelitian ini hanya digunakan fungsi Tukey’s Biweight, dengan memandang penelitian dari Croux et al. [5], dimana fungsi Tukey’s Biweight yang digunakan dengan tuning constant adalah 0.9958.
1.2
Perumusan Masalah
Berdasarkan latar belakang masalah, dapat dibuat perumusan masalah yaitu bagaimana persamaan regresi untuk estimasi penjualan tenaga listrik di Jawa Tengah tahun 2010 menggunakan metode regresi robust estimasi-GS?
1.3
Tujuan Penelitian
Berdasarkan perumusan masalah, tujuan dari penelitian ini adalah menentukan persamaan regresi untuk estimasi penjualan tenaga listrik di Jawa Tengah tahun 2010 menggunakan metode regresi robust estimasi-GS.
1.4
Manfaat Penelitian
Manfaat yang diharapkan dari penelitian ini adalah dapat mengembangkan ilmu pengetahuan dalam bidang statistika dan industri. Pada bidang statistika, metode estimasi-GS dapat diaplikasikan terhadap data yang mengandung pencilan pada variabel dependen dan independen, sedangkan pada bidang industri dapat memberikan masukan kepada instansi yang terkait yaitu PT. PLN (Persero) sebagai sarana untuk meningkatkan penjualan tenaga listrik kepada masyarakat.
commit to user
4
perpustakaan.uns.ac.id
digilib.uns.ac.id
Bab II LANDASAN TEORI Landasan teori ini terdiri dari tiga subbab, yaitu tinjauan pustaka, landasan teori, dan kerangka pemikiran.
2.1
Tinjauan Pustaka
Regresi robust merupakan metode regresi yang digunakan ketika distribusi dari sisaan tidak berdistribusi normal (Draper dan Smith, [6]). Regresi robust merupakan alternatif dari M KT . Regresi ini diperkenalkan oleh Andrews [1]. Seringkali dengan transformasi tidak akan menghilangkan atau melemahkan pengaruh dari pencilan yang akhirnya estimasi menjadi bias dan estimasi parameter menjadi tidak valid. Dalam keadaan ini, sangat tepat jika menggunakan model regresi robust yang tahan terhadap pengaruh pencilan sehingga menghasilkan estimasi yang lebih baik. Salah satunya adalah metode estimasi-GS. Estimasi-M pertama kali diperkenalkan oleh Huber [8] sebagai model regresi robust yang sering digunakan dan dipandang dengan baik untuk mengestimasi parameter yang disebabkan oleh x − outlier dan memiliki breakdown point
1 . n
Chen [4] dalam penelitiannya mengatakan bahwa estimasi-M mempunyai breakdown point kecil yaitu cenderung menuju nol ketika terdapat pencilan pada variabel independen. Rousseeuw dan Yohai [12] selanjutnya memperkenalkan estimasi LMS dan estimasi-LTS, yang merupakan metode high breakdown point. LMS adalah modifikasi dari metode kuadrat terkecil biasa. Modifikasi yang dilakukan adalah dengan mengubah operator jumlah menjadi median. Parameter β dapat diesticommit to user masi dengan cara meminimumkan median dari kuadrat sisaan. LTS merupakan suatu metode pendugaan parameter regresi robust untuk meminimumkan jumlah 5
perpustakaan.uns.ac.id
digilib.uns.ac.id
kuadrat h sisaan fungsi objektif. Namun kedua metode ini mempunyai efficiency rendah. Kelemahan dari metode yang telah ada yaitu hanya bisa mengestimasi parameter yang disebabkan oleh pencilan pada variabel independen (x) dan breakdown point lebih kecil dari 50 % sehingga dikembangkanlah estimasi-S dan estimasi-GS. Estimasi-GS merupakan perluasan dari estimasi-S. Penelitian regresi robust dengan estimasi-GS mula-mula dilakukan oleh Croux et al. [5] yang menunjukkan bahwa estimasi-GS mempunyai breakdown point sama dengan estimasi-S sebesar 50 %, tetapi efficiency lebih tinggi dari estimasi-S yang diterapkan pada kasus univariate dan ketika variabel dependen dan variabel independen terdapat pencilan. Kemudian penelitian dikembangkan oleh Roelant et al. [11] yang diterapkan pada kasus multivariate. Oleh karena itu, dari uraian latar belakang dan penelitian sebelumnya, peneliti tertarik untuk menerapkan regresi robust dengan estimasi-GS pada penjualan tenaga listrik di Jawa Tengah tahun 2010 mengacu dari penelitian Roelant et al. [11], Katili [9], dan Artiana [2].
2.2
Landasan teori
Dalam penelitian ini diberikan beberapa teori yang mendasari dan mendukung yaitu model regresi linear berganda, metode kuadrat terkecil, asumsi analisis regresi, pencilan, estimasi-M, estimasi-S, dan estimasi-GS.
2.2.1
Model Regresi Linear Berganda
Model regresi adalah model matematika yang menyatakan hubungan antara variabel dependen dan variabel independen. Model regresi linear berganda merupakan model regresi dengan variabel independen lebih dari satu. Montgomery dan Peck [10] mengatakan bahwa model tersebut dapat dituliskan Y = β0 + β1 x1commit + β2 x2 to + user . . . + βp xp + ε,
6
(2.1)
perpustakaan.uns.ac.id
digilib.uns.ac.id
dengan Y adalah variabel dependen, X1 , X2 , . . . , Xp adalah variabel independen, β0 , β1 , . . . , βp adalah parameter, dan ε adalah sisaan yang berdistribusi normal. Parameter β0 , β1 , . . . , βp pada persamaan (2.1) tidak diketahui sehingga harus diestimasi. Parameter-parameter tersebut dapat diestimasi dengan metode kuadrat terkecil. Metode ini mengestimasi parameter model regresi dengan meminimumkan jumlah kuadrat sisaan. Apabila ditinjau data pengamatan sebanyak n, maka persamaan (2.1) dapat dituliskan secara lengkap Y1 = β0 + β1 x11 + β2 x12 + . . . + βp x1p + ε1 , Y2 = β0 + β1 x21 + β2 x22 + . . . + βp x2p + ε2 , (2.2)
Y3 = β0 + β1 x31 + β2 x32 + . . . + βp x3p + ε3 , .......................................... Yn = β0 + β1 xn1 + β2 xn2 + . . . + βp xnp + εn , model (2.2) dapat dituliskan dalam bentuk matriks Y = Xβ + ε, dengan Y =
Y2 .. . Yn
Y1
(2.3)
1 x11 x12 . . . x1p
1 x21 x22 . . . x2p , X = .. .. .. . . . . .. . . . 1 xn1 xn2 . . . xnp
β0
β , β = 1 , ε = .. . βp
ε1 ε2 .. .
.
εn
Pada model regresi berganda bahwa sisaan ε dalam bentuk matriks, ε ∼ N ID(0, Iσ 2 ).
2.2.2
Metode Kuadrat Terkecil
Metode kuadrat terkecil (M KT ) pada prinsipnya adalah meminimumkan jumlah kuadrat sisaan (JKS ) untuk memperoleh nilai estimasi β0 , β1 , . . . , βp sebagai berikut JKS = S(βj ) =
n ∑ i=1
e2i =
n ∑
commit to user (Yi − β0 + β1 Xi 1 + β2 Xi 2 + . . . + βp Xi p)2 , (2.4)
i=1
7
perpustakaan.uns.ac.id
digilib.uns.ac.id
selanjutnya dicari turunan parsial terhadap β0 , β1 , . . . , βp dan menyamakan dengan nol sehingga diperoleh nilai estimasi model regresi linear. Untuk meminimumkan (2.4), dicari turunan S(βj ) secara parsial terhadap (βj ), j = 0, 1, 2, ..., p dan disamakan dengan nol sehingga diperoleh ∑ ∂S = −2 (yi − β0 + β1 xi1 + β2 xi2 + . . . + βk xip ) = 0, ∂β0 i=1 n
∑ ∂S = −2 (yi − β0 + β1 xi1 + β2 xi2 + . . . + βk xip )xi1 = 0, ∂β1 i=1 n
∑ ∂S = −2 (yi − β0 + β1 xi1 + β2 xi2 + . . . + βk xip )xi2 = 0, ∂β2 i=1 n
(2.5)
......................................................... ∑ ∂S = −2 (yi − β0 + β1 xi1 + β2 xi2 + . . . + βp xip )xip = 0, ∂βp i=1 n
persamaan (2.5) menghasilkan persamaan normal berikut ini nβb0 + βb1
n ∑
xi1 + βb2
n ∑
βb0
n ∑ i=1 n ∑
xi1 + βb1
n ∑
x2i1
n ∑
n ∑
xi1 xi2 + · · · + βbp
xi1 xi2 + βb2
n ∑
n ∑
yi ,
i=1 n ∑
n ∑
i=1
i=1
xi1 xip =
x2i2 + · · · + βbp
n ∑
xi2 xip =
xi1 yi ,
n ∑
i=1
i=1
i=1
i=1
xip =
i=1
i=1
xi1 xi2 + βb1
+ βb2
n ∑ i=1
i=1
i=1
βb0
xi2 + · · · + βbp
xi2 yi , (2.6)
i=1
.................................................................. βb0
n ∑ i=1
xip + βb1
n ∑
xi1 xip + βb2
n ∑
xi2 xip + · · · + βbp
x2ip =
i=1
i=1
i=1
n ∑
n ∑
xip yi .
i=1
Jika disusun dalam bentuk matriks maka persamaan (2.6) menjadi X X βb = X Y ′
dengan
′
(2.7) ∑n
∑n
··· n i=1 xip i=1 xi1 ∑ ∑ ∑ n n n 2 i=1 xi1 ··· ′ i=1 xi1 xip i=1 xi1 XX= commit .. .. to user .. .. . . . . ∑ ∑ ∑ n n n 2 i=1 xip i=1 xi1 xip · · · i=1 xip 8
,
perpustakaan.uns.ac.id
digilib.uns.ac.id
′ XY =
1
···
1
1
x11 x21 · · · .. .. . . . . .
x2p .. .
x1p x2p · · ·
xnp
∑ n i=1 y1 ∑n i=1 xi1 yi .. . ∑ n i=1 xip yi
=
y1 y2 .. .
.
yn
Penyelesaian persamaan (2.7) yaitu dengan mengalikan kedua sisinya deng′
an invers dari (X X), sehingga estimator kuadrat terkecil dari β adalah (X X)−1 X X βb = (X X)−1 X Y ′
′
′
′
′ ′ βb = (X X)−1 X Y.
2.2.3
(2.8)
Uji Asumsi Analisis Regresi
Uji asumsi analisis regresi dilakukan untuk mengetahui apakah model regresi memenuhi asumsi atau tidak. Uji asumsi yang dilakukan pada model regresi adalah 1. Asumsi Normalitas. Gujarati [7] mengatakan bahwa pada analisis regresi linear diasumsikan bahwa sisaan berdistribusi normal dengan rata-rata yang diharapkan sama dengan nol dan mempunyai variansi konstan. Asumsi normalitas dapat diketahui dengan uji Anderson-Darling. Uji ini didasarkan pada nilai A2 = −n − S dengan, S=
n ∑ (2i − 1) i=1
n
[lnF (ei ) + ln(1 − F (en+1−i ))]
dengan F adalah fungsi distribusi kumulatif, ei adalah sisaan yang telah diurutkan, dan n adalah banyak pengamatan. Pengujian Anderson-Darling akan memberikan informasi mengenai nilai pvalue. Menolak H0 jika nilai p-value kurang dari nilai alpha.
commit to user 2. Asumsi homoskedastisitas. Uji homoskedastisitas dilakukan untuk menguji apakah terjadi kesamaan 9
perpustakaan.uns.ac.id
digilib.uns.ac.id
variansi sisaan dari satu pengamatan ke pengamatan yang lain dalam sebuah model regresi. Jika variansi sisaan dari satu pengamatan ke pengamatan yang lainnya sama maka disebut homoskedastisitas dan jika variansi berbeda maka disebut heteroskedastisitas. Model regresi yang baik menunjukkan adanya homoskedastisitas. Asumsi ini dapat ditulis sebagai berikut V ar(ei ) = σ 2 , i = 1, 2, . . . , n. Salah satu cara menguji kesamaan variansi yaitu dengan melihat pola sebaran sisaan (ei ) terhadap nilai estimasi Y . Jika sebaran sisaan bersifat acak (tidak membentuk pola tertentu), maka menurut Draper et al. [6] mengatakan bahwa variansi sisaan homogen. Menurut Gujarati [7], salah satu cara untuk mendeteksi heteroskedastisitas adalah dengan pengujian korelasi rank Spearman yang didefinisikan sebagai berikut
∑
d2i ], n ̸= 1 n(n2 − 1) dengan di adalah perbedaan dalam rank yang ditempatkan pada dua kars = 1 − 6[
rakteristik yang berbeda dari individual atau fenomena ke−i dan n adalah banyaknya individual yang dirank. Koefisien rank korelasi tersebut dapat digunakan untuk mendeteksi heterokedastisitas dengan mengasumsikan Yi = Xi + ei . Adapun tahapannya adalah sebagai berikut (a) mencocokkan regresi terhadap data mengenai Y dan X dan mendapatkan sisaan ei , (b) dengan mengabaikan tanda dari ei yaitu dengan mengambil nilai mutlaknya |ei |, meranking baik harga mutlak |ei | dan Xi sesuai dengan urutan yang meningkat ataupun menurun dan menghitung koefisien rank korelasi Spearman yang telah diberikan sebelumnya, (c) dengan mengasumsikan bahwa koefisien rank korelasi populasi ρs adalah nol dan n > 8, signifikan dari rs dapat diuji dengan pengujian t commit to user sebagai berikut √ rs n − 2 t= √ , 1 − rs 2 10
perpustakaan.uns.ac.id
digilib.uns.ac.id
dengan derajat kebebasan, n − 2. Jika nilai t yang dihitung melebihi nilai t kritis maka H0 ditolak, artinya asumsi homoskedastisitas tidak dipenuhi. Jika model regresi meliputi lebih dari satu variabel X, rs dapat dihitung antara |ei | dan tiap-tiap variabel X secara terpisah dan dapat diuji untuk tingkat signifikansi secara statistik dengan pengujian t yang diberikan di atas. 3. Asumsi nonmultikolinearitas. Multikolinearitas adalah suatu kondisi yang menunjukkan adanya korelasi antar variabel independen dalam model regresi linear berganda. Multikolinearitas terjadi karena terdapat korelasi yang cukup tinggi di antara variabel independen (Montgomery dan Peck, [10]). VIF (Variance Inflation Factor ) merupakan salah satu cara untuk mengukur besar multikolinearitas dan didefinisikan sebagai berikut V IF =
1 , 1 − Rm2
dengan m = 1, 2, . . . , p dan p adalah banyaknya variabel independen. Rm2 adalah koefisien determinasi yang dihasilkan dari regresi variabel independen Xm dengan variabel independen lain Xj (m ̸= j). Nilai VIF menjadi semakin besar jika terdapat korelasi yang semakin besar diantara variabel independen. Jika nilai VIF lebih dari 10, multikolinearitas memberikan pengaruh yang serius pada pendugaan metode kuadrat terkecil.
2.2.4
Pencilan
Pada beberapa kasus dimungkinkan adanya data yang jauh dari pola kumpulan data keseluruhan, yang lazim didefinisikan sebagai data pencilan. Keberadaan dari pencilan akan menyebabkan kesulitan dalam proses analisis data dan perlu untuk dihindari. Permasalahan yang muncul akibat adanya pencilan antara lain
commit to user
1. Sisaan yang besar dari model yang terbentuk E(ei ) ̸= 0, 11
perpustakaan.uns.ac.id
digilib.uns.ac.id
2. Variansi dari data akan menjadi lebih besar, 3. Estimasi interval akan memiliki rentang yang lebih besar. Draper dan Smith [6] menyatakan bahwa metode yang digunakan dalam mengidentifikasi pencilan terhadap variabel Y adalah Studientized Deleted Residual (T RES) yang didefinisikan sebagai T RESi = ei [
1 n−k−1 2, ] JKS(1 − hii ) − e2i ′
(2.9)
′
dengan i = 1, 2, . . . , n, ei = sisaan ke-i, hii = xi (X X)−1 xi , k = p + 1, n = banyaknya pengamatan.
Hipotesis untuk menguji adanya pencilan adalah H0 : Pengamatan ke - i bukan pencilan H1 : Pengamatan ke - i merupakan pencilan T RES adalah statistik uji untuk mengetahui pencilan terhadap Y , kriteria pengujian yang melandasi keputusan adalah ≤ t α , n − k − 1, H tidak ditolak; 0 2 |T RESi | > t α , n − k − 1, H ditolak. 0 2 Metode yang digunakan dalam mengidentifikasi pencilan terhadap variabel X adalah nilai pengaruh (leverage point). Nilai pengaruh (hii ) dari pengamatan (Xi , Yi ) menunjukkan besarnya peranan Yi terhadap Ybi dan didefinisikan sebagai ′
′
hii = xi (X X)−1 xi , dengan i = 1, 2, · · · , n, xi =
[
1 xi2 xi3 · · ·
(2.10) ]
xip
adalah vektor baris yang
berisi nilai - nilai dari variabel independen dalam pengamatan ke-i. Nilai hii berada diantara 0 dan 1, yaitu 0 ≤ hii ≤ 1 dengan k = p + 1. Jika hii lebih besar dari 2h dengan
∑n 2commit toii user2k i=1 h 2h = = , n n
maka pengamatan ke-i dikatakan pencilan terhadap X. 12
perpustakaan.uns.ac.id
digilib.uns.ac.id
2.2.5
Estimasi-M
Menurut Montgomery dan Peck [10], estimasi-M merupakan estimasi yang meminimumkan suatu fungsi sisaan ρ βbM = min
n ∑
ρ(ei ) = min
i=1
n ∑
ρ(yi −
i=1
k ∑
xij βj ),
(2.11)
j=0
dengan ρ(ui ) didefinisikan sebagai fungsi obyektif Huber 1 u2 , |ui | < c; 2 i ρ(ui ) = c|u | − 1 u2 , |u | ≥ c. i i 2 i
(2.12)
estimator βb yang diperoleh bukan merupakan skala invariant sehingga digunakan nilai
ei σ b
sebagai pengganti ei , dengan σ b merupakan faktor skala.
2.2.6
Estimasi-S
Menurut Rousseeuw dan Yohai [12], estimasi-S adalah salah satu estimasi dengan breakdown point tinggi namun efficiency rendah. Estimasi ini diperoleh dari minimisasi estimasi-M berdasarkan sisaan skala. b = (e1 (β), b . . . , en (β)) b ′ adalah Definisi 2.2.1. Misal βb estimator dari β dan e(β) b . . . , en bS (e1 (β), vektor sisaan. Estimator-S didefinisikan sebagai βbS = argminβ∈Rp σ b dengan σ (β)) bS diperoleh dari estimasi-M sisaan skala σS yang merupakan solusi 1 ∑ ei (β) ) = δ, ρ( n i=1 σ bS n
dengan ρ adalah fungsi pembobot Tukey’s Biweight dan δ adalah nilai breakdown point. Estimator-S, yaitu βb dapat dinyatakan dalam bentuk lain, yaitu βbS = argminβ∈Rp
n ∑ i=1
dengan ei (β) = yi −
ρ(
ei (β) ). σ bS
commit √ to user ∑n ∑ 2 2 n n i=1 (ei )−( i=1 ei ) x β dan σ b = . ij j S j=0 n(n−1)
∑k
13
(2.13)
perpustakaan.uns.ac.id
digilib.uns.ac.id
Dalam literatur statistika estimasi robust dikenal beberapa jenis fungsi pembobot ρ, namun dalam penelitian ini hanya dipakai fungsi Tukey’s Biweight atau Tukey’s Bisquare. Bentuk fungsi pembobot ini sebagai berikut 2 ui − u4i2 + u6i4 , |u | < c; i 2 2c 6c ρ(ui ) = c2 , |ui | ≥ c. 6
(2.14)
dengan tuning constant c = 1, 547. Penyelesaian persamaan (2.13) adalah dengan diturunkannya persamaan tersebut terhadap β sehingga diperoleh n ∑
′
ρ(
i=1 n ∑
ψ(
i=1
ei (β) )=0 σ bS
ei (β) ) = 0, σ bS
dengan ψ disebut fungsi pengaruh yang merupakan turunan dari ρ sehingga dapat ′
dituliskan ρ = ψ sebagai berikut. ′ ψ(ui ) = ρ (ui ) = = = =
ui -
2u3i c2
+
ui 5 , c4
|ui | < c; |ui | ≥ c.
0, ui (1 −
2u2i c2
+
ui 4 ), c4
|ui | < c; |ui | ≥ c.
0, ui (1 −
ui 2 2 ), c2
(2.15)
|ui | < c; |ui | ≥ c.
0, ui (1 − ( uci )2 )2 ,
|ui | < c;
0,
|ui | ≥ c.
dengan wi adalah fungsi pembobot IRLS dan ui = σbeis . u ψ(ui ) (1 − ( ci )2 )2 , |ui | < c; wi (ui ) = = 0, ui |u | ≥ c.
(2.16)
i
2.2.7
Estimasi-GS
commit to user Menurut Croux et al.[5], estimator-GS adalah penyelesaian minimisasi estimasi-M berdasarkan selisih sisaan skala berpasangan. 14
perpustakaan.uns.ac.id
digilib.uns.ac.id
b = (e1 (β), b . . . , en (β)) b ′ adaDefinisi 2.2.2. Misal βb estimator dari β dan e(β) ∑ lah vektor sisaan dengan ei (β) = yi − kj=0 xij βj , 1 ≤ i ≤ n, dan ∆ei (β) = ′
(∆e12 (β), . . . , e(n−1)n (β)) merupakan vektor selisih sisaan berpasangan dengan ′
∆eii′ (β) = ei (β) − ei′ (β) dengan 1 ≤ i ≤ i ≤ n. bGS (∆e(β)) dengan Estimator-GS didefinisikan sebagai βbGS = argminβ∈Rp σ σ bGS diperoleh dari estimasi-M selisih sisaan skala berpasangan pakan solusi
1
n
n ∑ i
ρ(
σGS 1,1926
yang meru-
∆eii′ (β) ) = δ, σ bGS
2 dengan ρ adalah fungsi pembobot Tukey’s Biweight dan δ adalah nilai breakdown point. Menurut Croux et al. [5], nilai 1, 1926 merupakan faktor koreksi agar estimator tak bias. Selanjutnya seperti pada estimator-S, estimator-GS juga menggunakan fungsi pembobot Tukey’s Biweight yang ditunjukkan pada persamaan (2.14) dengan tuning constant yang disarankan oleh Croux et al. [5] adalah 0.9958. Menurut Croux et al. [5], Salibian dan Yohai [14], estimator-S dan estimator-GS merupakan estimator yang konsisten dan menyebar normal asimtotik. Seperti pada estimator-S, estimator-GS βb dapat dinyatakan dalam bentuk lain, yaitu βbGS = argminβ∈Rp
n ∑ i
′
ρ(
∆eii′ (β) ). σ bGS
(2.17)
Penyelesaian persamaan (2.17) adalah dengan diturunkannya persamaan tersebut terhadap β sehingga diperoleh n ∑ ′ ∆e ′ (β) )=0 ρ ( ii σ bGS ′ i
i
ψ(
∆eii′ (β) ) = 0, σ bGS
dengan ψ disebut fungsi pengaruh yang merupakan turunan dari ρ. Bentuk ini commit to user i) dapat ditulis sama seperti pada persamaan (2.15) dengan wi (ui ) = ψ(u meruui pakan fungsi pembobot IRLS dimana ui = 15
∆e ′ ii σ bGS
dan c = 0, 9958. Sisaan awal
perpustakaan.uns.ac.id
digilib.uns.ac.id
yang digunakan pada estimasi-GS adalah sisaan berpasangan yang diperoleh dari metode kuadrat terkecil. Proses dilanjutkan dengan M KT terboboti secara iterasi yang disebut Iteratively Reweighted Least Square (IRLS) hingga mencapai konvergen.
2.3
Kerangka Pemikiran
Berdasarkan tinjauan pustaka dapat disusun kerangka pemikiran sebagai berikut. Langkah pertama adalah menentukan populasi yang akan digunakan dalam penelitian, dengan mengambil data penjualan tenaga listrik, jumlah pelanggan, daya tersambung, jumlah perusahaan industri, jumlah rumah tangga, dan jumlah produk domestik regional bruto di tiap kabupaten/kota Provinsi Jawa Tengah tahun 2010. Langkah kedua adalah mengecek bahwa salah satu asumsi regresi dilanggar yaitu asumsi normalitas karena ditemukan pencilan. Langkah ketiga adalah menentukan nilai parameter regresi, karena pada suatu data observasi terdapat pencilan baik pada variabel dependen maupun independen maka tidak dapat menggunakan metode yang umum digunakan yaitu M KT . Masalah tersebut dapat diselesaikan menggunakan regresi robust. Regresi robust yang digunakan adalah estimator-GS yang meminimumkan skala berpasangan robust dengan fungsi pembobot Tukey’s Biweight.
commit to user
16
perpustakaan.uns.ac.id
digilib.uns.ac.id
Bab III METODE PENELITIAN Pada penelitian ini, metode yang digunakan adalah studi kasus yaitu melakukan estimasi model regresi robust estimasi-GS pada penjualan tenaga listrik di Jawa Tengah tahun 2010. Data yang digunakan dalam penelitian ini adalah data sekunder yang diambil dari Badan Pusat Statistik (BPS) Provinsi Jawa Tengah. Adapun langkah-langkah yang diperlukan dalam penelitian ini adalah 1. menduga koefisien regresi dengan M KT , 2. menguji asumsi klasik regresi linear, 3. mendeteksi adanya pencilan pada data dengan metode T RES dan hii , 4. menduga koefisien regresi dengan estimasi-GS, langkah-langkah menduga koefisien regresi dengan estimasi-GS adalah (a) menghitung sisaan awal yang diperoleh dari M KT , (b) menghitung selisih sisaan berpasangan, (c) menghitung standar deviasi selisih sisaan berpasangan σ bGS untuk mendapatkan nilai ui , (d) menghitung nilai pembobot w(ui ), (e) menggunakan M KT terbobot untuk mendapatkan penduga kuadrat terkecil terbobot ′ ′ βb∗ = (X W X)−1 X W Y
(f) menjadikan selisih sisaan berpasangan langkah (e) sebagai selisih sicommit to user saan berpasangan awal langkah (d) sehingga diperoleh nilai σ bGS dan pembobot w(ui ) yang baru, 17
perpustakaan.uns.ac.id
digilib.uns.ac.id
(g) melakukan pengulangan iterasi sampai didapatkan kekonvergenan sehingga diperoleh βb0GS , βb1GS , . . . , βbpGS yang merupakan estimasi-GS, (h) menentukan model yang robust dengan estimasi-GS dan menginterpretasikan.
commit to user
18
perpustakaan.uns.ac.id
digilib.uns.ac.id
Bab IV HASIL DAN PEMBAHASAN 4.1
Deskripsi Tenaga Listrik di Jawa Tengah
Provinsi Jawa Tengah merupakan salah satu provinsi yang terletak di Pulau Jawa dengan luas wilayah mencapai 3.254.800 hektar, terbagi menjadi 29 kabupaten dan 6 kota. Jumlah penduduk Provinsi Jawa Tengah tahun 2010 yaitu 32.382.657 jiwa. Kabupaten dengan jumlah penduduk terbanyak adalah Kabupaten Brebes sedangkan kota dengan jumlah penduduk terbanyak adalah Kota Semarang. Tenaga listrik merupakan salah satu kebutuhan penting di setiap kabupaten/kota di Jawa Tengah. Selama tahun 2010 telah dicatat bahwa terdapat 7.811 desa sudah beraliran listrik dari PT. PLN (Persero). Jumlah tenaga listrik yang terjual selama tahun 2010 sebesar 14, 39 milyar kWh. Tenaga listrik tersebut dimanfaatkan paling banyak oleh rumah tangga mencapai 92, 10%, usaha 4, 70%, sosial 2, 37%, selebihnya untuk industri, kantor pemerintah, penerangan jalan, dan multiguna. Pada penelitian ini, model analisis regresi, khususnya regresi robust dengan estimasi-GS, diterapkan pada penjualan tenaga listrik di Provinsi Jawa Tengah tahun 2010.
4.2
Data
Dalam penelitian ini digunakan data yang diambil dari BPS [3]. Data terdiri dari 6 variabel yaitu jumlah penjualan tenaga listrik tiap kabupaten/kota sebagai variabel dependen Y , jumlah pelanggan pada tiap kabupaten/kota sebagai variabel independen X1 , daya tersambung pada tiap kabupaten/kota sebagai
commit to user variabel independen X2 , jumlah perusahaan industri pada tiap kabupaten/kota sebagai variabel independen X3 , jumlah rumah tangga pada tiap kabupaten/kota 19
perpustakaan.uns.ac.id
digilib.uns.ac.id
sebagai variabel independen X4 , dan produk domestik regional bruto pada tiap kabupaten/kota sebagai variabel independen X5 . Data tersebut di atas terdapat pada lampiran 1.
4.3
Model Regresi Penjualan Tenaga Listrik di Jawa Tengah
Langkah pertama untuk menentukan model regresi robust adalah mencari model regresi berganda dengan metode kuadrat terkecil. Persamaan regresi berganda tersebut adalah Ybi = 48.660.195 − 104Xi1 + 2, 21Xi2 + 51.159Xi3 − 313Xi4 + 3, 28Xi5 ,
(4.1)
dengan Ybi adalah penjualan tenaga listrik (kWh), Xi1 adalah jumlah pelanggan (pelanggan), Xi2 adalah daya tersambung (VA), Xi3 adalah jumlah perusahaan industri (perusahaan industri), Xi4 adalah jumlah rumah tangga (rumah tangga yang menggunakan tenaga listrik), Xi5 adalah produk domestik regional bruto (rupiah). Langkah kedua adalah melakukan uji asumsi klasik regresi linear untuk melihat apakah model regresi yang diperoleh memenuhi asumsi klasik. Hasil uji asumsi klasik tersebut adalah sebagai berikut. 1. Normalitas Uji normalitas digunakan untuk mengetahui apakah sisaan dalam model berdistribusi normal. Plot probabilitas untuk sisaan dari model penjualan tenaga listrik dapat dilihat pada Gambar 4.1. Dari Gambar 4.1 terlihat bahwa pola penyebaran sisaan tidak mengikuti garis lurus, ini berarti asumsi normalitas pada sisaan tidak dipenuhi. Untuk menguji hal tersebut dapat dilakukan dengan menggunakan uji Anderson-Darling dengan uji hipotesisnya adalah sebagai berikut.
commit to user (a) H0 : sisaan berdistribusi normal H1 : sisaan tidak berdistribusi normal 20
perpustakaan.uns.ac.id
digilib.uns.ac.id
Probability Plot of RESI1 Normal 99 Mean StDev N AD P-Value
95 90
7.663454E-08 69638757 35 0.926 0.017
Percent
80 70 60 50 40 30 20 10 5
1
-200000000
-100000000
0 RESI1
100000000
200000000
Gambar 4.1. Plot probabilitas dari sisaan (b) Tingkat signifikansi (α)= 0,05 (c) Daerah Kritis H0 ditolak jika p-value < α = 0,05 (d) Statistik Uji Berdasarkan analisis, diperoleh nilai p-value = 0,017 (e) Kesimpulan Nilai p-value = 0,017 < α = 0,05, dapat disimpulkan bahwa H0 ditolak yang berarti bahwa sisaan tidak berdistribusi normal dan asumsi normalitas tidak dipenuhi. 2. Homoskedastisitas Uji homoskedastisitas dapat dilakukan dengan metode plot. Plot kesamaan variansi untuk data sisaan pada model penjualan tenaga listrik di Jawa Tengah tahun 2010 dapat dilihat pada Gambar 4.2. Dari Gambar 4.2 terlihat bahwa variansi sisaan dari satu pengamatan ke pengamatan yang lain berpola acak yang mengindikasikan bahwa variansi sisaan konstan sehingga dapat diindikasikan asumsi homoskedastisitas dipenuhi. Dari hasil tersebut commit to user dapat diambil kesimpulan bahwa asumsi homoskedastisitas dipenuhi. Selain itu dapat dilakukan uji korelasi rank Spearman. Jika nilai thitung 21
perpustakaan.uns.ac.id
digilib.uns.ac.id
Versus Fits (response is y) 200000000 150000000
Residual
100000000 50000000 0 -50000000 -100000000
0
500000000
1000000000 1500000000 2000000000 2500000000
Fitted Value
Gambar 4.2. Plot sisaan dengan Yb melebihi nilai ttabel , maka dalam data tersebut terdapat masalah heteroskedastisitas, sebaliknya jika thitung lebih kecil dari ttabel maka tidak terdapat masalah heteroskedastisitas. Pengujian dalam penelitian ini dilakukan secara terpisah antara |ei | dan tiap variabel independen yaitu jumlah pelanggan (X1 ), daya tersambung (X2 ), jumlah perusahaan industri (X3 ), jumlah rumah tangga (X4 ), dan produk domestik regional bruto (X5 ). Hasil pengujian diperoleh bahwa thitung jumlah pelanggan adalah sebesar 1,649, daya tersambung adalah sebesar 2,627, hasil thitung dari jumlah perusahaan industri adalah sebesar 0,653, hasil thitung dari jumlah rumah tangga adalah sebesar -0,846, dan hasil thitung dari produk domestik regional bruto adalah sebesar 0,986. Dengan menggunakan tabel t, besar ttabel adalah 2,75. Dari hasil tersebut dapat diambil kesimpulan bahwa asumsi homoskedastisitas dipenuhi, artinya tidak terjadi masalah heteroskedastisitas pada kasus tersebut. 3. NonMultikolinearitas Uji multikolinearitas bertujuan untuk mengetahui ada tidaknya hubungan linear antara variabel independen. Pendeteksian adanya multikolinearitas commit to user dapat dilakukan dengan berbagai uji, salah satunya adalah dengan melihat nilai VIF. Nilai VIF diperoleh dengan melakukan regresi secara parsial dan 22
perpustakaan.uns.ac.id
digilib.uns.ac.id
kemudian menghitung nilai VIF. Dari analisis diperoleh hasil yang dapat dilihat pada Tabel 4.1. Tabel 4.1. Hasil output uji multikolinearitas Variabel independen
VIF
Keterangan
X1 (Jumlah pelanggan)
3, 565 < 10 Tidak ada multikolinearitas
X2 (Daya tersambung)
6, 174 < 10 Tidak ada multikolinearitas
X3 (Jumlah perusahaan industri)
1, 230 < 10 Tidak ada multikolinearitas
X4 (Jumlah rumah tangga)
2, 275 < 10 Tidak ada multikolinearitas
X5 (Produk Domestik Regional Bruto)
4, 353 < 10 Tidak ada multikolinearitas
Berdasarkan hasil pada Tabel 4.1, dapat dilihat bahwa nilai VIF untuk semua variabel independen, baik variabel jumlah pelanggan (X1 ), daya tersambung (X2 ), jumlah perusahaan industri (X3 ), jumlah rumah tangga (X4 ), dan produk domestik regional bruto (X5 ) adalah lebih kecil dari 10, sehingga dapat disimpulkan bahwa asumsi nonmultikolinearitas dipenuhi. Dengan demikian, asumsi homoskedastisitas dan nonmultikolinearitas terpenuhi tetapi asumsi normalitas tidak terpenuhi. Hal ini berakibat bahwa penjualan tenaga listrik di Jawa Tengah tahun 2010 tidak dapat dimodelkan dengan model regresi biasa. Oleh karena itu, perlu dilakukan penanganan terhadap pelanggaran asumsi tersebut agar diperoleh estimasi regresi yang tepat. Penanganan tersebut dengan menggunakan model regresi robust yang resistant terhadap pencilan, dimana pencilan tersebut yang menyebabkan asumsi normalitas tidak dipenuhi. Langkah ketiga adalah mendeteksi adanya pencilan pada data penjualan tenaga listrik di Jawa Tengah tahun 2010 dengan metode T RES dan hii . Berdasarkan statistik uji untuk mengetahui pencilan terhadap Y yaitu TRES dengan menarik kesimpulan menolak H0 apabila nilai |TRES| > ttabel . Dari hasil perhitungan diperoleh bahwa pengamatan ke 2, 31, dan 33 merupakan pencilan. commit to user Berdasarkan statistik uji untuk mengetahui pencilan terhadap X yaitu hii apabila nilai hii >
2k . n
Dari hasil perhitungan diperoleh bahwa pengamatan ke 1, 2, 23
perpustakaan.uns.ac.id
digilib.uns.ac.id
19, dan 33 merupakan pencilan. Selengkapnya dapat dilihat pada Tabel 4.2. Tabel 4.2. Hasil Uji T RES dan hii Pengamatan
TRES
ttabel
hii
2k n
1
0, 471629 > 0, 34286
2
−2, 09455 < 2, 045 0, 352397 > 0, 34286
19
0, 622464 > 0, 34286
31 33
3, 48214
> 2, 045
−7, 53194 < 2, 045 0, 854636 > 0, 34286
Langkah keempat adalah menduga koefisien regresi dengan estimasi-GS. Proses penghitungan estimasi-GS yang iteratif dimulai dengan menentukan estimasi awal koefisien regresi, yang diperoleh dari M KT yaitu βb0 = (48.660.195; −104; 2, 21; 51.159; −313; 3, 28), kemudian berdasarkan algoritma estimasi-GS, dihitung nilai ybi0 , sisaan e0i = yi − ybi0 , dan selisih sisaan ∆eii′ = ei − ei′ dengan ∆eii′ = (∆e12 , . . . , e(n−1)n ). Proses iterasi menggunakan M KT terboboti dilanjutkan dengan menghitung sisaan, selisih sisaan, dan pembobot w(ui ) yang baru dan dilakukan pendugaan parameter secara berulang-ulang sampai konvergen. Menurut Salibian dan Yohai [14], kekonvergenan tercapai jika koefisien regresi sudah sama dengan koefisien regresi sebelumnya. Nilai σ bGS dan βbGS tiap iterasi pada estimasi-GS dengan 5 variabel independen ditunjukkan pada Tabel 4.3. Berdasarkan Tabel 4.3 terlihat bahwa koefisien regresi sudah konvergen pada iterasi ke-20 diperoleh estimasi parameternya adalah βc 20 = (674.187; −136; 1, 87; 144.277; −147; 11, 4), dan dapat dituliskan persamaan regresinya sebagai berikut.
to user i3 − 147Xi4 + 11, 4Xi5 , Ybi = 674.187 − 136Xi1 + 1, 87Xcommit i2 + 144.277X 2 dengan Radjusted = 99, 6%. Hasil output dapat dilihat pada Lampiran 7.
24
(4.2)
perpustakaan.uns.ac.id
digilib.uns.ac.id
Tabel 4.3. Nilai σ bGS dan βbGS tiap iterasi pada estimasi-GS dengan 5 var. indep. No.
σ bGS
βbGS
1
86.770.873
(- 14.514.687 ; - 68 ; 1,96 ; 103.322 ; - 130 ; 9,98)
2
87.573.368
(- 10.865.745 ; - 101 ; 1,87 ; 119.789 ; - 113 ; 11,6)
3
90.961.136
(- 3.291.631 ; - 135 ; 1,87 ; 140.516 ; - 129 ; 11,6)
4
91.317.191
(- 876.137 ; - 136 ; 1,87 ; 144.881 ; - 141 ; 11,5)
5 .. .
91.280.662 .. .
(129121 ; - 136 ; 1,87 ; 144.416 ; - 145 ; 11,5) .. .
15
91.257.803
(674.165 ; - 136 ; 1,87 ; 144.277 ; - 147 ; 11,4)
16
91.257.805
(674.177 ; - 136 ; 1,87 ; 144.277 ; - 147 ; 11,4)
17
91.257.803
(674.185 ; - 136 ; 1,87 ; 144.277 ; - 147 ; 11,4)
18
91.257.804
(674.186 ; - 136 ; 1,87 ; 144.277 ; - 147 ; 11,4)
19
91.257.803
(674.187 ; - 136 ; 1,87 ; 144.277 ; - 147 ; 11,4)
20
91.257.803
(674.187 ; - 136 ; 1,87 ; 144.277 ; - 147 ; 11,4)
Variabel independen yang berpengaruh dapat diketahui dengan melakukan uji signifikansi model regresi robust estimasi-GS. 1. H0 : βi = 0, i = 1, 2, 3, 4, 5 (jumlah pelanggan, daya tersambung, jumlah perusahaan industri, jumlah rumah tangga, atau produk domestik regional bruto tidak berpengaruh secara signifikan terhadap penjualan tenaga listrik di Jawa Tengah tahun 2010) H1 : βi ̸= 0 untuk suatu i = 1, 2, 3, 4, 5 (paling tidak ada salah satu jumlah pelanggan, daya tersambung, jumlah perusahaan industri, jumlah rumah tangga, atau produk domestik regional bruto yang berpengaruh secara signifikan terhadap penjualan tenaga listrik di Jawa Tengah tahun 2010) 2. Tingkat signifikansi (α)= 0,05
user 3. Daerah kritis: H0 ditolak jikacommit Fhit > to Ftab = F(p,n−p;α) = F(6,29;0,05) = 2, 42 4. Berdasarkan analisis, diperoleh nilai Fhitung =1.329,34 25
perpustakaan.uns.ac.id
digilib.uns.ac.id
5. Kesimpulan Nilai Fhitung =1.329,34 > Ftab =2,42, dapat disimpulkan bahwa H0 ditolak artinya paling tidak ada salah satu jumlah pelanggan, daya tersambung, jumlah perusahaan industri, jumlah rumah tangga, atau produk domestik regional bruto yang berpengaruh secara signifikan terhadap penjualan tenaga listrik di Jawa Tengah tahun 2010. Selanjutnya dilakukan uji parsial untuk mengetahui signifikansi atau pengaruh masing-masing variabel terhadap model regresi yang dihasilkan. Uji parsial tersebut menggunakan uji t. Hasil dapat dilihat pada Tabel 4.4. Tabel 4.4. Hasil uji t pada estimasi-GS dengan 5 var. indep. Variabel
p-value
Kesimpulan
X1 (Jumlah pelanggan)
0, 202 > 0, 05 Tidak signifikan
X2 (Daya tersambung)
0, 000 < 0, 5
Signifikan
X3 (Jumlah perusahaan industri)
0, 010 < 0, 05
Signifikan
X4 (Jumlah rumah tangga)
0, 045 < 0, 05
Signifikan
X5 (Produk Domestik Regional Bruto)
0, 000 < 0, 05
Signifikan
Berdasarkan Tabel 4.4 dapat disimpulkan bahwa masing-masing daya tersambung, jumlah perusahaan industri, jumlah rumah tangga, dan produk domestik regional bruto berpengaruh secara signifikan terhadap penjualan tenaga listrik di Jawa Tengah tahun 2010, sedangkan jumlah pelanggan tidak berpengaruh signifikan. Karena terdapat satu variabel independen yang tidak berpengaruh signifikan, maka proses iterasi diulang lagi seperti langkah di atas tanpa mengikutsertakan variabel yang tidak signifikan tersebut. Langkah pertama untuk menentukan model regresi robust adalah mencari model regresi berganda dengan metode kuadrat terkecil. Model regresi berganda tersebut adalah Ybi = 46.067.162 + 2, 16Xi2 + 54.475Xi3 − 363Xi4 + 4, 23Xi5
(4.3)
commit to user dengan Ybi adalah penjualan tenaga listrik (kWh), Xi2 adalah daya tersambung (VA), Xi3 adalah jumlah perusahaan industri (perusahaan industri), Xi4 adalah 26
perpustakaan.uns.ac.id
digilib.uns.ac.id
jumlah rumah tangga (rumah tangga yang menggunakan tenaga listrik), Xi5 adalah produk domestik regional bruto (rupiah). Langkah kedua adalah menduga koefisien regresi dengan estimasi-GS. Proses penghitungan estimasi-GS yang iteratif dimulai dengan menentukan estimasi awal koefisien regresi, yang diperoleh dari M KT yaitu βb0 = (46.067.162; 2, 16; 54.475; −363; 4, 23), kemudian berdasarkan algoritma estimasi-GS, dihitung nilai ybi0 , sisaan e0i = yi − ybi0 , dan selisih sisaan ∆eii′ = ei − ei′ dengan ∆eii′ = (∆e12 , . . . , e(n−1)n ). Proses iterasi menggunakan M KT terboboti dilanjutkan dengan menghitung sisaan, selisih sisaan, dan pembobot w(ui ) yang baru dan dilakukan pendugaan parameter secara berulang-ulang sampai konvergen. Menurut Salibian dan Yohai [14], kekonvergenan tercapai jika koefisien regresi sudah sama dengan koefisien regresi sebelumnya. Nilai σ bGS dan βbGS tiap iterasi pada estimasi-GS dengan 4 variabel independen ditunjukkan pada Tabel 4.5. Tabel 4.5. Nilai σ bGS dan βbGS tiap iterasi pada estimasi-GS dengan 4 var. indep. No.
βbGS
σ bGS
1
87.772.959 (- 5.526.831 ; 1,94 ; 79.029 ; - 176 ; 9,35)
2
89.084.157 (- 5.763.915 ; 1,86 ; 96.124 ; - 172 ; 11,0)
3
90.974.181
(279.530 ; 1,85 ; 100.851 ; - 201 ; 11,5)
4
91.347.499
(2.111.072 ; 1,85 ; 106.524 ; - 213 ; 11,8)
5 .. .
91.460.918 .. .
(2.708.553 ; 1,84 ; 108.189 ; - 217 ; 11,9) .. .
15
91.587.133
(3.043.055 ; 1,84 ; 109.457 ; - 220 ; 12,0)
16
91.587.137
(3.043.065 ; 1,84 ; 109.457 ; - 220 ; 12,0)
17
91.587.139
(3.043.069 ; 1,84 ; 109.458 ; - 220 ; 12,0)
18
91.587.140
(3.043.070 ; 1,84 ; 109.458 ; - 220 ; 12,0)
19
91.587.140
20
91.587.140
(3.043.071 ; 1,84 ; 109.458 ; - 220 ; 12,0) commit to user (3.043.071 ; 1,84 ; 109.458 ; - 220 ; 12,0)
27
perpustakaan.uns.ac.id
digilib.uns.ac.id
Berdasarkan Tabel 4.5 terlihat bahwa koefisien regresi sudah konvergen pada iterasi ke-20 diperoleh estimasi parameternya adalah βc 20 = (3.043.071; 1, 84; 109.458; −220; 12, 0), dan dapat dituliskan model regresinya sebagai berikut. Ybi = 3.043.071 + 1, 84Xi2 + 109.458Xi3 − 220Xi4 + 12, 0Xi5 ,
(4.4)
2 dengan Radjusted = 99, 6%. Hasil output dapat dilihat pada Lampiran 8.
Interpretasinya yaitu setiap peningkatan satu rumah tangga yang menggunakan tenaga listrik akan menurunkan penjualan tenaga listrik di Jawa tengah tahun 2010 sebesar 220 kWh dan setiap peningkatan satu VA daya tersambung, satu perusahaan industri, dan satu produk domestik regional bruto akan meningkatkan penjualan tenaga listrik masing-masing sebesar 1,84 kWh, 109.458 kWh 2 dan 12,0 kWh. Sedangkan Radjusted sebesar 99,6 % artinya bahwa penjualan te-
naga listrik dapat dijelaskan oleh variabel daya tersambung, jumlah perusahaan industri, jumlah rumah tangga, dan produk domestik regional bruto. Sisanya sebesar 0,4 % dijelaskan oleh variabel yang lain. Variabel independen yang berpengaruh dapat diketahui dengan melakukan uji signifikansi model regresi robust estimasi-GS. 1. H0 : βi = 0, i = 2, 3, 4, 5 (daya tersambung, jumlah perusahaan industri, jumlah rumah tangga, atau produk domestik regional bruto tidak berpengaruh secara signifikan terhadap penjualan tenaga listrik di Jawa Tengah tahun 2010) H1 : βi ̸= 0 untuk suatu i = 2, 3, 4, 5 (paling tidak ada salah satu daya tersambung, jumlah perusahaan industri, jumlah rumah tangga, atau produk domestik regional bruto yang berpengaruh secara signifikan terhadap penjualan tenaga listrik di Jawa Tengah tahun 2010) 2. Tingkat signifikansi (α)= 0,05commit to user 3. Daerah kritis: H0 ditolak jika Fhit > Ftab = F(5,n−p;α) = F(5,30;0,05) = 2, 53 28
perpustakaan.uns.ac.id
digilib.uns.ac.id
4. Berdasarkan analisis, diperoleh nilai Fhitung =1.604,13 5. Kesimpulan Nilai Fhitung =1.604,13 > Ftab =2,53, dapat disimpulkan bahwa H0 ditolak artinya paling tidak ada salah satu daya tersambung, jumlah perusahaan industri, jumlah rumah tangga, atau produk domestik regional bruto yang berpengaruh secara signifikan terhadap penjualan tenaga listrik di Jawa Tengah tahun 2010. Selanjutnya dilakukan uji parsial lagi untuk mengetahui signifikansi atau pengaruh masing-masing variabel terhadap model regresi yang dihasilkan. Hasil dapat dilihat pada Tabel 4.6. Tabel 4.6. Hasil uji t pada estimasi-GS dengan 4 var. indep. Variabel
p-value
Kesimpulan
X2 (Daya tersambung)
0, 000 < 0, 05
Signifikan
X3 (Jumlah perusahaan industri)
0, 047 < 0, 05
Signifikan
X4 (Jumlah rumah tangga)
0, 000 < 0, 05
Signifikan
X5 (Produk Domestik Regional Bruto)
0, 000 < 0, 05
Signifikan
Berdasarkan Tabel 4.6 dapat disimpulkan bahwa keempat variabel independen yaitu daya tersambung, jumlah perusahaan industri, jumlah rumah tangga, dan produk domestik regional bruto telah signifikan mempengaruhi jumlah penjualan tenaga listrik di Jawa Tengah tahun 2010. Oleh karena itu, model regresi robust dengan estimasi-GS yang terpilih adalah menggunakan 5 variabel yaitu jumlah penjualan tenaga listrik tiap kabupaten/kota sebagai variabel dependen Y , daya tersambung pada tiap kabupaten/kota sebagai variabel independen X2 , jumlah perusahaan industri pada tiap kabupaten/kota sebagai variabel independen X3 , jumlah rumah tangga pada tiap kabupaten/kota sebagai variabel independen X4 , dan produk domestik regional bruto pada tiap kabupaten/kota sebagai variabel independen X5 .
commit to user
29