Fuji Rahayu W
Oleh : (1208 100 043)
JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2012
Indonesia sebagai negara maritim
Penduduk Indonesia banyak yang menggantungkan hidupnya pada sektor perikanan
Metode regresi utk memodelkan jumlah produksi ikan laut di Jatim
Meningkatkan jumlah produksi ikan laut melalui pemilihan variabel kendali yang tepat
Rumusan Masalah 1.
Bagaimana bentuk persamaan model regresi untuk jumlah penangkapan ikan laut di Provinsi Jawa Timur.
2. Bagaimana model regresi yang terbentuk dari variabel bebas terhadap variabel respon.
Batasan massalah dalam Tugas Akhir ini adalah :
Variabel responnya adalah jumlah penangkapan ikan di perairan laut (Y) dan variabel bebasnya adalah jumlah nelayan (X1), jumlah motor boat penangkap ikan (X2), jumlah alat penangkapan ikan (X3) dan jumlah PDRB nelayan (X4).
1.
2.
Data stastistik yang diambil adalah data tahunan tentang perikanan di Provinsi Jawa Timur dari tahun 1980-2010 berdasarkan Badan Pusat Statistik Provinsi Jawa Timur.
4.
3.
Metode yang digunakan adalah Regresi Linier Bertatar Langkah Mundur.
Selang kepercayaan yang digunakan adalah 95 %.
Tujuan Penelitian 1.
Menentukan model regresi untuk jumlah penangkapan ikan laut di Provinsi Jawa Timur.
2. Menentukan besarnya sumbangan variabel bebas secara
keseluruhan terhadap variabel respon dari model regresi yang didapat.
Manfaat yang diharapkan pada tugas akhir ini adalah untuk memberikan informasi mengenai seberapa besar pengaruh variabel bebas terhadap jumlah penangkapan ikan laut di Provinsi Jawa Timur yang diharapkan mempunyai prospek hasil penangkapan ikan yang lebih bagus kedepannya.
2.1 Analisis Regresi Analisis regresi merupakan sebuah alat statistik yang memberikan penjelasan tentang pola hubungan (model) antara dua variabel atau lebih. Dalam analisis regresi, dikenal dua jenis variabel yaitu variabel respon yaitu variabel yang keberadaannya dipengaruhi oleh variabel lainnya dan dinotasikan dengan Y dan variabel bebas yaitu variabel yang bebas yang keberadaannya tidak dipengaruhi oleh variabel lainnya dan dinotasikan dengan X.
2.2 Analisis Regresi Linier Berganda Analisis regresi linier berganda (Multiple Linier Regression) ialah suatu alat analisis dalam ilmu statistik yang berguna untuk mengukur hubungan matematis antara lebih dari dua peubah. Regresi linear berganda juga merupakan regresi dimana variabel terikatnya (Y) dihubungkan atau dijelaskan lebih dari satu variabel, mungkin dua, tiga dan seterusnya variabel bebas. Bentuk umum dari persamaan regresi linier berganda dapat ditulis sebagai berikut: Y = 0 + 1X1i + 2X2i + ….. + kXki + i ; i = 1,2, …, n dengan : Y β0, β1...βk X1i , X2i .. Xki εi k
: variabel respon : parameter regresi : variabel bebas : error : banyaknya parameter
2.3 Regresi Bertatar Metode regresi bertatar umumnya dipakai sebagai pemilihan model terbaik apabila antar variabel bebasnya mengalami multikolinieritas karena dengan metode bertatar ini dapat menghilangkan variabel yang mempunyai multikolinieritas tinggi. Metode begresi bertatar langkah mundur (backward selection) mencoba memeriksa hanya regresi “terbaik” yang mengandung sejumlah tertentu peubah peramal. Metode ini bekerja dengan mengeluarkan satu per satu variabel bebas yang tidak signifikan dan dilakukan terus menerus sampai tidak ada variabel bebas yang tidak signifikan, langkah-langkah metode backward adalah sebagai berikut : 1. Menghitung persamaan regresi yang mengandung semua peubah peramal. 2. Menghitung nilai F-parsial untuk setiap peubah peramal. 3. Membandingkan nilai F-parsial terendah, misalnya FL, dengan nilai F bertaraf nyata tertentu dari tabel, misalnya F0. a. Jika FL < F0, buang peubah ZL yang menghasilkan FL dari persamaan regresi, kemudian hitung kembali persamaan regresi tanpa menyertakan peubah tersebut; kembali ke langkah (2). b. Jika FL > F0, ambillah persamaan regresi tersebut.
2.4 Pengujian Parameter Regresi 1. Uji serentak Uji serentak bertujuan untuk menguji apakah antara variabel-variabel bebas X dan terikat Y benar-benar terdapat hubungan linier (linear relation). Hipotesa : H0 : βi = 0, dimana i = 1,2,3,4,...k H1 : ada i dimana βi ≠ 0, dimana i = 1,2,3,4,...k Statistik Uji :
M SR SSReg/k Fhitung M SR SSReg/k Fhitung M SE SSRes/(n k 1) M SE SSRes/(n k 1) Kriteria Pengujian : Tolak Ho jika Fhitung > FTabel (α , p,
n- p-1 ).
2. Uji Individu Dalam pengujian ini ingin diketahui apakah jika secara terpisah, suatu variabel X masih memberikan kontribusi secara signifikan terhadap variabel terikat Y. Hipotesa : H0 : βi = 0 H1 : βi ≠ 0 Statistik Uji : bj ˆ j t hitung s (b j ) s.e( ˆ j ) jika thitung > ttabel (n-p), maka tolak H0
2.5 Uji Asumsi Residual Karena model regresi yang dibentuk didasarkan dengan meminimumkan jumlah kuadrat error, maka residual (sisaan) yang dalam hal ini dianggap sebagai suatu kesalahan dari pengukuran harus memenuhi beberapa asumsi, diantarannya : • Identik : memiliki varian yang konstan • Bebas (saling bebas) : tidak ada autokorelasi antar residual • Berdistribusi Normal a
1. Uji Identik (Heteroscedasticitas) Hipotesa : Statustik uji : Kriteria pengujian: Apabila nilai F hitung < F Tabel, maka H0 diterima atau residual tidak terdapat heterokedastisitas. i 0 1 X1 2 X 2 ... n X n
2. Uji Asumsi Independen Hipotesa : Statistik uji Durbin-Watson : n
et et12
d
t2
n
e
Kriteria pengujian : Ho: tak ada otokorelasi positif Bila: d < dL : tolak Ho, d >dU : terima Ho, dL≤d≤dU : tak dapat disimpulkan
2 t
t 1
Ho: tak ada otokorelasi positif dan negatif Bila: d < dL atau d > 4- dL : tolak Ho, dU
Ho: tak ada otokorelasi negatif Bila: d >4 - dL : tolak Ho, d<4-dU : terima Ho, 4-dU ≤d≤ 4-dL : tak dapat disimpulkan
3. Uji Asumsi Distribusi Normal Uji asumsi distribusi normal adalah untuk melihat apakah nilai residual terdistribusi normal atau tidak. Model regresi yang baik adalah memiliki nilai residual yang terdistribusi normal. Jadi uji normalitas bukan dilakukan pada masing-masing variabel tetapi pada nilai residualnya.
4. Uji Multikolinieritas Multikolinearitas merupakan korelasi atau hubungan yang kuat diantara variabelvariabel bebas dalam persamaan regresi linear berganda. Multikolinearitas terjadi jika nilai Variance Inflation Factor (VIF) lebih besar dari 10.
Metodologi Penelitian Pengumpulan Data Metode penelitian Penarikan kesimpulan Penyusunan laporan
Dalam Tugas Akhir ini, data di ambil dari Badan Pusat Statistik Provinsi Jawa Timur. Data stastistik yang diambil adalah data tahunan tentang perikanan di Provinsi Jawa Timur dari tahun 1980-2010.
Langkah1: Memeriksa asumsi Langkah 2: Mengolah data dengan bantuan Minitab 15 Langkah 3: Menafsirkan output Langkah4:Mengembangkan persamaan model
Analisis dan Pembahasan 4.1 Analisis Regresi Dengan menggunakan program aplikasi MINITAB diperoleh hasil output komputer sebagai berikut: Tabel 4.1 Hasil Printout Analisis Regresi Y terhadap X1, X2, X3, X4 The regression equation is Y = 168109 + 0,554 X1 - 2,4 X2 - 4,68 X3 + 0,0137 X4
Predictor Constant X1 X2 X3 X4
Coef 168109 0,5539 -2,42 -4,678 0,01365
S = 60074,9
SE Coef 118997 0,5890 10,58 3,040 0,01092
R-Sq = 70,6%
T 1,41 0,94 -0,23 -1,54 1,25
P 0,170 0,356 0,821 0,136 0,222
VIF 2,829 18,364 2,139 21,074
R-Sq(adj) = 66,1%
Analysis of Variance Source Regression Residual Error Total
DF 4 26 30
SS 2,25770E+11 93833719809 3,19603E+11
MS 56442424985 3608989223
Durbin-Watson statistic = 1,48237
F 15,64
P 0,000
Dari hasil pengolahan data minitab pada Tabel 4.1 diperoleh suatu model parameter regresi dengan metode kuadrat terkecil dan persamaan regresinya sebagai berikut: Yi = 168109 + 0,554X1i - 2,4X2i - 4,68X3i + 0,0137X4i + εi
Setelah dilakukan pengujian parameter untuk uji serentak, didapat bahwa = 15,6393 > Ftabel (5%,4,26) = 2,74 atau nilai p-value = 0.000 < = 0.05. Yang berarti secara statistik signifikan, maka H0 ditolak sehingga dapat disimpulkan bahwa secara bersama-sama terdapat pengaruh variabel X1, X2, X3 dan X4 terhadap variabel Y.
Sedangkan untuk uji individu didapat berdasarkan hasil output diperoleh bahwa koefisien regresi dari masing-masing X1, X2, X3, dan X4 tidak signifikan karena nilai thitung dari masingmasing koefisiennya lebih kecil daripada ttabel, sehingga Ho diterima. Maka dapat disimpulkan bahwa koefisien regresi variabel X1, X2, X3, dan X4 yang bersesuaian dengan parameter regresi secara individual tidak memberikan pengaruh yang berarti terhadap model.
3.2 Uji Asumsi Residual a. Uji Identik (Heteroscedasticitas). Dari hasil pengolahan diperoleh Fhitung = 3,25 > Ftabel (5%,4,26) = 2,74, dengan demikian Ho ditolak, maka dapat disimpulkan bahwa terjadi heteroskedastisitas.
b. Independen (Autokorelasi) Secara umum, pengujian autokorelasi dapat menggunakan plot ACF seperti pada Gambar 1. Jika tidak ada lag yang keluar dari garis merah, maka dapat disimpulkan bahwa tidak terdapat korelasi antar variabelnya.
c.Uji Normalitas Hasil minitab pada Gambar 2 menggunakan test Kolmogorov Smirnov menunjukkan pvalue < 0,150 maka H0 ditolak, jadi residual tidak memenuhi asumsi normal. d. Multikolinearitas Dari hasil Analisis multikolinearitas menggunakan minitab pada Tabel 1 ditemukan nilai VIF yang lebih besar dari 10 yaitu variabel X2 dan X4 sehingga diduga ada multikolinearitas antar variabel bebas tersebut.
Gambar 1. Plot ACF residual 1
Gambar 2. Uji Normalits residual 1
3.3 Perbaikan Model Dari model yang didapat sebelumnya, masih terdapat heterokedastisitas dan multikolenieritas serta residualnya belum berdistribusi normal. Oleh karena itu, antar variabel bebasnya perlu diadakan tinjauan ulang terhadap model tersebut dengan melakukan transformasi terhadap semua variabelnya, yaitu variabel Y, X1, X2, X3 dan X4 dengan menggunakan transformasi Box-Cox.. Untuk selanjutnya, semua variabel yang sudah ditransformasi diberi lambang Y*, X1*, X2*, X3* dan X4*. dengan : Y* mempunyai nilai X1* mempunyai nilai (X1)2 X2* mempunyai nilai In X2 X3* mempunyai nilai In X3 X4* mempunyai nilai (X4)0,18
Setelah dilakukan transformasi dengan menggunakan Box-Cox didapat persamaan regresinya, yaitu : Y* = 11,1 - 0,000000 X1* - 0,339 X2* - 0,199 X3* - 0,209 X4* Selajutnya dari hasil transformasi semua variabelnya dilakukan analisis regresi dengan metode bertatar seleksi langkah mundur untuk mengatasi kasus multikolinieritas dan uji asumsi normalnya. Secara umum, pengolahan metode analisis regresi seleksi bertatar langkah mundur dapat dilihat pada Tabel 2. Dari pengolahan tersebut didapat persamaan model regresinya adalah sebagai berikut : Yi* = 8,40 - 0,330 X4i* + εi
Tabel 2 Hasil Printout Analisis Regresi Metode Seleksi bertatar Langkah Mundur Backward elimination.
Alpha-to-Remove: 0,05
Response is Y* on 4 predictors, with N = 31 Step Constant
1 11,120
2 10,978
3 8,907
-0,28 -1,02 0,318
4 8,397
X1* T-Value P-Value
-0,00000 -0,18 0,859
X2* T-Value P-Value
-0,34 -1,02 0,316
-0,35 -1,09 0,286
X3* T-Value P-Value
-0,20 -0,46 0,650
-0,19 -0,44 0,661
X4* T-Value P-Value
-0,209 -1,77 0,089
-0,211 -1,83 0,078
-0,220 -1,96 0,060
-0,330 -11,51 0,000
0,680 82,84 80,20 5,0
0,668 82,82 80,91 3,0
0,658 82,69 81,46 1,2
0,658 82,05 81,43 0,2
S R-Sq R-Sq(adj) Mallows Cp
Setelah dilakukan semua asumsi uji residual ternyata masih ada autokorlasi. Untuk mengatasi autokorelasi tersebut, maka dilakukan lag satu kali pada variabel Y*. Kemudian, variabel Y* yang sudah mengalami lag tersebut dimasukkan sebagai variabel bebasnya. Yang diregresikan dengan X4* dengan variabel responya adalah Y* seperti pada Tabel 3.
Tabel 3. Hasil printout Analisis Regresi Yi* dengan variabel X4* dan Yi-1 The regression equation is Y* = 5,55 - 0,228 X4* + 0,371 Y*(i-1) 30 cases used, 1 cases contain missing values Predictor Constant X4* Y*(i-1) S = 0,594065
Coef SE Coef 5,553 1,321 -0,22760 0,05703 0,3712 0,1581 R-Sq = 86,0%
T 4,20 -3,99 2,35
P VIF 0,000 0,000 4,373 0,026 4,373
R-Sq(adj) = 85,0%
Karena semua asumsi residual terpenuhi, maka model yang digunakan adalah : Yi* = 5,55 - 0,228 X4i* + 0,371 Yi-1* dengan : Yi* adalah X4i* adalah (X4i)0,18
Untuk selanjutnya, akan dibahas kasus multikolinieritas. Pada pembahasan sebelumnya, ditemukan adanya kasus multikolinieritas antara variabel X2* dan X4* sebelum dilakukan proses seleksi bertatar. Multikolinearitas ditandai dengan tingginya nilai koefisien determinasi R2 jika antar variabel tersebut di regresikan. Hasil pengolahan minitab antara variabel X2* dan X4* dapat dilihat pada Tabel 4.15. Dapat dilihat pada Tabel 4.15 tersebut bahwa R2 yang didapat sangat besar yaitu 93,5 %. Sekarang akan dicoba memasukkan variabel X2* dalam model yang dapat dilihat pada Tabel 4.16. Dari pengolahan minitab didapat persamaan model regresinya adalah sebagai berikut :
Y* = 5,88 - 0,502 X2* + 0,430 Y*(i-i) + εi dengan : Yi* adalah X2* mempunyai nilai In X2
(5)
Tabel 4.15 Hasil Analisis Regresi variabel X4* terhadap X2* Selanjutnya dari persamaan (5) juga akan dilakukan uji asumsi residual untuk melihat apakah model tersebut benar-benar signifikan atau tidak. Jika model tersebut memenuhi semua asumsi residualnya, tidak menutup kemungkinan model tersebut juga bisa dipakai.
The regression equation is X2* = 1,83 + 0,396 X4* Predictor Coef SE Coef T P VIF Constant 1,8331 0,2519 7,28 0,000 X4* 0,39632 0,01942 20,41 0,000 1,000 S = 0,445915 R-Sq = 93,5% R-Sq(adj) = 93,3% Analysis of Variance Source DF SS MS F P Regression 1 82,823 82,823 416,53 0,000 Residual Error 29 5,766 0,199 Total 30 88,590
Uji Asumsi Residual a. Uji Identik (Heteroscedasticitas). Dari hasil pengolahan diperoleh Fhitung = 2,08 < Ftabel (5%,2,28) = 3,34, dengan demikian Ho diterima, maka dapat disimpulkan bahwa tidak terjadi heteroskedastisitas.
b. Independen (Autokorelasi) Secara umum, pengujian autokorelasi dapat menggunakan plot ACF seperti pada Gambar 4.18. Jika tidak ada lag yang keluar dari garis merah, maka dapat disimpulkan bahwa tidak terdapat korelasi antar variabelnya.
c.Uji Normalitas Hasil minitab pada Gambar 4.19 menggunakan test Kolmogorov Smirnov menunjukkan pvalue < 0, 05 maka H0 diterima, jadi residual memenuhi asumsi normal. d. Multikolinearitas Dari hasil Analisis multikolinearitas menggunakan minitab pada Tabel 4.16 ditemukan nilai VIF yang kurang dari dari 10 sehingga disimpulkan bahwa tidak ada multikolinearitas antar variabel bebas.
IV. PENUTUP Dari hasil analisa model yang terbentuk, didapatkan kesimpulan sebagai berikut : Model terbaik penangkapan ikan laut di Provinsi Jawa Timur tahun 1980-2010 setelah dilakukan pemilihan model terbaik berdasarkan kriteria yang ada dengan metode regresi linier bertatar langkah mundur adalah sebagai berikut : dengan : Y* = 5,88 - 0,502 X2* + 0,430 Y*(i-i) + εi Yi* adalah X2* mempunyai nilai In X2 Besar sumbangan variabel bebasn terhadap variabel responnya adalah 85,2%.