PENDEKATAN REGRESI SEMIPARAMETRIK UNTUK PROSES PEMBENTUKAN LIMBAH PABRIK GULA ASEMBAGUS SITUBONDO

PENDEKATAN REGRESI SEMIPARAMETRIK UNTUK PROSES PEMBENTUKAN LIMBAH PABRIK GULA ASEMBAGUS SITUBONDO 1

2

3

Niarfie Radythia, Ir. Mutiah Salamah Chamid, M Kes, dan Jerry Dwi TP, S.Si, M.Si 1

Mahasiswa Jurusan Statistika FMIPA-ITS (1306100045) 2,3

Dosen Jurusan Statistika FMIPA-ITS

------------------------------------------------------------------------------------------------------------------------Abstrak Masalah yang sering muncul dalam regresi adalah tidak semua variabel prediktor dapat didekati dengan pendekatan parametrik. Oleh karena itu diperlukan suatu pendekatan yang tidak terikat dengan asumsi bentuk kurva regresi tertentu dan memberikan fleksibilitas yang besar. Pendekatan semacam ini dinamakan regresi nonparametrik. Dengan menggabungkan kedua pendekatan ini akan di dapatkan suatu model regresi semiparametrik. Seiring dengan semakin dekatnya era pasar bebas, diperlukan upaya-upaya perbaikan dalam segala bidang termasuk proses pembuatan gula. Salah satu yang dapat dilakukan adalah menggambarkan pola hubungan antara bahan masukan proses dengan limbah yang dihasilkan. Dalam penelitian Rudianto (1997) terdapat lima variabel prediktor yaitu X1 adalah berat kapur tohor, X2 adalah berat sulfur, X3 adalah berat flokulan, X4 adalah berat tebu, dan X5 adalah berat fosfat, serta variabel respon Y adalah berat limbah/blotong. Dengan menggunakan metode All Possible Regression didapatkan bahwa model regresi Y dengan X2 dan X3 memiliki nilai R2 yang kecil yaitu sebesar 50,9. Diperlukan metode alternatif untuk menjelaskan hubungan antara Y, X2 dan X3. Untuk itulah dilakuan penelitian guna mendapatkan model semiparametrik pada proses pembentukan limbah pabrik gula Asembagus Situbondo.Metode yang digunakan adalah regresi semiparametrik dengan estimator spline. Didapatkan model yang lebih baik dari model parametrik pada penelitian Rudianto (1997) yaitu model semiparametrik dengan nilai koefisien determinasi dalam model ini sebesar 63,99%. Kata-kata kunci : Limbah Pabrik Gula, Regresi Semiparametrik, Estimator Spline

1. Pendahuluan Masalah yang sering muncul dalam regresi adalah tidak semua variabel prediktor dapat didekati dengan pendekatan parametrik. Oleh karena itu diperlukan suatu pendekatan yang tidak terikat dengan asumsi bentuk kurva regresi tertentu dan memberikan fleksibilitas yang besar. Pendekatan semacam ini dinamakan regresi nonparametrik. Dengan menggabungkan kedua pendekatan ini akan di dapatkan suatu model regresi semiparametrik. Seiring dengan semakin dekatnya era pasar bebas, diperlukan upaya-upaya perbaikan dalam segala bidang termasuk proses pembuatan gula. Salah satu yang dapat dilakukan adalah menggambarkan pola hubungan antara bahan masukan proses dengan limbah yang dihasilkan. Dalam penelitian Rudianto (1997) terdapat lima variabel prediktor yaitu X1 adalah berat kapur tohor, X2 adalah berat sulfur, X3 adalah berat flokulan, X4 adalah berat tebu, dan X5 adalah berat fosfat, serta variabel respon Y adalah berat limbah/blotong. Dengan menggunakan metode All Possible Regression didapatkan bahwa model regresi Y dengan X2 dan X3 memiliki nilai R2 yang kecil yaitu sebesar 50,9. Diperlukan metode alternatif untuk menjelaskan hubungan antara Y, X2 dan X3. Berdasarkan Uraian di atas maka permasalahan yang akan diselesaikan dalam penelitian ini adalah bagaimana mendapatkan model semiparametrik pada proses pembentukan limbah pabrik gula Asembagus Situbondo. Manfaat yang diharapkan dari penelitian ini adalah memberikan pemodelan alternatif pada proses pembentukan limbah pabrik gula Asembagus Situbondo yaitu dengan metode regresi semiparametrik. 2. Tinjauan Pustaka 2.1 Regresi Parametrik Regresi parametrik merupakan metode yang digunakan untuk mengetahui pola hubungan antara variabel respon dan prediktor yang diketahui bentuk kurva regresinya (Eubank, 1988). Secara umum bentuk regresi parametrik linear digambarkan sebagai berikut: y m x 1 ε , i 1,2, … , n

1

dengan:

y m x ε

= variabel respon ke-i = fungsi parametrik (mengikuti bentuk kurva regresi tertentu) = error ~ IIDN (0,σ2)

Bila dinyatakan dalam bentuk matrik adalah sebagai berikut: Estimasi dari perameter γ yaitu γλ dapat diperoleh dengan metode kuadrat terkecil sebagai berikut: ′ ′ 2 Dari persamaan (2.2) didapatkan estimasi kurva regresi: -1

Xγλ = X(X' X) X' y dengan

-1

3 X(X' X) X' Matrik A(λ) ini sering disebut matrik hat, yang memiliki peranan yang sangat penting dalam analisis regresi.

2.2 Regresi Nonparametrik Regresi nonparametrik adalah metode yang digunakan untuk mengetahui pola hubungan antara variabel respon dan variabel prediktor yang tidak diketahui bentuk fungsinya. Secara umum bentuk regresi nonparametrik digambarkan sebagai berikut: y f t 4 ε , i 1,2, … , n dengan:

y f t ε

= variabel respon ke-i = fungsi nonparametrik = error ~ IIDN (0,σ2)

2.3 Regresi Semiparametrik Model semiparametrik dikembangkan oleh Green, Jennison dan Scheult (1985); Engel, Granger, Rice, Weiss (1986); Heckman (1986); Eubank (1988); Wahba (1990); Chen dan Shiau (1994); Shi dan Li (1994); He dan Shi (1996); Ruppert, Wand, dan Caroll (2003). Model ini dirumuskan sebagai: yi =x'i γ+f ti +εi ,

i=1,2

(5)

dengan x'i = xi1 ,…,xip dan ti, i = 1,2,…,n merupakan variabel-variabel prediktor. Vektor γ=(γ1 ,…,γp )' Rp tidak diketahui dan f diasumsikan merupakan anggota ruang sobolev 2

1

(k) (m) Wm t ] dt< ∞}. Residual εi berdistribusi 2 0,1 = { f|f ,k=0,1,…,m-1) kontinu pada [0,1] dan 0 [f 2 independen dengan mean nol dan variansi σ . Estimator f diperoleh dari meminimumkan Penalized Least Squared (PLS):

Iλ f

R f

λJ f ,f

Wm 2 0,1

6

Fungsional Iλ f memuat tiga komponen, yaitu komponen likelihood R(f), fungsional penalti J(f) dan parameter penghalus λ. Estimator tipe PLS ini dikembangkan oleh Heckman (1986), Eubank (1988), Wahba (1990), dan Chen dan Shiau (1994) untuk estimator spline parsial original, dengan mengambil kesamaan-kesamaan: R f

n

y

xγ

f t

7

2

1 2

[f(m) t ] dt

J f =

8

0

Bentuk estimator γλ dan fλ diperoleh dengan meminimumkan PLS: 1

Iλ f

′

y

n

xγ

f t

2

[f(m) t ] dt

λ

9

0

2.4 Spline dalam Regresi Nonparametrik Ada berbagai macam pendekatan yang digunakan untuk mendapatkan estimator f, tergantung pada kriteria yang diinginkan dimiliki estimator tersebut. Jika ingin didapatkan estimator f yang smooth, dalam arti estimator itu kontinu dan diferensiabel, digunakan pendekatan Penalized Least Square (PLS), yaitu kriteria estimasi dengan memperhatikan kesesuaian terhadap data (goodness of fit) dan kemulusan kurva. Secara umum, fungsi spline berorde k-1 adalah sebarang fungsi yang dapat disajikan dalam bentuk: S t

αt

dengan t

ξ

δ t

=

t

10

ξ

ξ

0

,t

ξ

,t

ξ

α dan δ adalah konstanta real dan ξ1, ξ2, …, ξh adalah titik knots. 2.5 Pemilihan λ Optimal Parameter λ merupakan kemulusan kurva, dan pengontrol keseimbangan antara kesesuaian kurva terhadap data. Penentuan λ yang optimal sangat diperlukan agar mendapat estimator yang optimal. Salah satu metode pemilihan λ optimal adalah Generalized Cross Validation (GCV). Metode ini dikembangkan oleh Craven dan Wahba (1979), Wahba (1985), Li (1986), Kohn (1991), Shao (1993), Venter dan Snyman (1995). Kriteria GCV didefinisikan sebagai: GCV λ

MSE λ n tr I A λ

11

dimana MSE(λ) didefinisikan sebagai: MSE λ

n

y

f

12

dan matrik A(λ) dapat dicari dengan persamaan 2.3 dengan elemen matrik X sebagai berikut: k k 1 T11 …T11 T11 ‐ξ1 k … T11 ‐ξn k X11 …X11 k k 1 T21 …T21 T21 ‐ξ1 k … T21 ‐ξn k X21 …X21 .. .. .. .. X . 1

. k Tn1 …Tn1

Tn1 ‐ξ1

k

. … Tn1 ‐ξn

k

. k Xn1 …Xn1

3

2.6 Bentuk dan Sifat Estimator Spline Parsial Diberikan data (ti, xi, yi) dan hubungan antara ti, xi dan yi diasumsikan mengikuti model semiparametrik: (13 yi =x'i γ+f ti +εi , ti 0,1 dengan x'i x … x dan ti , i 1,2, … , n variabel-variabel prediktor. Vektor parameter ′ γ ,…, R tidak diketahui dan f anggota Wm 2 0,1 . Sesatan random εi berdistribusi normal dengan mean nol dan varians σ2. Bentuk estimator spline parsial diperoleh dengan meminimumkan PLS: 1

n

y

x′ γ

f t

2

[f(m) t ] dt

λ

14

0

dengan λ merupakan parameter penghalus. 2.7 Pemeriksaan Asumsi Residual Asumsi residual dalam analisis regresi meliputi identik, independen, dan berdistribusi normal (0,σ2).

a. Pemeriksaan Asumsi Identik Untuk pemeriksaan asumsi identik dilakukan dengan melihat Scatterplot atau diagram pencar antara residual dengan fits (nilai taksiran dari variabel respon). Bila residual dan fits saling independen atau plot yang dihasilkan acak dan tidak membentuk pola tertentu, hal ini menandakan bahwa varians dari residual adalah sama atau identik. b. Pemeriksaan Asumsi Independen Pemeriksaan asumsi independen untuk mengetahui apakah ada korelasi antar residual. Dapat dilakukan dengan melihat plot ACF dari residual. Bila dalam plot ACF terdapat lag yang keluar, menandakan adanya korelasi antar residual. c. Pemeriksaan Asumsi Distribusi Normal Pengujian asumsi residual normal (0,σ2) dapat dilakukan melalui uji Kolmogorov Smirnov. Hipotesis yang digunakan adalah: H0:F0(x)=F(x) (Residual berdistribusi normal (0,σ2)) H1:F0(x)≠F(x) (Residual tidak berdistribusi normal (0,σ2)) Statistik Uji: | 17 Pengambilan keputusan adalah tolak H0 ditolak jika |D|>q(1-α) dimana q adalah nilai berdasarkan tabel Kolmogorov Smirnov, dapat juga melalui P-value, dimana H0 ditolak jika nilai P-value< α 2.8 Pengujian Parameter Model Pengujian parameter dalam model regresi bertujuan untuk mengetahui apakah paraeter tersebut telah menunjukkan hubungan yang nyata antara variabel prediktor dan variabel respon. Selain itu juga untuk mengetahui kelayakan parameter dalam meerangkan model. Terdapat dua tahap pengujian yaitu uji serentak (simultan) dan uji parsial (individu). a. Uji serentak atau simultan (Draper and Smith, 1981; Kutner et al., 2004) 1. Hipotesis pengujian H 0 : γi = 0 H1 : paling sedikit ada satu γ i ≠ 0 , i= 0,1,…,p dengan p adalah banyaknya variabel prediktor 2. Statistik uji MSRegresi F 18 MSError ∑ni

Yi ‐Y 2 dan p‐1 ∑ni 1 Yi ‐Yi 2 MSError n‐p MSRegresi

1

4

3. Daerah penolakan Tolak H0 jika F > Fα;(v1=p-1, v2=n-p) atau P-value < α. b. Uji individu atau parsial (Draper and Smith, 1981; Kutner et al., 2004) 1. Hipotesis Pengujian H 0 : γi = 0 H1 : γi ≠ 0 , i = 0,1,…,p dengan p adalah banyaknya variabel prediktor 2. Statistik uji γi 19 t stdev γi 3. Daerah penolakan Tolak H0 jika |t| > tα/2;df=n-p atau P-value < α

2.8 Tinjauan Non Statistik Limbah padat yang dihasilkan dalam proses pembuatan gula di pabrik gula Asembagus Situbondo secara ringkas dijelaskan bahwa terdapat enam stasiun dalam tahap pembuatan gula. Stasiun tersebut bila diurutkan dari awal proses adalah dimulai dari stasiun penggilingan, stasiun pemurnian, stasiun penguapan, stasiun masakan, stasiun putaran dan terakhir stasiun finishing. Akan tetapi, limbah padat sudah dapat dikeluarkan pada tahap pemurnian, sehingga kotoran-kotoran dari bahan dasar tebu tidak mengganggu proses selanjutnya sampai diperoleh hasil akhir berupa gula. Berikut adalah dua proses di stasiun penggilingan dan stasiun pemurnian hingga didapatkannya limbah padat. 1. Proses di stasiun penggilingan bertujuan untuk mengambil nira sebanyak-banyaknya dari tebu. Dengan memotong-motong batang tebu menjadi bagian-bagian yang kecil, lunak dan seragam dengan penurunan volume yang kecil, maka pemerasan dengan hasil ekstraksi yang maksimum dan efisien dapat dicapai. Penggilingan dilakukan dengan lima mesin gilingan dan proses dilanjutkan ke stasiun pemurnian. 2. Pada stasiun pemurnian, nira dari stasiun penggilingan dipanaskan (750C) untuk membunuh jasad renik. Pupuk TSP ditambahkan untuk membentuk inti endapan serta membantu dalam proses pengendapan. Selanjutnya nira dimasukkan ke defekator dan ditambahkan susu kapur agar terjadi penggumpalan. Setelah itu, dalam bejana sulfitir ditambahkan gas SO2 agar terbentuk endapan. Setelah dipanaskan, nira tersulfitir dipanaskan dan masuk wadah pengendapan untuk memisahkan bahan padat (kotor) dan cair sehingga didapatkan nira kotor dan nira cair. Untuk mempercepat proses pengendapan ini ditambahkan flokulan. Nira kotor kemudian disaring di vakum filter untuk dipisahkan bagian padat dan cair. Setelah disiram dengan air untuk menghilangkan nira yang tersisa, limbah padat (blotong) masuk ke tempat yang disediakan dan dilakukan penimbangan. Berdasarkan uraian proses terbentuknya limbah, maka variabel data yang digunakan dalam penelitian ini adalah berat limbah (kuintal), berat kapur tohor (kuintal), berat sulfur (kg), berat flokulan (kg), berat tebu (kuintal) dan berat fosfat (kg). 3. Metodologi Penelitian 3.1 Sumber Data dan Identifikasi Variabel Sumber data, alat dan identifikasi variabel dalam penelitian ini adalah sebagai berikut: 1. Jurnal dan referensi yang terkait dengan tujuan penelitian. 2. Data yang digunakan berasal dari penelitian Rudianto (1997). Data tersebut terdiri dari satu variabel respon, yaitu berat limbah /blotong (Y), dan lima variabel prediktor yaitu berat kapur tohor (X1), berat sulfur (X2), berat flokulan (X3), berat tebu (X4) dan berat fosfat (X5). Dengan pendekatan regresi parametrik didapatkan hasil pengaruh berat sulfur (X2) dan berat flokulan (X3) dalam model kecil dan dibuang dari model. Dengan menggunakan metode All Possible Regression didapatkan bahwa model regresi Y dengan X2 dan X3 memiliki nilai R2 yang kecil yaitu sebesar 50,9 , ini menunjukkan bahwa X2 dan X3 memberikan kontribusi yang kecil terhadap kemampuan model regresi untuk menerangkan keragaman yang ada. Berdasarkan hal 5

tersebut maka variabel berat sulfur dan berat flokulan akan di dekati dengan metode regresi semiparametrik, maka variabel respon dan variabel prediktor yang digunakan dalam penelitian ini: Y = berat limbah/blotong X1 = berat flokulan (kg) X2 = berat sulfur (kg) 3.2 Metode Analisis Langkah-langkah dalam menganalisis data adalah sebagai berikut : a. Deskripsi data untuk melihat pola perilaku hubungan dari data. b. Pemilihan parameter penghalus optimal dengan metode GCV. c. Memodelkan data limbah pabrik gula Asembagus Situbondo dengan pendekatan regresi semiparametrik. d. Pemilihan model spline optimal. e. Melakukan analisis diagnostik residual. f. Melakukan pengujian signifikansi koefisien regresi secara simultan dan individu. 4. Analisis dan Pembahasan 4.1 Deskripsi Data Dari Gambar 4.1 dan Gambar 4.2 dapat dilihat untuk variabel berat flokulan dapat dijelaskan bahwa model parametrik kurang tepat digunakan. Hal ini terlihat dari pola perilaku data dari satu interval ke interval yang lain. Perubahan pola perilaku data dari satu interval ke interval yang lain ini ditandai dengan titik knots. 800

Y

700

600

500

400 3

4

5

6 X1

7

8

9

Gambar 4.1 Plot Y(berat limbah) dan X1(berat flokulan)

6

respon

400

500

600

700

800

3

4

5

6

7

8

9

param

Gambar 4.2 Plot antara Y dengan X1 dan Spline Kubik

Untuk variabel berat sulfur dapat digunakan pendekatan model parametrik (linier), karena adanya kecenderungan hubungan antara berat limbah dengan berat sulfur tersebut mengikuti pola linier, seperti yang terlihat pada Gambar 4.3 dan Gambar 4.4.

800

Y

700

600

500

400 200

300

400

500

600

700

X2

Gambar 4.3 Plot Y(berat limbah) dan X2(berat sulfur)

800

Y

700

600

500

400 200

300

400

500

600

Sulfur

Gambar 4.4 Ploy Y dan X2 dan Regresi Linier 7

700

Bedasarkan plot antara berat limbah dan berat flokulan (Gambar 4.1 dan Gambar 4.2) terlihat indikasi titik knots yang menunjukkan adanya perubahan perilaku dari data yaitu disekitar titik 4 dan titik 5. Tabel 4.1 Nilai GCV dengan dua titik knots

Orde 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4

titik knots 4,8 4,9 5,0 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 4,8 4,9 5 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6,0

4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

GCV 5809,489 5809,489 5809,489 5813,185 5822,233 5834,733 5849,576 5865,959 5883,159 5900,389 5916,698 5527,947 5527,937* 5527,945 5528,222 5529,675 5532,683 5537,383 5543,906 5552,473 5563,434 5577,31 5594,846 5617,109

Keterangan : * = GCV Minimum

Berdasarkan Tabel 4.1, terlihat bahwa GCV minimum adalah 5527,937 terdapat pada titik knots 4 dan 4,9 pada variabel flokulan. Nilai GCV minimum menunjukkan estimasi model semiparametrik yang terbaik, sehingga dari kedua titik knots ini didapatkan model semiparametrik sebagai berikut: Y γ0 γ1 X

γ2 X

2

γ3 X

3

γ4 X ‐4

3

γ5 X ‐4,9

3

γ6 X

ε

Dengan program S-Plus diperoleh estimasi model sebagai berikut: Y

91213,64 406,2007 X

73633,27X 4,9

19497,03X

1703,562X

2092,643 X

4

0,5659328X

dengan Y adalah berat limbah pabrik gula, X1 adalah variabel berat flokulan, dan X2 adalah variabel berat sulfur. Nilai koefisien determinasi dalam model ini sebesar 63,99%. Ini menunjukkan bahwa variabel besar flokulan dan berat sulfur mampu menerangkan 63,99% keragaman berat limbah gula.

8

Variabel sulfur dan berat limbah pabrik gula mempunyai hubungan linier. Sedangkan hubungan antara berat limbah pabrik gula dan berat flokulan berupa piecewise polynomials yang dapat dituliskan dengan: 91213,64 73633,27X 19497,03X 1703,562X ,X 4 91213,64 73633,27X 2092,643 X 4

19497,03X

1703,562X ,4

91213,64 73633,27X 19497,03X 2092,643 X 4 406,2007 X 4,9

X

4,9

1703,562X ,X

4,9kg

Dari potongan polinomial ini terlihat bahwa berat limbah pabrik gula dipengaruhi oleh perubahan berat flokulan pada tiga interval yang berbeda dan kontinu, yaitu berat flokulan kurang dari 4 kg, berat flokulan antara 4 kg sampai 4,9 kg, dan berat flokulan lebih dari 4,9 kg. 4.2 Model Pembanding Berikutnya akan diselidiki kesesuaian antara berat limbah gula taksiran dengan berat limbah gula sebenarnya pada titik-titik knots yang berbeda pada orde tertentu sebagai pembanding. Dipilih titik knots 4 dan 5,8 pada orde ketiga (spline kuadratik). Titik knots yang dipilih memiliki nilai GCV sebesar 5916,698 (Tabel 4.1). Nilai GCV yang besar mengindikasikan model semiparametrik yang kurang sesuai untuk menjelaskan data berat limbah gula. Model regresi semiparametrik dengan titiktitik knots ini menghasilkan nilai koefisien determinasi yang relatif kecil yaitu 55,91%. Model regresi semiparametrik yang terbaik adalah model dengan orde 4 (spline kubik) dan titik knots 4 dan 4,9. 4.3 Analisis Diagnostik Residual Berdasarkan analisis residual (Gambar 4.5) diperoleh bahwa spline kubik dengan dua titik knots 4 dan 4,9 residualnya tidak ada penyimpangan terhadap distribusi normal. Nilai P-value yang lebih dari 0,10 yaitu > 0,150 menyatakan bahwa residual berdistribusi normal. Dari Gambar 4.6 dapat dilihat bahwa residual dan fits(taksiran dari limbah pabrik gula) adalah saling bebas karena plot yang dihasilkan tidak membentuk suatu pola atau acak, hal ini menandakan sifat residual yang identik. Sedangkan pada Gambar 4.7 dapat dilihat bahwa tidak terjadi korelasi antar residual, ditandai dengan tidak adanya lag yang keluar dari garis batas, hal ini menggambarkan sifat residual yang independen. Probability Plot of residual Normal 99

Mean StDev N KS P-Value

95 90

Percent

80 70 60 50 40 30 20 10 5

1

-150

-100

-50

0 residual

50

100

150

Gambar 4.5 Plot Uji Kenormalan Residual

9

-0.0001273 57.98 30 0.079 >0.150

Scatterplot of residual vs fits 100

residual

50

0

-50

-100

-150 500

550

600

650 fits

700

750

800

850

Gambar 4.6 Scatterplot Residual dan Fits

1.0 0.8

Autocorrelation

0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1

2

3

4

5

6

7

8

Lag

Gambar 4.7 Plot ACF Residual

4.4 Uji Signifikansi Koefisien Regresi dalam Model Semiparametrik Berdasarkan hasil analisis diagnostik residual semua asumsi untuk residual yaitu varian konstan, residual dan fits(nilai taksiran limbah pabrik gula) saling bebas, dan residualnya tidak ada penyimpangan dari distribusi normal, sehingga dapat dilanjutkan untuk uji hipotesis koefisien regresi. Pertama dilakukan uji serentak dengan hipotesis: H0 : γi = 0 H1 : paling sedikit ada satu γ i ≠ 0 , i= 0,1,…,6 Tabel 4.2 Analisis Variansi Model Semiparametrik dengan titik knots 4 dan 4,9 (orde 4)

SK

db

JK

KT

Fhit

Ftabel

Regresi

6

173292

28882

6,814861

2,047227

Galat

23

97476,08

4238,09

Total

29

270768,8

Berdasarkan analisis variansi model semiparametrik (Tabel 4.2) dengan α = 0.10 diperoleh kesimpulan bahwa paling sedikit ada satu koefisien regresi yang tidak bernilai nol, sehingga model signifikan.

10

Selanjutnya dilakukan uji individu terhadap koefisien-koefisien regresi, terutama koefisien-koefisien fungsi truncated dengan hipotesis sebagai berikut: H0 : γi = 0 H1 : γi ≠ 0

, i = 0,1,…,6

Tabel 4.3 memperlihatkan bahwa dengan nilai α = 0,10 diperoleh kesimpulan estimator spline kubik dengan titik knots 4 dan 4,9 signifikan dalam model sehingga estimator spline kubik pada model semiparametrik cukup memadai untuk data limbah pabrik gula tersebut. Tabel 4.3 Inferensi Model Semiparametrik dengan titik knots 4 dan 4.9 (orde 4)

Koefisien

Estimasi

StDev

t-hitung

γ0

-91213,64

42188,6

-2,16205

γ1

73633,27

34152,12

2,156038

γ2

-19497,03

9089,539

-2,145

γ3

1703,562

797,1022

2,137194

γ4

-2092,64

991,9244

-2,10968

γ5

406,2007

204,9328

1,982116

γ6 0,565933 Nilai tabel t : 1,713872

0,15173

3,729873

Model regresi semiparametrik ini memiliki nilai koefisien determinasi yang lebih baik dari penelitian Rudianto (1997), yaitu sebesar 63,99%. 5.

Kesimpulan Berdasarkan analisis yang dilakukan dapat diambil kesimpulan bahwa data berat limbah pabrik gula Asembagus Situbondo dapat dimodelkan dengan model semiparametrik sebagai berikut: Y

91213,64 406,2007 X

73633,27X 4.9

19497,03X

1703,562X

2092,643 X

4

0,5659328X

Variabel sulfur dan berat limbah pabrik gula mempunyai hubungan linier. Sedangkan hubungan antara berat limbah pabrik gula dan berat flokulan berupa piecewise polynomials yang dapat dituliskan dengan: 91213,64

73633,27X

19497,03X

1703,562X

91213,64 73633,27X 2092,643 X 4

19497,03X

1703,562X ,4

19497,03X 91213,64 73633,27X 2092,643 X 4 406,2007 X 4,9

4

X

4,9

1703,562X ,X

11

,X

4,9kg

Daftar Pustaka Chen, H. dan Shiau, J.J.H.(1994). Data Driven Efficient Estimators for a Partially Linear Model. The Annals of Statistics, 22, 211-237 Craven an Wahba, G.(1979). Smoothing Noisy Data With Spline Function: Estimating The Correct Degree of Smoothing by The Method of Generalized Cross Validation, Numer. Math, 31, 377-403.

Draper, N.R., and Smith, H. (1981). Applied Regression Analysis. Second Edition, John Wiley & Sons, Inc. Engle, R.L., Granger, C., Rice, J., dan Weiss, A.(1986). Semiparametric Estimates of Relation Between Weather and Electricity Sales, Journal of The American Statistical Association, 81, 310-320. Eubank, R. (1988). Spline Smoothing and Nonparametric Regression. Marcel dekker, New York. Green, P., Jennison, C., Scheult, A.(1985). Analysis of field Experiments by Least Squared Smoothing, Journal of The Royal Statistics Society, Ser. B, 47, 299-314. He, X. dan Shi, P.(1996). Bivariate Tensor Product B-Spline in Partly Linear Models, Journal of Multivariate Analysis, 58, 162-181. Heckman, N.(1986). Spline Smoothing in a Partly Linear Models, Journal of Royal Statistics Society, Ser. B, 48, 244-248. Kohn, R.(1991). The Performance of Cross Validation and Maximum Likelihood Estimators of Spline Smoothing Parameters. Journal of American Statistics Association, 86, 1042-1050.

Kutner, M.H., Nachtsheim, C.J., and Neter, J. 2004. Applied Linear Regression Models, McGraw Hill International, New York. Li, K.C.(1986). Asymtotic Optimality of C1 and Generalized Cross Validation in Ridge Regression With Application to Spline Smoothing, Ann.Statist., 14, 1101-1112. Pratiwi (2008). Pemodelan Pertumbuhan Balita Menggunakan Regresi Spline Sebagai Pendekatan Pola Kurva Kartu Menuju Sehat (KMS), Tugas Akhir ITS Surabaya. Rudianto, N. (1997). Implementasi Gibbs Sampler dan Bayesian Inference dalam Pemilihan Model Terbaik Limbah Pabrik Gula Asembagus Situbondo, Tugas Akhir, ITS, Surabaya. Rupert, D, Wand, M.P, and Caroll, R.J. (2003). Semiparametric Regression, New York: Cambridge University. Shao, J.(1993). Linear Model Selection by Cross Validation. Journal of The American Statistical Assosiation, 88, 486-494. Shi, P., dan Li, G. (1994). On The Rate Convergence of :Minimum L1-Norm” Estimates in a partly Linear Model, Communication in Statistics, Theory and Methoda, 23, 175-196. Venter, J.H., dan Snyman, J.L.J.(1995). A note on the Generalized Cross Validation Criterior in Linear Model Selection, Biometrica, 82, 215-219. Wahba, G.(1985). A Comparison of GCV and GML for Choosing the Smoothing Parameter in the Generalized Spline Smoothing Problem, Journal The Annals of Statistics, 13, 1378-1402. Wahba, G. (1990). Spline Models for Observation Data, SIAM, Pensylvania.

12

PENDEKATAN REGRESI SEMIPARAMETRIK UNTUK PROSES PEMBENTUKAN LIMBAH PABRIK GULA ASEMBAGUS SITUBONDO

Recommend Documents