HASIL DAN PEMBAHASAN. Model Regresi Logistik Biner untuk data Hasil Pembangkitan

HASIL DAN PEMBAHASAN

Model Regresi Logistik Biner untuk data Hasil Pembangkitan Model regresi logistik digunakan untuk menggambarkan hubungan antara peubah respon dan peubah penjelas pada data hasil pembangkitan. Model regresi logistik biner yang dibangun ada dua macam, yaitu model regresi logistik Y terhadap dua peubah (X 1 dan X 2 ) dan model regresi logistik Y terhadap tiga peubah (X 1 , X 2 , dan X 3 ). Kedua model ini digunakan sebagai model pembanding bagi model-model yang terbentuk dari data hasil pengambilan contoh. Proses pembangkitan data diawali dengan menentukan model regresi yang akan dibangkitkan. Model tersebut adalah sebagai berikut:

Data hasil pembangkitan dianggap sebagai kerangka contoh.

Model Y terhadap X 1 dan X 2 Model untuk peubah respon, X 1 dan X 2 yang terbentuk adalah sebagai berikut:

dengan Nilai parameter dari model peubah Y terhadap peubah X 1 dan X 2 untuk masingmasing kerangka contoh dapat dilihat di tabel 2. Model dari data hasil pembangkitan pertama menunjukkan semua parameter dalam model tersebut signifikan pada α = 5%. Hal ini berarti bahwa semua peubah penjelas memberikan pengaruh yang nyata terhadap peubah respon. Setiap parameter dari peubah X 2 yang bernilai 1 memiliki tanda negatif. Hal ini menunjukkan bahwa peubah X 2 apabila bernilai 1 maka memiliki kecenderungan untuk

menghasilkan

respon

kasus

yang

lebih

kecil

daripada

peubah

pembandingnya. Sedangkan peubah lainnya memberikan kecenderungan untuk menghasilkan respon kasus yang lebih besar daripada peubah pembandingnya.

Tabel 2 Nilai parameter model Y terhadap X 1 dan X 2 untuk N=300 Kerangka GB GB GB Contoh 1 -1.4635 0.2072 0.6460 0.2062 0.8870 0.1949 2 -1.9009 0.3076 1.2736 0.3081 0.6911 0.2021 3 -1.4903 0.2165 0.7410 0.2163 0.6342 0.1947 4 -1.9505 0.3078 1.0435 0.3077 0.7227 0.2159 5 -2.0145 0.3678 1.3830 0.3682 0.6586 0.2091 6 -1.2473 0.1921 0.5251 0.1923 0.7721 0.2005 7 -1.4282 0.2271 0.9258 0.2292 0.4699 0.1991 8 -1.6445 0.2694 1.0149 0.2687 0.4589 0.2009 9 -1.4519 0.2290 0.7598 0.2269 0.4948 0.2022 10 -1.8188 0.3073 1.1658 0.3082 0.6379 0.2387

GB -0.9334 -0.8760 -0.7128 -0.8475 -0.6747 -0.7764 -0.7175 -0.5733 -0.5426 -0.7992

GB = Galat Baku (standard error)

Model Y terhadap X 1 , X 2 , dan X 3 Model regresi logistik biner Y terhadap X 1 , X 2 , dan X 3 yang diperoleh adalah sebagai berikut:

dengan . Nilai parameter dari model peubah Y terhadap peubah X 1 , X 2 dan X 3 untuk masing-masing kerangka contoh dapat dilihat di Tabel 3. Semua nilai parameter dalam

di kesepuluh model tersebut signifikan pada

taraf α = 5%. Model dari data hasil pembangkitan pertama menunjukkan semua parameter dalam model tersebut signifikan pada α = 5%. Hal ini berarti bahwa semua peubah penjelas memberikan pengaruh yang nyata terhadap peubah respon. Setiap parameter dari peubah X 2 dan X 3 yang bernilai 1 memiliki tanda negatif. Hal ini menunjukkan bahwa apabila nilai dari peubah X 2 dan X 3 adalah 1, maka peubah X 2 dan X 3 memiliki kecenderungan untuk menghasilkan respon kasus yang lebih kecil daripada peubah pembandingnya. Sedangkan peubah lainnya memberikan kecenderungan untuk menghasilkan respon kasus yang lebih besar daripada peubah pembandingnya. Nilai parameter model regresi logistik biner untuk Y terhadap X 1 dan X 2 dari data hasil pembangkitan secara keseluruhan dapat dilihat di Lampiran 3. Nilai

0.2119 0.2016 0.1956 0.2137 0.1946 0.1908 0.1860 0.1884 0.1857 0.1995

parameter model regresi logistik biner untuk Y terhadap X 1 , X 2 , dan X 3 dari data hasil pembangkitan secara keseluruhan dapat dilihat di Lampiran 4. Apabila nilai parameter dari model Y terhadap X 1 , X 2 , dan X 3 dibandingkan dengan parameter model yang dibangkitkan, terlihat bahwa nilainilai parameter dari model Y terhadap X 1 , X 2 , dan X 3 berada di sekitar parameter model yang dibangkitkan. Misalkan dilakukan perbandingan nilai

. Nilai

dari parameter model yang dibangkitkan adalah 1, sedangkan nilai

dari

model Y terhadap X 1 , X 2 , dan X 3 berada dalam rentang 0.5618 sampai 1.5154. Nilai rata-rata dari parameter-parameter ini sebesar 1.0605 dengan ragam sebesar 0.0897. Tabel 3 Nilai parameter model Y terhadap X 1 , X 2 dan X 3 Kerangka contoh 1 Parameter -1.5297 0.8013 1.0778 -1.1948 GB 0.3021 0.2331 0.2388 0.2409 2 Parameter -1.8214 1.5154 0.9441 -1.1691 GB 0.3654 0.3335 0.2485 0.2427 3 Parameter -1.8437 1.0006 1.1479 -0.7900 GB 0.2883 0.2579 0.2675 0.2361 4 Parameter -1.8821 1.1717 0.8415 -0.9654 GB 0.3404 0.3203 0.2445 0.2343 5 Parameter -2.1577 1.5825 0.8243 -0.9001 GB 0.4060 0.3828 0.2567 0.2320 6 Parameter -1.2831 0.5618 0.9462 -0.8024 GB 0.2354 0.2094 0.2349 0.2108 7 Parameter -1.6128 1.0139 0.5053 -0.8573 GB 0.2824 0.2436 0.2309 0.2123 8 Parameter -1.5451 1.1800 0.8593 -0.8564 GB 0.3083 0.2818 0.2564 0.2259 9 Parameter -1.3830 0.8163 0.7934 -0.7343 GB 0.2656 0.2445 0.2475 0.2158 10 Parameter -1.5634 0.9611 0.8038 -0.8096 GB 0.2655 0.2498 0.2458 0.2148

untuk N=300

1.1054 0.3295 1.1557 0.3477 1.6660 0.2969 0.8639 0.2992 1.1429 0.3055 1.0170 0.2649 0.8584 0.2868 1.2157 0.2856 1.1668 0.2762 0.8107 0.2802

-2.2634 0.3919 -1.7595 0.3318 -1.7595 0.3227 -1.4424 0.3052 -1.7614 0.3314 -1.8485 0.3453 -1.5921 0.3313 -1.7827 0.3201 -1.6208 0.2978 -1.8169 0.3304

GB = Galat Baku (standard error)

Model Regresi Logistik Biner dengan Penambahan Konstanta

0.7132 0.2890 0.6406 0.2944 0.9785 0.2886 0.5752 0.2767 0.9520 0.2809 0.5312 0.2543 1.0884 0.2715 0.5578 0.2809 0.6511 0.2715 0.6102 0.2471

Pada sub-bab ini akan dilakukan pembahasan tentang model regresi logistik dengan penambahan konstanta sebagai akibat penggunaan teknik

X1=0 N00=160

X1=0 n00=112

Y=0 N=222

X1=1 N01=62

X1=1 n01=43

Sampling Frame N= 300

X1=0 N10=59

X1=0 n10=42

Y=1 N=78

X1=0 N11=9

X1=0 n11=6

X2=0 N000=22

X2=0 N000=15

X2=1 N001=62

X2=1 N001=43

X2=2 N002=28

X2=2 N002=20

X2=0 N010=15

X2=0 N010=11

X2=1 N011=21

X2=1 N011=15

X2=2 N012=7

X2=2 N012=5

X2=0 N100=16

X2=0 N100=11

X2=1 N101=14

X2=1 N101=10

X2=2 N102=12

X2=2 N102=8

X2=0 N110=4

X2=0 N110=4

X2=1 N111=1

X2=1 N111=1

X2=2 N112=1

X2=2 N112=1

Gambar 1 Skema proses pengambilan contoh pengambilan contoh dengan tiga tahap. Sebagai contoh pada kerangka contoh pertama untuk jumlah data sebesar 300 data dengan jumlah contoh yang diambil pada setiap proses pengambilan contoh sebesar 70% dari jumlah data yang ada. Gambar 1 merupakan skema pengambilan contoh pada salah satu kasus simulasi. Kasus simulasi yang digunakan adalah data pada kerangka contoh pertama dengan jumlah contoh yang diambil adalah sebesar 70% pada setiap pengambilan contoh pada ulangan pertama. Model regresi logistik dengan konstanta berdasarkan skema pengambilan contoh (Gambar 1) sebagai berikut: Model 1 (Y terhadap X 1 dan X 2 )

dengan i = 0,1 Nilai untuk masing-masing α i adalah α 0 = -0.03198 dan α 1 = -0.03953. Model 2 (Y terhadap X 1 , X 2 dan X 2 )

dengan

i = 0,1 j = 0, 1, 2 Nilai untuk masing-masing α i dan α ij adalah sebagai berikut: = 0.0168

= -0.0395

= 0.0083

= 0.0295

= -0.06899

= 0.3102

= 0.3365

= 0.3365

Model peubah Y terhadap peubah X 1 dan X 2 dari kerangka contoh pertama sebagai berikut:

Nilai α i merupakan konstanta untuk mengkoreksi nilai β 0 dan β 1(0) . Berdasarkan skema pengambilan contoh

yang

digunakan,

pembagian kelompok

(i)

menggunakan nilai peubah X 1 . Misalkan pada saat X 1 = 0, maka nilai untuk model dari data hasil pembangkitan adalah -0.8175. Sedangkan nilai

untuk model 1 adalah -0.82478. Apabila dengan

menggunakan model 1 namun tanpa memasukkan nilai

, maka nilai

yang diperoleh sebesar -0.7928. Dari contoh diatas dapat dilihat bahwa dengan menggunakan nilai

lebih mendekati nilai

data hasil pembangkitan. Nilai parameter nilai parameter

dan

, maka

dari model untuk dan

dari model 1 mendekati

dari model model untuk data hasil pembangkitan.

Hal ini menunjukkan bahwa penambahan α mampu mengkoreksi model regresi logistik yang biasa. Selanjutnya dibandingkan tanda dari parameter model 1 dengan tanda dari parameter model data hasil pembangkitan. Dari kedua model tersebut, tanda yang dimiliki oleh parameternya sama. Misalkan untuk tanda dari

dan

model data hasil pembangkitan adalah positif dan negatif. Tanda dari

untuk dan

dari model 1 juga positif dan negatif. Apabila dilakukan uji Wald pada setiap parameter di model yang terbentuk dari data hasil pembangkitan, maka semua parameternya signifikan pada tingkat α = 5%, yang berarti bahwa semua peubah penjelas memberikan pengaruh yang nyata terhadap peubah respon. Setiap parameter dari model 1 dilakukan uji Wald, maka diperoleh bahwa semua parameter signifikan pada tingkat α = 5%, sehingga dapat disimpulkan bahwa dengan menggunakan model 1 semua peubah bebas memberikan pengaruh yang nyata terhadap peubah respon. Kesimpulan yang dihasilkan oleh model 1 sama dengan kesimpulan yang dihasilkan oleh model dari data hasil pembangkitan. Hal ini menunjukkan bahwa model 1 mampu menggambarkan pola hubungan antara peubah respon dan peubah penjelas dengan baik. Model Y terhadap X 1 , X 2 , dan X 3 dari sampling frame pertama adalah sebagai berikut:

dengan

Nilai

merupakan konstanta untuk mengkoreksi nilai

berfungsi untuk mengkoreksi nilai

,

,

dan dan

, sedangkan . Hal ini terjadi

sebagai akibat dari penggunaan teknik pengambilan contoh dengan tiga tahap. Misalkan pada saat nilai x1 = 0 dan x 2 = 0, maka nilai untuk model untuk data hasil pembangkitan adalah 0.3494.

Nilai

adalah

0.3276. Apabila dengan menggunakan model 2, namun tanpa memasukkan nilai , maka nilai

sebesar

0.3024. Terlihat bahwa dengan menggunakan penambahan konstanta nilai estimasi

dari model 2 lebih

mendekati nilai hasil pembangkitan. Selain itu nilai

dari model untuk data juga menunjukkan pengaruh interaksi

antara i dan j. Berdasarkan skema pengambilan contoh yang digunakan, i terbentuk berdasarkan nilai X 1 sedangkan j terbentuk berdasarkan nilai X 2 . Sehingga dapat dikatakan bahwa nilai-nilai

menggambarkan pengaruh

interaksi antara peubah X 1 dan X 2 . Perbandingan tanda dari nilai estimasi parameter model 2 dengan model dari data hasil pembangkitan, maka diperoleh bahwa tanda dari parameter di kedua model sama. Tanda pada parameter

dari model untuk

data hasil pembangkitan dan model 2 adalah positif, negatif, dan positif. Kemudian dilakukan uji Wald untuk masing-masing parameter dari model 2. Hasil uji Wald menunjukkan bahwa semua parameter dari model 2 signifikan pada tingkat α = 5%, yang berarti bahwa pengaruh yang diberikan oleh peubah penjelas terhadap varibel respon nyata pada α = 5%. Jadi, dapat disimpulkan bahwa model 2 mampu menggambarkan pola hubungan antara peubah penjelas dengan peubah respon dengan baik.

Pengujian Parameter Pada setiap model yang terbentuk dari proses simulasi pengambilan contoh dilakukan uji Wald untuk mengetahui parameter model signifikan atau tidak. Hipotesis yang digunakan yaitu H 0 :

lawan H 1 :

, i=1, 2, ..., p

Kemudian dihitung jumlah parameter yang memberikan hasil uji Wald yang berbeda dengan hasil uji Wald bagi parameter model dari data hasil pembangkitan. Setelah jumlah diketahui maka dihitung persentase jumlah parameter yang memberikan kesimpulan yang berbeda dengan model untuk data hasil pembangkitan. Selama proses simulasi dilakukan pengulangan, maka diperoleh nilai rata-rata persentase jumlah parameter yang memberikan kesimpulan yang berbeda denganmodel untuk data hasil pembangkitan. Tabel 2 menunjukkan nilai rata-rata persentase jumlah parameter yang memberikan kesimpulan yang berbeda dengan parameter dari model populasi pada taraf α = 5%. Model yang digunakan adalah model variabel Y terhadap peubah X 1 , X 2 , dan X 3 , karena pada saat dilakukan survei dengan beberapa tahap pengambilan contoh model yang digunakan hanyalah model Y terhadap seluruh peubah penjelas yang diamati (X 1 , X 2 , dan X 3 ). Tabel 4 Nilai rata-rata persentase jumlah parameter yang memberikan kesimpulan yang berbeda dari model data hasil pembangkitan untuk N=300 Kerangka Jml contoh yang diambil di setiap pengambilan contoh contoh 70% 75% 80% 85% 90% 95% 1 23.33 15.00 16.67 5.00 5.00 1.67 2 18.33 01.67 6.67 0.00 0.00 0.00 3 26.67 15.00 18.33 13.33 8.33 10.00 4 26.67 15.00 18.33 13.33 8.33 10.00 6 23.33 20.00 15.00 15.00 11.67 13.33 7 25.00 21.67 23.33 15.00 6.67 5.00 8 22.75 18.86 13.47 12.34 13.03 9.90 9 35.00 13.33 13.33 1.67 3.33 3.33 10 20.00 18.33 18.33 13.33 5.00 0.00 Rata-rata 24.56 15.43 15.94 9.89 6.82 5.92

Saat terjadi pengurangan jumlah contoh sebesar 30 % di masing-masing tahap pengambilan contoh, maka persentase rata-rata jumlah parameter yang berbeda dengan parameter model populasi sebesar 24.56 % (Tabel 4). Hal ini berarti bahwa pada saat diambil contoh sebesar 49% dari jumlah keseluruhan populasi, maka terdapat 24.56% parameter yang tidak menggambarkan hubungan antar peubah yang sebenarnya. Apabila terjadi pengurangan jumlah contoh sebesar 20% dan 25% di masing-masing tahap pengambilan contoh, maka ratarata persentase jumlah parameter yang tidak menggambarkan hubungan peubah respon dengan peubah penjelas berkisar 15%. Nilai rata-rata persentase jumlah parameter yang tidak mennggambarkan hubungan yang sebenarnya akan menurun seiring dengan bertambahnya jumlah contoh yang digunakan. Tanda positif atau negatif dari parameter memiliki peranan yang penting dalam menggambarkan pola hubungan antara peubah respon dan peubah penjelas. Tanda positif pada parameter menunjukkan kecenderungan yang lebih besar daripada peubah pembandingnya. Tanda negatif menunjukkan kecenderungan yang lebih kecil dari peubah pembandingnya. Hampir semua model yang dibangun dari data hasil pengambilan contoh memberikan tanda positif atau negatif yang sama dengan model dari data hasil pembangkitan. Tanda positif dan negatif dari 600 model yang terbentuk, hanya 13 parameter dalam 13 model yang berbeda dari model pembanding.

Tabel 5 Rata-rata persentase informasi hilang pada tahap kedua pengambilan contoh untuk N=300 Kerangka Jml contoh yang diambil di setiap pengambilan contoh contoh 70% 75% 80% 85% 90% 95% 1 8.43 5.15 5.38 15.48 12.80 23.61 2 29.60 25.38 19.15 17.48 9.30 6.55 3 28.25 21.48 37.38 30.58 23.61 31.32 4 32.21 28.31 21.98 17.01 14.85 11.93 6 42.31 6.31 4.32 5.48 3.03 4.38 7 19.43 14.11 14.44 17.90 19.50 13.44 8 16.86 15.81 13.67 13.64 15.33 18.94 9 17.14 15.50 16.39 15.66 19.23 14.42 10 17.73 10.08 12.58 14.89 18.25 11.41 Rata-rata 23.55 15.79 16.14 16.46 15.10 15.11

Informasi yang Hilang Model yang baik merupakan model yang mampu menggambarkan keadaan populasi yang sebenarnya. Informasi akan hilang dalam setiap pengurangan jumlah data. Pengurangan jumlah data pertama kali terjadi pada tahap kedua proses pengambilan contoh. Besar rata-rata persentase informasi yang hilang dapat dilihat pada Tabel 5. Pengurangan contoh sebesar 30% mengakibatkan kehilangan informasi ratarata sebesar 23.55% (Tabel 5). Pengurangan jumlah contoh sebesar 5% sampai 25% maka akan kehilangan informasi sebesar 15% sampai 16%. Gambar 2 menunjukkan rata-rata persentase informasi yang hilang pada tahap kedua proses pengambilan contoh untuk semua data yang dibangkitkan. Gambar 2 diperoleh dari data pada Lampiran 5.

Rata-rata informasi hilang (%)

25

20

15

1000 900

10

700 500 300

5

0 70

75

80

85

90

95

Persentase pengambilan contoh (%)

Gambar 2 Rata-rata informasi hilang pada tahap kedua proses pengambilan contoh

Penurunan jumlah informasi yang hilang terjadi seiring dengan bertambahnya jumlah contoh yang diambil (Gambar 2). Jumlah data hasil pembangkitan 500, 700, dan 1000 menghasilkan rata-rata persentase informasi yang hilang cenderung sama. Jumlah data hasil pembangkitan sebesar 900 mengakibatkan informasi yang hilang selalu lebih rendah dari jumlah yang lain. Hal ini mungkin terjadi apabila data hasil pembangkitan dengan jumlah 900 data lebih homogen dari data hasil pembangkitan yang lainnya. Rata-rata informasi yang hilang paling banyak ditunjukkan saat jumlah data hasil pembangkitan sebesar 300, karena jumlah contoh yang terambil lebih kecil dari yang lainnya. Pengurangan jumlah data yang kedua terjadi pada awal tahap ketiga proses pengambilan contoh. Besar rata-rata persentase informasi yang hilang dapat dilihat pada Tabel 6. Pengurangan jumlah contoh sebesar 30% di masing-masing tahap pengambilan contoh atau sebesar 51% dari jumlah total populasi, maka nilai ratarata informasi yang hilang sebesar 41%. Pengurangan jumlah data sebesar 43.75% dan 36% dari jumlah total populasi mengakibatkan informasi yang hilang sebesar 33% dan 32%. Persentase kehilangan informasi ini akan menurun seiring dengan bertambahnya jumlah contoh yang diamati. Tabel 6 Rata-rata persentase total informasi hilang untuk N=300 Kerangka Jml contoh yang diambil di setiap pengambilan contoh contoh 70% 75% 80% 85% 90% 95% 1 29.52 16.82 18.95 12.80 19.07 17.52 2 57.76 41.63 41.63 28.48 17.62 7.59 3 59.86 42.68 52.47 39.55 30.32 31.28 4 70.20 56.26 49.26 32.22 24.43 19.40 6 22.20 18.35 24.39 12.41 21.89 8.66 7 29.13 32.55 24.79 21.92 21.68 18.92 8 49.07 37.39 31.12 21.00 16.26 16.02 9 31.72 29.09 28.09 18.00 17.45 16.66 10 20.43 21.83 17.14 13.79 14.99 12.56 Rata-rata 41.10 32.95 31.98 22.24 20.41 16.51 Gambar 3 diperoleh dari data di Lampiran 6, dimana terjadi penurunan jumlah informasi yang hilang seiring dengan bertambahnya jumlah contoh yang diambil. Jumlah data yang semakin besar mengakibatkan contoh yang diamati

semakin banyak dan informasi yang hilang semakin kecil. Besar informasi yang hilang sebagai akibat dari pengurangan jumlah contoh yang diambil selalu lebih kecil daripada besar pengurangan contoh. Penghematan biaya akan menjadi


berarti apabila biaya untuk memperoleh contoh sangat mahal. 160 140 120 100

300

80

500

60

700

40

900

20

1000

0 70

75

80

85

90

95


Gambar 3 Rata-rata persentase total informasi hilang Besarnya informasi yang hilang pada tahap kedua dan ketiga sebanding dengan jumlah pengurangan contoh. Informasi yang hilang sebesar 23.55% apabila terjadi pengurangan contoh sebesar 30% pada tahap kedua. Total informasi yang hilang pada tahap ketiga sebesar 41.11% apabila terjadi pengurangan jumlah contoh sebesar 51%. Jumlah informasi yang hilang pada tahap ini sebesar 17.56%, apabila terjadi pengurangan jumlah contoh sebesar 30% di tahap tiga.


25,00 20,00 15,00 tahap 3

10,00

tahap 2 5,00 0,00 70

75

80

85

90

95


Gambar 4 Rata-rata persentase informasi hilang pada tahap kedua dan ketiga dengan N=300 Penurunan rata-rata informasi yang hilang seiring dengan bertambahnya jumlah contoh yang diambil pada tahap ketiga (Gambar 4). Rata-rata informasi yang hilang pada tahap ketiga proses pengambilan contoh hampir semua lebih kecil dari rata-rata informasi yang hilang di tahap kedua pengambilan contoh. Hal ini terjadi karena pada tahap ketiga, unit contoh yang ada lebih homogen dari unit contoh pada tahap kedua. Kehomogenan dari unit contoh terjadi sebagai akibat dari proses pengelompokan yang dilakukan pada akhir tahap kedua pengambilan contoh.

HASIL DAN PEMBAHASAN. Model Regresi Logistik Biner untuk data Hasil Pembangkitan

Recommend Documents