HASIL DAN PEMBAHASAN
Model Regresi Logistik Biner untuk data Hasil Pembangkitan Model regresi logistik digunakan untuk menggambarkan hubungan antara peubah respon dan peubah penjelas pada data hasil pembangkitan. Model regresi logistik biner yang dibangun ada dua macam, yaitu model regresi logistik Y terhadap dua peubah (X 1 dan X 2 ) dan model regresi logistik Y terhadap tiga peubah (X 1 , X 2 , dan X 3 ). Kedua model ini digunakan sebagai model pembanding bagi model-model yang terbentuk dari data hasil pengambilan contoh. Proses pembangkitan data diawali dengan menentukan model regresi yang akan dibangkitkan. Model tersebut adalah sebagai berikut:
Data hasil pembangkitan dianggap sebagai kerangka contoh.
Model Y terhadap X 1 dan X 2 Model untuk peubah respon, X 1 dan X 2 yang terbentuk adalah sebagai berikut:
dengan Nilai parameter dari model peubah Y terhadap peubah X 1 dan X 2 untuk masingmasing kerangka contoh dapat dilihat di tabel 2. Model dari data hasil pembangkitan pertama menunjukkan semua parameter dalam model tersebut signifikan pada α = 5%. Hal ini berarti bahwa semua peubah penjelas memberikan pengaruh yang nyata terhadap peubah respon. Setiap parameter dari peubah X 2 yang bernilai 1 memiliki tanda negatif. Hal ini menunjukkan bahwa peubah X 2 apabila bernilai 1 maka memiliki kecenderungan untuk
menghasilkan
respon
kasus
yang
lebih
kecil
daripada
peubah
pembandingnya. Sedangkan peubah lainnya memberikan kecenderungan untuk menghasilkan respon kasus yang lebih besar daripada peubah pembandingnya.
Tabel 2 Nilai parameter model Y terhadap X 1 dan X 2 untuk N=300 Kerangka GB GB GB Contoh 1 -1.4635 0.2072 0.6460 0.2062 0.8870 0.1949 2 -1.9009 0.3076 1.2736 0.3081 0.6911 0.2021 3 -1.4903 0.2165 0.7410 0.2163 0.6342 0.1947 4 -1.9505 0.3078 1.0435 0.3077 0.7227 0.2159 5 -2.0145 0.3678 1.3830 0.3682 0.6586 0.2091 6 -1.2473 0.1921 0.5251 0.1923 0.7721 0.2005 7 -1.4282 0.2271 0.9258 0.2292 0.4699 0.1991 8 -1.6445 0.2694 1.0149 0.2687 0.4589 0.2009 9 -1.4519 0.2290 0.7598 0.2269 0.4948 0.2022 10 -1.8188 0.3073 1.1658 0.3082 0.6379 0.2387
GB -0.9334 -0.8760 -0.7128 -0.8475 -0.6747 -0.7764 -0.7175 -0.5733 -0.5426 -0.7992
GB = Galat Baku (standard error)
Model Y terhadap X 1 , X 2 , dan X 3 Model regresi logistik biner Y terhadap X 1 , X 2 , dan X 3 yang diperoleh adalah sebagai berikut:
dengan . Nilai parameter dari model peubah Y terhadap peubah X 1 , X 2 dan X 3 untuk masing-masing kerangka contoh dapat dilihat di Tabel 3. Semua nilai parameter dalam
di kesepuluh model tersebut signifikan pada
taraf α = 5%. Model dari data hasil pembangkitan pertama menunjukkan semua parameter dalam model tersebut signifikan pada α = 5%. Hal ini berarti bahwa semua peubah penjelas memberikan pengaruh yang nyata terhadap peubah respon. Setiap parameter dari peubah X 2 dan X 3 yang bernilai 1 memiliki tanda negatif. Hal ini menunjukkan bahwa apabila nilai dari peubah X 2 dan X 3 adalah 1, maka peubah X 2 dan X 3 memiliki kecenderungan untuk menghasilkan respon kasus yang lebih kecil daripada peubah pembandingnya. Sedangkan peubah lainnya memberikan kecenderungan untuk menghasilkan respon kasus yang lebih besar daripada peubah pembandingnya. Nilai parameter model regresi logistik biner untuk Y terhadap X 1 dan X 2 dari data hasil pembangkitan secara keseluruhan dapat dilihat di Lampiran 3. Nilai
0.2119 0.2016 0.1956 0.2137 0.1946 0.1908 0.1860 0.1884 0.1857 0.1995
parameter model regresi logistik biner untuk Y terhadap X 1 , X 2 , dan X 3 dari data hasil pembangkitan secara keseluruhan dapat dilihat di Lampiran 4. Apabila nilai parameter dari model Y terhadap X 1 , X 2 , dan X 3 dibandingkan dengan parameter model yang dibangkitkan, terlihat bahwa nilainilai parameter dari model Y terhadap X 1 , X 2 , dan X 3 berada di sekitar parameter model yang dibangkitkan. Misalkan dilakukan perbandingan nilai
. Nilai
dari parameter model yang dibangkitkan adalah 1, sedangkan nilai
dari
model Y terhadap X 1 , X 2 , dan X 3 berada dalam rentang 0.5618 sampai 1.5154. Nilai rata-rata dari parameter-parameter ini sebesar 1.0605 dengan ragam sebesar 0.0897. Tabel 3 Nilai parameter model Y terhadap X 1 , X 2 dan X 3 Kerangka contoh 1 Parameter -1.5297 0.8013 1.0778 -1.1948 GB 0.3021 0.2331 0.2388 0.2409 2 Parameter -1.8214 1.5154 0.9441 -1.1691 GB 0.3654 0.3335 0.2485 0.2427 3 Parameter -1.8437 1.0006 1.1479 -0.7900 GB 0.2883 0.2579 0.2675 0.2361 4 Parameter -1.8821 1.1717 0.8415 -0.9654 GB 0.3404 0.3203 0.2445 0.2343 5 Parameter -2.1577 1.5825 0.8243 -0.9001 GB 0.4060 0.3828 0.2567 0.2320 6 Parameter -1.2831 0.5618 0.9462 -0.8024 GB 0.2354 0.2094 0.2349 0.2108 7 Parameter -1.6128 1.0139 0.5053 -0.8573 GB 0.2824 0.2436 0.2309 0.2123 8 Parameter -1.5451 1.1800 0.8593 -0.8564 GB 0.3083 0.2818 0.2564 0.2259 9 Parameter -1.3830 0.8163 0.7934 -0.7343 GB 0.2656 0.2445 0.2475 0.2158 10 Parameter -1.5634 0.9611 0.8038 -0.8096 GB 0.2655 0.2498 0.2458 0.2148
untuk N=300
1.1054 0.3295 1.1557 0.3477 1.6660 0.2969 0.8639 0.2992 1.1429 0.3055 1.0170 0.2649 0.8584 0.2868 1.2157 0.2856 1.1668 0.2762 0.8107 0.2802
-2.2634 0.3919 -1.7595 0.3318 -1.7595 0.3227 -1.4424 0.3052 -1.7614 0.3314 -1.8485 0.3453 -1.5921 0.3313 -1.7827 0.3201 -1.6208 0.2978 -1.8169 0.3304
GB = Galat Baku (standard error)
Model Regresi Logistik Biner dengan Penambahan Konstanta
0.7132 0.2890 0.6406 0.2944 0.9785 0.2886 0.5752 0.2767 0.9520 0.2809 0.5312 0.2543 1.0884 0.2715 0.5578 0.2809 0.6511 0.2715 0.6102 0.2471
Pada sub-bab ini akan dilakukan pembahasan tentang model regresi logistik dengan penambahan konstanta sebagai akibat penggunaan teknik
X1=0 N00=160
X1=0 n00=112
Y=0 N=222
X1=1 N01=62
X1=1 n01=43
Sampling Frame N= 300
X1=0 N10=59
X1=0 n10=42
Y=1 N=78
X1=0 N11=9
X1=0 n11=6
X2=0 N000=22
X2=0 N000=15
X2=1 N001=62
X2=1 N001=43
X2=2 N002=28
X2=2 N002=20
X2=0 N010=15
X2=0 N010=11
X2=1 N011=21
X2=1 N011=15
X2=2 N012=7
X2=2 N012=5
X2=0 N100=16
X2=0 N100=11
X2=1 N101=14
X2=1 N101=10
X2=2 N102=12
X2=2 N102=8
X2=0 N110=4
X2=0 N110=4
X2=1 N111=1
X2=1 N111=1
X2=2 N112=1
X2=2 N112=1
Gambar 1 Skema proses pengambilan contoh pengambilan contoh dengan tiga tahap. Sebagai contoh pada kerangka contoh pertama untuk jumlah data sebesar 300 data dengan jumlah contoh yang diambil pada setiap proses pengambilan contoh sebesar 70% dari jumlah data yang ada. Gambar 1 merupakan skema pengambilan contoh pada salah satu kasus simulasi. Kasus simulasi yang digunakan adalah data pada kerangka contoh pertama dengan jumlah contoh yang diambil adalah sebesar 70% pada setiap pengambilan contoh pada ulangan pertama. Model regresi logistik dengan konstanta berdasarkan skema pengambilan contoh (Gambar 1) sebagai berikut: Model 1 (Y terhadap X 1 dan X 2 )
dengan i = 0,1 Nilai untuk masing-masing α i adalah α 0 = -0.03198 dan α 1 = -0.03953. Model 2 (Y terhadap X 1 , X 2 dan X 2 )
dengan
i = 0,1 j = 0, 1, 2 Nilai untuk masing-masing α i dan α ij adalah sebagai berikut: = 0.0168
= -0.0395
= 0.0083
= 0.0295
= -0.06899
= 0.3102
= 0.3365
= 0.3365
Model peubah Y terhadap peubah X 1 dan X 2 dari kerangka contoh pertama sebagai berikut:
Nilai α i merupakan konstanta untuk mengkoreksi nilai β 0 dan β 1(0) . Berdasarkan skema pengambilan contoh
yang
digunakan,
pembagian kelompok
(i)
menggunakan nilai peubah X 1 . Misalkan pada saat X 1 = 0, maka nilai untuk model dari data hasil pembangkitan adalah -0.8175. Sedangkan nilai
untuk model 1 adalah -0.82478. Apabila dengan
menggunakan model 1 namun tanpa memasukkan nilai
, maka nilai
yang diperoleh sebesar -0.7928. Dari contoh diatas dapat dilihat bahwa dengan menggunakan nilai
lebih mendekati nilai
data hasil pembangkitan. Nilai parameter nilai parameter
dan
, maka
dari model untuk dan
dari model 1 mendekati
dari model model untuk data hasil pembangkitan.
Hal ini menunjukkan bahwa penambahan α mampu mengkoreksi model regresi logistik yang biasa. Selanjutnya dibandingkan tanda dari parameter model 1 dengan tanda dari parameter model data hasil pembangkitan. Dari kedua model tersebut, tanda yang dimiliki oleh parameternya sama. Misalkan untuk tanda dari
dan
model data hasil pembangkitan adalah positif dan negatif. Tanda dari
untuk dan
dari model 1 juga positif dan negatif. Apabila dilakukan uji Wald pada setiap parameter di model yang terbentuk dari data hasil pembangkitan, maka semua parameternya signifikan pada tingkat α = 5%, yang berarti bahwa semua peubah penjelas memberikan pengaruh yang nyata terhadap peubah respon. Setiap parameter dari model 1 dilakukan uji Wald, maka diperoleh bahwa semua parameter signifikan pada tingkat α = 5%, sehingga dapat disimpulkan bahwa dengan menggunakan model 1 semua peubah bebas memberikan pengaruh yang nyata terhadap peubah respon. Kesimpulan yang dihasilkan oleh model 1 sama dengan kesimpulan yang dihasilkan oleh model dari data hasil pembangkitan. Hal ini menunjukkan bahwa model 1 mampu menggambarkan pola hubungan antara peubah respon dan peubah penjelas dengan baik. Model Y terhadap X 1 , X 2 , dan X 3 dari sampling frame pertama adalah sebagai berikut:
dengan
Nilai
merupakan konstanta untuk mengkoreksi nilai
berfungsi untuk mengkoreksi nilai
,
,
dan dan
, sedangkan . Hal ini terjadi
sebagai akibat dari penggunaan teknik pengambilan contoh dengan tiga tahap. Misalkan pada saat nilai x1 = 0 dan x 2 = 0, maka nilai untuk model untuk data hasil pembangkitan adalah 0.3494.
Nilai
adalah
0.3276. Apabila dengan menggunakan model 2, namun tanpa memasukkan nilai , maka nilai
sebesar
0.3024. Terlihat bahwa dengan menggunakan penambahan konstanta nilai estimasi
dari model 2 lebih
mendekati nilai hasil pembangkitan. Selain itu nilai
dari model untuk data juga menunjukkan pengaruh interaksi
antara i dan j. Berdasarkan skema pengambilan contoh yang digunakan, i terbentuk berdasarkan nilai X 1 sedangkan j terbentuk berdasarkan nilai X 2 . Sehingga dapat dikatakan bahwa nilai-nilai
menggambarkan pengaruh
interaksi antara peubah X 1 dan X 2 . Perbandingan tanda dari nilai estimasi parameter model 2 dengan model dari data hasil pembangkitan, maka diperoleh bahwa tanda dari parameter di kedua model sama. Tanda pada parameter
dari model untuk
data hasil pembangkitan dan model 2 adalah positif, negatif, dan positif. Kemudian dilakukan uji Wald untuk masing-masing parameter dari model 2. Hasil uji Wald menunjukkan bahwa semua parameter dari model 2 signifikan pada tingkat α = 5%, yang berarti bahwa pengaruh yang diberikan oleh peubah penjelas terhadap varibel respon nyata pada α = 5%. Jadi, dapat disimpulkan bahwa model 2 mampu menggambarkan pola hubungan antara peubah penjelas dengan peubah respon dengan baik.
Pengujian Parameter Pada setiap model yang terbentuk dari proses simulasi pengambilan contoh dilakukan uji Wald untuk mengetahui parameter model signifikan atau tidak. Hipotesis yang digunakan yaitu H 0 :
lawan H 1 :
, i=1, 2, ..., p
Kemudian dihitung jumlah parameter yang memberikan hasil uji Wald yang berbeda dengan hasil uji Wald bagi parameter model dari data hasil pembangkitan. Setelah jumlah diketahui maka dihitung persentase jumlah parameter yang memberikan kesimpulan yang berbeda dengan model untuk data hasil pembangkitan. Selama proses simulasi dilakukan pengulangan, maka diperoleh nilai rata-rata persentase jumlah parameter yang memberikan kesimpulan yang berbeda denganmodel untuk data hasil pembangkitan. Tabel 2 menunjukkan nilai rata-rata persentase jumlah parameter yang memberikan kesimpulan yang berbeda dengan parameter dari model populasi pada taraf α = 5%. Model yang digunakan adalah model variabel Y terhadap peubah X 1 , X 2 , dan X 3 , karena pada saat dilakukan survei dengan beberapa tahap pengambilan contoh model yang digunakan hanyalah model Y terhadap seluruh peubah penjelas yang diamati (X 1 , X 2 , dan X 3 ). Tabel 4 Nilai rata-rata persentase jumlah parameter yang memberikan kesimpulan yang berbeda dari model data hasil pembangkitan untuk N=300 Kerangka Jml contoh yang diambil di setiap pengambilan contoh contoh 70% 75% 80% 85% 90% 95% 1 23.33 15.00 16.67 5.00 5.00 1.67 2 18.33 01.67 6.67 0.00 0.00 0.00 3 26.67 15.00 18.33 13.33 8.33 10.00 4 26.67 15.00 18.33 13.33 8.33 10.00 6 23.33 20.00 15.00 15.00 11.67 13.33 7 25.00 21.67 23.33 15.00 6.67 5.00 8 22.75 18.86 13.47 12.34 13.03 9.90 9 35.00 13.33 13.33 1.67 3.33 3.33 10 20.00 18.33 18.33 13.33 5.00 0.00 Rata-rata 24.56 15.43 15.94 9.89 6.82 5.92
Saat terjadi pengurangan jumlah contoh sebesar 30 % di masing-masing tahap pengambilan contoh, maka persentase rata-rata jumlah parameter yang berbeda dengan parameter model populasi sebesar 24.56 % (Tabel 4). Hal ini berarti bahwa pada saat diambil contoh sebesar 49% dari jumlah keseluruhan populasi, maka terdapat 24.56% parameter yang tidak menggambarkan hubungan antar peubah yang sebenarnya. Apabila terjadi pengurangan jumlah contoh sebesar 20% dan 25% di masing-masing tahap pengambilan contoh, maka ratarata persentase jumlah parameter yang tidak menggambarkan hubungan peubah respon dengan peubah penjelas berkisar 15%. Nilai rata-rata persentase jumlah parameter yang tidak mennggambarkan hubungan yang sebenarnya akan menurun seiring dengan bertambahnya jumlah contoh yang digunakan. Tanda positif atau negatif dari parameter memiliki peranan yang penting dalam menggambarkan pola hubungan antara peubah respon dan peubah penjelas. Tanda positif pada parameter menunjukkan kecenderungan yang lebih besar daripada peubah pembandingnya. Tanda negatif menunjukkan kecenderungan yang lebih kecil dari peubah pembandingnya. Hampir semua model yang dibangun dari data hasil pengambilan contoh memberikan tanda positif atau negatif yang sama dengan model dari data hasil pembangkitan. Tanda positif dan negatif dari 600 model yang terbentuk, hanya 13 parameter dalam 13 model yang berbeda dari model pembanding.
Tabel 5 Rata-rata persentase informasi hilang pada tahap kedua pengambilan contoh untuk N=300 Kerangka Jml contoh yang diambil di setiap pengambilan contoh contoh 70% 75% 80% 85% 90% 95% 1 8.43 5.15 5.38 15.48 12.80 23.61 2 29.60 25.38 19.15 17.48 9.30 6.55 3 28.25 21.48 37.38 30.58 23.61 31.32 4 32.21 28.31 21.98 17.01 14.85 11.93 6 42.31 6.31 4.32 5.48 3.03 4.38 7 19.43 14.11 14.44 17.90 19.50 13.44 8 16.86 15.81 13.67 13.64 15.33 18.94 9 17.14 15.50 16.39 15.66 19.23 14.42 10 17.73 10.08 12.58 14.89 18.25 11.41 Rata-rata 23.55 15.79 16.14 16.46 15.10 15.11
Informasi yang Hilang Model yang baik merupakan model yang mampu menggambarkan keadaan populasi yang sebenarnya. Informasi akan hilang dalam setiap pengurangan jumlah data. Pengurangan jumlah data pertama kali terjadi pada tahap kedua proses pengambilan contoh. Besar rata-rata persentase informasi yang hilang dapat dilihat pada Tabel 5. Pengurangan contoh sebesar 30% mengakibatkan kehilangan informasi ratarata sebesar 23.55% (Tabel 5). Pengurangan jumlah contoh sebesar 5% sampai 25% maka akan kehilangan informasi sebesar 15% sampai 16%. Gambar 2 menunjukkan rata-rata persentase informasi yang hilang pada tahap kedua proses pengambilan contoh untuk semua data yang dibangkitkan. Gambar 2 diperoleh dari data pada Lampiran 5.
Rata-rata informasi hilang (%)
25
20
15
1000 900
10
700 500 300
5
0 70
75
80
85
90
95
Persentase pengambilan contoh (%)
Gambar 2 Rata-rata informasi hilang pada tahap kedua proses pengambilan contoh
Penurunan jumlah informasi yang hilang terjadi seiring dengan bertambahnya jumlah contoh yang diambil (Gambar 2). Jumlah data hasil pembangkitan 500, 700, dan 1000 menghasilkan rata-rata persentase informasi yang hilang cenderung sama. Jumlah data hasil pembangkitan sebesar 900 mengakibatkan informasi yang hilang selalu lebih rendah dari jumlah yang lain. Hal ini mungkin terjadi apabila data hasil pembangkitan dengan jumlah 900 data lebih homogen dari data hasil pembangkitan yang lainnya. Rata-rata informasi yang hilang paling banyak ditunjukkan saat jumlah data hasil pembangkitan sebesar 300, karena jumlah contoh yang terambil lebih kecil dari yang lainnya. Pengurangan jumlah data yang kedua terjadi pada awal tahap ketiga proses pengambilan contoh. Besar rata-rata persentase informasi yang hilang dapat dilihat pada Tabel 6. Pengurangan jumlah contoh sebesar 30% di masing-masing tahap pengambilan contoh atau sebesar 51% dari jumlah total populasi, maka nilai ratarata informasi yang hilang sebesar 41%. Pengurangan jumlah data sebesar 43.75% dan 36% dari jumlah total populasi mengakibatkan informasi yang hilang sebesar 33% dan 32%. Persentase kehilangan informasi ini akan menurun seiring dengan bertambahnya jumlah contoh yang diamati. Tabel 6 Rata-rata persentase total informasi hilang untuk N=300 Kerangka Jml contoh yang diambil di setiap pengambilan contoh contoh 70% 75% 80% 85% 90% 95% 1 29.52 16.82 18.95 12.80 19.07 17.52 2 57.76 41.63 41.63 28.48 17.62 7.59 3 59.86 42.68 52.47 39.55 30.32 31.28 4 70.20 56.26 49.26 32.22 24.43 19.40 6 22.20 18.35 24.39 12.41 21.89 8.66 7 29.13 32.55 24.79 21.92 21.68 18.92 8 49.07 37.39 31.12 21.00 16.26 16.02 9 31.72 29.09 28.09 18.00 17.45 16.66 10 20.43 21.83 17.14 13.79 14.99 12.56 Rata-rata 41.10 32.95 31.98 22.24 20.41 16.51 Gambar 3 diperoleh dari data di Lampiran 6, dimana terjadi penurunan jumlah informasi yang hilang seiring dengan bertambahnya jumlah contoh yang diambil. Jumlah data yang semakin besar mengakibatkan contoh yang diamati
semakin banyak dan informasi yang hilang semakin kecil. Besar informasi yang hilang sebagai akibat dari pengurangan jumlah contoh yang diambil selalu lebih kecil daripada besar pengurangan contoh. Penghematan biaya akan menjadi
Rata-rata informasi hilang (%)
berarti apabila biaya untuk memperoleh contoh sangat mahal. 160 140 120 100
300
80
500
60
700
40
900
20
1000
0 70
75
80
85
90
95
Persentase pengambilan contoh (%)
Gambar 3 Rata-rata persentase total informasi hilang Besarnya informasi yang hilang pada tahap kedua dan ketiga sebanding dengan jumlah pengurangan contoh. Informasi yang hilang sebesar 23.55% apabila terjadi pengurangan contoh sebesar 30% pada tahap kedua. Total informasi yang hilang pada tahap ketiga sebesar 41.11% apabila terjadi pengurangan jumlah contoh sebesar 51%. Jumlah informasi yang hilang pada tahap ini sebesar 17.56%, apabila terjadi pengurangan jumlah contoh sebesar 30% di tahap tiga.
Rata-rata informasi hilang (%)
25,00 20,00 15,00 tahap 3
10,00
tahap 2 5,00 0,00 70
75
80
85
90
95
Persentase pengambilan contoh (%)
Gambar 4 Rata-rata persentase informasi hilang pada tahap kedua dan ketiga dengan N=300 Penurunan rata-rata informasi yang hilang seiring dengan bertambahnya jumlah contoh yang diambil pada tahap ketiga (Gambar 4). Rata-rata informasi yang hilang pada tahap ketiga proses pengambilan contoh hampir semua lebih kecil dari rata-rata informasi yang hilang di tahap kedua pengambilan contoh. Hal ini terjadi karena pada tahap ketiga, unit contoh yang ada lebih homogen dari unit contoh pada tahap kedua. Kehomogenan dari unit contoh terjadi sebagai akibat dari proses pengelompokan yang dilakukan pada akhir tahap kedua pengambilan contoh.