BAB IV HASIL DAN PEMBAHASAN PENELITIAN
4.1 Pemrosesan dan Analisis Data 4.1.1
Pembangkitan Data Untuk membangkitkan nilai varibel Y yang berdistribusi binomial maka sebelum
melakukan membangkitkan nilai acak binomial haruslah ditentukan terlebih dahulu nilai kemungkinan atau probabilitas munculnya nilai Y=1 yang juga ikut diacak. Dengan nama variabel jmln yang merupakan variabel yang berisikan jumlah banyaknya data yang dibangkitkan. Berikut ini sintax di R-language: pirand<-runif(jmln) y<-10*runif(jmln)*rbinom(jmln,c(1,0),pirand) x1<-20*runif(jmln)*rnorm(jmln*(exp(pirand/(1-pirand))))
Setelah didapatkan nilai acak variabel dependen (Y) maka nilai selanjutnya yang harus dibangkitkan secara diacak adalah nilai dari variabel (X), akan tetapi harus diingat bahwa variabel X dan variabel Y haruslah mempunyai hubungan data mengingat akan adanya probabilitas bersyarat sehingga data yang dibangkitkan juga harus berhubungan antara X dan Y. Jumlah variabel X yang dibangkitkan sebanyak dengan jumlah yang diinginkan.
27 4.1.2
Estimasi Parameter Regresi Logistik Untuk mengestimasi parameter dan menghitung deviance residual dari persamaan
regresi logistik biasa dengan maximum likelihood pada dengan contoh dibawah pada 3 variabel bebas dengan R-language dapat dengan sintax: pers<-glm(y~x1+x2+x3,family=binomial) pers<-coef(pers) pers Output yang dihasilkan: pers (Intercept)
x1
x2
x3
-0.99611942 0.45559697 -0.34549983 -0.03942732 Setelah didapatkan persamaan dari regresi logistik biasa secara general maka langkah selanjutnya adalah untuk mengetahui nilai deviance residual dari regresi logistik biasa yang nantinya akan dibandingkan dengan deviance residual rata-rata dari bootstrap. Berikut ini sintaxnya di R-language: devlogbiasa<-deviance(pers) devlogbiasa Output yang dihasilkan : 31.51926 Untuk mendapatkan nilai probabilitas yang akan dibootstrap, nilai dari vektor p harus dihitung yang didapatkan dengan cara menghitung fitted value yang isinya berupa nilai probabilitas nilai ekspetasi dari Y=1, dengan contoh menggunakan 3 variabel bebas dengan menggunakan sintax R-language sebagai berikut :
27
28 p<(exp(pers[1]+(pers[2]*x1)+(pers[2]*x2)+(pers[3]*x3)))/ (1+(exp(pers[1]+(pers[2]*x1)+(pers[2]*x2)+(pers[3]*x3) ))) Output hasilnya pada 3 variabel dan 30 data adalah : 1] 0.21140081 0.27315290 0.15481178 0.37433021 0.19469076 0.08808482 [7] 0.27240353 0.42438826 0.29581396 0.30878595 0.24415744 0.20612592 [13] 0.39011860 0.24294977 0.24451962 0.15526128 0.23056249 0.19080370 [19] 0.23410562 0.25115680 0.10600435 0.13229310 0.31134796 0.17783882 [25] 0.19649676 0.17357991 0.16942676 0.21163024 0.22961314 0.30414473
4.1.3
Replikasi Bootstrap Jumlah data hasil replikasi dari bootstrapping tergantung dari berapa banyak data
yang ada pada data observasi yang ingin dibootstrap yang dikalikan dengan jumlah replikasi bootstrap yang diinginkan. Replikasi bootstrap untuk menghasilkan Y* ditunjukkan dengan sintaks R-language berikut: for(i in 1:jmlboot){ for(j in 1:jmln){ p2<-c(p[j],q[j]) ybootemp<-sample(c(1,0),1,replace=TRUE,prob=p2) count<-count+1 yboot[count]<-ybootemp }} Output hasilnya ditampilkan didalam maka hasilnya seperti:
28
29
Tabel 4.1: Matrix nilai Y yang dibootstrap dengan 3 variabel X, n = 30 data, dan 1000 replikasi bootstrap Dari tabel (4.1) dari tabel diatas menunjukan bahwa terdapat 1000 kolom yang berarti bahwa telah dilakukan bootstrap sebanyak 1000 kali dengan banyak setiap kelompok bootstrap adalah sebanyak jumlah data awal dalam hal ini adalah 30 karena data yang dibangkitkan adalah 30 buah data.
4.1.4
Fit Regresi Logistik dan Metode Bootstrap Setelah didapatkan nilai Y yang baru dengan bootstrap maka yang harus dilakukan
adalah mendapatkan nilai persamaan regresi logistik yang baru hasil dari estimasi antara
Y * yang merupakan variabel dependen dari hasil replikasi bootstrap yang baru dengan variabel X. Hal itu ditunjukkan dengan sintaks R-language seperti berikut (dengan sintax 3 variabel):
29
30 for(i in 1:jmlboot){ for(j in 1:jmln){ yboot2[j]<-ybootmtx[j,i] } persboot<-glm(yboot2~x1+x2+x3,family=binomial) devmtx[i]<-deviance(persboot) persboot2<-coef(persboot) b0boot[i]<-persboot2[1] b1boot[i]<-persboot2[2] b2boot[i]<-persboot2[3] b3boot[i]<-persboot2[4] yboot2<-0 } Tiap persamaan akan disimpan pada variabel sehingga akan terdapat 1000 persamaan pada tiap-tiap parameter yang diestimasi karena terdapat 1000 kelompok data hasil dari bootstrap yang diestimasi masing-masing. Berikut ini adalah tabel matrix hasil dari estimasi parameter dengan 3 variabel independen pada bootstrap yang berjumlah 1000 persamaan:
30
31
Tabel 4.2: Matrix nilai estimasi parameter dengan 3 variabel X, n = 30 data, dan 1000 replikasi bootstrap
Output dari devmtx yang isinya adalah deviance residual dari tiap estimasi parameter dari tiap kelompok bootstrap adalah : [1] 3.464714e+01 2.745166e+01 2.871260e+01 2.567989e+01 3.072694e+01 [6] 3.256464e+01 3.571497e+01 3.558173e+01 2.293464e+01 3.808559e+01 [11] 2.708541e+01 2.491297e+01 3.179952e+01 3.962460e+01 3.087080e+01 ……………………………………. [496] 3.499126e+01 2.758886e+01 7.418162e+00 3.525510e+01 5.935821e+00 [501] 1.708749e+01 3.173942e+01 2.814258e+01 2.936333e+01 3.498697e+01 [506] 2.899372e+01 3.183486e+01 3.824760e+01 3.428857e+01 2.806842e+01 31
32 ……………………………….. [986] 3.335088e+01 1.961047e+01 3.716349e+01 3.940491e+01 2.645549e+01 [991] 3.132148e+01 3.314044e+01 1.681783e+01 2.301145e+01 3.641387e+01 [996] 3.030701e+01 3.759053e+01 2.478159e+01 1.016155e-07 3.119078e+01
Nilai deviance residual tersebut akan berjumlah 1000 yang masing-masingnya mewakili deviance residual pada tiap estimasi parameter pada tiap kelompok bootstrap.
4.1.5
Hitung Deviance Residual Bootstrap Dari persamaan bootstrap tersebut hitunglah deviance residual dari metode
bootstrap logistic regression tersebut. Hal itu ditunjukkan dengan sintaks R-language berikut: for(i in 1:jmlboot) { devttl<-devttl+devmtx[i] } devboot<- b0ttl/jmlboot
Output yang dihasilkannya pada 3 variabel dan 30 data adalah: 38.32749 deverr<-(b0ttl/jmlboot)-devlogbiasa output yang dihasilkannya pada 3 variabel dan 30 data adalah -4.49721
32
33 4.1.6
Rata-Rata Estimasi Parameter Pada Bootstrap Estimasi parameter dari regresi logistik dengan bootstrap dihitung dengan sintax
seperti berikut: for(i in 1:1000) { b0ttl<-b0ttl+b0boot[i] b1ttl<-b1ttl+b1boot[i] b2ttl<-b2ttl+b2boot[i] b3ttl<-b3ttl+b3boot[i] } b0ttl/jmlboot b1ttl/jmlboot b2ttl/jmlboot b3ttl/jmlboot Output hasil dari bootstrap parameter dari 3 variabel dan 30 data yang telah di adalah :
Tabel 4.3: Tabel estimasi parameter rata-rata pada regresi logistik dengan metode bootstrap pada 3 variabel dan n=30 data.
33
34 4.2 Perbedaan Deviance Residual Dari perhitungan perbedaan deviance residual antara regresi logistik biasa dengan regresi logistik dengan metode bootstrap probabilitas bersyarat dapat dilihat pada tabel dibawah ini: Komparasi
Regresi
Regresi logistik
Perbedaan
deviance
logistik
dengan bootstrap
deviance
residual
biasa
probabilitas
residual
bersyarat 3 variabel dengan 30 data 3 variabel dengan 60 data 3 variabel dengan 100 data 3 variabel dengan 500 data 6 variabel dengan 30 data 6 variabel dengan 60 data 6 variabel dengan 100 data 6 variabel dengan 500 data
38.32749
33.83028
-4.49721
58.74006
54.18114
-4.55892
116.6011
112.3468
-4.2543
553.9715
550.4109
-3.5606
42.90594
34.77067
-8.13527
67.68218
59.83228
-7.8499
103.4155
95.77689
-7.63861
567.2079
560.0612
-7.1467
Tabel 4.4: Tabel Perbandingan deviance residual antara regresi logistik biasa dengan regresi logistik bootstrap.
Bisa dilihat dari tabel 4.4 bahwa ternyata setelah dihitung perbedaan dari deviance residual dari regresi logistik biasa dan regresi logistik dengan metode bootstrap relatif kecil. Bersamaan dengan bertambahnya jumlah data yang dibangkitkan maka semakin besar pula deviance residual kedua regresi. 34
35 Berbeda halnya dengan perbedaan deviance residual dari kedua regresi yang semakin kecil seiring dengan bertambahnya data sampel yang diobservasi, semakin banyak data sampel yang direplikasi semakin tepat pula nilai deviance residual dari regresi logistik dengan metode bootstrap jika dibandingkan dengan nilai regresi logistik biasa. Dari hasil deviance residual pada tabel 4.4 dapat dikatakan bahwa deviance residual pada regresi logistik dengan bootstrap mempunyai nilai yang sebanding dengan nilai deviance residual yang dimiliki oleh regresi logistik biasa.
4.3 Nilai koefisien Regresi Logistik dan Regresi Logistik dengan Bootstrap Berikut ini adalah tabel hasil dari dari parameter yang diestimasi dari regresi logistik dan regresi logistik dengan metode bootstrap:
Estimasi b0 b1 b2 b3 parameter pada 3 variabel X dan n= 30 data Regresi logistik -0.5138178 -0.02289929 -0.00380185 -0.041916019 biasa Regresi logistik -0.6035863 -0.03481864 -0.00478708 -0.05873964 dengan bootstrap Tabel 4.5: Tabel perbandingan estimasi parameter pada 3 variabel X dan n= 30 data.
35
36 Estimasi b0 b1 b2 b3 parameter pada 3 variabel X dan n= 60 data Regresi logistik -1.4998791 -0.08619578 -0.05414047 -0.02438699 biasa Regresi logistik -1.682569 -0.0878764 -0.06149699 -0.02890257 dengan bootstrap Tabel 4.6: Tabel perbandingan estimasi parameter pada 3 variabel X dan n= 60 data.
Estimasi b0 b1 b2 b3 parameter pada 3 variabel X dan n= 100 data Regresi logistik -0.9372089 -0.069239289 -0.00792884 -0.014988913 biasa Regresi logistik -0.9896123 -0.07114679 -0.00963828 -0.01657390 dengan bootstrap Tabel 4.7: Tabel perbandingan estimasi parameter pada 3 variabel X dan n= 100 data.
Estimasi b0 b1 b2 b3 parameter pada 3 variabel X dan n= 500 data Regresi logistik -1.1423636 -0.013334585 -0.11207489 0.001350545 biasa Regresi logistik -1.150523 -0.01184655 -0.1029682 0.001284946 dengan bootstrap Tabel 4.8: Tabel perbandingan estimasi parameter pada 3 variabel X dan n= 500 data.
36
37 Estimasi parameter pada 6 variabel X dan n= 30 data Regresi logistik biasa Regresi logistik dengan bootstrap
b0
b1
b2
b3
-0.80111447
-0.03031234
0.09570664
-0.08003509
-1.071613
-0.04693233
0.1327544
-0.1126586
Estimasi b4 b5 b6 parameter pada 6 variabel X dan n= 30 data Regresi logistik 0.04512725 -0.02304710 -0.05618512 biasa Regresi logistik 0.06625681 -0.03445658 -0.07164192 dengan bootstrap Tabel 4.9: Tabel perbandingan estimasi parameter pada 6 variabel X dan n= 30 data.
Estimasi parameter pada 6 variabel X dan n= 60 data Regresi logistik biasa Regresi logistik dengan bootstrap
b0
b1
b2
b3
-1.0332333
-0.037049959
0.002400636
0.019542216
-1.227361
-0.04573248
0.001746254
0.02535444
Estimasi b4 b5 b6 parameter pada 6 variabel X dan n= 60 data Regresi logistik 0.006632124 0.012158041 -0.003029066 biasa Regresi logistik 0.007592152 0.01578432 -0.002774887 dengan bootstrap Tabel 4.10: Tabel perbandingan estimasi parameter pada 6 variabel X dan n= 60 data.
37
38 Estimasi parameter pada 6 variabel X dan n= 100 data Regresi logistik biasa Regresi logistik dengan bootstrap
b0
-1.3029463 -1.449078
b1
b2
0.0327364890 0.0206466059 0.03804383
0.02262030
b3
-0.007395508 -0.00814266
Estimasi b4 b5 b6 parameter pada 6 variabel X dan n= 100 data Regresi logistik 0.0045283001 0.0003223864 -0.030828788 biasa Regresi logistik 0.005532636 0.0003507035 -0.03899761 dengan bootstrap Tabel 4.11: Tabel perbandingan estimasi parameter pada 6 variabel X dan n= 100 data.
Estimasi parameter pada 6 variabel X dan n= 500 data Regresi logistik biasa Regresi logistik dengan bootstrap
b0
b1
b2
b3
-1.07038981
0.002751933
0.002995724
-0.008538030
-1.088501
0.002597593
0.002777001
-0.00825483
Estimasi b4 b5 b6 parameter pada 6 variabel X dan n= 500 data Regresi logistik -0.003875324 0.002574000 0.004579975 biasa Regresi logistik -0.003991370 0.003030202 0.004852104 dengan bootstrap Tabel 4.12: Tabel perbandingan estimasi parameter pada 6 variabel X dan n= 500 data. 38
39 Dari tabel 4.5 - 4.12 diatas dapat dilihat estimasi parameter dari persamaan regresi logistik biasa dan estimasi parameter rata-rata dari regresi logistik dengan metode bootstrap. Estimasi parameter antara regresi logistik dan regresi logistik dengan metode bootstrap memiliki nilai estimasi yang sebanding. Seperti yang diketahui besarnya nilai b0 pada regresi adalah nilai awal pada persamaan jika semua nilai X adalah nol, sedangkan pada nilai persamaan estimasi parameter lainnya (b1 ,b2, b3, dsb) nilai parameter tersebut adalah nilai besarnya perubahan pada variabel dependen Y jika X pada persamaan parameter tersebut naik sebanyak satu angka. Contohnya pada estmasi parameter dengan 6 variabel X dan n =500 nilai b6 pada regresi logistik biasa adalah 0.004579975, hal itu berati bahwa dengan kenaikan satu nilai x6 mempengharui sebesar 0.004579975 bertambahnya nilai Y.
4.4
Spesifikasi Sarana untuk Analisis Berikut ini akan diberikan spesifikasi sarana yang digunakan dalam analisis
perbandingan regresi logistik biasa dengan regresi logistic dengan metode bootstrap menggunakan R-language.
Sarana ini terdiri dari perangkat keras (hardware) dan
perangkat lunak (software).
4.3.1. Perangkat Keras Perangkat keras yang digunakan untuk analisis perbandingan regresi logistik biasa dan regresi logistik dengan metode bootstrap adalah : 1.
CPU Pentium 4.2.66 GHz
2.
RAM DDR 512 MB
39
40 3.
Harddisk 80 GB
4.
Monitor 21 inci resolusi 1024*768 pixel
5.
Keyboard
6.
Mouse
4.3.2. Perangkat Lunak Perangkat lunak yang dibutuhkan untuk analisis perbandingan regresi logistik biasa dan regresi logistik dengan metode bootstrap adalah : 1.
Microsoft Windows XP Sp 2
2.
R Language v2.1.1
3.
Notepad untuk menyimpan hasil dari listing program dari R-language.
40