4. Residence status (status kepemilikan rumah) yang dinotasikan dengan RS. Peubah ini dibagi menjadi enam kelompok. 5. Job code (kode pekerjaan) yang dinotasikan dengan JC. Peubah ini dibagi menjadi lima kelompok. Pada setiap peubah penjelas dibagi mejadi beberapa kategori dan pada masingmasing kategori dihitung nilai WOE-nya. Nilai WOE yang dihasilkan dan tercantum pada Tabel 1 merupakan perbandingan proporsi kategori tertentu pada masing-masing peubah penjelas untuk status baik atau buruknya calon penerima kredit. Semakin besar nilai WOE pada suatu kategori berarti kategori tersebut cenderung untuk baik, atau dengan kata lain para calon penerima kredit pada kategori tersebut cenderung memiliki peluang lebih besar untuk mendapatkan pinjaman. Tabel 1. Kategorisasi data berdasarkan WOE Debt Salary Ratio (%) Kategori WOE 0.00 - 16.27 -0.1740 16.27 - 17.00 0.8944 17.00 - 17.99 -1.0365 17.99 - 19.69 -0.0456 19.69 - 20.41 1.9240 20.41 - 38.01 0.3204 38.01 - 38.91 -0.8640 38.91 - inf -0.0362 Gross Annual Income (juta rupiah) Kategori WOE 0.0 – 53.4 -0.0682 53.4 – 57.6 -1.1005 57.6 – 63.0 1.0429 63.0 – 72.3 -0.1496 72.3 – 98.9 2.0323 98.9 – 139.7 0.0270 139.7 – inf 6.4396 Number Of Dependants (jiwa) Kategori WOE 1 -0.1874 2 -0.0419 4 0.0569 0,3 0.1355 ≥5 0.4107 Residence Status Kategori WOE Rented -0.3583 Parents -0.1376 Own 0.1444
Others Institution Credit
0.2658 0.4481 0.5087
Job Code Kategori Notaris, peg yayasan Pegawai swasta Guru/Dosen, peg.BUMN/BUMD Pegawai Negri Sipil Others
WOE -1.3393 -0.1135 0.4602 0.9379 2.0969
Metode Langkah–langkah metode penelitian sebagaimana tertera pada Gambar 2 adalah sebagai berikut : 1. Memanfaatkan data asli dan data hasil diskretisasi Alfiansyah (2007). 2. Menduga model menggunakan metode regresi logistik dengan peubah penjelasnya adalah nilai asli yang kemudian disebut sebagai Model-1. 3. Menduga model dengan menggunakan metode regresi logistik dengan nilai peubah penjelasnya adalah nilai hasil diskretisasi (nilai WOE) yang kemudian disebut sebagai Model-2. 4. Membandingkan performa dari kedua model yang dihasilkan pada tahap (2) dan (3) dengan melihat signifikansi koefisien regresi, correct classification table, dan kurva ROC. Software yang digunakan adalah SAS 9.1, SPSS 11.5, dan Microsoft Office Excel 2007. Data asli
Data terdiskretisasi
Menduga Model -I
Menduga Model -2
Membandingkan performa model - Koefisien regresi - Correct Classification Table - Kurva ROC
Gambar 2 Flowchart Metode
HASIL DAN PEMBAHASAN Deskripsi Nasabah
Jumlah nasabah yang menjadi contoh dalam penelitian ini sebanyak 1000 orang. Untuk melihat apakah orang tersebut bisa mendapatkan pinjaman dari bank atau tidak , maka harus dilihat apakah orang tersebut berpeluag untuk mengalami kredit macet atau tidak. Dilihat dari kategori pertama yakni DSR (Rasio Utang dan Pendapatan) semakin besar DSR menunjukkan bahwa nasabah tersebut semakin berpeluang untuk macet dalam pembayaran kredit karena alokasi pendapatan berkurang untuk membayar kredit dengan asumsi pengeluaran sama. Setelah dilakukan analisis terhadap 1000 orang nasabah tersebut dapat diketahui dari Tabel 2 bahwa sebagian besar nasabah berada pada selang rasio (17.00 - 17.99)% dan (20.41 - 38.01)%. Nasabah dengan rasio terkecil berada pada selang (0.00-16.27)% sebanyak 43 orang. Sedangkan nasabah dengan rasio tertinggi memiliki rasio lebih dari 38.91% sebanyak 37 orang.
GAI (juta rupiah)
Jumlah
%
0.0 – 53.4
27
2.7
53.4 – 57.6
27
2.7
57.6 – 63.0
818
81.8
63.0 – 72.3
25
2.5
72.3 – 98.9
31
3.1
98.9 – 139.7
40
4
139.7 – inf
32
3.2
Pada Tabel 4 dapat diketahui nahwa nasabah yang tidak memiliki tanggungan sebanyak 311 orang atau 31.1%, selanjutnya nasabah dengan tanggungan 1, 2, 3, 4 dan 5 berturut-turut sebesar 25.1%, 27.2%, 12.3%, 3.2%, dan 0.7%. Sedangkan nasabah yang memiliki tanggungan lebih dari 5 orang sebesar 0.4%. Tabel 4 Jumlah Nasabah pada kategori Jumlah Tanggungan
Tabel 2 Jumlah Nasabah pada kategori Debt Salary Ratio (DSR) DSR (%)
Jumlah
%
0.00 - 16.27
43
4.3
16.27 - 17.00
41
4.1
17.00 - 17.99
272
27.2
17.99 - 19.69
100
10
19.69 - 20.41
83
8.3
20.41 - 38.01
396
39.6
38.01 - 38.91
28
2.8
38.91 - inf
37
3.7
Untuk kategori pendapatan tahunan kotor atau GAI, sebagian besar nasabah memiliki pendapatan yang berkisar pada selang 57.6 sampai 63 juta rupiah dengan persentase 81.8%. Nasabah dengan pendapatan tahunan kotor paling rendah memiliki pendapatan sebesar 0.0 sampai 53.4 juta rupiah dengan persentase 27% dan nasabah dengan pendapatan paling tinggi memiliki pendapatan lebih dari 139.7 juta rupiah dengan persentase 32%, bahkan ada nasabah yang mencapai pendapatan tahunan kotor paling tinggi yakni sebesar 1.2 Milyar.
Tabel 3 Jumlah Nasabah pada kategori Pendapatan Tahunan Kotor
NOD (jiwa)
Jumlah
%
0
311
31.1
1
251
25.1
2
272
27.2
3
123
12.3
4
32
3.2
≥5
11
1.1
Untuk kategori status rumah atau RS pada Tabel 5 dapat diketahui bahwa sebagian besar nasabah tinggal di rumah milik sendiri sebesar 43.7% dan sebesar 47.1% tinggal di rumah milik orang tua. Selainnya tinggal di rumah yang berstatus sewa sebesar 3.2%, di rumah yang bestatus kredit sebesar 1.9%, di rumah milik institusi sebesar 1.8% dan dengan status rumah lainnya sebesar 2.3%. Tabel 5 Jumlah Nasabah pada Kategori Status Rumah Hunian RS
Jumlah
%
Rented
32
3.2
Parents
471
47.1
Own
437
43.7
Others
23
2.3
Institution
18
1.8
Credit
19
1.9
Kategori terakhir pada Tabel 6 adalah kode pekerjaan atau JC. Mayoritas nasabah
memiliki pekerjaan sebagai pegawai swasta sebesar 79% dan sebagian yang lain adalah pegawai BUMN/BUMD, Pegawai Negeri Sipil, Guru/Dosen, Pejabat Negara dll. Tabel 6 Jumlah Nasabah pada kategori Kode Pekerjaan JC
Jumlah
%
Notaris
2
0.2
Pegawai Yayasan
5
0.5
Pegawai Swasta
790
79
Guru/Dosen Pegawai BUMN/BUMD
8
0.8
137
13.7
Pegawai Negeri Sipil
29
2.9
Pejabat Negara
7
0.7
Profesional
2
0.2
Wiraswasta
7
0.7
Akuntan
2
0.2
Dokter
6
0.6
Employee
3
0.3
Paramedis
2
0.2
Peubah Y (kolektibilitas nasabah) sebagai peubah respon merupakan peubah biner karena memiliki dua nilai yakni baik yang dinotasikan oleh angka 1 dan buruk yang dinotasikan oleh angka 0. Pada Gambar 3 dapat dilihat nasabah yang memiliki kategori baik sebanyak 833 orang atau 83.3%, nasabah dengan kategori buruk sebanyak 163 orang atau 16.3%, dan data nasabah yang hilang sebanyak 4 orang atau 0.4%. Jumlah Kolektibilitas Nasabah
163
4
Baik Buruk Nilai Hilang
833
Gambar
3
Grafik Jumlah Nasabah
Kolektibilitas
Analisis Regresi Logistik Analisis regresi logistik menggunakan peubah penjelasnya, yang dapat berupa peubah kategorik ataupun peubah numerik, untuk menduga besarnya peluang kejadian tertentu dari kategori peubah respon. Dalam hal ini, analisis regresi logistik menggunakan
peubah penjelas (DSR, GAI, NOD, RS dan JC) untuk menduga besarnya peluang kejadian nasabah yang mengalami kredit macet atau masuk dalam kategori buruk. Pemodelan peluang kejadian peubah penjelas dari kategori peubah respon dilakukan melalui transformasi logit. Hubungan yang dibangun antara logit dengan parameternya adalah hubungan linier. Berdasarkan Lampiran 1 hubungan antara peubah penjelas dengan logitnya banyak yang tidak linier. Misalnya, hubungan DSR dengan logit membentuk pola kuadratik. Hubungan antara GAI dengan logit membentuk gerombol dan terdapat data ekstrem. Hubungan antara NOD dengan logit membentuk pola kubik. Untuk RS dan JC tidak bisa dihitung nilai logitnya karena RS dan JC merupakan peubah kategorik sementara model regresi mensyaratkan peubah penjelasnya dalam bentuk numerik. Berdasarkan Tabel 7 pendugaan parameter pada Model-1 menghasilkan nilai Statistik-G sebesar 30.012 dengan nilai p = 0.000. Model penuh dapat diterima secara statistik karena nilai p lebih kecil dari taraf nyata α = 0.05. Berarti model yang dibangun layak atau minimal ada satu βi yang tidak sama dengan nol. Sedangkan pendugaan parameter pada Model-2 menghasilkan nilai Statistik-G sebesar 74.461 dengan nilai p = 0.000. Model penuh dapat diterima secara statistik karena nilai p lebih kecil dari taraf nyata α = 0.05. Berarti model yang dibangun layak atau minimal ada satu βi yang tidak sama dengan nol. Dari tabel 7 juga bisa dilihat bahwa nilai statistik-G pada Model-2 lebih besar daripada Model-1, hal ini menunjukkan bahwa kuasa uji dari Model-2 lebih besar atau dengan kata lain pengaruh dari peubah penjelas (DSR, GAI, NOD, RS dan JC) lebih terdeteksi pada Model-2 daripada Model-1. Statistik uji-G digunakan untuk mengetahui peran seluruh peubah penjelas dalam model secara bersama-sama. Sehingga terujinya signifikansi kedua model menandakan bahwa seluruh peubah penjelas berpengaruh terhadap kelancaran kredit nasabah yang akan menentukan status nasabah pada dua kategori baik atau buruk. Akan tetapi keberpengaruhan peubah penjelas pada Model-2 lebih besar jika dilihat berdasarkan statistik uji-G. Tabel 7 Nilai statistik-G, nilai-p dan nilai loglikelihood pada Model-1 dan
Model-2 Statistik-G Nilai-p Log-Likelihood
Model-1 30.012 0.000 - 426.902
Model-2 74.461 0.000 -406.668
Selain statistik uji-G, uji Wald digunakan untuk menguji parameter secara parsial. Dari model logistik yang terlihat pada Tabel 8, pada Model-1 peubah DSR, NOD, dan RS menghasilkan nilai-p yang lebih besar dari α = 0.05. Hal ini menunjukkan bahwa peubah-peubah tersebut tidak berpengaruh nyata secara statistik, sedangkan peubahpeubah yang signifikan berpengaruh nyata pada taraf α = 0.05 adalah peubah GAI dan JC. Sedangkan untuk Model-2 peubah NOD dan RS menghasilkan nilai-p yang lebih besar dari α = 0.05. Hal ini menunjukkan bahwa peubahpeubah tersebut tidak berpengaruh nyata secara statistik, sedangkan peubah-peubah yang signifikan berpengaruh nyata pada taraf α = 0.05 adalah peubah DSR, GAI, dan JC. Tabel 8 P-Value dari uji Wald pada Model-1 dan Model-2 Peubah Model-1 Model-2 DSR 0.167 0.000 GAI 0.011 0.001 NOD 0.058 0.176 RS 0.265 0.121 JC 0.015 0.003 Untuk mengukur sejauh mana validitas pengujian parameter maka dapat dilakukan pengujian korelasi antar peubah, hal ini berguna dan menjadi salah satu indikator apakah antar peubah saling bebas atau tidak atau dengan kata lain telah terjadi multikolinearitas dalam model atau tidak.
GAI
-0.160 (0.000)
NOD
0.015 (0.637)
0.241 (0.000)
RS
0.052 (0.100)
0.136 (0.000)
0.388 (0.000)
JC
0.000 0.242 0.257 0.162 (0.988) (0.000) (0.000) (0.000) Keterangan : Nilai di dalam tanda kurung menunjukkan nilai-p Dari Tabel 9 dapat dilihat bahwa antar peubah NOD dengan RS ada korelasi. Akan tetapi hal ini tidak dapat dijadikan pegangan bahwa telah terjadi masalah dalam model sehingga pada Tabel 8 peubah NOD dan RS dari Model-2 tidak nyata. Kemudian dilakukan simulasi lagi dengan membuang peubah RS, akan tetapi hasilnya peubah NOD tetap saja tidak menjadi nyata. Hal ini diduga cukup untuk menyatakan bahwa tidak ada masalah dalam model sehingga hasil pengujian parameter dinyatakan valid. Besarnya nilai-nilai koefisien regresi (B), SE dan Rasio Odds dari Model-1 dan Model-2 disajikan berturut-turut pada Lampiran 2 dan Lampiran 3. Pembandingan Model Penilaian kebaikan model dalam mengepas data yang digunakan diperlukan untuk memastikan bahwa prediksi yang diperoleh dari model memiliki tingkat ketepatan yang tinggi. Menurut (Hosmer & Lemeshow 1989), model dengan peubah yang signifikan berdasarkan hasil pengujian belum tentu akan memberikan tingkat ketepatan yang tinggi. Sehingga digunakan teknik sederhana untuk menentukan tingkat kebaikan pendugaan dari model, salah satunya adalah tabel klasifikasi.
Tabel 9 Korelasi Antar Peubah Penjelas DSR GAI NOD RS Tabel 10 Klasifikasi metode regresi logistik antara Model-1 dan Model-2 Amatan Total (%) Tepat Dugaan Ya Tidak 115 47 162 71.0 Model-1 Ya 462 370 832 44.5 Tidak 577 417 994 Total 48.8 114 48 163 70.4 Model-2 Ya 348 484 833 58.2 Tidak 462 532 994 Total 60.2 Tabel ini merupakan tabel frekuensi dua kategori prediksinya. Model yang diinginkan arah antara nilai kategori aktual data dengan dari pengujian ini adalah model yang
memiliki rata-rata prediksi benar yang sangat tinggi. Karena dalam penelitian ini ada dua model, dimana Model-1 disusun dari data asli dan Model-2 dari data hasil diskretisasi maka model dengan rata-rata prediksi benar yang lebih tinggi adalah model yang lebih baik. Tabel 10 menunjukkan bahwa dengan menggunakan nilai cutoff sebesar 0.84 maka berdasarkan metode regresi logistik pada Model-1 diperoleh nilai sensitivity sebesar 71.0% dan nilai specificity sebesar 44.5% dengan nilai kesalahan positif dan kesalahan negatif masing-masing sebesar 80.1% dan 11.3%. Sedangkan nilai total correct classification adalah sebesar 48.8%. Untuk metode regresi logistik pada Model-2, nilai sensitivity dan specificity masing-masing sebesar 70.6% dan 58.1% dengan nilai total correct classification sebesar 60.1%, sedangkan nilai kesalahan positif sebesar 75.2% dan nilai kesalahan negatifnya sebesar 9.0%. Nilai total misclassification rate untuk Model-1 sebesar 51.2% sedangkan untuk Model-2 sebesar 39.9%. Selain Tabel Klasifikasi, teknik lain yang digunakan adalah kurva ROC. Kurva ROC merupakan teknik pengembangan dari tabel klasifikasi. Kurva ROC untuk pengkelasan yang sempurna akan memiliki satu titik di sudut kiri atas (0,1). Oleh karena itu, wilayah di bawah kurva ROC (c statistic) sering digunakan untuk mengevaluasi penampilan dari model prediksi untuk keseluruhan cutoff. Penggunaan c statistic yang diturunkan dari ROC curve sangat membantu kesulitan yang terjadi dalam penggunaan tabel klasifikasi dan memperjelas pengambilan kesimpulan terhadap kebaikan model.
Gambar 4. Kurva ROC Model 1
Gambar 5. Kurva ROC Model 2 Sebagaimana terlihat pada Gambar 4 dan 5, Model-2 lebih baik dari Model-1 karena kurva ROC pada Model-2 memiliki luas daerah di bawah kurva yang lebih besar dari Model-1 dilihat dari estimated area (c) pada Model-2 sebesar 0.703 sedangkan Model-1 sebesar 0.617. Setelah dianalisis melalui beberapa teknik yang ada maka dapat disimpulkan bahwa Model-2 lebih baik dari Model-1. Hal ini terjadi karena bentuk hubungan yang tidak linear antara peubah penjelas dengan logit. Sebagai contoh adalah plot antara NOD dengan logit pada Lampiran 1. Hubungan ini terkesan dipaksakan linier padahal hubungan yang sebenarnya tidak linier. Akibatnya performa Model-1 menjadi lebih buruk dari pada Model-2. Adapun Model-2 nampak lebih baik (hubungannya linier) karena data yang digunakan pada model ini adalah data hasil diskretisasi.
KESIMPULAN Perbandingan dua model yang dibentuk dari data yang berbeda, dimana Model-1 dibentuk dari data asli dan Model-2 dari data hasil diskretisasi, menghasilkan keluaran yang berbeda. Model dengan data asli menjadi buruk karena tidak dapat menghindari kehadiran data-data ekstrem, seperti data pencilan dan lain sebagainya. Kemudian model ini juga tidak dapat menghindari pelanggaran asumsi seperti kelinearan yang harus dipenuhi dalam hubungan antara logit dengan parameternya. Setelah melalui serangkaian pengujian dan pengepasan data menunjukkan bahwa keberadaan nilai ekstrem ataupun ketidaklinieran pada hubungan antara logit dengan parameternya menyebabkan buruknya model, sehingga upaya untuk melakukan diskretisasi data cukup memperbaiki kondisi model.