Pembentukan Model Credit Scoring Dengan Menggunakan Metode Bayesian Network: Studi Kasus Permohonan Aplikasi Kredit Pemilikan Rumah (KPR) Frendy1, Isti Surjandari2 Industrial Engineering Department Universitas Indonesia, Depok 16242, Indonesia 1
[email protected],
[email protected]
Abstrak Credit scoring merupakan sebuah metode analisis yang digunakan oleh pihak perbankan dalam menganalisis aplikasi kredit yang diajukan oleh nasabah. Adanya kemungkinan kredit yang default, kekurangan dari metode credit scoring yang umum digunakan, serta proses analisis aplikasi kredit yang tidak efisien dalam perbankan, mendorong pihak perbankan untuk terus mencari model credit scoring yang tepat. Untuk mengatasi permasalahan tersebut, diajukan sebuah model credit scoring yang dibentuk berdasarkan pada metode Bayesian Network yang bertujuan untuk mengelompokkan pemohon kredit ke dalam dua kelas, yaitu good creditor dan bad creditor. Tingginya tingkat akurasi model serta proses penggunaan yang sederhana membuktikan bahwa model yang dibentuk sangat efektif dalam mengatasi permasalahan yang dihadapi oleh pihak perbankan dalam melakukan credit scoring.
The Development of Credit Scoring Model Using Bayesian Network Method: A Study Case of Housing Loan Application Abstract Credit scoring is an analysis method used by banks to analyze credit applications which filed by customers. The possibility of credit default, the drawbacks of common credit scoring method, and the inefficiency of credit analysis process by banks, encourage the banks to keep looking for the best credit scoring model. To overcome these problems, the development of credit scoring model based on Bayesian Network is proposed. The main objective of this model is to classify the applicants into two groups, which are good creditor and bad creditor. High rate of accuracy as well as simple application process prove that formed model is very effective in addressing the problems faced by the banks in credit scoring process. Key Words: credit scoring; Bayesian Network; Housing loan; credit analysis.
Pendahuluan Dalam mengajukan aplikasi permohonan kredit kepada instansi keuangan, pemohon harus melalui sebuah tahap analisis yang dilakukan oleh pihak perbankan yang dikenal sebagai credit scoring analysis. Tujuan utama dari analisis yang dilakukan adalah untuk mengelompokkan pihak pemohon sesuai dengan kriteria yang telah ditentukan sebelumnya (umumnya “bad creditor” dan “good creditor”). Selain itu, tujuan dari analisis yang
Pembentukan Model..., Frendy, FT UI, 2014
dilakukan adalah untuk meminimalisir kerugian yang akan ditanggung oleh instansi keuangan bila melakukan kesalahan dalam mengelompokkan pihak pemohon. Terdapat beberapa metode credit scoring analysis yang digunakan oleh pihak perbankan secara umum, seperti survei langsung (tradisional), linear discriminant analysis (LDA), logistic regression/logit analysis, dan artificial neural network (ANN). Akan tetapi, setiap metode tersebut masih memiliki kekurangannya masing-masing dalam melakukan analisis credit scoring. Survei langsung merupakan metode credit scoring analysis yang paling tradisional dan proses analisisnya membutuhkan waktu yang cukup lama karena dalam waktu kerja sehari, seorang analis hanya dapat menganalisis 2-3 orang pemohon kredit. Linear discriminant analysis (LDA) dianggap kurang efektif dalam melakukan credit scoring analysis karena adanya asumsi normality yang harus dipenuhi (Lee & Chen 2005). Logistic regression kemudian dikembangkan untuk mengatasi kekurangan dari metode LDA, namun juga masih kurang efektif dalam melakukan credit scoring analysis karena variabel-variabel yang digunakan harus bersifat linear (Lee & Chen, 2005). Sedangkan, untuk ANN, dinilai kurang efektif dari segi waktu karena dalam membentuk sebuah model credit scoring yang paling optimal dibutuhkan waktu yang cukup lama dan hasil yang diperoleh cukup sulit untuk diintepretasikan oleh pengguna (Lee & Chen, 2005). Oleh karena itu, dibutuhkan sebuah model credit scoring analysis yang dapat digunakan pada variabel-variabel dependen dan independen yang memiliki hubungan yang kompleks (non-linear), tidak terdistribusi secara normal, mudah digunakan (tidak memakan waktu yang lama), serta memberikan hasil yang mudah diintepretasikan. Dalam penelitian ini digunakan metode Bayesian Network sebagai model credit scoring analysis yang baru. Tinjauan Teoritis a. Credit Scoring Analysis Credit scoring analysis pertama kali diperkenalkan pada tahun 1940-an dan telah mengalami perubahan fungsi secara signifikan dari tahun ke tahun, dari penentuan status kredit dari seorang calon kreditur hingga penentuan persetujuan personal loan, seperti pembuatan kartu kredit, KPR (Kredit Pemilikan Rumah), KTA (kredit tanpa anjungan), kredit modal usaha, dan lain sebagainya (Yap, Ong, & Husain, 2011). Secara umum, credit scoring analysis merupakan sebuah sistem analisis yang digunakan oleh instansi keuangan dalam menentukan status kredit dari calon kreditur berdasarkan pada data kredit historis dari kreditur-kreditur saat ini. Dalam credit scoring
Pembentukan Model..., Frendy, FT UI, 2014
analysis yang dilakukan, calon kreditur umumnya akan dikelompokan menjadi dua kelompok yaitu kelompok ‘good creditor’, kelompok kreditur yang mampu membayar tagihan kredit dengan baik, dan kelompok ‘bad creditor’, kelompok kreditur yang tidak mampu membayar tagihan kredit dengan baik. b. Linear Discriminant Analysis (LDA) Linear Discriminant Analysis (LDA) merupakan sebuah teknik klasifikasi yang paling umum digunakan dalam credit scoring analysis, yang diperkenalkan pertama kali oleh Fisher pada tahun 1936 (Mylonakis & Diacogiannis, 2010). Menurut Keramati & Yousefi (2011), terdapat asumsi yang harus dipenuhi untuk mencapai hasil yang paling tepat dan optimal dalam LDA yaitu variabel-variabel independen yang berpengaruh dalam perhitungan credit scoring harus berdistribusi secara normal (asumsi normality). Tujuan utama dari metode ini adalah untuk meminimalisasi jarak antar responden dalam kelompok dan memaksimalkan jarak responden antar kelompok yang berbeda (Keramati & Yousefi, 2011). Adapun keunggulan dalam menggunakan metode LDA adalah kemudahan dalam penggunaan serta intepretasi hasil yang didapatkan (Mylonakis & Diacogiannis, 2010). c. Logistic Regression Logistic Regression merupakan sebuah teknik pemodelan statistik yang memberikan hasil yang bersifat dichotomous dengan menyertakan probabilitas potensial dari hasil yang didapatkan (Lee & Chen, 2005). Logistic regression dapat digunakan tanpa harus memenuhi asumsi normality dan terbukti bahwa logistic regression dapat bekerja secara efisien seperti metode LDA. Namun, terdapat beberapa asumsi yang tetap harus dipenuhi dalam menggunakan logistic regression agar dapat mencapai hasil yang tepat dan optimal. Adapun asumsi yang harus dipenuhi oleh logistic regression adalah: (Butarbutar, 2006) Variabel bebas (variabel independen) tidak membentuk fungsi linear antar sesama variabel. Untuk mencapai hasil yang optimal dibutuhkan jumlah sampel yang cukup besar. Hanya memasukkan variabel independen yang relevan (berpengaruh). d. Artificial Neural Networks (ANN)
Pembentukan Model..., Frendy, FT UI, 2014
Artificial Neural Networks (ANN) merupakan sebuah pemodelan statistik yang dibentuk berdasarkan pada cara kerja otak manusia (Keramati & Yousefi, 2011). ANN digunakan untuk mengatasi kekurangan-kekurangan dari kedua metode sebelumnya. ANN dapat digunakan pada kasus dimana variabel dependen dan variabel independen dalam credit scoring membentuk hubungan non-linear yang kompleks (Lee & Chen, 2005). Selain itu, ANN mampu mempelajari dan mengetahui pola kompleks (pattern) dari variabel input dan variabel output dari sebuah database sehingga dapat diterapkan pada data dimana hubungan antar variabel dependen dan independennya belum diketahui (Keramati & Yousefi, 2011). Akan tetapi, menurut Lee & Chen (2005), dalam mencapai hasil yang optimal, ANN harus melalui proses pelatihan (training) yang panjang dan dengan jumlah data yang mencukupi, sehingga sangat tidak efisien untuk digunakan pada kasus pengambilan keputusan yang cepat. Hal ini menjadi salah satu kekurangan dari metode ANN dalam credit scoring. Selain itu, Heiat (2011) juga menambahkan bahwa hasil yang analisis ANN tidak memiliki keterangan yang jelas sehingga dapat menyulitkan pengguna dalam mengintepretasi hasil yang didapatkan. e. Bayesian Belief Networks Bayesian Belief Networks atau Bayesian Networks (BN) merupakan salah satu metode klasifikasi dalam Bayesian Classifiers. BN mengasumsikan bahwa nilai atribut (variabel independen) memiliki ketergantungan dengan nilai atribut lain (Han & Kamber, 2006). Terdiri atas dua bagian, bagian kualitatif (directed acyclic graph/DAG) dan bagian kuantitatif (tabel distribusi probabilitas).
Figure 1. Bagian Kuantitatif (Kiri) dan Bagian Kualitatif (kanan) BN (Sumber: Verdumen, 2003)
Pembentukan Model..., Frendy, FT UI, 2014
Berikut
ini
adalah
langkah-langkah
dalam
melakukan
klasifikasi
dengan
menggunakan metode BN (Verdumen, 2003): 1. Diasumsikan bahwa terdapat sejumlah variabel U = (A1, A2,...,An). 2. Distribusi probabilitas dari semua kemungkinan kejadian, P(U), dapat diketahui dengan ! !=! =
! !! = !! ! !! = !! = !
!(Γ) !
3. Diketahui bahwa Ω! = !! , !! , … , !! merupakan atribut kelas dari setiap node diagram DAG. 4. Distribusi probabilitas posterior dari !(!! |!), dimana ! merupakan kemungkinan kondisi yang ingin diteliti, dapat diketahui dengan menggunakan teorema Bayes, yaitu ! !! ! =
! ! !! !(!! ) !(!)
5. Kondisi ! akan diklasifikasikan ke dalam kelas i, jika dan hanya jika !"#$$ ! =
!; ! !! ! > ! !! ! , ∀! ≠ ! ∅; !"ℎ!"#$%!
Metodologi Penelitian Penelitian ini bertujuan untuk membentuk sebuah model credit scoring yang dapat digunakan oleh pihak perbankan dalam melakukan analisis aplikasi kredit yang diajukan oleh calon kreditur. Pembentukan model credit scoring ini didasarkan pada metode Bayesian Network. Penelitian ini dilakukan pada sebuah instansi perbankan yang berlokasi di Medan dan semua data penelitian yang digunakan merupakan data yang didapatkan dari perbankan tersebut (data sekunder). Data yang digunakan merupakan data kredit pemilikan rumah (KPR) yang diajukan pada periode bulan Januari – April 2014. Data yang dikumpulkan sebanyak 710 data, dimana terdiri dari 329 “good creditor” dan 381 “bad creditor”. Penelitian ini menggunakan 11 variabel input dalam membentuk model credit scoring tersebut. Variabel-variabel input tersebut adalah usia, jenis kelamin, status pernikahan, jumlah anak, jenis pekerjaan, total pendapatan bersih, total pinjaman yang diajukan, rasio
Pembentukan Model..., Frendy, FT UI, 2014
debt to income (DTI), historis kredit, dan status kredit. Data tersebut kemudian diolah dengan menggunakan bantuan software WEKA. Hasil dan Pembahasan Pada penelitian ini dihasilkan sebuah diagram yang menggambarkan hubungan antar variabel-variabel independen yang berpengaruh. Hubungan antar variabel digambarkan ke dalam sebuah directed acyclic graph (DAG) yang ditunjukkan pada Figure 2.
Figure 2. Directed Acyclic Graph (DAG)
Analisis credit scoring dengan menggunakan metode Bayesian Network dinilai sangat efektif karena memiliki tingkat akurasi yang mencapai 92,8%. Tingkat akurasi model ini dihitung dengan melihat rasio perbandingan jumlah klasifikasi yang benar dengan total kejadian yang ada. Pada Table 1 akan menunjukkan tingkat klasifikasi yang dilakukan oleh metode Bayesian Network dengan berdasarkan pada kesalahan pengklasifikasian data (tipe error). Table 1. Kesalahan Pengklasifikasian Data Predicted Outcomes Good Bad
Actual Outcomes Good Bad 13 316 (Type I Error) 38 343 (Type II Error)
Adapun keunggulan yang diberikan dari model credit scoring yang telah dibuat berdasarkan metode Bayesian Network yang diajukan adalah: 1. Tingkat akurasi yang cukup tinggi dalam mengelompokkan calon kreditur yang mengajukan aplikasi kredit KPR. 2. Model credit scoring yang dibentuk sangat efektif dari segi waktu dalam mengelompokkan calon kreditur yang mengajukan aplikasi kredit KPR.
Pembentukan Model..., Frendy, FT UI, 2014
3. Penambahan variabel input sangat memungkinkan dan dapat dilakukan dengan cara yang cukup mudah dan dalam waktu yang singkat. 4. Pengguna dapat dengan mudah mengintepretasikan hasil pengelompokkan yang didapatkan dari model credit scoring dengan menggunakan metode Bayesian Network. Sedangkan kekurangan dari model credit scoring yang telah dibuat adalah: 1. Model tidak dapat memberikan informasi mengenai pengaruh (signifikansi) dari setiap variabel independen terhadap variabel dependen (status kredit). 2. Sangat bergantung terhadap perbandingan jumlah atribut variabel dependen (status kredit). Perbandingan jumlah antara atribut variabel dependen dapat mempengaruhi tingkat akurasi dari model yang dibentuk. 3. Ketidakmampuan metode Bayesian Network dalam mengolah data yang bersifat numerik. 4. Model yang dibentuk masih belum mampu menjawab salah satu tantangan dalam memberikan izin kredit, yaitu menentukan nilai optimal dari produk kredit yang ditawarkan. Intepretasi terhadap model credit scoring yang didapatkan dapat dilakukan dengan mudah. Berikut ini adalah langkah-langkah dalam menggunakan model credit scoring yang dibentuk: 1. Diasumsikan bahwa terdapat seorang calon pemohon KPR (X) baru yang mengajukan aplikasi kredit. Diketahui bahwa calon pemohon tersebut memiliki deskripsi sebagai berikut: a. Berjenis kelamin Laki-laki b. Berusia 35 tahun, Menikah dan memiliki 2 anak c. Pendidikan terakhir yang ditempuh adalah Sarjana 1 d. Bekerja sebagai seorang karyawan swasta di sebuah perusahaan e. Memiliki total pendapatan sebesar Rp7.500.000,00 per bulan f. Mengajukan pinjaman dengan total sebesar Rp150.000.000,00 (rasio DTI 20) g. Membayar semua kredit yang pernah dipinjam dengan lancar 2. Deskripsi dari calon pemohon KPR tersebut akan dikelompokkan berdasarkan pengelompokkan atribut dari setiap variabel independen yang telah ditentukan.
Pembentukan Model..., Frendy, FT UI, 2014
3. Menghitung nilai akhir dari setiap atribut variabel dependen (status kredit). Nilai probabilitas dari setiap atribut variabel independen dapat dilihat pada tabel probabilitas yang dilampirkan pada bagian lampiran. Adapun perhitungan dari status kredit calon pemohon adalah sebagai berikut: P(Good|X) = P(Good) * P(Good|I1) * P(Good|(I1|DTI2)) * P(Good|(I1|L1)) * P(Good|DTI2|PL)) * P(Good|(L1|Karyawan Swasta)) * P(Good|(Karyawan Swasta|U1)) * P(Good|(Karyawan Swasta|S1)) * P(Good|(U1|A2)) * P(Good|(A2|Menikah)) * P(Good|(Menikah|Lakilaki)) = 0,463 * 0,984 * 0,475 * 0,929 * 1 * 0,62 * 0,467 * 0,639 * 0,241 * 0,776 * 0,758 = 0,00527 P(Bad|X) = P(Bad) * P(Bad|I1) * P(Bad|(I1|DTI2)) * P(Bad|(I1|L1)) * P(Bad|DTI2|PL)) * P(Bad|(L1|Karyawan Swasta)) * P(Bad|(Karyawan Swasta|U1)) * P(Bad|(Karyawan Swasta|S1)) * P(Bad|(U1|A2)) * P(Bad|(A2|Menikah)) * P(Bad|(Menikah|Laki-laki)) = 0,537 * 0,798 * 0,487 * 0,878 * 0,214 * 0,478 * 0,375 * 0,506 * 0,33 * 0,98 * 0,768 = 0,00088 4. Nilai probabilitas akhir dari setiap atribut status kredit kemudian dibandingkan. Pada perhitungan nilai probabilitas akhir yang dilakukan pada poin 3 menunjukkan bahwa P(Good|X) > P(Bad|X), oleh karena itu calon pemohon KPR (X) dikategorikan sebagai good creditor. Kesimpulan dan Saran Credit scoring merupakan sebuah metode analisis yang digunakan oleh pihak perbankan dalam menganalisis aplikasi-aplikasi kredit yang diajukan oleh nasabah. Dari beberapa metode credit scoring yang umum digunakan, seperti discriminant analysis, logit analysis, dan artificial neural network, masih banyak ditemukan berbagai kekurangan yang dapat mengakibatkan kesalahan dalam mengelompokkan calon kreditur sehingga dapat merugikan pihak perbankan. Selain itu, proses analisis kredit yang diterapkan pada perbankan yang menjadi objek penelitian masih sangat tradisional dan tidak efisien. Proses analisis yang kredit dengan melakukan survei langsung dinilai tidak efisien karena membutuhkan waktu yang cukup lama dan tenaga kerja yang banyak dikarenakan seorang analis hanya mampu menganalisis (survei) 2-3 orang calon kreditur dalam sehari. Untuk mengatasi permasalahan tersebut maka diusulkan menggunakan metode Bayesian Network untuk membentuk sebuah model credit scoring yang dapat dengan mudah digunakan oleh pihak perbankan.
Pembentukan Model..., Frendy, FT UI, 2014
Model credit scoring yang dibentuk dengan menggunakan metode Bayesian Network terbukti cukup efektif dalam menganalisis aplikasi-aplikasi kredit pemilikan rumah (KPR) yang diajukan oleh nasabah kepada Bank X di Medan. Hal ini dapat dibuktikan dari tingginya tingkat akurasi pengelompokkan model yang mencapai angka sebesar 92,8% serta kemudahan dan cepatnya proses analisis yang dilakukan. Angka akurasi 92,8% dapat dikatakan cukup tinggi bila dibandingkan logit analysis yang hanya mencapai 82,1%. Selain itu, dengan menggunakan metode Bayesian Network, pengguna juga dapat mengetahui kemungkinan hubungan antar variabel independen yang terbentuk. Akan tetapi, selain keunggukan-keunggulan yang diberikan, model credit scoring Bayesian Network yang telah dibentuk masih memiliki beberapa kekurangan yang harus diperbaiki. Kekurangan dari model ini adalah adanya pengaruh dari jumlah atribut variabel dependen terhadap tingkat akurasi model, keterbatasan metode Bayesian Network dalam mengolah data numerik, serta tidak adanya informasi mengenai signifikansi setiap variabel independen terhadap variabel dependen. Oleh karena itu, penelitian lebih lanjut dapat dilakukan dalam upaya pembentukan model credit scoring yang dapat memberikan informasi mengenai signifikansi variabel independen terhadap variabel dependen dengan tetap memperhatikan tingkat akurasi model dalam mengelompokkan aplikasi kredit yang diajukan. Penentuan variabel input dalam analisis credit scoring ini dapat disesuaikan dengan Peraturan Bank Indonesia (PBI) No. 7/2/PBI/2005. Selain itu, penelitian yang dilakukan juga dapat berkisar pada pembuatan model credit scoring yang dapat menentukan nilai optimal dari produk kredit yang ditawarkan, baik untuk kredit konsumtif maupun untuk kredit produksi. Penelitian lainnya juga dapat dilakukan dengan penambahan-penambahan variabel input yang mungkin memiliki pengaruh yang signifikan dalam proses credit scoring seperti variabel aset yang dimiliki oleh calon kreditur. Hasil credit scoring yang telah dilakukan dapat diuji coba dengan data kredit yang telah diterima untuk melihat apakah data kredit yang tidak lancar dapat diklasifikasikan dengan baik ke dalam kelompok kredit yang akan ditolak (bad creditor). Daftar Referensi Biçer, I., Sevis, D., & Bilgiç, T. (2010). Bayesian Credit Scoring Model with Integration of Expert Knowledge and Customer Data. Continuous Optimization and InformationBased Technologies in the Financial Sector (pp. 324-329). Izmir: MEC EurOPT.
Pembentukan Model..., Frendy, FT UI, 2014
Bouckaert, R. R., Frank, E., Hall, M., Kirkby, R., Reutemann, P., Seewald, A., et al. (2013). WEKA Manual for Version 3-6-10. Hamilton, New Zealand: University of Waikato. Butarbutar, R. S. (2006). Credit Scoring Model Kredit Kepemilikan Rumah Bank X. Karya Akhir. Jakarta, Jawa Barat, Indonesia: Fakultas Ekonomi Universitas Indonesia. Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E., & Tatham, R. L. (2006). Multivariate Data Analysis Sixth Edition. New Jersey: Pearson International. Han, J., & Kamber, M. (2006). Data Mining: Concepts and Techniques Second Edition. San Fransisco: Morgan Kaufmann Publishers. Heckerman, D. (1995). A Tutorial on Learning with Bayesian Network. Microsoft Corporation. Heiat, A. (2011). Modeling Consumer Credit Scoring Through Bayes Network. World Journal of Social Sciences, Vol. 1, 132-141. Kao, L. J., Chiu, C. C., & Chiu, F. Y. (2012). A Bayesian Latent Variable Model With Classification and Regression Tree Approach For Behavior and Credit Scoring. Knowledge-Based Systems, Vol. 36, 245-252. Keramati, A., & Yousefi, N. (2011). A Proposed Classification of Data Mining Techniques in Credit Scoring. International Conference on Industrial Engineering and Operation Management, (pp. 22-24). Kuala Lumpur. Korb, K. B., & Nicholson, A. E. (2011). Bayesian Artificial Intelligence. New York: CRC Press. Lee, T.-S., & Chen, I.-F. (2005). A Two Stage Hybrid Credit Scoring Model Using Artificial Neural Networks and Multivariate Adaptive Regression Splines. Expert Systems with Applications, Vol. 28, 743-752. Moran, S., He, Y., & Liu, K. (2009). Choosing the Best Bayesian Classifier: An Empirical Study. IAENG International Journal of Computer Science, Vol. 36, 36-45. Mylonakis, J., & Diacogiannis, G. (2010). Evaluating the Likelihood of Using Linear Discriminant Analysis as A Commercial Bank Card Owners Credit Scoring Model. International Business Research, Vol. 3, 9-20. Saputro, D. (2011, Juni). Model Credit Scoring Untuk Proses Analisa Kelayakan Fasilitas Kredit Motor Menggunakan Metode Classification And Regression Tree (CART). Skripsi. Jakarta, Indonesia: Universitas Islam Negeri Syarif Hidayatullah. Verdumen, N. (2003, November). A Model for Credit Scoring: Combining Bayesian Networks with Survival Analysis Techniques. Master's Thesis for Cognitive Artificial Intelligence. Utrecht, Netherlands: Utrecht University.
Pembentukan Model..., Frendy, FT UI, 2014
Yap, B. W., Ong, S. H., & Husain, N. H. (2011). Using Data Mining to Improve Assessment of Credit Worthiness Via Credit Scoring Models. Expert Systems with Applications, Vol. 38, 13274-13283.
Pembentukan Model..., Frendy, FT UI, 2014