SNIPTEK 2013
ISBN: 978-602-72850-4-0
KOMPARASI ALGORITMA C4.5, K-NEAREST NEIGHBOR DAN NEURAL NETWORK DALAM MENENTUKAN KELAYAKAN FASILITAS KREDIT : STUDI KASUS PT. BANK MEGA, TBK. Andi Diah Kuswanto
Hilman Pardede
Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri http://www.nusamandiri.ac.id
Pascasarjana Magister Ilmu omputer STMIK Nusa Mandiri http://www.nusamandiri.ac.id
ABSTRAK — Di industri perbankan, kredit merupakan sumber keuntungan bisnis dengan risiko tinggi. Kebutuhan untuk mengidentifikasi dan membedakan antara pelanggan baik dan buruk perlu dibangun sehingga pihak yang berkepentingan dapat mengambil satu tindakan pencegahan masalah kredit macet. Dalam penelitian ini, algoritma perbandingan C4.5, pembayaran angsuran KNearest Neighbor Network dan Neural Network atau tidak. Dari hasil pengujian untuk mengukur performansi dari ketiga algoritma tersebut dengan menggunakan metode uji Confusion Matrix dan kurva ROC, diketahui bahwa algoritma C4.5 memiliki nilai akurasi tertinggi. Sehingga bisa diaplikasikan pada masalah penentuan kelayakan kredit. Kata kunci: C4.5, K-Nearest Neighbor, Neural Network, Confusion Matrix, Kurva ROC. ABSTRACT In banking industry, credit is a source of business advantage with high risk. The need to identify and distinguish between good and bad customer needs to be built so that interested parties can take one precaution the problem of bad credit. In this research, comparison algorithm C4.5, K-Nearest Neighbor and Neural Network installment payment or not. From the test results to measure the performance of the three algorithms using the test method Confusion Matrix and the ROC curve, it is known that the C4.5 algorithm has the highest accuracy value. So it can be applied to the problem of determining the credit worthiness. Keywords: C4.5, K-Nearest Neighbor, Neural Network, Confusion Matrix, Kurva ROC.
PENDAHULUAN Berawal dari sebuah usaha milik keluarga bernama PT. Bank Karman yang didirikan pada tahun 1969 dan berkedudukan di Surabaya, selanjutnya pada tahun 1992 berubah nama menjadi PT. Mega Bank dan melakukan relokasi Kantor Pusat ke Jakarta. Seiring dengan perkembangannya PT. Mega Bank pada tahun 1996 diambil alih oleh PARA GROUP (PT. Para Global Investindo dan PT. Para Rekan Investama). Untuk lebih meningkatkan
citra PT. Mega Bank, pada bulan Juni 1997 melakukan perubahan logo dengan tujuan bahwa sebagai lembaga keuangan kepercayaan masyarakat, akan lebih mudah dikenal melalui logo perusahaan yang baru tersebut. Dan pada tahun 2000 dilakukan perubahan nama dari PT. Mega Bank menjadi PT. Bank Mega. Dalam rangka memperkuat struktur permodalan maka pada tahun yang sama PT. Bank Mega melaksanakan Initial Public Offering dan listed di BEJ maupun BES. Dengan demikian sebagian saham PT. Bank Mega dimiliki oleh publik dan berubah namanya menjadi PT. Bank Mega Tbk. Pada saat krisis ekonomi, Bank Mega mencuat sebagai salah satu bank yang tidak terpengaruh oleh krisis dan tumbuh terus tanpa bantuan pemerintah bersama-sama dengan Citibank, Deutche Bank dan HSBC. PT. Bank Mega Tbk. dengan semboyan "Mega Tujuan Anda" tumbuh dengan pesat dan terkendali serta menjadi lembaga keuangan ternama yang mampu disejajarkan dengan bank-bank terkemuka di Asia Pasifik dan telah mendapatkan berbagai penghargaan dan prestasi baik di tingkat nasional, regional maupun internasional. Dalam upaya mewujudkan kinerja sesuai dengan nama yang disandangnya, PT. Bank Mega Tbk. berpegang pada azas profesionalisme, keterbukaan dan kehati-hatian dengan struktur permodalan yang kuat serta produk dan fasilitas perbankan terkini. Kredit merupakan salah satu produk utama perbankan. Kredit adalah penyediaan uang atau tagihan yang dapat dipersamakan dengan ini, berdasarkan persetujuan atau kesepakatan pinjam meminjam antara pelapor dengan pihak lain yang mewajibkan pihak peminjam untuk melunasi utangnya setelah jangka waktu tertentu dengan pemberian bunga termasuk cerukan, pengambilalihan tagihan dalam rangka kegiatan piutang dan pengambil alihan atau pembelian kredit pihak lain.(Peraturan Bank Indonesia Nomor 9/14/PBI/2007). Dalam industri perbankan kredit menjadi salah satu bentuk pelayanan yang diberikan bank kepada masyarakat dan memberikan andil besar dalam memberikan keuntungan bisnis dengan resiko tinggi.. Seiring dengan banyaknya nasabah kredit PT. Bank Mega Tbk maka bertambah pula permasalahan yang terjadi. Dimana hampir setiap bulannya ada nasabah yang bermasalah dalam hal ini kredit macet (Non Performace Loan). Kredit macet yang cenderung meningkat akan
INF-226
ISBN: 978-602-72850-4-0 mengakibatkan penurunan penilaian masyarakat dan juga Bank Indonesia selaku regulator terhadap PT. Bank Mega Tbk. Dalam hal ini kurang tepatnya penilaian mengakibatkan terjadinya kredit macet. Sehubungan dengan hal tersebut maka perlu di buatkan sebuah pendukung keputusan dengan cara menganalisa data-data historis yang ada pada tahun-tahun sebelumnya. Sehingga ditemukan sebuah knowledge baru yang mampu membantu PT. Bank Mega Tbk dalam mengambil penilaian yang tepat bagi calon nasabah baru. Sangatlah penting tentunya bagi pihak bank selaku pemberi kredit mengetahui dan bisa membedakan antara nasabah baik dan nasabah buruk sehingga dapat meminimalisir terhadap resiko kredit macet, maka kebutuhan sistem terkait hal tersebut menjadi sangat mendesak. Pengertian kredit pada pasal 1 angka 11 Undangundang No. 10 tahun 1998 tentang perubahan undangundang No. 7 tahun 1992 tentang Perbankan adalah penyediaan uang atau tagihan yang dapat dipersamakan dengan itu, berdasarkan persetujuan atau kesepakatan pinjam-meminjam antara bank dengan pihak lain yang mewajibkan pihak peminjam untuk melunasi utangnya setelah jangka waktu tertentu dengan pemberian bunga. Istilah kredit berasal dari perkataan latin credo, yang berarti saya percaya, yang merupakan kombinasi dari bahasa Sansekerta cred yang artinya kepercayaan dan bahasa latin do yang artinya saya tempatkan (Hariani, 2010). Memperoleh kredit berarti memperoleh kepercayaan. Atas dasar kepercayaan kepada seseorang yang memerlukannya maka di berikan uang, barang atau jasa dengan syarat membayar kembali atau memberikan penggantiannya dalam jangka waktu yang telah diperjanjikan (Hariani, 2010). Kredit yang diberikan oleh bank didasarkan atas kepercayaan sehingga pemberian kredit merupakan pemberian kepercayaan kepada nasabah. Hal tersebut menunjukkan perlu diperhatikannya faktor kemampuan dan kemauan, sehingga tersimpul kehati-hatian dengan menjaga unsur keuntungan dari suatu kredit(Muhammad Jumhana dalam Hariani, 2010). Menurut Thomas Suyatno dalam Hariani(2010) mengemukakan bahwa unsur-unsur kredit terdiri atas (a) Kepercayaan, (b) Tenggang Waktu, (c) Degree of Risk (tingkat resiko), (d) Prestasi atau objek kredit.
SNIPTEK 2013 penelitian ditentukan dengan menggunakan tehnik data minning agar diperoleh algoritma yang tepat. Variabel Data dipersiapkan setelah diambil dari CoreSystem guna menentukan variable yang akan dibutuhkan. Permasalahan dalam penelitian ini adalah meningkatnya jumlah kredit macet, Tabel 1 Daftar atribut Attribut
Keterangan
Sex
jenis kelamin
usia
tingkat usia
stskawin
status perkawinan
pekerjaan
pekerjaan
stsrumah
status tempat tinggal
penghasilan
besar penghasilan
pinjaman
jumlah pinjaman
tenor
jangka waktu
kegunaan
kegunaan
collateral jaminan Sumber: Hasil penelitian (2013) Transformation Data yang digunakan dalam penulisan ini sebagian dalam angka, untuk model yang digunakan data ditransformasikan ke dalam klasifikasi atau kelompok berdasar interval. Interval kelas haruslah yang sama. Prof. Strurge telah memberikan rumus berikut untuk menentukan ukuran interval kelas (Jain dan Aggarwal, 2010). Tabel 2 atribut dan nilai kategori Attribut sex usia
BAHAN DAN METODE Kerangka Pendekatan Penelitian Penelitian menggunakan data observasi yang diambil langsung dari CoreSystem AS/400 PT. Bank Mega, Tbk. Tabel yang digunakan yaitu master data nasabah LNMAST kemudian akan dilakukan penentuan atribut yang akan digunakan dalam data minning. Proses identifikasi masalah dilakukan dengan melihat, mengamati dan memahami proses pinjaman yang dilakukan, secara langsung maupun memahami data-data yang diperoleh dari CoreSystem/CoreBanking. Objek
INF-227
stskawin
pekerjaan
Nilai
Keterangan
P
Pria
W SP
Wanita SPESIFIKASI
IM
IMPLEMENTASI (23 - 24 thn)
ST
STABILISASI
KD
KONSOLIDASI ( > 35 thn)
(19 - 22 thn) (25 - 35 thn)
1
Menikah
2
Lajang
3 11
Duda/Janda KARYAWAN SWASTA
12
PNS / GURU
13
TNI/POLRI
14
PENSIUNAN
15
WIRAUSAHA
SNIPTEK 2013
stsrumah
penghasilan
pinjaman
tenor
99
LAIN-LAIN
1
MILIK SENDIRI
2 3
MILIK KELUARGA
1
≤ 2,2 juta
2
> 2,2 - 5 juta
3
> 5 - 7,5 juta
4
> 7,5 - 10 juta
5
> 10 juta
0 1
≤ 10 juta
2
> 50 ≤ 100 juta
3
> 100 ≤ 500 juta
4
> 500 < 1 milyar
5
≥ 1 milyar
S
1-12 Bulan = PENDEK
M
13-36 Bulan = MENENGAH
L kegunaan
collateral
ISBN: 978-602-72850-4-0 K-Nearest Neighbor
72,80%
84,00%
69,33%
Neural Network
61,60%
93,00%
52,99%
Sumber: Hasil penelitian (2013)
SEWA/KONTRAK
Setelah ditemukan algoritma terbaik maka diterapkanlah algoritma tersebut kedalam bahasa pemprograman php dan di uji menggunakan data baru.
> 10 ≤ 50 juta
Sumber: Hasil penelitian (2013) Gambar 1 GUI Form input data baru
> 36 Bulan = PANJANG
10
MODAL USAHA
40
INVESTASI
70
KONSUMSI
9
SHM/SHGB
V01 10 Sumber: Hasil penelitian (2013)
Sumber: Hasil penelitian (2013) Gambar 2 GUI Hasil nasabah yang diterima
HASIL DAN PEMBAHASAN Nilai akurasi dapat dihitung dengan menggunakan software rapid minner. Keakuratan klasifikasi merupakan tolak ukur yang menunjukkan bagaimana classifier dapat mengidentifikasi objek dengan benar (Gorunescu, 2011). Pengujian akurasi bertujuan untuk mengevaluasi tingkat akurasi dari masing-masing algoritma dengan menggunakan dua model yaitu Confusion Matrix dan kurva ROC (Receiver Operating Character). Berdasarkan nilai accuracy yang ada, terlihat bahwa Algoritma C4.5 memiliki nilai akurasi tertinggi yaitu 72,92% kemudian diikuti dengan K-Nearest Neighbor 69,33% dan Neural Network 52,99%. Maka algoritma C4.5 layak untuk digunakan dalam menentukan kelayakan kredit di PT. bank Mega Tbk.
Sumber: Hasil penelitian (2013) Gambar 3 GUI Hasil nasabah yang ditolak
Tabel 3 Perbandingan Akurasi ketiga Algoritma Metode Algoritma C4.5
Accuracy Training
Testing
74,80%
82,06%
Perbandingan Akurasi 72,92%
INF-228
ISBN: 978-602-72850-4-0
SNIPTEK 2013 Mining Tools. New York: CRC Press. Banik Shipra, Farah Habib Chanchary, Khodadad Khan, Rifat Ara Rouf dan Mohammed Anwer. Neural Network and Genetic Algorithm Approach for Forecasting Bangladeshi Monsoon Rainfall, (2008). Proceedings of 11th International Conference on Computer and Information Technology (ICCIT 2008) 25-27 December, 2008, Khulna, Bangladesh
Sumber: Hasil penelitian (2013) Gambar 4 Laporan data nasabah yang sudah diproses Dari penerapan algoritma tersebut maka dapat diprediksi nasabah mana saja yang dapat diberikan fasilitas kredit sehingga mengurangi resiko NPL (kredit macet. Hasil laporan dalam bentuk excel memudahkan user melihat data nasabah mana yang dterima dan mana yang ditolak untuk pengajuan kreditnya.
UCAPAN TERIMA KASIH Terima kasih kepada orang tua, kerabat, teman dan semua pihak yang tidak dapat disebutkan satu persatu sehingga penelitian ini selesai dilakukan.
KESIMPULAN Beberapa kesimpulan yang dapat diambil dari hasil penelitian yang dilakukan adalah: 1. Dalam penelitian ini dilakukan pembuatan model menggunakan Algoritma C4.5, K-Nearest Neighbor dan Neural Network menggunakan data nasabah yang mendapatkan kredit. Model yang dihasilkan, dikomparasi untuk mengetahui algoritma yang paling baik dalam penentuan resiko kredit. Untuk mengukur kinerja ketiga algoritma tersebut digunakan metode pengujian Confusion Matrix dan Kurva ROC. Diketahui bahwa algoritma C4.5 memiliki nilai 74,80%, diikuti oleh metode K-Nearest Neighbor 72,80%, dan Neural Network 61,60%. 2. Diketahui bahwa penerapan data baru menggunakan Algoritma C4.5 menghasilkan data yang sesuai dengan prediksi lebih besar di banding dengan yang tidak sesuai dengan prediksi, sehingga dapat dikatakan bahwa program tersebut dapat digunakan untuk penentuan kelayakan pemberian kredit bagi nasabah yang akan menerima kredit.
REFERENSI Awad, M. et al. (2009). Design And Implementation Of Data
INF-229
Bramer, Max. (2007). Principles of Data Mining. London: Springer David, Olson L & Delen, Dursun. (2008). Advanced Data Mining Techniques. Verlag Berlin Heidelberg : Springer Gorunescu, F. (2011). Data Minin Concepts, Models and Techniques. Berlin Heidelberg: Springer Verlag. Han, J., & Kember, M. (2006). Data Mining Concepts adn Techniques. San Fransisco: Morgan Kauffman . Hannan, Shaikh Abdul, R. R. Manza, R. J. Ramteke. (2010). Generalized Regression Neural Network and Radial Basis Function for Heart Disease diagnosis. Maharashtra, India. International Journal of Computer Application (0975-8887) Volume 7- No.13. Hariani, Iswi. (2010). Restrukturisasi dan Penghapusan Kredit Macet. Jakarta: PT Elexmedia Komputindo . Haykin, S. (1999). Neural networks a comprehensive foundation, Second Edition, Upper Saddle River, N.J.: Prentice-Hall International, Inc. Jiang,Yi. et al. (2007). A Bank Customer Credit Evaluation Based on the Decision Tree and the Simulated Annealing Algorithm. Journal of Department of Computer Science Xiamen University (IEEE International Co 8-11 July 2008) Kusrini, & Luthfi, E. T. (2009). Algoritma Data Mining. Yogyakarta: Andi Publishing. Larose, D. T. (2005). Discovering Knowledge in Data. New Jersey: John Willey & Sons, Inc. Liao. (2007). Recent Advances in Data Mining of Enterprise Data: Algorithms and Application. Singapore: World Scientific Publishing Linof, Gordon S & Berry, Michael J. (2011). Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management. Indiana: Wiley Publishing.
SNIPTEK 2013
ISBN: 978-602-72850-4-0
Maimon, Oded, & Rokach, Lior.(2010). Data Mining and Knowledge Discovey Handbook. New York: Springer
Suhadi, Gunarto.(2003). Usaha Perbankan dan Perspektif Hukum. Yogyakarta: Kanisius.
Mania, Hasan & Patel. (2011). Comparative study of Naïve Bayes Classifier and KNN for Tuberculosis. International Journal of Computer Applications (IJCA).
Sumathi, S., & Sivanandam, S. (2006). Introduction to Data Mining and its Applications. Verlag Berlin Heidelberg: Springer.
Mujiasih,Subekti. (2011). Pemanfaatan Data Mining Untuk Prakiraan Cuaca. Jurnal Meteorologi dan Geofisika Volume 12 Nomor 2 September 2011:189-195 Purnomo, Mauridhi Hery, Agus Kurniawan. (2006). Supervised Neural Networks dan Aplikasinya. Yogyakarta: Graha Ilmu Santoso, Budi. (2007). Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis. Yogyakarta: Graha Ilmu. Satchidananda, S S & Jay B.Simha. (2006). Comparing Decision Trees With Logistic Regression For Credit Risk Analysis (SAS APAUGC)
Triantaphyllou, Evangelos. (2010). Data Mining and Knowledge Discovery Via Logic-Based Methods. Verlag Berlin Heidelberg : Springer Venkatesan, P. & S. Anitha. (2006). Application of a radial Basis Function Neural Network for Diagnosis of Diabetes Mellitus, Chennai, India: Current Science, Vol. 91, No. 9. Witten, I. H., Frank, E., & Hall, M. A. (2011).Data Mining: Practical Machine Learning and Tools. Burlington: Morgan Kaufmann Publisher. Wu, Xindong& Kumar, Vipin. (2009). The Top Ten Algorithms in Data Mining. Boca Raton: CRC Press
INF-230