JURNAL INFORMATIKA HAMZANWADI Vol. 2 No. 1, Mei 2017, hal. 28-47
ISSN: 2527 - 6069
PENERAPAN CLASSIFICATION BASE ON MULTIPLE ASSOCIANTON RULE PADA ANALISA RESIKO KREDIT USAHA MIKRO DI BANK SYARIAH MANDIRI KCP PRAYA Moh. Farid Wajdi1, Hamzan Ahmadi2, L. M. S a m s u3 1,2,3 Universitas Hamzanwadi
[email protected] Abstract Based on data of customer Micro Credit in BSM KCP Praya, there is a fact customer with troubled credit status is high enough percentage level. Of the total 171 customers, found as many as 42 clients with problematic status or by 24.56%. This is despite the presentation is still below the current credit status, it still would be a problem at KCP Praya because it would result in the loss and affect the balance of assets or general praya KCP. For the analysis of micro credit in KCP Praya has not used methods or techniques specific, but in another study that examines in particular the problem of credit ratings many use classification algorithm C4.5, SVM, neural network, logistic regression and classification methods traditional or other common. Particularly in this study, the authors use the technique Classification Asociative approach CMAR, because it is known proven Accuracy better than traditional methods. Results of measurement accuracy for 171 datasets micro credit customers in BSM KCP Praya obtained value reached 99.42% accuracy. Credit risk analysis that will be examined starting from the identification of variables that influence the existing loan in the training data, generate a model Classification Association Rule (CARs) with CMAR method, do ranking and pruning rule to get the best classifier models, and carry out testing of data to predict credit risk. At last evaluate performance and accuracy of the results in the form of credit risk prediction Keywords: Accuracy, Association classification (AC), Classification Association rule (CARs), CMAR, Credit risk Analysis.
PENDAHULUAN Penyaluran kredit merupakan kegiatan usaha yang mendominasi pengalokasian dana bank. Oleh karena itu sumber utama pendapatan bank berasal dari kegiatan penyaluran kredit dalam bentuk pendapatan bunga untuk bank konvensional dan bagi hasil untuk bank syariah. PT. Bank Syariah Mandiri merupakan bank umum syariah nasional milik Negara yang sudah mengembangkan konsentrasinya ke sektor Usaha Mikro Kecil Menengah (UMKM) dengan mempunyai satu produk unggulan yang disebut sebagai Warung Mikro. Menurut data 2013, BSM telah mengucurkan dana untuk pembiayaan UMKM sebesar Rp 1,5 T meningkat dari tahun 2012 sebesar 1,2 T. Hal ini menunjukkan semakin bergairahnya iklim usaha skala mikro dan menengah dan bergairah pula minat BSM untuk membantu perekonomian masyarakat melalui penyaluran pembiayaan kepada UMKM. Disatu sisi peningkatan jumlah pencairan dana mengairahkan sektor UMKM, namun disisi lain ini menjadi catatan oleh pemerintah dan komite perbankan bahwa rata-rata munculnya kasus 28
Moh. Farid Wajdi, Hamzan Ahmadi, L. M. S a m s u
kredit macet rata-rata terjadi pada sektor UMKM ini. Berdasarkan laporan komite per Juni 2014 yang dimuat di website Kontan tanggal 12 Agustus 2014, rata-rata perbankan mencatat rasio kredit macet tinggi pada Kredi t Usaha Rakyat atau Mikro. Rasio NPL atau Non performing loan dan BSM termasuk yang memiliki NPL tinggisebesar 12.5%. Fakta tingginya persentase NPL Bank Syariah Mandiri di awal 2014 ini jelas menjadi pekerjaan rumah yang harus segera diselesaikan karena secara langsung akan menggangu stabilitas keuangan dan kerugian bagi BSM. Lebih khusus dalam skala terkecil yaitu Kantor Cabang Pembantu, berdasarkan data status nasabah kredit Mikro BSM KCP Praya, ditemukan fakta nasabah dengan status kredit bermasalah cukup tinggi tingkat persentasenya. Dari total 171 nasabah, ditemukan sebanyak 42 nasabah dengan status bermasalah atau sebesar 24.56%. Hal tersebut apabila tidak segera dicari solusinya akan menjadi sebuah permasalahan pada KCP Praya karena akan berakibat kerugian dan mempengaruhi aktiva atau neraca KCP praya secara umum. Fakta lain ditemukan bahwa di KCP Praya belum menggunakan metode/teknik tertentu dalam menganalisa resiko kredit bermasalah karena kredit bermasalah hanya akan diketahui oleh pihak KCP BSM praya setelah terjadi masalah atau nasabah terlanjur macet. KCP Praya belum memanfaatkan pengalian informasi dan pengetahuan dari data-data nasabah kredit mikro yang sedang berjalan kreditnya atau yang sudah lunas. Padahal, dari data-data nasabah yang sedang atau sudah berjalan kreditnya bisa digali pengetahuan/knowledge base untuk mendapatkan aturan-aturan/rule base yang dipakai untuk menganalisa resiko kredit lebih awal sebelum terjadinya kredit bermasalah. Pada penilitian lalu [4-6] lebih banyak menitik beratkan pada membandingkan beberapa metode klasifikasi tradisional dan hasilnya pun sudah bisa dipastikan tidak akan beranjak dari Decision Tree, SVM dan Neural Network sebagai metode dengan tingkat akurasi terbaik. Para peneliti mencoba beberapa alternatif yang lain sebagai upaya untuk mengembangkan keilmuan mereka sekaligus mengupayakan perbaikan dan peningkatan performance dari metode tradisional. Salah satu pendekatan yang dikemukakan adalah Association Classification (AC). AC meng integrasikan kedua teknik data mining yang dikenal yaitu Asosiasi dan klasifikasi untuk membangun model (classifier) yang bertujuan memprediksi. Dan terbukti bahwa performance yang dihasilkan dari penerapan metode integrasi AC ini rata-rata akurasi klasifikasi lebih baik dari metode tradisional seperti C45/Decision Tree, dll. [1]
29
PENERAPAN CLASSIFICATION BASE ON MULTIPLE ASSOCIANTON RULE PADA ANALISA RESIKO KREDIT USAHA …
Berangkat dari beberapa penelitian dan konsep AC [1-3] maka guna meminimalkan munculnya kredit bermasalah pada sektor UMKM di BSM salah satu upaya yang menjadi usulan penelitian ini adalah dengan klasifikasi resiko kredit dengan menggunakan metode CMAR yaitu sistem analisa kredit dengan melakukan prediksi resiko kredit berdasarkan ekplorasi pengetahuan (Knowladge Base) dari data histori nasabah lama BSM yang telah diketahui status kolektibilitasnya yang kemudian diolah dengan menggunakan metode/teknik data mining klasifikasi berdasarkan beberapa aturan Asosiasi (Classification base on Multiple Association Rule). Dan dipilihnya metode CMAR karena diketahui terbukti keakurasiannya lebih baik dari metode tradisional [2].
Association Rule Mining (ARM) ARM adalah teknik data mining yang digunakan untuk menemukan pola frekuensi kemunculan, hubungan, korelasi dan struktur sebab akibat dalam kumpulan item data atau objek dalam database transaksi, database relasional dan sumber informasi lainnya [7]. Penerapan ARM umumnya untuk menganalisa keranjang belanja (market base analysis). Beberapa definisi aturan atau istilah dalam ARM antara lain [7]: - Itemset : kumpulan satu atau lebih item seperti {roti, susu,telur}. K-itemset artinya itemset yang terdiri dari k item. - Support count (σ) : frekuensi kemunculan dari itemset secara bersama sama. Contoh σ({roti,susu}) =3 - ({roti,susu, biscuit}) = 2 - Support : perbandingan support count terhadap seluruh transaksi (N). - Confidence : berapa sering item tertentu muncul dalam itemset. - Frequent Itemset : itemset yang sering muncul dimana nilai supportnya lebih besar atau sama dengan nilai minimum support threshold (minsup).
Association Classification (AC) Adalah integrasi metode teknik data mining asosiasi dan klasifikasi. Dengan kata lain aturan asosiasi yang sebenarnya unsupervised learning/tanpa class “dipaksa” menjadi supervised learning/harus ada class, karena tujuan akhirnya adalah klasifikasi.
30
Moh. Farid Wajdi, Hamzan Ahmadi, L. M. S a m s u
Contoh: sebuah rule: X
Y (pada aturan asosiasi X,Y adalah item tetapi pada AC X atribut
item dan Y harus class) Tabel 1. Perbedaan AC dan Association Rule Association Rule AC Tidak ada class atribut, termasuk Sebuah atribut class harus ada (supervised unsuperviced learning learning) Tujuannya menemukan asosiasi atau Tujuannya membangun classifier untuk hubungan antar item dalam database memprediksi class pada data uji. Terdapat lebih dari satu atribut di sisi Hanya atribut class saja yang ada disisi consequent. consequent ( Overfitting bukan isu penting Overfitting menjadi isu penting Kelebihan Metode AC dibandingkan metode klasik klasifikasi misalnya Decision Tree/C.45 menurut Thabat : 1. Output dari algoritma AC diwakili dalam aturan if-then sederhana, yang membuatnya mudah bagi pengguna akhir untuk memahami dan menafsirkannya [8]. 2. Tidak seperti Decision Tree, satu aturan dapat dirubah atau diperbaiki dalam AC tanpa mempengaruhi kumpulan aturan yang lain, sedangkan pada Decision Tree harus dirubah kembali keseluruhan pohon aturan yang sudah ada. 3. Menurut penelitian B.Liu [1], metode AC rata-rata memiliki akurasi lebih baik dari metode klasik.
Classification Base On Multple Association Rule (CMAR) CMAR adalah algoritma klasifikasi dengan menggunakan beberapa aturan asosiasi yang dikembangkan oleh Wenmin Li, Jiawei Han and Jian Pei (2001). CMAR dijalankan melalui 2 tahapan pendekatan untuk menghasilkan model (classifier) [2]: 1. Membangkitkan sekumpulan Classification Association Rules (CARs) berdasarkan parameter pengguna : Support threshold untuk menentukan frekeunsi kemunculan item sets, Confidence threshold mengkonfirmasi CRs. 2. Memangkas CARs untuk menghasilkan classifier. Dua tahapan diatas merupakan tahapan yang umum digunakan oleh algortima algoritma CARM, termasuk CBA (Liu et al 1998).
Algoritma CMAR (Li et al. 2001) awalnya menggunakan algoritma FP-growth (Frequent Pattern, Han et al. 2000) untuk membangkitkan sekumpulan CARs. Kemudian Coenen et. al. 31
PENERAPAN CLASSIFICATION BASE ON MULTIPLE ASSOCIANTON RULE PADA ANALISA RESIKO KREDIT USAHA …
(2004) bersama dengan tim dari LUCS-KDD (Liverpool University Computer ScienceKnowledge Discovery in Datas) mengadopsi CMAR dengan cara yang sama dengan Lie et. al (2001) tetapi memiliki cara yang berbeda dalam membangkitkan CARs yakni dengan Algoritma Apriori-TFP. Perbedaannya terletak pada, FP-Growth dengan struktur FP-Treenya diganti dengan struktur P-Tree dan T-Tree [9]. Lebih jelasnya tahapan metode CMAR dalam gambar 2.1 sbb.
Training Data Step 1 : menemukan Frequent ruleitems dengan AprioriTFP
Test Data Frequent Ruleitems Step 3 : perangkingan dan
Step 4:
pemangkasan
prediksi dengan CMAR
Step 2 : metode CMAR Generate rules Kumpulan CARs
Classifier
Gambar 2. Tahapan alur dengan metode CMAR.
32
Moh. Farid Wajdi, Hamzan Ahmadi, L. M. S a m s u
Algoritma Apriori-TFP [9] Algoritma Apriori-TPF lahir disebabkan beberapa algoritma terdahulu seperti Apriori, FPGrowth masih memerlukan perbaikan optimasi storage dan generate time. Apriori-TFP menggabungkan metode Apriori-T dan TFP guna mendapatkan frequent rule itemset dari penggunaan struktur P-Tree dengan metode Apriori untuk membentuk struktur yang lebih efisien yang disebut T-Tree. Dengan kata lain Apriori-TFP disebut juga algoritma pembentukan T-Tree. a. P-Tree [10] Partial Support Tree (P-Tree) adalah sebuah enumerasi struktur tree untuk menyimpan partial support counts dari itemset. Konsep partial support counts didasarkan atas ide dari P-Tree yang melakukan penyalinan data input dalam sekali jalan dalam struktur data Tree kemudian mengolah seluruh hal yang terkait dan menambang struktur tersebut. P-Tree menawarkan dua keuntungan yaitu 1) Mengabungkan baris data ganda/sama sehingga dapat mengurangi pemakaian storage. 2) Mempercepat runtime atau generate time sebab perhitungan partial support sebagian telah dilakukan.
b. T-Tree [10] Total support Tree (T-Tree) adalah sebuah enumerasi struktur tree untuk menyimpan informasi Frequent Itemset. T-Tree didahului dengan menerapkan metode Apriori untuk menemukan candidat N-Itemset bersumber dari P-Tree yang sudah didapat.
1.1.1. CARs Generation [2][9] Dari T-Tree akan diperoleh frequent rule itemset yang memenuhi minimum support. Dan dari kumpulan frequent itemset dipilih yang mengandung class target sebagai CARs karena sesuai aturan AC, frequent rule itemset yang mengandung class saja yang menjadi CARs. CARs yang terpilih tidak semua menjadi rule karena yang memenuhi minimum confidence saja yang akan menjadi rule CARs (Strong association rule).
33
PENERAPAN CLASSIFICATION BASE ON MULTIPLE ASSOCIANTON RULE PADA ANALISA RESIKO KREDIT USAHA …
Pemangkasan Rule Jumlah rule yang berhasil digenerate dari proses mining CARs bisa saja sangat banyak. Untuk mendapatkan klasifikasi yang efektif, yang diperlukan adalah memangkas rule untuk menghapus redundasi dan kebiasan informasi. Mekanisme pemangkasan terbagi dalam 3 tahap, Precedence Relationship, mencari korelasi positif antara atribut dengan class dengan metode X2–testing, dan multiple database coverage [2].
Metode Klasifikasi CMAR [2], [9] Metode klasifikasi dengan CMAR pada dasarnya sama dengan metode klasifikasi tradisional yang lain, yaitu dengan menjalankan rule-rule yang cocok pada data testing atau data uji untuk memprediksi label class. Diberikan classifier R dan objek/data training t , CMAR akan mengambil sebagian rule, Rk, dalam R yang sesuai dengan t. Terdapat 2 kemungkinan kondisi : 1. Jika rule lebih dari satu dan semua rule dalam Rk Class yang diprediksi hanya satu class, maka label class nya langsung dapat ditentukan. 2. Jika kasusnya labelnya class dalam Rk berbeda (multiple class), CMAR akan membagi kedalam kelompok sesuai labelnya class dan membandingkan kekuatan tiap tiap kelompok. Pendekatan yang digunakan adalah dengan analisis pembobotan (X2) atau weighted (X2) atau disingkat WCS. Pembobotan
X
2
untuk tiap-tiap kelompok class dapat dihitung menggunakan
rumus WCS :
Teknik Evaluasi Pengukuran kualitas pengklasifikasian pada data testing adalah pekerjaan yang penting dalam Klasifikasi Data mining untuk mengetahui seberapa efektif hasil klasifikasi yang sudah didapat. Untuk menguji model, pada penelitian ini, digunakan metode Confusion Matrix. Sedangkan nilai evaluasi kinerja metode CMAR dihitung dengan persamaan Akurasi [11]. True positif (TP) adalah jumlah record positif yang diklasifikasikan sebagai positif, false positif (FP) adalah jumlah record negatif yang diklasifikasikan sebagai positif, false negatif (FN)adalah jumlah record positif yang diklasifikasikan sebagai negatif, true negatif(TN) adalah jumlah record negatif yang diklasifikasikan sebagai negative
34
Moh. Farid Wajdi, Hamzan Ahmadi, L. M. S a m s u
Kerangka Pemikiran Kerangka Pemikiran dalam menjabarkan apa dan bagaimana penelitian ini secara garis besarnya dapat
dituliskan
dalam
diagram
proses
sebagai
Latar Belakang Masalah Pada peneltian terdahulu, Tingkat kredit
analisa resiko kredit
bermasalah di
Belum digunakan metode
yang
KCP BSM Cabang praya
analisis resiko kredit
dipakai umumnya
cukup
tertentu
metode klasifikasi klasik. (C.45,
tinggi (24,56%).
di KCP BSM Praya .
SVM, NN)
35
berikut:
PENERAPAN CLASSIFICATION BASE ON MULTIPLE ASSOCIANTON RULE PADA ANALISA RESIKO KREDIT USAHA …
Rumusan Masalah
Bagaimana cara mengukur akurasi dari Bagaimana memprediksi resiko kredit metode CMAR dan berapakah nilai akurasi usaha Mikro BSM KCP Praya dengan diperoleh terhadap data kredit usaha menggunakan metode CMAR?. mikro di BSM? )
Pendekatan Metode
ANALISA THE LUCS - KDD
Associative Classification dengan
Algoritma Apriori- SOFTWARE LIBRARY TFP CMAR ALgorithm
Metode CMAR
36
Moh. Farid Wajdi, Hamzan Ahmadi, L. M. S a m s u
Pengukuran
Accuracy
Penerapan Objek: Data Perancanga Nasabah n Warung Mikro BSM Desain KCP Eksperimenta aplikasi l PRaya CMAR
Tujuan / Hasil CMAR dapat diterapkan untuk memprediksi resiko kredit Mikro di BSM KCP Praya dengan Akurasi Tinggi Gambar 2.2 kerangka Pemikiran
METODE Metode pada penelitian ini adalah dengan tahapan-tahapan seperti berikut: Bussiness understanding, data understanding, data preparation, analisa, deployment/perancangan aplikasi, evaluation. Bussiness Understanding Penelitian ditetapkan pada sektor perbankan dengan mengambil lokasi di BSM Kantor Cabang Pembantu Praya. Dari hasil interview awal diarahkan untuk mengambil penelitian pada divisi Kredit Mikro karena menjadi core business BSM KCP Praya. Berdasarkan data status nasabah kredit Mikro KCP Praya, ditemukan fakta bahwa nasabah dengan status kredit bermasalah (status kolektabilitas DPK,KL, D,M) cukup tinggi tingkat persentasenya. Dari total 171 nasabah, ditemukan sebanyak 42 nasabah dengan status bermasalah atau sebesar 24.56%
Data Understanding Telah diidentifikasi variabel variabel penelitian mana yang relevan atau ada hubungan dengan objek penelitian dan ada yang kurang relevan atau tidak berhubungan. Yang relevan menjadi varibel penelitian sedangkan yang tidak relevan dikesampingkan karena bersifat keterangan tambahan. 37
PENERAPAN CLASSIFICATION BASE ON MULTIPLE ASSOCIANTON RULE PADA ANALISA RESIKO KREDIT USAHA …
Dari 14 kolom variabel yang digunakan sebanyak 11 kolom yaitu Alamat, Jenis Kelamin, Status Perkawinan, Plafon, Angsuran, Jangka Waktu, Jaminan, Jatuh Tempo, Usaha, Tunggakan dan Status Kolektabilitas. 10 kolom menjadi atribut independen dam 1 kolom yaitu status kolektabilitas menjadi class (atribut dependen).
Data Preparation Preprocessing merupakan tahap mempersiapkan dataset yang akan dijadikan data training Metode AC dengan CMAR data Trainingnya bertipe nominal u seluruh atribut/varibelnya termasuk label/class. Oleh karena itu dataset diolah/ditransformasikan tipe datanya menjadi nominal melalui tahapan kategorisasi. Kategorisasi adalah merubah seluruh item data kedalam data berbentuk bilangan positif. Kategorisasi data menghasilkan data bernilai 1,2,3,4,5 dst untuk semua data dimana nilai merepresentasikan data dalam arti sebenarnya. Dari data diperoleh rentang kolom sebanyak 46 kolom dengan 44 atribut item dan 2 atribut class.
Tabel 3.1 Kategorisasi Data (Tahap persiapan data) KATEGORISASI DATA
Data Alamat yang dipakai kecamatan saja.
Data kecamatan dikelompokkan menjadi nomor 1-13, Praya =1, Praya barat=2, praya tengah=3, praya timur=4, praya barat daya=5, kopang=6, janapria=7, pujut=8, batukliang =9, batukliang utara=10, jonggat= 11, pringgarata=12, lain=13. Nomor untuk laki=14, dan Perempuan=15 Nomor 16-18 status pernikahan, menikah= 16, Belum menikah=17, janda/duda=18 Nomor 19-21, plafon dibuat interval sesuai kelompok pembiayaan 2 jt s.d 10 juta =19
38
Moh. Farid Wajdi, Hamzan Ahmadi, L. M. S a m s u
>10 jt sd 50 jt = 20 > 50 s.d 100 jt = 21 Nomor 22-27 : jangka waktu/periode pinjaman 12 bulan= 22, 18 bulan=23 24 bulan= 4, 36 bulan = 25, 48 bulan= 26, lain-lain=27
Nomor 28-30, angsuran dibuat interval sesuai kelompok pembiayaan dan angsuran s.d 1 juta = 28 >1 sd 2 jt = 29 > 2jt = 30 Nomor 31-32, jaminan SHM = 31, BPKB motor/mobil=32, SK PNS/SK lain =33 Nomor 34-35, kredit masih berjalan=34, dan kredit sudah selesai=35 Karena usaha yang dibiayai beragam maka dari itu dibuat dalam kelompok usaha. Pedagang sembako/kelontongan/kebutuhan sehari-hari/ = 36, counter hp, konveksi, mainan, pecah belah dsb kebutuhan sekunder=37, jasa seperti heuler, bengkel, pjtki=38, rumah makan, warung,bakso, toko kue, catering = 39, PNS atau karyawan= 40, dan pertanian dan peternakan= 41, multiusaha dan lain-lain=42. Ada tunggakan= 43, tidak ada tunggakan 44 Status L=45, DPK, K, L, M =46 8
Analisa Tahap ini juga dapat disebut tahap learning atau tahap mining karena pada tahap ini data training diolah secara manual, yang secara terurut dan sistematis sesuai alur algoritma Association Classification metode CMAR, dari tahap mengenerate rule (sistem rule Generation) untuk menemukan Classification Association Rule (CARs) dengan algoritma Apriori_TFP, dan 39
PENERAPAN CLASSIFICATION BASE ON MULTIPLE ASSOCIANTON RULE PADA ANALISA RESIKO KREDIT USAHA …
melaksanakan Pruning/Pemangkasan dan sampai tahap Classification dengan menjalankan rule untuk tujuan memprediksi nilai class baru data uji yang disiapkan. Deployment/Perancangan Aplikasi Tahap ini adalah tahap perancangan prototype sistem dan pengembangan aplikasi CMAR dengan diawali tahap analisa activity diagram, desain user interface hingga tahap pengkodean. Evaluasi Klasifikasi/Evaluation Pada tahap ini dilakukan pengujian terhadap hasil klasifikasi guna mendapatkan informasi seberapa besar nilai kehandalan metode CMAR yang digunakan dari sisi akurasi. Selain itu, sebagai penjelasan hasil akan dibahas rule CMAR dan penafsirannya dan penerapannya dalam contoh kasus prediksi data nasabah baru. Dan pada akhir tahap evaluasi ini, akan dilakukan komparasi hasil akurasi metode CMAR dengan hasil ekperimen dengan metode klasifikasi lain seperti C.45 dan NN jika data yang diolah sama yaitu data nasabah mikro BSM KCP Praya.
HASIL DAN PEMBAHASAN Hasil Ekperimen Metode CMAR Dalam subbab ini mencakup pelaksanaan ekperimen algoritma CMAR dengan menjalankan aplikasi Demonstrasi Algoritma CMAR hasil pengembangan pada tahap deployment aplikasi. Ekperimen dilaksanakan melalui 2 tipe ekperimen yaitu Tipe I dimana ekperimen dengan mengganti nilai parameter support confidence dengan data training dan data testing sama, dan Tipe II dengan melakukan peubahan pada data training dan data testing yang berbeda dengan nilai support dan confidence yang optimal. Tabel 4.1 Rekap ekperimen Tipe 1 Ekperimen 1 S=20% C=80% Accuracy 99.42 Item prune 27 Jumlah frequent set 304 Jumlah CMAR Rule 33 Generate Time 0.86 second
Ekperimen 2 S=30% C=80% 75.44 31 108 19 0.9 second
Ekperimen 3 S=30% C=90% 75.44 31 108 17 0.87 second
Ekperimen 4 S=10% C=90% 99.42 20 1271 53 0.51 second
Dari tabel rekap diatas diambil kesimpulan untuk ekperimen data training dan data testing yang sama, yang akurasi yang optimal adalah ekperimen 4 S=10% C=90% dengan akurasi
40
Moh. Farid Wajdi, Hamzan Ahmadi, L. M. S a m s u
99.42. Berikutnya 1,3, dan terkhir 2. Ekperimen 1 dan 4 memiliki akurasi yang sama tetapi generate time ekperimen 4 lebih baik. Tabel 4.2 Rekap Hasil Ekperimen Tipe 2
Accuracy Jumlah record Item prune
Ekperimen 5 S=10% C=90% 99.23 130 19
Jumlah frequent set 1611 Jumlah CMAR 23 Rule Generate Time 0.33
Ekperimen 6 S=10% C=90% 99.01 100 19
Ekperimen 7 S=10% C=90% 98.84 86 20
Ekperimen 8 S=10% C=90% 98.0 50 18
1580
1504
1887
19
16
27
0.24
0.51
0.18 second
Dari tabel rekap diatas diambil kesimpulan untuk ekperimen data training dan data testing yang berbeda, dengan nilai support dan confidence tetap (S=10% dan C=90%) didapatkan akurasi yang optimal adalah ekperimen 5 (jumlah record 130) dengan akurasi 99.23. Berikutnya 6, 7 dan terkhir ekperimen 8. Dari ekperimen Tipe 1 dan Tipe 2, pilihan yang paling optimal adalah ekperimen tipe 1. Dengan accuracy yang lebih baik dari ekperimen tipe ke-2. Dimana dapat disimpulkan sebagai berikut : Untuk mendapatkan akurasi yang optimal dan terbaik, pilihan settingnya adalah Data Trainig dan data Testing yang sama dan dengan jumlah record terbanyak yakni 171 record. Dengan Support 10% dan Confidence 90%, ini akan menghasilkan variasi rule CMAR yang lebih banyak yaitu 53 rules dan nilai akurasi mendekati sempurna yaitu 99.42%. Dapat digambarkan secara grafik line hasil pengukuran tingkat akurasi dari 8 ekperimen diatas sbb:
41
PENERAPAN CLASSIFICATION BASE ON MULTIPLE ASSOCIANTON RULE PADA ANALISA RESIKO KREDIT USAHA …
120 Accuracy 100
99.42
99.42
99.23
99.01
98.84
98
80 75.44
75.44
60 40 Accuracy 20 0 S=30 S=20%
S=30%
%
S=10%
C=90 C=80%
C=80%
%
C=90%
S=10%
S=10%
C=90
C=90
%
%
S=10%
S=10%
C=90%
C=90%
Ekperime Ekperime Ekperime Ekperime Ekperime Ekperime Ekperim Ekperime n
nn 1
2
n 3
n 4
n 5
en 6
n 7
8
Gambar 4.1 Grafik akurasi hasil 8 ekperimen dengan metode CMAR
Rule CMAR dan Pembahasannya Hasil ekperimen algoritma CMAR diatas juga menghasilkkan rule base CMAR sebanyak 53 rule sbb: Format penulisan rule : 10 (No Rule ) {Ante} {Cons} confidence % (Sup. Rule, Sup. Ante, Sup. Cons.) \(1) {44 14}
{45} 100.0%, (69.0, 69.0, 129.0)
(2) {16 44 14}
{45} 100.0%, (69.0, 69.0, 129.0)
(3) {44 35}
{45} 100.0%, (58.0, 58.0, 129.0)
(4) {44 25}
{45} 100.0%, (58.0, 58.0, 129.0)
(5) {44 28}
{45} 100.0%, (54.0, 54.0, 129.0)
… 42
Moh. Farid Wajdi, Hamzan Ahmadi, L. M. S a m s u
(35) {44 31 30} (36) {20 43}
{46} 100.0%, (26.0, 26.0, 42.0)
(37) {16 44 31 30} (38) {14 43}
{45} 100.0%, (27.0, 27.0, 129.0)
{45} 100.0%, (25.0, 25.0, 129.0)
{46} 100.0%, (24.0, 24.0, 42.0)
… (47) {44 37}
{45} 100.0%, (18.0, 18.0, 129.0)
(48) {34 43}
{46} 100.0%, (18.0, 18.0, 42.0)
(49) {25 43}
{46} 100.0%, (18.0, 18.0, 42.0)
(50) {44}
{45} 99.23%, (129.0, 130.0, 129.0)
(51) {16 44}
{45} 99.18%, (122.0, 123.0, 129.0)
(52) {44 31} --> {45} 98.95%, (95.0, 96.0, 129.0) (53) {16 44 31} --> {45} 98.88%, (89.0, 90.0, 129.0) Pembahasan rule meliputi 1) proses rekonversi rule 2) proses penafsiran rule.
Rekonversi rule adalah proses merubah kembali format rule yang sebelumnya bentuk angka menjadi bentuk data sebenarnya sehingga proses pembacaan dan penafsiran rule akan jauh lebih mudah. Rule ke 37 : {16 44 31 30}
{45} 100.0%, (25.0, 25.0, 129.0) , dikonversi kembali menjadi
Menikah+Tidak Ada Tunggakan + Jaminan SHM+ Angsuran > 2jt
Lancar
Penafsiran rule : Dengan tingkat kepercayaan sebesar 100% telah terjadi sebanyak 25 kali kejadian status kredit Lancar dengan ciri-ciri status perkawinan nasabah telah menikah, tidak terdapat tunggakan, menggunakan jaminan SHM, dengan angsuran > 2jt. Rule 48: {34 43}
{46} 100% (18.0,18.0,42.0) dikonversi kembali menjadi Kredit masih berjalan + ada tunggakan
Macet
Penafsiran rule : Dengan tingkat kepercayaan sebesar 100% telah terjadi sebanyak 18 kali kejadian status kredit Macet dengan ciri-ciri kredit masih berjalan dan adanya tunggakan.
43
PENERAPAN CLASSIFICATION BASE ON MULTIPLE ASSOCIANTON RULE PADA ANALISA RESIKO KREDIT USAHA …
Perbandingan Akurasi Metode CMAR dengan Metode C.45 dan NN Selain metode CMAR dengan teknik integrasi metode Association dengan klasifikasi, data nasabah mikro BSM KCP Praya dapat pula dianalisa dengan metode klasifikasi klasik lain untuk tujuan perbandingan metode agar dapat diketahui metode mana yang lebih baik dari sisi akurasi. Untuk keperluan perbandingan ini penulis menentukan metode pembanding adalah Decision Tree/C.45 dan Neural Network. Proses analisa dengan metode lain dibantu dengan tools data mining yang sudah umum dipakai yaitu Rapidminer versi 5. Perbandingan Dengan Metode Decision Tree/C.45 : split Data uji dan Training : bsmmikro.xls
Metode evaluasi
validation
: 0.9 s.d Split ration
0.4 Tabel 4.3 Hasil Akurasi Metode Decision Tree
Accuracy dengan metode Sampling split validation
linear
Shuffled
Stratified
0.9
64.71
82.35
70.59
0.8
82.35
70.59
82.35
0.7
74.51
86.27
68.63
0.6
72.06
77.94
73.53
0.5
65.88
81.18
72.94
0.4
69.61
69.61
79.41
71.52
77.99
74.575
Averag e
Dari tabel dapat disimpulkan nilai akurasi maksimal yang bisa didapat sebesar rata-rata nilai akurasi metode decision tree sebesar 86.27 %. Artinya masih dibawah metode CMAR 99.42 %.
44
Moh. Farid Wajdi, Hamzan Ahmadi, L. M. S a m s u
Perbandingan Dengan Metode Neural Network Data uji dan
: splt
Training
: bsmmikro.xls
Metode evaluasi
validation
Split ration
: 0.9 s.d 0.4
Hidden layer
:3
Training cycle
: 500
Momentum
: 0.2
Error epsilon
: 1.00E-05
Tabel 4.4 Hasil Akurasi Metode NN Accuracy dengan metode Sampling split validation
Linear
shuffled
0.9
29.41
11.76
23.53
0.8
20.59
20.59
76.47
0.7
25.49
15.69
25.49
0.6
75
80.88
25
0.5
78.82
22.35
24.71
0.4
19.61
21.57
24.51
41.48666667
28.80666667
33.285
Average
Stratified
Dari tabel dapat disimpulkan nilai akurasi maksimal yang bisa didapat sebesar rata-rata nilai akurasi metode NN sebesar 80.88 %. Artinya masih dibawah metode CMAR 99.42 %.
KESIMPULAN DAN SARAN Dari hasil penelitian ini menunjukkan bahwa penggunaan algoritma Classification base on Multiple Association Rule (CMAR) dapat diterapkan dalam memprediksi resiko kredit sektor mikro di KCP cabang praya dengan mengetahui karakteristik kredit yang lancar dan karakteristik kredit yang macet dari basis aturan yang berhasil didapatkan. Dari hasil pengukuran accuracy didapati tingkat akurasi tertinggi diperoleh sebesar 99.42% dengan rule CMAR sebanyak 53 rule, dari data training sebanyak 171 nasabah dengan data uji yang sama dengan data training. Sehingga dapat diambil kesimpulan bahwa penerapan metode CMAR terbukti akurat untuk dapat memprediksi resiko kredit sektor mikro di KCP Praya. 45
PENERAPAN CLASSIFICATION BASE ON MULTIPLE ASSOCIANTON RULE PADA ANALISA RESIKO KREDIT USAHA …
Berdasarkan hasil analisis dan pembahasan penelitian ini, terdapat beberapa saran untuk pengembangan penelitian topik ini kedepan: 1 Mempertajam perbedaan karakteristik nasabah berdasarkan pola atribut nasabah yang status kreditnya lancar dengan kredit yang macet. 2 Menambahkan jumlah atribut atau variabel independen yang spesifik seperti jumlah tanggungan, jumlah pendapatan, jumlah pengeluaran atau variabel lainnya dan menambah jumlah record data training, karena semakin banyak data training, model classifier yang diperoleh akan lebih baik walaupun secara akurasi sama. Disamping itu agar data yang digali lebih banyak dan informasi yang diperoleh pun lebih lengkap. 3 Melakukan perbandingan tingkat akurasi metode CMAR dengan metode Association Classification lainnya untuk mendapatkan metode yang terbaik baik secara akurasi maupun kelengkapan informas DAFTAR PUSTAKA [1]
B. Liu, “Integrating Classification and Association Rule Mining,” Proc. Int. Conf. Knowl. Discov. Data Mining. New York, NY AAAI Press, pp. 80–88, 1998.
[2]
W. Li, J. Han, and J. Pei, “CMAR : Accurate and Efficient Classification Based on Multiple,” Proc. Int. Conf. Data Min. (ICDM’01), San Jose, CA,. Lim, pp. 369–376, 2001.
[3]
D. K. Tiwary, “A COMPARATIVE STUDY OF CLASSIFICATION ALGORITHMS FOR CREDIT CARD APPROVAL USING WEKA,” Int. Interdiscip. Res. J. _ ISSN 2347-6915, vol. 2, no. 3, pp. 165–174, 2014.
[4]
S. U. Purohit, V. Mahadevan, and A. N. Kulkarni, “Credit Evaluation Model of Loan Proposals for Indian Banks,” Int. J. Model. Optim., vol. 2, no. 4, pp. 530–534, 2012.
[5]
J. B. Simha, “Comparing decision trees with logistic regression for credit risk analysis,” SAS APAUGC 2006 MUMBAI, 2006.
[6]
S. Soni and O. P. Vyas, “Using Associative Classifiers for Predictive Analysis in Health Care Data Mining,” Int. J. Comput. Appl., vol. 4, no. 5, pp. 33–37, 2010.
[7]
K. Tan, Steinbach, “Association Analysis : Basic Concepts and Algoritm,” in Introduction Of Data Mining, 2004, pp. 327–370.
[8]
F. Thabtah, “A review of associative classification mining,” Knowl. Eng. Rev., vol. 22, no. 01, p. 37, May 2007.
46
Moh. Farid Wajdi, Hamzan Ahmadi, L. M. S a m s u
[9]
F. Conen, “Apriori-TFP Association Rule Mining (ARM) Software The CMAR Algorithm,” LUCS KDD , Department of Computer Science, The University of Liverpool, UK, 2004. [Online]. Available: http://www.csc.liv.ac.uk/~frans/KDD/Software/CMAR/cmar.html.
[10] F. Coenen, P. Leng, and S. Ahmed, “Data Structure for Association Rule Mining :T-Tree and P-Tree,” IEEE Trans. Knowl. Data Eng., vol. 16, no. 6, pp. 1–5, 2004. [11] J. Han, Data Mining : Concept and Techniques-3rd Edition, Third., vol. 40, no. 6. Morgan Kaufman, USA, 2012.
47