Prosiding
ANNUAL RESEARCH SEMINAR 2016 6 Desember 2016, Vol 2 No. 1
ISBN : 979-587-626-0 | UNSRI
http://ars.ilkom.unsri.ac.id
Pengenalan Tulisan Tangan Angka Cina menggunakan Weighted United Moment Invariant dan Self Organizing Kennycia Susila Dharma1, Samsuryadi2, Novi Yusliani3 Jurusan Teknik Informatika, Fakultas Ilmu Komputer, Universitas Sriwijaya Kampus Unsri Bukit, Jalan Srijaya Negara Bukit Besar Palembang, Telp.(0711) 707272729 e-mail:
[email protected],
[email protected],
[email protected] 1,2,3
Penelitian mengenai tulisan tangan angka Cina sudah pernah dilakukan oleh [2] menggunakan metode Feature Point Detection yaitu fungsi yang medeteksi titik skeleton dari citra tulisan tangan angka Cina dan menjadi masukan sistem. Metode ini menghasilkan akurasi sebesar 81,82%. Hal ini dikarenakan metode ini tidak memperhitungkan angka yang diputar dalam gambar dan beberapa angka berakhir menjadi ambigu karena hanya titik fitur dan informasi garis direkam. Secara umum, mekanisme yang dibutuhkan dalam pengenalan tulisan tangan terdiri 3 bagian, yaitu prapengolahan, ekstraksi fitur, dan pengelompokkan. Prapengolahan digunakan untuk meningkatkan kualitas citra sebelum diekstrak nilai fiturnya. Ekstraksi fitur merupakan proses pengambilan nilai karakterisitik dari citra tulisan tangan. Pengelompokkan adalah proses yang mampu membedakan suatu objek berdasarkan karakteristik objek yang didapatkan dari ekstraksi fitur. Penelitian ini menggunakan pra-pengolahan berupa binerisasi, ekstraksi fitur dengan Weighted United Moment Invariant dan pengelompokkan menggunakan algoritma Self Organizing Maps (SOM).
Abstrak— Pengenalan tulisan tangan angka Cina menjadi kebutuhan dalam meningkatkan produktivitas, akan tetapi untuk mengenali angka Cina tidaklah mudah. Masalah dalam pengenalan tulisan tangan angka Cina adalah kompleksitas variasi dari penulis. Hal tersebut menjadikan tulisan tangan berbeda dalam bentuk, ketebalan, dan ukuran. Penelitian ini menggunakan binerisasi untuk mengubah citra asli menjadi citra biner, Weighted United Moment Invariant untuk mengekstraksi citra biner tulisan tangan angka Cina, dan Self Organizing Maps untuk mengelompokkan hasil dari ekstraksi fitur. Hasil pengenalan tulisan tangan angka Cina dengan 600 data primer dengan setiap angka dibuat 60 kali diperoleh akurasi terbaik 93,89%. Kata Kunci— Tulisan Tangan Angka Cina, Weighted United Moment Invariant, Self Organizing Maps. I. PENDAHULUAN Perkembangan di era globalisasi menjadikan angka Cina digunakan dalam berbagai bidang. Dalam bidang keuangan, angka Cina digunakan dalam transaksi komersial mengenai harga, kuantitas barang dan kode barang di Republik Rakyat Tiongkok. Dalam bidang pendidikan, angka Cina mendukung pengetahuan anak-anak sejak dini mengenai angka Cina. Kebutuhan akan sebuah perangkat lunak yang dapat mengenali angka Cina diperlukan untuk meningkatkan efisiensi dari masalah tersebut. Akan tetapi, terdapat masalah dalam pengenalan tulisan tangan angka adalah kompleksitas variasi dari penulis seperti gaya penulisan, bentuk, ketebalan, dan lain-lain [1].
II. METODE PENELITIAN A. Binerisasi Binerisasi adalah proses mengubah citra abu-abu menjadi citra biner dengan menggunakan nilai ambang (thresholding) yang telah ditetapkan. Citra biner adalah citra yang hanya memiliki warna hitam dan putih. Gambar 1 merupakan tulisan tangan angka Cina yang telah mengalami proses binerisasi dan menjadi citra biner.
86
Prosiding
ANNUAL RESEARCH SEMINAR 2016 6 Desember 2016, Vol 2 No. 1
ISBN : 979-587-626-0 | UNSRI
http://ars.ilkom.unsri.ac.id
(
√
)
√
√ (3)
Gambar 1. Citra Abu-abu (kiri) dan Citra Biner (kanan)
C. Self Organizing Maps SOM merupakan sistem tanpa pengawasan didasarkan pada pembelajaran kompetitif, di mana setiap neuron keluaran bersaing dan memiliki neuron pemenang yang kemudian neuron-neuron tersebut akan di update [6]. SOM tidak menggunakan fungsi aktivasi dan tidak memiliki bias berat.
B. Weighted United Moment Invariant Weighted United Moment Invariant (WUMI) adalah integrasi antara Weighted Central Moment (WCM) dan United Moment Invariant (UMI). Derivasi dari WUMI mirip dengan derivasi UMI, kecuali momen pusat diganti dengan WCM [3]. Rumus momen pusat yang digunakan yaitu [4]: (
∑
)[
] [
dengan : ∑ ( (
)
]
(
)
)
((
)
(
) ) ;
(
)
Gambar 2. Struktur SOM [7]
; dan √
SOM bersifat unsupervised dan hanya memiliki dua layer, input layer dan output layer (Biasa dikenal Kohonen layer), tidak ada hidden layer di dalam SOM. Dalam hal ini, secara khusus hubungan topologi antara input data ketika dipetakan ke jaringan SOM memiliki nilai untuk merepresentasikan data yang kompleks [8]. Masukan untuk sebuah jaringan saraf tiruan Kohonen diberikan melalui neuron input yang akan diisi dengan angka yang akan membangun suatu pola input yang akan dikenali jaringan, bila pola input telah terbangun, maka jaringan tersebut akan memancing reaksi dari neuron output.
.
Setelah mendapatkan nilai momen pusat menggunakan Persamaan (1) dilakukan normalisasi dengan membagi nilai momen pusat dengan nilai dari momen pusat orde dasar yang lebih stabil [5] menggunakan Persamaan (2).
Dimana
( ) dan p, q = 2, 3, ...
(2)
III. HASIL DAN PEMBAHASAN Berdasarkan pengujian perangkat lunak menggunakan keseluruhan data primer, hasil percobaan dibedakan berdasarkan proses pelatihan menggunakan learning rate yang berbeda. Learning rate sendiri mempunyai rentang nilai dari 0,1 sampai 1,0 dan learning rate yang digunakan dalam pengujian perangkat lunak ini adalah 0,3 dan 0,6. Jenis data yang digunakan adalah data primer yang diambil dari 9
Setelah mendapat nilai momen pusat ternormalisasi, WUMI akan menghitung 8 nilai fitur dari citra yang diperlihatkan pada Persamaan (3). √
87
Prosiding
ANNUAL RESEARCH SEMINAR 2016 6 Desember 2016, Vol 2 No. 1
ISBN : 979-587-626-0 | UNSRI
http://ars.ilkom.unsri.ac.id
mahasiswa masing-masing menuliskan angka Cina 0(O) – 2.
9(九), sehingga menghasilkan 600 data tulisan tangan angka Cina. TABEL 1 Rekap Hasil Akurasi Berdasarkan Learning Rate Hasil Akurasi Jumlah Jumlah Data Learning Learning Data Uji Latih Rate 0,3 Rate 0,6 300 300 87,67% 89,33% 50:50 360 240 91,25% 92,08% 60:40 420 180 92,22% 93,89% 70:30 90,38% 91,77% Akurasi Rata-Rata
REFERENSI [1] Jipeng, T. Kumar, G.H. dan Chethan, H.K. (2010). Chinese Numeral Recognition using Gabor and SVM. Third International Conference on Emerging Trends in Engineering and Technology on IEEE. 202 – 206. [2] Rupard, Jason. (2005). An Approach to Chinese Number Recognition. CCEC Symposium 2005. University of North Florida, USA. [3] Samsuryadi. (2013). Biomimetic Pattern Recognition For Writer Identification using Geometrical Moment Functions. Universiti Teknologi Malaysia. [4] Pamungkas, R.P. dan Shamsuddin, S.M. (2009). Weighted Central Moment for Pattern Recognition: Derivation, Analysis of Invarianceness, and Simulation Using Letter Characters. Third Asia International Conference on Modelling & Simulation on IEEE. 102 – 106. [5] Dwitra, J., & Samsuryadi, S. (2014). Identifikasi Pribadi Berdasarkan Citra Telinga dengan Jaringan Syaraf Propagasi Balik. Jurnal GENERIC, 9(1), 301308. [6] Bullinaria, J.A. (2004). ‗Self Organizing Maps‘: Fundamentals, Introduction to Neural networks: Lecture 16. University of Birmingham. [7] Clark, R.M., Adjei, O. dan Johal, H. (2001). Machine vision: an incremental learning system based on features derived using fast Gabor transforms for the identification of textural objects. SPIE Vision Geometry X, International Symposium on Optical Science & Technology. California (USA). [8] Guthikonda, S. M. (2005). Kohonen Self-Organizing Maps. Wittenberg University.
Dari Tabel 1, dapat dilihat bahwa hasil akurasi untuk learning rate 0,3 yaitu, 90,38% lebih rendah 1,39% dibandingkan dengan hasil akurasi menggunakan learning rate 0,6 dengan nilai 91,77%. Kemudian banyak data latih mempengaruhi nilai akurasi, dimana semakin banyak data yang dilatih maka semakin besar akurasi yang dihasilkan. Pada proses pengujian, angka 3 memliki nilai akurasi yang paling kecil dibandingkan yang lain. Hal ini disebabkan gaya penulisan angka 3 menyerupai gaya penulisan angka 1 dan angka 2. IV. KESIMPULAN DAN SARAN Beberapa kesimpulan yang diperoleh dari penelitian ini : 1. Ekstraksi fitur Weighted United Moment Invariant (WUMI) dapat digunakan pada arsitektur Self Organizing Maps (SOM) untuk mengenali tulisan 2.
Penelitian ini dapat dijadikan rujukan dan perbandingan pada penelitian selanjutnya dengan menggunakan metode ekstraksi fitur lain untuk melihat pengaruh terhadap akurasi pengenalan tulisan tangan.
tangan angka Cina dari 0(O) sampai 9(九); Jumlah data, nilai learning rate, dan kualitas citra dapat mempengaruhi hasil akurasi pengenalan.
Saran pengembangan lebih lanjut dari penelitian ini adalah: 1. Penelitian selanjutnya menangani kombinasi angka Cina menggunakan metode segmentasi untuk memisahkan angka-angka tersebut;
88
Prosiding
ANNUAL RESEARCH SEMINAR 2016 6 Desember 2016, Vol 2 No. 1
ISBN : 979-587-626-0 | UNSRI
http://ars.ilkom.unsri.ac.id
Credit Scoring Menggunakan Algoritma Classification And Regression Tree (CART) Hermawan1, Santun Irawan2
Reza Firsandaya Malik
Magister Informatika, Universitas Sriwijaya Indonesia, Palembang
[email protected],
[email protected]
Fakultas Ilmu Komputer, Universitas Sriwijaya Jl. Raya Palembang – Prabumulih Km 32 Indralaya, OI Sumatera Selatan 30662
[email protected]
Abstrak— Credit Scoring, adalah proses penilaian permohonan kredit yang dilakukan oleh lembaga kreditur/ pihak yang memberikan kredit kepada debitur selaku penerima kredit tersebut. Keluaran dari credit scoring adalah layak atau tidaknya calon debitur tersebut untuk menerima kredit. Tahapan ini adalah tahapan yang paling penting didalam proses kredit. Kesalahan di dalam tahapan ini akan berdampak besar pada keseluruhan tahapan pemberian kredit, dan secara global berpengaruh terhadap lembaga itu sendiri. Bidang ilmu dari teknologi informasi, yang bisa membantu credit scoring adalah data mining. Salah satu algoritma yang bisa digunakan di dalam data mining adalah Classification And Regresion Tree (CART). Penggunaan algoritma ini untuk credit scoring akan menghemat waktu, usaha dan biaya serta dengan cepat, tepat dan efektif menganalisis kelayakan calon debitur. Model yang dibentuk dari algoritma CART di domain credit scoring memberikan rata-rata tingkat akurasi sebesar 75,20 % dan dikategorikan sebagai fair classification.
mengklasifikasikan apakah calon debitur layak atau tidak untuk diberikan kredit. Prediksi tersebut dibuat berdasarkan karakteristik data calon debitur baru, dengan dasar pertimbangan data historis yang sudah ada di lembaga keuangan. Pengetahuan dan hasil yang didapatkan dari data mining tersebut yang akan menjadi bahan pertimbangan lembaga keuangan untuk membuat keputusan. Berbagai model credit scoring dan algoritma klasifikasi di dalam bidang ilmu data mining bisa digunakan untuk credit scoring. Algoritma-algoritma tersebut dikelompokkan ke dalam kategori model statistik, kategori model artificial intelligent, kategori model hybrid dan kategori model metode ensemble [2]. Beberapa algoritma klasifikasi yang sudah pernah digunakan di dalam penelitian lainya adalah Support Vector Machine (SVM), Artificial Neural Network (ANN), Classification and Regression Tree (CART). Penelitian terhadap credit scoring ini akan menggunakan algoritma CART, dengan pertimbangan bahwa CART adalah algoritma sederhana, tetapi powerfull, yang menggunakan pohon keputusan untuk memprediksi layak dan tidaknya calon debitur untuk mendapatkan kredit. Algoritma ini juga diakui sebagai salah satu dari beberapa algoritma terbaik di dalam data mining. [3].
Keywords—data mining, credit scoring, CART.
I. PENDAHULUAN Credit scoring, sebuah tahapan penting dalam proses pemberian kredit kepada calon debitur. Penentuan kelayakan pemberian kredit kepada calon debitur yang dilakukan oleh lembaga keuangan. Kesalahan sering terjadi pada tahapan penting ini. Akan tetapi, seiring waktu akan terlihat apakah calon debitur bisa dikategorikan sebagai calon debitur yang layak atau tidak layak untuk diberikan kredit. Data historis tersebut biasanya akan tercatat di dalam database lembaga keuangan yang bersangkutan. Data historis tersebut kemudian akan menjadi sumber pengetahuan yang berharga. Data historis dengan ukuran skala besar tersebut, tentunya tidak mungkin dianalisa secara manual [1]. Penggunaan data mining akan sangat bermanfaat jika digunakan pada data historis tersebut. Data mining akan memprediksi calon debitur baru,
Penelitian sebelumnya telah melakukan komparasi beberapa metode seperti algoritma ID3, C4.5 dan CART pada area penelitian medical data mining. Hasilnya menunjukkan bahawa algoritma CART memberikan hasil akurasi yang lebih baik dibandingkan metode lainnya. [4]. Komparasi lainnya dilakukan dengan algoritma Chi Squared Automatic Interaction Detection (CHAID), dan hasilnya CART masih menunjukkan hasil akurasi yang lebih baik walaupun tidak signifikan.[5]. Beberapa penelitian yang terkait algoritma CART telah banyak dilakukan. Algoritma CART pernah diaplikasikan di dalam bidang medical data mining, khususnya untuk mendiagnosa penyakit hepatitis. Setelah membandingkan hasil akurasi
89
Prosiding
ANNUAL RESEARCH SEMINAR 2016 6 Desember 2016, Vol 2 No. 1
ISBN : 979-587-626-0 | UNSRI
http://ars.ilkom.unsri.ac.id
metode ini dengan beberapa metode lainnya seperti ID3 dan C4.5, algoritma CART menunjukkan hasil akurasi terbaik dengan tingkat akurasi sebesar 83,2 %[4]. Masih di bidang medical data mining, kombinasi metode CART dengan Random Forest untuk deteksi penyakit diabetes type II menunjukkan hasil akurasi sebesar 77% [6] .CART juga digunakan untuk menganalisis faktor-faktor yang mempengaruhi urbanisasi di area Jawa Timur, yang memberikan hasil berupa model pohon dan tingkat persentasi sebesar 75,92 % [7] . Penelitian lain mengenai CART juga menunjukkan hasil baik. Metode ensemble yang diterapkan pada algoritma CART juga menunjukkan bahwa algoritma ini mampu juga beradaptasi dengan metode ensemble, dan mampu memberikan peningkatan akurasi pada klasifikasi tingkat kemiskinan [8].
3.
4.
II. CLASSIFICATION AND REGRESSION TREE (CART) CART adalah algoritma yang termasuk sebagai kelompok meotode statistik non parametric, yang dikembangkan oleh oleh Leo Breiman, Jerome Friedman, Richard Olshen, and Charles Stone. CART dapat menggambarkan hubungan antara variabel respon (variabel dependen/variabel target) dengan satu atau lebih variabel prediktor (variabel independent) [7]. Algoritma ini akan menghasilkan keluaran berupa pohon klasifikasi, jika variabel targetnya adalah tipe data kategorik. Sedangkan, apabila variabel targetnya adalah tipe data numeric atau kontinu, algoritma CART akan menghasilkan pohon regressi. [9] Metodologi CART terdiri dari 4 langkah yaitu : 1. Tree Building Pembuatan pohon keputusan, yang dimulai dari root node. CART akan melakukan perhitungan varibel dan nilai yang terbaik untuk dibagi ke dalam tepat dua child node. Proses ini akan dilakukan secara rekursif berulang-ulang. Kriteria pemilahan terbaik umumnya diukur menggunakan impurity measure. Beberapa fungsi impurity measure yang bisa digunakan adalah gini impurity, information gain, twoing dan entropy. [10] 2. Stopping Tree Building process Algoritma CART awalnya dibuat secara rekursif tanpa ada batasan, sampai pada tahap tidak bisa dibuat lagi simpul atau node. Perkembangan berikutnya dari algoritma ini, kemudian dibuat batasan tertentu untuk penghentian pembentukan pohon keputusan. Batasan tersebut, biasanya adalah jika tidak ada penurunana keheterogenan yang berarti. Batasan lainnya yang bisa digunakan adalah
batasan minimum, batasan level pohon, dan kedalaman pohon. [10] Tree Prunning Algoritma CART dengan pembentukan pohon keputusan secara rekursif, otomatis biasanya juga akan menghasilkan pohon keputusan yang kompleks juga. Tahapan ini akan memangkas pohon keputusan dengan kompleksitas yang tinggi, sehingga akan menghasilkan pohon keputusan yang mudah dimengerti, dan tetap dengan pertimbangan bahwa akurasi yang dihasilkan juga harus baik. Pengujian akan dilakukan dengan menggunakan pengukuran cost complexity minimum. Optimal Tree Selection Tahapan ini adalah tahapan lanjutan dari tahapan tree pruning. Dimana tahapan ini akan memilih pohon keputusan yang paling optimum dan terbaik. Pengukuran dilakukan dengan melakukan dengan test sample estimate dan V cross validation estimate. III. METODE PENELITIAN
Penelitian ini akan menggunakan lingkungan sistem operasi Windows 7 64 bit, dengan spesifikasi perangkat keras menggunakan Intel Core I-5 dan memory dengan kapasitas 10 GB, serta harddisk 500 GB. Pengujian algoritma CART akan dilakukan dengan menggunakan tools data mining Rapidminer, dengan library Simple CART yang berasal dari Weka. Kemudian validasi akurasi model yang dibangun akan menggunakan metode Cross Validation, yaitu K-Fold Cross Validation. Nilai K yang digunakan adalah 10, sehingga metode validasi yang digunakan adalam 10-Fold Cross Validation. Analisa hasil penelitian, menggunakan Confusion Matrix dan kurva Receiver Operating Characteristic (ROC). Analisa penelitian akan menunjukkan tingkat akurasi, presisi, recall, dan hasil kurva ROC akan menunjukkan hasil penelitian dalam bentuk visual. IV. DATASET Dataset public yang digunakan adalah dataset penilaian kredit yang berasal dari University of California (UCI), yaitu yaitu German.data-numeric. Dataset ―german.data-numeric‖ berisikan data nasabah yang dikategorikan sebagai yang tergolong baik atau tidak.Dataset ―german.data-numeric‖ adalah dataset hasil modifikasi ―german data‖ oleh universitas Strathclyde, dimana data-data polynominal diubah menjadi data-data numerik. Dataset penelitian dapat di unduh di alamat
90
Prosiding
ANNUAL RESEARCH SEMINAR 2016 6 Desember 2016, Vol 2 No. 1
ISBN : 979-587-626-0 | UNSRI
http://ars.ilkom.unsri.ac.id
http://archive.ics.uci.edu/ml/datasets/Statlog+(German+Credi t+Data).
digunakan adalah 10. Sedangkan gambar 5.2 menunjukkan tahapan inti dari model, yaitu pemrosesan data menggunakan algoritma CART melalui pembagian dua tahapan utama yaitu tahapan training dan tahapan testing.
V. HASIL DAN PEMBAHASAN Penelitian ini menghasilkan output berupa persentase tingkat akurasi dari prediksi dari model credit scoring yang dibentuk oleh algoritma CART. Kemudian juga mengklasifikan hasil output model melalui kurva ROC, sesuai dengan aturan klasifikasi internasional yang telah disepakati.
5.2 Confusion Matrix Accuracy : 75,20 % +- 4,09 % (micro: 75,20 %) Parameter True 1 True 2 class precision pred 1 616 164 78,97 % pred 2 84 136 61,82 % Class Recall 88,00 % 45,33 %
5.1 Model Credit Scoring
Tabel 5.1Confusion Matrix Gambar 5.2 menunjukkan bahwa dari 1000 data yang diuji, sejumlah 616 data hasil prediksi ―1/Benar/Layak‖ dan hasilnya juga benar (prediksi akurat) , sedangkan hasil prediksi ―1/Benar/Layak‖ tetapi pada kenyataannya ―2/Salah/Tidak Layak‖ sejumlah 164 data. Sedangkan kebalikkannya, sejumlah 84 data di prediksi sebagai ―2/Salah/Tidak Layak‖ dan juga hasilnya juga ―2/Salah/Tidak Layak‖ (prediksi akurat), dan sejumlah 136 data menunjukkan bahwa prediksi ―2/Salah/Tidak Layak‖ akan tetapi pada kenyataannya bahwa data tersebut harusnya dikelompokkan/ diklasifikasikan sebagai data yang ―1/Benar/Layak‖. Tingkat akurasi menunjukkan bahwa persentase tingkat akurasi yang dihasilkan adalah sebesar 75,20 %. Berikut adalah tabel hasil uji coba hasil penelitian :
Gambar 5.1 Model Proses utama Data Mining
Parameter Accuracy Precision Recall
Persentase 75,20 % 62,29 % 45,33 % Tabel 5.2 Tabel Hasil Uji Coba
Gambar 5.2 Model Algoritma CART Gambar 5.1 dan Gambar 5.2 menunjukkan model credit scoring yang diusulkan. Gambar 5.1 menunjukkan bahwa data yang diambil adalah data yang sudah ditransformasikan ke dalam bentuk Microsof Excel,dan model akan menggunakan metode validasi K-Fold Cross Validation dengan nilai K yang
91
Prosiding
ANNUAL RESEARCH SEMINAR 2016 6 Desember 2016, Vol 2 No. 1
ISBN : 979-587-626-0 | UNSRI
http://ars.ilkom.unsri.ac.id
5.3 Kurva ROC
menunjukkan bahwa algoritma CART bisa digunakan untuk credit scoring, penilaian kredit dengan akurasi sebesar 75,20 %. Akan tetapi, tantangan yang umum selalu terjadi di dalam data mining adalah bagaimana meningkatkan tingkat akurasi dari model /algoritma yang diusulkan. Sehingga topik penelitian (future research) selanjutnya harus berfokus bagaimana meningkatkan tingkat akurasi model credit scoring yang diusulkan. DAFTAR PUSTAKA [1]
[2] [3]
Hasil kurva Receiver Operating Characteristic (ROC) menunjukkan hasil nilai Area Under Curve (AUC) sebesar 0,717. Sesuai aturan klasifikasi, nilai tersebut dikategorikan sebagai cukup (fair classification).
[4]
[5] [6]
VI. KESIMPULAN [7]
Data Mining adalah disiplin ilmu yang salah satu tugasnya adalah tugas prediktif, yaitu memprediksikan nilaa suatu attribut berdasarkan attribut data lainnya. Oleh karena itu, bisa dimanfaatkan di dalam credit scoring/ penilaian kredit. Dimana hasil dari klasifikasi tersebut menentukan apakah calon debitur bisa dikategorikan sebagai debitur yang layak atau tidak untuk diberikan kredit. Hasil prediksi tersebut yang bisa dijadikan pertimbangan dan dasar keputusan bagi lembaga keuangan untuk memberikan kredit. Hasil penelitian
[8]
[9] [10]
92
H.-P. Kriegel, K. M. Borgwardt, P. Kröger, A. Pryakhin, M. Schubert, and A. Zimek, ―Future trends in data mining,‖ Data Min Knowl Disc, vol. 15, pp. 87–97, 2007. X.-L. Li, ―An Overview of Personal Credit Scoring: Techniques and Future Work,‖ Int. J. Intell. Sci., vol. 02, no. 24, pp. 182–190, 2012. X. Wu, V. Kumar, Q. J. Ross, J. Ghosh, Q. Yang, H. Motoda, G. J. McLachlan, A. Ng, B. Liu, P. S. Yu, Z. H. Zhou, M. Steinbach, D. J. Hand, and D. Steinberg, Top 10 algorithms in data mining, vol. 14, no. 1. 2008. G. Sathyadevi, ―Application of CART algorithm in hepatitis disease diagnosis,‖ Int. Conf. Recent Trends Inf. Technol. ICRTIT 2011, pp. 1283–1287, 2011. M. A. Kadir and S. Teknik, ―Perbandingan Performansi Algoritma Decision Tree CART dan CHAID.‖ M. K. Sabariah, ―Early Detection of Type II Diabetes Mellitus with Random Forest and Classification and Regression Tree ( CART ),‖ pp. 238–242, 2014. A. Hartati, I. Zain, and S. Suprih, ―Analisis CART (Classification And Regression Trees) pada Faktor-Faktor yang Mempengaruhi Kepala Rumah Tangga di Jawa Timur Melakukan Urbanisasi,‖ vol. 1, no. 1, 2012. K. Jombang, M. J. Muttaqin, B. W. Otok, and P. Rahayu, ―Metode Ensemble pada CART untuk Perbaikan Klasifikasi Kemiskinan,‖ pp. 1–6. J. Morgan, ―Classification and Regression Tree Analysis,‖ PM931 Dir. Study Heal. Policy Manag., no. 1, p. 16, 2014. F. Eka and I. Zain, ―Klasifikasi Pengangguran Terbuka Menggunakan CART ( Classification and Regression Tree ) di Provinsi Sulawesi Utara,‖ J. SAINS DAN SENI POMITS, vol. 3, no. 1, pp. 2337–3520, 2014.