IMPLEMENTASI ALGORITMA CLASIFICATION AND REGRESSION TREE (CART) UNTUK KLASIFIKASI BANTUAN USAHA MIKRO KECIL MENENGAH (UMKM) JASA TELEMATIKA INDONESIA Fadlan Amirudin, Eneng Tita Tosida,Irma Anggraeni. Email :
[email protected] Program Studi Ilmu Komputer FMIPA Universitas Pakuan Bogor ABSTRAK Telematika salah satu bidang prioritas bagi pembangunan Indonesia. Oleh karena itu pemerintah terus melakukan berbagai upaya untuk meningkatkan daya saing bidang telematika, terutama dalam menghadapi perdagangan bebas lingkup Asia. Berdasarkan hal tersebut akan dilakukan penelitian dan pengimplementasian untuk menentukan badan usaha jasa telematika yang layak menerima bantuan dari permenkop UKM dari data yang sesuai dari Susenas (Sensus Nasional) Badan Pusat Statistik 2006, dengan menerapkan algoritma CART yang merupakan salah satu algoritma data mining dalam pengolahan data yang menggunakan pendekatan nonparametic yang tidak membutuhkan asumsi distribusi, sehingga memudahkan permenkop dalam menentukan badan usaha yang layak menerima bantuan. Hasil penelitian uji coba validasi berdasarkan confusion matrix algoritma CART ini mencapai 62% data latih dan 73% data uji dengan model (A). 61% data latih dan 63% data uji dengan model (B). Maka dipilihlah model (A) dengan 21 atribut tetap untuk implementasinya karena memiliki nilai akurasi lebih tinggi berdasarkan perhitungan confusion matrix dari proses mining yang membandingkan 2 skenario model. Kata Kunci : UMKM, Telematika, Klasifikasi, Data Mining, Algoritma CART, PENDAHULUAN Bidang telematika adalah salah satu bidang prioritas bagi pembangunan Indonesia. Oleh karena itu pemerintah terus melakukan berbagai upaya untuk meningkatkan daya saing bidang telematika, terutama dalam menghadapi perdagangan bebas lingkup Asia pada tahun 2015. Dasar penilitian ini bertujuan menentukan kelayakan UMKM untuk menerima bantuan atau tidak menerima bantuan dari Kemenkop UKM Indonesia. Beberapa penelitian terkait tentang kondisi telematika Indonesia baik berupa model klasifikasi usaha jasa telematika (Tosida et al. , 2012) Penelitian yang relevan berkaitan dengan telematika telah dilakukan oleh peneliti terdahulu Hardiani, (2015), melakukan clustering usaha kecil menengah jasa telematika Indonesia sesuai dengan data Susenas (Sensus Nasional) Badan Pusat Statistik tahun 2006 yang
tersebar di seluruh wilayah provinsi, kabupaten atau kota di Indonesia. Selain itu Tosida et al.(2015) meneliti dan mengembangkan visualisasi data UMKM Jasa Telematika yang memiliki 8 atribut menjadi 21 atribut sesuai data Susenas tahun 2006. Berdasarkan dua penelitian tersebut sudah menghasilkan beberapa atribut namun belum ada atribut kelas yang telah ditentukan sehingga tidak bisa melakukan klasifikasi, maka dari itu perlu dikembangkan agar bisa menjadi machine learning. Data penelitian ini sudah melalui tahap praproses data sehingga data tersebut sudah bisa di ujicoba pada algoritma yang digunakan. Pengembangan yang akan dilakukan dari hasil kedua penelitian tersebut adalah menentukan atribut kelas dan menerapkan data pada algoritma CART. Algoritma CART ini menggunakan pendekatan nonparametic yang tidak membutuhkan asumsi distribusi, lalu akan
mengidentifikasi variable secara otomatis yang berpengaruh dan mereduksi kompleksitas data, mudah dalam mengatasi data outlier, dan mudah dalam interpretasi. Untuk itu diterapkan algoritma CART dengan tujuan mampu menghasilkan klasifikasi berdasarkan informasi data yang ada. Pembuatan sistem ini menggunakan Adobe Dreamweaver cs6, perancangan database menggunakan MySQL dan klasifikasi data menggunakan algoritma CART. Sistem ini ditujukan untuk mempermudah penentuan UMKM yang layak untuk diberikan bantuan dan juga dapat mudah dimengerti penggunaanya agar bisa digunakan sebaik mungkin. Tujuan penelitian ini adalah mengimplementasikan algoritma CART untuk model klasifikasi pemberian bantuan UMKM Jasa Telematika Indonesia dengan menggunakan bahasa pemrograman R, PHP 5 dan database MySQL. Penelitian tentang kredit Scoring juga telah dilakukan oleh Saputro, D (2010) dengan judul Model kredit Scoring untuk proses analisa kelayakan fasilitas kredit motor menggunakan metode classification and regression tree (Cart). Di PT.X finance cabang mauk. Aplikasi ini memiliki tujuan adalah Membantu pihak kredit untuk mengetahui parameter dan klasifikasi kredit pada PT.X Finance. Menurut Susanto dan Suryadi (2010), pada klasifikasi algoritma CART (Classification and Regression Trees), sebuah record akan diklasifikasikan ke dalam salah satu dari sekian klasifikasi yang tersedia pada variable tujuan berdasarkan nilai-nilai variabel prediktornya.Langkah-langkah Algoritma CART: a. Susunlah calon cabang (candidate split) yang dilakukan terhadap seluruh variabel prediktor. Daftar yang berisi calon cabang disebut calon cabang mutakhir. b.Berikan penilaian keseluruhan calon cabang mutakhir dengan menghitung besaran (s|t)
c.Tentukan cabang yang memiliki kesesuaian (s|t). Setelah noktah keputusan tidak ada lagi, algoritma CART dihentikan. Kesesuaian (goodness) (s|t) dari calon cabang s pada noktah keputusan t, didefiniskan sebagai persamaan – persamaan berikut : ( |)
LPRQ(s|t)
( |) ∑ ( | )…....... (2)
…….. (1) | (| )
tl= Cabang kiri dari noktah keputusan t tr= Cabang kanan dari noktah keputusan t ………………. (3) (| )
…………. (4) ………….... (5)
(| )
……..(6)
METODE PENELITIAN Metode Peneitian yang diterapkan ini menggunakan tahapan data mining atau disebut juga Knowledge Discovery and Data Mining (KDD) (Han et al .2006) suatu rangkaian proses data mining dapat dibagi menjadi beberapa tahap yang diilustrasikan pada Gambar 1. Tahaptahap tersebut bersifat interaktif, pemakai terlibat langsung atau dengan perantaraan knowledge base. CLEANING & INTEGRATION
DATA MINING
SELECTION & TRANSFORMATION
KNOWLEDGE
EVALUATION & PRESENTATION
Gambar 1. Tahap-Tahap Data Mining (Han et al.2006)
Tahap-tahap data mining ada 5 yaitu : 1. Pembersihan data dan Integrasi data (Cleaning And Integration Data) Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan. Hasil pembersihan data set usaha jasa telematika yang diperoleh dari Susenas tahun 2006 melalui pengisian data kosong dengan nilai mean (untuk data numerik), modus (untuk data kategorik), menghapus data yang tidak konsisten serta outlier sesuai dengan ketentuan (UU No 20 Tahun 2008) menyebabkan reduksi data dari 12541 menjadi 8798. (Tosida et al.2015) 2. Seleksi Data dan Transformasi data (Data Selection and Data Transformation) Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari database. Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. Beberapa metode data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan. Sebagai contoh beberapa metode standar seperti analisis asosiasi dan clustering hanya bisa menerima input data kategorikal. (Tosida et al.2015) 3. Proses mining Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data.Untuk proses mining menggunakan algoritma CART dalam menentukan keputusan kelayakan bantuan UMKM. 4. Evaluasi pola (pattern evaluation),
Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yang ditemukan. Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai.Evaluasi dari penelitian ini menggunakan confusion matrix. 5. Presentasi pengetahuan (knowledge presentation) Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna. Tahap terakhir dari proses data mining adalah bagaimana memformulasikan keputusan atau aksi dari hasil analisis yang didapat. Ada kalanya hal ini harus melibatkan orangorang yang tidak memahami data mining. Karenanya presentasi hasil data mining dalam bentuk pengetahuan yang bisa dipahami semua orang adalah satu tahapan yang diperlukan dalam proses data mining. Dalam presentasi ini, hasil berupa decission tree yang berisi beberapa kaidah dan rule yang akan diimplementasikan ke dalam bentuk sistem berbasis web. HASIL DAN PEMBAHASAN Hasil Hasil yang didapat dari penelitian ini adalah pembuatan sistem klasifikasi bantuan usaha jasa telematika di Indonesia dengan mengunakan fungsi algoritma CART yang digunakan dalam machine learning pada aplikasi Rstudio, data di olah menjadi 2 bagian yaitu data latih sebesar 80% dan data uji sebesar 20% dengan keseluruhan 8798 data, sehingga akan menghasilkan klasifikasi berupa pohon keputusan badan usaha yang layak atau tidak untuk menerima bantuan.
Setelah data selesai diolah dalam aplikasi Rstudio maka akan diimplementasikan dengan web yang dirangcang menggunakan adobe dreamweaver kemudian diterapkan dalam framework yii dan database dibuat dalam aplikasi MySQL. Dalam web klasifikasi ini di bedakan menjadi 2 akses pengguna, yaitu penguna umum untuk melakukan klasifikasi informasi UMKM dan admin untuk mengolah data klasifikasi UMKM. Pembahasan 1.
Cleaning and Integration Data untuk klasifikasi ini telah mengalami tahapan praproses data mining seperti pembersihan data dan integrasi data yang dilakukan penelitian sebelumnya oleh Tosida et al (2015).
2.
Selection Data Data set usaha Jasa Telematika diperoleh dari Susenas (Sensus Nasional) pada tahun 2006 terdiri dari 8798 UMKM Jasa Telematika dengan atribut sebanyak 21 atribut (4 atribut numerik dan 17 atribut kategorik). Agar data lebih ringkas efektif dilakukan seleksi data yang tujuan lainnya juga untuk menentukan kelas kemudian dipilihlah atribut pernah menerima bantuan sebagai kelas. Berikut adalah deskripsi data yang telah dan diseleksi.
Tabel 1. Deskripsi Data UMKM Jasatelematika No. Atribut A. Keterangan Umum 1.
Provinsi
Tipe K
2.
Pendidikan pemilik
K
3.
Bentuk badan hokum
K
4. 5. 6.
Tahun Mulai Operasi Pengguna computer Pengguna internet
K K K
7.
Kelompok Usaha
K
Rentang Nilai 1. 1. 2. 3. 4. 1. 2. 3. 4. 1. 1. 1. 1. 2. 3.
Jawa, 2. Sumatera, 3.Kalimantan, SMA sederajat D4-S1atau lebih D1-D3 < SMA CV Firma Ijin Khusus Instansi Koperasi ≤ 3 tahun Ya Ya Jasa telekomunikasi Konsultasi Hardware Konsultasi Software
1. 2. 1. 2. 1. 1. 2. 1.
Mikro Kecil Mikro Kecil Modal sendiri Kecil Mikro Sedang 2. Banyak
4. Papua 5. Bali&Nusra
5. 6. 7.
Perorangan PT Yayasan
2. 2. 2. 4.
> 3 tahun Tidak Tidak Lainnya
B. Finansial 1.
Penjualan
N
2.
Total asset
N
3.
Modal
K
4.
tenaga kerja
N
5.
balas jasa
N
3.
Menengah
3. Menengah 2.
Modal Pihak lain
3.
Menengah
3.menengah
C. Kendala & Propek Usaha
1
Kesulitan
K
2 3 4
Koperasi Kemitraan Menerima pelatihan
5
Pemasaran
6
Kondisi perusahaan 3 bulan lalu
7
Perkiraan prospek usaha 3 bln akan datang
K K K K K
K
K 8
Rencana
1. bahan baku/barang dagangan 2. BBM/energy 3. ketrampilan tenaga kerja 4. Lainnya 1. Ya 1. Ya 1. Ya 1. Ekspor 2. Kabupaten 1. Sama baik 2. Sama buruk 3. Lebih baik 1. Lebih baik 2. Lebih buruk 3. Sama baik 1. Tidak 2. Ya, Memperluas usaha 3. Ya, membuka cabang
5. Pemasaran 6.
Permodalan
7.
Tidak ada kesulitan
8. 9. 2. 2. 2. 3. 4. 4. 5.
Transportasi Upah buruh Tidak Tidak Tidak Luar Provinsi Provinsi Lebih buruk Tidak dapat dibandingkan
4. 5.
Sama buruk Tidak dapat dibandingkan
4.
Ya, meningkatkan keahlian
5.
Ya,lainnya
Tabel 2. Atribut Kelas yang telah di seleksi No. 1
Rentang Nilai
Atribut Menerima bantuan
1. Tidak Menerima Bantuan
2. Menerima Bantuan
2. Proses Mining 2.1 Algortima CART Data ini dimasukan kedalam proses mining menggunakan algoritma CART yang akan mengeluarkan hasil decission tree. Data di bagi menjadi 2 yaitu data latih 80% yang nantinya dimasukan dalam proses mining dan data uji 20% digunakan sebagai validasi decission tree yang telah dibuat pola data aslinya. Berikut flowchart untuk algoritma CART. Gambar 2. Flowchart algoritma CART Fathurahman et.al 2014.
Berikut merupakan penjelasan dari flowchart algoritma CART untuk membangun pohon keputusan : 1. Masukan data latih. 2. Tentukan calon cabang yang akan di bentuk (Kandidat Split). 3. Lakukan split pada data dan membuat interval sehingga didapatkan nilaisplit dari setiap atribut. 4. Lakukan perhitungan Prior Length (PL) dan Prior Right (PR). 5. Dari hasil menghitung PL dan PR bisa dilanjutkan untuk menghitung nilai goodness 6. Setelah semua nilai goodness dihitung dari setiap cabang, kita mencari nilai goodness yang paling besar . 7. Cek apakah semua atribut sudah dibentuk pada pohon. Jika belum, ulangi dari langkah ke 5 8. Generate pohon keputusan 9. Selesai. Tabel 3. Contoh Implementasi bentuk_badan_ hukum Perorangan Koperasi Firma Perorangan
CV CV Ijin Khusus dari instansi terkait Perorangan
Perorangan
Perorangan
kelompok_usaha Warung telekomunikasi Warung telekomunikasi Warung telekomunikasi Warung telekomunikasi Warung telekomunikasi Warung telekomunikasi Warung telekomunikasi Warung telekomunikasi Jasa telekomunkasi lainnya Jasa telekomunkasi lainnya
Modal modal sendiri modal sendiri modal sendiri modal sendiri model pihak lain modal sendiri modal sendiri modal sendiri model pihak lain modal sendiri
Cabang Kiri
M= Pihak Lain
M = sendiri
P = Mikro
P = Kecil
11
P = Kecil
P = Mikro
12
Ta = Mikro
Ta = Kecil
13
Ta = Kecil
Ta = Mikro
Kemudian dihitung nilai Candidate split purity left PL dan purity right PR menggunakan rumus yang sudah ditentukan. Berikut adalah perhitungan dari tiap Candidate Split, PL, PR, P(j|tl), P(j|tr) yang memungkinkan “ya” atau “tidak” dan perhitungan nilai kesesuaian (goodnees) pada atribut bentuk badan hukum.disajikan pada tabel 5,6,7. Tabel 5. Perhitungan PL, PR , Bentuk badan hukum Perorangan
Total
Y
T
Jumlah Data
PL
PR
5
2
3
10
0.5
0.5
Koperasi
1
0
1
10
0.1
0.9
Firma
1
0
1
10
0.1
0.9
CV
2
2
0
10
0.2
0.8
Ijin khusus instansi terkait
1
0
1
10
0.1
0.9
penjualan
total_aset
menerima_ bantuan
Mikro
Mikro
Tidak
Mikro
Mikro
Tidak
Tabel 6. perhitungan P(j|tl) dan P(j|tr)
Mikro
Mikro
Tidak
Y
T
Mikro
Kecil
Ya
Kecil
Kecil
Ya
2
Mikro
Mikro
Ya
Bentuk badan hukum Peroranga n Koperasi
Mikro
Kecil
Tidak
Mikro
Kecil
Mikro
Mikro
P(j|tl ) Y
P(j|tl ) T
P(j|tr )Y
P(j|tr )T
3
Jumla h Data 10
0.4
0.6
0.4
0.6
0
1
10
0
1
Firma
0
1
10
0
1
Tidak
CV
2
0
10
1
0
0.44 4 0.44 4 0.25
0.55 5 0.55 5 0.75
Kecil
Ya
0
1
10
0
1
0.44 4
0.55 5
Kecil
Tidak
Ijin khusus instansi terkait
Tabel 4. Daftar Calon Mutakhir No
9 10
Cabang Kanan BBH = k , f , cv , ijin khusus dari instansi terkait BBH = p, f , cv , ijin khusus dari instansi terkait BBH = k , p , cv , ijin khusus dari instansi terkait BBH = k , f , p , ijin khusus dari instansi terkait
1
BBH = Perorangan
2
BBH = koperasi
3
BBH = Firma
4 5
BBH = CV BBH = ijin khusus dari instansi terkait
6
KU = warung telekomunikasi
KU = Jasa telekomunikasi
7
KU = Jasa telekomunikasi
KU = Warung telekomunikasi
8
M = sendiri
M = Pihak Lain
BBH = k , f , cv , p
Tabel 7. kesesuaian calon cabang Bentuk badan hokum Perorangan
2(Pl Pr)
Q(s|t)
phi (s|t)
0.5
0
0
Koperasi
0.18
0.888
0.16
Firma
0.18
0.888
0.16
CV
0.32
1.5
0.48
Ijin khusus instansi terkait
0.18
0.888
0.16
2.1. Hasil Mining Proses mining data UMKM jasa telematika ini menggunakan algoritma CART dalam menentukan kelayakan badan usaha untuk menerima bantuan. Beberapa hasil percobaan dari penelitian ini dengan 2 skenario model yang berbeda agar dapat diketahui tingkat akurasi yang tercipta. Berikut di sajikan pada gambar 10, dan 11 :
pada data latih dan 63,92% pada data uji.Maka dipilihlah model B pada penelitian kali ini dengan akurasi yang paling tinggi. 3.
Evaluasi Pola Dalam evaluasi pola klasifikasi ini memakai confusion matrix dengan menggunakan persamaan (7) sebagai berikut : 3.1. Confusion Matrix Data Latih 21 Atribut Tetap
Akurasi Data Latih 63.00% 62.00% 61.00% 60.00%
Akurasi
A
B
21 (Tetap)
21 (Reduksi)
Gambar 5. Hasil Summary Data Latih Menggunakan Aplikasi Rstudio Dari Gambar 5 Diketahui :
Model Atribut
Gambar 3. Chart Nilai Akurasi Data Latih dengan 2 model.
a. b. c. d. e.
True Positive (TP) = 2274 True Negative (TN) = 2105 False Positive (FP) = 1258 False Negative (FN) = 1401 Jumlah Data = 7038
Akurasi Data Uji 80.00% 70.00% 60.00% 50.00%
Akurasi
A
B
Model
21 (Tetap)
21 (Reduksi)
Atribut
Gambar 4. Chart Nilai Akurasi Data Latih dengan 2 model Berdasarkan Gambar 10,11 dapat disimpulkan bahwa model A dengan 21 atribut tetap adalah yang paling baik nilai akurasinya yaitu 62,21% pada data latih dan 73,97% pada data uji. sedangkan model B dengan 21 yang direduksi menghasilkan nilai akurasi yaitu 61,18% a. True Positive (TP) = 2434 b. True Negative (TN) = 1872 c. False Positive (FP) = 1098 d. False Negative (FN) = 1634
Dari perhitungan Confusion matrix tersebut bahwa tingkat akurasi yang dimiliki oleh klasifikasi ini adalah 62,21% sesuai data latih yang digunakan dengan jumlah 7038 data. 3.2. Confusion Matrix Data Latih 21 Atribut Reduksi
Gambar 6. Hasil Summary Data Latih Menggunakan Aplikasi Rstudio Dari Gambar 6 Diketahui : e.
Jumlah Data
= 7038
yang dimiliki oleh klasifikasi ini adalah 73,97% sesuai data latih yang digunakan dengan jumlah 1760 data. Dari perhitungan Confusion matrix tersebut bahwa tingkat akurasi yang dimiliki oleh klasifikasi ini adalah 61,18% sesuai data latih yang digunakan dengan jumlah 7038 data. 3.3. Confusion Matrix Data Uji 21 Atribut Tetap
3.4. Confusion Matrix Data Uji 21 Atribut Reduksi
Gambar 8. Hasil Summary Data Uji Menggunakan Aplikasi Rstudio Dari Gambar 8 Diketahui : a. b. c. d. e.
Gambar 7. Hasil Summary Data Uji Menggunakan Aplikasi Rstudio
True Positive (TP) = 766 True Negative (TN) = 359 False Positive (FP) = 149 False Negative (FN) = 486 Jumlah Data = 1760
Dari Gambar 7 Diketahui : a. b. c. d. e.
True Positive (TP) = 678 True Negative (TN) = 324 False Positive (FP) = 237 False Negative (FN) = 221 Jumlah Data = 1760
Dari perhitungan Confusion matrix tersebut bahwa tingkat akurasi yang dimiliki oleh klasifikasi ini adalah 61,93% sesuai data latih yang digunakan dengan jumlah 1760 data. 4.
Dari perhitungan Confusion matrix tersebut bahwa tingkat akurasi
Presentasi Pengetahuan Berikut ini adalah decission tree hasil dari skenario model yang dipilih sebelumnya yaitu dengan model 21 atribut tetap, disajikan pada gambar 9 :
Gambar 9. Hasil Decission tree
Dari gambar 9 tersebut algoritma CART hanya mengeluarkan atribut yang paling mempengaruhi dalam klasifikasi pemberian bantuan pada UMKM. Atribut Menerima Pelatiahan terpilih sebagai noktah dasar. Kondisi ini sesuai dengan Kemenkop UKM apabila UMKM yang sudah melakukan pelatihan dengan benar akan menerima bantuan.
4.3. Form Klasifikasi Pada tampilan ini berisi form isian data badan usaha yang akan diklasifikasi berikut dengan tombol klasifikasinya kemudian menghasilkan output berupa kelayakan badan usaha tersebut dalam menerima bantuan atau tidak, berikut disajikan pada Gambar 12 dan 13 untuk hasil keputusan.
UMKM yang salah dalam mengikuti pelatihan akan di proses kembali berdasarkan Rencana, apabila UMKM telah mempunyai rencana maka akan di berikan bantuan. UMKM akan terus diproses berdasarkan noktah keputusan atribut seterusnya. 4.1. Tampilan Index / Halaman Utama Pada halaman ini berisi menu awal dalam sistem klasifikasi ini dimana kita bisa memulai klasifikasi bantuan usaha jasa telematika, berikut disajikan pada Gambar 10.
Gambar 10. Tampilan Index 4.2. Tampilan Login Tampilan ini berfungsi sebagai autentikasi user yang berhak menghapus atau mengedit data yang ada pada web tersebut. Berikut disajikan pada Gambar 11.
Gambar 12. Tampilan Form Klasifikasi
Gambar 11. Tampilan Login
Gambar 13. Tampilan Hasil Keputusan
4.4. Tampilan Data Klasifikasi Pada tampilan ini berisi data yang telah masuk kedalam sistem klasifikasi yang telah di input sebelumnya dan bagi admin bisa langsung mengedit atau menghapus data tersebut. Berikut disajikan pada Gambar 14.
Gambar 14. Tampilan Data Klasifikasi KESIMPULAN Klasifikasi bantuan UMKM jasa telematika Indonesia dengan menggunakan algoritma CART ini dibuat untuk mengetahui UMKM yang akan menerima bantuan atau tidak, dan juga untuk pengguna sistem ini mencakup admin staf kemenkop UKM mengetahui informasi data UMKM jasa telematika yang ada di Indonesia. klasifikasi ini diolah dalam machine learning mengunakan aplikasi Rstudio, setelah menghasilkan pohon keputusan lalu diimplementasikan memakai website yang dirancang menggunakan aplikasi Adobe Dreamweaver CS6 dengan bahasa pemograman PHP yang tersimpan pada framework Yii untuk desain template memakai Bootstrap dan database menggunakan MySQL.
Tahap Implementasi dan pembuatan klasifikasi usaha jasa telematika ini dilakukan dari data susenas 2006. yang sebelumnya sudah dilakukan pembersihan data noise,integrasi data dari setiap data dan seleksi atribut yang di pilih menjadi 21 atribut oleh (Tosida et.al, 2015) yang masih dalam tahap visualisasi maka perlu dikembangkan untuk menunjang pemilihan dalam pemberian bantuan pada UMKM jasa telematika.sehingga dibuatlah website klasifikasi ini dengan fitur yang didalamnya berupa proses klasifikasi atribut menggunakan algoritma CART dan menampilkan decission tree untuk mengetahui UMKM yang layak diberi bantauan atau tidak . Jumlah data keseluruhan yang di klasifikasikan adalah 8798 data. Data di bagi menjadi 2 yaitu 80% data latih dan 20% data uji. Dalam penelitian ini data menggunakan 2 model dengan 21 atribut tetap model (A) dan 21 atribut yang di reduksi model (B). Reduksi atribut merupakan penyederhanan rentang nilai yang ada pada setiap atribut, maka atribut yang memiliki nilai rentang yang banyak maka akan di reduksi menjadi lebih sederhana dan sedikit. hasil uji coba validasi berdasarkan confusion matrix algoritma CART ini mencapai 62% data latih dan 73% data uji dengan model (A). 61% data latih dan 63% data uji dengan model (B). Maka dipilihlah model (A) dengan 21 atribut tetap untuk implementasinya karena memiliki nilai akurasi lebih tinggi berdasarkan perhitungan confusion matrix dari proses mining yang membandingkan 2 skenario model. DAFTAR PUSTAKA . Fathurahman et al. 2014. Analisis Dan Implementasi Algoritma ID3 Dan CART Pada Penilaian Kinerja Pegawai. Fakultas Informatika, Universitas Telkom, Bandung.
Han et al. 2006. Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers Inc, San Francisco. Hardiani, 2015. Implementasi Self Organizing Maps (SOM) Untuk Clustering Usaha Jasa Telematika Indonesia Menggunakan Matlab. Skripsi. Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Pakuan, Bogor.
Larose, 2006. Data mining merupakan analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkas data dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik data. Saputro, D. 2010. Model kredit Scoring untuk proses analisa kelayakan fasilitas kredit motor menggunakan metode classification and regression tree (Cart). Universitas Islam Syarief Hidayatullah, Jakarta Tosida et al , 2012. Strategi Peningkatan
Daya Saing Melalui Framework Rantai Nilai Untuk Kompetensi Usaha Jasa Telematika Indonesia. Program Studi Ilmu Komputer, FMIPA, Universitas Pakuan Tosida, E. T. 2015. Pengembangan Model Data Mining Kelayakan Bantuan Usaha Bagi Usaha Mikro Kecil Menengah Jasa Telematika Indonesia. Tesis. Sekolah Pascasarjana Institut Pertanian Bogor, Bogor. Winesett, J. 2012. Web Application Development with Yii and PHP. Packt Publishing, Birmingham, Inggris.