MODEL CREDIT SCORING UNTUK PROSES ANALISA KELAYAKAN FASILITAS KREDIT MOTOR MENGGUNAKAN METODE CLASSIFICATION AND REGRESSION TREE (CART) (Studi Kasus PT. X Finance Cabang Mauk Desember 2010)
Dendy Saputro
PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA 2011/1432 H
PENGESAHAN UJIAN Skripsi berjudul “ MODEL CREDIT SCORING UNTUK PROSES ANALISA KELAYAKAN FASILITAS KREDIT MOTOR MENGGUNAKAN METODE CLASSIFICATION AND REGRESSION TREE (CART) ” dengan studi kasus di PT X Finance cabang Mauk pada Desember 2010 yang ditulis oleh Dendy Saputro, NIM 107094002797 telah di uji dan dinyatakankan lulus dalam sidang Munaqosyah Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta pada tanggal 07 Juni 2011. Skripsi ini telah diterima sebagai salah satu syarat untuk memperoleh gelar sarjana strata satu (S1) Program Matematika. Menyetujui :
Penguji 1,
Penguji 2,
Gustina Elfiyanti, M.Si. NIP. 19820820 200901 2 006
Suma’inna, M.Si. NIP. 150 408 699
Pembimbing 1,
Pembimbing 2,
Hermawan Setiawan, M.Kom NIP. 19740623 199312 2 001
Bambang Ruswandi, M.Stat NIDN. 0305108301 Mengetahui :
Dekan Fakultas Sains dan Teknologi,
Ketua Program Studi Matematika,
DR. Syopiansyah Jaya Putra, M. Sis NIP. 19680112 00112 1 001
Yanne Irene, M. Si NIP. 19741231 200501 2 018
ii
ii
PERNYATAAN
DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENARBENAR HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN SEBAGAI SKRIPSI PADA PERGURUAN TINGGI ATAU LEMBAGA MANAPUN.
Jakarta, Juni 2011
Dendy Saputro 107094002797
iii
ABSTRAK
Pesatnya kemajuan teknologi transportasi merespon produsen dan distributor kendaraan bermotor bersaing secara ekstra. Pembelian secara kredit merupakan salah satu solusi yang positif dalam memenuhi permintaan kendaraan konsumen saat ini. Hal ini pula yang membuat pihak lembaga pembiayaan untuk melakukan serangkaian analisa kredit terhadap aplikasi permohonan kredit calon konsumen guna mensiasati besarnya resiko kredit yang akan terjadi. Model Credit Scoring dengan metode Classification and Regression Tree (CART) merupakan salah satu mediasi dalam menganalisa kelayakan fasilitas kredit calon konsumen. Pada penelitian ini, terdapat tujuh variabel uji yang digunakan dalam penelitian yaitu, variabel approval, uang muka, harga OTR, bunga pinjaman, tenor pembayaran, kondisi kendaraan, dan jenis kelamin. Hasil dari penelitian yang telah dilakukan ternyata hanya terdapat empat variabel yang berpengaruh terhadap keputusan persetujuan pemberian kelayakan fasilitas kredit yakni variabel uang muka, harga OTR, bunga pinjaman, dan tenor pembayaran dengan nilai kontribusi masing-masing variabel berturut-turut 100, 24.04, 21.5, 6.69. Kata Kunci: Analisa Kredit, Credit Scoring, CART, Approval.
v
ABSTRACT The advancement of transportation technology responds the vehicle’s producer and distributor to compete maximally. The purchase of motorcycle on credit is one positive solution to fulfill the consumer request nowadays. This also makes the financial institution to conduct a series of credit analysis on the prospective buyers’loan application to reduce credit risk Credit scoring model using the Classification and Regression Tree (CART) method is one of the mediation in analyzing the prospective buyers’ credit facility properness. In this research, there are seven variables used in the making of credit scoring model: approval variable, down payment, OTR price, loan interest, tenor payment, vehicle condition, and gender. The research result, however, only shows four variables that influence on the credit approval decision: down payment variable, OTR price, loan interest, and tenor payment with the contribution score of each variable in succession 100, 24.04, 21.5, 6.69.
Key words: Credit Analysis, Credit Scoring, CART, Approval.
vi
KATA PENGANTAR
Segala puji bagi Allah SWT, atas segala nikmat dan rahmat-Nya kepadaku. Shalawat teriring salam semoga selalu tercurah kepada junjungan kita, Baginda Nabi Besar Muhammad SAW. Dengan mengucap syukur Alhamdulillah berkat rahmat dan izin-Nya, akhirnya penulis dapat menyelesaikan skripsi penelitian yang berjudul “ MODEL CREDIT SCORING UNTUK PROSES ANALISA KELAYAKAN FASILITAS KREDIT MOTOR MENGGUNAKAN METODE CLASSIFICATION AND REGRESSION TREE (CART) ” dengan studi kasus di PT X Finance cabang Mauk pada Desember 2010. Pada penulisan skripsi ini, penulis mendapat bimbingan dan bantuan dari berbagai pihak, sehingga dalam kesempatan yang berbahagia ini penulis menghaturkan ucapan Terima Kasih kepada : 1.
Dr. Syopiansyah Jaya Putra, M.Sis, Dekan Fakultas Sains dan Teknologi.
2.
Yanne Irene, M.Si. Ketua Program Studi Matematika dan Suma’inna, M.Si, Sekretaris Program Studi Matematika.
3.
Hermawan Setiawan, M.Ti, selaku Pembimbing I.
4.
Bambang Ruswandi, M.Stat, selaku Pembimbing II.
5.
Seluruh Dosen Program Studi Matematika, terima kasih atas pengajaran dan ilmu yang telah diberikan kepada penulis.
vii
6.
Kedua orang tua, Bapak dan Ibu, mas Wawan, mbak Uthi, Opi, dan tentunya Keisha, terima kasih atas kasih sayang, dukungan dan semangat tiada henti yang membuat penulis bertahan hingga sejauh ini.
7.
Keluarga besar H. Daniel Asril, terima kasih atas doa dan semua bantuan yang tidak pernah terputus sampai saaat ini.
8.
Cyka, Binu, Cumie, Inoy, Nita, Abang, dan terkhusus Alm. Eja, dan semua sahabat-sahabat tersayang terima kasih untuk semua dukungan dan sekian tahun kebersamaan terkhusus keluarga besar Bapak Suherman, Bapak, Mama, Kaka, dan Bedhot.
9.
Atunku Yufriska Citradini terima kasih atas semangat serta kesediaannya mendengarkan curhatan selama ini dan semua teman-teman Mandiri TSC Jakarta.
10. Sahabat-sahabat terbaik, Ade, Icha, Widy, Dhila, Febri, Laung, Ubay, Gerdy, Rahmat, Afif, Angge, Asep, Opank, Cheper, terima kasih untuk dukungannya selama ini, serta teman-teman Matematika 2007. 11. Kak Dennis, Kak Mahmudi, Selly, Tami dan seluruh keluarga besar HIMATIKA UIN Jakarta. Dengan terselesaikannya skripsi ini, penulis berharap dapat memberikan sedikit kontribusi yang berarti, baik untuk pembaca dan khususnya untuk penulis. Berkaitan dengan belum sempurnanya penyusunan skripsi ini, maka dari itu kritik dan saran yang bersifat konstruktif sangat penulis harapkan. Jakarta, 1 Mei 2011 Penulis
viii
DAFTAR ISI
HALAMAN JUDUL …………………………………………………….....
i
PENGESAHAN UJIAN ......................................................................... ......
ii
PERNYATAAN ............................................................................................
iii
PERSEMBAHAN DAN MOTTO ................................................................
iv
ABSTRAK ............................................................................................ ........
v
ABSTRACT ............................................................................................. .... .
vi
KATA PENGANTAR ........................................................................... .......
vii
DAFTAR ISI ............................................................................................. .. .
ix
DAFTAR TABEL ………………………………………… .........................
xii
DAFTAR GAMBAR ......................................................................... ...........
xiii
BAB I PENDAHULUAN ...........................................................................
1
1.1. Latar Belakang ..........................................................................
1
1.2. Permasalahan .............................................................................
3
1.3. Pembatasan Masalah .................................................................
3
1.4. Tujuan Penelitian ......................................................................
3
1.5. Manfaat Penelitian ....................................................................
4
BAB II LANDASAN TEORI ......................................................................
5
2.1. Kredit .........................................................................................
5
2.2. Analisis Cross Tabulation .........................................................
6
) ...........................................................
7
2.3. Credit Scoring ...........................................................................
8
2.2.1 Uji Chi-Square (
ix
2.4. Decisoin Tree ............................................................................
10
2.5. Classification and Regression Tree (CART) ............................
13
2.5.1 Classification Tree .............................................................
15
2.5.2 Maksimum Tree .................................................................
19
2.5.3 Optimum Tree ....................................................................
21
BAB III METODOLOGI PENELITIAN 3.1 Waktu dan Tempat Penelitian
................................................
23
3.2. Metode Pengumpulan Data ......................................................
23
3.3. Metode Pengolahan Data ..........................................................
24
3.3.1 Analisis Cross Tabulation ..................................................
24
3.3.2 Pengolahan Data dengan CART ........................................
26
3.4. Alur Penelitian ..........................................................................
28
BAB IV HASIL DAN PEMBAHASAN 4.1. Analisis Pendahuluan .................................................................
29
4.1.1 Statistika Deskriptif ............................................................
29
4.1.2 Analisis Cross Tabulasi .......................................................
31
4.2 Analisis Hasil CART ...................................................................
35
4.2.1 Maksimum Tree ...................................................................
35
4.2.2 Optimal Tree ........................................................................
41
BAB V KESIMPULAN DAN SARAN .......................................................
48
5.1. Kesimpulan .............................................................................
48
5.2. Saran .......................................................................................
50
DAFTAR PUSTAKA ………………………………………… ...................
51 x
LAMPIRAN ......................................................................... .........................
53
RIWAYAT PENULIS ......................................................................... .........
54
xi
DAFTAR TABEL
Tabel 4.1 : Statistik Deskriptif untuk Data Kuantitatif .................................
29
Tabel 4.2 : Statistik Deskriptif untuk Data Kualitatif ...................................
30
Tabel 4.3 : CrossTabulasion untuk Data Kuantitatif ....................................
31
Tabel 4.4 : CrossTabulasion untuk Data Kualitatif ......................................
32
Tabel 4.5 : Chi Square Test ...........................................................................
33
Tabel 4.6 : Misclassification untuk Test Sample pada Maksimum Tree.......
36
Tabel 4.7 : Misclassification untuk Test Sample pada Optimal Tree............
41
Tabel 4.8 : GAINS CHART ...........................................................................
45
Tabel 4.9 : Prediction Success ......................................................................
46
Tabel 4.10 : Variabel Terpenting ..................................................................
47
xii
DAFTAR GAMBAR
Gambar 2.1 : Contoh Bagan Klasifikasi DecisionTtree .............................. 14 Gambar 2.2 : Diagram Algoritma Pemisah CART ..................................... 16 Gambar 2.3 : Grafik Pemisahan Twoing Splitting Rule .........................
18
Gambar 3.1 : Diagram Alur Penelitian ....................................................... 28 Gambar 4.1 : Diagram Salah Satu Cabang Maksimum Tree ....................... 37 Gambar 4.2 : Splitter Optimal Tree Menggunakan Twoing Splitting Rule .. 42 Gambar 4.3 : Gains CART Optimal Tree .................................................... 45 Gambar 5.1 : Optimal Tree .......................................................................... 49
xiii
PERSEMBAHAN
Sebuah persembahan kecil, teruntuk kedua orang tuaku, kedua kakakku, adik perempuanku, serta bidadari kecil yang selalu memberi senyuman baru dirumah “Keisha”, keluarga besarku, keluarga besar Bapak H. Daniel Asril, dan sahabat-sahabat terbaik yang selalu ada dan berjuang bersama dalam sebuah semangat kekeluargaan.
MOTTO
“Barang siapa yang menghendaki dunia maka hendaknya dia berilmu. Dan barang siapa yang menghendaki akhirat maka hendaknya dia berilmu. Dan barang siapa yang menghendaki dunia dan akhirat maka hendaknya dia berilmu.” [Sa’id bin Sholih al-Ghomidi]
Barang siapa berjalan untuk menuntut ilmu maka Allah akan memudahkan baginya jalan ke syorga .[HR. Muslim].
iv
BAB I PENDAHULUAN
1.1 Latar Belakang Kemajuan dan perkembangan dunia di segala bidang saat ini mendorong seluruh lapisan masyarakat melakukan semua aktivitas secara cepat. Masyarakat membutuhkan sarana-sarana untuk menunjang semua aktifitas tersebut, salah satunya adalah kendaraan bermotor yang saat ini memang dirasa sangat diperlukan. Masyarakat dapat memiliki kendaraan bermotor selain membelinya dengan cara tunai juga dapat membelinya dengan cara kredit yang akhir-akhir ini banyak penawaran-penawaran khusus yang dilakukan oleh beberapa perusahaan jasa pengkreditan dengan uang muka yang terjangkau, salah satunya adalah PT. X Finance. Walaupun masyarakat dipermudah dengan adanya penawaran khusus dengan uang muka yang terjangkau, pihak perusahaan juga melakukan serangkaian proses analisis kredit pada setiap konsumen yang mengajukan permohonan kredit sebelum menyetujuinya. Serangkaian proses tersebut diawali dari proses vertel yaitu adanya dokumen permohonan konsumen ke dealer yang dilanjutkan dengan mendatangkan surveyor ke rumah masingmasing konsumen untuk meminta persyaratan dokumen konsumen. Kemudian akan dilanjutkan dengan analisis kredit yang dilakukan oleh pihak perusahaan. Proses analisis kredit tersebut dalam pengerjaannya membutuhkan waktu yang tidak sebentar. Fenomena yang terjadi saat ini adalah banyaknya permohonan 1
kredit yang dilakukan konsumen akan tetapi pihak perusahaan hanya bisa menganalisa beberapa konsumen saja dalam sehari. Persaingan bisnis pengkreditan kendaraan bermotor dan keterbatasan untuk menganalisa dokumen kredit konsumen perhari mendorong pihak perusahaan dan penulis untuk melakukan inovasi dan perbaikan proses analisa kredit yang sudah ada. Inovasi dan perbaikan proses yang dimaksud adalah dengan mencoba membuat model credit scoring yang belum dimiliki oleh pihak perusahan, selanjutnya model tersebut akan digunakan untuk membantu memberikan hasil analisa kelayakan kredit secara tepat terhadap permohonan kredit konsumen perhari. Dari penelitian Dwi Andhayani, dkk tahun 2008 telah dibuat model credit scoring analisa kelayakan kredit konsumen KPR salah satu Bank pada suatu daerah yang menghasilkan model credit scoring berupa model regresi logistik. Selanjutnya dalam penelitian ini penulis bertujuan membuat model credit scoring dengan menggunakan metode Classification and Regression Tree (CART) untuk memperoleh model credit scoring konsumen kredit kendaraan bermotor yang diinginkan. Oleh karena itu, judul penelitian ini adalah “ MODEL CREDIT SCORING UNTUK PROSES ANALISA KELAYAKAN
FASILITAS
KREDIT
MOTOR
MENGGUNAKAN
METODE CLASSIFICATION AND REGRESSION TREE (CART) ” dengan studi kasus di PT X Finance cabang Mauk pada Desember 2010.
2
1.2 Permasalahan Berdasarkan latar belakang di atas maka dapat dirumuskan permasalahan sebagai berikut : 1. Parameter apakah yang menjadi faktor penting dalam model credit scoring penilaian kelayakan Kredit Kendaraan Bermotor di PT. X Finance ? 2. Bagaimana pola klasifikasi Permohonan Kredit yang disetujui oleh PT. X Finance? 3. Bagaimana model tree optimum credit scoring dengan menggunakan metode CART ? 1.3 Pembatasan Masalah Data yang digunakan dalam penelitian ini adalah data pribadi konsumen pemohon kredit, seperti data jenis kelamin, uang muka, tenor pembayaran, kondisi kendaraan, besar OTR dan bunga pinjaman yang penulis peroleh dari divisi Risk Management PT. X Finance yang selanjutnya akan dibuat model credit scoring dengan metode Classification and Regression Tree (CART). 1.4 Tujuan Penelitian Adapun tujuan yang hendak dicapai dalam penelitian kali ini adalah : 1.
Menentukan parameter yang menjadi faktor penting dalam model credit scoring penilaian kelayakan Kredit Kendaraan Bermotor di PT. X Finance.
3
2.
Mengetahui pola klasifikasi Permohonan Kredit yang disetujui oleh PT. X Finance.
3.
Mengetahui model optimum tree credit scoring dengan menggunakan metode CART.
1.5 Manfaat Penelitian Hal-hal yang dapat diperoleh dari penelitian kali ini adalah : 1.
Model credit scoring yang diperoleh akan bermanfaat untuk pihak perusahaan dalam menentukan kelayakan pemberian kredit kepada calon konsumen dengan lebih tepat dan cepat.
2.
Bagi penulis menambah wawasan mengenai credit scoring khususnya metode Classification and Regression Tree (CART).
4
BAB II LANDASAN TEORI
2.1 Kredit Pengertian kredit menurut undang-undang No. 7 Tahun 1992 tentang Perbankan adalah : “ Penyediaan uang atau tagihan yang dapat dipersamakan dengan itu, berdasarkan persetujuan kesepakatan pinjam-meminjam antara bank dengan pihak lain yang mewajibkan pihak meminjam untuk melunasi hutangnya setelah jangka waktu tertentu dengan jumlah bunga, imbalan atau pembagian hasil keuntungan ”. Jika dilihat dari fungsinya, fasilitas kredit dikatakan sangat bermanfaat bagi berbagai pihak [10], di antaranya : a.
Bagi dunia usaha (termasuk usaha kecil) atau debitur:
Sebagai sumber permodalan untuk menjaga kelangsungan atau meningkatkan usahanya.
Pengembalian kredit wajib dilakukan tepat waktu, diharapkan dapat diperoleh dari keuntungan usahanya
Memberi keuntungan usaha dengan adanya tambahan modal dan berkembangnya usaha
b.
Bagi lembaga keuangan (termasuk bank) :
Menyalurkan dana masyarakat (deposito, tabungan, giro) dalam bentuk kredit kepada dunia usaha.
Memberi keuntungan dari selisih bunga pemberian kredit atau jasa lainnya
5
Adapun jenis-jenis kredit disesuaikan dengan kebutuhan debitur. Jenis kredit yang akan dibahas dalam penelitian ini adalah jenis kredit kendaraan bermotor. Untuk mengkredit sebuah kendaraan bermotor calon konsumen ataupun calon debitur harus mengikuti serangkaian prosedur yang sudah ditetapkan oleh pihak perusahaan jasa pengkreditan. Prosedur yang dimaksud dimulai dari pengisian formulir pengajuan kredit sampai pengecekan langsung ke tiap-tiap rumah calon konsumen oleh surveyor sampai tahap analisa kredit yang dilakukan oleh pihak perusahaan untuk selanjutnya pemberian keputusan apakah permohonan kredit tersebut diterima atau ditolak berdasarkan ketentuan analisa kredit yang sudah ada. Keputusan perusahaan untuk menerima atau menolak sebuah permohonan kredit konsumen didasarkan pada analisa kredit berdasarkan formulir dokumen yang telah diisi oleh calon konsumen. Formulir tersebut berisi mengenai seluruh keterangan terperinci tentang pribadi calon konsumen, mulai dari nama, status perkawinan, besar pemasukan perbulan, sampai dengan biaya pengeluaran yang wajib dikeluarkan calon konsumen tiap bulannya.
2.2 Analisis Cross Tabulation
Cross tabulation atau tabulasi silang merupakan prosedur yang digunakan untuk menyajikan deskriptif suatu data dalam bentuk baris dan kolom [9]. Data yang digunakan dalam analisa ini adalah data yang berskala ordinal dan nominal. Pada dasarnya sebuah analisa crosstab dalam proses
6
pengerjaannya sama dengan menu TABLES pada MS. Excel biasa, perbedaannya terletak pada adanya metode statistik yang dipakai untuk mengukur tingkat asosiasi (hubungan) antara dua variabel yang tersedia pada crosstab, sedangkan dalam menu TABLES tidak menyediakan metode perhitungan statistik tersebut. Dalam prakteknya, alat statistik yang sering digunakan untuk mengukur tingkat asosiasi (hubungan) antar variabel yang tersedia dalam crosstab adalah chi-square. Alat ini, dapat diterapkan untuk menguji ada atau tidaknya hubungan antara baris dan kolom dari sebuah crosstab.
2.2.1
Uji Chi Square (
)
Maksud dan tujuan dari pengujian menggunakan metode uji Chi-Square (Khi-kuadrat) adalah membandingkan antara fakta yang diperoleh berdasarkan hasil observasi dan fakta yang didasarkan secara teoritis (yang diharapkan) [7]. Hal ini sejalan dengan konsep kenyataan yang sering terjadi, bahwa hasil observasi biasanya selalu tidak tepat dengan yang diharapkan atau tidak sesuai dengan yang direncanakan berdasarkan konsep dari teorinya (sesuai dengan aturan-aturan teori kemungkinan atau teori probabilitinya). ∑
(
)
(
di mana : = banyak kasus yang diamati dalam kategori ke-i = banyak kasus yang diharapkan dalam kategori ke-i
7
)
= banyaknya peristiwa atau kejadian ∑
= penjumlahan semua kategori (k)
Uji Chi Square dalam kaitannya dengan analisis cross tabulasi berfungsi untuk mengamati ada atau tidaknya hubungan atau korelasi ( ) antara baris dan kolom sebuah crosstab adapun dasar pengambilan keputusannya adalah sebagai berikut : H0 :
: Tidak ada hubungan antara baris dan kolom
H1 :
: Ada hubungan antara baris dan kolom
dengan kriteria uji : Jika
>
maka H0 ditolak.
Jika
<
maka H0 diterima.
2.3 Credit Scoring
Credit scoring adalah metode yang digunakan untuk mengevaluasi resiko kredit dalam hal permohonan pinjaman dari konsumen [1]. Metode ini digunakan untuk mengklasifikasikan konsumen yang mengajukan kredit termasuk ke dalam kelompok baik atau buruk. Credit scoring mencoba untuk mengelompokkan keragaman dari karakteristik konsumen yang mengajukan permintaan kredit berdasarkan kesalahan dan kelalaian atas kewajiban. Metode ini menghasilkan suatu perhitungan yang dapat digunakan oleh pihak perusahaan jasa pengkreditan untuk menggolongkan syarat-syarat konsumen yang mengajukan kredit dalam kaitannya dengan resiko kredit.
8
Untuk membuat suatu model scoring “scorecard” dalam menentukan karakteristik si peminjam, pengembangan analisis data dilakukan dengan melihat data historis konsumen kredit yang telah disetujui kreditnya atau tidak oleh pihak perusahaan. Hasil scoring ini akan berguna untuk memprediksi apakah calon konsumen dapat melaksakan pinjaman dengan baik atau buruk. Informasi mengenai keterangan pribadi calon konsumen atau calon peminjam didapat dari formulir aplikasi yang diajukan oleh pihak perusahaan. Data-data seperti jenis kelamin, status perkawinan, pendapatan bulanan, sisa pinjaman yang belum dibayar, jumlah tabungan, jenis pekerjaan, lama bekerja pada suatu perusahaan, apakah calon konsumen pernah melakukan pelanggaran pada peminjaman sebelumnya, status kepemilikan rumah apakah milik sendiri atau menyewa, jenis rekening bank yang dimiliki, dan semua faktor potensial yang berhubungan dengan disetujuinya permohonan pinjaman sampai dapat digunakannya “scorecard”. Dalam banyak kasus sistem scoring, dengan nilai scoring yang tinggi akan memperkecil nilai resiko, dan pihak perusahaan pengkreditan yang memberikan jasa kredit dapat menetukan batasan perhitungan untuk menerima atau menolak permohonan kredit konsumen berdasarkan nilai resiko yang dimiliki. Dengan mengacu kepada model credit scoring yang sudah terbentuk, pihak perusahaan akan menyetujui permohonan kredit jika aplikasi yang diajukan memiliki score di atas batas minimal dan menolak permohonan jika aplikasi yang diajukan memiliki score di bawah batas minimal. Walaupun model credit scoring untuk selanjutnya dapat menjadi penentu kebijakan
9
perusahaan untuk menerima ataupun menolak permohonan kredit dari konsumen, akan tetapi kesalahan prediksi terhadap nilai tiap-tiap calon konsumen untuk diberikan fasilitas kredit akan mungkin terjadi. Oleh karena itu, untuk membangun suatu model credit scoring yang baik, diperlukan data historis yang cukup. Model credit scoring dibentuk melalui serangkaian proses statistika yang dapat digunakan untuk melakukan ramalan terhadap data yang baru. Proses pengaplikasian model yang sudah terbentuk berbeda dengan proses dalam pembentukan atau pembuatan model. Secara
khusus, suatu model credit
scoring yang terbentuk dapat digunakan pada waktu yang lama untuk menghitung atau meramalkan data-data baru [1]. Selama proses pembentukan model credit scoring, informasi-informasi dari konsumen yang berbentuk data selanjutnya diolah dengan bantuan software statistika. Pada akhirnya akan dihasilkan suatu model yang memiliki output berupa keputusan untuk konsumen. Ada beberapa metode yang dapat dipakai untuk menghasilkan model credit scoring, di antaranya analisis diskriminan, regresi linier, regresi logistik, analisis probit, decision tree, dan sebagainya. Dalam penelitian kali ini, metode yang akan dibahas untuk memecahkan persoalan credit scoring adalah metode decision tree.
2.4 Decision Tree Berbeda dengan metode regresi linier dan logistik yang menghasilkan skor untuk kemudian mengklasifikasikan pengamatan dengan aturan 10
Diskriminan, decision tree memulai proses analisis dengan mengklasifikasikan pengamatan ke dalam kelompok dan kemudian memperoleh skor untuk setiap kelompok yang diamati [4]. Sebelum membahas lebih jauh mengenai decision tree, berikut akan dijelaskan terlebih dahulu istilah-istilah yang digunakan dalam tree, sebagai berikut :
Learning Sample :himpunan
data
awal
yang
digunakan
untuk
pembentukan model.
Tree/ Pohon
: suatu skema yang menunjukkan pola pengelompokan berdasarkan variabel-variabel
Sub-Tree
pemisah.
: cabang-cabang kecil dari pohon yang dipisahkan oleh variabel pemisah.
Node
: titik yang terdapat pada masing-masing cabang dari tree
Terminal node
: cabang akhir dari suatu tree
Parent node
: cabang dari suatu tree, namun dapat dipecah kembali berdasarkan nilai dari variabel pemisah
Child node
: simpul yang berhubungan langsung dengan parent node yang merupakan hasil pemecahan dari Parent node.
Decision tree dipisahkan menjadi dua buah teknik pengerjaan pertama jika variabel terikat atau variabel terikatnya bersifat kontinu maka teknik pengerjaan yang dilakukan adalah Regression tree, kedua apabila variabel
11
terikatnya bersifat diskrit atau kualitatif (kategori) maka teknik pengerjaannya disebut dengan Classification tree. Decision tree dapat didefinisikan sebagai prosedur rekursif, di mana satu set data statistik n secara progresif dibagi menjadi kelompok-kelompok berdasarkan aturan pembagian yang bertujuan untuk memaksimalkan ukuran homogenitas atau kemurnian variabel respon pada masing-masing kelompok. Pada setiap langkah prosedur pembentukan model tree aturan pembagian ditentukan oleh pilihan variabel penjelas (interikat) untuk membagi dan memisahkan variabel tersebut, yang menetapkan bagaimana partisi atau pemisahan terhadap pengamatan dilakukan [4]. Hasil yang akan didapat dari sebuah pemodelan tree adalah partisi akhir dari sebuah pengamatan. Untuk mencapai hal itu perlu dilakukan penentuan kriteria pemberhentian yang tepat pada proses pembagian pada setiap pengamatan. Anggap partisi akhir sudah tercapai, yang terdiri dari kelompok g di mana g < n. Maka untuk sembarang nilai observasi pada variabel terikat ( ), sebuah regression tree menghasilkan nilai prediksi ̂ yang nilainya sama dengan nilai mean dari
untuk setiap i dalam grup tersebut. Misalkan m
adalah jumlah kelompok, maka akan didapatkan persamaan :
̂
∑
(
)
Sementara untuk classification tree, nilai yang tepat diberikan dari gabungan probabilitas yang cocok menjadi satu buah kelompok. Jika hanya ada
12
dua kelas yang mungkin (klasifikasi biner), maka probabilitas yang cocok adalah :
(
∑
Pengamatan
)
bernilai 0 atau 1, oleh karena itu, probabilitas
koresponden dicocokkan ke perbandingan pengamatan yang sukses dalam grup. Perhatikan bahwa ̂ dan
konstan untuk setiap observasi atau
pengamatan dalam grup. Ada beberapa macam model dalam decision tree, di antaranya IDS, CART, CHAID, C4.5, dan ID3. Adapun metode yang dipakai dalam penelitian ini adalah model CART metode Classification tree.
2.5 Classification and Regression Tree (CART)
Breiman,
Friedman,
Olshen,
dan
Stone
pada
tahun
1984
memperkenalkan salah satu metode dalam statistika nonparametrik yakni metode classification and regression tree (CART) yang dikenal sebagai partisi binary rekursif. Dikatakan partisi binary karena pada proses pembentukan model melibatkan sekumpulan data yang akan menghasilkan dua buah node [6]. Disebut rekursif karena proses pembagian data menjadi dua node dilakukan secara bertingkat dan berulang pada setiap node yang dihasilkan, di mana parent node menghasilkan dua child node dan masing-masing child node memiliki dua grand child node dan seterusnya sampai mencapai terminal
13
node. Tujuan mendasar dari metode tree adalah membangun sebuah model pohon keputusan yang selanjutnya akan digunakan untuk memberikan score atau nilai tertentu pada suatu data baru.
Gambar 2.1 Contoh Bagan Klasifikasi Decision tree Keterangan gambar : 1
: Parent node
2
: Child node
3
: Grandchild node
4
: Terminal node (simpul akhir) CART merupakan alat dari metode decision tree yang dapat dikatakan
paling baik untuk memecahkan masalah data mining, pemodelan prediksi, dan pengolahan data. Pada proses pengerjaannya, CART secara otomatis mencari pola-pola dan hubungan yang penting yaitu membuka struktur yang tersembunyi meskipun data yang digunakan memiliki tingkat kompleksitas
14
yang tinggi. Dalam CART ada dua buah karakteristik penting yang harus diperhatikan untuk mendapatkan hasil tree dengan tampilan yang optimal [3]. Pertama pemecahan obyek secara berulang. Dalam langkah ini pemilihan kriteria alat pemisah (impurity function) yang sesuai dengan jenis data, dalam CART terdapat tujuh buah kriteria pemisah di antaranya yaitu Gini, Symgini, Twoing, Ordered Twoing, Entropy dan Class Probability untuk classification tree, serta Least Square dan Least Absolute Deviatio untuk regression tree. Kemudian yang kedua teknik pruning (pemangkasan) yang tepat. Metode CART memiliki tiga bagian yaitu : pertama model tree dibentuk menggunakan learning sample di mana dalam pembentukan tree tersebut tidak terjadi pruning tree (pemangkasan pada tree) sehingga model yang terbentuk memiliki jumlah terminal node paling banyak atau disebut juga dengan maksimum tree [8]. Karena maksimum tree yang dibentuk tidak memiliki keoptimalan antara misclassification error dengan kompleksitas tree sehingga diperlukan bagian kedua yaitu pengoptimalan tree. Misclassification error adalah nilai resiko ketepatan prediksi yang dihasilkan oleh model tree yang terbentuk. Kemudian setelah dilakukannya pengoptimalan terhadap tree tersebut maka lakukan bagian yang ketiga yaitu pengklasifikasian data baru.
2.5.1
Classification Tree Classification tree adalah suatu metode klasifikasi atau pengelompokan
yang berbentuk tree dari sekumpulan data ke dalam beberapa kelompok dengan menggunakan pemisahan tree [6]. Classification tree digunakan untuk
15
memprediksi objek atau kasus dalam kelas-kelas dengan satu variabel dependent (terikat) yang kategorik dari satu atau lebih variabel bebas. Classification tree dibangun berdasarkan splitting rule yang dipilih. Splitting rule adalah aturan pemisahan pada tree yakni aturan yang melaksanakan pemisahan data percobaan (learning sample) menjadi bagian yang lebih kecil dengan mencari kemungkinan didapatkan kehomogenitasan yang maksimum. Homogenitas maksimum adalah sebuah kondisi di mana pemisahan node berdasarkan kehomogenan kelas data sehingga pada terminal node akan didapatkan data yang lebih murni (pure). Kemurnian data yang didapat itulah yang dapat menentukan keakuratan sebuah prediksi. Semakin murni sebuah hasil yang didapat maka akan semakin akurat prediksinya, dan sebaliknya semakin tidak murni (impure) hasil yang didapat maka akan semakin tidak tepat prediksinya [6]. Aturan pemisah tree pada metode CART digambarkan dalam diagram di bawah ini [8] :
Gambar 2.2 Diagram Algoritma Pemisah CART
16
Dengan
adalah parent node dan
berturut-turut adalah node kiri
dan node kanan dari parent node tersebut. Sedangkan adalah nilai pemisah yang terbaik dari variabel
adalah variabel j dan
.
Homogenitas maksimum child node didefinisikan sebagai impurity function i(t). Impurity function adalah suatu fungsi yang digunakan untuk mengukur keakuratan model dengan memberikan indikasi kehomogenan kelaskelas pada data, sehingga pada simpul akhir (terminal node) akan didapatkan data yang lebih murni. Jika kemurnian dari parent node
konstan untuk setiap
, j = 1,2, … , p, maka homogenitas maksimum
kemungkinan pemisah
dari child node kiri dan kanan akan ekivalen ke maksimisasi perubahan impurity function
( ): ( )
( )
[ ( )]
(
)
dengan : ( )
: Impurity function untuk parent simpul : child node kiri dan kanan dari parent node
( )
: impurity function untuk
[ ( )]
: ekspektasi dari ( )
Diasumsikan bahwa P1 dan P2 adalah proporsi sample ke node kiri dan kanan, maka didapatkan : ( )
( )
( )
Atau
17
( )
(
)
( )
( )
[
]( )
[
]( )
(
)
CART akan mencari semua nilai yang mungkin dari semua variabel dalam matriks X untuk mencari pemisah yang terbaik memaksimumkan perubahan impurity function
yang akan
( ). Impurity function yang
akan dipakai dalam penelitian ini adalah Twoing Splitting Rule. Twoing Splitting Rule Metode twoing berusaha untuk mencari persentase kelas yang paling besar dan kelas paling kecil dalam data untuk kemudian memisahkan kedua kelas tersebut ke dalam node terpisah. Sebagai contoh terdapat 4 buah kelas yaitu kelas A, B, C, D yang masing-masing memiliki data sebesar 40, 30, 20, dan 10 persen dari data. Kemudian aturan twoing akan berusaha menempatkan kelas A sebagai kelas yang memiliki persen terbesar dari data dan kelas D yang memiliki persen kelas paling kecil dalam satu node. Diagram di bawah ini menunjukkan proses pemisahan yang mungkin dilakukan oleh Twoing untuk data seperti yang telah disebutkan sebelumnya. Kelas A = 40 Kelas B = 30 Kelas C = 20 Kelas D = 10
Kelas A = 40
Kelas B = 30
Kelas D = 10
Kelas C= 20
Gambar 2.3 Grafik Pemisahan Twoing Splitting Rule
18
Dapat disimpulkan bahwa metode twoing berusaha memisahkan kelas dengan memfokuskannya pada dua buah kelas pada waktu yang bersamaan. Twoing akan selalu mengerjakan kelas yang memiliki data yang paling besar dan kelas yang memilki data paling kecil. Berdasarkan [8] dan [2] Twoing splitting rule menggunakan impurity function sebagai berikut : ( )
(∑ (
)
(
))
(
)
dengan : = probabilitas node kiri = probabilitas node kanan (
)
= probabilitas kondisional kelas ke-k yang disajikan dalam node
(
)
= probabilitas kondisional kelas ke-k yang disajikan dalam node
2.5.2 Maksimum Tree
Proses pengklasifikasian data pada CART dibagi menjadi dua tahapan. Pertama proses pembentukan model, di mana pada proses ini akan dijelaskan dan diuraikan himpunan kelas yang ditentukan. Kemudian tahap kedua yaitu proses pemakaian model yang dilakukan setelah model tree terbentuk. Pada proses ini akan diklasifikasi data-data baru yang belum diketahui pengklasifikasiannya berdasarkan model yang terbentuk.
19
Pada proses klasifikasi dengan tahapan proses pembentukan model pada CART diperlukan learning sample (data percobaan) yang merupakan sekumpulan data yang digunakan untuk membentuk sebuah model tree dan biasanya
learning
sample
berukuran
besar
agar
dapat
membentuk
pengklasifikasian yang baik. Ketika model tree sudah terbentuk maka model itu dapat digunakan untuk mengklasifikasian data yang belum diketahui. Tujuan klasifikasi ini adalah menentukan aturan pada variabel yang lain yang memprediksi variabel kelas. Untuk menguji keakuratan model yang dibuat dapat digunakan test sample (data uji) di mana test sample tersebut biasanya berukuran lebih kecil dibandingkan dengan data percobaan yang sebenarnya. Pada pembentukan model, data percobaan yang digunakan akan dipisah menjadi dua buah node secara rekursif atau bertingkat hingga mencapai terminal node dengan menggunakan algoritma tertentu. Seperti yang telah dibahas dalam subbab sebelumnya, ada beberapa jenis algoritma yang dapat digunakan sebagai alat pemisah dalam pembentukan model. Seperti yang sudah dijelaskan sebelumnya, pada penelitian kali ini, akan digunakan algoritma pemisah yaitu Twoing Splitting Rule. Pertumbuhan tree dari data percobaan akan menghasilkan level dari suatu node yang paling besar dibandingkan dengan model tree lainnya, serta memiliki jumlah terminal node (simpul akhir) yang paling banyak. Tree yang paling besar seperti ini disebut dengan maksimum tree.
20
2.5.3 Optimum Tree Dalam pembentukan model tree perlu dipertimbangkan keakuratan dari model tree tersebut [6]. Tingkat keakuratan sebuah model tree menunjukkan seberapa baik model tersebut dalam memprediksi atau mengklasifikasi data. Sedangkan
ketidakakuratan
model
tersebut
dalam
memprediksi
atau
mengklasifikasi data disebut dengan resiko. Seperti yang sudah dibahas sebelumnya bahwa nilai resiko dari sebuah model tree dapat dilihat dari misclassification
error
yang
dihasilkan
oleh
model
tersebut.
Jika
misclassification yang dihasilkan tinggi maka resiko yang akan timbul dari model tree tersebut juga akan tinggi dan sebaliknya jika nilai misclassification rendah maka resiko dari tree tersebut juga rendah dalam memprediksi atau mengklasifikasi sebuah data. Dengan meningkatnya ukuran pada model tree, misclassification yang dihasilkan akan menurun dan jika ukuran tree tersebut maksimum maka misclassification error akan bernilai nol [6]. Akan tetapi maksimum tree dapat menghasilkan kompleksitas yang sangat tinggi dan berakibat akan melemahkan prediksi atau pengklasifikasian model tree terhadap suatu data. Di sisi lain tree yang memiliki ukuran yang lebih kecil dari maksimum tree memiliki kompleksitas yang rendah, namun akan memiliki nilai misclassification error yang lebih tinggi dibandingkan dengan maksimum tree. Oleh karena itu, perlu dilakukannya optimasi dari sebuah model tree sebelum model tersebut digunakan untuk memprediksi atau mengklasifikasikan sebuah data baru. Pengoptimasian tree mengimplikasikan pemilihan ukuran tree yang benar yaitu 21
memangkas node dan subtree yang tidak memberikan kontribusi yang cukup besar terhadap akurasi dari pengelompokan namun menambah kompleksitas dari tree tersebut.
22
BAB III METODOLOGI PENELITIAN
3.1 Waktu dan Tempat Penelitian Penelitian ini dilaksanakan pada bulan Desember 2010 sampai Mei 2011 di PT. X Finance cabang Mauk - Tangerang. 3.2 Metode Pengumpulan Data Pada penelitian ini data yang dipakai adalah data sekunder, yaitu data yang diperoleh berdasarkan arsip perusahaan. Data diperoleh dari divisi Risk Management yang berupa data pribadi konsumen PT. X Finance. Data tersebut terdiri dari 784 konsumen dengan 7 variabel (6 variabel berupa variabel bebas dan 1 buah variabel terikat). Variabel-variabel tersebut adalah sebagai berikut : 1. Jenis Kelamin a. Nilai 1 : Jenis kelamin konsumen laki-laki b. Nilai 2 : Jenis kelamin konsumen perempuan 2. Uang Muka adalah besarnya uang muka atau yang lebih dikenal dengan sebutan DP (down payment) yang merupakan persetujuan dari pihak konsumen dengan Surveior di awal pengajuan kredit 3. Tenor Pembayaran adalah jumlah bulan cicilan yang akan dibayarkan oleh konsumen. 4. Kondisi Kendaraan a. Nilai 1 : Untuk jenis kendaraan baru.
23
b. Nilai 2 : Untuk jenis kendaraan bekas (second hand) 5. Harga OTR adalah harga kendaraan jika pembelian secara tunai. 6. Bunga Pinjaman adalah besarnya biaya yang harus ditanggung oleh pihak konsumen yang mengajukan kredit, adapun besarnya bunga ditentukan oleh pihak perusahaan. 7. Variabel terikat (permohonan kredit diterima atau ditolak) didefinisikan sebagai variabel approval. Variabel approval merupakan variabel kategorik dengan skala pengukuran adalah nominal. Kode nilai 1 menyatakan bahwa permohonan kredit konsumen diterima dan kode nilai 2 menyatakan bahwa permohonan kredit konsumen ditolak. Selain itu, studi pustaka juga penulis lakukan melalui buku-buku atau sumber lain yang menunjang seperti jurnal, hasil penelitian, yang digunakan untuk memperoleh informasi-informasi tambahan yang berguna dalam penelitian kali ini.
3.3 Metode Pengolahan Data Setelah data sekunder didapat tahap selanjutnya data diolah dengan bantuan dua buah software statistika untuk proses statistika deskriptif dan analisis crosstab, dan untuk mendapatkan model credit scoring (dengan metode CART) yang diinginkan. 3.3.1
Analisis Cross Tabulation Sebelum melanjutkan proses pengolahan data, terlebih dahulu penulis
melakukan analisis statistik deskriptif dan analisis crosstab terhadap variabel-
24
variabel yang dipakai dalam penelitian. Adapun tujuannya adalah untuk mengetahui hubungan keterkaitan antara variabel-variabel tersebut. Langkah awal dilakukan dalam tahap ini adalah menentukan variabel apa yang menjadi variabel terikat dan variabel apa yang merupakan variabel bebas untuk selanjutnya dilakukan analisis deskriptif terhadap data yang diperoleh. Dalam penelitian ini yang menjadi variabel terikat adalah permohonan kredit. Kemudian variabel bebas yang mempengaruhi variabel terikat adalah variabel jenis kelamin, uang muka, tenor pembayaran, kondisi kendaraan, besar OTR dan bunga pinjaman. Pada tahap analisis deskriptif beberapa variabel yang menjadi variabel bebas
dikelompokkan
menjadi
beberapa
kelompok.
Variabel
yang
dikelompokkan itu diantaranya : a.
Variabel Uang Muka Pengelompokan variabel uang muka didasarkan pada wawancara yang telah dilakukan penulis dengan pihak perusahaan, adapun pengelompokan tersebut adalah : Kelompok 1 : besar uang muka ≤ 20% Kelompok 2 : 20% < uang muka < 50% Kelompok 3 : uang muka ≥ 50% Adapun variabel uang muka diubah ke dalam bentuk persentase dimana persen uang muka tersebut didasarkan pada biaya OTR
b.
Variabel Bunga Pinjaman Kelompok 1 : besar bunga pinjaman ≤ 30%
25
Kelompok 2 : 30% < bunga pinjaman < 45% Kelompok 3 : bunga pinjaman ≥ 45% c.
Variabel Tenor Pembayaran Kelompok 1 : tenor pembayaran ≤ 12 bulan Kelompok 2 : 12 bulan < tenor pembayaran < 24 bulan Kelompok 3 : tenor pembayaran ≥ 24 bulan
d.
Variabel Harga OTR Kelompok 1 : harga OTR ≤ 12.500.000 Kelompok 2 : 12.500.000 < harga OTR < 15.000.000 Kelompok 3 : harga OTR ≥ 15.000.000
Langkah selanjutnya yang dilakukan yaitu analisis Cross Tabulation,dan Uji Khi Kuadrat terhadap data yang sudah didapat.
3.3.2
Pengolahan Data Dengan CART
Berikut adalah tahapan-tahapan pembentukan model tree dengan metode CART : 1.
Penentuan variabel terikat dan variabel bebas yang digunakan Variabel terikat yang dipakai dalam penelitian ini adalah variabel approval. Sedangkan variabel bebasnya adalah variabel jenis kelamin, uang muka, tenor pembayaran, kondisi kendaraan besar OTR, dan bunga pinjaman. Dalam pengerjaan selanjutnya variabel bebas dibagi menjadi dua yaitu variabel bebas yang bersifat kategorik (variabel jenis kelamin
26
dan jenis kendaraan) dan variabel bebas yang bersifat numerik (variabel uang muka, tenor pembayaran, besar OTR, dan bunga pinjaman). 2. Penenentuan variabel kelas yang menjadi fokus penelitian Variabel terikat dipisahkan menjadi dua, yaitu permohonan kredit yang diterima oleh pihak perusahaan dan permohonan kredit yang ditolak. Dalam penelitian ini yang menjadi fokus penelitian adalah permohonan kredit yang diterima, pemilihan ini didasarkan karena penulis ingin mengetahui pola dari konsumen yang permohonan kreditnya telah diterima oleh pihak perusahaan. 3. Model Tree yang dipilih Model tree yang dipilih adalah classification tree karena variabel terikatnya merupakan variabel kategorik. 4.
Pemilihan model splitting rule Metode splitting rule yang digunakan adalah Twoing Splitting Rule.
5. Data yang diperlukan untuk pembentukan model tree Data konsumen yang akan digunakan sebanyak 784 data dengan 5 variabel, yang terdiri dari satu variabel terikat dan empat lainnya merupakan variabel bebas.
27
3.4 Alur Penelitian
Identifikasi Parameter Credit Scoring
Analisis Deskripsi Kategori Parameter Credit Scoring Analisis Cross Tab & Uji Chi square Parameter Signifikan Credit Scoring Analisis Classification and Regression Tree (CART) Model Tree Optimal CART CrediScoring
Model Credit Scoring Untuk Proses Analisa Kelayakan Pemberian Kredit Kendaraan Bermotor
Gambar 3.1 Diagram Alur Penelitian
28
BAB IV HASIL DAN PEMBAHASAN
4.1 Analisis Pendahuluan Analisis hasil yang akan dilakukan bertujuan untuk mendapatkan model tree berdasarkan data awal yakni data konsumen yang mengajukan kredit kendaraan motor di PT X Finance yang terdiri atas 6 variabel bebas dan 1 buah variabel terikat. Analisis pendahuluan yang dilakukan adalah analisis deskriptif dari 7 buah variabel pengukuran, yang meliputi 4 buah variabel pengukuran kuantitatif dan 3 buah variabel pengukuran kualitatif. Analisis pendahuluan selanjutnya adalah analisis crosstab untuk mengetahui hubungan antara variabel terikat dengan variabel bebasnya. 4.1.1 Statistika Deskriptif Statistika deskriptif untuk keseluruhan data dibagi menjadi dua bagian sesuai dengan variabel pengukurannya yakni variabel pengukuran kuantitatif dan kualitatif. Untuk data kuantitatif, statistik deskriptifnya dapat dilihat pada Tabel 4.1 berikut ini : Tabel 4.1 Statistika Deskriptif untuk Data Kuantitatif Jenis Variabel Uang Muka Tenor Pembayaran Bunga Pinjaman Harga OTR
N Minimum Maksimum Rata-rata Std. Deviasi 784 0 14.500.000 2.468.300 1.438.830 784 11 36 30,17 6,94 784 798.000 9.897.000 4.980.000 1.490.165 784 7.000.000 32.200.000 12.400.000 1.812.277
29
Pada Tabel 4.1, dapat dijelaskan bahwa rata-rata uang muka yang dikeluarkan konsumen PT X Finance dalam pengajuan kredit kendaraan motor adalah Rp. 2.468.300,00. Seperti kasus yang sering terjadi belakangan ini berkaitan dengan kredit kendaraan bermotor terdapat beberapa konsumen yang tidak mengeluarkan uang muka sama sekali pada saat mengajukan permohonan kredit. Sementara itu, besar uang muka maksimum adalah Rp. 14.500.000,00. Rata-rata tenor pembayaran yang dipilih konsumen diawal perjanjian pengajuan permohonan kredit adalah 30 bulan. Sedangkan untuk data kualitatif dapat dilihat pada Tabel 4.2, sebagai berikut : Tabel 4.2 Statistika Deskriptif untuk Data Kualitatif Variabel Jenis Kelamin Kondisi Kendaraan Approval
Frekuensi Persen Laki-laki Perempuan Baru Bekas Diterima Ditolak
564 220 756 28 647 137
71.8 28.1 96.4 3.6 82.5 17.5
Jumlah Persen 71.8 100.0 96.4 100.0 82.5 100.0
Pada Tabel 4.2 dapat dijelaskan bahwa pada data tersebut dari total 764 konsumen, 564 diantaranya berjenis kelamin laki-laki dengan 71.8% proporsi laki-laki dan 28.1% proporsi perempuan. Sementara itu, untuk kondisi kendaraan yang banyak diambil oleh konsumen adalah jenis kendaraan baru dengan proporsi sebesar 96.4% dengan sisanya sebesar 3.6% konsumen mengambil kendaraan bekas (secondhand). Sedangkan untuk variabel terikatnya sendiri, yakni approval dari total keseluruhan 784 data dapat dilihat jumlah permohonan kredit yang diterima oleh pihak perusahaan adalah 647
30
konsumen atau sebesar 82.5%, sementara untuk permohonan kredit yang ditolak oleh pihak perusahaan adalah sebesar 17.5%.
4.1.2 Analisis Cross Tabulation Tahap awal dalam analisis crosstab akan dijelaskan mengenai hubungan antara variabel terikat dan variabel bebas yang dibagi menjadi dua kolom berdasarkan jenis datanya, dapat dilihat pada Tabel 4.3 dan 4.4 sebagai berikut: Tabel 4.3 Crosstabulation untuk Data Kuantitatif Variabel Approval
1(UM≤20%) 492 109
Approval
1(BP≤30%) 146 43
Approval
1(OTR≤12.5jt) 300 47
Approval
1(Tenor≤12bln) 29 10
Diterima Ditolak Variabel Diterima Ditolak Variabel Diterima Ditolak Variabel Diterima Ditolak
Uang Muka 2(20%
Seperti yang sudah dijelaskan pada Bab III bahwa variabel kualitatif dikelompokkan ke dalam 3 buah kelompok. Dari Tabel 4.3 dapat dilihat beberapa hal seperti berikut :
Terdapat 492 konsumen dengan UM<20% yang diterima permohonan kreditnya. 31
Terdapat 109 konsumen dengan UM<20% yang ditolak permohonan kreditnya.
Terdapat 145 konsumen dengan 20%<=UM<50% yang diterima permohonan kreditnya.
Terdapat 26 konsumen dengan 20%<=UM<50% yang ditolak permohonan kreditnya.
Terdapat 10 konsumen dengan UM>=50% yang diterima permohonan kreditnya.
Terdapat 2 konsumen dengan UM>=50% yang ditolak permohonan kreditnya. Tabel 4.4 CrossTabulasion untuk Data Kualitatif Variabel Approval
Diterima Ditolak
Approval
Diterima Ditolak
Jenis Kelamin Laki-laki Perempuan 465 182 99 38 Kondisi Kendaraan Baru Bekas 622 25 134 3
Dari Tabel 4.4 didapatkan beberapa informasi sebagai berikut :
Terdapat 465 konsumen laki-laki yang diterima permohonan kreditnya, sedangkan yang ditolak berjumlah 99 orang.
Terdapat 182 konsumen perempuan yang diterima permohonan kreditnya, sedangkan sebanyak 38 konsumen perempuan ditolak permohonan kreditnya. 32
Terdapat 622 konsumen yang memilih kredit motor dengan kondisi baru diterima permohonan kreditnya, sedangkan 134 konsumen yang juga memilih kondisi motor baru ditolak permohonan kreditnya.
Terdapat 25 konsumen memilih kredit motor dengan kondisi bekas yang diterima permohonannya, sedangkan 3 orang ditolak. Tahap analisis crosstab selanjutnya akan menjelaskan mengenai
penentuan ada atau tidaknya hubungan antara variabel terikat(terikat) dengan variabel bebasnya. Dalam proses penentuan tersebut dilakukan uji Chi Square dengan menggunakan hipotesis sebagai berikut : H0 : Tidak ada hubungan antara variabel terikat dan variabel bebas. H1 : Ada hubungan antara variabel terikat dengan variabel bebas. Dengan ketentuan pengambilan keputusannya adalah sebagai berikut :
Jika probabilitas > 0.05 maka H0 diterima.
Jika probabilitas < 0.05 maka H0 ditolak. Tabel 4.5 Chi Square Test Variabel Terikat Aprroval Aprroval Aprroval Aprroval Aprroval Aprroval
Variabel Bebas Uang Muka Harga OTR Bunga Pinjaman Tenor Pembayaran Jenis Kelamin Kondisi Kendaraan
33
P-Value 0.000 0.001 0.020 0.017 0.926 0.337
Keputusan yang dapat diambil dari Tabel 4.5 adalah sebagai berikut :
Kolom P-value menunjukkan nilai probabilitas, dimana untuk variabel uang muka, tenor pembayaran, bunga pinjaman, dan harga OTR berturut-turut 0.000, 0.017, 0.020, dan 0.001 yang berarti lebih kecil dari 0.05, maka H0 ditolak. Hal ini berarti ada hubungan antara variabel terikat (approval) dengan kedua variabel bebas tersebut yakni variabel uang muka, variabel tenor pembayaran, bunga pinjaman, dan variabel besar OTR.
Untuk variabel jenis kelamin dan kondisi kendaraan mempunyai nilai probabilitas berturut-turut sebesar 0.926 dan 0.337 yang berarti lebih besar dari 0.05, sehingga H0 diterima. Maka dapat disimpulkan bahwa tidak ada hubungan antara variabel terikat (approval) dengan kedua variabel bebas tersebut. Dari kedua kesimpulan diatas, dilihat dari hubungannya dengan variabel terikat seharusnya variabel bebas yang dapat dimasukkan kedalam analisis lanjutan hanyalah variabel yang memiliki hubungan yaitu variabel uang muka, tenor pembayaran, bunga pinjaman, dan harga OTR. Akan tetapi, dalam pelaksanaannya di lapangan variabel jenis kelamin dan variabel kondisi kendaraan juga mempengaruhi keputusan perusahaan untuk menerima ataupun menolak permohonan kredit dari calon konsumen. Maka dari itu, dalam analisis lanjutan, kedua variabel ini tetap penulis masukkan untuk membuat model tree credit scoring.
34
4.2 Analisis Hasil CART Proses pembentukan model tree dengan menggunakan metode CART akan menghasilkan sebuah model tree yang memiliki terminal node yang paling banyak dan juga memiliki nilai resiko yang besar, untuk itu seperti yang telah dijelaskan pada pembahasan sebelumnya bahwa diperlukan adanya pengoptimalan model tree yang merupakan suatu model yang memiliki nilai resiko yang paling kecil. Di dalam model optimal tree tersebut terdapat aturanaturan klasifikasi yang dapat menjelaskan mengenai aturan pemberian keputusan perusahaan terhadap permohonan kredit yang ada, apakah permohonan kredit yang diajukan konsumen diterima atau ditolak. Aturan klasifikasi yang sudah didapat tersebut dapat digunakan untuk memprediksi calon konsumen apakah akan diterima atau ditolak pengajuan permohonan kreditnya. 4.2.1 Maksimum Tree Secara keseluruhan data yang digunakan adalah sebesar 784 data. Variabel terikat yang digunakan adalah variabel approval yang merupakan variabel kategorik. Sementara itu, variabel bebas yang digunakan adalah variabel uang muka, tenor pembayaran, bunga pinjaman, dan harga OTR yang merupakan variabel numerik, serta variabel jenis kelamin dan variabel kondisi kendaraan yang merupakan variabel kategorik. Karena variabel terikat yang digunakan dalam penelitian kali ini adalah variabel kategorik maka CART
35
akan menghasilkan model tree berupa classification tree dengan aturan pemisahan yang dipakai adalah Twoing splitting rule. Dalam penelitian ini maksimum tree yang dihasilkan adalah model tree yang memiliki terminal node paling banyak yaitu sebanyak 83 terminal node. Relative cost dari maksimum tree didapatkan dari hasil pengujian model dengan menggunakan test sample yang diperlihatkan pada Tabel 4.6 dibawah ini : Tabel 4.6 Misclassification untuk Test Sample pada Maksimum Tree Kelas Diterima Ditolak Total
Jumlah Kelas 647 137 784
Jumlah Persentase Nilai Kesalahan Kelas Kesalahan 201 31.07 0.31 68 49.64 0.50 269 40.35 0.405
Dari Tabel 4.6 di atas dapat dijelaskan bahwa untuk kelas approval yang diterima permohonan kreditnya dengan jumlah kasus sebanyak 647 dan jumlah kesalahan pengkelasan sebanyak 201 dan presentase kesalahan sebesar 31.07%, sehingga menghasilkan resiko sebesar 0.31. Sementara untuk kelas approval yang permohonan kreditnya ditolak dengan jumlah kasus sebanyak 137 dan jumlah kesalahan pengkelasan sebanyak 68 kasus dan persentase kesalahan sebesar 49.64% menghasilkan resiko sebesar 0.50. Dengan demikian maksimum tree yang dihasilkan memiliki nilai resiko paling besar yaitu (
)
= 0.405. Adapun model maksimum tree yang dihasilkan dapat dilihat
pada Lampiran I.
36
Untuk
menjelaskan
aturan
pengklasifikasian
berdasarkan
model
maksimum tree yang dihasilkan perlu dilakukannya pengoptimalan model tree yang didapat, berikut akan ditampilkan salah satu contoh cabang pada model maksimum tree.
Gambar 4.1 Diagram Salah Satu Cabang Maksimum Tree Dengan mengikuti alur dari gambar di atas yang merupakan salah satu cabang model tree dapat dijelaskan mengenai aturan klasifikasi dari terminal node 68 sampai dengan terminal node 78, adalah sebagai berikut : 1. Aturan klasifikasi untuk terminal node 68 Jika bunga pinjaman ≤ 6.631.300, harga OTR > 15.440.000, harga OTR ≤ 15.550.000, uang muka > 1.275.000, dan uang muka ≤ 2.550.000, maka probabilitas calon konsumen tersebut diterima permohonan kreditnya adalah sebesar 1. Adapun jumlah kasus yang terdapat pada terminal node 68 adalah sebanyak 8 data, dengan persentase data sebesar 1% resiko sebesar 0.
37
2. Aturan klasifikasi untuk terminal node 69 Jika harga OTR > 15.440.000, harga OTR ≤ 15.550.000, uang muka > 2.550.000, dan uang muka ≤ 4.475.000, bunga pinjaman ≤ 3.917.750, maka probabilitas calon konsumen tersebut ditolak permohonan kreditnya adalah sebesar 0.56. Adapun jumlah kasus yang terdapat pada terminal node 69 adalah sebanyak 9 data, dengan persentase data sebesar 1.1% resiko sebesar 0.45.
3. Aturan klasifikasi untuk terminal node 70 Jika harga OTR > 15.440.000, harga OTR ≤ 15.550.000, bunga pinjaman > 3.917.750, bunga pinjaman ≤ 6.631.300, uang muka > 2.550.000, dan uang muka ≤ 2.675.000 maka probabilitas calon konsumen tersebut ditolak permohonan kreditnya adalah sebesar 0.5. Adapun jumlah kasus yang terdapat pada terminal node 70 adalah sebanyak 10 data, dengan persentase data sebesar 1.3% resiko sebesar 0.5.
4. Aturan klasifikasi untuk terminal node 71 Jika harga OTR > 15.440.000, harga OTR ≤ 15.550.000, uang muka > 2.675.000, dan uang muka ≤ 4.475.000, bunga pinjaman > 3.917.750, bunga pinjaman ≤ 6.214.600, maka probabilitas calon konsumen tersebut diterima permohonan kreditnya adalah sebesar 1. Adapun jumlah kasus yang terdapat pada terminal node 71 adalah sebanyak 7 data, dengan persentase data sebesar 0.9% resiko sebesar 0.
38
5. Aturan klasifikasi untuk terminal node 72 Jika harga OTR > 15.440.000, harga OTR ≤ 15.550.000, uang muka > 2.675.000, dan uang muka ≤ 4.475.000, bunga pinjaman > 6.214.600, bunga pinjaman ≤ 6.631.300, maka probabilitas calon konsumen tersebut ditolak permohonan kreditnya adalah sebesar 0.25. Adapun jumlah kasus yang terdapat pada terminal node 72 adalah sebanyak 4 data, dengan persentase data sebesar 0.5% resiko sebesar 0.75.
6. Aturan klasifikasi untuk terminal node 73 Jika uang muka > 1.275.000, uang muka ≤ 4.475.000, harga OTR > 15.550.000, dan bunga pinjaman ≤ 4.148.530, maka probabilitas calon konsumen tersebut ditolak permohonan kreditnya adalah 0.429. adapun jumlah kasus yang terdapat pada terminal node 73 adalah sebanyak 7 data, dengan persentase data sebesar 0.9%, resiko sebesar 0.5714.
7. Aturan klasifikasi untuk terminal node 74 Jika uang muka > 1.275.000, uang muka ≤ 4.475.000, harga OTR > 15.550.000, bunga pinjaman > 4.148.530, dan bunga pinjaman ≤6.631.300 maka probabilitas calon konsumen tersebut ditolak permohonan kreditnya adalah 0.833. Adapun jumlah kasus yang terdapat pada terminal node 74 adalah sebanyak 6 data, dengan persentase data sebesar 0.8%, resiko sebesar 0.1667.
39
8. Aturan klasifikasi untuk terminal node 75 Jika bunga pinjaman ≤ 6.631.300, uang muka > 4.475.000, harga OTR > 15.440.000, dan harga OTR ≤ 18.973.000, maka probabilitas calon konsumen tersebut diterima permohonan kreditnya adalah 1. Adapun jumlah kasus yang terdapat pada terminal node 75 sebanyak 8 data, dengan persentase data sebesar 1%, dan resiko sebesar 0. 9. Aturan klasifikasi untuk terminal node 76 Jika bunga pinjaman ≤ 6.631.300, uang muka > 4.475.000, harga OTR > 18.973.000 dan tenor pembayaran ≤ 22, maka probabilitas calon konsumen tersebut ditolak permohonan kreditnya adalah 0.332. Adapun jumlah kasus yang terdapat pada terminal node 76 sebanyak 9 data, dengan persentase data sebesar 1.1%, dan resiko sebesar 0.667.
10. Aturan klasifikasi untuk terminal node 77 Jika bunga pinjaman ≤ 6.631.300, uang muka > 4.475.000, harga OTR > 18.973.000, tenor pembayaran > 22, dan tenor pembayaran ≤ 28, maka probabilitas calon konsumen tersebut diterima permohonan kreditnya adalah 1. Adapun jumlah kasus yang terdapat pada terminal node 77 sebanyak 6 data, dengan persentase data sebesar 0.8%, dan resiko sebesar 0.
11. Aturan klasifikasi untuk terminal node 78 Jika bunga pinjaman ≤ 6.631.300, uang muka > 4.475.000, harga OTR > 18.973.000, dan tenor pembayaran > 28, maka probabilitas calon
40
konsumen tersebut ditolak permohonan kreditnya adalah 1. Adapun jumlah kasus yang terdapat pada terminal node 78 sebanyak 2 data, dengan persentase data sebesar 0.3%, dan resiko sebesar 0.
4.2.2 Optimal tree Untuk memperoleh relative cost yang paling kecil dan terminal node terbaik pada maksimum tree yang telah didapat pada pembahasan sebelumnya perlu dilakukan pengoptimalan tree dengan menggunakan prosedur cross validation. Optimal tree yang dihasilkan dalam penelitian kali ini merupakan model tree yang memiliki terminal node sebanyak 6 buah dan memilki tinggi tree 4 level. Relative cost yang didapat dalam model optimal tree didasarkan pada hasil pengujian model dengan menggunakan test sample yang diperlihatkan pada Tabel 4.7 berikut ini. Tabel 4.7 Misclassification untuk Test Sample pada Optimal Tree Kelas Diterima Ditolak Total
Jumlah Jumlah Persentase Nilai Kelas Kesalahan Kelas Kesalahan 647 301 46.52 0.47 137 46 33.58 0.34 784 357 40.05 0.405
Dari Tabel 4.7 di atas dapat dijelaskan bahwa untuk kelas approval yang diterima permohonan kreditnya dengan jumlah kasus sebanyak 647 dan jumlah kesalahan pengkelasan sebanyak 301 dan presentase kesalahan sebesar 46.52%, sehingga menghasilkan resiko sebesar 0.47. Sementara untuk kelas approval yang permohonan kreditnya ditolak dengan jumlah kasus sebanyak
41
137 dan jumlah kesalahan pengkelasan sebanyak 46 kasus dan persentase kesalahan sebesar 33.58% menghasilkan resiko sebesar 0.34. Dengan demikian optimum tree yang dihasilkan memiliki nilai resiko paling besar yaitu (
)
= 0.405.
Adapun model optimal tree yang terbentuk dapat dilihat paga gambar 4.2 berikut ini.
Node 1 Class = 1 UANG_MUKA <= 1275000.00 Class Cases % 1 647 82.5 2 137 17.5 W = 784.00 N = 784
UANG_MUKA <= 1275000.00 T erminal Node 1 Class = 1 Class Cases % 1 62 96.9 2 2 3.1 W = 64.00 N = 64
UANG_MUKA > 1275000.00 Node 2 Class = 2 HARGA_OT R <= 13915000.00 Class Cases % 1 585 81.3 2 135 18.8 W = 720.00 N = 720
HARGA_OT R <= 13915000.00 Node 3 Class = 1 UANG_MUKA <= 1950000.00 Class Cases % 1 420 83.8 2 81 16.2 W = 501.00 N = 501
UANG_MUKA <= 1950000.00 Node 4 Class = 2 UANG_MUKA <= 1575000.00 Class Cases % 1 177 78.7 2 48 21.3 W = 225.00 N = 225
UANG_MUKA <= 1575000.00 T erminal Node 2 Class = 1 Class Cases % 1 102 86.4 2 16 13.6 W = 118.00 N = 118
HARGA_OT R > 13915000.00 Node 5 Class = 2 BUNGA_PINJAMAN <= 6631300.00 Class Cases % 1 165 75.3 2 54 24.7 W = 219.00 N = 219
UANG_MUKA > 1950000.00 T erminal Node 4 Class = 1 Class Cases % 1 243 88.0 2 33 12.0 W = 276.00 N = 276
BUNGA_PINJAMAN <= 6631300.00 T erminal Node 5 Class = 2 Class Cases % 1 128 72.3 2 49 27.7 W = 177.00 N = 177
BUNGA_PINJAMAN > 6631300.00 T erminal Node 6 Class = 1 Class Cases % 1 37 88.1 2 5 11.9 W = 42.00 N = 42
UANG_MUKA > 1575000.00 T erminal Node 3 Class = 2 Class Cases % 1 75 70.1 2 32 29.9 W = 107.00 N = 107
Gambar 4.2 Splitter Optimal Tree Menggunakan Twoing Splitting Rule Dengan mengikuti alur pada Gambar 4.2 diatas yang merupakan model optimal tree maka aturan klasifikasi dapat dihasilkan. Aturan klasifikasi beserta kemungkin diterima atau ditokalnya suatu permohonan kredit dari konsumen akan dibahas dari klasifikasi berdasarkan terminal node 1 sampai terminal node 6.
42
1. Aturan klasifikasi untuk terminal node 1 Jika uang muka ≤ 1.275.000, maka probabilitas calon konsumen tersebut dierima permohonan kreditnya adalah sebesar 0.968. Adapun jumlah kasus yang terdapat pada terminal node 1 sebesar 64 data, dengan persebtase data sebesar 8.2% dengan resiko 0.03. 2. Aturan klasifikasi untuk terminal node 2 Jika harga OTR ≤ 13.915.000, uang muka > 1.275.000, dan uang muka ≤1.575.000, maka probabilitas calon konsumen tersebut diterima permohonan kreditnya adalah sebesar 0.824. Adapun jumlah kasus yang terdapat pada terminal node 2 adalah sebesar 118 data, dengan persentase sebesar 15.1%, dan resiko kesalahan sebesar 0.1356. 3. Aturan klasifikasi untuk terminal node 3 Jika harga OTR ≤ 13.915.000, uang muka > 1.575.000, dan uang muka ≤ 1.950.000 maka probabilitas calon konsumen tersebut ditolak permohonan kreditnya adalah sebesar 0.3. Adapun jumlah kasus yang terdapat pada terminal node 3 adalah sebesar 107 data, dengan persentase sebesar 13.6%, dan resiko kesalahan sebesar 0.7. 4. Aturan klasifikasi untuk terminal node 4 Jika harga OTR ≤ 13.915.000 dan uang muka > 1.950.000, maka probabilitas calo konsumen tersebut diterima permohonan kreditnya adalah sebesar 0.881. Adapun jumlah kasus yang terdapat pada terminal node 4 adalah sebesar 276 data, dengan persentase data sebesar 35.2%, dan resiko kesalahan sebesar 0.119.
43
5. Aturan klasifikasi untuk terminal node 5 Jika uang muka > 1.275.000, harga OTR > 13.915.000, dan bunga pinjaman ≤ 6.631.300, maka probabilitas calon konsumen tersebut ditolak permohonan kreditnya adalah sebesar 0.28. Adapun jumlah kasus yang terdapat pada terminal node 5 adalah sebesar 177 data, dengan persentase data sebesar 22.6%, dan resiko kesalahan sebesar 0.72. 6. Aturan klasifikasi untuk terminal node 6 Jika uang muka > 1.275.000, harga OTR > 13.915.000, dan bunga pinjaman > 6.631.300, maka probabilitas calon konsumen tersebut diterima permohonan kreditnya adalah sebesar 0.881. Adapun jumlah kasus yang terdapat pada terminal node 6 adalah sebesar 42 data, dengan persentase data sebesar 5.4%, dan resiko kesalahan sebesar 0.119. Akan tetapi, dalam model optimum pengklasifikasian permohonan kredit konsumen yang sudah didapat diatas terdapat hal menarik yang dapat dijadikan sedikit evaluasi untuk pihak perusahaan, yaitu belum jelasnya standar penilaian diterima atau ditolaknya sebuah permohonan kredit konsumen. Hal ini dapat dilihat pada hasil akhir yang terdapat pada terminal node 1 dan terminal node lainnya. Pada terminal node 1 variabel yang menjadi tolak ukur klasifikasi permohonan kredit yang diterima hanya variabel uang muka yang besarnya ≤ Rp. 1.250.000,00. Namun, pada terminal node lain, jelas terlihat bahwa selain uang muka terdapat variabel lain yang menjadi tolak ukur pengklasifikasian permohonan kredit konsumen yakni variabel harga OTR dan variabel bunga pinjaman.
44
Laporan kesimpulan dari model optimal tree yang diperoleh dapat dilihat pada gains cart dibawah ini : Tabel 4.8 GAINS CHART Persentase Komulatif Kelas Terikat 23.36 59.12 70.80 94.89 98.54 100.00
Node 3 5 2 4 6 1
Persentase Komulatif Populasi 13.65 36.22 51.28 86.48 91.84 100.00
Menurut [5] suatu model optimal tree dikatakan suatu model yang dapat mempresentasikan data awal yang digunakan jika hasil akhir persentase komulatif kelas terikat (Cum% Tgt. Class) lebih besar daripada persentasi komulatif dari populasinya (Cum% Pop). Seperti yang terlihat pada Tabel 4.8 dapat dilihat bahwa nilai Cum% Tgt. Class yang didapat lebih besar daripada nilai Cum% Pop –nya kesimpulkan tersebut juga dikuatkan dengan grafik pada Gambar 4.3 di bawah. Hal ini menunjukkan bahwa model optimal tree yang terbentuk dapat dikatakan suatu model yang dapat mempresentasikan data awal yang dipakai dalam penelitian.
150 100
Cum % Tgt. Class
50
Cum % Pop
0 1
2
3
4
5
6
Gambar 4.3 Gains CART Optimal Tree 45
Setelah mengetahui bahwa model tersebut sudah dikatakan dapat mempresentasikan
data
awal,
selanjutnya
dapat
diketahui
persentase
keberhasilan pengelompokan berdasarkan Tabel 4.9 berikut ini : Tabel 4.9 Prediction Success Variabel kelas 1(Diterima) 2(Ditolak) Total
Jumlah Kasus 647 137 784
Persentase Sukses 68.62 59.12 63.87
Prediksi Kelas 1 (Diterima) 2(Ditolak) 444 203 56 81
Pada Tabel 4.9, persentase berhasilnya pengelompokan pada data percobaan diperlihatkan untuk masing-masing kelompok. Pada kelompok permohonan kredit yang diterima terdapat 647 konsumen, setelah dilakukan kembali pengelompokan tersebut terdapat 444 konsumen dengan tepat dikelompokkan ke dalam kelompok konsumen yang diterima permohonan kreditnya, sehingga persentase kesuksesan pengelompokan untuk kelompok permohonan kredit yang diterima adalah 68.62%. Begitu pula, pada kelompok permohonan kredit yang ditolak terdapat 137 konsumen, setelah dilakukan kembali pengelompokan tersebut kesuksesan pengelompokan sebanyak 81 konsumen, sehingga persentasenya adalah 59.12%. Secara keseluruhan, kesuksesan pengelompokan yang telah dilakukan dapat dilihat pada tabel 4.10 yaitu total kesuksesan pengelompkkan yang dilakukan sebanyak 525 konsumen dari total 784 konsumen, sehingga persentase total kesuksesan pengelompokan sebesar 63.87%.
46
Setelah mengetahui akurasi pengelompokan dengan model CART metode classification tree, selanjutnya dapat diketahui urutan variabel pemisah. Berdasarkan kontribusi yang terbesar terhadap proses pemisahan berarti memiliki peranan yang paling penting dalam pengelompokan dan sebaliknya semakin kecil kontribusinya terhadap proses pemisahan maka memilki peranan yang kurang penting dalam proses pemisahan, dapat dilihat pada Tabel 4.10 berikut : Tabel 4.10 Variabel Terpenting Variabel Uang Muka Harga OTR Bunga Pinjaman Tenor Pembayaran Kondisi Kendaraan Jenis Kelamin
Nilai 100.00 24.04 21.50 6.69 5.01 0.55
||||||||||||||||||||||||||||||||||||||||||||||||| |||||||||| |||||||| || |
Pada Tabel 4.10, diperlihatkan bahwa variabel pemisah yang terpenting dalam proses pembentukan model tree adalah variabel uang muka dengan nilai kontribusi 100. Setelah itu variabel harga OTR dan variabel bunga pinjaman yang mempunyai nilai kontribusi rata-rata sebesar 22.77. Sementara untuk variabel tenor pembayaran dan kondisi kendaraan memiliki nilai kontribusi yang kurang dari 10%. Sedangkan untuk variabel jenis kelamin mempunyai nilai kontribusi yang kurang dari 1% yakni sebesar 0.55, berarti tidak memiliki peranan dalam pemisahan kelompok.
47
BAB V KESIMPULAN DAN SARAN
5.1 Kesimpulan
Data konsumen diolah menggunakan metode CART yang menghasilkan suatu model tree yang dapat ditarik suatu kesimpulan berdasarkan tujuan dari penulisan skripsi ini. Pertama, variabel yang menjadi faktor terpenting dalam menentukan pola klasifikasi persetujuan permohonan kredit adalah variabel uang muka. Kemudian setelah variabel uang muka, variabel yang memilki peran cukup penting adalah variabel harga OTR dan variabel bunga pinjaman. Sementara untuk variabel tenor pembayaran dan kondisi kendaraan hanya mempunyai sedikit peran dalam pembentukan model, sementara untuk variabel jenis kelamin tidak memiliki peran penting dalam proses pembentukan model tree. Kedua, pola klasifikasi calon konsumen akan diterima permohonan kreditnya adalah sebagai berikut : 1.
Jika harga OTR ≤ 13.915.000 dan uang muka berkisar antara 1.275.000 – 1.575.000, maka prbabilitas konsumen tersebut diterima permohonan kreditnya adalah 0.865 yang berarti kemungkinan permohonan kreditnya akan diterima lebih besar.
2.
Jika harga OTR ≤ 13.915.000 dan uang muka > 1.950.000, maka probabilitas konsumen tersebut diterima permohonan kreditnya adalah
48
sebesar 0.881, yang berarti kemungkinan permohonan kreditnya diterima lebih besar. 3.
Jika uang muka > 1.275.000, harga OTR > 13.915.000, dan bunga pinjaman > 6.631.300, maka probabilitas konsumen tersebut akan diterima
permohonan
kreditnya
adalah
0.881,
yang
berarti
yang
optimal
kemungkinan permohonan kreditnya diterima lebih besar. Ketiga
model
tree
permohonan
kredit
diterima
digambarkan sebagai berikut :
Node 1 Class = 1 UANG_MUKA <= 1275000.00 Class Cases % 1 647 82.5 2 137 17.5 W = 784.00 N = 784
UANG_MUKA <= 1275000.00 Terminal Node 1 Class = 1 Class Cases % 1 62 96.9 2 2 3.1 W = 64.00 N = 64
UANG_MUKA > 1275000.00 Node 2 Class = 2 HARGA_OTR <= 13915000.00 Class Cases % 1 585 81.3 2 135 18.8 W = 720.00 N = 720
HARGA_OTR <= 13915000.00 Node 3 Class = 1 UANG_MUKA <= 1950000.00 Class Cases % 1 420 83.8 2 81 16.2 W = 501.00 N = 501
UANG_MUKA <= 1950000.00 Node 4 Class = 2 UANG_MUKA <= 1575000.00 Class Cases % 1 177 78.7 2 48 21.3 W = 225.00 N = 225
UANG_MUKA <= 1575000.00 Terminal Node 2 Class = 1 Class Cases % 1 102 86.4 2 16 13.6 W = 118.00 N = 118
HARGA_OTR > 13915000.00 Node 5 Class = 2 BUNGA_PINJAMAN <= 6631300.00 Class Cases % 1 165 75.3 2 54 24.7 W = 219.00 N = 219
UANG_MUKA > 1950000.00 Terminal Node 4 Class = 1 Class Cases % 1 243 88.0 2 33 12.0 W = 276.00 N = 276
BUNGA_PINJAMAN <= 6631300.00 Terminal Node 5 Class = 2 Class Cases % 1 128 72.3 2 49 27.7 W = 177.00 N = 177
BUNGA_PINJAMAN > 6631300.00 Terminal Node 6 Class = 1 Class Cases % 1 37 88.1 2 5 11.9 W = 42.00 N = 42
UANG_MUKA > 1575000.00 Terminal Node 3 Class = 2 Class Cases % 1 75 70.1 2 32 29.9 W = 107.00 N = 107
Gambar 5.1 Optimal Tree Model optimal tree di atas memilki resiko atau relative cost paling kecil yaitu sebesar 0.405 sehingga model tree inilah yang dikatakan dapat dipakai oleh pihak perusahaan untuk memprediksi calon konsumen baru.
49
5.2 Saran
Akurasi dari model tree yang didapat dirasa kurang optimal. Ada kemungkinan penyebab utamanya karena jumlah pengamatan yang tidak seimbang dalam masing-masing kelompok jenis permohonan kredit baik yang diterima maupun ditolak, yaitu sebesar 82.5% untuk data permohonan kredit yang diterima dan 17.5% untuk data permohonan kredit yang ditolak. Selain dari itu, sedikitnya jenis variabel yang didapat oleh penulis dalam skripsi ini juga dapat melemahkan tingkat akurasi model. Oleh karena itu, penulis mengharapkan dalam penelitian selanjutnya akan lebih baik dengan menambahkan jenis variabel yang dimasukkan dalam model dan membuat perbandingan yang sama terhadap data permohonan kredit antara permohonan kredit yang diterima atapun ditolak.
50
Biodata Penulis
DAFTAR RIWAYAT HIDUP Nama Lengkap
:
Dendy Saputro
Nama Panggilan
:
Dendy
NIM
:
107094002797
DATA PRIBADI
Tempat, Tanggal Lahir :
Jakarta, 21 Mei 1989
Jenis Kelamin
:
Laki-laki
Alamat Rumah
:
Jl. Musyawarah Rt. 04/001 No.86 Desa Sawah Kecamatan Ciputat Kota Tangerang Selatan 15413
No. HP
:
085697557289
Email
:
[email protected]
Kewarganegaraan
:
Indonesia
Tinggi/Berat Badan
:
172 cm/ 89 kg
Program Studi
:
MIPA Matematika
IPK
:
3.41 RIWAYAT PENDIDIKAN
1. Universitas Islam Negeri Syarif Hidayatullah Jakarta, Fakultas Sains dan Teknologi (FST), Jurusan MIPA (Matematika), Program Studi Matematika Statistika, lulus bulan Juni 2011. 2. SMU Negeri 2 Ciputat, lulus tahun 2007, berijazah. 3. SMP Negeri 2 Ciputat, lulus tahun 2004, berijazah. 4. SD Negeri 02 Kampung Sawah, lulus tahun 2001, berijazah. 5. RA Nurul Huda Pondok Karya lulus tahun 1995, berijazah.
Ciputat, 10 Juni 2011
Penulis
54
DAFTAR PUSTAKA
[1]
Amarnath, K.N. Statistical Methods in Consumer Credit Scoring. Cranes Software Internasiaonal Ltd . Product Analyst .2004
[2]
Andriyashin, Anton. Financial Applications of Classification And Regression Tree (CART). Master Thesis. CASE – Center of Applied Statistics and Aconomics. Humboldt University. 2006.
[3]
Angarini, Dini. Klasifikasi Kondisi Kesehatan Jantung Menggunakan Metode Multiple Discriminant Analysis (MDA) Dan Classification and Regression Tree (CART). Jakarta : Universitas Islam Negeri. 2007.
[4]
Giudici, Paolo . Applied Data Mining, Satistical Methods for Business and Industry. Italy : Faculty of Economics University of Pavia. 2003.
[5]
Manual CART. An Implementation of the Original CART Methodology by Salford System. California : Salford System San Diago. 2002
[6]
Nur Rahman, Andi. Klasifikasi Penyakit Diabetes Positif Menggunakan Classification and Regreesion Tree. Jakarta : Universitas Islam Negeri. 2006.
[7]
Siegel, Sidney. STATISTIK NONPARAMETRIK. Jakarta : PT Gramedia, Anggota IKAPI. 1985.
[8]
Timfee, Roman. Classification And Regression Tree (CART) Theory and Application. Master Thesis. CASE – Center of Applied Statistics and Aconomics. Humboldt University. 2003.
[9]
Trihendradi, C.Step by Step SPSS 16 Analisis Data Statistik. Yogyakarta : Penerbit ANDI. 2009.
51
[10]
http : // Edward Tanjung, Doddy. Apa Itu Kredit (1)-Prosedur Memperoleh Kredit. usaha-umkm.blogspot.com, tanggal 17 Mei 2010, pukul 17.36 WIB.
52
LAMPIRAN I
Node 1 Class = 1 UANG_MUKA <= 1275000.00 Class Cases % 1 647 82.5 2 137 17.5 W = 784.00 N = 784
UANG_MUKA <= 1275000.00 Terminal Node 1 Class = 1 Class Cases % 1 62 96.9 2 2 3.1 W = 64.00 N = 64
UANG_MUKA > 1275000.00 Node 2 Class = 2 HARGA_OTR <= 13915000.00 Class Cases % 1 585 81.3 2 135 18.8 W = 720.00 N = 720
HARGA_OTR <= 13915000.00 Node 3 Class = 1 UANG_MUKA <= 1950000.00 Class Cases % 1 420 83.8 2 81 16.2 W = 501.00 N = 501
UANG_MUKA <= 1950000.00 Node 4 Class = 2 UANG_MUKA <= 1575000.00 Class Cases % 1 177 78.7 2 48 21.3 W = 225.00 N = 225
UANG_MUKA <= 1575000.00 Terminal Node 2 Class = 1 Class Cases % 1 102 86.4 2 16 13.6 W = 118.00 N = 118
UANG_MUKA > 1575000.00 Terminal Node 3 Class = 2 Class Cases % 1 75 70.1 2 32 29.9 W = 107.00 N = 107
HARGA_OTR > 13915000.00 Node 5 Class = 2 BUNGA_PINJAMAN <= 6631300.00 Class Cases % 1 165 75.3 2 54 24.7 W = 219.00 N = 219
UANG_MUKA > 1950000.00 Terminal Node 4 Class = 1 Class Cases % 1 243 88.0 2 33 12.0 W = 276.00 N = 276
BUNGA_PINJAMAN <= 6631300.00 Terminal Node 5 Class = 2 Class Cases % 1 128 72.3 2 49 27.7 W = 177.00 N = 177
BUNGA_PINJAMAN > 6631300.00 Terminal Node 6 Class = 1 Class Cases % 1 37 88.1 2 5 11.9 W = 42.00 N = 42