BAB I PENDAHULUAN
1.1.
Latar Belakang Dalam mencapai tujuan pembangunan ekonomi diperlukan peran serta
lembaga keuangan untuk membiayai pembangunan tersebut. Lembaga keuangan memegang peranan penting dalam roda pembangunan ekonomi suatu negara. Terdapat banyak lembaga keuangan di suatu negara. Salah satu lembaga keuangan yang terlibat dalam pembangunan ekonomi adalah bank. Bank adalah lembaga keuangan yang menghimpun dana dari masyarakat dalam bentuk simpanan, memberikan kredit baik bersumber dari dana yang diterima dari masyarakat maupun dana yang diperoleh dari pemilik bank (pemegang saham), pemerintah maupun Bank Indonesia. Bank merupakan perantara yang menghimpun dana dan menempatkannya dalam bentuk aktiva produktif yaitu kredit. Menurut Undang-undang Republik Indonesia Nomor 10 Tahun 1998 Pasal 1 (11) tentang Perbankan, kredit adalah penyediaan uang atau tagihan yang dipersamakan dengan itu berdasarkan persetujuan atau kesepakatan pinjam meminjam antara pihak bank dan pihak lain yang mewajibkan pihak peminjam untuk melunasi hutangnya setelah jangka waktu tertentu dengan pemberian bunga. Pemberian kredit merupakan hal ringan apabila seorang debitur (peminjam) membayar pinjamannya dengan lancar. Pemberian kredit memiliki sebuah resiko yaitu adanya kredit macet. Kredit macet memberikan dampak yang negatif bagi bank, masyarakat dan negara. Timbulnya kredit bermasalah juga dapat mengakibatkan kesulitan dari bank tersebut untuk memenuhi kewajibannya kepada deposan. Kejadian debitur gagal membayar kembali pinjamannya dikenal dengan istilah default. Peminjam (debitur) yang gagal mengembalikan pinjamannya dapat mengakibatkan kerugian pada kreditur. Kejadian ini memungkinkan timbulnya micro systematic risk yaitu jatuhnya industri keuangan (kreditur) secara keseluruhan. Pihak kreditur perlu mengantisipasi untuk menghindari kejadian 1
2
tersebut dengan menerapkan early warning system untuk meminimalisasi risiko kredit. Pemberian kredit merupakan suatu kinerja bank yang paling pokok. Sebelum memberikan kredit, bank perlu memberikan penilaian terhadap nasabah yang akan mengajukan kredit pinjaman. Adanya unsur risiko dari suatu kredit ini menyebabkan bank perlu melakukan suatu pengamatan kredit. Tujuan pengamatan tersebut untuk menghilangkan risiko atau setidak-tidaknya untuk memperkecil resiko yang mungkin timbul. Dewasa ini banyak cara yang dapat dilakukan untuk mengantisipasi adanya kredit macet. Salah satu caranya adalah mencari potensi baik dari calon debitur dengan mengelompokkan karakteristik debitur. Kita dapat mengetahui debitur yang mengajukan pinjaman dapat terbagi ke dalam beberapa kelompok dan karakteristik debitur yang mengajukan pinjaman pada setiap kelompok yang terlihat dari beberapa variabel. Melalui data yang ada, penulis ingin mengelompokkan data tersebut ke dalam 4 kelompok. Penulis ingin mengetahui apakah durasi peminjaman, tingkat angsuran, lama tinggal di hunian, usia, jumlah kredit di bank, jumlah kredit yang ada di bank saat ini, dan jumlah tanggungan signifikan membedakan keempat kelompok yang terbentuk, profil serta kecenderungan-kecenderungan dari masingmasing kelompok yang terbentuk menggunakan metode K-means Cluster. Selanjutnya, penulis menggunakan metode Multi-class Support Vector Machines untuk menghitung tingkat akurasi dan prediksi pada dataset yang telah dikelompokkan ke dalam 4 kelompok tersebut. Terdapat 2 pendekatan untuk menganalis dataset yang dikenal sebagai metode belajar (learning) yaitu : unsupervised learning dan supervised learning. Dalam pendekatan pertama, unsupervised learning, metode kita terapkan tanpa adanya latihan (training) dan tanpa ada guru (teacher). Guru di sini adalah label dari data khusus. Metode yang termasuk unsupervised learning antara lain Kmeans Cluster, K-Nearest Neighbour, Self Organizing Map (SOM). Pendekatan selanjutnya adalah supervised learning yaitu metode belajar dengan adanya latihan dan pelatih. Banyak teknik dalam pattern recognition (pengenalan pola)
3
yang masuk dalam kategori ini. Contohnya : Regresi, Analisis Diskriminan (LDA), Artificial Neural Network (ANN), Support Vector Machine (SVM), Algoritma C4.5, Backpropogation, Algoritma Chi-Square Automatic Interaction Detection (CHAID). Metode ini membutuhkan acuan awal untuk memperoleh nilai yang disebut training dataset. Beberapa metode yang sudah digunakan untuk analisis credit scoring adalah Least Squares Support Vector Machines (LS-SVM), Klasifier Naive Bayes, Regresi Cox, Kombinasi K-means Clusters dan Algoritma C4.5, Learning Vector Quantization (LVG), K-nearest Neighbors, Jaringan Syaraf Backpropagation. Dalam tugas akhir ini, penulis akan mencoba mengemukakan analisis segmentasi karakteristik debitur dengan metode K-means cluster dan Multi-class Support Vector Machines. Konsep dasar dari Multi-class support vector machines adalah untuk mengklasifikasikan dataset ke dalam multi kelas (lebih dari 2 kelas). Ada 2 metode yang dapat digunakan untuk menyelesaikan masalah klasifikasi Multi-class support vector machines yaitu one-against-one (Satu Lawan Satu) dan one-against-all (Satu Lawan Semua). Sehingga dalam penggunaannya bisa menggunakan salah satu dari kedua metode tersebut. Analisis metode multi-class support vector machines ini merupakan pengembangan dari metode support vector machines yang mengklasifikasikan dataset ke dalam 2 kelas. Support vector machines berada dalam satu kelas dengan artificial neural networks dimana keduanya masuk ke dalam supervised learning. Para ilmuan maupun praktisi telah banyak menerapkan teknik ini dalam menyelesaikan masalah-masalah nyata dalam kehidupan sehari-hari. Terbukti dalam banyak implementasi, support vector machines maupun multi-class support vector machines memberikan hasil yang lebih baik daripada artificial neural networks, terutama dalam hal solusi yang dicapai. Artificial neural networks menemukan solusi berupa local optimal sedangkan support vector machines maupun multi-class support vector machines memberikan solusi yang global optimal. Solusi local optimal memberikan hasil yang berbeda atau tidak selalu sama setiap running yang dijalankan. Sedangkan solusi global optimal memberikan solusi yang sama untuk setiap running yang dijalankan. Teknik ini
4
sangat menarik dalam bidang data mining maupun machine learning karena performasinya yang meyakinkan dalam memprediksi kelas suatu data baru. 1.2.
Batasan Masalah Terdapat banyak metode yang dapat digunakan untuk menganalisis
pemodelan segmentasi karakteristik debitur, maka diperlukan adanya batasan masalah. Metode penelitian yang digunakan adalah menggabungkan 2 metode yaitu menggabungkan unsupervised learning (K-means cluster) dan supervised learning (multi-class support vector machines). Terdapat 2 metode yang dapat digunakan untuk mengaplikasikan masalah klasifikasi multi-class support vector machines yaitu one-against-one (satu lawan satu) dan one-against-all (satu lawan semua). Oleh karena itu, dalam Penulisan Tugas Akhir ini penulis hanya membatasi pada penjelasan metode multi-class support vector machines menggunakan metode one-against-one (satu lawan satu). Data yang digunakan penulis adalah data German kredit. 1.3.
Tujuan Penulisan Penyusunan tugas akhir ini dimaksudkan sebagai pemenuhan salah satu
syarat untuk mencapai derajat S1 Program Studi Statistika FMIPA UGM. Sedangkan tujuan dari penulisan tugas akhir ini adalah sebagai berikut : 1.
menggabungkan 2 metode yaitu metode unsupervised learning dan supervised learning untuk analisis segmentasi karakteristik debitur,
2.
untuk mempelajari dan memahami esensi dari data mining menggunakan metode Multi-class support vector machines dan support vector machines,
3.
untuk memahami dan dapat mengaplikasikan suatu studi kasus menggunakan aplikasi K-means cluster dan Multi-class support vector machines di bidang keuangan,
4.
untuk dapat meneliti tingkat akurasi dan prediksi dataset dengan menggunakan metode Multi-class support vector machines.
5
1.4.
Manfaat Penulisan Penulisan tugas akhir ini diharapkan bisa memberikan manfaat sebagai
berikut : 1.
mengaplikasikan ilmu statistika untuk menganalisis segmentasi karakteristik debitur,
2.
mengelompokkan
data
(klastering)
ke
dalam
4
kelompok
menggunakan K-means Cluster, 3.
dapat menganalisis karakteristik debitur tiap kelompok dan mencari nilai prediksi untuk setiap kelompok menggunakan metode Multiclass support vector machines dengan variabel dependennya lebih dari 2 kelas (multi-class),
4.
menambah wawasan dan ilmu pengetahuan yang selanjutnya dapat dikembangkan ke bidang-bidang lainnya.
1.5.
Metode Penulisan Metode Penulisan yang digunakan penulis adalah studi literatur yang
diperoleh dari perpustakaan, jurnal-jurnal ilmiah dan sumber-sumber lain yang diperoleh dari internet. Penulis dalam menyelesaikan penelitian ini menggunakan bantuan software SPSS 16.0 dan software R 3.03. Data yang digunakan adalah data sekunder dari internet yang bisa dipertanggungjawabkan. 1.6.
Tinjauan Pustaka K-means cluster adalah suatu metode clustering yang sering digunakan
untuk mengelompokkan sekumpulan objek ke dalam beberapa cluster sehingga kemiripan objek dalam kelompok lain akan bernilai minimal dengan jumlah cluster yang telah ditentukan sebanyak k. Support vector machines (SVM) adalah suatu teknik yang relatif baru untuk melakukan prediksi, baik klasifikasi maupun regresi. SVM adalah sistem pembelajaran yang menggunakan ruang hipotesis berupa fungsi-fungsi linier dalam sebuah fitur (feature space) berdimensi tinggi, dilatih dengan algoritma pembelajaran yang didasarkan pada teori optimasi dengan mengimplementasikan
6
learning bias yang berasal dari teori pembelajaran statistik. Teori yang mendasari SVM sudah berkembang sejak 1960-an tetapi tidak mendapatkan perhatian banyak dari para peneliti. Vladimir Vapnik, Boser dan Guyon memperkenalkan SVM pada tahun 1992 dan sejak itu SVM berkembang dengan pesat dan dapat menunjukkan aplikasi nyata. Salah satu penyebab keterlambatan support vector machines berkembang adalah tersimpan teori Matematika yang mendalam di balik Support Vector Machines dibandingkan dua kerabatnya di bidang soft computing : neural network dan fuzzy logic. Pada awalnya SVM dikembangkan untuk persoalan klasifikasi 2 kelas (klasifikasi biner). Pengembangan ke arah persoalan klasifikasi untuk multi kelas masih menjadi perhatian para peneliti (Hsu and Lin, 2002). Ada 2 pendekatan utama untuk mengimplementasikan SVM multi kelas. Pertama dengan menggabungkan beberapa fungsi pemisah persoalan klasifikasi biner untuk menyelesaikan persoalan klasifikasi multi kelas. Kedua, secara langsung menggunakan semua data dari semua kelas dalam satu formulasi persoalan optimasi. Namun, pada pendekatan kedua permasalahan optimasi yang harus diselesaikan
jauh
lebih
rumit.
Metode
yang umum
digunakan
untuk
mengimplementasikan SVM multi kelas dengan pendekatan pertama. Berikut ini yang termasuk dalam pendekatan pertama dimana beberapa fungsi untuk 2 kelas dikembangkan lalu digabung yakni : one-against-one (satu lawan satu) dan oneagainst-all (satu lawan semua). Penelitian dalam credit scoring dan clustering terus menerus mengalami perkembangan, begitu pula penelitian tentang segmentasi karakteristik debitur. Berikut ini penjelasan singkat tentang penelitian-penelitian sebelumnya yang membahas segmentasi karakteristik debitur, credit scoring dan clustering. Ramadhan (2010) membahas credit scoring menggunakan metode decision tree dengan algoritma QUEST (Quick, Unbiased, Efficient Statistical Tree). Penelitian ini menggunakan data salah satu BPR di Tasikmalaya sebagai studi kasusnya. Metode pada penelitian ini merupakan perpaduan antara statistika, machine learning, database, dan visualisasi. Penelitian ini juga membahas perbandingan decision tree antara algoritma QUEST dan CART. Kesimpulan
7
akhir yang didapat adalah metode QUEST dan CART memiliki tingkat kesalahan pembentukan model yang berbeda. Dibandingkan dengan QUEST, model classification rule yang dibentuk oleh CART memiliki lebih banyak risiko kesalahan data mengkualifikasi objek baru. Fadilla (2012) membahas tentang credit scoring menggunakan metode hybrid kombinasi K-means cluster dan Algoritma C4.5. Penelitian ini menggunakan data German credit. Pada analisis tersebut didapat kesimpulan bahwa metode hybrid dapat menyempurnakan metode yang telah digunakan untuk menganalisis credit scoring sebelumnya yaitu metode yang hanya menggunakan salah satu metode dari supervised maupun unsupervised hal tersebut berdasarkan pada eksperimen data yang mengandung unsur outlier. Pertiwi (2013) membahas tentang credit scoring menggunakan metode Least Squares Support Vector Machines. Metode Least Squares Support Vector Machines dapat digunakan untuk mengklasifikasikan data menjadi dua kelas. Hasil studi kasus menunjukkan bahwa keakuratan yang dihasilkan oleh metode ini dipengaruhi oleh proporsi training data dan testing data. Semakin tinggi proporsi training data, maka tingkat akurasi yang dihasilkan akan semakin tinggi pula. Dewi (2014) membahas tentang segmentasi karakterikstik debitur menggunakan algoritma X-means Cluster. Algoritma X-means Cluster digunakan untuk menentukan jumlah Cluster optimal menggunakan kriteria BIC dan menggunakan analisis regresi logistik untuk menghitung probabilitas default tiap cluster. Pada penelitian ini penulis membahas segmentasi karakteristik debitur menggunakan metode K-means Cluster dan Multi-class Support Vector Machines. 1.7.
Sistematika Penulisan Tugas Akhir ini disusun dengan sistematika penulisan sebagai berikut : BAB I
PENDAHULUAN Bab ini berisi latar belakang masalah, batasan masalah, tujuan penulisan, manfaat penulisan, metode penulisan dan
8
sistematika penulisan yang memberikan arah terhadap penulisan tugas akhir ini. BAB II
LANDASAN TEORI Bab ini membahas tentang teori
yang menunjang
pembahasan tentang K-means cluster dan Multi-class support vector machines untuk pemodelan statistika khusunya di bidang keuangan yaitu segmentasi karakteristik debitur. BAB III
PEMBAHASAN Bab ini membahas mengenai topik Tugas Akhir yakni tentang K-means cluster yang terdiri dari pengertian Kmeans cluster dan algoritma K-means cluster, penjelasan tentang metode Support vector machines, dan metode Multi-class support vector machines.
BAB IV
STUDI KASUS Bab ini membahas analisis kluster menggunakan K-means cluster beserta karakteristik yang terbentuk tiap kelompok (klaster) dan nilai prediksi setelah dilakukan analisis menggunakan metode Multi-class support vector machines dengan menggunakan data yang diperoleh dari sumber resmi.
BAB V
KESIMPULAN DAN SARAN Bab ini berisi tentang kesimpulan yang diperoleh dari hasil analisis dan saran-saran untuk penelitian selanjutnya.