Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta, 15 November2014
ISSN: 1979-911X
APLIKASI METODE K-NEAREST NEIGHBOR DAN ANALISIS DISKRIMINAN UNTUK ANALISIS RESIKO KREDIT PADA KOPERASI SIMPAN PINJAM DI KOPINKRA SUMBER REJEKI 1,2
Ririn Dwi Jayanti1, Noeryanti2
Program Studi Statistika Institut Sains & Teknologi AKPRIND Yogyakarta e-mail :
[email protected],
[email protected]
ABSTRACT Credit Union becamea major destination fo rpeople and businesses in finding sources offinancing are"friendly" and easy to reach without th ecomplicated requirements with the principle of kinship. Credit Unionsare required to applythe precautionary principleto providea loantobe able tocontrol theriskof badcredit. This study aimstopredict themicro-credit activitiesby large variable income, loan size, loan termandthe guarantee for loan repay mentsin determining the source KOPINKRASumber Rejeki.Objects in this study is a data credit application form and data summary payments on recapitulation dara source KOPRINKA Sumber Rejeki in 2009 until 2013. The study was conducted through the stages of preparation, library research, data collection and analysis process.The results of the analysis of the descriptive analysis of 166 borrowers, there are 51 people (30.7%) pay the loan smoothly and 115 people (69.3%) non-current payments. The model resulting from the analysis of credit risk using discriminant analysis is Y = 1,160 – 0,095x3 + 1,915x4. Credit risk prediction accuracy is analyzed by K-Nearest Neighbor method is equal to 83.13% on the value of k is 3 and 7, while credit risk prediction accuracy is analyzed by discriminant analysis is at 76,5%. The results of credit risk prediction in KOPINKRA Sumber Rejeki by using a K-Nearest Neighbor method showed that the bad loans that may occur is at 25,30% and Discriminant Analysis is at 44,57%. Keywords : K-Nearest Neighbor, Discriminant analysis, prediction, classification PENDAHULUAN Keberadaan Koperasi Simpan Pinjam (KSP) di Indonesia tak bisa lepas dari sejarah dan perkembangan koperasi secara umum. Usaha simpan pinjam telah menjadi basis utama kegiatan koperasi yang menjadikan koperasi terus bertahan dan berkembang. KSP bahkan menjadi tujuan utama pelaku usaha mikro dan kecil dalam mencari sumber pembiayaan yang "ramah" dan mudah dijangkau tanpa syarat berbelit dengan asas kekeluargaan "serasa milik sendiri". Hingga saat ini berkembang pameo ketika menyebut koperasi, orang akan dengan mudah tercitrakan koperasi sebagai tempat meminjam uang.Koperasi yang bergerak dalam usaha simpan pinjam baik KSP ataupun USP merupakan industri yang penuh dengan resiko. Resiko tersebut adalah resiko kredit sebagai resiko kerugian sehubungan dengan pihak peminjam tidak dapat dan atau tidak mau memenuhi kewajiban untuk membayar kembali dana yang dipinjamkannya secara penuh pada saat jatuh tempo atau sesudahnya. Penerapan prinsip kehati-hatian dalam memberikan pinjaman akan memperkecil resiko kredit yang mungkin dialami oleh koperasi. Dalam menerapkan prinsip kehati-hatian ini, koperasi perlu melakukan manajemen risiko dengan mengidentifikasi, mengukur, dan mengendalikan bentuk kerugian yang dapat timbul dari risiko kredit. Proses mengidentifikasi dan mengukur potensi resiko kredit ini dapat dibantu oleh teknologi informasi yang memadai sehingga koperasi dapat memberikan evaluasi terhadap riwayat pinjaman peminjam serta memprediksi kelancaran kredit seorang peminjam yang dapat digunakan untuk menentukan besarnya pinjaman yang akan diberikan kepada peminjam tersebut. KOPINKRA Sumber Rejeki merupakan koperasi simpan pinjam yang ada di Dusun Bobung, Putat, Pathuk, Gunung Kidul yang telah berdiri sejak tahun 1998. Pengelolaan dan pengarsipan data di KOPINKRA Sumber Rejeki dilakukan secara manual dan belum terkomputerisasi. Data-data yang dimiliki oleh KOPINKRA Sumber Rejeki selama ini diperlakukan hanya sebatas arsip saja. Data-data ini belum diolah dan dipergunakan untuk menentukan kebijakan dan aturan dalam pengelolaan koperasi.Oleh karena itu, potensi kredit macet di KOPINKRA menjadi hal yang sangat perlu C-275
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta, 15 November2014
ISSN: 1979-911X
diwaspadai dan perlu dilakukan evaluasi riwayat peminjaman untuk mengurangi resiko kredit macet tersebut. Metode K-Nearest Neighbor dan Analisis Diskriminan merupakan metode dalam ilmu statistika yang dapat digunakan untuk melakukan evaluasi dan menentukan resiko kredit macet. Metode – metode ini dapat diaplikasikan dalam menentukan resiko kredit macet di Koprinkra Sumber Rejeki.Metode K-Nearest Neighbor adalah pendekatan untuk mencari kasus dengan menghitung kedekatan antara kasus baru dengan kasus lama, yaitu dengan berdasarkan pada pencocokan bobot dari sejumlah fitur yang ada. (Kusrini, 2009).Selain dengan metode K-Nearest Neighbor, dapat juga digunakan Analisis Diskriminan untuk memprediksi kelancaran kredit. Analisis Diskriminan adalah salah satu teknik analisa Statistika dependensi yang memiliki kegunaan untuk mengklasifikasikan objek beberapa kelompok. Pengelompokan dengan analisis diskriminan ini terjadi karena ada pengaruh satu atau lebih variabel lain yang merupakan variabel independen. Dengan diterapkannya metode K-Nearest Neighbor dan Analisis Diskriminan maka diharapkan KSP/KJKS dapat membuat suatu prediksi potensi kredit macet calon peminjam berdasarkan riwayatdata transaksi pembayaran kredit sebelumnya serta dapat memanfaatkan data karakteristik peminjam untuk dijadikan sebagai informasi tambahan yang dapat membantu perusahaan dalam membuat analisis kelancaran pinjaman.Berdasarkan latar belakang di atas, maka perlu dilakukan penelitian tentang aplikasi metode K-Nearest Neighbor dan Analisis Diskriminan untuk analisis resiko kredit pada koperasi simpan pinjam dengan bantuan software Matlab dan SPSS. Tujuan utama dari penelitian ini adalah menentukan model yang dihasilkan dari analisis resiko kredit dengan menggunakan Analisis Diskriminan, menerapkan metode K-Nearest Neighbor untuk mengklasifikasikan peminjam pada KOPINKRA Sumber Rejeki, membandingkan ketepatan prediksi dengan metode K-Nearest Neighbor dan Analisis Diskriminan dan menentukan kelancaran kegiatan simpan pinjam berdasarkan hasil klasifikasi peminjam di KOPINKRA Sumber Rejeki. METODE PENELITIAN Objek dalam penelitian ini adalah data yang diperoleh dari KOPINKRA Sumber Rejeki yang terletak di Dusun Bobung, Putat, Pathuk, Gunungkidul. Data yang digunakan dalam penelitian ini adalah data formulir pengajuan kredit dan data rekapitulasi pembayaran angsuran pada KOPRINKA Sumber Rejeki pada tahun 2009 sampai dengan tahun 2013.Peralatan utama yang digunakan dalam penelitian ini adalah : 1. Sistem operasi : Windows 7 Ultimate 32-bit (6.1, Build 7600) 2. Pengolah kata : Microsoft Office Word 2007 3. Pengolah data manual : Microsoft Office Excel 2007 4. Pengolah data pada metode K-Nearest Neighbor : Matlab7.8.0 5. Pengolah data pada Analisis Diskriminan : SPSS 16 Bahan penelitian yang digunakan dalam penelitian ini diperoleh dari hasil studi literatur dan observasi, antara lain : 1. Data karakteristik peminjampada formulirpengajuan kredit pada KOPINKRA Sumber Rejeki. Pada formulir pengajuan kredit tercantum nomor anggota, nama anggota, alamat, pekerjaan, jumlah penghasilan, jumlah pinjaman, jaminan serta jangka waktu pengembalian pinjaman. Formulir pengajuan kredit yang digunakan pada penelitian ini berjumlah 166 buah. 2. Datarekapitulasi pembayaran angsuran peminjam4 tahun terakhir pada KOPINKRA Sumber Rejeki. Data rekapitulasi pembayaran angsuran merupakan data pembayaran pinjaman setiap bulannya yang dirangkum dalam sebuah tabulasi. Data rekapitulasi ini menunjukkan pembayaran angsuran pinjaman anggota dari waktu ke waktu dalam kurun waktu 4 tahun yakni tahun 2009 – 2013. Variabel-variabel penelitian yang memiliki pengaruh besar dalam penentuan kelancaran, yaitu variabel tak bebas adalah kelancaran, sedangkan variabel bebas adalah penghasilan, pinjaman, jangka waktu dan jaminan. Penjelasan variabel-variabel yang digunakan dalam penelitian ini adalah : 1. Penghasilan Dalam penelitian ini, data penghasilan anggota cukup penting karena diasumsikan semakin tinggi penghasilan anggota maka kemampuan untuk mengembalikan pinjaman juga semakin tinggi sehingga kemungkinan pembayaran angsuran C-276
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta, 15 November2014
ISSN: 1979-911X
2. Pinjaman Besar pinjaman diasumsikan sebagai beban yang harus ditanggung oleh peminjam. Semakin besar pinjaman maka diasumsikan semakin tinggi beban peminjam sehingga semakin rendah kemungkinan dalam kelancaran pembayaran pinjaman. 3. Jangka waktu Jangka waktupengembalian pinjaman berpengaruh terhadap beban angsuran setiap bulannya. Jangka waktu pengembalian pinjaman yang semakin lama diasumsikan bahwa semakin sedikit angsuran pinjaman setiap bulannya sehingga kemungkinan kelancaran pengembalian pinjaman menjadi semakin tinggi. 4. Jaminan Jaminan dapat digunakan sebagai pertanggungjawaban yang dapat dipergunakan untuk melunasi pinjaman ketika peminjam tidak sanggup mengembalikan pinjaman. Keberadaan pinjaman merupakan bukti kesungguhan dari peminjam dalam mengembalikan pinjaman. Oleh karena itu, dengan adanya jaminan dapat diasumsikan bahwa semakin tinggi kesungguhan peminjam dalam mengembalikan pinjaman. 5. Kelancaran Kelancaran pengembalian pinjaman merupakan variabel yang bergantung pada besarnya penghasilan, besar pinjaman, jangka waktu pinjaman serta keberadaan jaminan. Kelancaran pinjaman dapat diketahui dari kesesuaian waktu pengembalian pinjaman terhadap jangka waktu pinjaman. Sebuah pinjaman dapat diasumsikan lancar apabila penghasilan tinggi, pinjaman rendah, jangka waktu lama serta adanya jaminan dari peminjam. Metode K-Nearest Neighbor sangat sering digunakan dalam klasifikasi. Tujuan dari algoritma ini adalah untuk mengklasifikasi objek baru berdasarkan atribut dan training samples (Larose, 2005). Algoritma K-Nearest Neighbor (K-NN atau KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Teknik ini sangat sederhana dan mudah diimplementasikan. Dalam hal ini jumlah data/tetangga terdekat ditentukan oleh user yang dinyatakan dengan k. Misalkan ditentukan k=5, maka setiap data testing dihitung jaraknya terhadap data training dan dipilih 5 data training yang jaraknya paling dekat ke data testing. Lalu periksa output atau labelnya masing-masing, kemudian tentukan output mana yang frekuensinya paling banyak. Lalu masukkan suatu data testing ke kelompok dengan output paling banyak. Misalkan dalam kasus klasifikasi dengan 3 kelas, lima data tadi terbagi atas tiga data dengan output kelas 1, satu data dengan output kelas 2 dan satu data dengan output kelas 3, maka dapat disimpulkan bahwa output dengan label kelas 1 adalah yang paling banyak. Maka data baru tadi dapat dikelompokkan ke dalam kelas 1. Prosedur ini dilakukan untuk semua data testing [Santosa, 2007]. Metode K-Nearest Neghbor sangat sederhana tetapi performanya sangat handal. Persoalan terpenting pada metode K-Nearest Neighor adalah biaya komputasi karena dalam proses klasifikasi, seluruh data dipakai untuk menentukan kelas dari pola tes. Oleh karena itu, diperlukan program komputer untuk melakukannya. Beberapa macam jarak yang sering digunakan dalam literatur machine learning/data mining: 1. Jarak Euclidean (L2- norm) Jarak dua titik x dan y menurut Euclid dirumuskan sebagai :
d ( x, y ) = x − y =
n
∑ (x i =1
i
− yi ) 2
2. Jarak Manhattan atau Cityblock (L2-norm) Menurut konsep ini jarak dua titik x dan y dirumuskan : n
d ( x, y ) = ∑ ( x i − y i ) i =1
3. Jarak Minkowski
d ( x, y ) = x − y
= (∑ x − y ) q
q
1 q
Dimana q ≥ 1 adalah parameter yang bisa diseleksi. Apabila q = 1, maka jarak tersebut menjadi jarak Manhattan. Sedangkan untuk q = 2, jarak tersebut menjadi jarak Euclidean. C-277
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta, 15 November2014
ISSN: 1979-911X
4. Jarak Chebyshev (L∞- norm)
d ( x, y ) = x − y
∞
=
max { xi − y i } 1≤ i ≤ n
5. Jarak Mahalanobis (energy-norm)
[
d ( x, y) = ( x − y) T ∑ −1 ( x − y)
]
Dimana ∑ adalah covariance matrix. Dalam hal ∑ = I, maka jarak ini menjadi Euclidean.[Santosa, 2007]. Tahapan analisis dengan metode K-Nearest neighbor 1. Menentukan kelas Kelas variabel dependen berupa kategorikal yang merepresentasikan ‘label’ yang terdapat pada objek. Contohnya: resiko penyakitjantung, resiko kredit, customer loyalty, jenis gempa. 2. Predictor Variabel independen direpresentasikan oleh karakteristik (atribut) data. Contohnya: merokok, minum alkohol, tekanan darah, tabungan, aset, gaji. 3. Training dataset Satu set data yang berisi nilai dari kedua komponen di atas yang digunakan untuk menentukan kelas yang cocok berdasarkan prediktor. 4. Testing dataset Berisi data baru yang akan diklasifikasikan oleh model yang telah dibuat dan akurasi klasifikasi dievaluasi. 5. Pengukuran akurasi Untuk mengukur akurasi algoritma klasifikasi, metode yang dapat digunakan yaitu cross validation, confusion matrix dan kurva ROC (Receiver Operating Characteristic). Untuk mengembangkan aplikasi (development) berdasarkan model yang dibuat, digunakan Rapid Miner. Sedangkan metode validasi yang sering digunakan adalah confusion matrix. Tabel 1.Pengukuran akurasi metode K-Nearest Neighbor Kelas asli (i)
Kelas hasil prediksi (j) d Kelas = 1 Kelas = 0 f11 f10 f01 f00
Kelas = 1 Kelas = 0
Untuk menghitung akurasinya digunakan formula : Akurasi =
J
J
Analisis Diskriminan adalah salah satu teknik analisis Statistika dependensi yang memiliki kegunaan untuk mengklasifikasikan objek beberapa kelompok. Pengelompokan dengan analisis diskriminan ini terjadi karena ada pengaruh satu atau lebih variabel lain yang merupakan variabel independen. Kombinasi linier dari variabel-variabel ini akan membentuk suatu fungsi diskriminan. Analisis diskriminan adalah teknik multivariate yang termasuk dependence method, yakni adanya variabel dependen dan variabel independen. Dengan demikian ada variabel yang hasilnya tergantung dari data variabel independen. Analisis diskriminan mirip regresi linier berganda (multivariable regression). Perbedaannya analisis diskriminan digunakan apabila variabel dependennya kategoris (maksudnya kalau menggunakan skala ordinal maupun nominal) dan variabel independennya menggunakan skala metric (interval dan rasio). Sedangkan dalam regresi berganda variabel dependennya harus metric dan jika variabelnya independen, bias metric maupun nonmetrik. Model dasar analisis diskriminan mirip regresi berganda. Perbedaannya adalah kalau variabel dependen regresi berganda dilambangkan dengan Y, maka dalam analisis diskriminan dilambangkan dengan D. Model analisis diskriminan adalah sebuah persamaan yang menunjukkan suatu kombinasi linier dari berbagai variabel independen yaitu : … Dengan : C-278
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta, 15 November2014
ISSN: 1979-911X
D = skor diskriminan b= koefisien diskriminasi atau bobot X = prediktor atau variabel independent Yang diestimasi adalah koefisien ‘b’, sehingga nilai ‘D’ setiap grup sedapat mungkin berbeda. Ini terjadi pada saat rasio jumlah kuadrat antargrup (betweengroup sum of squares) terhadap jumlah kuadrat dalam grup (within-group sum of square) untuk skor diskriminan mencapai maksimum. Berdasarkan nilai D itulah keanggotaan suatu objek diprediksi. Sebelum dilakukan Analisis Diskriminan, data harus memenuhi asumsi sebagai berikut : 1. Uji Normalitas Uji normalitas bertujuan untuk mengetahui apakah masing-masing variabel berdistribusi normal atau tidak. Uji normalitas diperlukan karena untuk melakukan pengujian-pengujian variabel lainnya dengan mengasumsikan bahwa nilai residual mengikuti distribusi normal. Jika asumsi ini dilanggar maka uji statistik menjadi tidak valid dan statistik parametrik tidak dapat digunakan. 2. Uji Multikolinieritas Uji multikolinearitas bertujuan untuk menguji apakah ditemukan adanya korelasi antar variabel bebas (independen).Karena data yang baik seharusnya tidak terjadi korelasi di antara variabel independen.Uji multikolinearitas dilakukan dengan melihat tolerance value dan variance inflation factor (VIF). Multikolinearitas terjadi bila nilai VIF diatas nilai 10 atau tolerance value dibawah 0,10. Multikolinearitas tidak terjadi bila nilai VIF dibawah nilai 10 atau tolerance value diatas 0,10. 3. Uji homoskedastisitas Uji ini bertujuan untuk melihat apakah terdapat ketidaksamaan varians dari residual satu pengamatan ke pengamatan yang lain. Dalam analisis diskriminan diasumsikan bahwa varians bersyarat dari E(εi2) = Var(εi) = σ2, apabila varians bersyarat εi = σi2untuk setiap 1, ini berarti variansnya homogen atau homokedastisitas. Tahapan analisis diskriminan 1. Pembentukan model diskriminan Kombinasi linier Fisher adalah kombinasi linier sebagai berikut: Y = λ ' X = ( μ1 − μ2 )∑ −1 X [Rosy, 2010] Dimana : λ’ = vektor yang berisi koefisien-koefisien variabel penjelas X = variabel-variabel dalam model diskriminan (X1, X2, ... Xk) μ = vektor rata-rata tiap variabel X pada kelompok 1 μ = vektor rata-rata tiap variabel X pada kelompok 2 ∑ = matriks varian-kovarian 2. Menguji signifikansi dari fungsi diskriminan yang telah terbentuk dengan menggunakan Wilk’s Lambda, Pilai, F test dan lainnya. 3. Menguji ketepatan klasifikasi dari fungsi diskriminan , termasuk mengetahui ketepatan klasifikasi secara individual dengan Casewise Diagnostics. 4. Melakukan interpretasi terhadap fungsi diskriminan tersebut. 5. Melakukan uji validasi fungsi diskriminan. Penelitian terkait yang mendukung penelitian ini adalah penelitian Kusrini, dkk (2009) dengan judul Perbandingan Metode Nearest Neighbor dan Algoritma C4.5 Untuk Menganalisis Kemungkinan Pengunduran Diri Calon Mahasiswa di STMIK AMIKOM Yogyakarta, penelitian tersebut memberikan kesimpulan bahwa rata-rata keberhasilan K-Nearest Neighbor dalam melakukan klasifikasi data cukup akurat. Hal ini menunjukkan bahwa K-Nearest Neighbor memiliki performa yang handal dalam melakukan klasifikasi. Maria, dkk (2012)melakukan penelitian yang berjudul Analisis Diskriminan terhadap Perilaku Mahasiswa dalam Mengkonsumsi Makanan Cepat Saji menghasilkan kesimpulan bahwa model fungsi diskriminan yang terbentuk mempunyai ketepatan mengklasifikasikan sebesar 73,05% sehingga dapat digunakan untuk mengklasifikasikan konsumen baru termasuk pada kelompok tertentu. Sumbodo (2010) dalam penelitiannya yang berjudulPerbandingan Model Diskriminan dan Model Logit untuk Memprediksi Financial Distress Perusahaan Manufaktur di BEI memperoleh kesimpulan bahwa model logit memiliki akurasi prediksi sebesar90% lebih tinggi dibanding dengan model diskriminan yang memiliki akurasi prediksi sebesar 88.6%. C-279
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta, 15 November2014
ISSN: 1979-911X
HASIL DAN PEMBAHASAN Dalampenelitian ini digunakan nilai k yaitu 1,3,5,7,9 dan 11 sehingga hasilnya sebagai berikut: Tabel 2.Hasil analisis dengan nilai k=1
Kelas asli
Kelas hasil prediksi Kelas = 1 Kelas = 0 100 15 19 32
Kelas = 1 Kelas = 0
‘ Tabel 3.Hasil analisis dengan nilai k=3
Kelas asli
Kelas hasil prediksi Kelas = 1 Kelas = 0 105 10 18 33
Kelas = 1 Kelas = 0
Tabel 4.Hasil analisis dengan nilai k=5
Kelas asli
Kelas hasil prediksi Kelas = 1 Kelas = 0 105 10 20 31
Kelas = 1 Kelas = 0
Tabel 5. Hasil analisis dengan nilai k=7
Kelas asli
Kelas hasil prediksi Kelas = 1 Kelas = 0 106 9 17 34
Kelas = 1 Kelas = 0
Tabel 6.Hasil analisis dengan nilai k=9 Kelas hasil prediksi Kelas = 1 Kelas = 0 Kelas asli Kelas = 1 104 11 Kelas = 0 18 33 Tabel 7.Hasil analisis dengan nilai k=11
Kelas asli
Kelas = 1 Kelas = 0
Maka dapatdihitung akurasinya adalah : 1. K=1 J Akurasi = J
2. K=3 J Akurasi = 3. K=5 J Akurasi = 4. K=7 J Akurasi =
J J
J
Kelas hasil prediksi Kelas = 1 Kelas = 0 102 12 20 31
0,7951
0,8313
0,8192
0,8433
5. K=9 C-280
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta, 15 November2014
Akurasi =
J
6. K=11 J Akurasi =
J
J
0,8253
0,8012
ISSN: 1979-911X
Sehingga dapat disimpulkan bahwa nilai k yang menghasilkan analisis terbaik adalah 7 dengan kredit macet yang mungkin terjadi adalah sebesar 25,90% dan akurasi 0,8433 atau 84,33%. Karena nilai ketepatan 84,33% > 50% maka metode K-Nearest Neighbor tersebut dapat digunakan untuk mengklasifikasikan kasus pada pinjaman anggota KOPINKRA Sumber Rejeki. Analisis Diskriminan 1. Uji asumsi analisis diskriminan a. Uji normalitas Hipotesis : H0 : Variabel berdistribusi normal H1 : Variabel tidak berdistribusi normal Pada uji normalitas dengan metode Kolmogrof Sminorv, H0 ditolak jika sig < 0,05 Tabel 8.Uji Normalitas a
Normal Parameters
Most Extreme Differences
penghasilan pinjaman jangka_waktu 1084939.76 2.45E6 20.93 452416.739 1.045E6 9.212 .098 .099 .093 .098 .089 .093 -.082 -.099 -.091 1.259 1.274 1.196 .084 .078 .115
Mean Std. Deviation Absolute Positive Negative
Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed)
Pada tabel diatas menunjukan bahwa nilai sig > 0,05 artinya H0 tidak ditolak sehingga variabel penghasilan, pinjaman dan jangka waktu berdistribusi normal yang berarti bahwa variabelvariabel tersebut telah memenuhi asumsi normalitas. b. Uji Multikolinieritas Hipotesis : H0 : Variabel-variabel independen tidak terjadi multikolinieritas H1 : Variabel-varibel independen terjadi multikolinieritas Pada uji multikolinieritas tersebut, H0 ditolak jika nilai VIF > 10 Tabel 9.Uji Multikolinieritas Model 1
Collinearity Statistics Tolerance VIF (Constant) penghasilan pinjaman jangka_waktu jaminan
.486 .121 .162 .929
2.058 8.269 6.164 1.076
Pada tabel di atas menunjukkan bahwa nilai VIF <10 artinya H0 tidak ditolak sehingga variabel penghasilan, pinjaman, jangka waktu dan jaminan tidak terjadi multikolinieritas yang berarti bahwa variabel-variabel tersebut telah memenuhi asumsi multikolinieritas. c. Uji Homoskedastisitas Hipotesis : H0 : Matriks varian-kovarian homogen H1 : Matriks varian-kovarian tidak homogen Pada uji multikolinieritas tersebut, H0 ditolak jika nilai sig < 0,05
C-281
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta, 15 November2014
ISSN: 1979-911X
Tabel 9. Uji Homokesdastisitas Box's M 20.737 F Approx. 2.006 df1 10 df2 4.562E4 Sig. .029 Pada tabel diatas menunjukan bahwa nilai sig < 0,05 artinya H0 ditolak sehingga matriks varian-kovarian tidak homogen yang berarti bahwa matrik varian-kovarianantar kelompok memang berbeda dan hal ini menyalahi asumsi diskriminan. Namun demikian analisis diskriminan tetap robust walaupun asumsi homoskedastisitastidak terpenuhi dengan syarat data tidak outlier. (Ghozali, 2002). 2. Analisis Diskriminan a. Uji Signifikansi dari fungsi diskriminan yang terbentuk Dengan menggunakan level toleransi (α) sebesar 5% untuk uji signifikansi fungsi diskriminan. Untuk mengevaluasi output, dapat dilihat pada tabel sebagai berikut: Tabel 10.Wilks’ Lambda Test of Function(s) 1
Wilks' Lambda 0,534
Chi-square 101,722
Df 4
Sig. 0,000
Dari tabel di atas diperoleh nilai sig < 0,05 maka H0 ditolak sehingga dapat disimpulkan bahwa fungsi diskriminan signifikan yang berarti nilai rata-rata scorediskriminan untuk kelompok anggota besdasarkan kelancaran pembayaran angsurannya tidak sama. b. Uji kekuatan hubungan fungsi driskriminan Perhitungan dengan SPSS 16 diperoleh hasil sebagai berikut : Tabel 11.Nilai Eigen Function 1
Eigenvalue 0,874
% of Variance
Cumulative %
100,0
100,0
Canonical Correlation 0,683
Pada tabel di atas, canonical correlation mengukur keeratan hubungan antara discriminan score dengan grup. Angka 0,683 menunjukkan keeratan yang tinggi dengan ukuran skala 0 sampai 1. c. Fungsi Diskriminan Perhitungan dengan SPSS 16 diperoleh hasil sebagai berikut : Tabel 12Koefisien Kanonik Fungsi Diskriminan Function 1 0,000 0,000 -0,062 1,459 0,134
penghasilan pinjaman jangka_waktu jaminan (Constant)
Berdasarkan tabel di atas diperoleh fungsi diskriminan dengan nilai koefisien pada variabel penghasilan dan pinjaman adalah 0,000, sehingga harus dilakukan analisis ulang dengan menghilangkan variabel penghasilan dan pinjaman. 3. Analisis Diskriminan tanpa variabel penghasilan dan pinjaman a. Uji Signifikansi dari fungsi diskriminan yang terbentuk C-282
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta, 15 November2014
ISSN: 1979-911X
Dengan menggunakan level toleransi (α) sebesar 5% untuk uji signifikansi fungsi diskriminan. Untuk mengevaluasi output, dapat dilihat pada tabel sebagai berikut: Tabel 13.Wilks’ Lambda Test of Function(s) 1
Wilks' Lambda Chi-square .655 69.090
df 2
Sig. .000
Dari tabel di atas diperoleh nilai sig < 0,05 maka H0 ditolak sehingga dapat disimpulkan bahwa fungsi diskriminan signifikan yang berarti nilai rata-rata scorediskriminan untuk kelompok anggota besdasarkan kelancaran pembayaran angsurannya tidak sama. b. Uji kekuatan hubungan fungsi driskriminan Perhitungan dengan SPSS 16 diperoleh hasil sebagai berikut : Tabel 14. Nilai Eigen Function 1
Eigenvalue % of Variance Cumulative % .528a 100.0 100.0
Canonical Correlation .588
Pada tabel di atas, canonical correlation mengukur keeratan hubungan antara discriminan score dengan grup. Angka 0,588 menunjukkan keeratan yang tinggi dengan ukuran skala 0 sampai 1. c. Fungsi Diskriminan Perhitungan dengan SPSS 16 diperoleh hasil sebagai berikut : Tabel 15.Koefisien Kanonik Fungsi Diskriminan
jangka_waktu jaminan (Constant)
Function 1 -.095 1.915 1.160
Dari tabel di atas dapat dilihat bahwa tidak ada variabel dengan koefisien 0,000, sehingga model yang dihasilkan pada Analisis Diskriminan tersebut adalah : Y = 1,160 – 0,095x3 + 1,915x4 Model tersebut menyatakanbahwa variabel jangka waktu berkorelasi negatif terhadap kelancaran, yang berarti bahwa semakin tinggi jangka waktu maka tingkat kelancaran semakin redah, dan sebaliknya. Sedangkan variabel jaminan berkorelasi posetif terhadap kelancaran, yang berarti bahwa dengan adanya jaminan maka tingkat kelancaran semakin tinggi, dan sebaliknya. d. Pengklasifikasian Perhitungan dengan SPSS 16 diperoleh hasil sebagai berikut : Selanjutnya nilai cutting score (nilai batas) dapat dihitung sebagai berikut; Tabel 16. Koefisien Kanonik Fungsi Diskriminan kelancaran tidak lancar lancar
Function 1 -1.084 .481
Karena terdapat dua tipe kelancaran, maka disebut two-group discriminant, dimana grup yang satu mempunyai centroid (group means) negatif dan grup lainnya mempunyai centroid (group means) positif.Tabel dapat digunakan untuk perhitungan cutting score (nilai batas) sebagai berikut : n Z n Z Z n n
,
,
0,00018 C-283
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta, 15 November2014
ISSN: 1979-911X
Pada penggunaan nilai Zcu (Discriminating Z Score), apabila skor kasus disubstitusikan pada fungsi diskriminan nilainya di atas Zcu maka masuk ke dalam grup tidak lancar. Sebaliknya apabila nilainya di bawah Zcu maka masuk ke dalam grup lancar. e. Penilaian validitas diskriminan Setelah pembentukan dan klasifikasi dilakukan, maka selanjutnya akan dilihat ketepatan hasil klasifikasi pada proses klasifikasi tersebut. Tabel 17.Hasil Klasifikasi
Original
Count %
kelancaran tidak lancar lancar tidak lancar lancar
Predicted Group Membership tidak lancar lancar 43 8 31 84 84.3 15.7 27.0 73.0
Total 51 115 100.0 100.0
Dari tabel di atas, dapat dilihat bahwa kredit macet yang mungkin terjadi adalah sebesar 44,57% dengan ketepatan prediksi dari model diskriminan sebesar76,5%. Karena nilai ketepatan 76,5% > 50% maka model diskriminan tersebut dapat digunakan untuk mengklasifikasikan kasus pada pinjaman anggota. KESIMPULAN Setelah melakukan analisis resiko kredit dengan metode K-Nearest Neighbor dan Analisis Diskriminan dapat diambil kesimpulan sebagai berikut : 1. Model yang dihasilkan dari analisis resiko kredit dengan menggunakan Analisis Diskriminan adalah Y = 1,160 – 0,095x3 + 1,915x4. Model tersebut menyatakanbahwa variabel jangka waktu berkorelasi negatif terhadap kelancaran, yang berarti bahwa semakin tinggi jangka waktu maka tingkat kelancaran semakin redah, dan sebaliknya. Sedangkan variabel jaminan berkorelasi posetif terhadap kelancaran, yang berarti bahwa dengan adanya jaminan maka tingkat kelancaran semakin tinggi, dan sebaliknya. 2. Ketepatan prediksi resiko kredit yang dianalisis dengan metode K-Nearest Neighbor adalah sebesar 84,33% pada nilai k adalah 7. Sedangkan ketepatan prediksi resiko kredit yang dianalisis dengan Analisis Diskriminan adalah sebesar 76,5%. 3. Hasil prediksi resiko kredit di KOPINKRA Sumber Rejeki dengan menggunakan metode KNearest Neighbor menunjukkan bahwa kredit macet yang mungkin terjadi adalah sebesar 25,90% dan Analisis Diskriminan adalah sebesar 44,57%. DAFTAR PUSTAKA Ghozali, I. (2002). “Aplikasi Analisis Multivariate dengan Program SPSS”. Badan Penerbit Universitas Diponegoro Semarang. Kusrini, dkk. 2009. Perbandingan Metode Nearest Neighbor dan Algoritma C4.5 Untuk Menganalisis Kemungkinan Pengunduran Diri Calon Mahasiswa di STMIK AMIKOM Yogyakarta. STMIK AMIKOM. Yogyakarta Maria, dkk. 2012. Analisis Diskriminan terhadap Perilaku Mahasiswa dalammengkonsumsi Makanan cepat Saji (Studi Kasus : Para Mahasiswa UPI, ITB, UNLA dan UIN Sunan Gunung Djati). ‘ Santosa, B. 2007. Data Mining : Teknik Pemanfaatan Data untuk Keperluan Bisnis. Graha Ilmu. Yogyakarta. Sumbodo, J. 2010. Perbandingan Model Diskriminan dan Model Logit untuk Memprediksi Financial Distress Perusahaan Manufaktur di BEI. Universitas Sebelas Maret. Surakarta.
C-284