BAB I PENDAHULUAN 1.1
Latar Belakang Klasifikasi merupakan pengelompokan secara sistematis pada suatu objek
atau benda ke dalam golongan atau pola-pola tertentu berdasarkan kesamaan ciri. Masalah klasifikasi sering dijumpai dalam kehidupan sehari-hari, baik pada bidang industri, sosial, kesehatan maupun pendidikan. Penyelesaian
masalah
klasifikasi dapat dilakukan dengan metode klasifikasi. Metode klasifikasi dibedakan menjadi dua yaitu metode klasifikasi parametrik dan nonparametrik. Metode klasifikasi parametrik yang sering digunakan antara lain: analisis regresi logistik, analisis diskriminan, dan analisis regresi probit. Metode klasifikasi parametrik umumnya terikat pada asumsi tertentu misalnya kenormalan data yang harus dipenuhi. Sedangkan metode klasifikasi nonparametrik tidak bergantung pada asumsi tertentu sehingga memberikan fleksibilitas yang lebih besar dalam menganalisis data tetapi tetap mempunyai tingkat akurasi yang tinggi dan mudah dalam penggunaannya. Metode klasifikasi berstruktur pohon merupakan metode klasifikaasi nonparametrik yang hasil akhirnya akan menghasilkan klasifikasi berupa diagram pohon yang mudah dalam penginterpretasian. Metode klasifikasi berstruktur pohon dapat dibagi menjadi dua kelompok, yaitu kelompok yang menghasilkan pohon biner dan nonbiner. CART (Classification and Regression Trees) dan QUEST (Quick, Unbiased, Efficient Statistical Trees) merupakan contoh metode 1
2
klasifikasi yang menghasilkan pohon biner. Sementara CHAID (Chi-squared Automatic Interaction Detection), FACT (Factor Analysis Classification Trees), dan CRUISE (Classification Rule with Unbiased Interaction Selection and Estimation) merupakan contoh metode klasifikasi yang menghasilkan pohon nonbiner. Pada penelitian ini akan dibahas metode klasifikasi pohon menggunakan metode QUEST dan CHAID. Metode QUEST merupakan algoritma yang diperkenalkan oleh Loh dan Shih (1997), sebagai salah satu bentuk metode pohon klasifikasi yang menghasilkan pohon biner, diterapkan pada data dengan variabel respon kategorik dan variabel prediktor berupa variabel kategorik maupun numerik, memiliki kecepatan dalam hal komputasi (quick), menghasilkan pemilihan variabel prediktor yang takbias (unbiased), dan efisien (efficient) untuk data kompleks, serta merupakan metode yang relatif baru berkembang. Hasil analisis dari metode QUEST akan dibandingkan dengan metode pendahulunya, yaitu metode CHAID merupakan algoritma yang diperkenalkan oleh Kass (1980), metode klasifikasi yang lebih dulu diterapkan dan menghasilkan pohon nonbiner. CHAID diterapkan pada data dengan variabel respon dan variabel prediktor berupa variabel kategorik. CHAID merupakan tehnik iteratif yang menguji satu persatu variabel prediktor dalam klasifikasi, dan menyusunnya berdasarkan pada tingkat signifikansi statistik khi-kuadrat terhadap variabel respon (Gallagher, 2000). Metode CHAID sangat efektif digunakan untuk data dengan pengamatan yang banyak.
3
Klasifikasi pohon dengan metode CHAID dan QUEST sebelumnya telah dilakukan oleh Rahmawati (2011) yang berjudul metode CART dan CHAID
untuk pengklasifikasian mahasiswa Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Jember. Dan Malani (2011) yang berjudul pembentukan pohon klasifikasi biner dengan algoritma QUEST. Penelitian Rahmawati (2011) membahas tentang bagaimana memodelkan penjurusan mahasiswa dan membandingkan misklasifikasi dari CART dan CHAID. Penelitian Malani (2011) diterapkan pada bidang kesehatan untuk mengetahui klasifikasi seseorang menderita penyakit jantung berdasarkan faktor-faktor yang memengaruhi. Kebutuhan hidup yang beraneka ragam dan terus meningkat akan mendorong seseorang berusaha untuk memenuhi kebutuhannya. Salah satu cara untuk memenuhi kebutuhan tersebut yaitu dengan memperoleh pinjaman (kredit). Hal ini menyebabkan banyaknya pengajuan kredit oleh calon nasabah terhadap suatu lembaga kredit. Salah satu lembaga kredit di Indonesia adalah Adira Kredit Elektronik Cabang Denpasar. Setiap lembaga kredit harus dapat menyeleksi calon nasabah yang akan diberikan kredit. Dalam menyeleksi apakah seseorang layak mendapatkan pinjaman kredit, dibutuhkan suatu analisis statistika salah satunya dengan metode klasifikasi. Dalam hal ini, metode klasifikasi digunakan untuk membagi nasabah ke dalam kelompok-kelompok yang lebih kecil berdasarkan karakteristik status pembayaran kredit lancar atau macet. Kelompok-kelompok yang terbentuk tersebut akan digunakan oleh Adira Kredit Elektronik Cabang Denpasar sebagai acuan untuk
4
menentukan sasaran utama pemasaran dengan mempertimbangkan status kredit. Dengan penentuan kelompok sasaran kredit yang tepat, diharapkan risiko kredit macet bisa diminimalkan. Adanya kesamaan karakteristik dari metode QUEST dan CHAID yaitu dapat diterapkan pada data variabel kategorik dan dalam pemilihan variabel penyekat menggunakan uji khi-kuadrat. Sehingga penulis tertarik untuk melakukan penelitian dengan metode QUEST dan CHAID yang akan diterapkan pada data nasabah Adira Kredit Elektronik Cabang Denpasar. Penelitian ini membandingkan hasil klasifikasi dari kedua metode tersebut untuk dapat dijadikan bahan analisis perusahaan dalam menentukan calon nasabah pada masa yang akan datang. 1.2
Rumusan Masalah Rumusan masalah dalam penelitian ini adalah sebagai berikut:
1. Bagaimana hasil klasifikasi metode QUEST dan CHAID pada data nasabah Adira Kredit Elektronik Cabang Denpasar? 2. Bagaimana perbandingan besarnya kesalahan klasifikasi dari metode QUEST dan CHAID pada klasifikasi data nasabah Adira Kredit Elektronik Cabang Denpasar? 1.3
Batasan Masalah Penelitian ini hanya akan membahas pembentukan pohon klasifikasi dengan
metode QUEST dan CHAID yang akan dilakukan dengan bantuan software SPSS 20, dengan kedalaman pohon maksimum dan jumlah minimum variabel prediktor
5
yang masuk ke dalam simpul menggunakan nilai default software atau nilai yang telah ditetapkan oleh software SPSS 20. 1.4
Tujuan Penelitian Tujuan dari penelitian ini adalah:
1 untuk mengetahui hasil klasifikasi metode QUEST dan CHAID pada data nasabah Adira Kredit Elektronik Cabang Denpasar. 2 untuk mengetahui perbandingan besarnya kesalahan klasifikasi dari metode QUEST dan CHAID pada klasifikasi data nasabah Adira Kredit Elektronik Cabang Denpasar. 1.5
Manfaat Penelitian Penelitian ini diharapkan dapat memberikan gambaran mengenai metode
klasifikasi berstruktur pohon yang diterapkan pada data nasabah untuk mengetahui karakteristik nasabah dalam pembayaran angsuran. Selain itu juga, hasil dari klasifikasi ini diharapkan dapat menjadi informasi awal pihak Adira Kredit Elektronik Cabang Denpasar dalam hal pemberian kredit bagi calon nasabah.