Konferensi Nasional Sistem dan Informatika 2012 Bali, November 27, 2012
KNS&I12-026
IMPLEMENTASI DATA MINING UNTUK MENEMUKAN ASSOCIATION RULE PADA DATA PERBANKAN Amiruddin Sekolah Tinggi Sandi Negara
[email protected] ABSTRACT A large amount of transaction data held by the bank and the business needs to make effective marketing are the two important issues that faced by the banking sector. Handling large amounts of transaction data can be done with data warehousing. Bank XYZ has implemented data warehousing, but to utilize these data in order to support decision making by the management, it is necessary to dig out information buried in such massive data. Therefore, this paper presented the implementation of data mining to discover association rules in banking data owned by Bank XYZ. Interpretation of the data mining results in the following characteristics: banking transactions on Bank XYZ is most prevalent in the branch offices in Jakarta with a transaction value equal to or less than Rp. 2.250.000; transactors are generally Muslim and male sex; marital status and type of work are closely related to the religion of the perpetrators, which in general, transactors are married, Muslim, and private jobs; and most transactions occurred on December 28th, while the lowest transaction occurred on December 31st. Kata Kunci: Data mining, association rule, support, confidence
1. Pendahuluan 1.1 Latar Belakang Peningkatan pertumbuhan volume dan jenis transaksi perbankan berjalan seiring dengan kesadaran masyarakat dalam menggunakan layanan perbankan. Akibatnya, jumlah data yang dikelola bank pun semakin membesar sehingga perlu upaya untuk memanfaatkan data tersebut. Sementara itu, dinamika dan persaingan dalam dunia perbankan yang semakin ketat, membuat manajemen harus senantiasa memikirkan cara-cara untuk terus eksis dan bertahan bahkan jika mungkin mengembangkan skala bisnis mereka. Untuk memenuhi kebutuhan bisnis tersebut, banyak cara yang dapat ditempuh. Salah satunya adalah dengan menerapkan teknik-teknik pemasaran yang efektif dengan biaya yang minimal [1]. Hal ini berkaitan erat dengan pengambilan keputusan yang tepat dalam pemasaran produk pada sasaran pelanggan tepat. Pemanfaatan data dan kebutuhan bisnis untuk pemasaran yang efektif dengan biaya yang minimal dapat dilakukan dengan implementasi data warehouse dan data mining. Dengan data warehousing dan data mining, data dalam data warehouse tersebut bisa dimanfaatkan untuk menemukan pengetahuan berguna yang diperlukan dalam pengambilan keputusan oleh manajemen, khususnya dalam mendukung pemasaran yang efektif seperti disebutkan di atas. Bank XYZ sudah menerapkan data warehousing untuk menyimpan data transaksi yang dilakukan dan sudah memanfaatkan data tersebut, meskipun masih secara sederhana, untuk meningkatkan layanan mereka kepada pelanggan dan masyarakat lainnya. Dalam tulisan ini akan dibahas tentang implementasi teknologi data mining untuk mendapatkan informasi yang tersembunyi dalam data warehouse Bank XYZ, khususnya untuk menemukan Association Rules pada beberapa kolom pada data transaksi, tabungan dan pelanggan. 1.2 Tujuan dan Perumusan Masalah Penelitian ini bertujuan untuk mengimplementasikan teknologi data mining untuk mencari keterkaitan/hubungan pada beberapa field dalam tabel transaksi, tabungan, dan pelanggan, yaitu: a. Kode cabang dengan jumlah transaksi untuk mengetahui cabang tempat pelanggan paling banyak melakukan transaksi. b. Jumlah pengambilan uang dengan tanggal, bulan dan tahun pengambilan, jenis kelamin, agama, status pernikahan, dan pekerjaan untuk menggambarkan perilaku pelanggan yang melakukan transaksi penarikan. c. Jumlah penyetoran uang dengan tanggal, bulan dan tahun penyetoran, jenis kelamin, agama, status pernikahan, dan pekerjaan untuk menggambarkan perilaku pelanggan yang melakukan transaksi penyetoran.
2. Landasan Teori 2.1 Data Mining Hanya menyimpan informasi dalam data warehouse saja, tidak memberikan manfaat yang dicari oleh perusahaan. Karena nilai data dalam data warehouse begitu berharga, perlu dilakukan upaya untuk menemukan pengetahuan yang tersembunyi dalam data warehouse. Namun, seiring dengan jumlah dan kompleksitas data dalam data warehouse, menjadi sangat sulit, jika tidak ingin dikatakan mustahil, bagi analis bisnis untuk mengidentifikasi tren dan hubungan 154
Konferensi Nasional Sistem dan Informatika 2012 Bali, November 27, 2012
KNS&I12-026
dalam data tersebut hanya menggunakan query tool dan reporting yang sederhana. Data mining merupakan solusi terbaik untuk menemukan pengetahuan dari data yang sangat besar dalam data warehouse. Banyak istilah yang digunakan untuk menunjukkan proses data mining. Di antaranya adalah knowledge discovery, knowledge extraction, data/pattern analysis, data archeology, data dredging, information harvesting, business intelligence, dll. Berikut ini adalah definisi data minig yang diambil dari beberapa sumber: a. Data mining adalah mencocokkan data dalam suatu model untuk menemukan informasi yang tersembunyi dalam database [2]. b. Data mining merupakan aplikasi suatu algoritma untuk menggali informasi bermanfaat dari dalam database [3]. c. Data mining adalah proses menemukan pola-pola di dalam data, di mana proses penemuan tersebut dilakukan secara otomatis atau semi otomatis dan pola-pola yang ditemukan harus bermanfaat [4]. d. Data mining adalah proses penemuan informasi yang berguna pada penyimpanan data yang besar secara otomatis [5]. e. Data mining atau Knowledge Discovery in Databases (KDD) adalah pengambilan informasi yang tersembunyi, di mana informasi tersebut sebelumnya tidak dikenal dan berpotensi bermanfaat. Proses ini meliputi sejumlah pendekatan teknis yang berbeda, seperti clustering, data summarization, learning classification rules [3]. 2.2 Tahapan Data Mining Proses Data Mining/KDD secara garis besar dan berurutan dapat dijelaskan sebagai berikut [2] : a. Seleksi Data (Data Selection). Seleksi data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari database operasional. Data hasil seleksi ini disebut data target. b. Prapemrosesan (Pre-processing/ Cleaning). Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses pembersihan (cleaning) pada data target yang dihasilkan dari tahap seleksi. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi). Juga dilakukan proses pengayaan (enrichment) data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal. Data yang dihasilkan dari tahap ini disebut preprocessed data. c. Transformasi (Transformation). Proses transformasi dilakukan pada preprocessed data dengan melakukan pengkodean, sehingga data tersebut sesuai untuk proses data mining. Proses pengkodean (coding) dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam database. Data hasil transformasi disebut sebagai transformed data atau dataset. d. Data mining. Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan. Hasil dari tahap data mining adalah model yang sesuai dengan tujuan yang dikehendaki. e. Interpretasi (Interpretation/ Evaluation). Model yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya. 2.3 Association Rule Mining Association Rule Mining merupakan bagian dari Frequent Pattern Mining. Fungsi ini mencari hubungan/relasi, assosiasi, dan korelasi dalam data. Pengetahuan yang dihasilkan juga sangat berguna untuk klasifikasi, clustering, dan fungsi data mining yang lain. Association Rule Mining dapat juga disebut Frequent Itemset Mining karena pola yang dihasilkan adalah pola item yang sering muncul bersamaan dalam sebuah database . Contoh klasik yang sering digunakan untuk menjelaskan Association Rule Mining adalah market basket analysis. Pada market basket analysis, kita menganalisis kebiasaan pelanggan dalam membeli barang. Contoh pengetahuan yang dapat diperoleh dari data transaksi belanja adalah {Beer} {Diaper} artinya orang yang beli beer biasanya beli diaper juga. Lebih jauh, Association Rule menjelaskan hubungan korelasi antar item dengan lebih jelas, tidak hanya korelasi kuat atau korelasi lemah saja. Hal ini karena adanya beberapa metrik yang digunakan untuk evaluasi rule. Penting tidaknya suatu Association Rule dapat diketahui dengan dua parameter, yaitu support dan confidence. Support adalah prosentase kombinasi item tersebut dalam database, sedangkan confidence adalah kuatnya hubungan antar-item dalam Association Rule. Association Rule biasanya dinyatakan dalam bentuk sintaks : Antecedent Consequent (support, confidence) Untuk menghitung nilai support dan confidence tersebut, misalnya dari data transaksi T, digunakan rumus sebagai berikut [7]: Support = kejadian (Antecedent + Consequent) / semua kejadian dalam T Confidence = support (Antecedent) / support (Antecedent + Consequent) Contoh Association Rules adalah sebagai berikut: 155
Konferensi Nasional Sistem dan Informatika 2012 Bali, November 27, 2012
KNS&I12-026
{roti, mentega} {susu} (support = 40%, confidence = 50%) Artinya : "50% dari transaksi di database yang memuat item roti dan mentega juga memuat item susu, dan 40% dari seluruh transaksi yang ada di database memuat ketiga item itu." Dapat juga diartikan : "Seorang konsumen yang membeli roti dan mentega punya kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari catatan transaksi selama ini." 2.4 Algortima K-Means K-Means adalah sebuah algoritma clustering yang bersifat iteratif, artinya terjadi proses yang sama berulang-ulang sampai tercapai cluster yang diinginkan atau memenuhi batas toleransi yang diinginkan. K-means adalah metode clustering berbasis jarak yang membagi data ke dalam sejumlah cluster. 2.5 Algoritma Apriori Algoritma Apriori adalah algoritma paling terkenal untuk menemukan pola frekuensi tinggi [2]. Pola frekuensi tinggi adalah pola-pola item di dalam suatu database yang memiliki frekuensi atau support di atas ambang batas tertentu yang disebut dengan istilah minimum support. Pola frekuensi tinggi ini digunakan untuk menyusun association rules dan juga beberapa teknik data mining lainnya. Walaupun akhir-akhir ini dikembangkan banyak algoritma yang lebih efisien dari Apriori seperti FP-growth, LCM dsb, tetapi Apriori tetap menjadi algoritma yang paling banyak diimplementasikan dalam produk komersial untuk data mining karena dianggap algoritma yang paling mapan [8].
3. Metodologi Penelitian Penelitian ini menggunakan metodologi sebagai berikut: Pengumpulan data melalui: observasi langsung ke lapangan untuk memperoleh gambaran dan data yang obyektif mengenai sistem penyimpanan dan pengelolaan data transaksi Bank XYZ; studi literatur melalui buku-buku perpustakaan dan pencarian di internet; dan diskusi dan wawancara yang dilakukan terhadap personil dan pimpinan di Bank XYZ untuk mendapatkan informasi mengenai kebijakan dalam data warehousing dan rencana pelayanan pelanggan ke depan. Proses data mining/KDD melalui tahapan sebagaimana dijelaskan dalam landasan teori yaitu: seleksi data, prapemrosesan/pembersihan data, transformasi, data mining, dan interpretasi. Pengelompokan data menggunakan algoritma K-means dan data mining menggunakan algoritma apriori.
4. Impelementasi Data Mining Penelitian ini menggunakan algoritma K-means untuk clustering, algoritma apriori untuk association rule mining, dan aplikasi ARMiner [9] untuk melakukan data mining. Adapun tahapan proses yang dilakukan dijelaskan sebagai berikut. 4.1 Seleksi Data Tahap pertama dalam proses KDD adalah tahap seleksi, yaitu pemilihan data yang nantinya akan diformat untuk dijadikan dataset yang akan menjadi masukan untuk proses mining. Seleksi ini meliputi penentuan tabel-tabel dan atribut-atribut yang akan digunakan sesuai dengan tujuan yang akan dicapai. Dari hasil penelitian lapangan, tabel-tabel dan kolom/field data perbankan yang diperlukan untuk menjawab permasalahan sebagaimana dituliskan dalam perumusan masalah adalah sebagai berikut: Tabel TRANSAKSI (DWH_FEF) dengan kolom: BRCOD, AMTR Tabel TABUNGAN1 (DWH_SAFBATCH) dengan kolom: CSNO, ACNO Tabel TABUNGAN2 (DWH_KYC071) dengan kolom:NOCIBX, SE, RELIGI, STKAWIN, KD_PEK Tabel PELANGGAN1 (DWH_CIF) dengan kolom: CSNO Tabel PELANGGAN2 (DWH_F111) dengan kolom: NOREK, NOCIBX, RTAMBIL, RTSETOR, TGLINP Besar sampel data yang digunakan untuk tabel transaksi adalah antara 8.036 sampai 1.387.319 record. 4.2. Prapemrosesan/pembersihan data Pada tahap ini dilakukan prapemrosesan terhadap target data yang telah dihasilkan pada tahap seleksi. Prapemrosesan dilakukan untuk membersihkan data sehingga menghasilkan data yang siap untuk di-mining. Ada beberapa cara yang dilakukan pada tahap prapemrosesan tergantung permasalahan data yang ada, seperti melakukan penghapusan, pengisian field kosong dengan metode tertentu, penghalusan data, dan sebagainya. Permasalahan data yang biasa terjadi adalah adanya data yang hilang, data inkonsisten, kesalahan tipografi (data noisy), data anomali, atau data dengan rentang nilai yang sangat lebar. Pada penelitian ini, pembersihan data dilakukan dengan cara menghapus baris-baris yang mengandung data yang tidak konsisten, data hilang, dan data noisy. 156
Konferensi Nasional Sistem dan Informatika 2012 Bali, November 27, 2012
KNS&I12-026
4.3 Transformasi Proses transformasi dalam penelitian ini terdiri atas tiga yaitu : 4.3.1 Pengelompokan Dalam penelitian ini, pengelompokan data dilakukan pada data yang memiliki rentang nilai yang sangat lebar, yaitu: nilai (nominal) transaksi, nilai pengambilan uang, dan nilai penyetoran uang. Pengelompokan tersebut berdasarkan algoritma clustering yang dilakukan menggunakan algoritma K-Means. Pemilihan jumlah cluster-nya dilakukan secara rule of thumb, yaitu berdasarkan ketentuan bahwa cluster yang baik adalah jumlahnya tidak terlalu besar [10]. Oleh karena itu, dalam penelitian ini, clustering dilakukan dengan menggunakan jumlah cluster 4, 6, 8, dan 10. 4.3.2 Pengkodean Setelah pengelompokan data, selanjutnya dilakukan pengkodean untuk setiap nilai transaksi, nilai pengambilan uang, nilai penyetoran uang, kantor cabang, tahun, bulan, tanggal transaksi, serta agama, pekerjaan, jenis kelamin, dan status pernikahan pelaku transaksi. 4.3.3 Pembentukan Dataset Setelah pengkodean selesai, maka langkah selanjutnya adalah pembentukan dataset. Dari data yang sudah dikelompokkan dan dikodekan dibuat tabel baru. Dari tabel baru tersebut dibuat file berformat .asc. Untuk membuat file berformat .asc dibuat program khusus untuk meng-generate file .asc untuk setiap kelompok data yang sudah dibuat. Selanjutnya file-file .asc tersebut harus diubah menjadi file-file .db, yaitu format file database yang bisa diolah oleh ARMiner, dengan menggunakan tools asc2db.java. 4.4 Proses Mining Dari proses mining dengan aplikasi ARMiner menggunakan algoritma Apriori diperoleh beberapa Association Rules, yang disajikan pada bagian berikut ini. 4.4.1 Nilai Transaksi Association Rules yang ditemukan pada nilai transaksi adalah sebagai berikut: AR 1 : c2-4 c1-1 (13%, 89%) AR 1 ini berarti 13% dari transaksi yang terjadi melibatkan transaksi dengan nilai dari Rp. 425.001 s.d. Rp. 554.328 dan lokasi transaksi di DKI Jakarta, dan dari transaksi dengan nilai tersebut, 89% terjadi di DKI Jakarta. AR 2 : c2-6 c1-1 (11%, 83%) Rule ini menunjukkan bahwa transaksi dengan nilai dari Rp. 804.501 s.d. Rp. 1.142.210 ada 83% kemungkinan terjadi di DKI Jakarta, namun aturan ini tidak cukup menentukan, karena hanya mewakili 11% dari catatan transaksi yang ada. 4.4.2 Nilai pengambilan uang Association Rules yang ditemukan pada data nilai pengambilan uang dengan jumlah cluster 4, 6, 8, 10, 12, 14, 16, dan 20 adalah sebagai berikut. Untuk nilai pengambilan uang, dengan minimum support 40% dan confidence 50%, diperoleh dua buah Association Rules teratas yaitu: AR 1 : c5-1 c6-1 (50%, 86%) Ini artinya adalah 50% transaksi pengambilan uang melibatkan pelanggan berjenis kelamin laki-laki (c5-1) dan beragama Islam (c6-1), dan dari transaksi yang melibatkan pelanggan yang berjenis kelamin laki-laki tersebut ada 86% kemungkinan beragama Islam. AR 2 : c6-1 c5-1 (50%, 58%) Kaidah ini menyatakan bahwa transaksi pengambilan uang yang dilakukan oleh pelanggan beragama Islam, 58% kemungkinan berjenis kelamin laki-laki, pernyataan ini cukup signifikan karena mewakili 50% dari transaksi yang terjadi. 4.4.3 Nilai penyetoran uang Association Rules yang ditemukan pada data nilai penyetoran uang adalah sebagai berikut: Hasil mining untuk nilai penyetoran uang, diperoleh dua buah Association Rules teratas yang sama dan mempunyai support dan confidence yang sama pula, yaitu: AR 1 : c5-1 c6-1 (50%, 86%) Artinya bahwa 50% transaksi penyetoran uang melibatkan pelanggan berjenis kelamin laki-laki (c5-1) dan beragama Islam (c6-1), dan dari transaksi yang melibatkan pelanggan yang berjenis kelamin laki-laki tersebut terdapat 86% kemungkinan beragama Islam. AR 2 : c6-1 c5-1 (50%, 58%) 157
Konferensi Nasional Sistem dan Informatika 2012 Bali, November 27, 2012
KNS&I12-026
Artinya bahwa 50% transaksi penyetoran uang melibatkan pelanggan berstatus menikah dan beragama Islam, dan dari transaksi yang melibatkan pelanggan berstatus menikah tersebut 58% beragama Islam. 4.4.4 Penemuan Association Rules dengan Kriteria Tertentu Program aplikasi ARMiner menyediakan fitur untuk menemukan Association Rules dengan kriteria tertentu yang diinginkan oleh user. Fitur tersebut adalah Find Association Rules dengan pilihan tab Advanced. Pada tab Advanced ini, user bisa menentukan item yang akan dijadikan antecedent, consequent, atau diabaikan. Dalam penelitian ini, penulis memanfaatkan fitur Advanced tersebut untuk menemukan Association Rules untuk item tertentu yang dipilih penulis. Data yang digunakan adalah nilai penyetoran uang dengan 10 cluster. Dengan memasukkan kode bulan (c3-01 s.d. c3-12) sebagai antecedent yang harus muncul, maka ditemukan Association Rules dengan support yang sangat kecil yaitu maksimal 8,2%. Dengan demikian, kaidah yang dihasilkan tersebut tidak cukup signifikan. Meskipun Rule yang dihasilkan tidak signifikan, tetap ada yang bisa terlihat jelas, yaitu bahwa pada bulan apa pun transaksi pengambilan atau penyetoran uang dilakukan, ada kemungkinan yang sangat besar yaitu minimal 84,9% transaksi tersebut akan dilakukan oleh pelanggan beragama Islam (c6-1). Bila kode tanggal dimasukkan sebagai antecedent yang harus muncul pada association rules, maka hasil mining-nya menunjukkan support yang sangat kecil, tetapi tetap ada perbedaan yang sangat jelas, yaitu bahwa transaksi yang paling banyak terjadi pada tanggal 28 (c4-28) dan yang terendah terjadi pada tanggal 31 (c4-31), dan pada tanggal berapa pun transaksi dilakukan ada kemungkinan besar, minimal 85%, dilakukan oleh pelanggan beragama Islam. Hasil mining dengan memasukkan kode pekerjaan (c8-1 s.d. c8-3) sebagai parameter yang harus muncul pada association rules diperoleh association rules yang cukup signifikan, yaitu: AR1 : c6-1 c8-2 (41%, 48%) AR2 : c8-2 c6-1 (41%, 86%) AR 2 menunjukkan bahwa kemungkinan 86% pelaku transaksi yang pekerjaannya swasta (c8-2) adalah juga beragam Islam, dan hal ini cukup signifikan karena didukung 41% data transaksi yang ada. Serupa dengan kode pekerjaan, kode status nikah sebagai item yang harus muncul pada association rules juga memperlihatkan kaitan yang erat dengan pelaku beragama Islam, bahwa apa pun status pernikahan pelaku transaksi bisa dipastikan kemungkinan besar beragama Islam. Untuk kode jenis kelamin diperoleh association rule sebagai berikut: AR 1: c6-1 c5-1 (50%, 58%) AR 2 : c5-1 c6-1 (50%, 86%) Kaidah AR 1 menyatakan bahwa 50% transaksi yang terjadi melibatkan pelaku beragama Islam dan berjenis kelamin laki-laki, dari kejadian transaksi yang dilakukan oleh pelanggan beragama Islam 58% juga laki-laki. Adapun kaidah AR 2 menunjukkan bahwa transaksi yang dilakukan pelanggan laki-laki 86% mungkin pelanggan beragama Islam. Pernyataan tersebut sangat signifikan karena mewakili 50% catatan transaksi yang ada. Kaidah AR lain memperlihatkan bahwa kejadian transaksi dengan pelaku beragama Islam (c6-1) berkaitan erat dengan jenis kelamin laki-laki (c5-1), sedangkan kejadian transaksi dengan pelaku non-agama Islam berkaitan erat dengan jenis pekerjaan swasta (c7-2). 4.5 Interpretasi Penemuan Association Rules tentunya tidak akan ada gunanya jika tidak ditindaklanjuti dengan interpretasi pengetahuan. Interpretasi pengetahuan inilah yang nantinya akan menjadi bahan analisis bagi manajemen perusahaan dalam pengambilan keputusan, khususnya dalam mendukung kelancaran transaksi perbankan. Ada pun interpretasi pengetahuan yang diperoleh dalam penelitian ini adalah, sebagai berikut: a. Kegiatan transaksi perbankan pada bank XYZ paling banyak terjadi di kantor cabang di DKI Jakarta dengan nilai transaksi berkisar sampai dengan Rp. 2.250.000. Hal ini dibuktikan dengan hasil mining untuk nilai transaksi yaitu dua buah Association Rules teratas yang ditemukan melibatkan lokasi transaksi di DKI Jakarta dengan nilai transaksi <= Rp. 2.250.000. b. Pelaku transaksi pada umumnya beragama Islam dan berjenis kelamin laki-laki. Hal ini sangat signifikan, karena hasil mining menunjukkan kaitan antara kedua item tersebut (Islam dan laki-laki dan sebaliknya) dengan minimum support 50% dan minimum confidence 58%. c. Status pernikahan berkaitan erat dengan agama pelaku, yakni pada umumnya pelaku transaksi adalah berstatus menikah dan beragama Islam. d. Kode pekerjaan juga berkaitan erat dengan agama pelaku, yaitu pelaku transaksi pada umumnya bekerja di sektor swasta dan beragama Islam. 158
Konferensi Nasional Sistem dan Informatika 2012 Bali, November 27, 2012
e.
f. g. h.
KNS&I12-026
Adapun kode agama erat kaitannya dengan jenis kelamin dan status pernikahan. Pelaku transaksi pada umumnya beragama Islam dan berjenis kelamin laki-laki, sedangkan pelaku transaksi yang beragama non-Islam berkaitan erat dengan pekerjaan swasta. Jenis kelamin berkaitan erat dengan agama pelaku, yaitu pelaku berjenis kelamin laki-laki atau perempuan kemungkinan besar beragama Islam. Bulan terjadinya transaksi tidak cukup signifikan, tetapi ada satu yang sangat jelas, yaitu bahwa bulan berapa pun terjadinya transaksi kemungkinan besar (84,9%) pelakunya beragama Islam. Tanggal terjadinya transaksi juga tidak signifikan, tetapi kejadian transaksi yang terbanyak terjadi pada tanggal 28 dan kemungkinan besar pelakunya beragama Islam. Transaksi terendah terjadi pada tanggal 31 dan kemungkinan besar pelakunya juga beragama Islam.
5. Penutup 5.1 Kesimpulan Hal-hal yang dapat disimpulkan dari tulisan ini adalah sebagai berikut: Kegiatan transaksi perbankan pada bank XYZ paling banyak terjadi di kantor cabang di DKI Jakarta dengan nilai transaksi lebih kecil sama dengan Rp. 2.250.000. Hal ini dibuktikan dengan hasil mining untuk nilai transaksi dengan semua jumlah cluster yang digunakan yaitu 4, 6, 8, dan 10. Dua buah Association Rules teratas yang ditemukan melibatkan lokasi transaksi di DKI Jakarta dengan nilai transaksi <= Rp. 2.250.000. Pelaku transaksi pada umumnya beragama Islam dan berjenis kelamin laki-laki. Hal ini sangat signifikan, karena hasil mining untuk semua jumlah cluster menunjukkan kaitan antara kedua item tersebut (Islam dan laki-laki dan sebaliknya) dengan minimum support 50% dan minimum confidence 58%. Status pernikahan dan jenis pekerjaan berkaitan erat dengan agama pelaku, yakni pada umumnya pelaku transaksi adalah berstatus menikah, beragama Islam, dan pekerjaan swasta. Bulan dan tanggal terjadinya transaksi tidak terlalu menentukan dalam transaksi. Hal ini dapat terlihat pada nilai support yang sangat kecil. Meskipun demikian untuk tanggal transaksi, ada hal yang cukup menonjol yaitu bahwa transaksi terbanyak terjadi pada tanggal 28 dan kemungkinan besar pelakunya beragama Islam, sedangkan transaksi terendah terjadi pada tanggal 31 dan kemungkinan besar pelakunya adalah beragama Islam. 5.2 Saran Saran yang diajukan untuk pengembangan penelitian ini adalah sebagai berikut: a. Penelitian ini perlu dilanjutkan dengan pengelompokan data secara non-clustering, misalnya menggunakan teknik klasifikasi dan rumus H.A Sturges [11]. b. Penelitian ini perlu dilanjutkan dengan menambahkan atau meneliti atribut yang lain, selain yang sudah dibahas dalam penelitian ini sehingga dapat memberikan gambaran yang lebih lengkap tentang perilaku pelanggan.
6. Keterbatasan Penelitian a. b.
Algoritma Apriori yang digunakan dalam data mining ini termasuk memliliki komputasi yang cepat, namun dengan jumlah data yang besar, algoritma ini terasa lambat dalam pemrosesan. Pada penelitian ini dilakukan data mining hanya pada beberapa field/atribut umum karena keterbatasan waktu.
Daftar Pustaka [1] Sri Murtini, Veronika(2002), Data Mining sebagai Solusi Bisnis, INTEGRAL, vol. 7 no. 1. [2] Margaret H. Dunham (2003), Data Mining, Introductory and Advanced Topics, Pearson Education, Inc., Upper Saddle River, New Jersey 07458. [3] Fayyad, U., Piatetsky-Shapiro, G. dan Smyth, P. (1996), From Data Mining to Knowledge Discovery in Databases, AAAI and The MIT Pres, 37-53. [4] Han, J., Kamber, M. (2001), Data Mining: Concepts and Techniques, Morgan Kaufman. [5] Tan P. N., Steinbach, M., Kumar, V. (2006), Introduction to Data Mining, Addison Wesley. [6] Ceppy S. Wibowo (2003), Sistem Deteksi Intrusi dengan Teknik Data Mining: Studi Pengenalan, Tugas Akhir Mata Kuliah Keamanan Informasi, Departemen Teknik Elektro, Fakultas Teknologi Industri ITB. [7] Laurentiu Cristofor dan Dana Cristofor, ARMiner Server Manual, version 0.9. [8] http://datamining.japati.net/cgi-bin/indodm.cgi?Bacaarsip &1172210143, diakses pada Oktober 2008. [9] http://www.cs.umb.edu/~laur/ARMiner/, diakses pada 20 Juli 2012. [10] AB, Hutama (2006), Subspace Clustering Pada Data Multidimensi Menggunakan Algoritma Findit Subspace Clustering Multidimensional Data Using Findit Algorithm http://digilib.ittelkom.ac.id/, diakses pada Juli 2012. [11] Anto Dajan (1986), Pengantar Metode Statistik Jilid I, Cetakan 11, LP3ES, Jakarta.
159