ISSN : 2407 - 6511 ANALISIS DAN IMPLEMENTASI DATA MINING DENGAN CONTINUOUS ASSOCIATION RULE MINING ALGORITHM (CARMA) UNTUK REKOMENDASI MATA KULIAH PADA PERWALIAN Dwiaji Nuraryudha1, Shaufiah2, Hetti Hidayati3 1,2,3
Fakultas Informatika โTelkom University, Bandung
[email protected],
[email protected],
[email protected]
1
Abstrak
Perwalian adalah tahapan yang harus dilalui oleh setiap mahasiswa pada masa registrasi semester baru. Saat perwalian, mahasiswa mengajukan mata kuliah yang akan diambil kepada dosen wali, kemudian dosen wali akan membantu dengan memberikan rekomendasi mata kuliah untuk mahasiswa walinya terutama dalam pengambilan mata kuliah pilihan. Untuk itu dibuatlah sebuah sistem rekomendasi guna membantu proses perwalian. Sistem rekomendasi ini dibuat dengan teknik Data mining menggunakan algoritma CARMA (Continuous Association rule Mining Algorithm). Hasil implementasi yang dilakukan membuktikan bahwa algoritma CARMA dapat digunakan untuk menyelesaikan proses rekomendasi mata kuliah pilihan. Rekomendasi ini berdasarkan aturan asosiasi yang terbentuk. Nilai yang didapat adalah minimum confidence=50%, dan support sequence = 0.4. Kata kunci : Perwalian, rekomendasi, CARMA, minimum confidence, support sequence 1. Pendahuluan Perwalian adalah tahapan yang harus dilalui oleh setiap mahasiswa pada masa registrasi semester baru. Perwalian yang terdapat pada IT Telkom khususnya Fakultas Informatika menyediakan beberapa mata kuliah untuk dipilih oleh mahasiswa. Mata kuliah tersebut ada yang bersifat wajib dan khusus/pilihan. Mata kuliah pilihan tersebut biasanya diambil sesuai dengan KK (kelompok keahlian) yang diinginkan. Pada fakultas informatika terdapat tiga KK yaitu ICM, TELE, dan SIDE. Setiap KK memiliki mata kuliah pilihan yang berbeda dengan KK yang lainnya. Solusi yang ditawarkan fakultas yaitu mahasiswa harus berhubungan dengan dosen wali. Pertama, sebelum registrasi mahasiswa berkonsultasi dengan dosen wali terkait pengambilan mata kuliah. Dosen wali akan membantu dalam pengambilan mata kuliah sesuai aturan yang berlaku. Dosen wali akan memberikan rekomendasi mata kuliah untuk mahasiswa walinya terutama dalam pengambilan mata kuliah pilihan yang dilihat dari riwayat akademik mahasiswanya. Proses akhir yaitu mahasiswa dapat mencetak Kartu Studi Mahasiswa. Pada prakteknya, dosen wali memiliki kurang lebih 40 anak mahasiswa wali. Dosen wali harus memeriksa satu per satu data akademik mahasiswa dengan waktu yang terbatas. Selain itu, mahasiswa tidak pernah berkonsultasi dengan dosen wali. Mahasiswa tersebut menentukan mata kuliah pilihannya sendiri berdasarkan minat riwayat dari teman-temannya. Bila seperti ini secara terus-menerus peminatan pengambilan mata kuliah pilihan tidak dapat sesuai dengan kemampuan yang dimiliki masing-masing mahasiswa. Pada kasus perwalian, terutama dalam pengambilan Mata Kuliah Pilihan, aturan asosiasi pernah dijadikan untuk memprediksi pengambilan mata kuliah pilihan.[12] Diharapkan pemanfaatan Data mining dengan Continuous Association rule Mining Algorithm (CARMA) dapat mengelola dan menyelesaikan masalah rekomendasi ini. Dengan dua fungsi yaitu Phase I dan Phase II diharapkan mengoptimalkan pembentukan lattice yang merupakan Large itemset (frequent itemset)[1]. Dari Large itemset ini baru dibentuk aturan asosiasinya. Proses Data mining dianggap dapat menemukan knowledge baru yaitu dapat mengelompokan serta merekomendasikan mata kuliah pilihan yang diambil oleh mahasiswa. Pola rekomendasi di dapat dari pencarian aturan asosiasi dengan mencari pola atau hubungan antar mata kuliah, sehingga diharapkan CARMA dapat menemukan MKpil untuk rekomendasi. 2.
Continuous Association rule Mining Algorithm (CARMA) Pada fungsi phase I, input dan output yang dikeluarkan adalah lattice V. Sebelum membaca transaksi, maka dapat dilakukan penambahan lattice V dengan menginisialisasikan lattice V = { ย ๐ } dikarenakan belum ada itemset yang masuk ke dalam V. Selain itu, atur count(๐) = 0, firstTrans(๐)= 0, maxMissed(๐) = 0. Untuk mendapatkan V, lakukan baca setiap transaksi ti. Ada tiga tahap untuk medapatkan V yaitu[3] : a. Increment Sub tahap fungsi ini melakukan perhitungan kejadian semua itemset atau count(v) yang termasuk dari transaksi dan menjamin semua integers tersimpan di V. 74
ISSN : 2407 - 6511 b. Insert Tahapan insert yaitu memasukan beberapa itemset ke dalam lattice. Proses yang dilakukan adalah memasukan subset v yang dibaca dari transaksi-i ke dalam V jika dan hanya jika subset w dari v sudah terkandung dalam V dan berpotensial besar kemunculannya dengan syarat maxSupport (w) ย โฅ ย ๐๐ข . Hal ini sesuai dari observasi bahwa himpunan besar terhimpun dari subset-nya. Memasukan itemset v ke dalam V, atur firstTrans(v) = i & count(v) = 1 saat v termasuk pada saat transaksi ti. [(๐ โ ๐)๐๐๐๐ ๐ ([๐]๐ ๐ )] + ย |๐| โ ๐ ย , ๐๐๐๐ด๐๐๐๐๐
(๐) โ ๐ฆ๐ข๐ง } (2.1) ๐๐๐๐ด๐๐๐๐๐
(๐) + ย ๐๐๐๐๐(๐) โ ๐ ย Kondisi tertentu, maxMissed(v) ย โค ย i-1, saat himpunan kosong adalah subset dari v, ๐ adalah elemen dari V dan count ๐ bernilai i yaitu indeks transaksi pada posisi itu. c. Prune Tahap akhir dari phase I, yaitu memangkas beberapa itemset dari lattice. Prune lattice yang dilakukan dengan mmenghapus semua itemset yang ย berkadinalitas ย ย โฅ ย 2 ย dengan ย maxSupport โฅ ย ๐๐ข , contoh jika itemset kecil mengandung setidaknya 2 itemset. Bila hanya memiliki syarat tersebut ditakutkan akan menimbulkan prune yang cukup besar. Maka ada syarat tambahan yaitu prune di ๐ setiap ๐๐๐๐๐ atau setiap 500 transaksi dicari dua kemungkinan tersebut mana yang lebih besar. ๐๐
Dengan catatan bahwa beberapa strategi heuristic pruning dapat di terima asalkan hanya itemset kecil yang dihapus dan setiap kali 1-itemset dihapus semua begitu pula dengan superset-nya. Cara strategi pruning diatas dipilih dengan alasan untuk efisiensi memori. Dengan catatan, 1-itemset tidak akan diprune. Dengan demikian item yang tidak terdapat dalam lattice tidak akan muncul di transaksi, caranya dengan mengatur maxMissed dengan 0 untuk setiap 1-itemset dimasukan dalam lattice. Pada fungsi phase II, yang dijadikan sebagai input adalah output dari lattice pada phase I. Sedangkan output-nya adalah sejumlah Large itemset V. Phase II melakukan prune untuk semua itemset kecil dari V yang di dapat dari phase I dan menentukan support yang tepat untuk itemset yang tersisa. Mula-mula phase II menghapus semua itemset kecil. Contoh : itemset dengan maxSupport < ๐๐ง dari V. Membaca setiap transaksi, phase II melakukan menambah jumlah count dan mengurangi jumlah maxMissed untuk setiap itemset yang terkandung pada transaksi sampai transaksi yang mengandung itemset dimasukan. Atur maxMissed dengan nilai 0 untuk mendapatkan minSupport = maxSupport, untuk support yang nyata pada itemset. Lalu pindahkan itemset jika bernilai kecil. Atur maxMissed(v) = 0 untuk itemset v yang menghasilkan maxSupport(w) > maxSupport(v) untuk beberapa superset w dari v. Atur juga nilai maxMissed(w) dengan count(v) โ count(w) untuk semua superset w dari v dengan maxSupport(w) > maxSupport(v). Phase II berakhir saat indeks transaksi sebelumnya adalah firstTrans untuk semua itemset yang terdapat di lattice. Hasil lattice mengandung semua itemset besar yang bersamaan dengan support yang tepat untuk masing-masing itemset. Tahap terakhir yaitu menggabungkan dua phase yaitu phase I dan phase II sehingga dinamakan CARMA. 3.
Rekomendasi dengan CARMA
Gambar 3.1 Gambaran umum sistem 75
ISSN : 2407 - 6511 Pada gambar 3.1, yang dilakukan adalah dataset terlebih dahulu dilakukan preprocessing dengan menghilangkan item yang tidak diperlukan lalu menginisialisasikan item untuk mempermudah, setelah itu data diolah dalam CARMA sehingga menghasilkan Large itemset atau frequent itemset[1]. Setelah mendapatkan Large itemset masukan ke dalam pembentukan aturan asosiasi yang didapat dengan membandingkan dengan nilai minimum confidence. Aturan asosiasi yang telah di dapat akan dilakukan cek kecocokan terlebih dahulu untuk validasi. Setelah validasi memenuhi syarat, kemudian aturan asosiasi tersebut siap dijadikan acuan rekomendasi pengambilan MKpil. Sistem ini dibuat untuk membantu dosen wali untuk memudahkan proses rekomendasi pengambilan MKpil pada perwalian. Di bawah ini, merupakan tampilan rekomendasi yang akan digunakan dosen wali untuk mencari rekomendasi mahasiswa berdasarkan riwayat mata kuliah yang pernah diambil.
Gambar 3.2 tampilan rekomendasi 4. Pengujian Sistem a. Tujuan Pengujian Pada penelitian ini memiliki tujuan yaitu melakukan analisis dan memperhatikan pengaruh dari nilai support sequence dan minimum confidence yang sesuai dengan memperhatikan kemunculan MKpil pada jumlah aturan asosiasi, kecocokan hingga 100%, dan kemunculan MKpil. b. Pengujian Sistem Sistem yang dibuat untuk mengetahui aturan rekomendasi. Untuk itu, yang harus diperhatikan adalah banyaknya kemunculan MK pil dengan memperhatikan jumlah aturan asosiasi, kecocokan, dan kemunculan MKpil. Pada tabel 4.1, yang dilakukan adalah mengubah nilai support sequence dari 0.4-0,7 dengan nilai minimum confidence tetap yaitu 50% sebagai berikut. Tabel 4.1 kemunculan MKpil (support sequence) Kecoco Kemuncul kan Kemuncu an Aturan hingga lan MKpil asosiasi 100% 0. 18 20 MKpil 17 MKpil 4 MKpil 0. 12 20 MKpil 10 MKpil 5 MKpil 0. 14 MKpil 5 MKpil 1 MKpil 6 0. 4 MKpil 0 MKpil 0 MKpil 7 Selanjutnya, melakukan variasi nilai minimum confidence dengan mengambil hasil terbaik dari pengujian nilai support sequence. Support sequence yang di ambil adalah 0.4, lalu nilai minimum confidence dari 50%-80%. Tabel 4.2 merupakan hasil dari pengujian. Pada tabel ini, mengasilkan bahwa nilai minimum confidence 50 % dengan support sequence 0.4 menghasilkan 76
ISSN : 2407 - 6511 kemunculan aturan asosiasi di 20 MKpil, kecocokan hingga 100% di 18 MKpil, dan kemuculan MKpil di 17 MKpil. Tabel 4.2 kemunculan MKpil (minimum confidence) Kemunc Kecoco ulan kan Kemuncu Aturan hingga lan MKpil asosiasi 100% 50 18 20 MKpil 17 MKpil % MKpil 60 17 20 MKpil 17 MKpil % MKpil 70 14 20 MKpil 12 MKpil % MKpil 80 12 20 MKpil 6 MKpil % MKpil 4. Analisis pengujian Dari pengujian 4.2, bila diperhatikan tabel 4.1 bahwa semakin besar nilai support sequence maka kemunculan MKpil pada aturan asosiasi, kecocokan hingga 100%, dan kemunculan MKpil semakin menurun. Hal ini dikarenkan itemset yang dihasilkan sedikit sehingga berpengaruh terhadap aturan asosiasi. Pada tabel 4.2, meningkatkan nilai minimum confidence untuk meilhat peformansi, disimpulkan bahwa semakin besar nilai minimum confidence membuat kemunculan MKpil di setiap kecocokan hingga 100% dan kemunculan MKpil rekomendasi. 5. Saran Dari pengujian maka algoritma CARMA dapat digunakan untuk menyelesaikan masa perwalian yaitu perekomendasian mata kuliah pilihan informatika. Aturan asosiasi yang dihasilkan dari CARMA adalah mata kuliah wajib beserta nilai dan mata kuliah pilihan yang diambil mahasiswa beserta nilainya. CARMA memilki karakteristik yaitu semakin kecil nilai support sequence maka itemset yang dihasilkan akan semakin banyak. Nilai minimum confidence 50 % dengan support sequence 0.4 menghasilkan kemunculan aturan asosiasi di 20 MKpil, kecocokan hingga 100% di 18 MKpil, dan kemuculan MKpil di 17 MKpil. Pada pengujian 4.2, diambil kesimpulan bahwa nilai minimum confidence 50 % dengan support sequence 0.4 menghasilkan kemunculan aturan asosiasi di 20 MKpil, kecocokan hingga 100% di 18 MKpil, dan kemuculan MKpil di 17 MKpil. Daftar Pustaka: [1] [2] [3] [4] [5] [6] [7] [8]
Abul, Osmal. Hiding Co-Occuring Frequent Itemsets. TOBB University of Economics and Technology Ankara, Turkey. Diahpangastuti, ย Nucifera. ย โSistem ย Rekomendasi ย Bidang ย Minat ย Mahasiswa ย Menggunakan ย Metode ย Association rule dan ย Algoritma ย Aprioriโ, ย Teknik ย Informatika ย FTIF-ITS. Hidber, Christian. September 1998. Online Association rule Mining. International Computer Science Institute, Berkeley Huang Yuan, Xing Wang, Ben-Chang Shia. 2009. Efficiency and Consistency Study on Carma. Fifth International Joint Conference on INC, IMS, and IDC. Jian-min Hang, Qin Zhang Fu-zan Chen, "An Efficiently Algorithm for Mining Association rules," National Science Foundation. Jiawei han & Micheline Kamber Harcourt.2006.Data mining Concepts and Techniques. Morgan Kaufmann Publishers. Kusrini dan Emha Taufiz Luthfi. 2009. Algoritma Data mining. Yogyakarta : CV ANDI OFFSET (Penerbit ANDI) Pramod,S and O.P.Vyas. June 2010. Performance Evaluation of some Online Association rule Mining Algorithms for sorted and unsorted Data sets. International Journal of Computer Application (097577
ISSN : 2407 - 6511 8887).Volume 2 [9] Raden Selamet. 2008. Association rule. Media Informatika volume 7 nomer 1 [10] R. Agrawal, T. Imielinski, and A. Swami. May 1993. Mining Association rule between set of items in Large databases. In Proc. Of the ACM SIGMOD Conference on Management of Data, pages 207-216, Washington D.C [11] R. Agrawal and R.Srikant.Sept,1994. Fast Algorithms for Mining Association rules. In Proc. Of the 20th ย Intโl ย Conf. ย On ย Very ย Large Databases, Santiago,Chile [12] Widodo, 21-23 ย Mei ย 2008, ย โPrediksi ย Mata ย Kuliah ย Pilhan ย dengan ย Aturan ย Asosiasiโ, ย Jurusan ย Teknik ย Elektro โ Fakultas Teknik Universitas Negeri Jakarta, Konferensi dan Temu Nasional Teknologi Informasi dan Komunikasi untuk Indonesia, Jakarta [13] control.cs.berkeley.edu/carma.html (Date : 30/11/12 ) [14] http://www.ittelkom.ac.id/plugins/file/file_download/ INSTITUSI/BP% 202011.pdf (Date : 30/11/12) [15] http://www2.cs.uregina.ca/~dbd/cs831/notes/kdd/1_kdd.html (Date : 30/11/12)
78