ISSN : 2407 - 6511 IMPLEMENTASI ALGORITMA CT-PRO DAN DATA WAREHOUSE SKEMA GALAXY UNTUK SISTEM INFORMASI EVALUASI DIRI(STUDI KASUS : FAKULTAS INFORMATIKA IT TELKOM) Raden Mochamad Rizky Zulfikar1, Shaufiah, S.T., M.T.2, Hetti Hidayati, S.Kom., M.T.3 1,2,3Fakultas Informatika –Telkom University Jalan Telekomunikasi 1, Dayeuh Kolot Bandung 40257 Indonesia
[email protected],
[email protected],
[email protected] Abstrak Evaluasi diri merupakan proses evaluasi internal pada suatu program studi di suatu perguruan tinggi yang bertujuan untuk meningkatkan jaminan mutu pendidikannya, perencanaan, perbaikan suatu program studi dan untuk mempersiapkan evaluasi eksternal atau akreditasi. Sistem yang dinamakan Sistem Informasi Evaluasi Diri ditujukan untuk pimpinan program studi dan pihak-pihak terkait untuk membantu melakukan proses evaluasi diri di fakultas Informatika IT Telkom berdasarkan tiga komponen evaluasi diri yang dipilih, yaitu Mahasiswa dan Lulusan, Sumber Daya Manusia, dan Penelitian, Pelayanan/Pengabdian Masyarakat, dan Kerjasama. Sistem Informasi Evaluasi Diri dibangun menggunakan DATA WAREHOUSE yang dirancang dengan skema GALAXY dan Data mining dengan algoritma CT-Pro. DATA WAREHOUSE skema GALAXY merupakan salah satu metode perancangan skema DATA WAREHOUSE dimana suatu tabel dimensi dapat terhubung dengan dua atau lebih tabel fakta. Data mining dengan algoritma CT-PRO merupakan modifikasi dari algoritma association rule lainnya yaitu fp-growth. Perbedaan algoritma CT-PROdengan algoritma FP-growth terletak pada proses pembuatan tree nya. Tree pada CT-PRO(CFP-Tree) lebih sedikit node nya daripada Tree pada FPgrowth (FP-Tree). Tujuan menggunakan algoritma Data mining CT-PROadalah untuk menemukan pola-pola rules dari data-data komponen evaluasi diri yang ada agar dapat menjadi knowledge untuk evaluasi diri dan juga akreditasi. Pencarian pola-pola rules tersebut bergantung pada minimum support dan minimum confidence. Pengujian pada DATA WAREHOUSE menunjukkan bahwa DATA WAREHOUSE yang dibangun pada sistem telah memenuhi keempat karakteristik DATA WAREHOUSE, yaitu subject oriented, integrated, time variant,dan non-volatile. Pengujian pada Data mining CT-PRO menunjukkan bahwa association rule pada data mahasiswa kurang dapat diambil knowledge nya karena atribut yang ada pada data mahasiswa kurang lengkap. Kata Kunci : DATA WAREHOUSE,Skema GALAXY, Data mining, CT-Pro 1.
Pendahuluan
Seiring dengan berkembangnya teknologi informasi saat ini dimana semakin banyak pula informasi yang disajikan memicu tingginya kebutuhan seseorang akan informasi. Namun hal ini tidak diimbangi dengan penyediaan informasi yang cepat dan akurat. Begitu juga di perguruan tinggi, untuk meningkatkan mutu pendidikannya dibutuhkan informasi dari datadata yang sudah ada di perguruan tinggi tersebut. Evaluasi diri merupakan proses evaluasi internal pada suatu program studi di suatu perguruan tinggi yang bertujuan untuk meningkatkan jaminan mutu pendidikannya, perencanaan, perbaikan suatu program studi dan untuk mempersiapkan evaluasi eksternal atau akreditasi. Di IT Telkom data yang dibutuhkan untuk melakukan evaluasi diri masih tersebar sehingga dibutuhkan suatu sistem yang dapat menyatukan dan menyajikan secara langsung pengolahan data dari data yang dibutuhkan untuk evaluasi diri tersebut sehingga memudahkan pihak yang terkait dalam melakukan proses evaluasi diri. Sistem yang dinamakan Sistem Informasi Evaluasi Diri ini ditujukan untuk pimpinan program studi dan pihak-pihak terkait untuk melakukan proses evaluasi diri di fakultas Informatika IT Telkom. Sistem informasi evaluasi diri dibangun menggunakan DATA WAREHOUSE yang dirancang dengan skema GALAXY dan Data mining dengan algoritma CTPro. DATA WAREHOUSE skema GALAXY atau biasa disebut skema fact constellations merupakan salah satu metode perancangan skema DATA WAREHOUSE dimana suatu tabel dimensi dapat terhubung dengan dua tabel fakta. Data mining dengan metode CT-PRO merupakan modifikasi dari algoritma association rule lainnya yaitu fpgrowth. Perbedaan algoritma CT-PRO dengan algoritma FP-growth terletak pada proses pembuatan tree nya. Tree pada CTPRO(CFPTree) lebih sedikit node nya daripada Tree pada FP-growth (FP-Tree). Tujuan menggunakan algoritma Data mining CT-PROadalah untuk menemukan pola-pola rules dari data-data komponen evaluasi diri yang ada agar dapat menjadi knowledge untuk evaluasi diri dan juga akreditasi. Pencarian pola-pola rules tersebut bergantung pada minimum support dan minimum confidence.
63
ISSN : 2407 - 6511 2. Dasar Teori 2.1 DATA WAREHOUSE Skema GALAXY DATA WAREHOUSE merupakan metode perancangan database yang menunjang DSS (Decision Support System) dan EIS (Executive Information System). Fungsi utama DATA WAREHOUSE adalah mengubah data menjadi informasi untuk mengambil keputusan DATA WAREHOUSE menyatukan dan menggabungkan data dalam bentuk multidimensi. Pembangunan DATA WAREHOUSE meliputi pembersihan data, penyatuan data, dan transformasi data dan dapat dilihat sebagai praproses yang penting untuk digunakan dalam data mining. Selain itu DATA WAREHOUSE mendukung On-Line Analytical Processing (OLAP), sebuah kakas yang digunakan untuk menganalisis secara interaktif dari bentuk multidimensi yang mempunyai data yang rinci. Sehingga dapat memfasilitasi secara efektif data generalization dan Data mining [1]. Metode-metode dalam data mining, seperti association, classification, dan clustering dapat diintegrasikan dengan operasi OLAP. Maka dari itu, DATA WAREHOUSE dan OLAP merupakan hal yang penting dalam proses data mining. Karakteristik DATA WAREHOUSE ada empat, yaitu: a. Subject Oriented, sebuah DATA WAREHOUSE disusun dalam subjek utama, seperti pelanggan, suplier, produk, dan sales. Meskipun DATA WAREHOUSE terkonsentrasi pada operasi harian dan proses transaksi dalam perusahaan, DATA WAREHOUSE fokus pada pemodelan dan analisis data untuk pembuat keputusan. Oleh karena itu DATA WAREHOUSE mempunyai karakter menyediakan secara singkat dan sederhana gambaran seputar subjek lebih detail yang dibuat dari data luar yang tidak berguna dalam proses pendukung keputusan [1]. b. Integrated, DATA WAREHOUSE biasanya dibangun dari bermacam-macam sumber yang berbeda, seperti database relasional, flat files, dan on-line transaction records. Pembersihan dan penyatuan data diterapkan untuk menjamin konsistensi dalam penamaan, struktur kode, ukuran atribut, dan yang lainnya [1]. c. Time Variant, data disimpan untuk menyajikan informasi dari sudut pandang masa lampau (misal 5 – 10 tahun yang lalu). Setiap struktur kunci dalam DATA WAREHOUSE mempunyai elemen waktu baik secara implisit maupun eksplisit [1]. d. Nonvolatile, sebuah DATA WAREHOUSE secara fisik selalu disimpan terpisah dari data aplikasi operasional. Penyimpanan yang terpisah ini, DATA WAREHOUSE tidak memerlukan proses transaksi, recovery dan mekanisme pengendalian konkurensi. Biasanya hanya membutuhkan dua operasi dalam akses data yaitu initial load of data dan access of data [1]. DATA WAREHOUSE skema GALAXY, sering juga disebut Fact Constellations yaitu skema pada DATA WAREHOUSE dimana tidak hanya terdapat satu tabel fakta saja yang terhubung dengan tabel dimensi
Dalam DATA WAREHOUSE, ada yang disebut dengan ETL (Extract, Transform, dan Load). ETL bisa dikatakan merupakan komponen utama dalam pembangunan DATA WAREHOUSE. ETL memiliki tiga proses, yaitu: [8] 1. Extraction, merupakan proses mengumpulkan data dari berbagai sumber data (Data Source) [8]. 2. Transformation, merupakan proses pengubahan dari data yang diperoleh dari proses extraction menjadi data dengan format sesuai standar yang telah ditetapkan sebelumnya [8]. 3. Load, merupakan proses pemasukkan data ke dalam DATA WAREHOUSE setelah melalui proses transformation sebelumnya [8].
2.1 Data mining Algoritma CT-PRO Secara sederhana Data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar. Data mining juga disebut sebagai serangkaian
64
ISSN : 2407 - 6511 proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data. Data mining, sering juga disebut sebagai Knowledge Discovery in Database(KDD). KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar [1]. Association rule,(aturan asosiasi) merupakan teknik dalam Data mining untuk menemukan aturan assosiatif antara suatu kombinasi item. Association rule berkenaan dengan kalimat “apa dengan apa”. Dalam association rule terdapat istilah antecedent dan consequent. Antecedent berarti kalimat yang mendahului, dan consequent berarti kalimat berikutnya. Hal ini erat kaitannya dengan hubungan sebab-akibat. Antecedent sebagai “sebab” dan consequent sebagai ”akibat”. Penting dan tidaknya suatu aturan asosiasi dapat diketahui dengan dua buah parameter, yaitu support (nilai penunjang) yaitu prosentase kombinasi item tersebut dalam database dan confidence (nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan asosiasi. Analisis asosiasi didefinisikan sebagai suatu proses untuk menemukan semua aturan asosiasi yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence) [1]. Lift merupakan sebuah angka ratio yang menunjukkan berapa banyak kemungkinanmenemukan sebuah atribut muncul bersama dengan atribut lainnya dibandingkan dengan seluruh kejadian adanya atribut yang terpenuhi. Lift didefinisikan sebagai berikut [15] :
Dimana, Expected Confidence = (Jumlah Transaksi memiliki item consequent) / (Total jumlah transaksi) Salah satu algoritma dalam teknik association rule adalah algoritma CT-PROyang merupakan hasil modifikasi dan berakar dari algoritma sebelumnya, yaitu algoritma FPGrowth. Perbedaan algoritma CTPROdengan algoritma FP-growth terletak pada proses pembuatan tree nya. Tree pada CT-PRO(CFPTree) lebih sedikit node nya daripada Tree pada FP-growth (FP-Tree). Algoritma CT-PROmerupakan salah satu penerapan algoritma dari teknik association rule pada data mining. Algoritma ini berakar dari algoritma FP-growth dimana modifikasi yang dilakukan adalah pada struktur data yang digunakan. Struktur data yang digunakan adalah Compressed FP-Tree (CFP-Tree) dimana informasi dari sebuah FP-Tree diringkas dengan struktur yang lebih kecil, sehingga baik pembentukan tree maupun frequent itemset mining dapat dilakukan lebih cepat (lihat Gambar 2.3) [9].
Gambar 2.3 Compressed FP-Tree (FP-Tree) [9] 2.3 Evaluasi Diri Evaluasi diri merupakan evaluasi internal suatu program studi yang ditujukan untuk semua perguruan tinggi. Evaluasi-diri diperlukan untuk proses akreditasi oleh BANPT. Bagi beberapa program studi/perguruan tinggi, evaluasi-diri merupakan sesuatu yang baru, belum pernah dilaksanakan, bahkan belum dipahami. Sementara itu, banyak program studi/perguruan tinggi yang telah pernah bahkan sering melakukan evaluasi-diri untuk berbagai maksud. Bagi beberapa program studi/perguruan tinggi, evaluasi-diri telah menjadi agenda berkelanjutan, dan telah menjadi “budaya” dalam kehidupan akademiknya. Sistem dan prosedur evaluasidiri yang telah dilaksanakan itu kadang-kadang berbeda satu dengan yang lainnya, bergantung kepada keperluan yang dirasakan sendiri oleh perguruan tinggi, atau kepada hal-hal yang dipersyaratkan oleh masingmasing pihak yang meminta laporan evaluasi-diri program studi atau perguruan tinggi [13]. Komponen evaluasi-diri seperti yang tertulis pada pedoman evaluasi-diri yang diterbitkan oleh BANPT, yaitu [13]: 1. Visi, Misi, Tujuan dan Sasaran, serta Strategi Pencapaiannya
65
ISSN : 2407 - 6511 2. 3. 4. 5. 6. 7.
Tata Pamong, Kepemimpinan, Sistem Pengelolaan, dan Penjaminan Mutu Mahasiswa dan Lulusan. Sumber Daya Manusia Kurikulum, Pembelajaran, dan Suasana Akademik. Pembiayaan, Sarana, dan Prasarana, serta Sistem Informasi. Penelitian, Pelayanan/Pengabdian kepada Masyarakat, dan Kerjasama.
3. Perancangan Sistem 3.1 Gambaran Umum Sistem
1. 2. 3. 4. 5.
Penjelasan dari gambar 3.1 yaitu: Data Source merupakan sumber data utama yang akan diolah. Sebelum masuk ke proses selanjutnya, Data Source dalam format *.xlsx dilakukan preprocessing terlebih dahulu. Sebelum diproses di aplikasi SQL Server Management Studio, dilakukan proses ETL (Extract, Transform, Load) terlebih dahulu di aplikasi SQL Server Data Tools. Setelah dilakukan proses ETL pada tiap source data, selanjutnya skema GALAXY yang telah dirancang secara terpisah diterapkan di DATA WAREHOUSE. Tahap selanjutnya yaitu masuk pada tahap Data mining dengan menggunakan algoritma CT-PRO dari DATA WAREHOUSE dengan skema GALAXY. Tahap terakhir yaitu proses penampilan informasi hasil olahan di Sistem Informasi Evaluasi Diri.
Tahap preprocessing terhadap Data Source harus dilakukan sebelum masuk ke dalam tahap ETL (Extract, Transform, Load). Tahap preprocessing dilakukan dengan tujuan agar Data Source siap untuk diproses ke dalam tahap selanjutnya. Data-data yang dibutuhkan disesuaikan dengan skema GALAXY yang telah dirancang dan disesuaikan dengan tiga dari tujuh standar evaluasi diri, yaitu standar 3 (Mahasiswa dan Lulusan), standar 4 (Sumber Daya Manusia), dan standar 7 (Penelitian, Pelayanan/Pengabdian Kepada Masyarakat, dan Kerjasama). Ketiga standar tersebut dipilih karena datanya yang dapat terukur untuk proses DATA WAREHOUSE dan data mining. Data-data didapatkan dari berbagai sumber yang berbedabeda sehingga format penulisan pada file excel nya pun berbeda-beda. Maka dari itu perlu dilakukan tahap preprocessing ini.Tahap-tahap yang dilakukan adalah: 1. Memisahkan mahasiswa dan dosen dari fakultas Informatika dengan mahasiswa dan dosen dari fakultas lain. 2. Menghapus atribut pada kolom yang tidak diperlukan. 3.3
Perancangan DATA WAREHOUSE Pada perancangan DATA WAREHOUSE ini terdapat delapan proses bisnis dan delapan grain yang disesuaikan dengan ketiga standar yang dipilih dan ketersediaan data yang ada. Delapan proses bisnis tersebut adalah Evaluasi Mahasiswa, Pemantauan Lulusan, Prestasi, Pelatihan atau Seminar, Pengabdian Kepada Masyarakat, Penelitian, Publikasi, Dan Kerjasama dengan Instansi Lain. Dimensi-dimensi yang terdapat pada DATA WAREHOUSE Sistem Informasi Evaluasi Diri adalah sebagai berikut. a. Dimensi untuk proses bisnis Evaluasi Mahasiswa adalah NIM, angkatan, jalur masuk mahasiswa ke IT Telkom, IPS (Indeks Prestasi Semester), dan tahun ajaran. b. Dimensi untuk proses bisnis Pemantauan Lulusan adalah NIM, IPK, waktu lulus, waktu mulai bekerja, nama perusahaan tempat bekerja, bidang pekerjaan, dan range gaji. c. Dimensi untuk proses bisnis Prestasi adalah peraih prestasi, prestasi, tingkat, nama event, penyelenggara, waktu. d. Dimensi untuk proses bisnis Pelatihan atau Seminar adalah nama pelatihan atau seminar, NIP, nama dosen, waktu pelatihan, tempat pelatihan, dan keterangan pelatihan. e. Dimensi untuk proses bisnis Pengabdian Kepada Masyarakat adalah judul, jumlah dosen yang terlibat, NIP, nama dosenwaktu, sumber dana, dan skema pengabdian kepada masyarakat. f. Dimensi untuk proses bisnis Penelitian adalah judul penelitian, NIP, nama dosen, waktu, skema penelitian, dan sumber dana penelitian.
66
ISSN : 2407 - 6511 g.
Dimensi untuk proses bisnis Publikasi adalah judul publikasi, jenis publikasi, NIP, nama dosen, seminar publikasi, tempat seminar publikasi, dan waktu. h. Dimensi untuk proses bisnis Kerjasama dengan Instansi Lain adalah deskripsi kerjasama, nomor kerjasama, nama partner, tingkat, dan tahun. Atribut Pengukuran (Measurement) yang Terdapat pada setiap Tabel Fakta pada Sistem Informasi Evaluasi Diri adalah sebagai berikut. a. Atribut pengukuran untuk proses bisnis Evaluasi Mahasiswa adalah IP. b. Atribut pengukuran untuk proses bisnis Pemantauan Lulusan adalah IPK, rata-rata masa tunggu, dan jumlah lulusan. c. Atribut pengukuran untuk proses bisnis Prestasi adalah jumlah prestasi. d. Atribut pengukuran untuk proses bisnis Pelatihan atau Seminar adalah jumlah pelatihan atau seminar. e. Atribut pengukuran untuk proses bisnis Pengabdian Kepada Masyarakat adalah jumlah pengabdian kepada masyarakat dan jumlah dana pengabdian kepada masyarakat f. Atribut pengukuran untuk proses bisnis Penelitian adalah jumlah penelitian dan jumlah dana penelitian. g. Atribut pengukuran untuk proses bisnis Publikasi adalah jumlah publikasi. h. Atribut pengukuran untuk proses bisnis Kerjasama adalah jumlah kerjasama. 4. Pengujian dan Analisis 4.1 Pengujian dan Analisis Empat Karakteristik DATA WAREHOUSE Analisis hasil pengujian keempat karakteristik DATA WAREHOUSE dengan DATA WAREHOUSE pada sistem ini yaitu: 1. Subject Oriented DATA WAREHOUSE dibangun dengan karakteristik yang beriorientasi subjek, yang berarti DATA WAREHOUSE didesain untuk menganalisa data berdasarkan subjek-subjek tertentu. Dalam penelitian ini, DATA WAREHOUSE dibangun dengan beberapa subjek utama berdasarkan ketiga standar Evaluasi Diri yang dipilih, yaitu Mahasiswa, Lulusan, Sumber Daya Manusia, Penelitian, Pengabdian Masyarakat, dan Kerjasama dengan Instansi Lain. Karena dibangun berdasarkan subjek subjek ini dan dirancang sebuah skema DATA WAREHOUSE, maka data akan lebih mudah dianalisis. 2. Integrated DATA WAREHOUSE dapat menyimpan data dari berbagai sumber terpisah menjadi saling terintegrasi. Begitu juga dengan sistem ini, data yang dibangun pada sistem ini berasal dari delapan file excel yang berbeda, yaitu Mahasiswa, Lulusan, Prestasi, Pelatihan atau Seminar, Kerjasama, Abdimas (Pengabdian Masyarakat), Penelitian, dan Publikasi. 3. Time Variant DATA WAREHOUSE yang dibangun pada sistem ini merupakan data yang terdiri dari data historis beberapa waktu. Dari setiap skema terdapat data yang menunjukkan hitungan waktu. Pada penelitian ini, hanya terdapat satu tabel yang berisi waktu, yaitu tabel dimensi time yang berisi tahun dari beberapa data. Penggabungan tahun ini dilakukan karena pada penelitian ini diimplementasikan skema GALAXY dimana boleh terdapat satu tabel dimensi yang terhubung ke beberapa tabel fakta. Tabel dimensi time pada penelitian ini terdapat pada gambar 4.1 berikut.
Gambar 4.1 Tabel dimensi time Dapat dilihat pada gambar 4.1, tahunnya tidak berurut dari tahun yang lebih kecil ke tahun yang lebih besar. Hal tersebut dikarenakan data tahun yang lebih dahulu masuk ke dalam tabel dimensi time tidak berisi tahun 2005, 2006, 2007, dan 2008. Ini membuktikan juga bahwa DATA WAREHOUSE menyimpan data historis yang dilihat dari id baris datanya. 4. Nonvolatile Data yang terdapat pada DATA WAREHOUSE tidak di-update secara real time, tapi direfresh dari sistem operasional secara reguler. Sebagai contoh pada sistem ini, digunakan data Lulusan. Pada mulanya data Lulusan terdiri dari 385 baris data seperti pada gambar 4.2 berikut.
67
ISSN : 2407 - 6511
Pada gambar 4.1 data terakhir terdapat di baris ke-386 karena baris pertama pada file excel merupakan judul tiap atribut data. Setelah dimasukkan ke dalam DATA WAREHOUSE melalui proses ETL (Extract, Transform, Load), data yang masuk juga terdiri dari 385 baris data seperti pada gambar 4.3 berikut.
Selanjutnya ditambahkan satu baris data baru pada data Lulusan di file excel seperti pada gambar 4.4 berikut
Selanjutnya dilihat lagi pada DATA WAREHOUSE apakah data yang baru saja dimasukkan ke file excel masuk apa tidak. Tentu saja tidak dilakukan proses ETL pada pengujian ini. DATA WAREHOUSE setelah dimasukkan baris data baru pada file excel terdapat pada gambar 4.5 berikut.
Dari hasil pengujian tersebut, dapat dibuktikan bahwa data yang terdapat pada DATA WAREHOUSE tidaklah di-update secara real time, namun harus melalui proses ETL terlebih dahulu agar baris data yang baru bisa masuk data . Oleh karena itu sistem ini memenuhi sifat DATA WAREHOUSE yang terakhir, yaitu nonvolatile. Berdasarkan uraian dari keempat karakteristik DATA WAREHOUSE tersebut, dapat dikatakan bahwa DATA WAREHOUSE yang dibangun sudah memenuhi keempat karakteristik DATA WAREHOUSE. 4.2 Pengujian dan Analisis Kebenaran Proses ETL (Extract, Transform, Load) Berikut merupakan hasil pengujian kebenaran proses ETL (Extract, Transform, Load) yaitu dengan cara mengecek jumlah baris data yang terdapat pada file excel dengan jumlah data yang masuk ke DATA WAREHOUSE setelah melalui proses ETL. Sebagai contoh, yaitu data pelatihan yang terdiri dari 116 jumlah baris data. Selanjutnya dilakukan proses ETL menggunakan SQL Server Data Tools. Setelah proses ETL berhasil dilakukan, data yang masuk ke DATA WAREHOUSE juga tetap 116 baris yang berarti jumlah baris data pada sumber data (file excel) sama dengan jumlah baris data yang masuk ke DATA WAREHOUSE. Proses ETL data kerjasama dapat dilihat pada gambar 4.6 berikut.
68
ISSN : 2407 - 6511
4.3 Pengujian dan Analisis Pengaruh Nilai Minimum Support dan Minimum Confidence Terhadap Kekuatan Rule Kekuatan rule diukur dengan maksud untuk menentukan nilai minimum support dan nilai minimum confidence yang akan digunakan pada sistem. Kekuatan rule dari algoritma CTPro dihitung dengan menggunakan hasil perkalian nilai support dan confidence nya dan nilai lift yang dihasilkan. Tabel 4.1 Kekuatan rule mahasiswa tahun ajaran 2006/2007 yang dihasilkan dengan nilai minimum confidence 20%
Tabel 4.2 Kekuatan rule mahasiswa tahun ajaran 2007/2008 yang dihasilkan dengan nilai minimum confidence 10%
69
ISSN : 2407 - 6511
Gambar 4.9 Grafik association rule mahasiswa tahun ajaran 2008/2009 yang dihasilkan dengan nilai minimum confidence 10% Dilihat dari tabel 4.2, 4.3, dan 4.4 serta grafik pada gambar 4.8, 4.9, dan 4.10, semakin besar persentase nilai minimum support, maka semakin besar pula nilai rata-rata support dikalikan confidence nya. Maka dapat disimpulkan bahwa semakin besar nilai minimum support, semakin besar pula kekuatan dari association rule yang dihasilkan. Sementara itu, dapat dilihat juga untuk nilai rata-rata lift ratio nilainya tidak dapat ditentukan oleh besarnya nilai minimum confidence, nilainya cenderung sama yaitu 1. Hanya pada kasus Mahasiswa tahun ajaran 2006/2007 saja terdapat penurunan nilai lift ratio seiring dengan naiknya nilai minimum support. Namun nilai lift ratio lebih besar atau sama dengan 1 dapat diartikan bahwa rule bisa dikatakan berkorelasi positif. Untuk pemilihan nilai minimum support dan nilai confidence, harus diperhatikan juga jumlah rule yang dihasilkan. Jika jumlah rule yang dihasilkan terlalu sedikit, maka atribut yang akan dianalisis juga semakin sedikit. Maka dari itu harus dipilih yang jumlah rule nya cukup, tidak terlalu banyak dan juga tidak terlalu sedikit, serta dengan nilai minimum support yang tinggi. Maka nilai minimum support dan minimum confidence yang dipilih dari Mahasiswa dapat dilihat pada tabel 4.5 berikut.
Dari nilai minimum support dan minimum confidence yang dipilih tersebut, didapatkan aturan asosiasi yang dapat bermanfaat dalam melakukan analisis dan pendukung pengambilan keputusan. Aturan asosiasi tersebut dapat dilihat pada tabel berikut
70
ISSN : 2407 - 6511
71
ISSN : 2407 - 6511
Pada tabel 4.5, 4.6, dan 4.7 yang merupakan aturan asosiasi mahasiswa pada tahun ajaran 2006/2007, 2007/2008, dan 2008/2009, dapat dilihat berbagai rule. Sebagai contoh pada tahun ajaran 2006/2007 ternyata banyak mahasiswa yang masuk melalui jalur UTG-1 Regular dan range IPS 0,00-2,75 dilihat dari tingginya nilai support dan confidence nya. Pada tahun ajaran 2007/2008 terjadi peningkatan range IPS terbanyak yaitu antara 2,75-3,50 dan 3,50-4,00. Lalu pada tahun ajaran 2008/2009 terjadi penurunan range IPS terbanyak dilihat dari nilai support dan confidence nya, yaitu antara 2,75-3,50. Dari ketiga tahun ajaran tersebut dapat di evaluasi mengapa IPS mahasiswa setiap tahunnya naik turun. Dari aturan-aturan asosiasi tersebut, jika memungkinkan dan jika datanya tersedia akan lebih baik jika misalnya terdapat atribut penghasilan orang tua, jumlah prestasi yang dimiliki, dan lainnya yang dapat menunjang proses pengambilan keputusan pada aturan asosiasi mahasiswa. 5.
Kesimpulan dan Saran 5.1 Kesimpulan Kesimpulan dari penyusunan penelitian ini adalah sebagai berikut. 1. DATA WAREHOUSE dengan skema GALAXY berhasil dibangun dari enam buah data untuk sistem informasi evaluasi diri fakultas Informatika IT Telkom. Namun terdapat dua buah data yang tidak dapat dijadikan skema GALAXY, yaitu data Mahasiswa dan data Lulusan karena tidak memiliki atribut yang dapat disatukan menjadi skema GALAXY. 2. Algoritma CT-PROberhasil diimplementasikan untuk sistem informasi evaluasi diri fakultas Informatika IT Telkom dan menghasilkan aturan asosiasi (association rule). 3. Pengaruh nilai minimum support dan minimum confidence pada algoritma CTPro pada kasus sistem informasi evaluasi diri fakultas Informatika IT Telkom yaitu semakin besar nilai minimum support dan minimum confidence, aturan asosiasi yang dihasilkan akan semakin sedikit. Maka dari itu dilakukan pengujian untuk menentukan besar nilai minimum support dan minimum confidence yang tepat. 5.2 Saran Saran dari penyusunan penelitian ini adalah sebagai berikut. 1. Untuk merancang DATA WAREHOUSE dengan skema GALAXY dibutuhkan data historis yang lengkap dengan atribut yang bisa saling terkait antara beberapa tabel fakta dan dimensinya.
72
ISSN : 2407 - 6511 2. 3.
6.
Menggunakan sumber data dengan data historis yang lebih lama lagi agar pola aturan asosiasi dapat lebih lengkap lagi. Proses pengisian sumber data harus konsisten, benar, dan teliti agar tidak terjadi duplikasi data. Misalnya penyingkatan nama yang berbeda-beda dari berbagai sumber data.
Daftar Pustaka [1] Amiruddin, Purnama, I. K. E., Purnomo, M. H. Penerapan Association rule Mining pada Data Nomor Unik Pendidikan dan Tenaga Kependidikan untuk Menemukan Pola Sertifikasi Guru. [2] Badan Akreditasi Nasional Perguruan Tinggi. (2010). Pedoman Evaluasi-Diri, Jakarta. [3] Huda, N. M. (2010). Aplikasi Data mining untuk Menampilkan Informasi Tingkat Kelulusan Mahasiswa (Studi Kasus di Fakultas MIPA Universitas Dipenogoro), Universitas Dipenogoro, Indonesia. [4] Kaniclides, A., Kimble, C. (1995). A Framework for the Development and Use of Executive Information Systems, The university of York, England. [5] Kimball, Ralph. (2002). The DATA WAREHOUSE Toolkit Second Edition, Wiley. [6] Kurz, A., Tjoa, A. M. (1997). Data Warehousing within Intranet: Prototype of a Web-based Executive Information System, Vienna University of Technology, Austria, IEEE. [7] McFadden, F. R. (1996). DATA WAREHOUSE for EIS: Some Issues and Impacts, University of Colorado, USA, IEEE. [8] Mejia-Lavalle, M., Arroyo-Figueroa, G. (2009). A Corporate Information System: from Legacy Systems to Exective Digital Dashboards, Instituto de Investigaciones Electricas, IEEE. [9] Prestashya, S. (2009). Implementasi dan Analisis Sistem OLAP pada Text-Rich Document oleh Multidimensional Database Menggunakan Skema GALAXY dan Skema Star, Institut Teknologi Telkom, Bandung, Indonesia. [10] Qu, S., Liu, K., Wang, Q., Zou, Y. (2007). DATA WAREHOUSE Design for Chinese Intelligent Question Answering System Based on Data mining, University of Jinan, China, IEEE. [11] Rakhmawati. (2007). Data Warehousing sebagai Pendukung SIEDA (Sistem Informasi Executive Daerah) Pemerintah Daerah Propinsi Jawa Barat, Institut Teknologi Telkom, Bandung, Indonesia. [12] Ruldeviyani, Y., Fahrian, M. (2008). Implementasi Algoritma-Algoritma Association rules Sebagai Bagian dari Pengembangan Data mining Algorithms Collection, Universitas Indonesia, Indonesia. [13] Sucahyo, Y. G., Gopalan, R. P. (2004). CTPRO: A Bottom-Up Non Recursive Frequent Itemset Mining Algorithm Using Compressed FP-Tree Data Structure, Curtin University of Technology, Western Australia. [14] Taleghani, M. (2011). Executive Information Systems Development Lifecycle, Islamic Azad University, Iran, IEEE. [15] Watson, H., Walls, J. (1993). Executive Information Systems Introduction to MiniTrack, IEEE.
73