APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES MASUK DENGAN TINGKAT KELULUSAN MAHASISWA (Studi Kasus: STMIK AMIKOM YOGYAKARTA)
JUDUL
NASKAH PUBLIKASI
diajukan oleh Faundry Amrul Ma’ruf 09.11.2997
kepada SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER AMIKOM YOGYAKARTA 2013
PENGESAHAN NASKAH
DATA MINING APPLICATION PROCESS IN RELATION TO SEE WITH STUDENTS GRADUATION RATE (Case Study: STMIK AMIKOM Yogyakarta) APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES MASUK DENGAN TINGKAT KELULUSAN MAHASISWA (Studi Kasus: STMIK AMIKOM YOGYAKARTA) Faundry Amrul Ma’ruf Kusrini Jurusan Teknik Informatika STMIK AMIKOM YOGYAKARTA
ABSTRACT With the existence of many data accumulated explosive data growth has created conditions that have a lot of data but minimal information. Data mining is the discovery of new information by looking for certain patterns or rules of a number of large amounts of data to get a relationship that may provide a useful indication. By utilizing data from AMIKOM students are expected to know the relationship between the entrance to the graduation rate of students through the use of data mining methods. Categories in the measure of graduation rates and IPK student study duration. The algorithm used is algorithm a priori, so that once the data is in the process it will display information in the form of support and confidence values of each category graduation rates, and will also display some reports, the reports suggestions, generated tables and summary report . AMIKOM campus parties will be given the right advice and accurate in getting his students more potential entry and print quality graduates. Keywords: A Priori Algorithm, Data Mining, Relationship Processes in Student
1.
Pendahuluan Pemanfaatan data yang ada dalam sistem informasi untuk menunjang kegiatan
pengambilan keputusan tidak cukup hanya mengandalkan data operasional saja, diperlukan suatu analisis data untuk menggali potensi-potensi informasi yang ada. Jadi, proses pengubahan data menjadi informasi dan dari informasi yang ada akan diambil polanya agar menjadi pengetahuan. Dalam mengambil keputusan, kebanyakan mereka hanya memanfaatkan data yang sudah di miliki untuk menggali informasi yang berguna. Hal ini mendorong munculnya cabang ilmu baru untuk mengatasi masalah penggalian informasi atau pola yang penting atau menarik dari data dalam jumlah besar, yang disebut dengan data mining. Penggunaan metode data mining
diharapkan dapat
menemukan hubungan antara proses masuk dengan tingkat kelulusan yang sebelumnya tersembunyi didalam gudang data
sehingga menjadi informasi yang berharga dan
bermanfaat bagi kampus STMIK AMIKOM yogyakarta supaya dapat mengetahui tingkat kelulusan mahasiswanya
dan faktor yang mempengaruhi tingkat kelulusan.
Dengan adanya informasi tersebut akan dapat diketahui potensial masuk mahasiswanya melalui tes tertulis atau wawancara dengan melihat nilai support dan confidence.
2.
Landasan Teori
2.1
Data warehouse Data warehouse adalah sebuah koleksi data yang mempunyai karakteristik
subject-oriented, integrated, nonvolatile, dan time variant, yang dapat mendukung keputusan ditingkat manajemen suatu organisasi (Inmon, 2002). Data warehouse adalah sebuah sistem yang mengambil dan menggabungkan data secara periodik dari sistem sumber data ke penyimpanan data bentuk dimensional atau normal (Rainardi, 2008). Data warehouse adalah sebuah database analitis yang hanya dapat dibaca dan digunakan sebagai dasar untuk sebuah sistem pendukung keputusan (Poe, 1998) . Jadi, Data warehouse merupakan metode dalam perancangan database, yang menunjang DSS(Decission Support System) dan EIS (Executive Information System). Secara fisik data warehouse adalah database, tapi perancangan data warehouse dan database sangat berbeda. Dalam perancangan database tradisional menggunakan normalisasi, sedangkan pada data warehouse normalisasi bukanlah cara yang terbaik.
2.2
Karakteristik Data Warehouse Seperti yang telah disebutkan diatas bahwa data warehouse mempunyai empat
karakteristik (Inmon, 2002), yaitu:
1. Subject oriented 2. Integrated 3. Time variant 4. Nonvolatile
2.3
Pengertian Data mining Data mining juga disebut sebagai serangkaian proses untuk menggali nilai
tambah berupa pengetahuan yang selama ini tidak diketahui secara manual . (Pramudiono, 2006). Karakteristik data mining sebagai berikut: 1.
Data mining berhubungan dengan penemuan sesuatu yang tersembunyi dan pola data tertentu yang tidak diketahui sebelumnya.
2.
Data mining merupakan suatu proses otomatis terhadap daya yang sudah ada.
3.
Data yang akan diproses berupa daya yang sangat besar. data yang besar digunakan untuk membuat hasil lebih dipercaya.
4.
Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat.
Penemuan pola merupakan keluaran lain dari data mining. misalnya sebuah perusahaan yang akan meningkatkan fasilitas kartu kredit dari pelanggan, maka perusahaan akan mencari pola dari pelanggan-pelanggan yang ada untuk mengetahui pelanggan yang potensial dan pelanggan yang tidak potensial (Kusrini,2009).
2.4
Tahap-Tahap Data Mining Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapa
tahap, tahap-tahap data mining yaitu: 1. Data selection 2. Data cleaning 3. Data Transformation 4. Data mining 5. Evaluation
2.5
Metode Data mining Banyak
metode-metode yang dapat digunakan dalam proses data mining
diantaranya yaitu decision tree, clustering dan association rules. tetapi disini penulis hanya membahas association rules.
a.
Association rules Association rules (aturan asosiasi) atau affinity analysis (analisis afinitas)
berkenaan dengan studi tentang “apa bersama apa”. Sebagai contoh dapat berupa berupa studi transaksi di supermarket, misal seorang konsumen membeli (roti, mentega) => (susu) dan mempunyai nilai support = 40%, confidence = 50%. Aturan tersebut berarti “seorang konsumen yang membeli roti dan mentega punya kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari transaksi selama ini (Kusrini, 2009).” Karena awalnya berasal dari studi tentang database transaksi pelanggan untuk menentukan kebiasaan suatu produk dibeli bersama produk apa, maka aturan asosiasi juga sering dinamakan market basket analysis. Analisis asosiasi dikenal juga sebagai salah satu metode data mining yang menjadi dasar dari berbagai metode data mining lainnya. Khususnya salah satu tahap dari analisis asosiasi yang disebut analisis pola frekuensi tinggi (frequent pattern mining) menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien adalah analisis pola frekuensi tinggi.
3.
ANALISIS DAN PERANCANGAN APLIKASI DATA MINING
3.1
Tinjauan Umum
3.2.1
Analisis lingkungan sistem Dalam pembangunan aplikasi
data mining ini menggunakan jenis arsitektur
dengan sumber data warehouse fungsional
yaitu sebuah data warehouse yang
mengambil data dari sistem operasional terdekat. tiap data warehouse fungsional melayani kelompok yang berbeda dan terpisah, area fungsional yang berbeda dan terpisah, unit geografis yang berbeda dan terpisah atau kelompok pemasaran produk yang berbeda dan terpisah. Karena data mining membutuhkan data dalam jumlah besar untuk itu diperlukan suatu data warehouse yang dapat menampung dan menyatukan dari keenam sumber data tersebut. Selain itu penggunaan data warehouse juga bertujuan agar data transaksional dalam keenam database sumber tidak terganggu.
Data mhs
Data data_gelombang
Data agama
Data Warehouse
Data jurusan Aplikasi Data Mining
Data daft_wisuda
Data calonsiswa
Gambar 3.2 Analisis lingkungan sistem 3.3
Analisis Kebutuhan Sistem Kebutuhan fungsional merupakan kemampuan sistem untuk melakukan proses
dan dapat menampilkan informasi apa saja. kebutuhan fungsional pada Aplikasi Data mining ini merujuk pada kebutuhan akan perancangan data mining, seperti yang tertera berikut ini : 1. Dapat menggabungkan data yang akan diproses mining dari data kelulusan dan data mahasiswa (diambil dari kekuatan) 2. Dapat membersihkan data-data yang tidak relevan serta atribut yang tidak dipakai (diambil dari kekuatan) 3. Dapat merubah data menjadi data yang siap diproses (diambil dari ancaman) 4. Dapat memproses data untuk dimining meliputi (diambil dari kelemahan dan peluang) a. Hubungan antara proses masuk dengan tingkat kelulusan. b. Hubungan antara asal sekolah dan proses masuk dengan tingkat kelulusan. c.
Hubungan antara kota asal sekolah dengan tingkat kelulusan.
d. Hubungan jurusan dengan tingkat kelulusan e. Hubungan dari semua atribut agar di dapat hasil yang lebih spesifik 5. Dapat menampilkan hasil proses mining dengan nilai support dan confidence (diambil dari kekuatan) 6. Menggunakan database sql server yang telah di ubah menjadi microsoft access sehingga lebih mudah dalam mengoperasikannya. (diambil dari ancaman) 7. Aplikasi inimampumelakukanpembuatanlaporan berupa laporan tabel hasil proses mining, laporan rangkuman, laporan saran.(diambil dari kelemahan)
3.2
Pemodelan Data Dalam aplikasi ini dibangun data warehouse yang digunakan untuk menampung
data dari data mahasiswa dan data kelulusan mahasiswa. Tujuan utama pembangunan data warehouse adalah agar database sumber tidak terganggu bila terjadi error, selain itu data warehouse memudahkan dalam menyatukan data dari beberapa database sumber. Proses ETL (Ekstrak Transform Load) dalam pembangunan data warehouse merupakan proses yang penting karena menentukan pembangunan data warehouse selanjutnya. Pada pembangunan data warehouse ini, terdapat enam source system yaitu dari data mahasiswa, data agama, data jurusan, data data_gelombang, data calonsiswa dan data daft_wisuda. Proses pemuatan data dari data source ke data warehouse melalui proses ETL. Diagram Proses ETL dapat digambarkan seperti pada gambar 3.4 Data mhs
Data data_gelomb ang
Data agama
Proses ETL
Data Warehouse
Data jurusan
Data daf t_w isuda
Data calonsisw a
3.4 Gambar 3.4 Proses ETL
3.4.1
Pemodelan Fungsi Pemodelan fungsi digambarkan dengan Flowchart , DCD (Data Context
Diagram), DFD (Data Flow Diagram) dan kamus data (Data Dictionary).
1. Flowchart yang diusulkan
Data mhs
mulai
Data calonsiswa Form Utama Data data_gelom bang
Muat Data Data Gabungan
Data daft_wisuda Muat
Data jurusan
Tabel Data Gabungan Data agama
Bersihkan
Bersihkan Data
Tabel yang sudah bersih
Prodi Atribut Threshold Proses
Proses Mining
Tabel Hasil Gabungan
Laporan Rangkuman
Laporan Saran Untuk Amikom
Yes Proses lagi?
No
selesai
Gambar 3.6 Flowchart
2. Diagram konteks DFD menggambarkan arus data dari suatu sistem informasi logika tanpa mempertimbangkan lingkungan fisik dimana dara tersebut berada. Berikut gambaran DFD dari sistem yang akan dibuat. Data Login Akses Data Gabungan Input Jurusan Input Atribut Input Threshold
Aplikasi Data Mining Untuk Mencari Hubungan Proses Masuk dengan Tingkat Kelulusan
Admin
Verifikasi Login Admin Tampil Data Gabungan Hasil Proses Data Mining Laporan Mining Proses Masuk Laporan Mining Asal Sekolah Laporan Mining Kota Asal Laporan Mining Program Studi Laporan Rangkuman Laporan Saran Untuk Amikom
Gambar 3.7 Diagram Context
3. DFD Level 1
Data Login
Petugas
Data Petugas
Verifikasi Login
Hasil data warehouse
Data mhs
Data data_gelombang
Laporan Hasil Mining Program Studi
Laporan Hasil Mining Kota Asal
Data daft_Wisuda
Data calonsiswa
Cleaning Selection integration Transformation
Data Gabungan dengan Jurusan
Data Gabungan dengan kota asal
Data Gabungan dengan Asal sekolah
Data Gabungan dengan proses masuk
Data Gabungan Data Gabungan Bersih
Laporan Hasil Mining Asal Sekolah
Laporan Hasil Mining Proses Masuk
Data Warehouse
Data jurusan
Data mahasiswa, gelombang, kelulusan, jurusan, wisuda, agama, test masuk
Proses Import Data
Data agama
Sistem Akademik Amikom
Mining Proses Masuk
Mining Asal Sekolah
Mining Kota Asal
Mining Jurusan
Gambar 3.8 DFD Level 1
4.
IMPLEMENTASI PROGRAM DAN PEMBAHASAN
4.1
Implementasi Dalam bab ini menjelaskan tentang implementasi dari perancangan data mining,
implementasi rancangan antar muka, uji coba sistem, implementasi pengujian, manual program, serta manual instalasi. Selain itu juga terdapat pengujian Aplikasi Data mining dengan pengujian black box testing. 4.2
Pembahasan
4.2.1
Pembahasan Tampilan
4.2.1.1 Tampilan halaman login
Gambar 4.15 Tampilan halaman login 4.2.1.2. Tampilan halaman utama
Gambar 4.16 Tampilan Halaman Utama 4.2.1.3. Tampilan data gabungan Pada saat menu berkas di pilih dan memilih sub menu ambil data maka akan tampil seperti gambar berikut:
Gambar 4.17 Tampilan data gabungan 4.2.1.4. Tampilan bersihkan data Setelah data mahasiswa berhasil diambil dan ditampilkan di datagrid proses selanjutnya yaitu membersihkan data yang tidak dibutuhkan dan memilih data yang akan ditampilkan dan akan diproses mining, selanjutnya staf memilih sub menu bersihkan data dan hasilnya bisa dilihat di gambar berikut ini:
Gambar 4.18Tampilan Bersihkan Data 4.2.1.5. Tampilan data yang akan di proses mining Pada Gambar berikut menunjukan bahwa proses mining telah siap untuk diproses .
Gambar 4.19 Tampilan data yang akan di proses mining 4.2.1.6. Tampilan tabel gabungan setelah proses mining
Gambar 4.20 Tampilan tabel gabungan setelah proses mining 4.2.1.7. Tampilan laporan rangkuman
Gambar 4.21 Tampilan laporan rangkuman
4.2.1.8. Tampilan laporan saran untuk amikom
Gambar 4.22 Tampilan laporan saran untuk amikom 4.2.1.9. Tampilan rekam jejak
Gambar 4.23 Tampilan rekam jejak 4.2.1.10.
Tampilan keamanan
Gambar 4.24 Tampilan keamanan
4.2.1.11. Tampilan ubah nama pengguna dan kata sandi
Gambar 4.25 Tampilan ubah nama pengguna dan kata sandi 4.2.1.12
Tampilan Logout
Gambar 4.26 Tampilan Logout
5.
PENUTUP
5. 1
Kesimpulan Kesimpulan yang dapat di ambil dalam pengerjaan skripsi ini adalah a.
Membuat aplikasi yang dapat menampilkan informasi yang berguna dalam mengambil keputusan dalam menganalisa hubungan proses masuk dengan tingkat kelulusan dengan menggunakan metode data mining.
b.
Cara mengambil keputusan setelah proses mining selesai yaitu dengan melihat tingkat saran yang di anjurkan untuk AMIKOM yang dapat di jadikan acuan dalam memaksimalkan iklan pada daerah tertentu apabila yang di pilih berdasarkan asal sekolah ataupun kota asal.
c.
Pada aplikasi data mining ini juga di beri pilihan untuk pihak kampus AMIKOM apabila ingin mendapatkan hasil kualitas lulusan yang lebih bagus dan dengan target yang akurat bisa menggunakan pilihan keseluruhan atribut di gabung jadi satu pilihan.
d.
Hasil dari proses data mining ini dapat digunakan sebagai pertimbangan dalam mengambil keputusan lebih lanjut tentang faktor yang mempengaruhi tingkat kelulusan khususnya faktor dalam data induk mahasiswa. dengan adanya aplikasi ini maka akan di dapat
e.
informasi tentang keberhasilan proses masuk mahasiswa itu berasal dari mana, dan juga dapat mengetahui asal sekolah, nama sekolah, program studi mahasiswa tersebut. dari atribut program studi dapat di ketahui program studi yang mana yang di unggulkan dan di anggap berhasil dalam mencetak kelulusan mahasiswa di STMIK AMIKOM yogyakarta.
5. 2
Saran Untuk pengembangan Aplikasi Data mining lebih lanjut dari segi algoritma yang
digunakan yaitu dapat menggunakan algoritma lain, misal algoritma nearest neighbor, algoritma C4.5 ataupun menggunakan fuzzy C means
Daftar Pustaka Inmon, W.H.(2002). Building the Data Warehouse,edisi-3. Wiley Computer Publishing. Kusrini, dan Emha Taufik Luthfi, 2009. Algoritma Data mining. CV. Andi OFFSET. Yogyakarta. Kusrini, 2007. Strategi perancangan dan pengelolaan basis data. CV. Andi OFFSET. Yogyakarta. Poe, Vidette(1998). Building Data Warehouse for Decision Support, edisi-2. Prentice Hall. Pramudiono, I. 2007. Pengantar Data mining : Menambang Permata Pengetahuan di Gunung Data,http://www.ilmukomputer.org/wp-content/uploads/2006/08/ikodatamining.zip Pramudiono, I., 2007. Algoritma Apriori, http://datamining.japati.net/cgibin/indodm.cgi?bacaarsip&1172210143 Rainardi, Vincent, 2008, Building a Data Warehouse with Examples in SQL Server, Springer, New York.