PEMBANGUNAN DATA WAREHOUSE DAN APLIKASI OLAP BERBASIS WEB (STUDI KASUS DATA SKRIPSI MAHASISWA ILMU KOMPUTER IPB)
SILVIANI YULIASARI
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Pembangunan Data Warehouse dan Aplikasi OLAP Berbasis Web (Studi Kasus Data Skripsi Mahasiswa Ilmu Komputer IPB) adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, September 2013 Silviani Yuliasari NIM G64090075
ABSTRAK SILVIANI YULIASARI. Pembangunan Data Warehouse dan Aplikasi OLAP Berbasis Web (Studi Kasus Data Skripsi Mahasiswa Ilmu Komputer IPB). Dibimbing oleh ANNISA. Setiap tahunnya Departemen Ilmu Komputer selalu meluluskan mahasiswanya dari berbagai angkatan yang sudah menyelesaikan studi dan tugas akhir. Kondisi tersebut akan menghasilkan data skripsi yang semakin menumpuk. Dari penumpukan data tersebut bisa diambil suatu informasi diantaranya, topik skripsi, IPK, dosen pembimbing, dan lab keilmuan yang bisa memengaruhi kelulusan seorang mahasiswa. Pada penelitian ini, dibuat sebuah data warehouse yang terintegrasi dengan (On-Line Analytical Processing) OLAP untuk mendapatkan informasi yang berpotensi menunjang kelulusan mahasiswa tepat waktu. OLAP server yang digunakan adalah Mondrian 3.5.0. Data yang digunakan adalah data skripsi mahasiswa Ilmu Komputer IPB tahun masuk 2001, dan 2005 sampai dengan 2008. Tahapan yang dilakukan meliputi analisis, desain, praproses, diakhiri dengan pembuatan data warehouse dan implementasi operasi OLAP. Skema data warehouse yang dibuat menggunakan skema galaksi. Penelitian ini menghasilkan sebelas dimensi (IPK, Tahun Masuk, Tahun Lulus, Lab Keilmuan, Dosen Pembimbing, Jalur Masuk, Jenis Kelamin, Asal Daerah, Kata Kunci, Lama Studi, NIM) dan dua fakta (Skripsi, Mahasiswa). Kata Kunci : data warehouse, Mondrian 3.5.0, OLAP server
ABSTRACT SILVIANI YULIASARI. Development of Data Warehouse and OLAP Application Web Based (Case Study of Computer Science Students Thesis Data IPB). Supervised by ANNISA. Each year the Department of Computer Science graduates several students, upon the completion of their thesis. This results in the accumulation of the thesis data. From the data bank, some information related to the timely graduations of students, such as title of thesis, GPA, supervisor, and lab can be retrieved. This research created an integrated data warehouse with (On-Line Analytical Processing) OLAP to see the pattern that support timely graduation. The OLAP server used in this research is Mondrian 3.5.0. The data used are the thesises of IPB Computer Science students year 2001, 2005 to 2008. The steps being taken include analysis, design, preprocessing, and concluded with the implementation of data warehouse and OLAP operations. The data warehouse schema is created using the galaxy scheme. This research resulted in eleven dimensions (GPA, Time Entry, Time Pass, Lab, Lecturer, Entrance, Gender, District, Keywords, Duration of Study, NIM) and two facts table (Thesis, Student). Keywords: data warehouse, Mondrian 3.5.0, OLAP server
PEMBANGUNAN DATA WAREHOUSE DAN APLIKASI OLAP BERBASIS WEB (STUDI KASUS DATA SKRIPSI MAHASISWA ILMU KOMPUTER IPB)
SILVIANI YULIASARI
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
Dosen Penguji : 1 Dr Imas S Sitanggang Mkom 2 Hari Agung Adrianto Skom MSi
Judul Skripsi: Pembangunan Data Warehouse dan Aplikasi OLAP Berbasis Web (Studi Kasus Data Skripsi Mahasiswa Ilmu Komputer IPB) Nama : Silviani Yuliasari NIM : G64090075
Disetujui oleh
Annisa Skom MKom Pembimbing
Diketahui oleh
Dr Ir Agus Buono MSi MKom Ketua Departemen
Tanggal Lulus:
PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan April 2013 ini ialah data warehouse, dengan judul Pembangunan Data Warehouse dan Aplikasi OLAP Berbasis Web (Studi Kasus Data Skripsi Mahasiswa Ilmu Komputer IPB) Terima kasih penulis ucapkan kepada Ibu Annisa SKom Mkom selaku pembimbing yang telah memberikan saran, masukkan, dan ide-ide kepada Penulis dalam menyusun skripsi, serta Ibu Dr Imas S. Sitanggang Ssi Mkom dan Bapak Hari Agung A. Skom MSi selaku penguji yang telah memberikan saran kepada Penulis. Ungkapan terima kasih juga disampaikan kepada ayah, ibu, adik, serta seluruh keluarga, atas segala doa dan kasih sayangnya. Ridwan Agung yang memberikan motivasi dan membantu dalam penyelesaian skripsi. Keluarga kos WH, Siti, Deby, Rita, Evi, Dina, Childa, Nurul, Ka Didi, Lily, dan Novia tempat bertukar pikiran dengan Penulis selama perkuliahan. Retno D, Lizza, Anggi, dan Intan teman-teman satu bimbingan yang menemani Penulis selama mengerjakan tugas akhir. Teman-teman Ilmu Komputer angkatan 46 yang telah banyak membantu Penulis selama perkuliahan. Departemen Ilmu Komputer, staf, dan dosen yang telah banyak membantu baik selama penelitian maupun pada masa perkuliahan. Kepada semua pihak lainnya yang telah memberikan kontribusi yang besar selama pengerjaan penelitian ini yang tidak dapat disebutkan satu-persatu, Penulis ucapkan terima kasih banyak. Semoga karya ilmiah ini bermanfaat.
Bogor, September 2013 Silviani Yuliasari
DAFTAR ISI DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
PENDAHULUAN
1
Latar Belakang
1
Perumusan Masalah
1
Tujuan Penelitian
2
Manfaat Penelitian
2
Ruang Lingkup Penelitian
2
TINJAUAN PUSTAKA
2
Data Warehouse
2
Operasi Dasar OLAP ( On-Line Analytical Processing)
2
Model Data Multidimensi (Han dan Kamber 2006)
3
Mondrian
5
METODE
5
Analisis
5
Desain
7
Praproses Data
7
Pemuatan Data
7
Pembuatan Data Warehouse
8
Aplikasi OLAP
8
Uji Query
8
Lingkungan Pengembangan
9
HASIL DAN PEMBAHASAN
9
Analisis Data
9
Klasifikasi
11
Desain Konseptual dan Desain Logikal
11
Integrasi Data, Reduksi Data, dan Pembersihan Data
12
Transformasi data
13
Pemuatan Data
13
Eksplorasi dan Presentasi Hasil
13
SIMPULAN DAN SARAN
26
Simpulan
26
Saran
26
DAFTAR PUSTAKA
26
RIWAYAT HIDUP
34
DAFTAR TABEL 1 2 3 4 5 6 7 8
Atribut pada data skripsi Atribut pada data dosen Atribut pada data lab keilmuan Atribut pada data mahasiswa Atribut hasil analisis Contoh klasifikasi untuk tabel fakta skripsi Desain fisik fakta skripsi Desain fisik fakta mahasiswa
10 10 10 10 10 11 12 13
DAFTAR GAMBAR 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Skema Bintang Skema Snowflake Skema Galaksi Tahapan Penelitian Arsitektur data warehouse dan OLAP Skema galaksi dengan dua tabel fakta Tampilan awal aplikasi Tampilan aplikasi untuk kubus skripsi Tampilan aplikasi untuk kubus mahasiswa Tampilan editor query MDX topik skripsi Tampilan OLAP Navigator topik skripsi Tampilan hasil topik skripsi Tampilan editor query MDX Dosen pembimbing Tampilan OLAP Navigator Dosen Pembimbing Tabel pivot menunjukkan dosen pembimbing yang meluluskan mahasiswa tepat waktu Tampilan editor query MDX Lab Keilmuan Tampilan OLAP Navigator Lab Keilmuan Tabel pivot dan grafik batang menunjukkan jumlah mahasiswa lulus tepat waktu berdasarkan lab keilmuan Tampilan editor query MDX IPK TPB Tampilan OLAP Navigator IPK TPB Tabel pivot menunjukkan kelulusan tepat waktu berdasarkan IPK TPB Tampilan editor query MDX Jenis Kelamin Mahasiswa Tampilan OLAP Navigator Jenis Kelamin Mahasiswa Tabel pivot dan grafik operasi drill-down menunjukkan jumlah mahasiswa lulus tepat waktu berdasarkan jenis kelamin Tampilan editor query MDX Jalur Masuk Mahasiswa Tampilan OLAP Navigator Jalur Masuk Mahasiswa Tabel pivot dan grafik operasi drill-down menunjukkan jumlah mahasiswa lulus tepat waktu berdasarkan jalur masuk Tampilan editor query MDX Asal Daerah Mahasiswa Tampilan OLAP Navigator Asal Daerah Mahasiswa Grafik batang kelulusan tepat waktu berdasarkan asal daerah mahasiswa
4 4 5 6 8 12 14 14 14 15 16 16 17 17 18 19 19 19 20 20 21 21 22 22 23 23 24 25 25 25
PENDAHULUAN Latar Belakang Seorang mahasiswa dikatakan lulus apabila telah menyelesaikan studi dan tugas akhir. Adapun penyelesaian masa studi setiap mahasiswa berbeda-beda dilihat dari selisih tahun lulus dengan tahun masuknya. Mahasiswa IPB memiliki lama studi maksimal sebesar 12 semester dan dikatakan lulus tepat waktu apabila selesai studi selama delapan semester (IPB 2011). Salah satu faktor yang memengaruhi lama studi mahasiswa adalah skripsi atau tugas akhir, untuk itu dibutuhkan informasi mengenai topik skripsi yang dilihat dari kata kunci setiap judul skripsi, waktu masuk dan waktu lulus, dosen pembimbing, lab keilmuan, jenis kelamin, jalur masuk, asal daerah, dan IPK. Dari aspek tersebut ingin diketahui aspek mana yang memengaruhi lama penyelesaian studi seorang mahasiswa. Data yang dihasilkan dari setiap judul skripsi yang masuk ke perpustakaan Departemen Ilmu Komputer dan perpustakaan IPB akan disimpan dalam suatu tempat penyimpanan data dalam bentuk berkas Excel (xls dan xlsx). Penyimpanan data yang dilakukan secara rutin dari tahun ke tahun menyebabkan data yang tersimpan semakin menumpuk walaupun saat ini media penyimpanan sudah memiliki kapasitas yang besar (sampai terabyte), penumpukan data tetap akan menimpulkan masalah apabila tidak dikelola dengan baik. Kondisi seperti ini biasa disebut dengan istilah “rich of data but poor of information” (Han dan Kamber 2006). Beberapa penelitian sebelumnya yang melakukan pengolahan data diantaranya adalah Herlambang (2007) membangun data warehouse dan operasioperasi OLAP untuk data PPMB IPB dan data IPK TPB IPB menggunakan Palo Server 1.0c. Penelitian tersebut menghasilkan data warehouse data PPMB yang terdiri dari dua kubus data. Selanjutnya, Aulia (2011) melakukan penelitian yang sama dengan menggunakan data Departemen Ilmu Komputer IPB tahun 2005 sampai dengan 2009 (mayor dan minor). Penelitian tersebut menggunakan Mondrian sebagai OLAP server, sistem operasi ubuntu, dan menghasilkan dua kubus data. Penelitian Herlambang (2007) dijadikan acuan dalam pembuatan arsitektur data warehouse sedangkan penelitian Aulia (2009) dijadikan acuan dalam penggunaan OLAP server Mondrian. Selain itu, penelitian keduanya sama-sama dijadikan acuan dalam pembuatan skema galaksi dengan dua tabel fakta. Sehingga, diharapkan hasil dari penelitian ini mampu memberikan manfaat untuk pengguna, yaitu pihak-pihak terkait yang ada di Departemen Ilmu Komputer dalam membuat kebijakan yang mampu mendukung mahasiswa lulus tepat waktu. Perumusan Masalah Data skripsi yang setiap tahunnya rutin masuk ke perpustakaan IPB dan perpustakaan Ilmu Komputer mengakibatkan penumpukan data dan data skripsi yang ada tidak pernah dikelola lebih lanjut. Oleh karena itu dibutuhkan data warehouse dan OLAP untuk memanfaatkan penumpukan data skripsi tersebut dan mendapatkan informasi yang mampu menunjang kelulusan mahasiswa tepat waku.
2 Tujuan Penelitian 1
2
Tujuan dari penelitian ini adalah: Membangun data warehouse dan operasi OLAP untuk data skripsi mahasiswa Ilmu Komputer IPB serta membangun aplikasi untuk memvisualisasikan hasil operasi OLAP. Mendapatkan informasi yang berpotensi menunjang kelulusan mahasiswa tepat waktu. Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan manfaat kepada pihak-pihak terkait yang ada di Departemen Ilmu Komputer IPB yaitu komisi akademik, Ketua Departemen, dan para dosen untuk membuat kebijakan yang dapat mendukung mahasiswa lulus tepat waktu. Ruang Lingkup Penelitian Ruang lingkup penelitian ini dibatasi pada pembuatan data warehouse dan pembangunan aplikasi OLAP berbasis web menggunakan Mondrian 3.5.0 sebagai OLAP server dan operasi sistem Windows. Data yang digunakan adalah data skripsi program sarjana mahasiswa Ilmu Komputer IPB tahun masuk 2001 dan 2005 sampai dengan 2008 yang terdapat di perpustakaan IPB dalam bentuk berkas Excel (xls dan xlsx) yang didapatkan pada April 2013.
TINJAUAN PUSTAKA Data Warehouse Data warehouse adalah koleksi data yang memiliki sifat subject oriented, integrated, time variant, dan nonvolatile sehingga memungkinkan suatu lembaga, organisasi, atau perusahaan dalam membuat keputusan (Han dan Kamber 2006). Empat karakteristik data warehouse menurut Han dan Kamber (2006) yaitu: 1 Subject oriented, data warehouse didesain untuk menganalisis data berdasarkan subjek tertentu dalam lembaga, organisasi, atau perusahaan bukan berdasarkan fungsi atau proses aplikasi tertentu. 2 Integrated, data dibangun dengan mengintegrasikan berbagai sumber data. 3 Time variant, data yang disimpan memberikan sejarah informasi dengan kata lain data yang disimpan valid pada rentang waktu tertentu. 4 Nonvolatile, proses yang diijinkan dalam data warehouse hanya pemuatan dan akses data tanpa mengubah data sumber sehingga data yang tersimpan tidak dapat diperbarui atau dihapus. Operasi Dasar OLAP ( On-Line Analytical Processing) OLAP adalah sistem yang memfokuskan pada interaktif analisis data dan biasanya memiliki kemampuan luas mengenai visualisasi data dan membangkitkan ringkasan statistika. Karena alasan ini, pendekatan analisis
3 multidimensional data didasarkan pada terminologi dan konsep OLAP ( Han dan Kamber 2006). Data yang biasanya ditampilkan oleh OLAP adalah fungsi agregasi seperti summary, max, min, dan average. OLAP menyediakan proses kalkulasi dan perbandingan data serta dapat menampilkan hasil dalam bentuk tabel dan grafik. Operasi dasar OLAP menurut Han dan Kamber (2006) sebagai berikut: Slicing Slicing adalah proses melakukan pemilihan satu dimensi dari suatu kubus data sehingga menghasilkan subcube. Dicing Dicing adalah proses melakukan pemilihan dua atau lebih dimensi dari suatu kubus data sehingga menghasilkan subcube. Roll up Operasi roll up dilakukan pada kubus data dengan cara menaikkan tingkat suatu hierarki atau mereduksi jumlah dimensi. Drill down Drill down merupakan operasi kebalikan dari roll up. Operasi ini dapat merepresentasikan data secara lebih detail atau spesifik dari level tinggi ke level rendah. Pivoting Pivoting merupakan kemampuan OLAP yang dapat melihat data dari berbagai sudut pandang. Sumbu pada kubus data dalam aplikasi OLAP dapat diatur sehingga dapat diperoleh data yang diinginkan sesuai dengan sudut pandang analisis yang diperlukan. Model Data Multidimensi (Han dan Kamber 2006) Pembuatan data warehouse didasarkan pada model data multidimensi. Model ini menampilkan data dalam bentuk kubus. Model data multidimensi terdiri dari dimensi (dimensions) dan fakta (facts). Dimensi adalah perspektif atau entitas penting yang dimiliki oleh organisasi. Dimensi akan berubah jika analisis kebutuhan pengguna berubah. Tabel dimensi berukuran lebih kecil daripada tabel fakta dan berisi data tidak numerik. Pada data warehouse, kubus data merupakan kubus dengan n-dimensi. Fakta adalah kuantitas yang akan dianalisis hubungan antar dimensinya dan berisi data numerik. Tabel fakta berisi measure dan key dari tabel-tabel dimensi yang berelasi dengan tabel fakta itu. Data fakta diekstrak dari berbagai sumber. Data fakta cenderung stabil dan tidak berubah seiring waktu. Skema basis data berisi kumpulan entitas dan hubungan antar entitas. Tipetipe skema model data multidimensi yaitu: 1 Skema bintang (star schema) Skema bintang adalah data warehouse yang paling sederhana. Disebut skema bintang karena hubungan antar tabel dimensi dan tabel fakta menyerupai bintang, dimana satu tabel fakta dihubungkan dengan beberapa tabel dimensi. Titik tengah skema bintang adalah satu tabel fakta besar dan sudut-sudutnya adalah tabel-tabel dimensi. Keuntungan yang didapat jika menggunakan skema ini adalah peningkatan kinerja data warehouse, pemrosesan query yang
4 lebih efisien, dan waktu respon yang cepat. Bentuk skema bintang dapat dilihat pada Gambar 1.
Gambar 1 Skema Bintang 2 Skema snowflake (snowflake schema) Skema snowflake adalah variasi dari skema bintang dengan beberapa tabel dimensi dinormalisasi sehingga dihasilkan beberapa tabel tambahan. Keuntungan yang didapat dengan menggunakan skema ini adalah penghematan memori tapi waktu yang dibutuhkan untuk pemrosesan query menjadi lebih lama. Bentuk skema snowflake dapat dilihat pada Gambar 2.
Gambar 2 Skema Snowflake 3 Skema galaksi (fact constellation) Pada skema galaksi beberapa tabel fakta berbagi tabel dimensi. Keuntungan menggunakan skema ini adalah menghemat memori. Bentuk skema galaksi dapat dilihat pada Gambar 3.
5
Gambar 3 Skema Galaksi Mondrian Mondrian merupakan aplikasi server OLAP berbasis open source dan menggunakan bahasa pemograman Java. Mondrian mengeksekusi query yang ditulis menggunakan bahasa Multi-Dimensional Expression (MDX), membaca data dari database Relational Database Management System (RDBMS), dan mempresentasikan hasil multidimensional dengan format java API (Hyde 2005).
METODE Metode yang digunakan terdiri atas tahap analisis, desain, praproses data, pemuatan data, pembuatan data warehouse, aplikasi OLAP, dan uji query. Alur kerja penelitian dapat dilihat pada Gambar 4. Analisis Pada tahap ini dilakukan analisis spesifikasi untuk mengetahui karakteristik dari masing-masing data sehingga memudahkan untuk menentukan desain data warehouse yang akan dirancang. Data yang akan dianalisis yaitu data skripsi mahasiswa program sarjana Ilmu Komputer yang didapat dari perpustakaan IPB, data dosen dan data lab keilmuan didapat dari Sekretariat Departemen Ilmu Komputer, serta data mahasiswa Ilmu Komputer didapat dari sekretariat TPB dalam bentuk Excel. Terdapat unit kerja di perpustakaan Ilmu Komputer IPB yang melakukan pengumpulan data yaitu pegawai khusus bagian perpustakaan sekaligus yang akan menjadi administrator. Administrator memiliki akses langsung ke sistem manajemen basis data MySQL tempat data disimpan. Pengguna adalah Ketua Departemen dan dosen yang dapat berinteraksi langsung dengan antarmuka aplikasi berbasis web sehingga dapat memanfaatkan fasilitas sistem dengan mudah. Adapun fasilitas untuk pengguna adalah sebagai berikut:
6
Memilih dimensi dan measure melalui OLAP navigator. Menampilkan data secara roll up, drill down, slice, dan dice. Menampilkan data dalam bentuk grafik (bar, pie, dan line). Dari aplikasi ini diharapkan dapat memberikan informasi kepada pengguna seperti: 1 Menampilkan informasi penunjang kelulusan tepat waktu dilihat dari faktor: Topik skripsi, Dosen pembimbing, Lab keilmuan, IPK, Jenis kelamin mahasiswa, Jalur masuk, Asal daerah. 2 Tren skripsi mahasiswa Ilmu Komputer untuk setiap dosen pembimbing dan lab keilmuan. 3 Rata-rata lama studi mahasiswa Ilmu Komputer. Tahap awal sebelum proses pembuatan data warehouse dilakukan pengumpulan data dan menganalisis atributnya untuk mendapatkan atribut-atribut yang tepat dalam pembuatan data warehouse. Setelah dipilih dan diketahui atribut-atributnya kemudian dilanjutkan ke tahapan praproses data.
Gambar 4 Tahapan Penelitian
7 Desain Pada tahap desain, terdapat tiga fase yaitu: Desain konseptual Pada tahap ini dilakukan desain skema pembuatan data warehouse, dimensidimensi, dan measure yang akan digunakan. Measure menunjukkan hasil analisis data warehouse dari dimensi-dimensi yang dibuat. Tahap ini bertujuan untuk mengidentifikasi hubungan atribut-atribut dalam data warehouse. 2 Desain logikal Pada tahap ini dilakukan perencanaan dan pembuatan data warehouse dengan membuat relasi-relasi data dan menentukan hubungan antar atribut. Tahap ini bertujuan untuk menerjemahkan representasi konseptual data warehouse dari tahap sebelumnya ke tahap implementasi. 3 Desain fisik Pada tahap ini kubus data yang sudah siap, akan digunakan ke dalam data warehouse. Selain itu, skema sudah bisa diimplementasikan ke dalam data warehouse yang akan dibangun. 1
Praproses Data Setelah melalui tahap analisis dan desain, data yang ada harus melalui tahap praproses terlebih dahulu. Tahapan praproses data dalam penelitian ini meliputi : 1 Integrasi dan Reduksi Data Atribut-atribut data skripsi, data dosen, data lab keilmuan, dan data mahasiswa yang relevan dipilih terlebih dahulu sebelum diimpor ke sistem manajemen basis data MySQL. Integrasi dilakukan dengan menggabungkan atribut-atribut yang menarik dari tabel-tabel yang telah diperoleh. Data direduksi dilakukan bersamaan dengan proses integrasi, yaitu membuang atribut-atribut yang tidak menarik dan tidak relevan. 2 Pembersihan Data Pembersihan data dilakukan terhadap record-record yang mengandung nilai null dan nilai yang tidak konsisten. Kondisi tersebut dapat diatasi dengan membuang atau menyeragamkan nilainya dengan menggunakan nilai rataan untuk atribut yang bernilai angka. Pada tahap ini juga terdapat tahap transformasi untuk menjaga konsistensi data. 3 Transformasi Data Transformasi ke bentuk data yang tepat agar dapat digunakan untuk proses selanjutnya. Hal yang dilakukan meliputi penyeragaman nama atribut, generalisasi, agregasi, dan konstruksi atribut atau dimensi. Akhir dari tahap ini adalah terbentuknya sebuah data warehouse. Pemuatan Data Pada tahap ini data yang terseleksi telah siap untuk dimuat ke dalam data warehouse. Pemuatan data bertujuan untuk memuat data yang terseleksi ke dalam data warehouse tujuan.
8 Pembuatan Data Warehouse Pada tahap ini dilakukan pembuatan data warehouse menggunakan metode arsitektur three-tier data warehouse Han dan Kamber (2006) meliputi : 1 Lapisan bawah (bottom tier) Pada lapisan ini terdapat server data warehouse yaitu sistem manajemen basis data MySQL yang berfungsi sebagai tempat pengolahan data. 2 Lapisan tengah (middle tier) Lapisan tengah merupakan lapisan tempat menyimpan struktur kubus data yang biasa disebut dengan OLAP server. Dalam penelitian ini digunakan Mondrian Server 3.5.0. Sedangkan tempat pembuatan atau pemodelan struktur kubus data dan pemuatan data dari data warehouse ke kubus data menggunakan Schema Worbench. 3 Lapisan atas (top tier) Lapisan ini merupakan lapisan untuk end user yang memiliki fungsi menampilkan ringkasan data warehouse yang merupakan hasil dari operasi OLAP. Gambaran umum arsitektur data warehouse dan OLAP dapat dilihat pada Gambar 5.
Gambar 5 Arsitektur data warehouse dan OLAP Aplikasi OLAP Langkah awal membangun aplikasi adalah membentuk struktur kubus data dalam Mondrian 3.5.0. Sebelum membentuk struktur kubus data, dilakukan koneksi terlebih dahulu dengan sistem manajemen basis data yang telah dibangun menggunakan fasilitas connection. Selanjutnya dilakukan perancangan aplikasi yang terdiri dari rancangan antarmuka, fungsi, dan modul. Uji Query Tahap ini dilakukan setelah pembuatan data warehouse selesai. Pengujian ini dilakukan untuk melihat apakah operasi OLAP yang dibangun sudah berhasil diimplementasikan dan sesuai dengan analisis awal. Pengujian query dibantu dengan memvisualisasikan kubus-kubus data dengan grafik dan tabel untuk akurasi hasil.
9 Lingkungan Pengembangan Aplikasi OLAP ini dibangun dengan menggunakan perangkat sebagai berikut: Perangkat keras berupa komputer personal dengan spesifikasi: Prosesor Intel Core i3. Memory 2 GB. Harddisk 500 GB. Monitor 14.1”. Mouse dan keyboard. Perangkat lunak yang digunakan untuk membuat sistem ialah: Sistem Operasi Microsoft Windows 7 Profesional 64 bit. MySQL (perangkat lunak bantu untuk pemrosesan data dan pembuatan skema data warehouse). Apache Server XAMPP. Schema Workbench (tempat pemodelan struktur kubus data dan pemuatan data dari data warehouse ke kubus data) Mondrian Server 3.5.0 (OLAP server yang melakukan fungsi agregasi dan tempat penyimpanan struktur kubus data multidimensi) Web browser Google Chrome.
HASIL DAN PEMBAHASAN Analisis Data Pada penelitian ini, sumber data diperoleh dengan format Excel (xls dan xlsx) berisi data skripsi mahasiswa tahun masuk 2001 dan 2005 sampai dengan 2008 sebanyak 318 record, data dosen sebanyak 38 record, data lab keilmuan sebanyak 28 record, dan data mahasiswa sebanyak 454 record. Data skripsi diperoleh dari perpustakaan IPB, data dosen dan data lab keilmuan diperoleh dari bagian administrasi Departemen Ilmu Komputer, sedangkan data mahasiswa didapat dari Tingkat Persiapan Bersama (TPB). Proses analisis dilakukan untuk menemukan atribut-atribut yang tepat untuk perancangan desain data warehouse. Atribut-atribut pada data skripsi, data dosen, data lab keilmuan, dan data mahasiswa masing-masing dapa dilihat pada Tabel 1, Tabel 2, Tabel 3, dan Tabel 4 sedangkan atribut hasil analisis dapat dilihat pada Tabel 5. Proses analisis yang dilakukan sebagai berikut: 1 Pada data skripsi, atribut subjek dan judul tidak diambil karena topik skripsi sudah bisa diketahui dari setiap kata kunci. 2 Pada data dosen, atribut nomor, NIP, NIDN, dan keterangan tidak diambil karena pada data skripsi yang dipakai adalah nama dosen, sedangkan inisial dosen diambil untuk menjadi primary key pada entity dosen dan menjadi foreign key pada entity skripsi. 3 Pada data lab keilmuan, atribut NIP dosen tidak diambil karena nama dosen sudah mewakili sebagai dosen pembimbing.
10 4 Pada data mahasiswa, atribut kode pos tidak diambil karena atribut kota sudah mewakili sebagai asal daerah mahasiswa. Tabel 1 Atribut pada data skripsi No Atribut 1 NIM 2 Nama Mahasiswa 3 Kata Kunci 4 Subjek 5 Tahun 6 Judul 7 Dosen Pembimbing Tabel 2 Atribut pada data dosen No Atribut 1 No 2 Nama 3 NIP 4 NIDN 5 Inisial 6 Keterangan Tabel 3 Atribut pada data lab keilmuan No Atribut 1 Nama dosen 2 Inisial Lab 3 NIP Tabel 4 Atribut pada data mahasiswa No Atribut 1 NIM 2 Kota 3 Jenis Kelamin 4 Tahun Masuk 5 Jalur Masuk 6 IPK 7 Kode pos
Nama Atribut NIM Nama mhs Kata kunci Tahun lulus Nama dosen Inisial dosen
Tabel 5 Atribut hasil analisis Deskripsi Nomor induk mahasiswa Nama mahasiswa Kata kunci di setiap judul skripsi Tahun mahasiswa lulus Nama dosen di Departemen Ilmu Komputer Inisial nama dosen
11 Tabel 5 Atribut hasil analisis (lanjutan) Nama Atribut Deskripsi Nama lab Nama lab keilmuan Inisial lab Inisial nama lab keilmuan Asal daerah Kota asal mahasiswa Jenis Kelamin Jenis kelamin mahasiswa Tahun masuk Tahun mahasiswa masuk IPB Jalur masuk Jalur masuk IPB IPK IPK mahasiswa waktu TPB Klasifikasi Klasifikasi digunakan untuk mengetahui keberadaan seorang mahasiswa masuk lab keilmuan mana. Contoh sebelum klasifikasi dapat dilihat pada Tabel 6. Setelah ditelusuri dengan melihat kata kunci dan dosen pembimbing, maka skripsi tersebut berasal dari lab keilmuan Computational Intelligence (CI). Tahap ini bertujuan mengetahui tren topik skripsi pada masing-masing lab keilmuan. Nama Mahasiswa Muhammad Agung Nugroho
Tabel 6 Contoh klasifikasi untuk tabel fakta skripsi Kata Judul Skripsi Subjek Dosbing Kunci Perbandingan Jaringan Buono, beberapa metode syaraf Agus; praproses pada tiruan Neyman pengenalan karakter Shelvie tulisan tangan Nidya; menggunakan jaringan syaraf tiruan propagasi balik
Lab ?
CI
Desain Konseptual dan Desain Logikal Tahap ini merujuk kepada tujuan penelitian, yaitu melihat pola-pola informasi yang berpotensi menunjang kelulusan mahasiswa tepat waktu. Sehingga membutuhkan tabel fakta skripsi yang akan menghasilkan faktor-faktor yang memengaruhi seorang mahasiswa lulus tepat waktu atau tidak. Faktor tersebut diimplementasikan dalam sebelas atribut (inisial_dosen, inisial_lab, nim, th_lulus, inisial_key, th_masuk, IPK, lama_studi, id_jm, id_jk, id_kab) dan dua measure (jumlah_judul_skripsi, rata_lama_studi). Data yang digunakan adalah data skripsi mahasiswa Ilmu Komputer yang sudah lulus sebanyak 318 record. Hasil dari sebelas atribut dan dua measure digunakan untuk melihat tren skripsi dan tujuh faktor (dosen, lab, kata kunci, IPK, jalur masuk, jenis kelamin, atau asal daerah) yang paling berpengaruh terhadap kelulusan mahasiswa. Selanjutnya, dibuat skema multidimensi untuk data warehouse yang dapat dilihat pada Gambar 6. Skema data multidimensi yang dihasilkan merupakan hasil desain logikal.
12
Gambar 6 Skema galaksi dengan dua tabel fakta Integrasi Data, Reduksi Data, dan Pembersihan Data Tahap ini diawali dengan melakukan penggabungan atribut-atribut yang menarik dari tabel-tabel yang dianalisis menjadi satu tabel besar untuk dijadikan tabel fakta. Penggabungan yang dilakukan adalah menggabungkan data skripsi, data dosen, data lab keilmuan, dan data mahasiswa. Reduksi data dan pembersihan data dilakukan dengan membuang atributatribut yang tidak terpilih, record yang kosong (null), mengandung noise, dan tidak konsisten berdasarkan hasil analisis data. Nilai atribut yang berulang dalam tabel-tabel sumber tidak disertakan dalam proses selanjutnya. Praproses data menghasilkan tabel baru yaitu tabel skripsi dan tabel mahasiswa. Hasil dari praproses data menghasilkan desain fisik final yang selanjutnya dijadikan tabel fakta dapat dilihat pada Tabel 7 dan Tabel 8. Setelah melakukan praproses data selanjutnya data dari format Excel (xls dan xlsx) diimpor menjadi file SQL. Tabel 7 Desain fisik fakta skripsi Nama atribut Deskripsi inisial_dosen Kode dosen pembimbing inisial_lab Kode lab keilmuan nim Nomor induk mahasiswa th_lulus Tahun lulus mahasiswa inisial_key Kode kata kunci setiap judul skripsi th_masuk Tahun masuk mahasiswa lama_studi Lama studi mahasiswa IPK TPB Nilai IPK saat TPB id_jm Kode jalur masuk IPB id_jk Kode jenis kelamin mahasiswa id_kab Kode asal daerah mahasiswa
13 Tabel 8 Desain fisik fakta mahasiswa Nama atribut Deskripsi nim Nomor induk mahasiswa th_masuk Tahun masuk mahasiswa id_jm Kode jalur masuk IPB id_jk Kode jenis kelamin mahasiswa id_kab Kode asal daerah mahasiswa Transformasi data Transformasi data meliputi penyeragaman nama atribut, generalisasi, agregasi, dan konstruksi atribut atau dimensi. Proses ini dilakukan dengan berpedoman pada skema data warehouse yang sudah dibuat. Langkah transformasi yang dilakukan antara lain: 1 Mengubah nama atribut pada tabel data hasil pembersihan sesuai dengan nama atribut dimensi yang ada pada skema galaksi. 2 Proses transformasi juga dilakukan dengan mengkontruksi atribut baru menggunakan data dari atribut yang sudah ada. Atribut NIM dari tabel skripsi digeneralisasi menjadi tahun_masuk dengan mengambil lima digit awal, kemudian dari digit tersebut diambil tiga digit awal dan dua digit terakhir. Misalnya NIM = ‘G64070101’→’G6407’→’G64’→’07 sehingga mahasiswa yang memiliki NIM tersebut adalah mahasiswa Departemen Ilmu Komputer IPB dengan tahun masuk 2007. 3 Langkah selanjutnya adalah menentukan nilai agregasi atribut-atribut menjadi ukuran (measure). Data tabel fakta skripsi ditentukan nilai agregasinya untuk menentukan ukuran rata-rata lama studi. Pemuatan Data Data warehouse yang sudah selesai dibuat, selanjutnya dimuat ke kubus data OLAP server Mondrian. Kemudian, skema data warehouse dimodelkan dengan menentukan dimensi-dimensi, ukuran-ukuran, dan kubus data. Kubus data yang dibuat yaitu, kubus skripsi dan kubus mahasiswa. Kubus skripsi dibuat untuk tabel fakta skripsi dan kubus mahasiswa dibuat untuk tabel fakta mahasiswa. Eksplorasi dan Presentasi Hasil Eksplorasi data dilakukan dengan menggunakan operasi OLAP untuk menghasilkan beberapa informasi yang diinginkan. Operasi OLAP yang dapat dijalankan dapat dilihat pada tiap kubus yang terbentuk. Tampilan aplikasi dapat dilihat pada Gambar 7. Pada aplikasi ini dibuat dua modul yaitu modul skripsi untuk kubus skripsi pada Gambar 8 dan modul mahasiswa untuk kubus mahasiswa pada Gambar 9.
14
Gambar 7 Tampilan awal aplikasi
Gambar 8 Tampilan aplikasi untuk kubus skripsi
Gambar 9 Tampilan aplikasi untuk kubus mahasiswa
15 Pada kubus Skripsi dapat dilihat beberapa operasi OLAP misalnya operasi roll-up, drill-down, slice, dan dice. Berikut tampilan aplikasi untuk informasi penunjang kelulusan tepat waktu dilihat dari faktor: a Topik skripsi Pengguna memiliki dua pilihan untuk mengggunakan aplikasi ini yaitu, manual (menggunakan query MDX) dan praktis (menggunakan OLAP navigator). Gambar 10 merupakan tampilan editor query MDX. Untuk menggunakan editor tersebut pengguna cukup mengklik button MDX. Berikut keterangan dari setiap query yang ditulis pada Gambar 10: o select {[Measures].[Jumlah Skripsi]} ON COLUMNS - Ukuran atau measure yang digunakan yaitu Jumlah Skripsi yang ditampilkan dalam bentuk kolom. o Hierarchize({[Kata kunci].[All]}) ON ROWS - Hirarki atau dimensi yang digunakan adalah Kata Kunci (topik skripsi) ditampilkan dalam bentuk baris. o from [Skripsi] – diambil dari kubus Skripsi. o where [Lama Studi].[4] – slicer untuk melihat mahasiswa dengan lama studi empat tahun.
Gambar 10 Tampilan editor query MDX topik skripsi Gambar 11 merupakan tampilan OLAP navigator. Pada bagian columns terdapat Measure, pada bagian rows terdapat Kata Kunci, dan pada bagian filter terdapat slicer (Lama Studi = 4). Untuk menggunakan fungsi tersebut, pengguna cukup mengklik button Open OLAP Navigator.
16
Gambar 11 Tampilan OLAP Navigator topik skripsi Gambar 12 merupakan potongan tampilan hasil topik skripsi mahasiswa dengan lama studi empat tahun. Kekurangan pada fungsi ini adalah kata kunci skripsi masih dalam bentuk hierarki. Contohnya dari Gambar 12, Natural language processing berada pada tingkatan ketiga di bawah Knowledge graph dan berada di bawah Adverb. Oleh karena itu dibutuhkan data hasil klasifikasi keberadaan suatu kata kunci masuk dalam sebuah kategori tertentu sesuai dengan bidang kajiannya.
Gambar 12 Tampilan hasil topik skripsi b Dosen pembimbing Gambar 13 merupakan tampilan editor query MDX. Untuk menggunakan editor tersebut pengguna cukup mengklik button MDX. Berikut keterangan dari setiap query yang ditulis pada Gambar 13: o select {[Measures].[Jumlah Skripsi]} ON COLUMNS, - Ukuran atau measure yang digunakan yaitu Jumlah Skripsi yang ditampilkan dalam bentuk kolom.
17 o Hierarchize({[Dosen Pembimbing].[All]}) ON ROWS - Hirarki atau dimensi yang digunakan adalah Dosen Pembimbing ditampilkan dalam bentuk baris. o from [Skripsi] – diambil dari kubus Skripsi. o where [Lama Studi].[4] – slicer untuk melihat mahasiswa dengan lama studi empat tahun.
Gambar 13 Tampilan editor query MDX Dosen pembimbing
Gambar 14 Tampilan OLAP Navigator Dosen Pembimbing Gambar 14 merupakan tampilan OLAP navigator. Pada bagian columns terdapat Measure, pada bagian rows terdapat Dosen Pembimbing, dan pada bagian filter terdapat slicer (Lama Studi = 4). Untuk menggunakan fungsi tersebut, pengguna cukup mengklik button Open OLAP Navigator. Untuk hasilnya diketahui bahwa dosen pembimbing yang banyak meluluskan mahasiswa tepat waktu adalah Bapak Julio Adisantoso dapat dilihat pada Gambar 15.
18
Gambar 15 Tabel pivot menunjukkan dosen pembimbing yang meluluskan mahasiswa tepat waktu c Lab Keilmuan Gambar 16 merupakan tampilan editor query MDX. Untuk menggunakan editor tersebut pengguna cukup mengklik button MDX. Berikut keterangan dari setiap query yang ditulis pada Gambar 16: o select {[Measures].[Jumlah Skripsi]} ON COLUMNS, - Ukuran atau measure yang digunakan yaitu Jumlah Skripsi yang ditampilkan dalam bentuk kolom. o Hierarchize({[Lab Keilmuan].[All]}) ON ROWS - Hirarki atau dimensi yang digunakan adalah Lab Keilmuan ditampilkan dalam bentuk baris. o from [Skripsi] – diambil dari kubus Skripsi. o where [Lama Studi].[4] – slicer untuk melihat mahasiswa dengan lama studi empat tahun. Gambar 17 merupakan tampilan OLAP navigator. Pada bagian columns terdapat Measure, pada bagian rows terdapat Lab Keilmuan, dan pada bagian filter terdapat slicer (Lama Studi = 4). Untuk menggunakan fungsi tersebut, pengguna cukup mengklik button Open OLAP Navigator. Untuk hasilnya diketahui bahwa lab keilmuan Computational Intelligence (CI) paling banyak meluluskan mahasiswa tepat waktu sedangkan lab keilmuan yang paling sedikit meluluskan mahasiswa tepat waktu adalah SEINS dapat dilihat pada Gambar 18.
19
Gambar 16 Tampilan editor query MDX Lab Keilmuan
Gambar 17 Tampilan OLAP Navigator Lab Keilmuan
Gambar 18 Tabel pivot dan grafik batang menunjukkan jumlah mahasiswa lulus tepat waktu berdasarkan lab keilmuan
20 d IPK Gambar 19 merupakan tampilan editor query MDX. Untuk menggunakan editor tersebut pengguna cukup mengklik button MDX. Berikut keterangan dari setiap query yang ditulis pada Gambar 19: o select {[Measures].[Jumlah Skripsi]} ON COLUMNS, - Ukuran atau measure yang digunakan yaitu Jumlah Skripsi yang ditampilkan dalam bentuk kolom. o Hierarchize({[IPK TPB].[All]}) ON ROWS - Hirarki atau dimensi yang digunakan adalah IPK TPB ditampilkan dalam bentuk baris. o from [Skripsi] – diambil dari kubus Skripsi. o where [Lama Studi].[4] – slicer untuk melihat mahasiswa dengan lama studi empat tahun.
Gambar 19 Tampilan editor query MDX IPK TPB
Gambar 20 Tampilan OLAP Navigator IPK TPB
21 Gambar 20 merupakan tampilan OLAP navigator. Pada bagian columns terdapat Measure, pada bagian rows terdapat IPK TPB, dan pada bagian filter terdapat slicer (Lama Studi = 4). Untuk menggunakan fungsi tersebut, pengguna cukup mengklik button Open OLAP Navigator. Untuk hasilnya diketahui bahwa IPK diatas 2.5 cenderung lulus tepat waktu, sedangkan IPK di bawah 2.5 hanya sedikit yang mampu lulus tepat waktu dilihat pada Gambar 21.
Gambar 21 Tabel pivot menunjukkan kelulusan tepat waktu berdasarkan IPK TPB e Jenis Kelamin Mahasiswa Gambar 22 merupakan tampilan editor query MDX. Untuk menggunakan editor tersebut pengguna cukup mengklik button MDX. Berikut keterangan dari setiap query yang ditulis pada Gambar 22: o select {[Measures].[Jumlah Skripsi]} ON COLUMNS, - Ukuran atau measure yang digunakan yaitu Jumlah Skripsi yang ditampilkan dalam bentuk kolom. o Hierarchize({[Jenis Kelamin].[All]}) ON ROWS - Hirarki atau dimensi yang digunakan adalah Jenis Kelamin ditampilkan dalam bentuk baris. o from [Skripsi] – diambil dari kubus Skripsi. o where [Lama Studi].[4] – slicer untuk melihat mahasiswa dengan lama studi empat tahun. Gambar 23 merupakan tampilan OLAP navigator. Pada bagian columns terdapat Measure, pada bagian rows terdapat Jenis Kelamin, dan pada bagian filter terdapat slicer (Lama Studi = 4). Untuk menggunakan fungsi tersebut, pengguna cukup mengklik button Open OLAP Navigator. Hasilnya pada Gambar 24 diketahui bahwa mahasiswa perempuan paling banyak lulus tepat waktu daripda mahasiswa laki-laki, tetapi perbedaannya tidak terlalu signifikan.
Gambar 22 Tampilan editor query MDX Jenis Kelamin Mahasiswa
22
Gambar 23 Tampilan OLAP Navigator Jenis Kelamin Mahasiswa
Gambar 24 Tabel pivot dan grafik operasi drill-down menunjukkan jumlah mahasiswa lulus tepat waktu berdasarkan jenis kelamin f Jalur Masuk Gambar 25 merupakan tampilan editor query MDX. Untuk menggunakan editor tersebut pengguna cukup mengklik button MDX. Berikut keterangan dari setiap query yang ditulis pada Gambar 25: o select {[Measures].[Jumlah Skripsi]} ON COLUMNS, - Ukuran atau measure yang digunakan yaitu Jumlah Skripsi yang ditampilkan dalam bentuk kolom. o Hierarchize({[Jalur Masuk].[All]}) ON ROWS - Hirarki atau dimensi yang digunakan adalah Jalur Masuk ditampilkan dalam bentuk baris. o from [Skripsi] – diambil dari kubus Skripsi. o where [Lama Studi].[4] – slicer untuk melihat mahasiswa dengan lama studi empat tahun. Gambar 26 merupakan tampilan OLAP navigator. Pada bagian columns terdapat Measure, pada bagian rows terdapat Jalur Masuk, dan pada bagian filter terdapat slicer (Lama Studi = 4). Untuk menggunakan fungsi tersebut, pengguna cukup mengklik button Open OLAP Navigator.
23
Gambar 25 Tampilan editor query MDX Jalur Masuk Mahasiswa
Gambar 26 Tampilan OLAP Navigator Jalur Masuk Mahasiswa Gambar 27 menunjukkan kelulusan mahasiswa tepat waktu berasal dari jalur masuk USMI daripada jalur masuk SNMPTN, BUD. Sedangkan berdasarkan jalur masuk Prestasi Internasinal-Nasional (PIN), asing, dan Ujian Talenta Masuk (UTM) tidak ada mahasiswa yang lulus tepat waktu.
24
Gambar 27 Tabel pivot dan grafik operasi drill-down menunjukkan jumlah mahasiswa lulus tepat waktu berdasarkan jalur masuk g Asal Daerah Gambar 28 merupakan tampilan editor query MDX. Untuk menggunakan editor tersebut pengguna cukup mengklik button MDX. Berikut keterangan dari setiap query yang ditulis pada Gambar 28: o select {[Measures].[Jumlah Skripsi]} ON COLUMNS, - Ukuran atau measure yang digunakan yaitu Jumlah Skripsi yang ditampilkan dalam bentuk kolom. o Hierarchize({[Asal Daerah].[All]}) ON ROWS - Hirarki atau dimensi yang digunakan adalah Asal Daerah ditampilkan dalam bentuk baris. o from [Skripsi] – diambil dari kubus Skripsi. o where [Lama Studi].[4] – slicer untuk melihat mahasiswa dengan lama studi empat tahun. Gambar 29 merupakan tampilan OLAP navigator. Pada bagian columns terdapat Measure, pada bagian rows terdapat Asal Daerah, dan pada bagian filter terdapat slicer (Lama Studi = 4). Untuk menggunakan fungsi tersebut, pengguna cukup mengklik button Open OLAP Navigator. Hasilnya pada Gambar 30 menunjukkan bahwa jumlah kelulusan tepat waktu terbanyak berasal dari Pulau Jawa, sedangkan dari daerah Maluku dan Sulawesi tidak ada mahasiswa yang lulus tepat waktu.
25
Gambar 28 Tampilan editor query MDX Asal Daerah Mahasiswa
Gambar 29 Tampilan OLAP Navigator Asal Daerah Mahasiswa
Gambar 30 Grafik batang kelulusan tepat waktu berdasarkan asal daerah mahasiswa
26
SIMPULAN DAN SARAN Simpulan Hasil penelitian pembangunan data warehouse dan OLAP berbasis web data skripsi Ilmu Komputer menghasilkan dua kubus data, yaitu kubus data skripsi dan mahasiswa. Kubus data skripsi berisi sebelas dimensi, yaitu Dosen Pembimbing, Lab Keilmuan, NIM, Tahun Lulus, Kata Kunci, Tahun Masuk, Lama Studi, IPK TPB, Jalur Masuk, Jenis Kelamin, dan Asal Daerah. Measure yang digunakan yaitu Jumlah Judul Skripsi dan Rata Lama Studi. Sedangkan kubus data mahasiswa berisi lima dimensi, yaitu NIM, Tahun Masuk, Jalur Masuk, Jenis Kelamin, dan Asal Daerah. Measure yang digunakan yaitu Jumlah Mahasiswa. Aplikasi OLAP yang dibangun dapat digunakan untuk operasi-operasi OLAP seperti roll-up, drill-down, slice, dice, dan pivot. Aplikasi ini menyediakan navigator OLAP untuk memilih measure dan dimensi tanpa harus memasukkan query-query SQL. Hasil operasi OLAP divisualisasikan dalam bentuk grafik yang dinamis dan dapat dicetak dalam bentuk PDF dan Excel. Saran Saran untuk penelitian data warehouse dan OLAP selanjutnya, yaitu data yang lengkap untuk mendapatkan hasil OLAP dan hasil analisis yang tepat, aplikasi OLAP dikembangkan dengan menambah fasilitas login sehingga aplikasi hanya diakses oleh pihak-pihak yang berkepentingan dan kerahasian data terjamin, hierarki kata kunci diperbaiki menjadi klasifikasi berdasarkan bidang kajian lab keilmuan, dan operasi slice dan dice dioperasikan dalam OLAP navigator.
DAFTAR PUSTAKA Aulia K. 2011. Data warehouse dan Aplikasi OLAP Akademik Kurikulum Mayor-Minor Berbasis Linux. [skripsi]. Bogor (ID): Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor. Han J, Kamber M. 2006. Data Mining: Concept and Techniques, San Francisco (US): Morgan Kaufmann Publisher. Herlambang A. 2007. Pembangunan Data warehouse dan Aplikasi OLAP Berbasis Web Menggunakan Palo (Studi Kasus: Data PPMB IPB). [skripsi]. Bogor (ID): Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor. Hyde J. 2007. Developing OLAP Solution with Mondrian. [IPB] Institut Pertanian Bogor. 2013. Sekilas Tentang Penerimaan Mahasiswa Baru IPB. http://admisi.ipb.ac.id/p/single/penerimaanmahasiswabaruipb (diakses tanggal 18 Juli 2013) [IPB] Institut Pertanian Bogor. 2011. Panduan Program Pendidikan Sarjana Edisi 2011. Bogor (ID): IPB Press.
27 Lampiran 1 Data Dimensi a Dimensi Dosen inisial_dosen nama_dosen MAI Istiadi; Muhammad Abrar TTH Haryanto; Toto WAK Kusuma; Wisnu Ananta AGB Buono; Agus AZK Kustiyo; Aziz KLN Nisa; Karlina Khiyarin MUS Mushthofa YHY Herdiyeni; Yeni ANN Annisa HAA Adrianto; Hari Agung ISS Sitanggang; Imas S. ARD Ridha; Ahmad JAS Adisantoso; Julio SHW Wijaya; Sony Hartono ARA Akbar; Auriza Rahmad EPG Giri; Endang Purnama HRS Sukoco; Heru HRW Rahmawan; Hendra KPR Priandana; Karlisa SGN Guritman; Sugi SNN Neyman; Shelvie Nidya SWJ Wahjuni; Sri AAS Asfarian; Auzi FAR Ardiansyah; Firman IRH Hermadi; Irman KBS Seminar; Kudang Boro MAA Agmaloro; Muhammad Ashyar MTR Rachmaniah; Meuthia RKD Karyadin; Rindang YNY Nurhadryani; Yani ARF Ramadhan; Arief ARR Rambe; Abdurrauf DAR Ramadhan; Dean Aprilia DKM Kartika; Desina PWA Wasmana; Panji SNI Nurdiati; Sri b Dimensi Lab Inisial_lab IR NCC SEINS
Nama_lab Information Retrieval Net-Centric Computing Software Engineering and Information Sciences
28 Dimensi Lab (lanjutan) Inisial_lab Nama_lab CI Computational Intelligence DM Data Mining BIF Bioinformatika
c
Dimensi NIM nim G64101028 G64101027 G64101025 G64101024 G64101022 G64101021 G64101019 G64101018 G64101017 G64101016 G64101014 G64101013 G64101012 G64101010 G64101009 G64101008 G64101007 G64101006 G64101004 G64101003 G64101001 G64070072 G64070071 G64070070 G64070069 G64070066 G64070065 G64070064 G64070063 G64070062 G64070061 G64070060 G64070059 G64070058 G64070057 G64070054
nama_mhs Favorisen Rosyking Lumbanraja Tri Priyo Sudarmanto Holan Yani Mandasari Wibawa Andriyanto Nugroho Usep Aris Sutandi Dyah Ruwiyanti Rony Setiawan Toto Haryanto Nugraha Tejapermana Elmi Achelia Ardian Ariono Rades Wandri Aisyah Marlian Daulay Ratna Purnama Sari Marico Djakasaputra Andika Wahyu Agusetyawan Muslikhah Fajriyati Novi Apriyanti Sifilia Erwin Wahyu Akbar Riyan Nugroho Nutri Rahayuni Windy Wahyu Astuti Islamiyah Dean Apriana Ramadhan Ni Made Febryantini Dwi Ariny Ria Astriratma Remarchtito Heyziputra Nur Nissa Amyati Dillyani Windy Widowati Isna Mariam Gema Alief Utama Devi Dian Pramana Putra Adi Gunarso Fani Valerina Rani Dwijayanti
29 Dimensi NIM (lanjutan) nim nama_mhs G64070050 Yoga Herawan G64070048 Wiwiek Dewi Anggraeni G64070047 Rendy Eka Saputra G64070046 Rahman Sujatman G64070043 Fandi Rahmawan G64070040 Dhieka Avrilia Lantana d Dimensi Waktu Lulus th_lulus 2005 2006 2007 2008 2009 2010 2011 2012 2013 e
Dimensi Kata Kunci inisial_key kata_kunci1 Fuzzy cCIG64101010 means CIG64080065
CIG64080030 CIG64063196 CIG64062552
CIG64052475 CIG64051561 CIG64101068 CIG64050964 CIG64101064 CIG64101059
kata_kunci2
kata_kunci3
kata_kunci4
Character Asterinaceae Selection Document classificatio Chi-square n Speech Mobile robot recognition Certainty Expert factor system Central Online tabulating voting faciliteis Density GIS analysis Citra sidik jari Flocking Separation Objek tiga Sistem dimensi kordinat Berbasis Zakat web
Identification Key
Important Characters
Document identification Hidden markov model
K-fold cross validation Mfcc
ADHD Two central faciliteis Bakosurtanal
Cohesion Model waterfall
Pest Shortest Path
30 Dimensi Kata Kunci (lanjutan) inisial_key kata_kunci1 Kinerja CIG64101027 algoritma
CIG64101028 CIG64101006
CIG64101070 . . .
Association Mining Rule Jaringan syaraf tiruan Sistem pembelajara n cerdas . . .
SEINSG64070010 Android SEINSG64070015 ASP.net SEINSG64070033 3D Map Business SEINSG64070048 Intelligence
SEINSG64070082 SEINSG64070106 SEINSG64080001 SEINSG64080026
Augmented Reality (AR) Android Browser Customer
SEINSG64080040 Analysis Transaction Processing SEINSG64080051 System f
Dimensi Waktu Masuk th_masuk angkatan 2001 38 2005 42 2006 43 2007 44 2008 45
kata_kunci2
Personalisas i rekomendasi Propagasi Balik Model komunikasi . . . Augmented Reality Forest usage Bezier Curve Data Warehouse Usability Engineering Lifecycle Rotate E-commerce E-commerce
kata_kunci3
kata_kunci4
Profil minat Ketepatan Prediksi
Profil perilaku NguyenWidrow
Model pakar . . .
Modul pedagogig . . .
IPB GIS
Navigation Google Maps API
IPB
RIA
Metadata
OLAP
Prototype Map Evaluator Parameter
Parenting
R4 framework
Navigation Kajian Transactor Social network developmen t
Kindergarte n
Requirement Analysis
Zachman Framework
31 g Dimensi Lama Studi lama_studi 4 5 6 7 h Dimensi IPK Id_ipk rentang_ipk E 1
Dimensi Jalur Masuk id_jm jalur_masuk 1 usmi 2 snmptn/spm 3 pin 6 bud 7 asing 8 utm
j
Dimensi Jenis Kelamin id_jk jenis_kelamin P Perempuan L Laki-laki
k Dimensi Kabupaten id_kab Kab-1 Kab-2 Kab-3 Kab-4 Kab-5 Kab-6 Kab-7 Kab-8 Kab-9 Kab-10 . . . .
nama_kab Kabupaten Aceh Barat Kabupaten Aceh Barat Daya Kabupaten Aceh Besar Kabupaten Aceh Jaya Kabupaten Aceh Selatan Kabupaten Aceh Singkil Kabupaten Aceh Tamiang Kabupaten Aceh Tengah Kabupaten Aceh Tenggara Kabupaten Aceh Timur . . . . .
id_prov Prov-1 Prov-1 Prov-1 Prov-1 Prov-1 Prov-1 Prov-1 Prov-1 Prov-1 Prov-1 . . . . .
32 Dimensi Kabupaten (lanjutan) id_kab nama_kab Kab-488 Kabupaten Pegunungan Bintang Kab-489 Kabupaten Puncak Kab-490 Kabupaten Puncak Jaya Kab-491 Kabupaten Sarmi Kab-492 Kabupaten Supiori Kab-493 Kabupaten Tolikara Kab-494 Kabupaten Waropen Kab-495 Kabupaten Yahukimo Kab-496 Kabupaten Yalimo Kab-497 Kota Jayapura l
Dimensi Provinsi id_prov Prov-1 Prov-2 Prov-3 Prov-4 Prov-5 Prov-6 Prov-7 Prov-8 Prov-9 Prov-10 Prov-11 Prov-12 . . . . . Prov-26 Prov-27 Prov-28 Prov-29 Prov-30 Prov-31 Prov-32 Prov-33
nama_prov Aceh Sumatera Utara Sumatera Barat Riau Jambi Sumtera Selatan Bengkulu Lampung Kep. Bangka Belitung Kep. Riau DKI Jakarta Jawa Barat . . . . . Sulawesi Selatan Sulawesi Tenggara Gorontalo Sulawesi Barat Maluku Maluku Utara Papua Barat Papua
id_pulau Pulau-1 Pulau-1 Pulau-1 Pulau-1 Pulau-1 Pulau-1 Pulau-1 Pulau-1 Pulau-1 Pulau-1 Pulau-2 Pulau-2 . . . . . Pulau-4 Pulau-4 Pulau-4 Pulau-4 Pulau-8 Pulau-8 Pulau-5 Pulau-5
id_prov Prov-33 Prov-33 Prov-33 Prov-33 Prov-33 Prov-33 Prov-33 Prov-33 Prov-33 Prov-33
33 m Dimensi Pulau id_pulau Pulau-1 Pulau-2 Pulau-3 Pulau-4 Pulau-5 Pulau-6 Pulau-7 Pulau-8
nama_pulau Sumatra Jawa Kalimantan Sulawesi Papua Bali Nusa tenggara Maluku
34
RIWAYAT HIDUP Penulis dilahirkan di Ciamis, Jawa Barat pada tanggal 6 Juli 1991. Penulis merupakan anak pertama dari 2 bersaudara dari pasangan Dede Herdiana dan Masitah. Pada tahun 2009, penulis menamatkan pendidikan di SMA Negeri 1 Ciamis. Penulis lulus seleksi masuk Institut Pertanian Bogor (IPB) pada tahun yang sama melalui jalur Undangan Seleksi Masuk IPB di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam. Penulis aktif di organisasi kemahasiswaan Himpunan Mahasiswa Ilmu Komputer (HIMALKOM) pada tahun 2011-2012 dan berbagai kegiatan kepanitiaan seperti IT Today (2010 & 2011), Masa Perkenalan Departemen (2011), Family Gathering Ilkom (2011). Penulis juga menjadi asisten praktikum pada Mata Kuliah Data Mining (2013). Selain itu, penulis melaksanakan kegiatan Praktik Kerja Lapangan di Badan Pemeriksa Keuangan Republik Indonesia (BPK RI) pada tahun 2012.