DATA WAREHOUSE DAN APLIKASI OLAP AKADEMIK KURIKULUM MAYOR-MINOR BERBASIS LINUX
KAROMATUL AULIA
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
DATA WAREHOUSE DAN APLIKASI OLAP AKADEMIK KURIKULUM MAYOR-MINOR BERBASIS LINUX
KAROMATUL AULIA
Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
ABSTRACT KAROMATUL AULIA. Data Warehouse and OLAP Major-Minor Curriculum Aplications Based on Linux. Supervised by HARI AGUNG ADRIANTO. Data warehouse is a specialized database for decision support purposes, which is integrated data from different systems, query performance, relieving source systems from long running queries, and the tracking of history. Accordingly, data warehouse is often use by company. This research represents the elaboration of data warehouse for academic purpose at Bogor Agricultural University using Online Analytical Processing (OLAP). OLAP is part of the broader category of business intelligence, which also encompasses relational reporting and data mining. OLAP which is integrated with data warehouse, developed to analyze academic data yearly including student’s grades, GPA, and cumulative GPA for Major and Minor. This research produces a data warehouse and web-based OLAP containing two data cubes: Subject_Grade and GPA. Data warehouse consists of seven dimensions (Time, Generation, Sex, Subject, Grade, Status of study, and Minor) and two cubes (Subject_Grade and GPA). This application provides information as of report with Excel Spreadsheet, and pdf file. Users can explore this application to get academic related information in Computer Science Department by application OLAP operations including roll-up, drill-down, dice, slice, drill through, pivot, etc.
Keywords : data warehouse, academic data, OLAP server, Mondrian 3.2.0, Linux Ubuntu.
Judul Nama NIM
: Data Warehouse dan Aplikasi OLAP Akademik Kurikulum Mayor-minor Berbasis Linux : Karomatul Aulia : G64061148
Menyetujui: Pembimbing,
Hari Agung Adrianto S.Kom., M.Si NIP. 19760917 200501 1 001
Mengetahui: Ketua Departemen Ilmu Komputer,
Dr. Ir. Sri Nurdiati, M.Sc. NIP. 19601126 198601 2 001
Tanggal Lulus:
KATA PENGANTAR Puji syukur penulis panjatkan ke hadirat Allah SWT atas segala curahan rahmat dan karuniaNya sehingga skripsi ini dapat diselesaikan. Skripsi ini merupakan hasil penelitian dalam bidang kajian Data Warehouse dan Aplikasi OLAP pada Data Akademik Kurikulum Mayor-minor IPB dalam sistem Operasi Linux. Penulis mengucapkan terima kasih kepada Bapak Hari Agung Adrianto, S.Kom, M.Si selaku pembimbing yang telah memberi saran, masukan, dan ide-ide kepada penulis dalam menyusun skripsi ini. Terima kasih juga penulis ucapkan kepada Bapak Firman Ardiansyah, S.Kom, M.Si selaku penguji I dan Ibu Dr. Ir. Sri Nurdiati, M.Sc sebagai penguji II. Penulis juga mengucapkan terima kasih kepada: 1 Ibu dan Bapak serta adik yang selalu memberikan doa, nasihat, dukungan, semangat, dan kasih sayang yang luar biasa kepada penulis sehingga dapat menyelesaikan tugas akhir ini. Widia Sulistyaningsih dan Rina Trisminingsih yang menjadi tempat bertukar ide dalam menyelesaikan tugas. 2 Teman dekat, Putri Heriningtyas, Nur Aziza Aziz dan kawan-kawan Ilkom angkatan 43 yang selalu mendukung dan memberi semangat. 3 Kakak kelas, Mba Windi 42, Kak Auriza 42, dan Kak Tanto 42 yang telah memberi masukan. 4 Departemen Ilmu Komputer, staf, dan dosen yang telah banyak membantu baik selama penelitian maupun pada masa perkuliahan. Kepada semua pihak lainnya yang telah memberikan kontribusi yang besar selama pengerjaan penelitian ini yang tidak dapat disebutkan satu-persatu, penulis ucapkan terima kasih banyak. Semoga penelitian ini dapat memberikan manfaat.
Bogor, November 2010
Karomatul Aulia
RIWAYAT HIDUP Penulis dilahirkan di Tegal pada tanggal 6 Mei 1988 yang merupakan anak pertama dari empat bersaudara dengan ayah bernama Agus Sofwan dan ibu bernama Rohyati. Pada tahun 2006 lulus dari Sekolah Menengah Atas (SMA) Negeri 1 Tegal dan pada tahun 2006 diterima di Institut Pertanian Bogor melalui jalur USMI atau Undangan Seleksi Masuk IPB. Tahun 2006-2007 penulis aktif di lembaga kemahasiswaan Badan Eksekutif Mahasiswa Tingkat Persiapan Bersama. Pada tahun 2007-2009 penulis aktif di Himpunan Mahasiswa Ilmu Komputer Institut Pertanian Bogor. Tahun 2009 penulis melaksanakan Praktik Kerja Lapangan di BAPETEN dan membantu dosen sebagai asisten praktikum pengenalan komputer.
DAFTAR ISI Halaman DAFTAR TABEL ................................................................................................................. vi DAFTAR GAMBAR ............................................................................................................ vi DAFTAR LAMPIRAN ......................................................................................................... vi PENDAHULUAN Latar Belakang................................................................................................................... 1 Tujuan ............................................................................................................................... 1 Ruang Lingkup .................................................................................................................. 1 Manfaat Penelitian ............................................................................................................. 1 TINJAUAN PUSTAKA Data Warehouse ................................................................................................................ 1 Arsitektur Data Warehouse ................................................................................................ 1 Operasi-operasi pada OLAP ............................................................................................... 2 Metode Pengembangan Data Warehouse ............................................................................ 4 METODE PENELITIAN Analisis.............................................................................................................................. 4 Desain ............................................................................................................................... 4 Pemuatan Data ................................................................................................................... 4 Pembuatan Data Warehouse............................................................................................... 4 Uji Query ........................................................................................................................... 5 Lingkungan Pengembangan................................................................................................ 5 HASIL DAN PEMBAHASAN Analisis Data ..................................................................................................................... 5 Pemuatan Data ................................................................................................................... 6 Eksplorasi dan Presentasi Hasil .......................................................................................... 8 KESIMPULAN DAN SARAN Kesimpulan ........................................................................................................................ 9 Saran ................................................................................................................................. 9 DAFTAR PUSTAKA............................................................................................................. 9 LAMPIRAN ........................................................................................................................ 11
v
DAFTAR TABEL Halaman 1 2 3 4 5 6
Nama dan deskripsi atribut tabel tempfact_indeksprestasi.................................................... 5 Nama dan deskripsi atribut tabel tempfact_mkmutu ............................................................ 5 Nama dan deskripsi atribut tabel tempfact_minor ................................................................ 6 Nama dan deskripsi atribut tabel tempfact_ip ...................................................................... 6 Nama dan deskripsi dimensi dari kubus mata kuliah mutu ................................................... 6 Nama dan deskripsi dimensi dari kubus indeks prestasi ....................................................... 6
DAFTAR GAMBAR Halaman 1 Arsitektur data warehouse (Malinowski & Zim’anyi 2008). ................................................ 2 2 Kubus awal (Malinowski & Zim’anyi 2008). ...................................................................... 2 3 Roll up pada level Negara (Malinowski & Zim’anyi 2008). ................................................. 3 4 Drill down pada level bulan (Malinowski & Zim’anyi 2008). ............................................. 3 5 Pivot (Malinowski & Zim’anyi 2008). ................................................................................ 3 6 Slice (Malinowski & Zim’anyi 2008). ................................................................................. 3 7 Dice (Malinowski & Zim’anyi 2008). ................................................................................. 3 8 Metode penelitian. .............................................................................................................. 5 9 Skema galaksi dengan tiga tabel fakta (Sulistyaningsih 2010). ............................................. 7 10 Skema galaksi dengan dua tabel fakta. .............................................................................. 7 11 Minor Favorit Chart ......................................................................................................... 9
DAFTAR LAMPIRAN Halaman 1 2 3 4 5 6 7 8 9
Tampilan I Aplikasi .......................................................................................................... 12 Tampilan II Aplikasi......................................................................................................... 12 Tampilan III OLAP Indeks Prestasi berdasarkan mutu....................................................... 12 Tampilan IV OLAP Indeks Prestasi berdasarkan status studi ............................................. 12 Operasi Drill down di Linux ............................................................................................. 12 Operasi Dice di Linux....................................................................................................... 12 Operasi Drill Down di Windows (Sulistyaningsih 2010) .................................................... 12 Operasi Dice di Windows (Sulistyaningsih 2010) .............................................................. 12 Operasi drill down pada rataan IP, IPK, dan sebaran minor................................................ 12
vi
PENDAHULUAN Latar Belakang Kurikulum Berbasis Kompetensi dengan sistem mayor-minor memiliki tujuan untuk menjamin fleksibilitas guna meningkatkan kompetensi dan softskill lulusan terbaik. Pada sistem ini mahasiswa memiliki kompetensi utama (mayor) dan kompetensi pelengkap (minor). Kurikulum sistem mayor-minor adalah kurikulum berbasis kompetensi di mana setiap mahasiswa mengikuti pendidikan dalam salah satu mayor sebagai bidang keahlian (kompetensi) utama dan dapat mengikuti pendidikan dalam salah satu bidang minor sebagai sebagai bidang (kompetensi) pelengkap. Untuk memantau dan menganalisis lebih lanjut perkembangan prestasi mahasiswa, maka Sulistyaningsih (2010) melakukan penelitian dengan judul Pembangunan Data Warehouse Akademik (Studi Kasus : Kurikulum Mayor-minor Program Sarjana Departemen Ilmu Komputer IPB). Penelitian ini menghasilkan data warehouse mayorminor Mahasiswa Ilmu Komputer dengan tiga tabel fakta yaitu indeks prestasi, mata kuliah mutu, dan sebaran minor. Dalam data warehouse yang telah dikembangkan Sulistyaningsih (2010) tidak dapat menampilkan rataan IP dan IPK mahasiswa berdasarkan minor yang diambil. Hal ini karena adanya pemisahan tabel fakta antara indeks prestasi dengan sebaran minor. Oleh karena itu perlu dibangun data warehouse yang mengintegrasikan antara mata kuliah minor yang diambil dengan rataan IP maupun IPK. Tujuan Tujuan dari penelitian ini adalah memperbarui data warehouse untuk data akademik mayor-minor Program Studi Ilmu Komputer yang berbasis pada sistem operasi Linux. Ruang Lingkup Ruang lingkup penelitian ini difokuskan pada perbaikan skema data warehouse data akademik mayor-minor Program Studi Ilmu Komputer IPB tahun masuk 2005 sampai 2009. Sistem dikembangkan dengan menggunakan Ubuntu 10.04 sebagai sistem operasi dan Mondrian 3.2.0 sebagai OLAP server.
Manfaat Penelitian Penelitian ini diharapkan dapat memberikan manfaat bagi pihak-pihak terkait di IPB dalam memberikan informasi yang cepat dan menarik. Selain itu juga dapat mempermudah analisis data dan membantu dalam proses pengambilan keputusan. TINJAUAN PUSTAKA Data Warehouse Data warehouse adalah koleksi data yang berorientasi subjek, terintegrasi, nonvolatile, dan time-variant dalam mendukung proses pengambilan keputusan. (Malinowski & Zim’anyi 2008). Karakteristik data warehouse adalah : Berorientasi subjek Data warehouse terpusat pada kebutuhan analisis data yang bervariasi pada tiap level untuk menentukan keputusan dengan berorientasi pada subjek. Subjek sangat ditentukan pada aktivitas organisasi, contohnya analisis penjualan, produk, dan konsumen. Terintegrasi Data dibangun dengan mengintegrasikan berbagai sumber data yang berbeda-beda yaitu tipe data, synonyms (field yang berbeda tapi datanya sama), homonyms (field dengan nama yang sama tapi data yang berbeda), keseragaman data, dan masalah yang lainnya. Non-volatile Data bertahan lama karena tidak dilakukan modifikasi ataupun dikurangi. Dapat dikatakan bahwa data tidak dapat diubah secara real time. Time-variant Data pada suatu waktu dapat dipertahankan dengan rentang waktu tertentu. Arsitektur Data Warehouse Arsitektur data warehouse dapat dilihat pada Gambar 1.
1
Gambar 1 Arsitektur data warehouse (Malinowski & Zim’anyi 2008). Keuntungan yang didapat jika menggunakan data warehouse antara lain (Bouman & Dongen 2009) :
Semua informasi sudah terdapat dalam satu tempat. Informasi yang update. Akses yang cepat. Tidak ada batas ukuran. Tersedia semua data history. Mudah dimengerti. Memiliki standar data.
tampilan data, dan didukung dengan representasi data grafik yang dinamis. Beberapa operasi OLAP menurut Malinowski & Zim’anyi (2008) dengan menggunakan kubus awal (Gambar 2) yaitu :
Data warehouse memberikan ringkasan data operasional yang sederhana dan mudah dipahami melakukan analisis untuk membuat keputusan. Operasi-operasi pada OLAP Online Analitycal Processing (OLAP) terdiri atas seperangkat tool untuk membantu proses analisis dan perbandingan data dalam database. Tool dan metode OLAP membantu pengguna menganalisis data pada sebuah data warehouse dengan menyediakan berbagai
Gambar 2
Kubus awal (Malinowski & Zim’anyi 2008).
2
1. Roll up (drill-up) : ringkasan data, yaitu dengan menaikkan hirarki atau mengurangi dimensi (Gambar 3).
Gambar 5 Pivot (Malinowski & Zim’anyi 2008).
Gambar 3
Roll up pada level Negara (Malinowski & Zim’anyi 2008).
4. Slice and dice : slice adalah pemilihan data satu dimensi dari kubus data yang bersangkutan (Gambar 6) dan dice mendefinisikan subcube dengan memilih dua dimensi atau lebih (Gambar 7).
2. Drill down (roll down) : kebalikan dari roll-up, yaitu melihat data secara lebih detail atau spesifik dari level tinggi ke level rendah (Gambar 4).
Gambar 6 Slice (Malinowski & Zim’anyi 2008).
Gambar 4 Drill down pada level bulan (Malinowski & Zim’anyi 2008). 3. Pivot (rotate) : memvisualisasikan operasi yang merotasikan sumbu data dalam view sebagai alternatif dalam presentasi data (Gambar 5). Gambar 7 Dice (Malinowski & Zim’anyi 2008).
3
5. Operasi lain : drill across yaitu operasi yang melibatkan lebih dari satu kubus, drill through yaitu operasi yang mengijinkan pengguna untuk dapat melihat tabel data yang menampilkan nilai-nilai pada suatu sel data. Metode Pengembangan Data Warehouse Pengembangan data warehouse yang ditujukan untuk menganalisis data dilakukan dengan mengikuti beberapa fase desain yaitu spesifikasi kebutuhan, desain konseptual, desain logis, dan desain fisik. Dua fase pertama merupakan fase yang sangat penting karena mempengaruhi persetujuan pengguna terhadap sistem yang dibuat. Dua tahap tersebut menentukan hubunga antara duania nyata (kebutuhan pengguna) dan dunia software (sistem yang digunakan). (Malinowski & Zim’anyi 2008). Fase selanjutnya, yaitu desain logis dan fisik yang lebih mengacu pada tahapan teknis yang dilakukan berurutan untuk merepresentasikan skema desain konseptual untuk mengimplementasikannya ke dalam data warehouse. (Malinowski & Zim’anyi 2008). METODE PENELITIAN Analisis Pada tahap ini dilakukan analisis untuk mengetahui karakteristik dari masing-masing data yang diketahui sehingga memudahkan dalam menentukan desain data warehouse yang akan dirancang. Desain Pada tahap desain, terdapat empat fase yaitu : Spesifikasi kebutuhan : mengumpulkan informasi yang dibutuhkan pengguna dalam data warehouse. Desain konseptual : bertujuan untuk membangun representasi yang berorientasi pada pengguna. Hal ini dilakukan untuk mengidentifikasi hubungan atribut-atribut dalam data warehuse. Desain logikal : bertujuan untuk menerjemahkan representasi konseptual database dari tahap sebelumnya ke implementasi tertentu untuk beberapa DBMS.
Desain fisik : representasi logis dari database yang diperoleh dalam tahap sebelumnya untuk implementasi pada DBMS tertentu, dalam penelitian ini adalah PostgreSQL. Untuk mengelola aplikasi ini, administrator memiliki akses langsung ke sistem manajemen database PostgreSQL di mana data akademik disimpan. Dosen sebagai pengguna biasa dapat berinteraksi dengan grafis berbasis web sehingga dapat memanfaatkan fasilitas sistem dengan mudah, antara lain : memilih dimensi atau atribut melalui kotak drop-down list. menampilkan data dalam bentuk tabel pivot. menampilkan data dalam bentuk grafik batang, garis, dan lingkaran. mencetak laporan dalam format Excel maupun pdf Dari aplikasi ini, diharapkan dapat diberikan beberapa informasi antara lain : perkembangan jumlah mahasiswa per tahun. perkembangan huruf mutu mata kuliah tertentu untuk mengetahui rata-rata kemampuan mahasiswa Ilmu Komputer sesuai dengan jumlah bidang yang terdapat di Departemen Ilmu Komputer. perkembangan indeks prestasi tiap angkatan berdasarkan status studi. perkembangan indeks prestasi tiap angkatan berdasarkan minor yang diambil. rata-rata lama studi untuk mahasiswa angkatan 2005. rata-rata IP dan IPK tiap angkatan. persebaran minor yang banyak dipilih oleh mahasiswa Ilmu Komputer berdasarkan rataan IP dan IPK. Pemuatan Data Pada tahap ini, data telah siap untuk dimuat (load) ke dalam data warehouse. Tahap pemuatan bertujuan untuk memuat data yang terseleksi ke dalam data warehouse tujuan dan membuat indeks yang diperlukan. Pembuatan Data Warehouse Tahap ketiga yang dilakukan pada penelitian ini adalah membuat data warehouse dengan menggunakan data akademik departemen mayor-minor Ilmu Komputer mulai tahun 2005 sampai tahun 2009.
4
Uji Query Tahap ini dilakukan setelah pembuatan data warehouse selesai. Pengujian ini dilakukan untuk melihat apakah operasi dasar OLAP berhasil diimplementasikan dan sesuai dengan informasi yang ditampilkan. Pengujian dilakukan dengan memvisualisasikan kubus data dengan grafik dan tabel jpivot. Secara singkat metode penelitian dapat dilihat pada Gambar 8.
agregasi dan tempat penyimpanan struktur dan data kubus data multidimensi) Schema Workbench (tempat pembuatan / pemodelan struktur kubus data dan proses pemuatan data dari data warehouse ke kubus data) Web Server Apache Tomcat Web browser Mozilla Firefox 3.0.1. HASIL DAN PEMBAHASAN Analisis Data Pada penelitian ini, sumber data diperoleh dengan format .csv. Proses analisis dilakukan terhadap data untuk mengevaluasi atributatribut untuk membangun data warehouse. Data yang digunakan antara lain : tiga tabel fakta (tempfact_indeksprestasi, tempfact_mkmutu, dan tempfact_minor) pada Tabel 1, Tabel 2, dan Tabel 3 serta tujuh tabel dimensi (waktu, angkatan, minor, matakuliah, mutu, statusstudi, dan jeniskelamin). Fakta terdiri atas foreign key dari tabel dimensi ukuran : jumlah mahasiswa, rataan ip, rataan ipk, dan sebaran minor.
Tabel 1
Nama dan deskripsi atribut tabel tempfact_indeksprestasi
Nama Atribut id_mhs
Kode mahasiswa sebagai penciri tiap mahasiswa
id_jk
Kode jenis mahasiswa
th_akademik
Tahun akademik dari tiap semester
kode_statusstudi
Kode yang menunjukkan status studi mahasiswa berdasarkan IPK yang diperoleh tiap semester
ip
Nilai IP per semester
ipk
Nilai IPK
Gambar 8 Metode penelitian. Lingkungan Pengembangan Aplikasi dibangun dengan menggunakan perangkat sebagai berikut: Perangkat keras berupa komputer personal dengan spesifikasi: Prosesor Intel(R) Core(TM) 2 Duo CPU @2.20 (2 CPUs) GHz Memori 4 GB RAM Harddisk 160 GB Monitor 13.1” dengan resolusi 1024 × 768 pixel Mouse dan Keyboard Perangkat lunak: Sistem Operasi Linux Ubuntu 10.04 Desktop PostgreSQL 8.4.2 (perangkat lunak DBMS untuk pemrosesan data dan pembuatan skema data warehouse) Mondrian Server 3.2.0 (berfungsi sebagai OLAP server yang melakukan fungsi
Deskripsi
Tabel 2
kelamin
Nama dan deskripsi atribut tabel tempfact_mkmutu
Nama Atribut
Deskripsi
id_mhs
Kode mahasiswa sebagai penciri tiap mahasiswa
id_jk
Kode jenis mahasiswa
kelamin
5
Nama Atribut
Deskripsi
th_akademik
Tahun akademik dari semester
kode_mk
Kode mata diambil
mutu
Huruf mutu
Tabel 3
kuliah
tiap yang
Nama dan deskripsi atribut tabel tempfact_minor
Nama Atribut
Deskripsi
id_mhs
Kode mahasiswa sebagai penciri tiap mahasiswa
id_jk
Kode jenis mahasiswa
th_akademik
Tahun akademik dari tiap semester
kode_minor
Kode minor dari tiap-tiap departemen
kelamin
Tabel 5
Selanjutnya dibuat skema model data multidimensi untuk data warehouse yang berasal dari skema Gambar 9 hingga menghasilkan skema baru yaitu skema pada Gambar 10. Namun sebelum data dibuat skemanya, tabel fakta tempfact_indeksprestasi dan tempfact_minor dilakukan penggabungan data dengan atribut kode_minor sehingga menjadi tabel fakta yang baru yaitu tempfact_ip, terlihat pada Tabel 4. Tabel 4
Nama dan deskripsi atribut tabel tempfact_ip
Nama Atribut
Pemuatan Data Data warehouse yang sudah dibuat selesai dibuat, selanjutnya dimasukkan ke kubus data OLAP server Mondrian. Kemudian, skema data warehouse dimodelkan dengan menentukan dimensi-dimensi, elemen-elemen dari dimensi, ukuran-ukuran, dan kubus data. Kubus data yang dibuat yaitu, kubus mata kuliah mutu dan kubus indeks prestasi. Kubus data mata kuliah mutu dibuat untuk tabel fakta tempfact_mkmutu. Kubus data indeks prestasi dibuat untuk tabel fakta tempfact_ip. Ukuran pada struktur Mondrian dimasukkan dalam struktur dimensi tabel fakta yang tidak mempunyai id_key. Nama dan deskripsi dari kubus data dapat dilihat pada Tabel 5 dan Tabel 6.
Deskripsi
id_mhs
Kode mahasiswa sebagai penciri tiap mahasiswa
id_jk
Kode jenis mahasiswa
th_akademik
Tahun akademik dari tiap semester
kode_statusstudi
Kode yang menunjukkan status studi mahasiswa berdasarkan IPK yang diperoleh tiap semester
kode_minor
Kode minor dari tiap-tiap departemen
Ip
Nilai IP per semester
Ipk
Nilai IPK
kelamin
Nama dan deskripsi dimensi dari kubus mata kuliah mutu
Nama Dimensi
Deskripsi
waktu
Tahun akademik semester
jenis kelamin
Jenis kelamin mahasiswa
angkatan
Angkatan masuk IPB
mata kuliah
Mata kuliah
mutu
Nilai mutu
ukuran mata kuliah mutu
Nama-nama ukuran (jumlah mahasiswa)
Tabel 6
dan
Nama dan deskripsi dimensi dari kubus indeks prestasi
Nama Dimensi
Deskripsi
waktu
Tahun akademik semester
jenis kelamin
Jenis kelamin mahasiswa
angkatan
Angkatan masuk IPB
status studi
Status studi mahasiswa
minor
Status studi mahasiswa
ukuran prestasi
indeks
dan
minor
Nama-nama ukuran (jumlah mahasiswa, rataan ip, rataan ipk, jumlah mahasiswa yang mengambil minor tertentu)
6
Gambar 9 Skema galaksi dengan tiga tabel fakta (Sulistyaningsih 2010).
Gambar 10 Skema galaksi dengan dua tabel fakta.
7
Eksplorasi dan Presentasi Hasil Hasil penelitian ini ditunjukkan pada Lampiran 1 berupa tampilan awal web yang berisi penjelasan penelitian data warehouse. Lampiran 2 yang menjelaskan tentang Ilmu Komputer di IPB. Lampiran 3 menampilkan OLAP indeks prestasi berdasarkan mutu, serta Lampiran 4 OLAP indeks prestasi berdasarkan status studi. Penelitian ini menggunakan sistem operasi Linux yaitu Ubuntu 10.04 dan eksplorasi data yang dilakukan dengan operasi OLAP untuk menghasilkan beberapa informasi yang diinginkan. Dalam hal ini operasi OLAP untuk kubus indeks prestasi. 1. Pengoperasian Linux
Data
Warehouse
di
Perbedaan instalasi Linux Langkah instalasi data warehouse pada Linux lebih sering menggunakan CLI (Command Line Interface) yang lebih dikenal dengan nama Terminal. Contoh : Perintah untuk update paket instalasi java jdk dan jre > sudo apt-get install sun-java6-jdk sun-java6-jre Windows Cara instalasi di Windows dengan menggunakan file .exe yang hanya mengikuti langkah-langkah yang sudah dalam bentuk GUI (Graphic User Interface). Cara menjalankan dan akses file Linux Pada saat pemuatan data file .csv yang dilakukan dalam postgresql file folder yang akan digunakan untuk pemuatan data harus memiliki ijin akses folder sehingga harus dikonversi dengan perintah chmod. Setelah data dapat dimuat dalam postgresql, maka dibuat desain kubus data menggunakan skema workbench. Kemudian data kubus dapat direpresentasikan ke Mondrian. Berikut adalah cara menjalankan skema workbench dan Mondrian dalam paket Pentaho. > sudo sh workbench.sh > sudo sh start-pentaho.sh
Windows Pada Windows, cara menjalankan Mondrian yaitu dengan start-pentaho.bat pada folder Pentaho yang telah diinstal. Perbandingan Operasi data Linux Dengan operasi drill down (Lampiran 5) data yang dapat ditampilkan yaitu nilai rataan IP, IPK, sebaran minor, dan jumlah mahasiswa berdasarkan status studi. Tidak hanya itu, untuk operasi slice (Lampiran 6) data juga dapat menampilkan nilai rataan IP, IPK, sebaran minor, dan jumlah mahasiswa berdasarkan status studi, minor yang diambil, dan angkatan. Windows Pada aplikasi di Windows, operasi drill down yang dapat ditampilkan (Lampiran 7) yaitu nilai rataan IP, IPK, dan jumlah mahasiswa berdasarkan status studi. Jadi data warehouse tidak dapat menampilkan nilai sebaran minornya. Selain itu untuk operasi slice (Lampiran 8) data yang dapat ditampilkan adalah nilai rataan IP, IPK, dan jumlah mahasiswa berdasarkan status studi dan angkatan.
2. Kubus Indeks Prestasi Pada kubus ini dapat dilihat beberapa operasi OLAP misalnya operasi drill down pada rataan IP , IPK, dan sebaran minor pada tiap mata kuliah minor. (Lampiran 9) merupakan tabel hasil operasi drill down pada rataan IP , IPK, dan sebaran minor pada tiap mata kuliah minor. Lampiran 9 menunjukkan rata-rata IP, IPK, dan sebaran minor pada tiap mata kuliah minor dengan status studi tanpa syarat. Ratarata IP dan IPK tersebut dihitung berdasarkan semester yang telah dilalui dan minor yang diambil. Tidak hanya itu, terdapat beberapa fakta menarik pula berdasarkan jumlah sebaran minor yaitu pada minor Riset Operasi untuk IPK lebih dari 3,51 peminatnya dari tahun ke tahun tetap, kecuali pada tahun 2008. Dengan demikian minor yang diambil oleh mahasiswa yang memiliki nilai IPK lebih dari 3,51 yaitu Riset Operasi dengan nilai rataan IP dan IPK tertinggi pada tahun 2008.
8
Salah satu faktor yang menyebabkan nilai rataan IP dan IPK tahun 2008 tinggi adalah hanya satu mahasiswa yang mengambil minor pada status studi untuk rataan IPK lebih dari 3,51. Penurunan jumlah mahasiswa yang memiliki nilai rataan IPK lebih dari 3,51 pada tahun 2008 sepatutnya mendapat perhatian dari departemen untuk meningkatkan potensi dan semangat mahasiswa sejak awal perkuliahan. Untuk IPK antara 2,76 sampai dengan 3,51, minor yang paling banyak diambil adalah Manajemen Fungsional, Riset Operasi, dan SC. Manajemen Fungsional sendiri peminatnya tetap dari tahun ke tahun, sedangkan untuk Riset Operasi dan SC menurun. Rataan nilai IP dan IPK tertinggi pada status studi IPK antara 2,76 sampai dengan 3,51 adalah Perkembangan Anak pada tahun 2005 dan Statistika Industri pada tahun 2006. Untuk minor pada nilai IPK antara 2,00 sampai dengan 2,76 yaitu SC yang mengalami peningkatan pada tahun 2006. Dengan nilai rataan IP tertinggi diperoleh minor Riset Operasi dan rataan IPK tertinggi adalah Manajemen Industri. Dari beberapa analisis di atas dapat disimpulkan bahwa beberapa minor favorit pilihan mahasiswa berdasarkan jumlah sebaran mahasiswa dengan rataan nilai IPK dari 2,00 sampai 3,51 adalah SC, Manajemen Fungsional, dan Riset Operasi. Hal ini dapat diasumsikan bahwa dengan mengambil minor Riset Operasi nilai yang didapat akan tinggi, dengan banyaknya mahasiswa pandai (IPK lebih dari 3,51) yang mengambil mata kuliah ini (Gambar 11).
IPK berdasarkan maupun TPB.
jenis
kelamin,
mayor,
KESIMPULAN DAN SARAN Kesimpulan Hasil penelitian menyimpulkan bahwa, pembangunan data warehouse dan OLAP berbasis web data akademik Ilmu Komputer menghasilkan dua kubus data, yaitu kubus data mata kuliah mutu dan indeks prestasi. Dua kubus data tersebut dapat divisualisasikan dalam tiga jenis tampilan, yaitu tampilan grafik batang, grafik garis dan pie chart dengan menggunakan OLAP Mondrian 3.2.0. Selain itu kubus data juga dapat dicetak dalam bentuk pdf dan excel. Operasi OLAP yang dilakukan pada kubus data ini adalah roll-up (misalnya mencari pola sebaran perkembangan huruf mutu mata kuliah mayor, interdepartemen, pilihan, dan elektif pada setiap angkatan.), drill-down (Rataan IP dan Rataan IPK berdasarkan jenis kelamin, minor dan tahun akademik), dice (misalnya untuk melihat jumlah mahasiswa yang mengambil minor riset operasi), dan slice (jumlah mahasiswa yang drop out tiap angkatan berdasarkan jenis kelamin). Hasil dari penelitian ini dapat memberikan manfaat bagi Departemen Ilmu Komputer dalam mempermudah analisis data akademik ukuran besar sehingga dapat membantu dalam pengaksesan data tersebut, penyampaian informasi, pembuatan laporan dan pembuatan keputusan yang lebih baik. Saran Saran untuk penelitian data warehousing dan OLAP selanjutnya adalah: 1.
membangun modul program untuk pemasukan data baru yang nantinya diintegrasikan ke dalam aplikasi OLAP.
2.
menambah ukuran lama studi agar dapat diketahui rata-rata lama studi pada kurikulum mayor-minor. DAFTAR PUSTAKA
Malinowski E, Zim´anyi E. 2008. Advanced Data Warehouse Design. Heidelberg: Springer. Gambar 11 Minor Favorit Chart. Selain itu, kubus ini juga dapat menunjukkan informasi tentang rataan IP dan
Bouman R, Dongen J.V. 2009. Pentaho Solution. Canada: Wiley.
9
Sulistyaningsih, W. 2010. Pembangunan Data Warehouse Akademik (Studi Kasus : Kurikulum Mayor-minor Program Sarjana Departemen Ilmu Komputer IPB). [Skripsi]. Bogor : Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor.
10
LAMPIRAN
Lampiran 1 Tampilan I Aplikasi
Lampiran 2 Tampilan II Aplikasi
12
Lampiran 3 Tampilan III OLAP Indeks Prestasi berdasarkan mutu
Lampiran 4 Tampilan IV OLAP Indeks Prestasi berdasarkan status studi
13
Lampiran 5 Operasi Drill down di Linux
Lampiran 6 Operasi Dice di Linux
14
Lampiran 7 Operasi Drill Down di Windows (Sulistyaningsih 2010)
Lampiran 8 Operasi Dice di Windows (Sulistyaningsih 2010)
15
Lampiran 9 Operasi drill down pada rataan IP, IPK, dan sebaran minor pada tiap mata kuliah minor
16