5
4 Web server mengakses kubus data Palo server melalui Palo PHP API. Aplikasi OLAP menggunakan library JpGraph untuk menampilkan grafik.
Grafik
Line Plot
Lapis atas: Web browser
Crosstab
Web Server package WAMPP versi 2.0
Laptop PC
Bahasa Pemrograman PHP 5.1.2
JpGraph
JpGraph
Palo API
1.20 (library menghasilkan grafik)
Palo OLAP server
Apache PHP Web server
MsSQL Server Data Warehouse
Lapis bawah: Data Warehouse DBMS
Palo Excel Add-In
MDB
Web browser Mozilla Firefox 3.0
Pada penelitian ini, data diperoleh dengan format Access (.mdb). Proses analisis dilakukan terhadap data untuk mendapatkan atribut-atribut yang tepat untuk membangun data warehouse. MDB
Gambar 3 Arsitektur aplikasi OLAP berbasis web (Sumber: diadopsi dari Herlambang 2007). Lingkungan Pengembangan Aplikasi OLAP berbasis web ini dibangun dengan menggunakan perangkat sebagai berikut: Perangkat keras berupa komputer personal dengan spesifikasi : Prosessor AMD Sempron 2500 + 1.4 GHz Memori 512 MB DDR RAM Harddisk 80 GB Monitor 15” dengan resolusi 1024 × 768
Data yang digunakan adalah data KRS mahasiswa (krs), data KRS mata kuliah (krsmk), dan data mahasiswa (mhs). Ketiga kelompok data tersebut dipilih karena sudah memenuhi beberapa kriteria dari informasi yang ingin ditampilkan. Tabel KRS mahasiswa berisi isian KRS mahasiswa tiap semester sedangkan tabel data KRS mata kuliah berisi perolehan nilai pada mata kuliah yang diambil tiap semester. Pada tabel mahasiswa berisi keterangan dari data mahasiswa yang masuk ke Program Studi S1 Ilmu Komputer. Dari tabeltabel itu, kemudian dipilih atribut-atribut yang akan digunakan untuk membuat data warehouse. Atribut yang akan digunakan berdasarkan ketentuan sebagai berikut: 1 Atribut yang dianalisis
dipilih
menarik
dipilih untuk
2 Atribut tersebut berkaitan dengan atribut di tabel data yang lain
Mouse dan Keyboard yang
untuk
Analisis Data
Data sumber
MDB
PHP
HASIL DAN PEMBAHASAN
Praproses data
Perangkat lunak membuat sistem:
Palo Server 2.0 (berfungsi sebagai OLAP server yang melakukan fungsi agregasi dan tempat penyimpanan struktur dan kubus data multidimensi) Palo Excel Add-In 2.0 (tempat pembuatan atau pemodelan struktur kubus data dan proses pemuatan data dari data warehouse ke kubus data)
Presentasi OLAP
Lapis tengah: Web server OLAP server
Microsoft SQL Server 2000 (perangkat lunak bantu untuk pemrosesan data dan pembuatan skema data warehouse)
dibutuhkan
untuk
Sistem Operasi Microsoft Windows XP Professional SP2
3 Data yang dianalisis tidak terlalu banyak mengandung nilai null Setelah pemilihan atribut, maka langkah selanjutnya adalah menentukan atribut-atribut yang menjadi ukuran (measure) dan non ukuran
6
(non-measure). Hasil analisis data ditentukan dua tabel fakta (MataKuliah_Mutu dan IndexPrestasi) dan enam dimensi (Waktu, Angkatan, JenisKelamin, MataKuliah, Mutu, dan StatusStudi). Fakta terdiri dari foreign key dari tabel dimensi, ukuran jumlah mahasiswa, rataan IP, dan rataan IPK. Selanjutnya dibuat skema model data multidimensi untuk data warehouse yang dapat dilihat pada Gambar 4.
Sedangkan tabel baru tempfakta2 merupakan hasil integrasi dan reduksi dari proses query tabel krs dan mhs. Nama dan deskripsi atribut dari tabel-tabel tersebut dapat dilihat pada Tabel 1 dan Tabel 2. Tabel 1 Nama dan deskripsi atribut tabel tempfakta1 hasil integrasi dan reduksi Nama Atribut
Integrasi dan Reduksi Data Proses integrasi diawali dengan mengkonversi seluruh data sumber dengan format Access (.mdb) menjadi format Microsoft SQL server (.mdf). Selanjutnya dilakukan penggabungan atribut-atribut yang menarik dari tabel-tabel yang dianalisis menjadi satu tabel besar untuk dijadikan tabel fakta. Penggabungan yang pertama adalah menggabungkan tabel data KRS mahasiswa (krs) dengan tabel KRS mata kuliah (krsmk) dan tabel mahasiswa (mhs). Penggabungan yang kedua adalah menggabungkan tabel KRS mahasiswa (krs) dengan tabel mahasiswa (mhs).
Deskripsi
nokrs
nomor KRS-tahun akademik- semester
nrp
nomor registrasi pokok mahasiswa
sex
kode jenis kelamin
kodemk
kode matakuliah
mutu
huruf mutu
Tabel 2 Nama dan deskripsi atribut tabel tempfakta2 hasil integrasi dan reduksi
Reduksi data dilakukan dengan membuang atribut-atribut yang tidak terpilih berdasarkan hasil analisis data dan menyeleksi data dengan hanya mengambil mahasiswa Ilmu Komputer. Nilai atribut yang redundan dalam tabel-tabel sumber tidak disertakan dalam proses selanjutnya.
Nama Atribut
Proses integrasi dan reduksi data membentuk tabel baru, yaitu tabel tempfakta1 dan tempfakta2. Tabel baru tempfakta1 merupakan hasil integrasi dan reduksi dari proses query tabel krs, krsmk, dan mhs.
Deskripsi
nokrs
Nomor KRS - tahun akademik - semester
nrp
nomor registrasi pokok mahasiswa
sex
kode jenis kelamin
IP
nilai IP
IPK
nilai IPK
Waktu PK
MataKuliah PK
id_mk namamk kriteria
Mutu PK
id_mutu
id_waktu thakademik semester
MataKuliah_Mutu
IndexPrestasi StatusStudi
FK1 FK2 FK3 FK4 FK5
id_waktu id_angkt id_jk id_mk id_mutu jml_mhs
Angkatan PK
id_angkt angkatan
kategori_mutu
FK1 FK2 FK3 FK4
id_waktu id_angkt id_jk id_status jml_mhs RataanIP RataanIPK
PK
JenisKelamin PK
id_jk jeniskelamin
Gambar 4 Skema galaksi dengan tabel fakta MataKuliah_Mutu dan IndexPrestasi.
id_status kelasIPK statusstudi
7
Pembersihan Data Proses pembersihan data dilakukan dengan mengidentifikasi data yang kosong (null), mengandung noise, dan tidak konsisten karena proses pengentrian data sumber maupun akibat proses integrasi data. Dalam pembersihan data terdapat beberapa nilai yang kosong (null). Nilai kosong pada atribut IP dan IPK di-update menjadi nilai rataan. Pada atribut mutu, nilai huruf mutu yang bernilai null di-update menjadi nilai „BM‟ (Belum Masuk) dan huruf mutu F dan T di-update menjadi nilai „E‟. Dalam atribut nokrs dilakukan penghapusan terhadap nilai atribut nokrs untuk tahun akademik „0708‟, karena tahun akademik tersebut masih banyak nilai yang belum masuk sehingga bernilai null. Sedangkan noise pada tabel krsmk dengan atribut nama mata kuliah (namamk) di-update dengan menyeragamkan nilai dari atributnya. Penyeragaman nilai dilakukan dengan mengambil jumlah yang lebih dominan muncul dari nama tersebut. Hal itu dilakukan untuk menjaga konsistensi data, karena dalam data sumber terdapat satu kode mata kuliah yang mempunyai dua nama mata kuliah yang berbeda. Selain itu pembersihan data terhadap data yang tidak konsisten juga dilakukan pada atribut nokrs. Pada atribut ini dilakukan penghapusan data terhadap nokrs yang tidak sesuai antara kode tahun di nokrs dan di nrp. Misalnya mahasiswa angkatan 2001 dengan nokrs xxx-0102-1, yang berarti bahwa mahasiswa tersebut ada di tahun akademik 2001/2002 semester ganjil, seharusnya setiap angkatan 2001 yang baru masuk IPB hanya mempunyai nokrs TPB yaitu xxx-0102-2. Setelah dilakukan proses pembersihan, tabel tempfakta1 berkurang 369 tuple menjadi 13308 tuple. Sedangkan pada tabel tempfakta2 berkurang 86 tuple menjadi 1684 tuple. Transformasi Data Proses transformasi data meliputi penyeragaman nama atribut, generalisasi, agregasi, dan konstruksi atribut atau dimensi. Proses ini dilakukan dengan berpedoman pada skema data warehouse yang sudah dibuat. Langkah awal transformasi dilakukan dengan mengubah nama atribut dari tabel hasil pembersihan sesuai dengan nama atribut dimensi yang ada pada skema. Data untuk atribut nokrs dari tabel tempfakta1 digeneralisasi dengan mengubah nilainya menjadi tahun akademik dan semester dengan mengambil enam digit akhir dari nokrs. Atribut nrp dari tabel tempfakta2 digeneralisasi menjadi
kode tahun masuk IPB dengan mengambil 5 digit belakang, kemudian dari digit tersebut diambil 2 digit awal. Misalnya: nrp=‟G64104008‟ „04008‟ „04‟. Proses transformasi juga dilakukan dengan mengkonstruksi atribut baru menggunakan data dari atribut yang sudah ada. Data dari atribut IPK digunakan untuk mengkonstruksi atribut status dengan mengelompokkan range nilai IPK tertentu ke dalam status tertentu. Misalnya: range nilai IPK dari 2,76 - 3,50 memiliki status tanpa syarat. Hasil transformasi dimasukkan ke dalam tabel baru, tabel tempfakta1 menjadi tabel fakta1 dan tabel tempfakta2 menjadi tabel fakta2. Langkah berikutnya adalah menentukan nilai agregasi atribut-atribut yang menjadi ukuran (measure). Data tabel fakta1 ditentukan nilai agregasinya untuk mendapatkan ukuran jumlah mahasiswa dengan menghitung banyaknya nrp dari mahasiswa dan mengelompokkannya berdasarkan atributatribut yang ada. Kemudian membuat atribut baru untuk menampung ukuran jumlah mahasiswa hasil agregasi. Pada data tabel fakta2 dilakukan agregasi untuk mendapatkan ukuran jumlah mahasiswa, rataan nilai IP dan IPK. OLAP server Palo belum mendukung fungsi agregasi rataan. Oleh karena itu nilai agregasi rataan ditentukan dengan menentukan nilai total dari ukuran, kemudian membaginya dengan ukuran jumlah data. Untuk data atribut rataan IP dan IPK dari tabel fakta2 ditentukan nilai totalnya dan dihitung jumlah mahasiswa, dikelompokkan berdasarkan atribut-atribut nonukuran. Atribut baru dikonstruksi untuk ukuran jumlah mahasiswa. Hasil dari transformasi dengan operasi agregasi ini dipindahkan ke tabel baru yang merupakan tabel fakta data warehouse sesungguhnya. Tabel-tabel fakta tersebut adalah tabel fact_mkmutu yang terdiri dari lima dimensi dan satu ukuran, dan tabel fact_indexprestasi yang terdiri dari empat dimensi dan tiga ukuran. Tahap transformasi terakhir adalah melakukan konstruksi tabel-tabel dimensi. Keenam tabel dimensi tersebut dibuat dengan nama dim_time, dim_mk, dim_mutu, dim_angktn, dim_jk, dan dim_statusstudy. Tabel dimensi Waktu (dim_time) dibuat dari generalisasi kode nokrs, dimana empat digit awal dari enam digit akhir nokrs diidentifikasi sebagai tahun akademik dan satu digit terakhir dari enam digit akhir nokrs diidentifikasi sebagai semester. Tabel dimensi Angkatan (dim_angktn) dibuat dari generalisasi kode NRP, di dalamnya menjelaskan tahun masuk
8
mahasiswa ke IPB. Adapun model hierarki dari dimensi-dimensi tersebut dapat dilihat setiap Lampiran 1 dan data dalam tabel dimensi dapat dilihat setiap Lampiran 2. Pemuatan Data Data warehouse yang sudah dibuat selesai dibuat, selanjutnya di-load ke kubus data OLAP server Palo. Kemudian, skema data warehouse dimodelkan dengan menentukan dimensidimensi, elemen-elemen dari dimensi, ukuranukuran, dan kubus data. Kubus data yang dibuat yaitu, kubus MataKuliah-Mutu dan kubus IndexPrestasi. Kubus data MataKuliah-Mutu dibuat untuk tabel fakta fact_mkmutu sedangkan kubus data IndexPrestasi dibuat untuk tabel fakta fact_indexprestasi. Ukuran pada struktur Palo dimasukkan dalam struktur dimensi tabel fakta yang tidak mempunyai id_key. Selanjutnya data dimuat menggunakan fasilitas Data Import dari Excel Add-In Palo. Nama dan deskripsi dari kubus data dapat dilihat pada Tabel 3 dan Tabel 4. Tabel 3 Nama dan deskripsi dimensi dari kubus MataKuliah-Mutu Nama Dimensi
Deskripsi
Waktu
Tahun akademik dan semester
Angkatan
Angkatan masuk IPB
Jenis Kelamin
Jenis kelamin mahasiswa
Mata Kuliah
Mata kuliah
Mutu
Nilai mutu
Ukuran Matakuliah_Mutu
Nama-nama ukuran (jumlah mahasiswa)
Aplikasi OLAP yang dibuat menyediakan fasilitas-fasilitas berikut : 1 Menu OLAP, dimana pengguna dapat menentukan kubus data, ukuran, dan dimensi-dimensi yang akan ditampilkan untuk dianalisis. 2 Filter dimensi, fungsi ini menyaring dimensi yang ditampilkan pada sumbu x dan sumbu y untuk menampilkan elemen-elemen tertentu dari dimensi. Dimensi lainnya dapat dipilih satu elemen dari tiap-tiap dimensi. 3 Visualisasi Crosstab dan Graph, dimana data hasil operasi OLAP yang dilakukan pengguna dapat ditampilkan ke dalam bentuk crosstab dan/atau grafik. Grafik yang ditampilkan berupa bar plot atau line plot. Eksplorasi dan Presentasi Hasil Ekplorasi data dilakukan dengan menggunakan operasi OLAP untuk menghasilkan beberapa informasi yang diinginkan. Contohnya adalah operasi roll-up untuk melihat dan menganalisis tren perkembangan indeks prestasi mahasiswa Ilmu Komputer pada setiap angkatan. Proses eksplorasi dan operasi ini menggunakan kubus IndexPrestasi yang mempunyai ukuran jumlah mahasiswa, rataan IP, dan rataan IPK. Untuk melihat nilai rataan IPK tiap angkatan, dapat dilakukan pemilihan dari kelas IPK ke status studi yang diinginkan. Hasil perkembangan rataan IPK tiap angkatan dapat dilihat pada Gambar 5.
Tabel 4 Nama dan deskripsi dimensi dari kubus IndexPrestasi Nama Dimensi
Deskripsi
Waktu
Tahun akademik dan semester
Angkatan
Angkatan masuk IPB
Jenis Kelamin
Jenis kelamin mahasiswa
Status Studi
Status studi mahasiswa
Ukuran IndexPrestasi
Nama-nama ukuran (jumlah mahasiswa, rataan IP, rataan IPK)
Gambar 5 Crosstab dengan operasi OLAP roll-up dengan ukuran rataan IPK, dimensi angkatan, dimensi status studi. Selain operasi roll up, dapat dilakukan operasi drill-down untuk melihat jumlah mahasiswa yang mendapatkan nilai mutu A dari semua mata kuliah pilihan. Hasil operasi tersebut dapat dilihat pada Gambar 6 dalam bentuk grafik garis.
9
Gambar 6 Grafik hasil operasi drill-down dimensi mata kuliah pilihan dengan ukuran jumlah mahasiswa, dimensi angkatan, dan dimensi mutu untuk nilai mutu A. Operasi yang dapat dilakukan lainnya adalah mencari pola sebaran perkembangan huruf mutu mata kuliah Basis Data dari tahun akademik 2001/2002 sampai 2006/2007. Grafik pada Gambar 7 merupakan hasil operasi slice dengan peserta mata kuliah Basis Data pada semua angkatan dan tahun akademik. Untuk tahun
akademik 2003/2004 dan 2004/2005 nilai mutu mata kuliah tersebut umumnya B. Sedangkan pada tahun akademik 2005/2006 mahasiswa yang mengambil Basis Data lebih banyak mendapatkan nilai mutu C.
Gambar 7 Grafik hasil operasi slice dengan ukuran jumlah mahasiswa, dimensi mutu, dimensi waktu, dan dimensi mata kuliah untuk Basis Data.
10
Selain itu juga dapat dilihat daftar jumlah mahasiswa pada angkatan dan tahun tertentu dengan kelas IPK yang diinginkan dengan operasi dice. Misalkan akan dilihat jumlah mahasiswa angkatan 2003-2004 pada rentang waktu tahun akademik 2001/2002 sampai 2006/2007 dengan kelas IPK lebih dari 3.51. Hasil operasi tersebut dapat dilihat pada Gambar 8.
Hasil dari penelitian ini dapat memberikan manfaat bagi pengguna di Departemen Ilmu Komputer dalam mempermudah analisis data akademik ukuran besar sehingga dapat membantu dalam pengaksesan data tersebut, penyampaian informasi, pembuatan laporan dan pembuatan keputusan yang lebih baik. Saran Saran untuk penelitian data warehousing dan OLAP selanjutnya adalah: 1 Memperbanyak jumlah data, yaitu dengan melibatkan semua data mahasiswa di setiap tahun akademik untuk masing-masing angkatan yang terdapat di Departemen Ilmu Komputer IPB. Data akademik tersebut lebih mencakup pada kurikulum mayor minor. 2 Dibangun modul program untuk pemasukan data baru yang nantinya diintegrasikan ke dalam aplikasi OLAP.
Gambar 8 Grafik hasil operasi dice dengan ukuran jumlah mahasiswa, dimensi angkatan, dimensi waktu. Dari beberapa contoh eksplorasi yang ditampilkan dalam bentuk grafik, dapat dilihat bentuk kubus data dari operasi OLAP pada Lampiran 3. KESIMPULAN DAN SARAN Kesimpulan Pembangunan data warehouse dan OLAP berbasis web data akademik Ilmu Komputer menghasilkan dua kubus data, yaitu kubus data MataKuliah_Mutu dan IndexPrestasi. Kedua kubus data tersebut dapat divisualisasikan dengan tepat, cepat dan akurat dalam tiga jenis tampilan, yaitu tampilan grafik batang, grafik garis dan pie chart dengan menggunakan OLAP Palo 2.0. Operasi OLAP yang dilakukan pada kubus data ini adalah roll-up (misalnya untuk melihat dan menganalisis tren perkembangan indeks prestasi mahasiswa Ilmu Komputer pada setiap angkatan), drill-down (misalnya untuk melihat jumlah mahasiswa yang mendapatkan nilai mutu A dari semua mata kuliah pilihan), dice (misalnya untuk melihat jumlah mahasiswa angkatan 2003-2004 pada rentang waktu tahun akademik 2001/2002 sampai 2006/2007 dengan kelas IPK lebih dari 3.51), dan slice (misalnya untuk mengetahui perkembangan huruf mutu mata kuliah Basis Data).
3 Dikembangkan operasi-operasi OLAP dalam aplikasi. Operasi dice dan slice lebih disempurnakan, sehingga setiap sumbu dari crosstab dapat diisi lebih dari dua dimensi. Penambahan operasi pivot untuk memutar sumbu. 4 Diintegrasikan dengan aplikasi pendukung untuk menambahkan link menu yang ketika dipilih, langsung menampilkan visualisasi sesuai perintah menu tersebut.