Perancangan Data Warehouse Calon Mahasiswa Baru ………..……………………………………….Nanang Prihatin
PERANCANGAN DATA WAREHOUSE CALON MAHASISWA BARU POLITEKNIK NEGERI LHOKSEUMAWE Nanang Prihatin1 1
Dosen Politeknik Negeri Lhokseumawe ABSTRAK
Bagi sebuah perguruan tinggi, penerimaan calon mahasiswa merupakan kegiatan yang sangat penting. Karena mahasiswa baru merupakan salah satu sumber daya yang menentukan berjalannya sebuah perguruan tinggi. Politeknik Negeri Lhokseumawe, setiap tahunnya selalu menerima calon mahasiswa baru sebagai sumber daya baru untuk menggantikan mahasiswa lama yang sudah lulus. Pada dasarnya data calon mahasiswa baru merupakan data yang sangat penting karena dari data tersebut dapat dilihat trend yang terjadi pada sebuah program studi. Setelah data calon mahasiswa baru selesai diproses maka data calon mahasiswa baru tersebut akan disimpan saja. Perancangan data warehouse calon mahasiswa politeknik negeri lhokseumawe adalah salah satu cara agar data calon mahasiswa yang selama ini hanya disimpan saja bisa dijadikan sebagai sumber data. Karena dengan data calon mahasiswa baru yang lama, pimpinan dapat menganalisa dan dari analisa tersebut dapat diambil sebuah kebijakan atau mengambil keputusan berkaitan dengan penerimaan calon mahasiswa baru untuk tahun berikutnya. Kata kunci : Data warehouse, calon mahasiswa baru, pengambilan keputusan I.
dihasilkan akan lebih bersifat statis sesuai dengan yang telah diberikan oleh aplikasi yang berada pada tingkatan sistem informasi manajemen. Dengan adanya data warehouse, akan mempermudah pembuatan aplikasi-aplikasi Decision Support System dan Executive Information System karena memang kegunaan dari data warehouse adalah khusus untuk membuat suatu database yang dapat digunakan untuk mendukung proses analisa bagi para pengambil keputusan. Perancangan untuk membangun sebuah data warehouse untuk data calon mahasiswa baru Politeknik Negeri Lhokseumawe meliputi kegiatan perancangan data warehouse termasuk di dalamnya perancangan arsitektur, pemodelan data dan hasil implementasi dari data warehouse yang telah dirancang.
PENDAHULUAN
Bagi sebuah perguruan tinggi, calon mahasiswa baru adalah salah satu komponen yang sangat penting. Calon mahasiswa yang akan masuk ke sebuah perguruan tinggi dapat dijadikan salah satu indikator penilaian apakah perguruan tinggi tersebut memiliki peminat yang banyak atau tidak. Jika calon mahasiswa yang mendaftar memiliki sebaran wilayah yang luas dan memiliki peminat yang relatif banyak, maka perguruan tinggi tersebut bisa dikatakan sudah memiliki nama atau terkenal. Data calon mahasiswa baru sangat berguna bagi perguruan tinggi sebagai salah satu media untuk melakukan evaluasi diri. Perguruan tinggi bisa mengambil data tersebut untuk menilai seberapa jauh sebaran dan jumlah calon mahasiswa yang mendaftar. Dengan adanya data calon peserta maka perguruan tinggi dapat melihat berdasarkan atribut daerah atau kota calon mahasiswa, asal sekolahnya, dan program studi yang akan diambil. Data calon mahasiswa dari tahun ke tahun akan terus bertambah seiring dengan jumlah peminat yang mendaftar pada perguruan tinggi tersebut. Data calon mahasiswa tersebut akan membuat ukuran database menjadi semakin besar. Agar tidak membebani sistem pemrosesan transaksi yang ada, pada saatnya data alumni yang lama perlu dipindahkan ke sebuah data warehouse, karena data warehouse memiliki kemampuan untuk melakukan analisa terhadap data transaksi yang telah lalu dan juga bisa memberikan laporan yang bersifat dinamis dan bisa dilihat dari berbagai dimensi. Laporan yang dihasilkan dari proses data warehouse juga mempunyai kemampuan untuk diperinci lebih lanjut ataupun diringkaskan. Tanpa adanya data warehouse, laporan-laporan yang
II.
TINJAUAN PUSTAKA
Data Warehouse Data warehouse adalah koleksi data yang bersifat subject-oriented, terintegrasi, time-variant, dan non-volatile yang digunakan untuk mendukung proses pengambilan keputusan yang strategis untuk perusahaan [2]. Menurut Vidette Poe, data warehouse merupakan database yang bersifat analisis dan read only yang digunakan sebagai fondasi dari sistem penunjang keputusan[3]. Menurut Paul Lane, data warehouse merupakan database relasional yang didesain lebih kepada query dan analisa dari pada proses transaksi, biasanya mengandung history data dari proses transaksi dan bisa juga data dari sumber lainnya[4]. Data warehouse memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan
62
Jurnal Litek (ISSN: 1693-8097) Volume 10 Nomor 1, Maret 2013: hal. 62 - 66 organisasi menggabung/konsolidasi data dari berbagai macam sumber. Data warehouse merupakan salah satu konsep penyediaan solusi ke organisasi, dimana memiliki database yang distrukturkan secara khusus untuk dilakukan proses query dan analisis. Data warehouse umumnya berisi data yang mempresentasikan histori organisasi. Data warehouse memungkinkan pengguna untuk melakukan pemeriksaan terhadap data historis utuk melakukan analisis terhadap data dalam beragam cara dan membuat keputusan yang didasarkan pada hasil analisis.
III.
METODE PENELITIAN
Tahap perancangan adalah merupakan tahap awal yang penting untuk dilakukan dalam pembentukan data warehouse. Di dalamnya meliputi perancangan arsitektur logical maupun fisik dari data warehouse, pemilihan data pada sumber data yaitu data penelitian yang telah ada, dan dilanjutkan dengan pemodelan data dimensional. a. Perancangan Arsitektur Data Warehouse
Gambar 2. Rancangan arsitektur logical dari data calon mahasiswa baru.
Gambar 1. Arsitektur Data Warehouse Untuk pembuatan data warehouse, dilakukan dengan melakukan beberapa langkah yang ada, antara lain [1]: 1. Data extraction Fungsi ini biasanya berhadapan dengan bermacam data source, dan menggunakan teknik yang sesuai dengan setiap data source. Sumber data mungkin berasal dari source machine yang berbeda dalam format data yang berbeda pula. 2. Data transformation Data transformation melibatkan berbagai bentuk dalam mengkombinasikan bagian dari data yang berasal dari sumber yang berbeda. Kombinasi data dilakukan dari sumber record tunggal, atau dapat juga dilakukan dari elemen data yang berelasi dengan banyak sumber record. Proses cleaning mungkin dilakukan dalam data transformation, dimana proses cleaning memiliki fungsi untuk melakukan koreksi terhadap kesalahan pengejaan, atau untuk melakukan eliminasi terhadap duplikat data. 3. Data loading Setelah selesai melakukan desain dan konstruksi dari data warehouse dan aplikasi digunakan untuk pertama kalinya, akan dilakukan pengisian awal data ke dalam media penyimpanan data warehouse. Dalam pengisian awal, dilakukan pemindahan data dalam jumlah yang besar.
Gambar 3. Rancangan arsitektur fisik dari data warehouse calon mahasiswa baru. Pada konfigurasi ini pengguna mengakses data warehouse melalui server aplikasi. Database Olah dan data warehouse berada pada mesin yang sama sehingga proses Ekstraksi, Transformasi dan Loading dilakukan di mesin data warehouse dan tidak mengganggu kerja mesin operasional. b.
Sumber Data
Dalam penelitian ini digunakan data penerimaan mahasiswa baru Politeknik Negeri Lhokseumawe tahun 2009. Sumber data sebelumnya dibuat dalam format Microsoft Access dan sudah dikonversi menjadi file dengan format Ms-Excel. Setelah dianalisa, sumber data yang akan diolah tersebut ternyata memiliki beberapa record masih tidak standar dan memerlukan penyeragaman//cleaning/pembersihan data.
63
Perancangan Data Warehouse Calon Mahasiswa Baru ………..……………………………………….Nanang Prihatin Sumber data penerimaan mahasiswa baru tahun 2009 terdiri dari 1679 record yang terdiri 12 (dua belas) kolom yaitu : Tahun, Nomor Ujian, Pilihan 1, Pilihan 2, Tahun Lulus, Agama, Pendidikan Ayah, Pendidikan Ibu, Gender, Kewarganegaraan, Kabupaten/Kota, dan Propinsi.
Tabel dim_Pend_Ibu Tabel ini berisi data pendidikan terakhir ibu calon mahasiswa Tabel dim_Gender Tabel ini berisi data jenis kelamin calon mahasiswa baru Tabel dim_Warga Tabel ini berisi data tentang status kewarganegaraan calon mahasiswa baru Tabel dim_KabKota Tabel ini berisi data nama kabupaten dan kota asal calon mahasiswa Tabel dim_Propinsi Tabel ini berisi data nama propinsi asal calon mahasiswa
Gambar 4. Sumber data calon mahasiswa baru dengan format ms-excel c.
Pemodelan Data Dimensional
Skema yang digunakan adalah star schema dimana terdapat satu tabel fakta dan beberapa tabel dimensi. Alasannya adalah proses query yang lebih ringan dan memudahkan penjelajahan terhadap data dimensinya, selain itu table dimensinya tidak memerlukan tabel sub dimensi karena tabel dimensinya tidak mengandung ringkasan atau tidak memiliki perbedaan tingkat ukuran. Tabel fakta yang terbentuk dari perancangan data warehouse ini merupakan tabel data pendaftaran penerimaan mahasiswa baru. Tabel Fakta Tabel ini berisi semua data yang berhubungan dengan data calon mahasiswa baru Politeknik Negeri Lhokseumawe tahun 2009. Tabel dimensi merupakan tabel yang berisi data yang menunjukkan tinjauan dari berbagai perspektif. Penjelasan dari masing-masing tabel dimensi dijelaskan sebagai berikut: Tabel dim_Pilihan1 Data yang termasuk dimensi pilihan1 adalah data pilihan pertama daftar program studi yang ditawarkan kepada calon mahasiswa baru. Tabel dim_Pilihan2 Data yang termasuk dimensi Pilihan2 adalah data pilihan kedua daftar program studi yang ditawarkan kepada calon mahasiswa baru. Tabel dim_ThnLulus Tabel ini berisi data tahun lulus calon mahasiswa baru dari sekolah asalnya. Tabel dim_Agama Tabel ini berisi data agama calon mahasiswa baru Tabel dim_PendAyah Tabel ini berisi data pendidikan terakhir bapak calon mahasiswa
Gambar 4. Rancangan tabel data warehouse penerimaan calon mahasiswa baru d.
Extraction cleaning/standarisasi isian kolom.
Pada penelitian ini proses ekstraksi data dilakukan dengan menggunakan tool yang bernama Pentaho Data Integration/Kettle.Kettle adalah aplikasi ETL (Extract, Transformation and Load) yang bersifta open source. Yang bisa digunakan sebagai tool standar untuk pengolahan data. Kettle merupakan bagian dari aplikasi Pentaho.
Gambar 5. Proses ETL data kedalam basisdata
64
Jurnal Litek (ISSN: 1693-8097) Volume 10 Nomor 1, Maret 2013: hal. 62 - 66 Proses ETL dilakukan untuk mengekstrak data source yang sebelumnya hanya satu file dengan format excel menjadi menjadi sebelas tabel. Selanjutnya sebelas tabel tersebut akan di-transform menjadi sebuah basisdata dengan format mysql yang terdiri satu tabel fakta (data transaksi) dan sepuluh tabel dimensi (master).
Adapun langkah-langkah untuk membuat multidimensi data werehouse adalah membuat dimensi baru untuk semua table dimensi/table referensi yang telah dibuat sebelumnya, yaitu: Tabel dim_Pilihan1, dim_Pilihan2, dim_ThnLulus, dim_Agama, dim_PendAyah, dim_Pend_Ibu, dim_Gender, dim_Warga, dim_KabKota, dan Tabel dim_Propinsi. Langkah ini juga digunakan untuk melakukan seting cube, tabel fakta (transaksi) dan measure. Setelah tabel dimensi selesai disusun, tahap selanjutnya adalah membuat hierarki, level dan menentukan tabel untuk masing-masing dimensi.
Gambar 6. Hasil proses ETL data source dari file excel menjadi basisdata mysql e.
Gambar 8. Setting Hirarki, Level dan Tabel
Presentasi Data Warehouse
Setelah penyusunan semua dimensi selesai dilakukan, langkah berikutnya adalah melakukan publish untuk bisa diakses dengan Pentaho User Console. Sebelum melakukan publish, maka harus dilakukan koneksi antara schema workbench dengan server pentaho dengan seting publish sebagai beriku : Untuk publish password perlu dibuka file berikut ini : …biserver-ce-3.0.0-STABLE\biserver-ce\pentahosolutions\system\publisher_config.xml Pada bagian dibawah setelah
isikan password besbas. Misal publish publish
Kemampuan data warehouse menyediakan informasi kepada pengguna merupakan hal terpenting dari data warehouse. Platform database yang digunakan untuk data warehouse pada penelitian ini adalah MySQL. Sedangkan tools yang digunakan untuk presentasi data kepada pengguna disesuaikan dengan kemampuan berintegrasi dengan MySQL sebagai platform database data warehouse. Tools yang digunakan adalah Pentaho Workbench. Pentaho Workbench merupakan Online Analytical Processing (OLAP) engine yang menggunakan bahasa pemrograman Java.
IV. HASIL DAN PEMBAHASAN Setelah data proses dimensional selesai dilakukan, maka tahap selanjutnya adalah melihat analisis data werehouse. Tools yang bisa digunakan adalah Bi_server pentaho, dengan cara membuka browser dan pada address bar dituliskan localhost:8080.
Gambar 9. Tampilan analisis data keseluruhan
Gambar 7. Setting penggunaan dimensi
65
Perancangan Data Warehouse Calon Mahasiswa Baru ………..……………………………………….Nanang Prihatin 3.
4.
Gambar 10. Contoh tampilan analisis berdasarkan dimensi Pilihan1 5.
Gambar 11. Contoh tampilan analisis berdasarkan dimensi Gender
DAFTAR PUSTAKA [1] Paulraj Ponniah. (2001). Data Warehousing Fundamentals. Wiley-Interscience Publication.
Untuk melihat data analisis berdasarkan dimensi yang lain, bisa dilakukan dengan cara mengklik tanda plus ( + ) pada masing-masing dimensi. Kemampuan yang dimiliki oleh aplikasi data warehouse ini antara lain: Kemampuan roll-up dan drill-drown sehingga memudahkan dalam memetakan data dan mempertajam analisis. Roll-up adalah kemampuan untuk menampilkan data dengan tingkat rincian yang lebih rendah. Drill-down adalah kemampuan menampilkan data dengan tingkat rincian yang lebih tinggi. Kemampuan membuat query sendiri sesuai dengan kebutuhan. Kemampuan report customization sesuai dengan kebutuhan informasi. Kemampuan untuk membuat chart atau grafik sesuai dengan laporan yang diinginkan. Kemampuan membuat report dalam format Excel dan PDF. V. 1.
2.
Agar data warehouse penerimaan calon mahasiswa baru dapat dimanfaatkan dengan optimal, maka proses pendaftaran calon mahasiswa harus dilakukan standarisasi formulir pendaftaran, sehingga data penerimaan calon mahasiswa baru dari tahun ke tahun memiliki standar yang sama. Data warehouse dengan menggunakan aplikasi Pentaho dapat digunakan dengan cara yang cepat dan mudah dan bebas biaya karena bersifat open source. Media presentasi yang digunakan adalah aplikasi berbasis web sehingga pemenuhan kebutuhan laporan menjadi lebih fleksibel untuk para pimpinan. Penelitian ini dapat dikembangkan lebih lanjut untuk mengarah ke pemanfaatan dari data warehouse untuk data mining. Dengan telah terbentuknya informasi yang terintegrasi di dalam data warehouse, pola-pola yang ada di dalamnya dapat digali untuk kemudian menghasilkan informasi yang berharga untuk pengambilan keputusan.
[2]
Inmon, W.H.(2002). Building Warehouse, edisi-3. Wiley Publishing.
the Data Computer
[3] Poe, Vidette (1998). Building Data Warehouse for Decision Support, edisi-2. Prentice Hall. [4] Lane, Paul (2002), Data Warehousing Guide Release 2 (9.2), Copyright © 1996, Oracle Corporation
KESIMPULAN Data warehouse dapat digunakan oleh pimpinan Politeknik Negeri Lhokseumawe dalam melihat trend perkembangan yang terjadi di dalam penerimaan calon mahasiswa baru, sehingga pimpinan dapat melakukan analisis terhadap laporan yang disajikan. Data warehouse penerimaan calon mahasiswa baru Politeknik Negeri Lhokseumawe dapat dijadikan sebagai salah satu sarana di dalam mendukung pengambilan keputusan.
66