Transformator Entity Relationship Model Ke Star schema Humasak Simanjuntak1, Rina Sihotang2, Daniel H. Nababan3, Andreas M. C. Pangaribuan4 1
2
3
4
Abstrak Data warehouse (DW) adalah sebuah central basisdata yang digunakan untuk mendukung reporting dan analisis data dengan mengintegrasikan data dari beberapa sumber yang berbeda. Pemodelan pada DW dilakukan menggunakan Entity Relationship (ER) modeling dan Dimensional modeling. ER modeling menerapkan konsep normalisasi yang menciptakan banyak tabel dengan proses join yang banyak, sedangkan dimensional modeling menerapkan konsep denormalisasi, dengan proses join yang lebih sedikit. Salah satu dimensional modeling yang bnyak digunakan adalah Star schema. Proses perancangan star schema dari sumber data, yang biasanya menggunakan ER modelling membutuhkan waktu yang tidak cepat. Selain itu, developer sering kesulitan dalam menghasilkan Star schema dari sumber data yang ada. Oleh karena itu, pada kajian ini dikembangkan sebuah algoritma dan aplikasi yang dapat melakukan transformasi dari ER modeling ke Star schema, yang selanjutnya diberi nama Trans ER2STAR. Analisis menunjukkan terdapat enam proses pembuatan star schema yaitu memeriksa fakta, menghasilkan primary dimension, menghasilkan secondary dimension, menghapus key secondary dimension dari primary dimension, menambahkan key secondary dimension pada fakta dan menghasilkan time dimension. Pengujian dilakukan dengan membandingkan skema yang dihasilkan oleh Trans ER2STAR dengan Sybase Power Designer 15. Hasil pengujian dan pembahasan menunjukkan, bahwa Sybase Power Designer 15 menghasilkan snowflake schema, sedangkan Trans ER2STAR menghasilkan star schema. Selain itu, Trans ER2STAR mampu untuk menghasilkan star schema secara otomatis dan manual. Star schema yang dihasilkan secara otomatis yang sesuai dengan bisnis proses dan kebutuhan user sangat sulit dilakukan, sehingga dibutuhkan masukan dari pengguna untuk menentukan kriteria dari star schema yang dibutuhkan. Star schema yang dihasilkan secara manual (bantuan interaksi dari pengguna) lebih sesuai dengan bisnis proses dan kebutuhan pengguna. Kata kunci: star schema, data warehouse, ER modelling, dimensional modelling Trans ER2STAR Abstract Data warehouse (DW) is a central database that is used to support reporting and data analysis by integrating data from multiple disparate sources. Data modeling in DW performed using Entity Relationship (ER) modeling and Dimensional modeling. ER modeling apply the concept of normalization which create many tables and do many join the process, while dimensional modeling applying the concept of denormalization with less tables. The most dimensional modeling which used is Star schema. Designing star schema from data source, which typically modeled using ER modeling takes more time. In addition, the developer is often difficult to generate Star schema from an existing data source. Therefore, this research developed an algorithm and application which perform transformation of ER modeling to Star schema (Trans ER2STAR). The analysis produced six phases to create a star schema are facts checking, generate primary dimension, generate secondary dimension, remove secondary key dimension, adding secondary dimension key to the facts and generate a time dimension. Testing has finished by comparing the scheme produced by Trans ER2STAR with Sybase Power Designer 15. Test results indicate that Sybase Power Designer 15 produces snowflake schema, while the Trans ER2STAR produces star schema. In addition, Trans ER2STAR able to generate star schema automatically and manually. Generate star schema automatically in accordance with the business processes and user requirements is very difficult. The process still require input from user to specify the criteria of the star schema. Star schema generated manually more in line with the business processes and user requirements. Keywords: star schema, data warehouse, ER modeling, dimensional modeling Trans ER2STAR
1.
Pendahuluan
2.
Studi Literatur
A. Data Warehouse
B. Pemodelan Data pada Data Warehouse
i. ER Modeling
ii. Dimensional Modeling
Star Model
Snowflake Model
ii.
Grains
iii.
Dimensions
iv.
Facts
D. Algoritma yang Direferensi (Algoritma A) C. Star schema
i.
Business Process
3.
Analisis
A. Find and Make Fact Table
No.
Algoritma A
Algoritma B
B. Get Primary Dimensions
D. Load Data dari ER model ke Star schema
C. Generate Time Dimension
4.
Desain Dan Implementasi Perangkat Lunak
5.
Hasil, Pengujian, Dan Pembahasan
No.
Trans ER2STAR
Sybase Power Designer 15
A. Perbandingan Aplikasi Trans ER2STAR dengan Sybase Power Designer 15
TRANS ER2STAR
No.
Trans ER2STAR
Sybase Power Designer 15
B. Perbadingan Star Skema dihasilkan yang dihasilkan. 1. Aplikasi Trans ER2STAR VS Sybase Power Designer 15
2.
Hasil Star schema secara Otomatis VS Manual 6.
Simpulan
Daftar Putaka