Membangun Data Warehouse Anief Fauzan Rozi, S. Kom., M. Eng.
10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
1
Kompentensi • Mahasiswa mengetahui desain data warehouse
10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
2
Pengantar • Desain data warehouse didasarkan atas konsep pemodelan dimensional. • Pemodelan dimensional adalah suatu model berbasis-‐ pemanggilan yang mendukung akses query volume-‐tinggi. • Skema-‐skema: – Star Schema – Snowflake Schema – Facts Constellation Schema 10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
3
Star Schema (1) • Terdiri dari tabel fakta (pusat) dan tabel dimensi (sekeliling tabel pusat). • Tabel fakta berisi: – Atribut analisis keputusan, – Atribut deskriptif untuk pelaporan query, – Foreign key untuk menghubungkan dengan tabel dimensi.
• Tabel dimensi: – Berisi atribut yang menguraikan data dalam tabel fakta. – Menunjuk bagaimana data akan dianalisis?
10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
4
Star Schema (2)
10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
5
Snowflake Schema (1) • variasi dari star skema • beberapa tabel dimensi dinormalisasikan – tabel dimensi dipecah menjadi beberapa tabel tambahan
10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
6
Snowflake Schema (2)
10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
7
Facts Constellation Schema (1) • bisa dipandang sebagai koleksi bintang (stars) • beberapa tabel fakta berbagi tabel dimensi • disebut juga Galaxy Schema
10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
8
Facts Constellation Schema (2)
10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
9
Langkah-‐langkah membangun data warehouse – pendekatan praktik (1) 1. Tentukan skenario/proses bisnis yang terjadi pada suatu transaksi. – Skenario dapat dibuat dengan cara menentukan alur yang dilalui dalam suatu transaksi – Misalnya dalam transaksi sewa mobil, bagaimana tahapan dari seorang konsumen datang untuk menyewa sampai mobil dikembalikan. 10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
10
Langkah-‐langkah membangun data warehouse – pendekatan praktik (2) 2. Buat database transaksional yang menyimpan data-‐ data transaksi berdasar pada proses bisnis yang telah dibuat di langkah 1. – Database transaksional/relasional dibutuhkan sebagai bahan input yang akan dikenai proses ETL sebelum disimpan dalam bentuk data warehouse – Minimal terdiri dari 5 tabel dan saling berelasi – Tahap ini database sudah harus ada isinya. 10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
11
Langkah-‐langkah membangun data warehouse – pendekatan praktik (3) 3. Lakukan pemodelan proses bisnis ke dalam bentuk skema yang ada. –
Misalkan menggunakan skema star yang terdiri dari 1 tabel fakta dan beberapa tabel dimensi.
–
Penamaan/pemilihan tabel fakta (dipilih dari database transaksional) didasarkan pada transaksi apa yang terjadi.
–
Penentuan nama dan jumlah tabel dimensi didasarkan pada pengenaan unsur 5W (what, who, when, where, why) kepada proses bisnis yang terjadi.
10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
12
Langkah-‐langkah membangun data warehouse – pendekatan praktik (4) 4. Buat skema data warehouse berdasar model skema yang telah dibuat di langkah 3. – Tahap ini membuat data warehouse yang siap diisi datanya dari proses ETL di langkah 5. Hal ini berarti bahwa pada tahap ini data masih kosong. – Pembuatan tabelnya dapat menggunakan konsep de-‐normalisasi terhadap database relasional 10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
13
Langkah-‐langkah membangun data warehouse – pendekatan praktik (5) 5. Lakukan proses ETL untuk mengisi data warehouse yang telah dibuat di langkah 4 menggunakan Pentaho Data Integration. – Langkah ini harus mencakup ketiga proses inti dari data warehouse, yaitu Extraction, Transformation, dan Load. – Saat selesai proses Load, maka data warehouse secara otomatis harus sudah terisi datanya.
10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
14
Pertanyaan ???
10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
15
Tugas e-‐learning • Buatlah skema data warehouse dari tugas besar Anda dengan 4 bagian yang akan dinilai: 1. Skenario proses bisnis 2. Database operational/transaksional 3. Pemodelan skema (5W) 4. Skema data warehouse (denormalisasi) 10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
16
Tugas e-‐learning • Tugas dikumpulkan paling lambat hari rabu, 6 november 2013 jam 23:59 waktu bagian email. – To:
[email protected] – Subject: 20131_building_dw_NIM_nama – Filename: 20131_building_dw_NIM_nama.pdf
10/24/13
Data Mining dan Data Warehouse Universitas Mercu Buana Yogyakarta
17