Business Intelligence
Hendrik
} }
Fragmentasi sistem informasi secara vertical Menghasilkan pengembangan sistem operasional yang berbasis aplikasi (pengguna) Sales Planning Suppliers Num. Control Stock Mngmt Debt Mngmt Inventory ... ... ...
Sales Administration
Finance
Manufacturing
...
Integration System
World Wide Web } } }
Digital Libraries
Scientific Databases
Mengumpulkan dan menggabungkan informasi Menyediakan sudut pandang yang terintegrasi, antaramuka pengguna yang seragam Mendukung berbagi pakai
Personal Databases
} }
Pendekatan Tradisional (Query-Driven/ Lazy/ ondemand approach) Pendekatan Warehousing
Clients
Integration System
Metadata
... Wrapper
Source
Wrapper
Wrapper
Source
...
Source
}
Kelemahan
◦ Delay saat pemrosesan query
Sumber informasi yang lambat atau tidak tersedia Proses integrasi dan penyaringan data yang kompleks
◦ Untuk penggunaan yang sangat intens, berpotensi tidak efisien dan mahal ◦ Adanya kompetisi pemrosesan pada sumber data
Clients ❖
❖
Informasi terintegrasi di awal Tersimpan pada gudang data (WH) untuk query dan analisis langsung
Data Warehouse
Integration System
Metadata
... Extractor/ Monitor
Source
Extractor/ Monitor
Source
Extractor/ Monitor
...
Source
} }
Kinerja query yang tinggi Tidak saling mengganggu saat pemrosesan pada sumber data ◦ Query kompleks dilakukan pada DW ◦ OLTP dilakukan pada sumber informasi
}
Informasi digandakan pada DW
}
Banyak digunakan pada dunia industri
◦ Dapat digunakan untuk memodifikasi, mendokumentasi, merangkum dan merestruktutisasi data. ◦ Dapat menyimpan informasi historis
}
Pendekatan Query-driven tetap lebih baik dalam kasus
◦ Perubahan informasi yang sangat cepat ◦ Perubahan sumber informasi yang sangat cepat ◦ Klien dengan kebutuhan yang sulit diprediksi
“A data warehouse is simply a single, complete, and consistent store of data obtained from a variety of sources and made available to end users in a way they can understand and use it in a business context.” -- Barry Devlin, IBM Consultant
} } } }
Berorientasi subjek Terintegrasi Runtun waktu (time series) Tak berubah (non volatile)
}
}
}
Data disimpan dan dikategorisasikan berdasarkan subjek bisnis. Data diorganisir sedemikian rupa sehingga semua elemen data berelasi dengan kejadian atau objek dunia nyata yang dihubungkan bersama Menyediakan pandangan menyeluruh terhadap data
} } }
Mengambil data dari berbagai sumber data Disajikan dalam format yang konsisten Menangani konflik nama dan satuan Savings
Current accounts
Loans
OLTP Applications
Customer
Data Warehouse
}
}
Digunakan untuk keperluan analisis trend, deviasi, peramalan, perbandingan, … Waktu: harian, mingguan, bulanan
}
Data tidak untuk diubah (read-only)
Operational
Warehouse
Load
Insert Update Delete
Read
Read
First time load Warehouse Database Operational Database }
Perubahan dianggap sebagai data baru
Refresh
Refresh
Refresh
Property
Operational
Data Warehouse
Response Time
Sub seconds to seconds
Seconds to hours
Operations
DML
Primarily read only
Nature of Data
30-60 days
Snapshots over time
Applications
Subject, time
Small to large
Large to very large
Data Organization Size Data Source Activities
Operational, Internal Processes
Operational, Internal, External Analysis
} } } } } }
Meningkatkan produktivitas knowledge worker mendukung semua kebutuhan data pembuat keputusan Menyediakan akses ke data kritis yang senantiasa siap Memisahkan basisdata operasi dengan adhoc processing Menyediakan rangkuman informasi bagi level manajemen tingkat tinggi Menyediakan kemampuan drill-down
}
Organisasi yang ….
◦ Memiliki data pada berbagai macam sistem/aplikasi ◦ Menggunakan pendekatan manajemen berbasis informasi ◦ Besar, memiliki pelanggan dengan lokasi yang terpisah atau berbeda-beda ◦ Memiliki data yang sama namun dengen representasi yang berbeda pada berbagai sistem yang berbeda pula
} } } } }
Data detil kini Detil data lampau Data terangkum tingkat rendah Data terangkum tingkat tinggi Metadata
◦ Merupakan direktori terkait apa yang ada di DW, panduan pemetaan data dari data operasional ke bentuk DW, aturan yang digunakan untuk perangkuman (summarization)
}
Bagian dari DW yang berisi data yang relevan untuk fungsi bisnis tertentu (fokus pada 1 subjek) ◦ Dependent DM : Subset DW ◦ Independent DM: DW kecil (mis: untuk 1 departemen/unit bisnis)
}
Memerlukan detil data level rendah
Data Warehouse
Property Scope Subject Data Source Size(typical) Implementation time
Data Warehouse Enterprise Multiple Many 100 GB to>1 TB Months to years
Data Mart
Data Mart Department Single-subject, LOB Few <100 GB Months
Flat Files Operational Systems
Marketing
Marketing Sales Finance Human Resources Data Warehouse External Data
Marketing
Marketing Data Marts
Flat Files Operational Systems
Sale or Marketing
External Data
External Data Sources Visualisation Extract Clean Transform Load
Metadata respository
Refresh
Operational Databases
Data Warehouse
Serves
OLAP
Data Mining
} } } }
Data Mart Centric Virtual Federated Hub-and-Spoke DW Enterprise DW
}
Plus
◦ Secara organisasi dan teknis mudah dibangun
}
Minus
◦ Tidak ada sudut pandang enterprise ◦ Redundansi biaya data ◦ Biaya ETL dan operasional tinggi
}
Plus
◦ Tidak perlu platform tersendiri
}
Minus ◦ ◦ ◦ ◦
Cocok hanya untuk volume rendah Kompleksitas tinggi Perlu bandwith besar Masalah pada metadata
}
Plus
◦ Kustomisasi UI dan laporan mudah
}
Minus ◦ ◦ ◦ ◦
Tantangan pada sudut pandang enterprise Redundan biaya data Biaya operasi tinggi Data terlambat
}
Plus
◦ Menyediakan sudut pandang enterprise ◦ Konsistensi data tinggi ◦ Data dapat dipakai ulang (reusable)
}
Minus
◦ Perlu visi, komitmen dan kepemimpinan enterprise
}
Inmon Model (pendekatan EDW)
◦ Top-Down ◦ Adaptasi dari basisdata relasional untuk keperluan enterprise
}
Kimball Model (pendekatan DM) ◦ Bottom-Up ◦ “Plan Big, Build Small”