BAB 2 LANDASAN TEORI
2.1 Pengertian Database Menurut Connolly (2005, p15), database adalah kumpulan relasi-relasi logikal dari data, dan deskripsi dari data, yang dapat digunakan bersama dan dibuat untuk memperoleh informasi yang dibutuhkan oleh perusahaan. Menurut O’Brien (2005, p211), database adalah kumpulan terintegrasi dari elemen data yang secara logika saling berhubungan. Menurut Sawyer (2005, p116), database adalah kumpulan dari file–file yang saling berhubungan pada sistem komputer.
2.2 Pengertian Datawarehouse Menurut Kimball dan Caserta (2004, p23), datawarehouse adalah sebuah sistem yang mengekstrak, membersihkan, menyesuaikan diri, dan mengirimkan sumber data ke dalam
sebuah
penyimpanan
data
dimensional
dan
mendukung
serta
mengimplementasikan query dan analisis untuk tujuan pengambilan keputusan. Menurut Inmon (2005, p.29), sebuah datawarehouse ialah sebuah kumpulan data yang mempunyai sifat berorientasi subjek, terintegrasi, time-variant, dan bersifat tetap dari koleksi data dalam mendukung proses pengambilan keputusan managemen. Menurut Laudon (2006, p.233), datawarehouse adalah database yang menyimpan data penting saat ini dan historis dari kebutuhan informasi untuk manager dalam perusahaan. 8
9
Menurut Inmon (2005, p.7), datawarehouse didefinisikan dengan karakteristik sebagai berikut: 1.
Subject Oriented (Berorientasi subjek) Datawarehouse berorientasi subjek artinya datawarehouse didesain untuk menganalisa data berdasarkan subjek-subjek tertentu dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu. Datawarehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan (customers, products dan sales) dan tidak diorganisasikan pada area-area aplikasi utama (customer invoicing, stock control dan product sales). Hal ini dikarenakan kebutuhan dari datawarehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data. Jadi dengan kata lain, data yang disimpan adalah berorientasi kepada subjek bukan terhadap proses.
2.
Integrated (Terintegrasi) Datawarehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep datawarehouse itu sendiri. Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variabel, konsisten dalam ukuran variabel, konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data. Contoh pada lingkungan operasional terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh developer yang berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi tersebut ada variabel yang memiliki maksud yang sama tetapi
10
nama dan format nya berbeda. Variabel tersebut harus dikonversi menjadi nama yang sama dan format yang disepakati bersama. Dengan demikian tidak ada lagi kerancuan karena perbedaan nama, format dan lain sebagainya. Barulah data tersebut bisa dikategorikan sebagai data yang terintegrasi karena kekonsistenannya. 3.
Non-Volatile Karakteristik ketiga dari datawarehouse adalah non-volatile, maksudnya data pada datawarehouse tidak di-update secara realtime tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara kontinyu menyerap data baru, kemudian secara incremental disatukan dengan data sebelumnya. Berbeda dengan database operasional yang dapat melakukan update, insert dan delete terhadap data yang mengubah isi dari database sedangkan pada datawarehouse hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses datawarehouse seperti melakukan query atau menampilan laporan yang dibutuhkan, tidak ada kegiatan updating data).
4.
Time-variant (Rentang Waktu) Seluruh data pada datawarehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu datawarehouse, kita dapat menggunakan cara antara lain : • Cara yang paling sederhana adalah menyajikan datawarehouse pada
rentang
waktu tertentu, misalnya antara 5 sampai 10 tahun ke depan. • Cara yang kedua, dengan menggunakan variasi/perbedaan waktu yang disajikan dalam datawarehouse baik implicit maupun explicit secara explicit dengan unsur
11
waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan tetap ada secara implicit didalam data tersebut. • Cara yang ketiga, variasi waktu yang disajikan datawarehouse melalui serangkaian snapshot yang panjang. Snapshot merupakan tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang ada bersifat read-only. Gambar di bawah adalah Aspek Time Variancy dari Datawarehouse (Inmon, 2005, p.32)
Gambar 2.1 Time Variance Datawarehouse (Sumber Inmon, 2005, p.32)
12
2.3 Pengertian Data mart Menurut Connolly (2005, p1171), data mart adalah subset dari datawarehouse yang mendukung kebutuhan informasi dari suatu departemen atau fungsi bisnis tertentu. Data mart merupakan suatu bagian dari datawarehouse yang dapat mendukung pembuatan laporan dan analisis data pada suatu unit, bagian, atau operasi perusahaan. Menurut Larson (2006, p30), data mart dilambangkan sebagai tubuh dari data historis didalam sebuah penyimpanan elektronik yang tidak berhubungan didalam operasi harian di perusahaan. Melainkan data ini digunakan untuk membuat business intelligence. Data di dalam data mart biasanya digunakan di area yang spesifik dari perusahaan. Karakteristik perbedaan data mart dan datawarehouse, yaitu : 1. Data mart hanya berfokus pada kebutuhan user yang berkaitan dengan satu departemen atau fungsi bisnis. 2. Data mart tidak mengandung data operasional secara detail, tidak seperti datawarehouse 3. Data yang ada di dalam data mart lebih sedikit daripada yang ada di dalam datawarehouse, data mart juga lebih mudah dimengerti dan dinavigasikan.
2.4 Pengertian Skema Bintang Menurut Ponniah (2001, pp210-216), skema bintang adalah teknik dasar perancangan data untuk datawarehouse. Struktur skema bintang adalah suatu struktur yang dapat dengan mudah dipahami dan digunakan oleh pengguna. Struktur tersebut mencerminkan bagaimana pengguna biasanya memandang ukuran-ukuran kritis mengikuti dimensi-dimensi bisnis yang ada. Dalam skema bintang tergambar dua jenis
13
tabel, yaitu tabel dimensi dan tabel fakta. Menurut Conolly dan Begg (2005, p1183), star schema adalah struktur logical yang mempunyai sebuah tabel fakta berisi data factual yang ditempatkan di tengah dan dikelilingi oleh tabel dimensi berisi data referensi (yang dapat didenormalisasi). Pada gambar dibawah menggambarkan struktur bagaimana pengguna biasanya memandang ukuran-ukuran kritis mengikuti dimensi-dimensi bisnis yang ada.
Gambar 2.2 Star Schema (Sumber Connolly dan Begg, 2005, p1184)
14
2.5 Pengertian Extract Transform Load ( ETL) Menurut Inmon (2002, p390). ETL (Extract, Transform, Load) adalah proses melakukan pencarian data, mengintegrasikan, dan menempatkan data ke dalam sebuah datawarehouse. Menurut Kimball dan Ross (2002, p401), ETL adalah kumpulan proses untuk menyiapkan data dari operational source untuk datawarehouse. Proses ini terdiri dari extracting, transforming, loading dan beberapa proses yang dilakukan sebelum dipublikasikan ke dalam datawarehouse. Jadi, ETL adalah fase pemrosesan data dari sumber data masuk ke dalam datawarehouse. Tujuan dari ETL adalah mengumpulkan, menyaring, mengolah dan menggabungkan data yang relevan dari berbagai sumber untuk disimpan ke dalam datawarehouse. ETL juga dapat digunakan untuk mengintegrasikan data dengan sistem yang sudah ada sebelumnya. Hasil dari proses ETL adalah data yang memenuhi kriteria datawarehouse seperti data historis, terpadu, terangkum, statis dan memiliki struktur yang dirancang utuk keperluan proses analisis. Proses ETL terdiri dari tiga tahap, yaitu : 1. Extract Langkah pertama dari proses ETL adalah proses penarikan data dari satu atau lebih sistem operasional sebagai sumber data (data bisa diambil dari OLTP). Pada hakikatnya, proses ekstrasi adalah proses penguraian dan pembersihan data yang diekstrak untuk mendapatkan suatu pola atau struktur data yang diinginkan.
15
2. Transform Proses membersihkan data yang telah diambil pada proses ekstrak sebelumnya sehingga data itu sesuai dengan struktur datawarehouse atau data mart. Hal-hal yang dapat dilakukan dalam tahap transformasi adalah sebagai berikut : ‐
Hanya memilih kolom tertentu saja untuk dimasukkan ke dalam datawarehouse
‐
Menerjemahkan nilai berupa kode (misal database sumber menyimpan nilai 1 untuk pria dan 2 untuk wanita, tetapi datawarehouse menyimpan M untuk pria dan F untuk wanita). Proses yang dilakukan disebut automated data cleansing, tidak ada pembersihan secara manual selama proses ETL
‐
Mengkodekan nilai-nilai ke dalam bentuk bebas (misalnya memetakan “male”, “I”, “Mr” ke dalam “M”)
‐
Melakukan perhitungan nilai-nilai baru (misal, sale_amount= qty*unit_price)
‐
Menggabungkan data dari berbagai sumber bersama-sama Membuat ringkasan dari sekumpulan baris data (misalnya total penjualan untuk setiap bagian).
Kesulitan yang terjadi pada proses transformasi adalah data harus digabungkan dari beberapa sistem terpisah. Oleh karena itu harus dibersihkan sehingga konsisten dan harus diagregasi untuk mempercepat analisis. 3. Load Fase load merupakan tahapan yang berfungsi untuk memasukkan data ke dalam target akhir, yaitu ke dalam suatu datawarehouse. Waktu dan jangkauan untuk mengganti atau menambah data tergantung pada perancangan datawarehouse pada waktu menganalisa keperluan informasi.
16
Fase load berinteraksi dengan suatu database, constraint didefinisikan dalam skema database sebagai suatu trigger yang diaktifkan pada waktu melakukan load data (contohnya : uniqueness, referential, integrity, mandotary fields) yang juga berkontribusi untuk keseluruhan tampilan dan kualitas data dari proses ETL.
2.6 Pengertian Metadata Menurut Inmon (2002, p393), metadata adalah data mengenai data atau deskripsi dari struktur, isi, kunci, indeks, dan lain-lain mengenai data. Sedangkan Mallach (2002, p474) mengatakan metadata adalah data tentang data yang berguna sebagai pusat penyimpanan informasi untuk menjelaskan kepada user tentang apakah datawarehouse itu, dari mana asalnya dan siapa yang bertanggung jawab atas hal tersebut dan sebagainya. Menurut Connolly (2005, p1055), metadata digunakan untuk berbagai tujuan meliputi : - Proses ekstraksi dan loading. Metadata digunakan untuk memetakan sumber data ke dalam pandangan umum dari data dalam warehouse. - Proses manajemen warehouse. Metadata digunakan untuk mengotomatiskan pembuatan tabel ringkasan. - Sebagai bagian dari proses manajemen query. Metadata digunakan untuk menghubungkan suatu query dengan sumber data yang tepat.
17
Metadata dalam datawarehouse dibagi menjadi 3 kategori (Ponniah, 2001, p36), yaitu : -
Metadata operasional, berisi mengenai informasi tentang sumber data operasional yang memiliki struktur data yang berbeda, ukuran field yang berbeda, dan tipe data yang berbeda.
-
Metadata ekstraksi dan transformasi, berisi mengenai data ekstraksi dari sumber data, penamaan, frekuensi ekstraksi, metode ekstraksi, dan peraturan untuk ekstraksi.
-
Metadata pengguna akhir, adalah sebuah peta navigasi dari datawarehouse. Ini memampukan pengguna akhir untuk menemukan informasi dari datawarehouse.
2.7 Pengertian Data Mining Menurut Han, Jiawei (2006, p5) data mining merupakan pemilihan atau “menambang” pengetahuan dari jumlah data yang banyak. Sedangkan menurut Berry (2004, p7), data mining adalah kegiatan mengeksplorasi dan menganalisis data dalam jumlah yang besar untuk menemukan pattern dan rule yang berarti. Data mining digunakan untuk mencari informasi bisnis berharga dari basis data yang sangat besar, yang dipakai untuk memprediksi trend dan sifat-sifat bisnis serta pola-pola yang tidak diketahui sebelumnya. Menurut Prescott, Hoffer dan McFadden (2005, p482), data mining adalah penemuan pengetahuan dengan menggunakan teknik-teknik yang tergabung dari statistic, tradisional, artificial intelligence dan grafik computer. Menurut Han (2006, p21), Fungsi data mining digunakan untuk menentukan jenis pola yang terdapat dalam database. Dalam beberapa kasus, mungkin beberapa pengguna tidak tahu bahwa pola-pola menarik yang terdapat dalam data mereka, dan karena hal itu mereka ingin mencari beberapa jenis pola data secara parallel. Karenanya
18
data mining sistem memiliki peranan penting dalam menghasilkan jenis-jenis pola yang berbeda untuk mengakomodasi keinginan pengguna akan pola yang beragam. Selanjutnya, sistem data mining harus dapat menemukan bermacam-macam pola dari berbagai macam sumber. Sistem data mining juga harus membantu pengguna untuk menemukan petunjuk yang tepat dan spesifik. Karena beberapa pola dalam data mining tidak menyimpan seluruh datanya dalam database, ukuran kepastian atau kepercayaan biasanya terkait dengan setiap pola yang ditemukan. Menurut Berson, Smith, dan Thearling (2000. P37-38) pada dasarnya aplikasi data mining digunakan untuk melakukan empat macam funsi, yaitu : 1. Fungsi Klasifikasi (Classification) Data mining dapat digunakan untuk mengelompokan data-data yang jumlahnya besar menjadi data-data yang lebih kecil. 2. Fungsi Segmentasi (Segmentation) Disini data mining juga digunakan untuk melakukan segmentasi (pembagian) terhadap data berdasarkan karakteristik tertentu. 3. Fungsi Asosiasi (Association) Pada fungsi asosiasi ini, data mining digunakan untuk mencari hubungan antara karakteristik tertentu. 4. Fungsi Pengurutan (Sequencing) Pada fungsi ini, data mining digunakan untuk mengidentifiksaikan perubahan pola yang terjadi dalam jangka waktu tertentu.
19
2.8 Pengertian Business Intelligence Menurut David (2003, p.6), business intelligence adalah proses, teknologi, dan alat bantu yang digunakan untuk mengubah data menjadi informasi, informasi menjadi pengetahuan, dan pengetahuan menjadi rencana yang digunakan untuk menggerakan tindakan bisnis yang menguntungkan. Business intelligence menggunakan data warehousing, business analytic tools, dan knowledge management. Menurut Oguz (2003), business intelligence adalah kategori luas dari aplikasi dan teknik untuk mengumpulkan, menyimpan, dan menganalisis, dan menyediakan akses ke data untuk membantu pengguna dalam membuat keputusan bisnis dan keputusan strategis yang lebih baik. Menurut Larson (2006, p.11), business intelligence yaitu menyampaikan informasi yang akurat dan berguna kepada para pembuat keputusan dalam suatu batasan waktu untuk mendukung pembuatan keputusan yang efektif. Tujuan dari business intelligence adalah untuk memungkinkan akses yang interaktif (terkadang real-time) terhadap data, dan memberikan kemampuan kepada para manager serta analisis bisnis untuk melakukan analisis yang tepat. Dengan menganalisis data, situasi, dan performa yang bersifat historical serta actual, pembuatan keputusan akan lebih bernilai sehingga memungkinkan mereka, para pengambil keputusan untuk membuat keputusan yang lebih baik. Proses dari business intelligence berdasarkan transformasi dari data menjadi informasi, kemudian menjadi keputusan, dan pada akhirnya menjadi tindakan (Turban, 2007, p. 24). Menurut Bart Czernicki arsitektur dari business intelligence adalah sebagai berikut :
20
Gambar 2.3 Arsitektur Business Intelligence (Sumber Bart Czernicki, 2010, p11) Beberapa
keuntungan
yang
didapatkan
bila
suatu
organisasi
mengimplementasikan business intelligence adalah sebagai berikut: 1.
Meningkatkan nilai data dan informasi organisasi Melalui pembangunan business intelligence, maka seluruh data dan informasi dapat diintegrasikan sedemikian rupa sehingga menghasilkan pengambilan keputusan yang lengkap. Informasi-informasi yang dulunya tidak dicakupkan sebagai salah satu faktor pengambilan keputusan dapat dengan mudah dilakukan ‘connecty and combine’ dengan menggunakan business intelligence. Data dan informasi yang dihasilkan pun juga menjadi lebih mudah diakses dan lebih mudah untuk dimengerti.
21
2.
Memudahkan pemantauan kinerja organisasi Dalam mengukur kinerja suatu organisasi seringkali dipergunakan ukuran yang disebut key performance indicator (KPI). KPI tidak selalu diukur dengan satuan uang, namun dapat juga berdasarkan kecepatan pelaksanaan suatu layanan. Business intelligence dapat dengan mudah menunjukkan pencapaian KPI suatu organisasi dengan mudah, cepat, dan tepat. Dengan demikian akan memudahkan pihak-pihak yang terlibat dalam pengambilan keputusan untuk langkah-langkah antisipasi yang diperlukan.
3.
Meningkatkan nilai investasi teknologi informasi yang sudah ada Business intelligence tidak perlu/harus mengubah atau menggantikan sistem informasi yang sudah digunakan sebelumnya. Sebaliknya, business intelligence hanya menambahkan layanan pada sistem-sistem tersebut sehingga data dan informasi yang sudah ada dapat menghasilkan informasi yang komprehensif dan memiliki kegunaan yang lebih baik.
4.
Menciptakan pegawai yang memiliki akses informasi yang baik Dalam melaksanakan pekerjaanya sehari-hari, seluruh level dari suatu organisasi selalu berkaitan dan/atau membutuhkan akses data dan informasi. Business intelligence mempermudah seluruh level pegawai dalam mengakses data dan informasi yang diperlukan sehingga membantu membuat suatu keputusan. Jika seperti ini tercapai, maka misi dan strategi organisasi yang sudah ditetapkan dapat dengan lebih mudah terlaksana terpantau tungkat pencapaiannya.
22
2.9 Pengertian OLAP (Online Analytical Processing) Sebuah OLAP digunakan untuk mengelola informasi yang dapat dilihat dari berbagai aspek. OLAP memungkinkan pengguna untuk mendapatkan pengertian dan pengetahuan yang lebih dalam tentang berbagai aspek dari data perusahaan secara cepat, konsisten dan akses yang interaktif ke seluruh view dari data yang memungkinkan. Menurut Connolly dan Begg (2002, p1101), OLAP adalah istilah yang mendeskripsikan sebuah teknologi yang menggunakan multidimensional view dari agregat data untuk menyediakan akses yang cepat bagi informasi strategis dengan tujuan - tujuan dari advance analysis.
2.10 Pengertian OLTP (Online Transaction Processing) Banyak perusahaan yang membutuhkan kegiatan untuk menyimpan semua hal yang telah dilakukan perusahaan tersebut untuk menjalankan bisnis mereka. Karena banyaknya kebutuhan untuk menyimpan data secara bersamaan, sebuah perusahaan membutuhkan sebuah sistem OLTP. Menurut Connolly dan Begg (2005, p1149), OLTP adalah suatu sistem yang telah dirancang untuk menangani jumlah hasil transaksi yang tinggi, dengan transaksi yang ada pada umumnya membuat perubahan yang kecil bagi data operasional oranisasi. Oleh karena itu data organisasi memerlukan penanganannya operasinya setiap hari. Transactional data merupakan informasi yang disimpan, digunakan untuk mengawasi interaksi atau transaksi bisnis yang dilakukan oleh perusahaan. Secara umum perusahaan membutuhkannya untuk terus mengawasi apa yang telah terjadi dan apa yang harus dilakukan. Ketika transaksi – transaksi ini disimpan dan dikelola oleh komputer, inilah disebut sebagai OLTP (Larson, 2006, p27).
23
Sistem OLTP dirancang untuk memungkinkan terjadinya concurrency yang tinggi, membuatnya mungkin bagi banyak pengguna, untuk mengakses sumber data yang sama serta melakukan proses yang mereka butuhkan. Setiap interaksi yang dilakukan perusahaan dalam bisnisnya adalah transaksi bisnis, sehingga dapat disebut sebagai transactional data. Seluruh penjumlahan dari transaksi – transaksi tersebut yang disimpan dalam sistem OLTP adalah sebuah histori dari sebuah perusahaan. Data transaksi ini mengandung angka- angka yang mentah, yang digunakan untuk menghitung ukuranukuran yang digunakan untuk membuat business inteligence.
2.11 Pengertian Dashboard Menurut Malik (2005) sebuah dashboard adalah sebuah tampilan komputer yang kaya dengan grafik, laporan, indicator visual, dan mekanisme pengumuman yang digabungkan menjadi sebuah tampilan informasi yang dinamis dan relevan. Menurut Few (2006, p34), Dashboard adalah tampilan visual dari informasi yang paling penting yang diperlukan untuk mencapai satu atau beberapa tujuan yang digabungkan serta disusun dalam sebuah layar sehingga informasi tersebut dapat diakses dengan mudah. Oleh karena itu, sebuah dashboard dapat menjadi sebuah ringkasan pengukur dari sebuah performa bisnis terpenting yang telah terlaksana. Tiap-tiap komponen dashboard yang ditampilkan pada layar, memberikan suatu informasi spesifik dari sebuah pengukuran. Sama seperti sebuah dashboard yang terdapat pada mobil atau motor yang menyediakan informasi kritis yang diperlukan untuk menjalankan mobil
24
tersebut, dashboard juga memiliki tujuan yang serupa, yaitu dalam mendukung keputusan strategis tau kegiatan operasional harian. Menurut Malik (2005, p8), karakteristik dasar yang harus dimiliki sebuah dashboard dapat dijelaskan dengan singkatan SMART. Adapun elemen-elemen dari SMART adalah sebagi berikut : ‐
Synergetic Harus ergonomis dan efektif secara visual bagi sebuah pengguna untuk mengsinergiskan informasi menyangkut aspek-aspek berbeda dalam sebuah tampilan layar tunggal.
‐
Monitor KPI Harus menampilkan Key Performance Indicators yang kritis yang dibutuhkan dalam membuat keputusan efektif.
‐
Accurate Informasi yang ditampilkan haruslah akurat agar dapat meraih kepercayaan diri yang penuh dari pengguna dalam kepada dashboard. Data-data yang mendukung dashboard harus sudah dicoba dan divalidasikan dengan baik.
‐
Responsive Harus bisa merespon terhadap perubahan dengan menciptakan peringatan kepada pengguna dalam bentuk tampilan visual pada dashboard untuk menarik perhatian pengguna kepada masalah kritis secepat mungkin.
‐
Timely Harus menampilkan informasi yang paling baru agar dapat mengambil keputusan yang efektif. Informasi tersebut haruslah real-time dan right-time.
25
2.12 Langkah – Langkah Pengembangan Business Intelligence
Gambar 2.4 Engineering stages (Sumber Business Intelligence Roadmap, 2003, p6)
1. Justification : Menetapkan kebutuhan bisnis yang mendukung proyek baru. 2. Planning
: Mengembangkan strategi dimana proyek dapat diselesaikan dan
dikembangkan. 3. BusinessAnalysis : Menampilkan analisis secara rinci dari masalah bisnis atau peluang bisnis untuk mendapatkan solusi yang berpotensi. 4. Design
: Menyusun solusi untuk menyelesaikan permasalahan bisnis atau
untuk mendapatkan peluang bisnis. 5. Construction
: Membangun solusi yang harus menyediakan pengembalian
investasi dengan jangka waktu yang sudah ditentukan.
26
Gambar 2.5 Development Step Dependencies Sumber (Business Intelligence Roadmap, 2003, p15)
The Justification Stage Langkah 1: Business Case Assesment Masalah bisnis atau peluang bisnis didefinisikan dan solusi business intelligence yang diusulkan. Masing-masing aplikasi business intelligence yang dikeluarkan harus sesuai dengan yang biaya telah ditentukan dan harus didefinisikan secara jelas keuntungan dari penyelesaian masalah bisnis atau mengambil keuntungan dari peluang bisnis.
27
Kegiatan Business Case Assesment Tentukan kebutuhan bisnis, menilai solusi dari sistem pendukung keputusan, menilai sumber-sumber operasional dan prosedur, menilai para pesaing business intelligence, menentukan tujuan aplikasi business intelligence, mengusulkan solusi business intelligence, lakukan analisis biaya, melakukan penilaian risiko, menulis laporan penilaian
The Planning Stage Langkah 2: Enterprise Infrastructure Evaluation Aplikasi business intelligence adalah inisatif yang digunakan banyak perusahaan, sebuah infrastruktur perusahaan harus diciptakan untuk mendukung mereka. Beberapa komponen infrastruktur mungkin sudah berada di tempat sebelum proyek business intelligence pertama diluncurkan. Komponen infrastruktur lainnya mungkin harus dikembangkan dari waktu ke waktu sebagai bagian dari proyek business intelligence. Sebuah infrastruktur perusahaan memiliki dua komponen: 1. Technical Infrastructure, yang mencakup perangkat keras, perangkat lunak, middleware, sistem manajemen database, sistem operasi, komponen jaringan, repository metadata, utilitas, dan seterusnya. Kegiatan Technical Infrastructure Menilai platform yang ada, mengevaluasi dan memilih produk-produk baru, menulis laporan penilaian teknis infrastruktur, memperluas platform saat ini 2. NonTechnical Infrastructure, yang meliputi metadata standar, data-penamaan standar, data model perusahaan logis (berkembang), metodologi, pedoman, prosedur
28
pengujian, perubahan pengendalian proses, prosedur untuk manajemen isu dan penyelesaian sengketa, dan sebagainya. Kegiatan NonTechnical Infrastructure Menilai efektivitas komponen nontechnical infrastructure yang ada, menulis laporan penilaian infrastruktur nonteknis, meningkatkan infrastruktur nonteknis Langkah 3: Project Planning Keputusan business intelligence mendukung proyek-proyek yang sangat dinamis Perubahan ruang lingkup, staf, anggaran, teknologi, perwakilan bisnis, dan sponsor sangat dapat mempengaruhi keberhasilan proyek. Oleh karena itu, perencanaan proyek harus rinci, dan kemajuan yang sebenarnya harus diawasi ketat dan dilaporkan. Kegiatan Project Planning Tentukan persyaratan proyek, tentukan kondisi sumber file dan database, tentukan atau merevisi perkiraan biaya, merevisi penilaian risiko, mengidentifikasi faktor-faktor keberhasilan, siapkan project charter, buat rencana proyek tingkat tinggi, kickoff proyek.
The Business Analysis Stage Langkah 4: Project Requirement Definition Mengelola lingkup proyek adalah salah satu tugas yang paling sulit di dalam keputusan business intelligence yang mendukung proyek-proyek. Sangat sulit mengurangi keinginan untuk mendapatkan hal hal yang instan, tetapi membatasi keinginan itu adalah salah satu aspek yang paling penting dari negosiasi persyaratan untuk setiap penyampaiannya. Tim proyek harus mengharapkan persyaratan untuk berubah selama
29
siklus pembangunan sebagai pembelajaran orang bisnis mengenai kemungkinan dan keterbatasan dari teknologi business intelligence selama menjalankan proyek. Kegiatan Project Requirement Definition Tentukan persyaratan untuk peningkatan infrastruktur teknis, menentukan persyaratan untuk peningkatan infrastuktur nonteknis, menetapkan persyaratan untuk sumber data, tentukan persyaratan untuk sumber data, review lingkup proyek, memperluas model data logis, tentukan persiapan perjanjian tingkat layanan, menulis dokumen aplikasi persyaratan Langkah 5: Data Analysis Tantangan terbesar untuk semua pendukung keputusan
proyek-proyek business
intelligence adalah kualitas dari sumber data. Kebiasaan buruk yang dikembangkan selama beberapa dekade sulit untuk dihentikan, dan kerusakan yang diakibatkan dari kebiasaan buruk adalah biaya mahal, memakan waktu, dan sulit menemukan suatu kebenaran. Selain itu, data analisis di masa lalu terbatas pada pandangan satu baris bisnis dan tidak pernah konsolidasi atau berdamai dengan pandangan lain dalam organisasi. Langkah ini mengambil persentase yang signifikan dari waktu yang diberikan dengan jadwal keseluruhan proyek. Kegiatan Data Analysis Analisis sumber data eksternal, memperbaiki Logical data model, menganalisis kualitas sumber data, memperluas logical data model perusahaan, menyelesaikan perbedaan data, menulis data-pembersihan spesifikasi Langkah 6: Application Prototyping
30
Analisis dari penyampaian fungsional, yang dulu disebut analisis sistem, yang terbaik adalah dilakukan melalui prototipe sehingga dapat dikombinasikan dengan desain aplikasi. Alat-alat baru dan bahasa pemrograman memungkinkan pengembang untuk dengan cepat membuktikan atau menyangkal suatu konsep atau ide. Prototyping juga memungkinkan orang-orang bisnis untuk melihat potensi dan batas-batas teknologi, yang memberikan mereka kesempatan untuk menyesuaikan kebutuhan proyek mereka dan harapan mereka. Kegiatan Application Prototyping Menganalisis kebutuhan akses, menentukan cakupan prototipe, pilih alat untuk prototipe, siapkan prototipe chapter, desain laporan dan query, membangun prototipe, menunjukkan prototipe Langkah 7: Metadata Repository Analysis Memiliki peralatan lebih berarti memiliki metadata yang lebih teknis di samping data bisnis meta, yang biasanya ditangkap dalam rekayasa perangkat lunak berbantuan komputer (CASE) alat pemodelan. Metadata teknis yang perlu dipetakan ke data bisnis meta, dan semua metadata harus disimpan dalam repository metadata. Metadata repository dapat dibeli atau dibangun. Dalam kasus yang lain, persyaratan untuk jenis metadata untuk menangkap dan menyimpan harus didokumentasikan dalam logical meta model. Ketika lisensi produk repository metadata, persyaratan didokumentasikan pada logical data model harus dibandingkan dengan model meta vendor, jika disediakan. Selain itu, persyaratan untuk menyampaikan metadata untuk komunitas bisnis harus dianalisis (misalnya, fungsi Help).
31
Kegiatan Metadata Repository Analysis Menganalisis kebutuhan repository metadata, menganalisis kebutuhan antarmuka untuk repository metadata, penganalisis repository metadata dan kebutuhan laporan, buat logical metadata, buat meta-meta data
Design Stage Langkah 8: Database Design Satu atau lebih database sasaran business intelligence akan menyimpan data bisnis dalam bentuk rinci atau berhubungan, tergantung pada persyaratan pelaporan dari komunitas bisnis. Tidak semua persyaratan pelaporan yang strategis, dan tidak semua dari mereka adalah multidimensi. Skema desain database harus sesuai dengan kebutuhan akses informasi dari komunitas bisnis. Kegiatan Database Design Meninjau kebutuhan akses data, menentukan agregasi dan ringkasan persyaratan, desain database sasaran business intelligence, desain stuktur database, membangun database sasaran business intelligence, mengembangkan prosedur pemeliharaan database, bersiaplah untuk memantau dan menyesuaikan desain database Langkah 9: Extract / Transform / Load Design Sekumpulan proses ETL yang bersifat kecil, namun rendahnya kualitas sumber data biasanya memerlukan banyak waktu untuk menjalankan program transformasi dan pembersihan. Penyelesaian sekumpulan proses ETL adalah tantangan bagi kebanyakan organisasi.
32
Kegiatan Extract / Transform / Load Design Buat sumber untuk sasaran pemetaan dokumen, menguji fungsi alat ETL, desain aliran proses ETL, desain program ETL, mengatur staging area ETL Langkah 10: Metadata Repository Design Jika repository metadata yang berlisensi, kemungkinan besar akan harus ditingkatkan dengan fitur yang didokumentasikan pada logical data model tetapi tidak disediakan oleh produk. Jika repository metadata sedang dibangun, keputusan harus dibuat apakah repository metadata desain database akan berdasarkan hubungan antara entitas atau object oriented. Dalam kedua yang lain, desain harus memenuhi persyaratan logical meta model. Kegiatan Metadata Repository Design Desain database repositoy metadata, menginstal dan menguji produk repository metadata, desain proses migrasi metadata, desain aplikasi metadata
The Construction Stage Langkah 11: Extract / Transform / Load Development Banyak alat yang tersedia untuk proses ETL, beberapa canggih dan beberapa sederhana. Tergantung pada persyaratan untuk pembersihan data dan transformasi data yang dikembangkan selama Langkah 5, Analisis Data, dan Langkah 9, ETL Desain, alat ETL mungkin atau tidak mungkin bukan solusi terbaik. Dalam kasus lain, preprocessing data dan ekstensi menulis untuk melengkapi kemampuan dari alat ETL yang sering diperlukan.
33
Kegiatan Extract / Transform / Load Development Membangun dan menguji unit proses ETL, integrasi atau uji regresi proses ETL, kinerja pengujian proes ETL, jaminan Kualitas pengujian proses ETL, penerimaan pengujian proses ETL Langkah 12: Application Development Setelah upaya prototipe telah menguat sampai persyaratan fungsional, perkembangan dari akses dan aplikasi analisis dapat dimulai. Mengembangkan aplikasi dapat menjadi masalah sederhana menyelesaikan sebuah prototipe operasional, atau dapat lebih melibatkan upaya pengembangan yang menggunakan perbedaan, akses yang lebih kuat dan alat analisis. Dalam kasus lainnya, kegiatan aplikasi front-end pembangunan biasanya dilakukan secara paralel dengan kegiatan back-end ETL pengembangan dan pengembangan metadata repository. Kegiatan Application Development Tentukan persyaratan proyek akhir, desain program aplikasi, membangun dan menguji unit program aplikasi, uji program aplikasi, menyediakan akses data dan pelatihan analisis Langkah 13: Data Mining Banyak organisasi tidak menggunakan business intelligence untuk mendukung pengambilan keputusan mereka. Aplikasi business intelligence sering terbatas pada penulisan laporan, beberapa di antaranya bahkan bukan tipe baru dari laporan tapi pengganti laporan lama. Umpan balik berasal dari informasi yang tersembunyi dalam data organisasi, yang dapat ditemukan hanya dengan alat data mining.
34
Kegiatan Data Mining Pengelompokan masalah bisnis, mengumpulkan data, konsolidasi dan membersihkan data, siapkan data, membangun model data analitikal, menginterpretasikan hasil data mining, melakukan validasi eksternal dari hasil, monitor data model analitical dari waktu ke waktu. Langkah 14: Metadata Repository Development Jika keputusan dibuat untuk membangun sebuah repository metadata daripada satu lisensi, sebuah tim terpisah biasanya diisi dengan proses pengembangan. Ini proyek yang cukup besar menjadi dalam proyek business intelligence secara keseluruhan. Kegiatan Metadata Repository Development Membangun database repository metadata, membangun dan menguji unit proses migrasi metadata, membangun dan menguji unit apliaksi metadata, uji program repository metadata atau fungsi produk, siapkan repository metadata untuk produksi, menyediakan pelatihan repository metadata.