BAB 2 LANDASAN TEORI
2.1.
Teori Umum 2.1.1. Pengertian Data Menurut Frost, Day dan Slyke (2006, p6), secara tradisional data adalah nilai yang disimpan ke dalam database. Menurut Indrajani (2009, p2), data adalah fakta atau observasi mentah yang biasanya mengenai fenomena bisnis atau transaksi bisnis. Lebih khusus lagi, data adalah ukuran objektif dari atribut (karakteristik) dari entitas seperti orang, tempat, benda atau kejadian.
2.1.2. Database dan DBMS (Database Management Sistem) 2.1.2.1.
Pengertian Database Menurut Connolly dan Begg (2010,p65), database adalah kumpulan data secara logis terkait, dan deskripsi dari data ini, didesain untuk memenuhi kebutuhan informasi sebuah
organisasi.
Database
adalah
tunggal,
tempat
penyimpanan data yang besar yang dapat digunakan secara bersama-sama oleh banyak departemen dan pengguna.
8
9
Menurut Frost, Day dan Slyke (2006, p6), database adalah sekumpulan data yang digunakan oleh sebuah sistem.
2.1.2.2.
Pengertian DBMS (Database Management System) Menurut Connolly dan Begg (2010, p66), database management system adalah sebuah sistem software yang memungkinkan pengguna untuk mendefinisikan, membuat, memelihara, dan mengontrol akses ke database. Menurut Frost, Day dan Slyke (2006, p6), database management system adalah sekumpulan program yang membantu
menyimpan,
mengatur
dan
menggunakan
sekumpulan data, tanpa memperhatikan form. Secara formal, database management sistem adalah software yang membuat, mengatur dan menggunakan database.
2.1.2.3.
Keuntungan DBMS (Database Management System) Keuntungan DBMS yang diuraikan Connolly dan Beg (2010, p77) : 1. Mengontrol pengulangan data 2. Data yang konsisten 3. Dapat memperoleh informasi yang lebih banyak dari jumlah data yang sama. 4. Pemakaian data secara bersama-sama
10
5. Meningkatkan integritas data 6. Meningkatkan keamanan 7. Penetapan standarisasi 8. Perbandingan skala ekonomi 9. Menyeimbangi konflik kebutuhan 10. Meningkatkan akses dan respon dari data 11. Meningkatkan produktifitas 12. Meningkatkan pemeliharaan data melalui data independen 13. Meningkatkan konkurensi 14. Meningkatkan layanan backup dan recovery
Menurut William dan Sawyer (2007, p422) , keuntungan dari DBMS adalah : 1. Pengulangan data berkurang Pengulangan data atau repetisi, berarti bahwa field data yang sama muncul berkali-kali dalam file yang berbeda dan terkadang format yang berbeda. Dalam sistem pemrosesan yang lama, file-file yang berbeda akan mengulang data yang sama sehingga memboroskan ruang penyimpanan. Dalam DBMS, informasi hanya muncul sekali, karena itulah kapasitas penyimpanan banyak tersisa.
11
2. Integritas data meningkat Integritas data berarti data itu akurat, konsisten, dan terbaru. Dalam sistem lama, ketika ada perubahan dalam suatu file, perubahan ini tidak perlu dibuat dalam file lain. Akibatnya, beberapa laporan memiliki informasi yang
tidak
akurat.
Dalam
DBMS,
berkurangnya
pengulangan berarti meningkatkan kesempatan integritas data, kesempatan bahwa data akurat, konsisten dan terbaru karena semua perubahan hanya dilakukan di satu tempat. Selain itu, banyak DBMS menyediakan sistem cek bawaan yang membantu memastikan akurasi data yang dimasukkan. Ungkapan GIGO (garbage in garbage out) menunjukkan bahwa sebuah database dengan data yang tidak benar akan menghasilkan informasi yang tidak benar juga.
3. Keamanan meningkat. Walaupun berbagai departemen bisa berbagi akses data, namun akses ke informasi bisa dibatasi hanya untuk pengguna tertentu.
12
4. Kemudahan memelihara data. DBMS
menawarkan
prosedur
standar
untuk
menambahkan, mengedit dan menghapus rekaman juga untuk memvalidasi pemeriksaan untuk memastikan bahwa data yang tepat sudah dimasukkan dengan benar dan lengkap ke dalam masing-masing jenis field. Utilitas
backup
data
membantu
memastikan
tersedianya data jika terjadi kegagalan sistem primer.
2.1.2.4.
Kekurangan DBMS (Database Management System) Kekurangan dari Database Management System (DBMS) menurut Connolly dan Beg (2010, p80): 1. Kompleksitas 2. Ukuran yang besar karena kompleksitas yang terjadi 3. Biaya DBMS yang beragam tergantung pada lingkungan dan fungsi yang disediakan 4. Tambahan biaya untuk hardware 5. Biaya konversi yang dibutuhkan untuk penggunaan DBMS yang baru 6. Performa kinerja menurun 7. Tingkat kegagalan yang lebih besar
13
2.1.2.5.
Fasilitas DBMS (Database Management System) Menurut Conolly dan Begg (2010,p66), fasilitasfasilitas yang disediakan oleh DBMS adalah : a. DDL (Data Definition Language) adalah suatu bahasa yang memperbolehkan DBA (Database Administrator) ataupun user untuk menentukan tipe, struktur, dan batasan keamanan data yang akan disimpan pada database. b. DML (Data Manipulation Language) adalah suatu bahasa yang memiliki fasilitas untuk mengoperasikan data yang ada dalam database. Misalnya insert, edit, delete, dan update. c. SQL (Structured Query Language) adalah suatu bahasa yang memberikan layanan akses terhadap data. Contoh dari layanan akses yang diberikan adalah : - Sistem keamanan, yang mencegah pengguna yang tidak memiliki hak untuk mengakses database; - Sistem integritas, yang mempertahankan konsistensi data yang tersimpan; - Sistem kontrol konkurensi, yang memungkinkan untuk mengakses database secara bersama-sama.
14
2.1.3. ERD (Entity Relationship Diagram) 2.1.3.1.
Pengertian ERD Menurut Frost, Day dan Slyke (2006, p17), entity relationship diagram adalah sebuah model visual dari berbagi entitas dan hubungannya. Sebuah diagram yang terdiri dari entitas, hubungan antar entitas dan batasan kardinalitas.
2.1.3.2.
Entitas Menurut Frost, Day dan Slyke (2006, p16), entitas adalah kata benda, mereka adalah orang, tempat atau benda yang menjadi objek di dunia , sebagai contoh pegawai, pesanan atau buku). Menurut Conolly dan Begg (2010,p372), entitas adalah sekelompok objek dengan properti yang sama, yang diidentifikasi oleh perusahaan. Gambar 2.1 di bawah menjelaskan contoh diagram untuk entitas dengan nama Staff dan Branch. Dimana bentuk gambar untuk menyatakan entitas adalah persegi dan nama entitas diletakkan didalam entitas.
15
Gambar 2.1 Diagram untuk Tipe Entitas Staff dan Branch (Connolly dan Begg, 2010, p374)
2.1.3.3.
Relationship Menurut
Frost,
Day
dan
Slyke
(2006,
p16),
relationship adalah kata kerja , mereka menunjukkan aksi atau kepunyaan, sebagai contoh pelanggan memberikan pesanan, pegawai memiliki kewajiban, dokter mengobati pasien dan pasien mengunjungi beberapa dokter. Jadi, relationship adalah hubungan secara logis antara banyak record yang berasal dari dua atau lebih tabel. Menurut
Connolly
dan
Begg
(2010,
p374),
relationship adalah sekumpulan hubungan antara satu atau lebih entitas yang memiliki arti. Gambar 2.2 di bawah menjelaskan contoh diagram untuk entitas dengan nama Staff dan Branch. Dimana bentuk gambar untuk menyatakan entitas adalah persegi dan nama entitas diletakkan didalam entitas. Dan hubungan antara Staff
16
dan Branch adalah ‘memiliki’ dengan panah yang menunjuk pada Staff yang artinya Branch memiliki Staff.
Gambar 2.2 Diagram Untuk Tipe Relationship Branch Memiliki Staff (Connolly dan Begg, 2010, p376)
2.1.3.4.
Keys Menurut Indrajani (2009, p154), jenis-jenis key adalah sebagai berikut : 1. Candidate key adalah jumlah minimal atribut-atribut yang dapat mengidentifikasikan setiap kejadian atau record secara unik. 2. Primary key adalah candidate key yang dipilih untuk mengidentifikasikan setiap kejadian atau record dari suatu entitas secara unik. 3. Composite key adalah candidate key yang terdiri atas dua atau lebih atribut.
17
2.1.3.5.
Cardinality Menurut Frost, Day dan Slyke (2006, p20), cardinality adalah istilah teknis yang digunakan untuk mendefinisikan banyak record dalam relationship. Cardinality pada umumnya ditunjukkan dalam bentuk one-to-many, walupun ada juga desain yang menggunakan kardinalitas one-to-one dan many-to-many. Menurut Connolly dan Begg (2010, p390), cardinality mengidentifikasi nilai maksimum relationship yang mungkin terjadi antara entity yang terlibat dalam tipe relationship yang ada. Berikut adalah simbol-simbol notasi cardinalitas : Interpretasi
Minim
Maksim Notasi Grafis
kardinalitas
um
um
1
1
0
1
Tepat satu (Satu dan hanya satu)
Nol atau satu
atau
18
Satu atau
Banyak 1
lebih
(>1)
Nol, satu atau
Banyak 0
lebih
(>1)
Banya Lebih dari
Banyak k
satu
(>1) (>1) Tabel 2.1 Notasi Kardinalitas
2.1.4. DFD (Data Flow Diagram) Menurut Whitten, Bentley, dan Dittman (2004, p357), data flow diagram adalah sebuah sarana yang menggambarkan aliran data dan proses kerja data yang terjadi pada sistem. Untuk merancang data flow diagram kita dapat menggunakan simbol-simbol yang dikutip oleh Whitten, Bentley, dan Dittman menurut DeMarco dan Gene dan Sarson adalah sebagai berikut : DeMarco Yourdan
Proses
Gene dan Sarson
19
Data Store
Source/Sink
Data flow Tabel 2.2 Perbandingan Simbol Diagram Aliran Data
2.1.5. OLTP (Online Transaction Processing) Menurut Connolly dan Begg (2010, p1199), OLTP adalah sebuah sistem yang dirancang untuk memproses transaksi dalam jumlah yang besar, berulang, dan mengalamani perubahan secara intensif setiap waktunya. Data di dalam OLTP diatur sesuai transaksi terkait dengan aplikasi bisnis dan mendukung keputusan sejumlah pengguna operasional bersamaan setiap hari.
2.1.6. Data Warehouse 2.1.6.1.
Pengertian Data Warehouse Menurut Connolly dan Begg (2010, p321), data warehouse adalah sebuah kumpulan data yang bersifat subject-oriented, time-varriant, dan non-volatile dalam rangka mendukung proses pengambilan keputusan manajemen.
20
2.1.6.2.
OLAP (Online Analytical Processing) Menurut Connolly dan Begg (2010, p1250), OLAP adalah perpaduan dinamis, analisis, dan konsolidasi volume data multidimensional yang besar. Dalam Codde et al., OLAP merupakan istilah yang menggambarkan teknologi view multidimensional kumpulan data yang menyediakan akses yang cepat pada informasi strategis untuk tujuan anlisis lebih lanjut. OLAP memungkinkan pengguna untuk lebih mengerti dan mengetahui bermacam-macam aspek data perusahaan melalui akses yang cepat, konsisten, dan interaktif pada bermacam-macam kemungkinan view data.
2.1.6.3.
Perbandingan
Sistem
OLTP
dengan
Sistem
Data
Warehouse Menurut Connolly dan Begg (2010, p1199), secara umum perbedaan data warehouse dan OLTP adalah Karakteristik
OLTP
Data Warehouse
Mendukung proses Mendukung proses Tujuan utama operasional
analisis Dahulu (tapi juga
Umur data
Saat ini
termasuk data saat ini)
21
Tergantung dari panjangnya siklus tambahan data ke Data laten
Real-time
data warehouse (tapi juga termasuk data tambahan yang real-time) Data detail, data
Data Data detail
ringkas yang tinggi
glanularitas dan sedikit Pola dari Pola dari proses pemasukan,pengha query data kurang pusan dan queries bisa diprediksi.
Pemrosesan data yang dapat
Transaksi tingkat
data diprediksi.
sedang sampai Transaksi tingkat rendah tinggi Dapat diprediksi, Tidak dapat satu dimensi, diprediksi, Reporting
reporting yang multidimensi, tetap, statis dan reporting dinamis relatif
22
Melayani pengguna manajerial dalam Melayani jumlah sedikit (tapi pengguna Pengguna
juga mendukung operasional dalam kebutuhan analisis jumlah banyak bagi pengguna operasional)
Tabel 2.3 Perbandingan Sistem OLTP Dengan Sistem Data Warehouse
2.1.6.4.
Karakteristik Data warehouse Menurut Inmon (2005, p29), karakteristik data warehouse, yaitu: 1. Berpusat pada subjek Data
warehouse
lebih
diorganisasikan
pada
subjek-subjek utama dari perusahaan (seperti pelanggan, produk, penjualan) dibandingkan pada area aplikasi utama (seperti faktur pelanggan, kontrol stok, dan penjualan produk).
Hal
ini
mencerminkan
kebutuhan
untuk
menyimpan data pendukung keputusan dibandingkan data berorientasi aplikasi.
23
Gambar 2.3 Contoh Data Berorientasi Subjek (Inmon, 2005, p30)
2. Terintegrasi Data warehouse terintegrasi dikarenakan oleh penggabungan sumber-sumber data dari beberapa sistem aplikasi yang berbeda-beda. Sumber data sering tidak konsisten misalnya pada format data yang berbeda. Sumber data yang terintegrasi harus dibuat konsisten untuk menampilkan data yang menyatukan pandangan user.
24
Gambar 2.4 Contoh Data Terintegrasi (Inmon, 2005, p31)
3. Rentang Waktu Rentang waktu karena data warehouse hanya akurat dan valid pada suatu waktu tertentu. Perbedaan waktu pada data warehouse juga dtunjukkan pada saat yang bersamaan pada saat data dijalankan.
Gambar 2.5 Contoh Rentang Waktu (Inmon, 2005, p32)
25
4. Tidak berubah Data tidak berubah pada saat itu juga tetapi diperbaharui dari sistem operasional pada basis umum. Data baru selalu ditambahkan sebagai suatu suplemen ke database, daripada sebagai pengganti. Database terus menerus menyerap data baru, meningkatkan integrasinya dengan data sebelumnya.
Gambar 2.6 Contoh data tidak berubah (Inmon, 2005, p32)
2.1.6.5.
Keuntungan Data warehouse Keuntungan data warehouse menurut Connolly dan Beg ( 2010, p1198) : 1. Tingkat pengembalian modal tinggi 2. Keuntungan yang kompetitif 3. Meningkatkan produktifitas dari para pembuat keputusan.
26
2.1.6.6.
Struktur Data warehouse Data warehouse memiliki struktur yang spesifik serta perbedaan tingkatan summary dan detail datanya, dan juga perbedaan tentang umur data di dalamnya. Menurut Deliana, Cahya, dan Kaisariza (2009, p184), lingkungan
data
warehouse
dibagi
menjadi
beberapa
tingkatan detail. Tingkatan ini dikategorikan menjadi empat, yaitu older detail level, current detail level, lightly summarized data level, dan highly summarized data level. Aliran data berawal dari lingkungan operasional ke dalam data warehouse. Pada aliran data inilah proses transformasi terjadi. Aliran data warehouse selanjutnya berada pada tingkatan detail. Seiring berjalannya waktu , data dari current detail level mengalir menuju older detail level. Apabila terjadi summarize, maka data akan beralih dari current detail level menuju lightly summarized data level yang kemudian akan menuju highly summarized data level.
27
Gambar 2.7 Struktur Data Warehouse (Deliana, Cahya, dan Kaisariza ,2009, p183)
Komponen – komponen struktur data warehouse sebagai berikut :
1. Current Detail Data Data yang mencerminkan keadaan yang sedang berjalan saat ini dan merupakan level terendah dari data warehouse. Oleh karena itu, data di level ini belum efisien untuk digunakan sekalipun datanya detail. Hal ini dikarenakan proses analisis data menjadi rumit jika dilakukan dengan data dalam jumlah besar. Biasanya current detail memerlukan penyimpanan yang besar.
28
2. Old Detail Data Data lama (histori) berupa hasil backup yang disimpan dalam media penyimpanan yang terpisah, seperti tape atau disk dengan frekuensi akses yang relatif rendah. File atau direktori dari data ini disusun berdasarkan umur dari data untuk mempermudah pencarian atau pengaksesan kembali.
3. Lightly Summarized Data Data yang merupakan hasil ringkasan dari current detail data, namun sifatnya belum merupakan ringkasan secara total dan masih bersifat detail. Akses data ini biasanya digunakan untuk view dari suatu kondisi yang sedang atau sudah berjalan
4. Highly Summarized Data Data hasil summary yang bersifat total dan mudah diakses. Data di level ini dapat digunakan untuk mengambil keputusan di tingkat eksekutif perusahaan karena dianggap sudah representatif dan ringkas. Data ini mencerminkan keseluruhan sehingga eksekutif tidak perlu membaca dan menganalisis data dalam waktu yang lama. Selain itu, untuk melakukan analisis perbandingan data berdasarkan urutan waktu dan multidimensinya.
29
5. Metadata Metadata adalah informasi yang ada di dalam data warehouse yang mendeskripsikan mengenai struktur, isi, kunci, indeks, dan hal lain mengenai data. Metadata dipakai sebagai direktori bagi user dalam mencari data yang dibutuhkan dalam data warehouse.
2.1.6.7.
Arsitektur Data Warehouse Gambaran arsitektur dan komponen utama data warehouse menurut Anahory dan Murray (Connolly dan Begg, 2005, p1203-p1206) :
Gambar 2.8 Arsitektur Data Warehouse (Connolly dan Begg, 2010, p1204)
30
Dengan detail keterangan sebagai berikut :
1. Data Operasional Sumber data data warehouse berasal dari : a. Data operasional mainframe dalam hirarki generasi pertama dan jaringan database. Diperkirakan sebagian besar data operasional berada dalam sistem ini. b. Data departemen dalam sistem file, seperti VSAM, RMS, dan DBMS relasional, seperti Informix dan Oracle. c. Data privat yang berada di workstation dan server privat. d. Sistem eksternal seperti internet, database yang tersedia
secara
berhubungan
komersial,
dengan
atau
pemasok
database atau
yang
pelanggan
organisasi.
2. Operational Data Store Operational Data Store (ODS) adalah gudang data operasional sekarang dan terintegrasi yang digunakan untuk analisis. Membangun ODS dapat membantu data warehouse karena ODS dapat menyediakan data yang telah diekstrasi dari source sistem dan dibersihkan. Hal ini
31
berarti pekerjaan yang tersisa untuk mengintegrasikan dan merekstrusisasi data data warehouse disederhanakan.
3. ETL Manager ETL Manager menampilkan semua operasi yang berkaitan dengan ETL suatu data ke dalam data warehouse. Data dapat diekstrak langsung dari sumber data atau secara umum dari penyimpanan data operasional.
4. Warehouse Manager Operasi yang dilakukan oleh warehouse manager meliputi: a. Analisis data untuk memastikan konsistensi. b. Transformasi dan penggabungan sumber data dari penyimpanan sementara ke tabel data warehouse. c. Pembuatan indeks dan viewbase table. d. Generasi denormalisasi (jika perlu). e. Generasi agregasi (jika perlu). f. Back up dan pengarsipan data. Pada beberapa kasus, warehouse manager juga menghasilkan profil query untuk menentukan indeks dan agregasi yang tepat. Profil query dapat dihasilkan untuk setiap
pengguna,
kelompok
pengguna,
atau
data
32
warehouse
dan
berdasarkan
pada
informasi
yang
mendeskripsikan karakteristik query, seperti frekuensi, tabel target, dan ukuran result set.
5. Query Manager Query Manager menampilkan semua operasi yang berkaitan dengan pengaturan user queries. Kompleksitas dari query manager ditentukan dari fasilitas yang disediakan oleh end-user access tools dan database. Operasi ditampilkan oleh komponen ini termasuk queries yang mengarahkan ke table sebenarnya dan melakukan schedule dari eksekusi queries.
6. Detail Data Area warehouse ini menyimpan semua detail data dalam skema database. Pada kebanyakan kasus, detail data tidak disimpan online, tapi dibuat tersedia dengan mengagregasikan data ke tingkat berikutnya. Akan tetapi, secara rutin, detail data dimasukkan ke warehouse untuk menambah agregat data.
33
7. Lightly and Highly Summarized Data Area warehouse ini bersifat sementara karena akan berubah secara terus menerus sebagai respon perubahan profil
query.
Tujuan
ringkasan
informasi
yaitu
mempercepat kinerja query. Walaupun ada peningkatan biaya operasional yang berhubungan dengan ringkasan awal data, hal ini juga diimbangi dengan penghilangan kebutuhan untuk melakukan operasi summary terus menerus (seperti sorting atau grouping) dalam menjawab permintaan pengguna. Ringkasan data terus diperbarui ketika ada data baru masuk ke warehouse.
8. Pengarsipan atau Back Up Data Area warehouse menyimpan detail dan ringkasan data untuk pengarsipan dan back up. Walaupun ringkasan data dihasilkan dari detail data, mungkin perlu untuk back up ringkasan data online jika data tersebut disimpan di luar waktu penyimpanan detail data. Data ditransfer ke arsip penyimpanan, seperti pita magnetik atau disk optik.
34
9. Metadata Struktur metadata berbeda antara tiap proses karena tujuannya berbeda. Hal ini berarti beberapa salinan metadata mendeskripsikan item data yang sama di data warehouse.
10. End-User Access Tools Tujuan utama dari data warehouse adalah untuk memberikan informasi
kepada business user untuk
mengambil keputusan strategis. User berinteraksi dengan data warehouse menggunakan end-user access tools. Data warehouse harus secara efisien mendukung ad hoc dan analisis
rutin.
Kinerja
tinggi
perencanaan persyaratan untuk
dicapai
dengan
pra
join, summation, dan
laporan periodik oleh end user. Walaupun definisi dari end-user access tools tumpang tindih , end-user access tools dikategorikan menjadi empat kelompok utama, yaitu : a. Reporting dan query tools. b. Application development tools. c. Online Analytical Processing (OLAP) tools. d. Data mining tools.
35
2.1.6.8.
Aliran Data dalam Data Warehouse Menurut Hackatorn (Connolly dan Begg, 2005, p1161p1162), aliran data warehouse berfokus pada manajemen lima data flow primer, yaitu : 1. Inflow : Ekstrak, penghapusan, dan loading sumber data. 2. Upflow : Menambahkan nilai pada data di data warehouse melalui ringkasan, packaging, dan distribusi data. 3. Downflow : Pengarsipan dan back up data di data warehouse. 4. Outflow : Membuat data tersedia untuk pengguna akhir. 5. Metaflow : Mengatur metadata.
Gambar 2.9 Aliran Informasi Data Warehouse (Connolly dan Begg, 2005, p1162)
36
2.1.6.9.
Surrogate Key Menurut Imhoff, Galemmo, dan Geiger (2003, p149), surrogate key adalah nilai pengganti. Biasanya merupakan nilai numerik acak yang diberikan oleh proses load atau sistem database. Keuntungannya yaitu dapat terstruktur sehingga selalu unik di rentang integrasi untuk data warehouse.
2.1.6.10.
Bentuk Data Warehouse Menurut Deliana, Cahya, dan Kaisariza (2009, p185), bentuk data warehouse yaitu : 1. Functional
Data
Warehouse
(Data
Warehouse
Fungsional) Data warehouse ini dibuat berdasarkan fungsi yang berada di dalam perusahaan. Kata operasional disini merupakan basis data yang diperoleh dari kegiatan seharihari. Data Warehouse
dibuat lebih dari satu dan
dikelompokkan berdasarkan fungsi-fungsi yang ada di dalam perusahaan seperti fungsi keuangan (financial), marketing, personalia, dan lain-lain. Keuntungan membangun data warehouse dengan bentuk seperti ini adalah sistem mudah dibangun dan biaya relative murah, sedangkan kerugiannya adalah
37
resiko dalam konsistensi data dan terbatasnya kemampuan dalam pengumpulan data bagi pengguna.
Gambar 2.10 Data Warehouse Fungsional (Deliana, Cahya, dan Kaisariza, 2009, p185)
2. Centralized Data Warehouse (Data Warehouse Terpusat) Sekilas bentuknya menyerupai functional data warehouse
namun dalam centralized data warehouse
data dikumpulkan terlebih dahulu dalam satu tempat terpusat, setelah itu data-datanya dipisahkan berdasakan fungsi-fungsi yang dibutuhkan oleh perusahaan. Keuntungan menggunakan bentuk ini adalah tingkat konsistensi data yang tinggi karena data yang ada di dalamnya benar-benar terpadu, sedangkan kerugiannya
38
adalah biaya yang mahal serta memerlukan waktu yang cukup lama untuk membangunnya.
Gambar 2.11 Data Warehouse Terpusat (Deliana, Cahya, dan Kaisariza, 2009, p186)
3. Distributed Data Warehouse (Data Warehouse Terdistribusi) Distributed data warehouse merupakan gateway yang berfungsi sebagai jembatan atau penghubung antara source (lokasi data dari data warehouse) dengan workstation yang menggunakan sistem yang beraneka ragam dan berbeda, sehingga
memungkinkan
bagi
pengguna
untuk
dapat
mengakses sumber data yang berada di luar lokasi perusahaan. Keuntungan distributed data warehouse
adalah
memungkinkan adanya pengaksesan data dari luar perusahaan, karena sebelumnya telah dilakukan sinkronisasi terlebih dahulu pada data-data yang ada di dalamnya agar konsistensi
39
data tetap terjaga. Kerugiannya adalah harga serta sistem pembuatan data dari data warehouse bentuk ini yang paling mahal serta paling kompleks apabila dibandingkan dengan bentuk-bentuk data warehouse yang lainnya.
Gambar 2.12 Data Warehouse Terdistribusi (Deliana, Cahya, dan Kaisariza, 2009, p187)
2.1.7. Tabel Fakta Menurut Deliana, Cahya, dan Kaisariza (2009, p188), tabel fakta merupakan tabel yang pada umumnya mengandung angka dan data history dimana key (kunci) yang dihasilkan sangat unik karena key-nya merupakan kumpulan foreign key dari primary key yang ada pada masing-masing tabel dimensi yang berhubungan.
2.1.8. Tabel Dimensi Menurut Deliana, Cahya, dan Kaisariza (2009, p188), tabel dimensi adalah tabel yang berisikan kategori dengan ringkasan data detail yang dapat dilaporkan, seperti laporan keuntungan pada tabel fakta yang
40
dilaporkan sebagai dimensi waktu (berupa per bulan, per kuartal dan per tahun).
2.1.9. Cube Menurut Jensen, Pedersen, dan Thomsen (2010, p7), cube adalah struktur data multidimensional untuk menangkap dan menganalisis data. Walaupun istilah “cube” memberikan kesan terdiri dari tiga dimensi, cube dapat terdiri dari beberapa dimensi. Untuk alasan itu, istilah hypercube digunakan sebagai pengganti istilah cube. Kumpulan cube yang berkaitan biasanya disebut database multidimensional atau data warehouse multidimensional.
2.1.10. Dimensionality Modeling Menurut Connolly dan Begg (2010, p1227), dimensionality modeling adalah teknik perancangan logikal yang bertujuan untuk mewakili data dalam sebuah standar, bentuk intuitif yang memungkinkan untuk akses dengan kinerja yang tinggi. Dimensionality modelling menggunakan konsep Entity Relationship (ER) modeling dengan beberapa batasan penting. Setiap model dimensi tersusun dari satu tabel dengan sebuah composite primary key, yang disebut tabel fakta, dan kumpulan tabel yang lebih kecil yaitu tabel dimensi. Setiap tabel dimensi memiliki sebuah primary key yang berhubungan dengan satu komponen composite key di tabel fakta. Fitur lain yang penting pada model dimensi
41
yaitu semua natural key digantikan dengan surrogate key. Hal ini berarti setiap penggabungan antara tabel fakta dan dimensi berdasarkan pada surrogate key, bukan natural key. Surrogate key digunakan untuk mengizinkan data di data warehouse tidak bergantung dari data yang digunakan dan dihasilkan oleh sistem OLTP.
2.1.11. Star Schema Menurut Connolly dan Begg (2010, p1227-1229) star schema adalah struktur logika yang di tengahnya merupakan tabel fakta yang berisi data faktual yang dikelilingi tabel dimensi yang berisi data referensi (yang bisa didenormalisasi). Sangat penting untuk membuat tabel fakta sebagai data read-only yang tidak berubah dari waktu ke waktu. Fakta yang paling berguna dalam tabel fakta adalah numerik dan aditif karena aplikasi data warehouse hampir tidak pernah mengakses single record dibandingkan ratusan, ribuan, bahkan jutaan record pada suatu waktu dan hal yang paling berguna dilakukan dengan banyak record adalah dengan menyatukannya. Tabel dimensi, sebaliknya umumnya berisi informasi tekstual deskriptif. Atribut dimensi digunakan sebagai pembatas dalam query data warehouse. Star schema dapat digunakan untuk mempercepat kinerja query dengan denormalisasi informasi reference ke dalam satu tabel dimensi.
42
Gambar 2.13 Star Schema (Connolly dan Begg, 2010, p1228)
2.1.12. ETL (Extract Transform Load) Menurut Connolly dan Begg (2010, p1208-1209) Extract Transform Load adalah proses pencarian data, mengintegrasikannya, dan menempatkannya dalam data warehouse.
Extract Tujuan dari proses ekstrak adalah untuk mencapai sumber sistem dan mengumpulkan data yang diperlukan untuk data warehouse. Biasanya data dikonsolidasi dari sumber sistem yang berbeda yang
43
mungkin menggunakan data organisasi atau format yang berbeda sehingga ekstraksi harus mengubah data menjadi format yang sesuai untuk pemrosesan transformasi. Kompleksitas ekstraksi dapat bervariasi dan tergantung pada tipe sumber data. Proses ekstraksi juga mencakup seleksi data sebagai sumber yang biasanya berisi data redundansi atau data yang kurang penting. Agar ekstraksi ETL sukses, dibutuhkan pemahaman tentang data layout. Tool ETL yang baik juga memungkinkan penyimpanan data versi intermediate diekstrak. Hal ini disebut “staging area” dan memungkin reload data mentah pada kasus masalah loading lebih lanjut, tanpa reekstraksi. Data mentah juga harus di-backup dan diarsipkan.
Transform Tahap transformasi pada proses ETL mencakup aplikasi dari rangkaian aturan atau fungsi untuk data diekstraksi. Hal ini mencakup validasi record dan penolakannnya jika tidak diterima sebagai bagian dari integrasi. Jumlah manipulasi yang dibutuhkan untuk proses transformasi tergantung pada data. Sumber data yang baik akan membutuhkan sedikit transformasi, sementara yang lain mungkin membutuhkan satu atau lebih teknik transformasi untuk memenuhi persyaratan bisnis dan teknis dari target database atau data warehouse. Proses yang paling umum digunakan untuk transformasi adalah konversi, menghilangkan duplikasi, standarisasi, menyaring, mengurutkan, menerjemahan dan mencari atau
44
memverifikasi jika sumber data tidak konsisten. Tool ETL yang baik harus
memungkinkan
membangun
proses
yang
kompleks
dan
memperluas tool library sehingga fungsi custom user dapat ditambahkan.
Load Loading adalah tahap terakhir proses ETL dan load data yang diekstrak dan ditransformasi menjadi target repository. Ada beberapa cara ETL load data. Beberapa di antaranya, menambahkan tiap record secara fisik sebagai baris baru ke dalam tabel target data warehouse yang melibatkan SQL insert statement build-in, sedangkan yang lain menghubungkan proses ekstraksi, transformasi, dan loading dengan tiap record dari sumber. (http://www.etltools.org/)
2.1.13. Data mart Menurut Connolly dan Begg (2002, p1171-p1173), data mart adalah bagian dari data warehouse yang mendukung kebutuhan departemen atau fungsi bisnis tertentu. Data mart dapat berdiri sendiri atau dihubungkan secara terpusat dengan data warehouse perusahaan. Karakteristik yang membedakan data mart dan data warehouse adalah : •
Data mart hanya berfokus pada kebutuhan user yang berhubungan dengan satu departemen atau fungsi bisnis.
45
•
Data mart biasanya tidak berisi data operasional, tidak seperti data warehouse.
•
Karena data mart berisi data yang lebih sedikit dibandingkan dengan data warehouse, data mart lebih mudah dimengerti dan dinavigasi. Ada beberapa pendekatan dalam membangun data mart.
Pendekatan yang pertama yaitu membangun beberapa data mart kemudian mengintegrasikannya pada data warehouse. Pendekatan yang lain yaitu membangun infrastruktur untuk data warehouse perusahaan dan membangun satu atau lebih data mart untuk memenuhi segera kebutuhan perusahaan pada saat yang bersamaan. Alasan perlu dibuat data mart, yaitu: •
Untuk memberikan pengguna akses pada data yang sering mereka butuhkan untuk analisis.
•
Untuk menyediakan data dalam bentuk yang sesuai dengan pandangan data bersama oleh sekelompok pengguna pada suatu departemen atau fungsi bisnis.
•
Meningkatkan waktu respon pengguna karena pengurangan volume data yang diakses.
•
Menyediakan data terstruktur sesuai kebutuhan access tool pengguna akhir, seperti online anlytical processing (OLAP) dan data mining tools yang membutuhkan struktur database internalnya.
46
•
Data mart biasanya menggunakan data yang sedikit sehingga tugas seperti membersihkan data, loading, transformasi, dan integrasi jauh lebih mudah. Oleh karena itu, implementasi dan pengaturan data mart lebih sederhana daripada membangun data warehouse perusahaan.
•
Biaya implementasi data mart biasanya lebih sedikit daripada membangun data warehouse.
•
Pengguna data mart yang potensial lebih jelas dan lebih mudah ditargetkan untuk memperoleh dukungan untuk proyek data mart dibandingkan dengan proyek data warehouse perusahaan.
2.1.14. Metodologi Perancangan Database untuk Data Warehouse Menurut Kimball (Connolly dan Begg, 2010, p1231-1238), metodologi perancangan database untuk data warehouse, yaitu: 1. Memilih proses Proses (fungsi) yang mengacu pada subjek data mart tertentu. Data mart yang pertama kali dibangun seharusnya yang pertama kali dikirim tepat waktu, dalam anggaran, dan untuk menjawab pertanyaan-pertanyaan bisnis yang paling penting secara komersial. 2. Memilih grain Memilih grain berarti memutuskan apa yang diwakili record tabel fakta. Dimensi dari tabel fakta baru bisa diidentifikasi hanya jika grain untuk tabel fakta telah dipilih. Keputusan grain untuk tabel fakta juga menentukan grain untuk setiap tabel dimensi.
47
3. Mengidentifikasi dan menyesuaikan dimensi Dimensi menetapkan konteks untuk mengajukan pertanyaan tentang fakta di tabel fakta. Serangkaian dimensi yang dibangun dengan baik membuat data mart lebih mudah dimengerti dan digunakan. Jika ada dimensi pada dua data mart, dimensi tersebut harus sama, atau salah satunya merupakan bagian matematis dari yang lain. 4. Memilih fakta Grain dari tabel fakta menentukan fakta mana yang digunakan di data mart. Semua fakta harus diekspresikan pada tingkat yang disiratkan oleh grain. Selain itu, fakta harus numerik dan aditif. 5. Menyimpan pra kalkulasi di tabel fakta Setelah fakta telah dipilih, setiap fakta harus diperiksa kembali untuk menentukan apakah ada peluang untuk menggunakan pra kalkulasi. Contoh umum kebutuhan menyimpan pra kalkulasi terjadi ketika fakta terdiri dari pernyataan laba rugi. 6. Menyempurnakan tabel dimensi Pada tahap ini kembali ke tabel dimensi dan tambahkan deskripsi teks pada dimensi. Deskripsi teks harus intuitif dan dimengerti oleh pengguna. Kegunaan data mart ditentukan oleh ruang lingkup dan sifat atribut dari tabel dimensi.
48
7. Memilih durasi database Di banyak perusahaan ada kebutuhan untuk melihat periode waktu yang sama satu atau dua tahun sebelumnya. Tabel fakta yang sangat besar menimbulkan setidaknya dua masalah besar pada rancangan data warehouse. Pertama, semakin tua data, semakin besar kemungkinan
munculnya
masalah
dalam
membaca
dan
menginterpretasikan file atau tape lama. Kedua, wajib menggunakan versi lama dimensi yang penting, bukan versi terbaru. 8. Melacak perubahan dimensi secara perlahan Ada tiga tipe perubahan dimensi secara perlahan: Tipe pertama, dimana atribut dimensi yang berubah ditimpa; Tipe kedua dimana atribut dimensi yang berubah menyebabkan record dimensi baru dibuat; Tipe ketiga, di mana atribut dimensi yang berubah menyebabkan atribut alternatif dibuat sehingga nilai atribut yang lama dan baru dapat diakses secara bersamaan pada record dimensi yang sama. 9. Menentukan prioritas dan mode query Pada tahap ini pertimbangkan masalah rancangan fisik. Masalah rancangan fisik yang paling penting yang mempengaruh persepsi data mart pengguna akhir yaitu urutan tabel fakta pada disk dan adanya pre-stored summaries atau aggregations. Di luar masalah-masalah tersebut, ada beberapa masalah isu yang
49
mempengaruhi masalah administrasi, backup, kinerja pengindeksan, dan keamanan.
2.1.15. LAN (Local Area Network) Menurut Williams dan Sawyer yang diterjemahkan oleh Rahayu, N.W. dan Prabawati, T.A. (2007, p321), LAN menghubungkan komputer dan peranti dalam cakupan geografis yang terbatas, misalnya pada satu kantor, satu gedung, atau kumpulan gedung yang berdekatan.
2.1.16. Server Menurut Williams dan Sawyer yang diterjemahkan oleh Rahayu, N.W. dan Prabawati, T.A. (2007, p23), server adalah komputer sentral yang menangani kumpulan data (database) dan program untuk menghubungkan dan member layanan ke PC / workstation dan alat-alat yang disebut komputer client.
2.1.17. Client Menurut Williams dan Sawyer yang diterjemahkan oleh Rahayu, N.W. dan Prabawati, T.A. (2007, p109), client adalah komputer yang meminta data atau layanan.
50
2.2.
Teori Khusus 2.2.1. Yellow Pages Yellow Pages adalah media informasi dalam bentuk direktori produk dan jasa disusun menurut abjad berdasarkan kelas bisnis. PIB (Petunjuk Informasi Bisnis) Yellow Pages dapat menjadi media promosi yang tepat dan efektif bagi orang-orang bisnis dengan distribusi yang luas mampu menjangkau seluruh pelosok negeri. Semua informasi dalam PIB Yellow Pages dapat diperoleh melalui berbagai multi akses, yaitu: 1. E-book dapat diakses melalui www.yellowpages.co.id 2. CD ROM E-book Yellow Pages 3. Layanan pelanggan - 5000 57 4. My Mobile Directory – 8108 5. Akses informasi 108: Ketik * 108 # tekan OK (khusus Telkomsel) 6. Aplikasi Mobile Yellow Pages, dapat di-download secara gratis melalui Blackberry di http:/ / odp.yellowpages.co.id
Sebagai media promosi yang efektif, Yellow Pages memiliki manfaat sebagai berikut : •
Multi-akses
•
Ekonomis
•
Efektif
•
Target yang sesuai sasaran (http://www.infomedianusantara.com/dmrc.asp?r=1&loc=Id)
51
2.2.2. Pemasaran Menurut Kotler dan Keller ( 2006, p5-p6 ), pemasaran berhubungan dengan identifikasi dan mempertemukan manusia dengan kebutuhan sosial. Salah satu definisi singkat pemasaran yaitu “memenuhi kebutuhan yang menguntungkan”. Definisi formal marketing menurut Asosiasi Marketing Amerika adalah : Suatu fungsi organisasi dan kumpulan proses dalam pembentukan, komunikasi, dan membawakan hasil kepada pelanggan dan untuk mengatur hubungan pelanggan dengan cara yang menguntungkan organisasi dan pemengang saham perusahaan.
2.2.3. Oracle Warehouse Builder 10g Menurut Oracle Team (2009, p1-1, p1-2), Oracle Warehouse Builder (OWB) merupakan tool tunggal yang komprehensif untuk seluruh aspek manajemen data. OWB menjembatani database Oracle untuk mengubah data menjadi informasi dengan kualitas yang tinggi. OWB menyediakan manajemen kualitas data, audit data, permodelan relasional dan dimensional yang terintegrasi penuh serta daur hidup manajamen data dan metadata yang lengkap. OWB memungkinkan user untuk membuat data warehouse, memindahkan data dari sistem terdahulu, mengkonsolidasi data dari sumber data yang terpisah, membersihkan dan mengubah data untuk menyediakan informasi berkualitas dan mengatur metadata perusahaan.
52
Untuk mengubah kualitas data yang rendah menjadi informasi yang berkualitas tinggi diperlukan : •
Akses ke dalam beragam sumber data OWB menjembatani database Oracle untuk membuat koneksi yang transparan ke banyak database third-party, aplikasi, file dan data store.
•
Kemampuan untuk mem-profile, mengubah dan membersihkan data OWB menyediakan library transformasi data yang luas untuk tipe data seperti text, numeric, date, dan lainnya. Sebelum dimuat ke dalam penyimpanan data yang baru, dapat dilakukan profiling terhadap data untuk mengevaluasi kualitas dan kelayakannya. Berikutnya, dapat dilakukan matchmerge terhadap record menggunakan rule yang direncanakan.
•
Kemampuan untuk mengimplementasi desain untuk berbagai aplikasi Dengan
menggunakan
OWB,
user
dapat
mendesain
dan
mengimplementasikan penyimpanan data apapun yang diperlukan oleh aplikasi, baik relasional maupun dimensional. •
Menelusuri jejak audit (audit trails) Setelah mengkonsolidasi data dari berbagai sumber ke dalam penyimpanan data tunggal, tantangan yang akan ditemui adalah untuk membuktikan validitas dari informasi output. Sebagai contoh, dapatkah dicari dan dibuktikan bagaimana angka ini dihasilkan? Ini merupakan pertanyaan yang seringkali ditanyakan para pembuat keputusan dan oleh petugas pemerintah.
53
Fungsi utama dari OWB adalah penggabungan sumber data yang beragam dalam pembuatan Data Warehouse dan migrasi data dari sistem sebelumnya. Lebih jauh lagi, OWB menawarkan kemampuan untuk permodelan data relasional, dimensional dan metadata, data profiling, data cleansing dan data auditing.
2.2.4. PHP PHP merupakan bahasa script open source yang banyak digunakan dan sangat cocok digunakan untuk pengembangan web dan dapat dilekatkan dengan HTML. Kode PHP menggunakan instruksi pada akhir pemrosesan yang memungkinkan untuk masuk dan keluar dari mode PHP. PHP berbeda dari Java Script karena kode dieksekusi pada server, menghasilkan HTML yang dikirimkan ke client. Client akan menerima hasilnya tanpa mengetahui kode yang mendasarinya. (http://php.net/manual/en/introwhatis.php)