7
BAB 2 LANDAS AN TEORI
2.1 Basis Data Karena data dan basis data merupakan elemen mendasar dan sumber utama pada sistem data wareouse, pada bagian ini akan dijelaskan mengenai pengertian data, basis data, DBM S, dan data mart, hal – hal diatas dapat menjelaskan secara mendasar mengenai data dan sistem pemrosesannya. 2.1.1 Pengertian Data M enurut Inmon, W.H. (2005, p388), dikemukakan bahwa data adalah rekaman dari fakta-fakta, konsep-konsep, atau instruksi-instruksi di dalam media penyimpanan untuk komunikasi, perolehan dan pemrosesan dengan cara otomatis dan presentasi sebagai informasi yang dapat dimengerti oleh manusia. Berdasarkan pengertian di atas, dapat dilihat bahwa data adalah suatu rekaman fakta yang belum diolah dimana data tersebut diperoleh dari hasil transaksi yang nantinya dapat digunakan untuk kepentingan perusahaan.
2.1.2 Pengertian Basis Data M enurut Connolly (2005, p14), (database) merupakan kumpulan dari logical data yang berhubungan dengan deskripsi data tersebut yang dirancang untuk kebutuhan informasi suatu organisasi. M enurut Date, C. J. (2000, p10), database adalah kumpulan data tetap yang digunakan oleh suatu sistem aplikasi pada beberapa perusahaan.
8
Sedangkan menurut M cLeod (2007, p130), database adalah koleksi semua data yang berbasis komputer dalam suatu perusahaan.
2.1.3 Pengertian Database Management System (DBMS ) Database Management System (DBM S) adalah sistem perangkat lunak yang memungkinkan user untuk mendefinisikan, membuat, menjaga, dan mengontrol akses ke database (Connoly dan Begg 2005, p16), sedangkan menurut Atzeni, et al. (2003, p3) DBM S adalah sistem perangkat lunak yang dapat mengatur kumpulan data yang besar, shared, dan untuk memastikan reliabilitas dan privasi data. Seperti perangkat lunak lainnya, DBM S harus efisien dan efektif. Shared mengandung arti bahwa data tersebut dapat digunakan bersama-sama oleh para user.
2.1.4 Pengertian Data Mart Data mart menurut Inmon, W. H. (2005, p389), adalah struktur data yang terbagi-bagi yang diperoleh dari data warehouse dimana data tersebut telah didenormalisasi berdasarkan kebutuhan informasi manajemen. M enurut Kimball (2002, p396), data mart adalah bagian dari logikal dan fisikal dari area cakupan yang dimiliki oleh data warehouse. M cLeod dan Schell (2007, p191) berpendapat bahwa data mart adalah basis data yang berisi data yang hanya menjelaskan segmen dari operasi perusahaan. M enurut Turban etal (2005, p73) data mart adalah data warehouse kecil yang didesain untuk unit atau departemen bisnis strategis.
9
Sedangkan menurut Connolly dan Begg (2005, p1067) data mart adalah serangkaian data yang mendukung kebutuhan dari departemen atau fungsi bisnis tertentu. Berikut karakteristik yang membedakan antara data mart dengan data warehouse: 1. Data mart berfokus pada kebutuhan user yang berhubungan dengan satu bagian departemen atau fungsi bisnis. 2. Data mart tidak berisi data operasional yang bersifat detil. 3. Data mart lebih dimengerti dan digunakan karena berisi data yang lebih sedikit jika dibandingkan dengan data warehouse.
2.2 OLTP dan OLAP 2.2.1 Pengertian Online Transaction Processing (OLTP) M enurut Turban (2005,p214), OLTP (Online Transaction Processing) adalah sistem pemrosesan transaksi yang memungkinkan transaksi bisnis diproses secara online saat transaksi terjadi. M enurut Peterson (2000, p53), OLTP adalah aplikasi yang menjalankan operasi basis perusahaan. Fokus utama dari OLTP adalah untuk mendukung fungsi dasar sehari-hari organisasi, misalkan untuk menerima pesanan barang, pengaturan stok, pengajuan rekening pelanggan, dan sebagainya. (Groff, 1999, p736). OLTP dirancang untuk memungkinkan terjadinya pengaksesan beberapa user secara bersama-sama terhadap sumber data yang sama dan mengatur proses yang dibutuhkan, tentunya dengan performa tinggi. Transaksi yang dilakukan
10
meliputi insert, update, dan delete. Data OLTP biasanya bersifat relasional dan dalam bentuk normal ketiga.
2.2.2 Pengertian Online Analytical Processing (OLAP) M enurut Connolly dan Begg (2005, p1101), OLAP (Online Analytical Processing) adalah sintesis, analisis dan konsolidasi dinamis dari sejumlah besar data multidimensional. Sedangkan menurut M allach, Effrem G. (2000, p531), OLAP adalah suatu kategori teknologi software yang memungkinkan analis, manajer dan eksekutif lainnya untuk memperoleh wawasan tentang data dengan cepat, konsisten, dan akses interaktif ke dalam variasi yang lebih luas jika dimungkinkan untuk melihat informasi yang telah diubah dari data mentah menjadi dimensi yang nyata dari suatu perusahaan agar dimengerti oleh user. M enurut Hoffer (2005, p480), OLAP adalah sekumpulan alat grafikal yang menyediakan kepada user sebuah tampilan multidimensional dari data dan memampukan user untuk menganalisa data menggunakan teknik penyajian yang sederhana. Dapat disimpulkan bahwa pengertian OLAP adalah sebuah teknologi yang memungkinkan para eksekutif untuk dapat melihat informasi dengan cepat dalam berbagai dimensi yang ada sehingga lebih dimengerti oleh user.
11
2.3 Data Warehouse 2.3.1 Pengertian Data warehouse M enurut Imhoff, C. (2003, p400), data warehouse adalah sekumpulan data yang memiliki sifat orientasi subjek, terintegrasi, time-variant, dan nonvolatile, yang digunakan untuk mendukung proses pengambilan keputusan strategis pada perusahaan. M enurut Peterson, data warehouse adalah koleksi semua data dalam perusahaan yang digunakan untuk query analisa bisnis (2000, p55). M enurut Connolly dan Begg (2002, p1047), data warehouse adalah suatu kumpulan data yang bersifat subject-oriented, integrated, time-variant, dan nonvolatile dalam mendukung proses pengambilan keputusan. M enurut Inmon, W. H. (2005, p495), data warehouse adalah kumpulan dari basis data yang terintegrasi dan berorientasi subjek serta dirancang untuk mendukung fungsi pengambilan keputusan, dimana setiap unit data relevan terhadap satu kejadian pada waktu tertentu. Dari definisi-definisi mengenai data warehouse yang telah dijabarkan di atas, dapat disimpulkan bahwa tujuan yang ingin dicapai dalam data warehous e adalah: 1. Data warehouse sehingga data
menyediakan suatu pandangan (view) umum, warehouse akan
memiliki keleluasaan
untuk
mengakomodasi bagaimana data akan ditafsirkan atau dianilisis selanjutnya.
12
2. Data warehouse merupakan tempat penyimpanan seluruh data yang bersifat historis. Karena itu data warehouse akan bertumbuh menjadi sangat besar sehingga harus dirancang untuk mengakomodasi pertumbuhan data. 3. Data warehouse dirancang untuk menyediakan data bagi berbagai teknologi analisis dalam komunitas bisnis.
2.3.2 Karakteristik Data warehouse M enurut Imnon, W. H. (2007, p7), Data warehouse didefinisi dengan karakteristik sebagai berikut : 1. Subject-Oriented Data warehouse berorientasi subjek artinya data warehouse didesain untuk menganalisa data berdasarkan subjek-subjek tertentu yang ada di dalam sebuah organisasi, bukan pada proses atau fungsi aplikasi tertentu. Data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan
(konsumen,
produk
dan
penjualan)
dan
tidak
diorganisasikan pada area-area aplikasi utama (customer invoicing, stock control dan product sales). Hal ini dikarenakan kebutuhan dari data warehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data. Jadi dengan kata lain, data yang disimpan adalah berorientasi kepada subjek bukan terhadap proses.
13
Gambar 2.1 Contoh Data Berorientasi Subyek (Inmon, 2002, p32)
2. Integrated Karakteristik kedua dan terpenting dari data warehouse adalah integrasi. Data diambil dari banyak sumber terpisah ke dalam data warehouse. Data yang diambil itu akan diubah, diformat, disusun kembali, diringkas, dan seterusnya. Integrasi akan terjadi ketika data berasal dari lingkungan operasional yang berorientasi aplikasi ke data warehouse. Data dalam data warehouse disimpan dalam suatu format yang konsisten seperti penamaan, struktur kunci, ukuran atribut, dan karakteristik data secara fisik. Hasilnya adalah data dalam data warehouse yang mempunyai satu bentuk. Gambar 2.2 di bawah ini akan mengilustrasikan integrasi yang
14
muncul ketika data melewati lingkungan operasional berbasiskan aplikasi ke lingkungan data warehouse.
Gambar 2.2 Pokok persoalan dari integrasi (Inmon, 2005, p31).
3. Time Variant Setiap unit data dalam data warehouse hanya akurat dan tepat dalam periode waktu tertentu. Dalam beberapa kasus, record-nya berupa time stamped. Tapi dalam kasus lain, record memiliki tanggal transaksi. Tetapi dalam setiap kasus ada beberapa bentuk dari penanda waktu untuk menunjukkan waktu sepanjang record yang akurat. Lingkungan yang berbeda memiliki horizon waktu yang berbeda.
15
Horizon waktu merupakan parameter dari waktu yang direpresentasikan dalam suatu lingkungan. Time horizon yang normal untuk sistem operasional adalah sekitar 60-90 hari, sedangkan untuk data warehouse adalah sekitar 5-10 tahun. Oleh karena perbedaan dalam time horizon inilah, data warehouse mengandung histori lebih banyak dibandingkan dengan lingkungan lainnya. Data yang terdapat dalam data warehouse berhubungan dengan suatu titik atau poin pada periode waktu tertentu (semester, tahun fiskal, atau kuartal). Data tersebut merupakan hasil ringkasan. Hal ini membantu dalam menentukan kinerja dari query data warehouse, serta dalam membentuk pengertian bisnis.
Tabel 2.1 Perbandingan Time Variant antara Data Operasional dan Data warehouse (Inmon, 2002, p35)
Data Operasional
Data warehouse
- M empunyai time horizon 60-90
- M empunyai time horizon 5-10
hari
tahun
- Data atau record dapat di-update
- Data atau record tidak dapat di-
- Key structure dapat termasuk atau tidak
update
termasuk elemen waktu
- Key structure termasuk elemen waktu
16
4. Non-volatile Karakteristik keempat dari data warehouse adalah non-volatile, maksudnya data pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi basis data itu sendiri daripada sebagai sebuah perubahan. Basis data tersebut secara kontinu menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya. Berbeda dengan basis data operasional yang dapat melakukan update, insert dan delete terhadap data yang mengubah isi dari basis data, pada data warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses data warehouse seperti melakukan query atau menampilan laporan yang dibutuhkan, tidak ada kegiatan updating data).
Gambar 2.3 Gambaran pengertian Non Volatile (Inmon, 2002, p34)
17
2.3.3
Perbandingan Data warehouse dengan OLTP Secara umum perbedaan antara data warehouse dan OLTP (Connolly,
2005, p1153) adalah
Tabel 2.2 Perbedaan antara OLTP dan Data warehouse OLTP
Data warehouse
M enyimpan data saat ini
M enyimpan data histori
M enyimpan data detil
M enyimpan detailed, lightly, dan highly summarized data
Datanya bersifat dinamik
Datanya bersifat statis
Proses yang berulang kali
Prosesnya bersifat khusus dan tidak terstruktur
Transaksi tingkat tinggi
Transaksinya dari tingkat rendah hingga menengah
Pola userannya dapat diprediksi
Pola userannya tidak dapat diprediksi
Brefokus pada proses transaksi
Berfokus pada proses analisis
Berorientasi aplikasi
Berorientasi subjek
M endukung pengambilan keputusan
M endukung pengambilan keputusan
harian
strategis
M elayani user dalam jumlah besar
M elayani user dalam jumlah kecil biasanya manajer
18
2.3.4 Metadata M enurut Inmon, W.H. (2002, p393), metadata adalah data mengenai data atau deskripsi dari struktur, isi, kunci, indeks, dan lain-lain mengenai data. M enurut M allach, Effrem G. (2002, p474), metadata adalah data tentang data yang berguna sebagai pusat penyimpanan informasi untuk menjelaskan kepada user tentang apakah data warehouse itu, dari mana asalnya dan siapa yang bertanggung jawab atas hal tersebut dan sebagainya. M enurut Connolly (2005, p1055), metadata digunakan untuk berbagai tujuan meliputi : a. Proses ekstraksi dan loading Metadata digunakan untuk memetakan sumber data ke dalam pandangan umum dari data dalam warehouse. b. Proses manajemen warehouse Metadata digunakan untuk mengotomatiskan pembuatan tabel ringkasan. c. Sebagai bagian dari proses manajemen query Metadata digunakan untuk menghubungkan suatu query dengan sumber data yang tepat. M enurut Inmon, W. H. (2005, p269-270), hal-hal penting dari metadata meliputi: a. ID dokumen b. Tanggal mengentri data ke warehouse c. Deskripsi dari dokumen d. Sumber dari dokumen
19
e. Tanggal sumber dari dokumen f. Klasifikasi dokumen g. Indeks h. Lokasi fisikal i. Panjang dokumen j. Referensi yang terhubung dengan dokumen Adapun syarat-syarat dalam pembuatan metadata menurut Inmon, W. H. (2005, p102) : a. Struktur data yang dikenal programmer b. Struktur data yang dikenal analis DSS c. Sumber data yang membantu data warehouse d. Transformasi data ketika dilewatkan ke data warehouse e. M odel data f. Hubungan antara model data dan data warehouse g. History dari extracts M enurut Ponniah (2001, p36), metadata dalam data warehouse dibagi menjadi 3 kategori, yaitu : a. Metadata operasional Metadata operasional berisi mengenai informasi tentang sumber data operasional yang memiliki struktur data yang berbeda, ukuran field yang berbeda, dan tipe data yang berbeda.
20
b. Metadata ekstraksi dan transformasi Metadata ekstraksi dan tranformasi berisi mengenai data ekstraksi dari sumber data, penamaan, frekuensi ekstraksi, metode ekstraksi, dan peraturan untuk ekstraksi. c. Metadata user akhir Metadata user akhir adalah sebuah peta navigasi dari data warehouse. Ini memampukan user akhir untuk menemukan informasi dari data warehouse.
2.3.5 S truktur Data warehous e M enurut Inmon, W. H. (2005, p35), data mengalir dari lingkungan operasional ke dalam data warehouse dimana data mengalami transformasi dari tingkatan operasional ketingkatan data warehouse. Pada perumusan data yang dapat dilihat pada Gambar 2.4, data disampaikan dari current detail data ke older detail. Setelah data diringkas, data tersebut disampaikan dari current detail ke lightly summarized data, kemudian dari lightly summarized data ke highly summarized data.
21
Gambar 2.4 Struktur Data warehouse (Inmon,2002, p36)
Apabila data dalam data warehouse sudah menua, maka data akan berpindah dari current detail ke older detail. Jika data sudah dirangkum maka data akan berpindah dari current detail ke lightly summarized data dan kemudian dari lightly summarized data ke highly summarized data. a.
Current detail data •
Sangat
banyak
jumlahnya
dan
disimpan
pada
tingkat
penyimpanan terendah. •
Hampir selalu disimpan dalam tempat penyimpanan karena cepat diakses tetapi mahal dan kompleks dalam pengaturannya.
•
Digunakan dalam membuat rekapitulasi sehingga current detail data harus akurat.
22
b.
Older detail data •
Data ini merupakan data historis dari current detail data, dapat berupa hasil backup atau arsip dari data yang disimpan dalam tempat penyimpanan yang terpisah. Karena bersifat
cadangan,
maka biasanya data disimpan dalam tempat penyimpanan alternatif seperti tape-disk. •
Data ini biasanya jarang di akses. Penyusunan file data dari data ini disusun
berdasarkan
umur
dari data yang bertujuan
mempermudah pencarian atau pengaksesan kembali.
c.
Lighlty summarized data •
Data ini merupakan ringakasan dari current detail data. Data ini dirangkum berdasarkan periode atau dimensi lainnya sesuai dengan kebutuhan.
•
Ringkasan dari current detail data belum bersifat total summary. Data-data ini memiliki detil tingkatan yang lebih tinggi dan mendukung kebutuhan warehouse pada tingkat departemen. Tingkatan data ini disebut juga dengan data mart. Akses terhadap data jenis ini data jenis ini banyak digunakan untuk view suatu kondisi yang sedang atau sudah berjalan.
23
d.
Highly summarized data •
Data ini merupakan tingkat lanjutan dari Lightly summarized data, merupakan hasil ringkasan yang bersifat total, dapat diakses untuk melakukan analisis perbandingan data berdasarkan urutan waktu tertentu dan analisis multidimensi. Data pada tingkat inilah yang pada akhirnya digunakan
untuk
mendukung pengambilan
keputusan terutama di kalangan eksekutif dalam dunia bisnis.
2.3.6 Bentuk Data warehous e Data warehouse memiliki beberapa bentuk yang setiap bentuk tersebut memiliki karakteristik tersendiri. Berikut ini adalah bentuk-bentuk dari data warehouse : 1. Functional Data warehous e Functional data warehouse ini merupakan bentuk database dimana data warehouse dibuat lebih dari satu dan dikelompokkan berdasarkan masing-masing fungsi yang ada dalam perusahaan, seperti fungsi financial / keuangan, fungsi marketing / pemasaran, fungsi kinerja personalia, dan lain-lain. Keuntungan dari bentuk ini adalah sistem akan mudah dibangun dengan biaya yang relatif murah. Kerugian dari bentuk ini adalah resiko kehilangan konsistensi data dan terbatasnya kemampuan user dalam hal pengumpulan data.
24
Gambar 2.5 Functional Data warehouse 2. Centralized Data warehouse Centralized data warehouse ini merupakan basis data fisikal tunggal yang memuat semua data untuk area fungsional yang khusus, departemen, divisi, atau perusahaan. Data warehouse ini digunakan ketika terdapat kebutuhan akan data informasional dan terdapat banyak end-user yang sudah terhubung ke komputer pusat atau jaringan. Bentuknya menyerupai functional data warehouse, akan tetapi sumber datanya lebih dahulu dikumpulkan atau
diintegrasikan pada
suatu tempat terpusat, baru kemudian data tersebut dibagi-bagi berdasarkan fungsi-fungsi yang dibutuhkan oleh perusahaan. Bentuk data warehouse terpusat ini sering digunakan oleh perusahaan-perusahaan yang belum mempunyai jaringan eksternal. Keuntungan bentuk centralized data warehouse ini adalah data benar-benar terpadu karena konsistensi yang tinggi. Namun demikian membutuhkan waktu yang lama dan biaya yang mahal dalam membentuk data warehouse seperti ini.
25
Gambar 2.6 Centralized Data warehouse 3. Distributed Data warehous e Distributed data warehouse adalah data warehouse dimana komponen tertentu dari data warehouse tersebut didistribusikan melewati sebuah basis data fisikal yang berbeda. Distributed data warehouse biasanya melibatkan data yang paling teredundansi, dan sebagai akibatnya, menimbulkan proses load dan update yang sangat kompleks. Distributed data warehouse ini menggunakan gateway yang berfungsi sebagai jembatan antara lokasi data warehouse dengan workstation yang menggunakan sistem yang beraneka ragam, sehingga pada bentuk data warehouse ini
memungkinkan perusahaan untuk
mengakses sumber data yang terdapat diluar lokasi perusahaan (eksternal). Bentuk data warehouse ini mempunyai kelebihan dalam hal pengaksesan data dari luar perusahaan yang telah mengalami sinkronisasi terlebih dahulu dan tetap terjaga konsistensinya.
26
Tetapi bentuk ini juga memiliki kerugian yaitu bentuk ini merupakan bentuk yang paling mahal dan paling kompleks untuk diterapkan karena sistem operasinya dikelola secara terpisah.
Gambar 2.7 Distributed Data warehouse
2.3.7 Arsitektur Data warehouse
Gambar 2.8 Arsitektur Data warehouse (Connolly, 2005, p1157)
27
M enurut Poe (1996, p24), arsitektur adalah sekumpulan aturan atas struktur yang memberikan keterangan untuk keseluruhan rancangan suatu sistem atau
produk.
Arsitektur
data
menyediakan
kerangka
dengan
cara
mengidentifikasikan bagaimana data berpindah melalui sistem dan digunakan dalam perusahaan. Komponen utama arsitektur data untuk data warehouse adalah read-only database. Berdasarkan Connolly (2002, p1053), komponen utama data warehouse terdiri dari : 1. Sumber Data Sumber data untuk data warehouse bersumber dari data berikut: - M ainframe data operasional yang ada dalam jaringan database. - Data departemental disimpan dalam sistem file seperti VSAM , RM S dan DBM S relasional seperti Informix dan Oracle. - Data privat di simpan di dalam server pribadi dan workstation. - Sistem external, seperti internet, atau database yang terkait dengan pemasok atau pelanggan. 2. Datastore Operasional Tempat penyimpanan data operasional yang sifatnya saat ini dan terintegrasi dan dipakai untuk analisis. Biasanya datastore operasional terstruktur dan tersuplai dengan data dengan cara yang sama dengan data warehouse. Pembuatan
datastore
operasional
dapat
membantu
dalam
mengembangkan data warehouse karena datastore operasional telah
28
menyediakan data yang sudah di extract dari sistem sumber dan sudah dibersihkan. 3. Load Manager Load manager disebut juga sebagai komponen front-end yang menampilkan semua operasi gabungan dengan ekstraksi dan loading data ke data warehouse. Data bisa langsung dikeluarkan langsung dari sumber data, atau data store operasional. Operasi yang dilakukan load manager, bisa termasuk transformasi sederhana dari data untuk menyiapkan data yang akan dimasukan data warehouse. 4. Warehouse Manager M enangani semua operasi yang berhubungan dengan manajemen data dalam data warehouse. Operasi-operasi yang dijalankan oleh warehouse manager, mencakup: a. Analisis data untuk menjaga kekonsistenan data. b. M elakukan transformasi dan pengabungan sumber data dari tempat penyimpanan sementara ke dalam tabel data warehouse. c. M embuat indeks dan view dari base table. d. M elakukan denormalisasi (jika perlu). e. M elakukan aggregations (jika perlu). f. menyimpan (archive) dan backup data.
29
5. Query Manager Query manager disebut juga sebagai component back-end, untuk menangani semua operasi yang berhubungan dengan manajemen permintaan user (user queries). Operasi yang dijalankan oleh query manager meliputi kegiatan mengarahkan permintaan ke tabel-tabel data yang tepat dan melakukan penjadwalan eksekusi query pada permintaan. 6. Detailed Data Area dari data warehouse yang menyimpan semua data rinci di dalam skema database. Umumnya, data rinci tidak disimpan secara online namun bisa tersedia dengan mengagregasi data ke tingkat detil selanjutnya. Data rinci ditambahkan ke dalam data warehouse untuk mendukung data agregat. 7. Lightly and Highly Summarized Data Area dari data warehouse yang menyimpan semua standar untuk lightly dan highly summarized data yang dihasilkan oleh warehouse manager. Tujuan dari meringkas informasi adalah untuk mempercepat kinerja saat melakukan query. Ringkasan data akan ditambah saat data baru dimasukkan ke dalam data warehouse.
30
8. Archive / Back-up Data Area dari data warehouse yang menyimpan data rinci dan rangkuman untuk diarsip dan backup. Data kemudian ditransfer ke media penyimpanan seperti magnetic tape atau optical disk. 9. Metadata Area dari data warehouse yang menyimpan semua definisi meta-data yang digunakan oleh semua proses di dalam data warehouse. Meta-data digunakan untuk beberapa tujuan diantaranya : •Dalam proses ekstraksi dan loading, meta-data digunakan untuk memetakan sumber data ke view dari data di dalam data warehouse. •Dalam proses manajemen warehouse, meta-data digunakan untuk menghasilkan tabel ringkasan secara otomatis. •Sebagai bagian dari proses manajemen query, meta-data digunakan untuk melakukan query langsung ke sumber data yang sesuai. 10. End-user Access Tools Prinsip tujuan dari data warehouse, adalah untuk menyediakan informasi sebagai bantuan bagi para user dalam bidang bisnis, yang melakukan strategi untuk pengambilan keputusan. M enurut beberapa ahli, End-user access tools dapat dikategorikan menjadi lima golongan utama, yaitu: a. Reporting and Query Tools Reporting tools meliputi production reporting tools dan report writer. Production reporting tools digunakan untuk menghasilkan
31
laporan operasional reguler seperti order customer, invoice, dan gaji karyawan. Query tools untuk data warehouse relasional dirancanng untuk menerima SQL atau menghasilkan perintah SQL untuk meng-query data yang disimpan dalam warehouse. b. Application Development Tools Terkadang alat pelaporan dan query yang sudah ada tidak dapat memenuhi kebutuhan end user. M aka aplikasi harus dibangun sendiri menggunakan graphical data access tools dan biasanya dikembangkan untuk lingkungan client-server. c. Executive Information System (EIS) tools Alat sistem informasi eksekutif yang berhubungan dengan mainframe yang memungkinkan pemakai untuk membuat aplikasi pengambilan keputusan untuk menyediakan gambaran tentang perusahaan dan akses terhadap sumber data eksternal. d. OnLine Analitical Proccessing (OLAP) tools Alat untuk OLAP didasarkan pada konsep database multi dimensi dan memungkinkan user untuk menganalisis data menggunakan pandangan yang kompleks dan multi dimensi. e. Data Mining Tools Data mining adalah proses untuk menemukan hubungan, pola, dan tren baru yang berarti dari data dalam jumlah besar menggunakan teknik statistik, matematik, dan artificial intelligence.
32
2.3.8 Aliran Informasi Data warehouse
Gambar 2.9 Aliran Informasi dalam Data warehouse (Connolly, 2005, 1162)
Data flows yang ada pada data warehouse terdiri dari 5 bagian, yaitu: 1. Inflow Inflow
adalah
proses
yang
berhubungan
dengan
ekstraksi,
pembersihan, dan loading dari data dari sistem sumber ke dalam data warehouse. Agar data dapat masuk ke dalam data warehouse maka data harus direkonstruksi terlebih dahulu. Proses rekonsruksi ini melibatkan proses :
33
a. Pembersihan data yang kotor b. M embentuk kembali data agar sesuai dengan persyaratan data warehouse yang baru, misalnya menambah atau mengurangi field dan denormalisasi data. c. M emastikan sumber data konsisten dengan sumber itu sendiri dan data yang sudah ada di data warehouse. 2. Upflow Upflow adalah proses yang berhubungan dengan menambah nilai data di dalam data
warehouse melalui merangkum,
mempaket, dan
mendistribusikan data. Aktivitas yang berhubungan dengan upflow yaitu: a.
M eringkas
menggabungkan,
data dengan dan
memilih,
mengelompokkan
memproyeksikan, data relasional
menjadi view yang lebih baik dan berguna untuk user akhir. b. M embungkus data dengan merubah detil atau ringkasan data menjadi format yang lebih berguna, seperti spreadsheets, dokument teks, grafik, tampilan grafis yang lain, database privat, dan animasi. c. M endistribusikan data untuk kelompok yang tertentu untuk meningkatkan ketersediaannya dan pengaksesannya. 3. Downflow M enurut Connolly (2005, p1164), downflow adalah proses yang berhubungan dengan pengarsipan dan melakukan backup data dalam data warehouse
34
4. Outflow Outflow adalah proses yang berhubungan dengan pembuatan data agar tersedia untuk user akhir. Dua aktivitas kunci yang terlibat dalam outflow mencakup: a. Pengaksesan, yang berfokus pada kepuasan permintaan user untuk data yang mereka perlukan. b. Pengiriman, yang berfokus dengan pengiriman informasi yang proaktif untuk workstation user akhir. 5. Meta-flow M enurut Connolly (2005,p1165), meta-flow adalah proses yang berhubungan dengan manajemen meta-data. M eta-data adalah penjelasan dari isi data dari data warehouse, apa yang ada di dalamnya, darimana berasal dan apa yang sudah dilakukan dengan pembersihan, peringkasan dan integrasi.
2.3.9 Tabel Dimensi M enurut
Whalen
(2001,p236),
tabel
dimensi
digunakan
untuk
menyempurnakan data yang ada pada tabel fakta atau menjelaskannya dengan lebih detil. Datanya merupakan karekter. Tabel dimensi menyimpan informasi seperti region name, salesperson name, item description, customer name, dan customer addresses. Setiap tabel dimensi menyimpan baris dari data dengan informasi berupa karakter yang menjelaskan field yang berhubungan dengan tabel fakta dengan lebih detil.
35
Tabel dimensi lebih kecil dan memiliki baris yang sedikit dari table fakta, biasanya terdiri dari ratusan atau ribuan record.
Gambar 2.10 Contoh Tabel Dimensi (Kimball, 2002, p20)
2.3.10 Tabel Fakta M enurut Whalen (2001, p236), tabel fakta adalah tabel di dalam data warehouse yang menjelaskan ukuran data bisnis. Fakta berisi nilai dari sebuah kejadian atau transaksi tertentu misalnya penyimpanan uang di bank, penjualan produk, atau pesanan. Tabel fakta menyimpan nilai numeric daripada karakter. Contohnya tabel fakta dapat berisi field seperti RegionID, SalespersonID, ItemID, dan CustomerID. Tabel fakta dapat memiliki banyak foreign key yang berhubungan dengan tabel dimensi. Tabel fakta menyimpan informasi penting dari data
36
warehouse. Tabel fakta dapat menyimpan jutaan hingga miliaran record dan memakan tempat penyimpanan hingga satu terabyte.
Gambar 2.11 Contoh Tabel Fakta (Kimball, 2002, p17)
2.3.11 Skema Bintang M enurut Connolly (2005, p1018), skema bintang adalah sebuah logical struktur yang mempunyai sebuah tabel fakta berisi data terbaru di tengah, yang dikelilingi tabel dimensi yang berisi data referensi (yang dapat didenormalisasi). M enurut Inmon, W. H. (2005, p128), skema bintang adalah struktur desain yang dibutuhkan untuk mengatur data dengan cara denormalisasi dalam jumlah yang besar ke dalam sebuah entity dalam sebuah data mart untuk mengoptimalkan akses data. M enurut Vidette Poe (1996, p120), rancangan skema bintang merupakan struktur yang sederhana dengan tabel-tabel yang relatif dan penggabungan jalurjalur yang telah ditetapkan, menyediakan waktu respon yang cepat dalam melakukan query serta memudahkan pemahaman bagi analis dan user walaupun mereka tidak biasa dengan struktur database tersebut. a. Keuntungan M enggunakan Skema Bintang Skema bintang memiliki kelebihan yang tidak dimiliki oleh stuktur relasional biasa, yaitu:
37
o Efisiensi struktur basis data konsisten sehingga efisien dalam mengakses
data
dengan
menggunakan
tool
untuk
menampilkan data termasuk laporan tertulis dan query. o Kemampuan untuk mengatasi perubahan kebutuhan, skema bintang dapat beradaptasi kepada kebutuhan user karena tabel dimensi memilki kesamaan dalam hal menyediakan akses ke tabel fakta. o Extensibility, model dimesional dapat dikembangkan. Seperti menambah tabel dimensi selama ada nilai tunggal di tabel dimensi tersebut yang mendefinisikan setiap record
tabel
fakta yang ada, menambahkan attribute tabel dimensi, dan memecahkan record tabel dimensi yang ada menjadi level yang lebih rendah dari level sebelumnya. o Kemampuan untuk menggambarkan situasi bisnis pada umumnya, pendekatan standar untuk menangani situasi umum di dunia bisnis yang terus bertambah. o Proses query yang bisa diprediksi, aplikasi data warehouse yang mencari data dari level yang di bawahnya akan mudah menambahkan jumlah atribut pada tabel dimensi dari sebuah skema bintang. Aplikasi yang mencari data dari level yang setara akan menghubungkan tabel fakta yang terpisah malalui tabel dimensi yang dapat diakses bersama.
38
b. Jenis-Jenis Skema Bintang Ada dua jenis skema bintang, yaitu: 1. Simple Star Schema Tiap tabel harus mempunyai Primary key yang terdiri atas satu kolom atau lebih. Pada jenis ini, Primary key untuk tiap tabel fakta didapatkan dari satu atau lebih foreign key. Foreign key adalah kolom pada suatu table yang nilainya didefinisikan sebagai Primary key pada table yang lain. 2. Star Schema with Multiple Fact Table Skema bintang pada jenis ini mengandung banyak tabel fakta. Beberapa kasus, skema ini digunakan karena pada kenyataannya tidak semua tabel saling berkaitan atau karena perbedaan waktu pada saat data di-load. Skema ini juga dikenal sebagai “constellation schema”. Jenis ini juga dapat meningkatkan kinerja terutama untuk jumlah data yang sangat besar. c. Variasi Skema Bintang Variasi-variasi yang ada pada skema bintang, yaitu : 1. Skema Snowflake M enurut Connolly (2005,p1184), Skema snowflake adalah variasi dari skema bintang dimana tabel dimensi tidak berisi data yang denormalisasi. Dengan adanya normalisasi, skema ini menambah jumlah tabel
dimensi
dan
gabungan
foreign
key,
meningkatkan
39
kompleksitas query, dan mengurangi kinerja query. Skema snowflake sering digunakan untuk data warehouse dengan jumlah data yang besar dan terutama berguna untuk me-load dan melengkapi data mart. Keuntungan
dari
skema
snowflake
adalah
kecepatan
memindahkan data dari data OLTP ke dalam metadata, sebagai kebutuhan dari alat pengambil keputusan tingkat tinggi di mana dengan
tipe seperti ini seluruh
sepenuhnya,
dan
struktur
dapat digunakan
banyak yang beranggapan
lebih
nyaman
merancang dalam bentuk normal ketiga. Kerugian yang didapat adalah memiliki masalah besar dalam hal kinerja (performance), hal ini disebabkan semakin banyaknya join antar tabel-tabel yang dilakukan dalam skema snowflake ini maka semakin lambat kinerja yang dilakukan. 2. Skema Starflake M enurut Connolly (2005, p1081), skema starflake merupakan struktur gabungan yang berisi kombinasi antara skema bintang yang telah
didenormalisasi
dan
skema
snowflake
yang
telah
dinormalisasi.
2.3.12 Granularity M enurut Inmon, W. H. (2005,p41), granularity merupakan suatu level dari detil atau ringkasan pada unit data di dalam data warehouse. Semakin
40
banyak detil atau ringkasan pada unit data maka akan semakin rendah level pada granularity. Contohnya adalah sebuah transaksi yang sederhana akan berada pada tingkat granularity yang rendah, sedangkan keseluruhan dari transaksi dalam satu bulan akan berada pada level granularity yang lebih tinggi. Granularity
merupakan
permasalahan
utama
dalam
mendesain
lingkungan pada data warehouse karena berpengaruh besar pada volume dari data yang terletak di dalam data warehouse. Keuntungan-keuntungan granularity : ‐
Dapat digunakan kembali Dikatakan dapat digunakan kembali karena dapat digunakan oleh
banyak orang dengan cara-cara yang berbeda. Contohnya data yang sama dapat digunakan untuk memenuhi kebutuhan dalam bidang pemasaran, penjualan dan keuangan. Pemasaran menginginkan melihat data bulanan berdasarkan
area
geografi, dan
keuangan menginginkan
melihat
pendapatan setiap kuarter berdasarkan produk. ‐
Kemampuan untuk mencocokkan data Jika memiliki satu dasar yang sama untuk semuanya, maka jika
terjadi perbedaan dalam analisis antara dua atau lebih departemen, proses pencocokan akan menjadi lebih sederhana dan mudah. ‐
Fleksibel Dimana para user dapat merubah data sesuai dengan tampilan
yang mereka inginkan sehingga pekerjaan dapat diselesaikan dengan baik dan mudah.
41
‐
Kebutuhan yang tidak jelas yang akan datang dapat diakomodasi. Saat ada kebutuhan yang baru dan ada kebutuhan informasi, data
warehouse sudah siap untuk melakukan analisis dan organisasi disiapkan untuk menangani kebutuhan yang baru.
2.3.13 Tahap Perancangan Data warehouse M enurut metodologi Kimball (Connolly, 2005, p1187), terdapat sembilan tahap metodologi dalam perancangan data warehouse, yaitu: 1.
Pemilihan Proses (Choosing the Process) Sebuah proses atau fungsi, merujuk pada permasalahan subjek
pada data mart tertentu. Saat pengembangan data mart pertama kali, data mart harus lebih tepat waktu, sesuai anggaran, dan menjawab pertanyaan penting dalam bisnis. Umumnya pilihan
pertama dalam pembuatan data
mart
berhubungan dengan penjualan di dalam perusahaan. 2.
M emilih Grain Pada tahap ini akan ditentukan tingkat detail data yang bisa
didapatkan dari model dimensional. 3.
M engidentifikasikan dan M enyesuaikan Dimensi Dimensi menentukan apa saja yang menjadi pertanyaan yang
diminta yang berhubungan dengan fakta di tabel fakta. Dimensi harus menggambarkan sejelas mungkin dan dapat memperkuat grain. Dimensi yang dibentuk dengan baik dapat membuat data mart mudah dimengerti dan mudah digunakan.
42
4.
Pemilihan Fakta Grain pada tabel fakta menentukan fakta mana yang bisa
digunakan didalam data mart. Semua fakta harus menampilkan tingkat grain yang sama. Sebagai contoh bila grain pada tabel fakta merupakan penjualan, maka seluruh fakta-fakta numerik harus mengarah pada penjualan tertentu juga. Fakta harus berupa numeric dan additive. Sebuah tabel fakta dengan fakta non-numeric, fakta non-additive, serta fakta dengan granularity yang berbeda akan menjadi tidak berguna. 5.
M enyimpan Pre-kalkulasi dalam Tabel Fakta Ketika fakta sudah dipilih, masing-masing fakta tersebut harus
diperiksa kembali untuk menentukan apakah ada kemungkinan untuk melakukan
pre-kalkulasi.
Pre-kalkulasi
berisikan
formula
untuk
menentukan perhitungan-perhitungan. Contoh umum pemakaian pre-kalkulasi dalam tabel fakta adalah ketika terdapat fakta yang membandingkan antara rugi dan laba. Prekalkulasi semakin diperlukan jika tabel fakta didasarkan pada penjualan atau invoice. 6.
M elengkapi Tabel Dimensi Pada tahap
ini akan
ditambahkan
keterangan
selengkap-
lengkapnya pada tabel dimensi. Keterangan yang ditambahkan harus bersifat intuitif dan mudah dipahami oleh user. Kegunaan dari data mart ditentukan oleh scope dan atribut dari tabel dimensi.
43
7.
M emilih Durasi dari Basis Data Durasi mengukur sejauh mana jangka waktu tabel fakta
kebelakang. Banyak perusahaan yang ingin melihat apa yang telah terjadi dan dilalui pada periode waktu tertentu dalam satu atau dua tahun sebelumnya. Bahkan pada beberapa perusahaan tertentu, data yang masih dapat menjadi bahan
pertimbangan berlaku
selama lima tahun
kebelakang. 8.
M elacak Perubahan Dimensi Secara Perlahan (Tracking Slowly
Changing Dimension) Terdapat tiga buah tipe Slowly Changing Dimension yaitu : Tipe 1: Perubahan dimensi yang menyebabkan data lama di overwrite. Tipe 2: Perubahan dimensi yang menyebabkan terbentuknya record baru. Tipe 3: Pembuatan dimensi yang menyebabkan pembuatan atribut alternatif sehingga nilai yang lama dan nilai yang baru dapat diakses secara bersamaan pada dimensi yang sama pula. 9.
M enentukan Prioritas dari M ode Query Pada tahap ini kita mempertimbangkan tentang permasalahan
desain fisik. Persoalan utama pada desain fisik yaitu menentukan urutan fisik dari tabel fakta pada media penyimpanan dan adanya useran agregasi. Ditahap ini dilakukan pula suatu pertimbangan terhadap permasalahan indexing, backup, dan security. Isu rancangan fisik yang paling kritis yang akan mempengaruhi persepsi user data mart.
44
Dengan mengacu pada langkah-langkah yang telah dijabarkan di atas, kita dapat membangun sebuah data warehouse yang baik dan sesuai dengan kebutuhan perusahaan.
2.3.14 Data Transformation System M enurut
Peterson (2001, p6), Data Transformation System adalah
sebuah alat yang digunakan untuk menyalin, memindahkan, menggabungkan, membersihkan dan memvalidasi data. DTS adalah sebuah proses mendapatkan data dengan kinerja tingkat tinggi. DTS juga merupakan sebuah alat Rapid Application
Development
untuk
data
berorientas
Programming
yang
menyediakan sebuah alat manipulasi data yang komprehensif yang diatur dalam sebuah lingkungan pengembangan yang baik dan kuat.
2.3.15 Extraction, Transformation, Loading (ETL) M enurut Inmon, W. H. (2002, p390), ETL adalah proses melakukan pencarian data, mengintegrasikan, dan menempatkan data ke dalam sebuah data warehouse. M enurut Kimball dan Ross (2002, p401), ETL adalah kumpulan proses menyiapkan data dari operational source untuk data warehouse. Proses ini terdiri dari extracting, transforming, loading dan beberapa proses yang dilakukan sebelum dipublikasikan ke data warehouse. Dari kedua pernyataan di atas, dapat disimpulkan bahwa ETL merupakan proses meyiapkan data yang meliputi pencarian,
pengintegrasian, dan
penempatan data dari operational source ke dalam data warehouse.
45
Proses ini terdiri dari tiga tahap yaitu: a.
Extraction Langkah pertama dari proses ETL adalah penarikan data dari satu
atau lebih sistem operasional sebagai sumber data (biasanya OLTP, tapi juga bisa dari sistem diluar sistem basis data). Kebanyakan proyek data warehouse menggabungkan data dari sumber-sumber yang berbeda. Proses ekstraksi adalah proses penguraian dan pembersihan data yang di ekstrak untuk mendapatkan suatu pola atau struktur data yang diinginkan. b.
Transformation Proses membersihkan data yang diambil pada proses extract
sehingga data itu sesuai dengan struktur data warehouse atau data mart. Proses-proses dalam tahap transformasi: o Hanya memilih kolom tertentu saja untuk dimasukkan ke dalam data warehouse. o M enerjemahkan nilai berupa kode (misal, database sumber menyimpan nilai 1 untuk pria dan 2 untuk wanita, tetapi data warehouse menyimpan M untuk pria dan F untuk wanita). Proses yang dilakukan disebut automated data cleansing, tidak ada pembersihan secara manual dalam proses ETL. o M engkodekan nilai-nilai ke dalam bentuk bebas (misal mengkodekan laki-laki sebagai “p” dan wanita sebagai “w”). o M elakukan
perhitungan
nilai-nilai
baru
(misal
sale_amount=qty*price). o M enggabungkan data dari berbagai sumber bersama-sama.
46
o M embuat ringkasan dari sekumpulan baris data (total dari sesuatu). Adapun kesulitan-kesulitan yang mungkin terjadi dalam proses transformasi adalah: o Data harus digabungkan dari beberapa sistem terpisah. o Data harus dibersihkan sehingga konsisten. o Data harus di agregasi untuk mempercepat analisis. c.
Loading M erupakan tahap akhir dalam proses ETL. Proses memasukkan
data ke dalam target akhir, dalam hal ini adalah data warehouse atau data mart. Data berasal dari proses transformasi, setelah data sesuai dengan apa yang diinginkan dalam data warehouse maka proses loading akan berjalan. Data dari staging area akan dipindahkan ke dalam data warehouse atau data mart.
2.4 Reservasi Dalam bidang perhotelan, reservasi berarti pemesanan ruangan oleh calon pelanggan kepada pihak hotel. Proses reservasi atau pemesanan bagi seorang tamu amatlah penting karena untuk memastikan apakah kamar tersebut tersedia dan juga memastikan tentang harganya. Reservasi merupakan suatu permintaan untuk memperoleh kamar yang dilakukan beberapa waktu sebelumnya oleh berbagai sumber dengan menggunakan berbagai cara pemesanan untuk memastikan bahwa tamu akan memperoleh kamar pada waktu check-
47
in (Sugiarto, 1998, p59). M enurut Darsono (1992, p15) reservasi adalah salah satu bagian yang bertanggung jawab atas pesanan kamar tamu hotel dan di pimpin oleh chief reservation.
2.5 Penjualan Proses penjualan menurut Hollander et al (2000, p230) adalah rangkaian kegiatan yang disajikan secara bersama-sama untuk menarik minat konsumen, membantu konsumen memilih barang dan jasa, dan menerima pembelian dari barang dan jasa. Penjualan menurut M ulyadi (2003, p202) terdiri dari transaksi penjualan barang atau jasa baik secara kredit maupun tunai. Sedangkan menurut Warren (2005, p290), penjualan adalah jumlah yang dibebankan kepada pelanggan untuk barang dagang yang dijual, baik secara tunai maupun kredit. Jadi, penjualan adalah suatu sistem yang digunakan untuk mencatat sampai membuat kalkulasi tentang penjualan barang dagangan ke pelanggan baik secara kredit maupun tunai.
2.6 Voucher Hotel M enurut Vallen (2009, p590), voucher hotel merupakan formulir yang diberikan oleh travel agent sebagai tanda terima untuk pembayaran reservasi di muka oleh klien. Voucher ini kemudian digunakan oleh klien untuk check-in di hotel yang bersangkutan. Umumnya dengan memesan voucher hotel harganya lebih murah daripada membeli kamar secara langsung di hotel.