BAB 2 LANDASAN TEORI
2.1
Pengertian Data Menurut Inmon (2002, p388), data adalah sebuah catatan dari fakta-fakta, konsep-konsep, atau instruksi-instruksi pada sebuah media penyimpanan untuk komunikasi, penarikan dan pemrosesan secara otomatis, serta presentasi sebagai informasi yang dapat dimengerti oleh manusia. Menurut Laudon (2010, p46), data adalah kumpulan fakta yang masih mentah yang menjelaskan aktivitas-aktivitas yang terjadi dalam organisasi atau lingkungan fisik, sebelum terorganisir dan disusun menjadi sebuah bentuk yang dapat dimengerti dan digunakan oleh manusia. Menurut Turban (2005, p38), data adalah deskripsi dasar dari benda, peristiwa, aktivitas, dan transaksi yang direkam, dikelompokkan, dan disimpan tetapi belum terorganisir untuk menyampaikan arti tertentu.
2.2
Pengertian Informasi Menurut Inmon (2002, p391), informasi adalah data yang manusia pahami dan evaluasi untuk menyelesaikan masalah atau membuat keputusan. Menurut Laudon (2010, p46), informasi adalah data yang telah ditentukan menjadi sebuah bentuk yang berarti dan berguna bagi kehidupan masyarakat. Menurut Turban (2005, p38), informasi adalah data yang sudah diorganisasi sehingga memiliki arti dan nilai untuk penerima. 7
8 2.3
Pengertian Database Menurut Connolly dan Begg (2005, p15), database adalah suatu kumpulan relasi-relasi logikal dari data dan deskripsi dari data, yang diciptakan untuk memperoleh informasi yang dibutuhkan oleh suatu organisasi. Menurut O’Brien (2005, p211), database adalah kumpulan terintegrasi dari elemen data yang secara logika saling berhubungan. Database mengonsolidasikan berbagai catatan yang dahulu disimpan dalam file-file terpisah ke dalam satu gabungan umum elemen data yang menyediakan data untuk banyak aplikasi.
2.4
Pengertian Database Management System (DBMS) Menurut O’Brien (2005, p222), DBMS adalah software utama dalam pendekatan manajemen database, karena software tersebut mengendalikan pembuatan, pemeliharaan, dan penggunaan database organisasi dan pemakai akhir. Menurut Connolly dan Begg (2005, p16), DBMS adalah sistem software yang memungkinkan pengguna untuk mendefinisikan, menciptakan, memelihara, dan mengontrol database.
2.5
Pengertian Online Transaction Processing (OLTP) Menurut O’Brien (2005, p228), OLTP adalah sistem pemrosesan yang terjadi secara real-time. Menurut Connolly dan Begg (2005, p1205), OLTP adalah sistem yang dirancang untuk menangani jumlah hasil transaksi yang tinggi, dengan transaksi
9 yang biasanya membuat perubahan kecil bagi data operasional organisasi, yaitu data yang memerlukan penanganan operasi setiap hari.
2.6
Pengertian Online Analytical Processing (OLAP) Menurut Connolly dan Begg (2005, p1205), OLAP adalah sintesis, analisis, dan konsolidasi dinamis dari sejumlah besar data multidimensi. Menurut O’Brien (2005, p446), OLAP adalah kemampuan sistem informasi manajemen, sistem pendukung keputusan, dan sistem informasi eksekutif yang mendukung pemeriksaan interaktif dan manipulasi atas sejumlah besar data dari berbagai perspektif.
2.7
Data Warehouse 2.7.1
Pengertian Data Warehouse Menurut Inmon (2005, p1151), data warehouse adalah kumpulan data yang berorientasi subjek, terintegrasi, nonvolatile, dan time-variant yang mendukung keputusan manajemen. Menurut Kimball dan Caserta (2004, p23), data warehouse adalah sebuah sistem yang mengekstrak, membersihkan, menyesuaikan, dan mengirimkan data sumber ke dalam sebuah penyimpanan data dimensional yang kemudian mendukung dan mengimplementasikan proses query dan analisis untuk tujuan pengambilan keputusan.
10 2.7.2
Karakteristik Data Warehouse Menurut Inmon (2002, p31), karakteristik dari data warehouse yaitu : subjek oriented, integrated, nonvolatile, dan time variant. 2.7.2.1 Subjek Oriented Dalam sistem operasional klasik, data berpusat pada aplikasi fungsional perusahaan (kontrol stok, penjualan produk, tagihan pelanggan), sedangkan pada data warehouse, datanya berpusat pada subjek utama dari perusahaan (pelanggan, produk, dan penjualan).
Gambar 2.1 Subject Oriented (Inmon, 2002, p32)
11 2.7.2.2 Integrated Dari
semua
aspek
dalam
data
warehouse,
integrasi
merupakan hal yang terpenting. Data diambil dari berbagai sumber yang berbeda ke dalam data warehouse. Setelah data diambil, data tersebut dikonversi, diformat kembali, disusun, diringkas, dan sebagainya. Pada Gambar 2.2 dapat dilihat bahwa integrasi terjadi ketika data melewati lingkungan operasional berbasis aplikasi menuju data warehouse.
Gambar 2.2 Integrated (Inmon, 2002, p33)
12 2.7.2.3 Nonvolatile
Gambar 2.3 Nonvolatile (Inmon, 2002, p34)
Gambar 2.3 menunjukkan bahwa data operasional dapat diakses dan dimanipulasi, sedangkan data yang ada pada data warehouse dapat dimuat, diambil, dan diakses, tetapi data tersebut tidak dapat diperbaharui. Ketika data pada data warehouse diambil, data tersebut berupa snapshot, format statik. Baris snapshot baru akan ditulis ketika data operasional berubah. Untuk melakukan itu, maka histori dari setiap baris data harus disimpan di dalam data warehouse.
2.7.2.4 Time Variant Time variant menyiratkan bahwa setiap unit dari data di dalam data warehouse akurat pada beberapa saat dalam waktu tertentu. Secara umum, sebuah record dapat diberi penanda waktu,
13 dan dapat juga menggunakan tanggal transaksi pada record tersebut.
Gambar 2.4 Time Variant (Inmon, 2002, p35)
2.7.3 Perbandingan OLTP dan DWH Menurut Connolly dan Begg (2005, p1153), perbandingan antara OLTP dan data warehouse adalah sebagai berikut :
Tabel 2.1 Perbandingan antara OLTP dan Data Warehouse OLTP
Data Warehouse
Menyimpan data sekarang
Menyimpan data historis
Menyimpan data yang detail
Menyimpan
detailed,
lightly,
dan highly ringkasan data Data bersifat dinamis
Data bersifat statis
Proses berulang-ulang
Proses sewaktu-waktu dan tidak terstruktur secara heuristik
Hasil transaksi yang tinggi
Hasil transaksi medium atau bahkan rendah
14 Pola penggunaan dapat diprediksi
Pola penggunaan tidak dapat diprediksi
Berbasis transaksi
Berbasis analisis
Berorientasi aplikasi
Berorientasi subjek
Mendukung keputusan sehari-hari
Mendukung dalam pengambilan keputusan strategis
2.7.4
Menyediakan pengguna
Menyediakan pengguna
operasional dalam jumlah yang
manajerial dalam jumlah yang
besar
cenderung sedikit
Arsitektur Data Warehouse
Gambar 2.5 Arsitektur Data Warehouse (Connolly, 2005, 1157)
15 Komponen-komponen dari data warehouse menurut Connolly dan Begg (2005, p1156), antara lain : 2.7.4.1 Operational Data Sumber data untuk data warehouse disediakan dari : a. Data operasional yang disimpan dalam hierarki generasi pertama dan database jaringan. b. Data departemen yang disimpan dalam sistem file paten seperti VSAM, RMS, dan DBMS relasional seperti Informix dan Oracle. c. Data privat yang disimpan dalam workstation dan server privat. d. Sistem eksternal seperti internet, database komersial, atau database yang terasosiasi dengan pelanggan dan pemasok organisasi.
2.7.4.2 Operational Data Store Operational Data Store (ODS) adalah gudang dari data operasional saat ini dan data operasional terintegrasi yang digunakan untuk analisis. ODS biasanya dibuat ketika warisan dari sistem operasional yang ditemukan tidak mampu mencapai persyaratan pelaporan. ODS menyediakan pengguna kemudahan dalam penggunaan database relasional. Pembangunan ODS dapat membantu dalam membangun data warehouse karena ODS dapat memasok data yang sudah diekstrak dari sistem sumber.
16 2.7.4.3 Load Manager Load manager (disebut juga komponen front end) melakukan seluruh operasi yang berasosiasi dengan ekstraksi dan pengisian data ke dalam data warehouse. Data mungkin diekstrak langsung dari sumber data atau umumnya penyimpanan data operasional. Operasi yang dilakukan oleh load manager mungkin memuat perubahan mudah dari data untuk menyiapkan data yang akan dimasukkan ke dalam data warehouse. Ukuran dan kompleksitas dari komponen bervariasi dan mungkin dibangun menggunakan kombinasi dari loading tools dan program yang dibuat.
2.7.4.4 Warehouse Manager Warehouse manager melakukan semua operasi yang berhubungan dengan manajemen data dalam data warehouse. Komponen ini dibangun dengan perangkat-perangkat manajemen data atau program yang dibuat. Operasi yang dilakukan oleh warehouse manager antara lain : a. Analisis data untuk memastikan konsistensi b. Perubahan dan penggabungan sumber data dari penyimpanan sementara ke dalam tabel data warehouse c. Pembuatan indeks dan tampilan dari tabel d. Generasi dari denormalisasi (jika diperlukan) e. Generasi agregasi (jika diperlukan)
17 f. Membuat cadangan data dan arsip data.
2.7.4.5 Query Manager Query manager (disebut juga komponen back end) menampilkan
segala
operasi
yang
berhubungan
dengan
manajemen dari user queries. Komponen ini dibuat dengan menggunakan vendor perangkat pengaksesan data end-user, perangkat memonitor data warehouse, fasilitas database, dan program buatan. Kompleksitas dari query manager bergantung pada fasilitas yang disediakan oleh perangkat pengaksesan data end-user dan database.
2.7.4.6 Detail Data Area ini menyimpan semua data detail dalam skema database. Dalam banyak kasus, data detail tidak disimpan secara online, tetapi dibuat tersedia dengan mengagregasikan data ke level detail berikutnya. Pada sebuah basis data yang biasa, data detail ditambahkan ke dalam warehouse untuk mendukung pengagregasian data.
2.7.4.7 Lightly and Highly Summarized Data Warehouse dari area ini menyimpan rangkuman data yang telah didefinisikan oleh warehouse manager. Area ini bersifat
18 tidak tetap karena menjadi subjek yang berubah dalam basis yang berjalan untuk merespon profil queries yang berubah.
2.7.4.8 Archive (Backup Data) Area dalam data warehouse menyimpan detail dan rangkuman data untuk tujuan pengarsipan dan backup. Data dipindahkan ke dalam penyimpanan seperti magnetic tape atau optical disk.
2.7.4.9 Metadata Area dalam data warehouse menyimpan semua definisi metadata yang digunakan oleh semua proses dalam data warehouse. Metadata digunakan untuk beberapa tujuan, di antaranya : a. Proses extraction dan loading. Metadata digunakan untuk memetakan sumber data ke tampilan umum data dalam data warehouse. b. Proses manajemen warehouse. Metadata digunakan untuk membuat rangkuman tabel secara otomatis. c. Bagian dari proses manajemen query. Metadata digunakan untuk mengarahkan query ke sumber daya yang paling sesuai.
19 2.7.4.10 End-User Access Tools Tujuan utama data warehouse adalah untuk menyediakan informasi kepada pengguna bisnis demi tujuan pengambilan keputusan strategis. Penguna ini berinteraksi dengan warehouse melalui end-user access tools. Terdapat lima kategori end-user access tools, yaitu: a. Reporting and query tools, digunakan untuk menghasilkan laporan operasional regional atau mendukung sejumlah pekerjaan yang volumenya tinggi, seperti invoice (pesanan pelanggan) dan cek gaji pegawai. b. Application development tools, aplikasi yang menggunakan perangkat data grafik untuk mendesain lingkungan clientserver. c. Executive Information System (EIS) tools, akhir-akhir ini ditujukan sebagai sistem informasi milik semua orang, yang dibangun secara asli untuk mendukung pembuatan keputusan strategis level tinggi. Bagaimana pun, fokus dari sistem yang terbuka ini adalah untuk memasukkan dukungan kepada seluruh manajemen level. d. Online Analytical Processing (OLAP) tools, berdasarkan pada konsep database multidimensional dan mengizinkan pengguna yang berpengalaman untuk menganalisis data dengan tampilan yang kompleks dan multidimensional. Aplikasi bisnis tipikal untuk perangkat ini mencakup penilaian efektivitas dari sebuah
20 kampanye
pemasaran,
prediksi
penjualan
produk,
dan
perencanaan kapasitas. e. Data mining tools, data mining adalah proses menemukan korelasi, pola, dan tren baru yang berharga dengan cara menggali data dalam jumlah besar dengan teknik statistik, matematik, dan artificial intelligence. Data mining memiliki potensi untuk menggantikan kemampuan perangkat OLAP dikarenakan daya tarik utama data mining adalah membangun model prediksi dari model yang meninjau ke belakang.
2.7.5 Aliran Data dalam Data Warehouse
Gambar 2.6 Aliran Data dalam Data Warehouse (Connolly, 2005, p1162)
21 Menurut Connolly dan Begg (2005, p1161), data warehouse berfokus pada lima manajemen arus data primer, yaitu : 2.7.5.1 Inflow Proses yang berhubungan dengan extraction, transformation, dan loading (ETL) data dari sumber data ke dalam data warehouse. Proses inflow berperan dalam proses pengambilan data dari sumber sistem dan memasukkannya ke dalam data warehouse. Cara lainnya yaitu dengan memasukkan data ke dalam operational data store (ODS) sebelum dikirim ke dalam data warehouse. Data harus direkonstruksi untuk tujuan data warehouse. Proses rekonstruksi dari data meliputi : a. Membersihkan data yang kotor. b. Restrukturisasi data yang dicocokkan dengan kebutuhan data warehouse, contohnya menambah atau membuang field-field. c. Memastikan sumber data konsisten dengan dirinya sendiri dan data lainnya yang sudah ada di dalam data warehouse.
2.7.5.2 Upflow Proses penambahan nilai ke data di dalam data warehouse melalui proses meringkas, mengemas, dan menyalurkan data. Aktivitas yang berhubungan dengan proses upflow meliputi : a. Meringkas data dengan proses memilih, memperhitungkan, menggabungkan, dan mengelompokkan data relasional ke dalam tampilan yang lebih baik dan berguna bagi pengguna.
22 b. Pengepakan data dengan mengubah data yang detail ke dalam format yang lebih berguna seperti spreadsheets, teks dokumen, diagram, grafik, dan animasi. c. Mendistribusikan data dalam kelompok-kelompok yang tepat untuk meningkatkan ketersediaan agar dapat diakses.
2.7.5.3 Downflow Proses pengarsipan dan backup data di dalam data warehouse. Penyimpanan data lama memainkan peranan yang penting dalam mempertahankan penampilan dan efektifitas dari warehouse dengan mengirimkan data lama dengan nilai yang terbatas ke sebuah tempat penyimpanan seperti magnetic tape atau optical disk. Downflow dari data juga meliputi proses yang memastikan bahwa kondisi sekarang dari data warehouse dapat dibangun kembali jika terjadi kehilangan data, kegagalan software atau hardware.
2.7.5.4 Outflow Proses pembuatan data hingga tersedia bagi pengguna. Dua aktivitas yang dilakukan dalam outflow meliputi : 1) Pengaksesan, berhubungan dengan proses memuaskan end-user dengan menyediakan data yang dibutuhkan. Frekuensi dari pengaksesan ini bervariasi mulai dari ad hoc secara rutin hingga real time. Selain itu, dipastikan bahwa sumber sistem digunakan
23 dengan cara yang paling efektif di dalam penjadwalan pengeksekusian terhadap query dari pengguna. 2) Pengiriman, berhubungan secara aktif dalam pengiriman informasi ke workstation dari pengguna. Ini merupakan area baru dari data warehouse dan sering dihubungkan dengan proses publish dan subscribe. Data warehouse akan mempublikasikan objek bisnis yang bermacam-macam dan pengguna akan berlangganan terhadap objek bisnis yang dibutuhkan mereka.
2.7.5.5 Metaflow Proses yang berhubungan dengan mengatur metadata. Metaflow merupakan proses memindahkan metadata (data tentang flow yang lainnya). Metadata merupakan deskripsi dari data yang ditampung di dalam data warehouse, apa yang ada di dalamnya, dari mana asalnya, dan apa yang telah dilakukan terhadap data tersebut dengan cara cleansing, integrating, dan summarizing.
2.7.6
Anatomi Data Warehouse Konsep awal dari penerapan arsitektur data warehouse yaitu bahwa data
warehouse
mengambil
data
dari
berbagai
sumber
dan
memindahkannya ke dalam pusat pengumpulan data yang besar. Konsep ini sebenarnya lebih cenderung kepada sebuah lingkungan mainframe yang terpusat.
24 Keunggulan
teknologi
Client
Server
memungkinkan
data
warehouse diterapkan dalam berbagai macam cara untuk menampung kebutuhan pemakai sistem secara lebih proporsional. Dalam suatu kasus, misalkan pemakai tertentu perlu menggabungkan data dari sebuah sistem pengumpulan data yang statis dengan data dari sistem operasional yang dinamis hanya dengan sebuah query saja. Berikut ini adalah tiga jenis dasar sistem data warehouse : 2.7.6.1 Data Warehouse Fungsional Data warehouse fungsional merupakan data warehouse yang dibuat lebih dari satu dan dikelompokkan berdasarkan fungsi-fungsi yang ada di dalam perusahaan seperti fungsi keuangan (financial), pemasaran, personalia, dan lain-lain.
Gambar 2.7 Data Warehouse Fungsional (http://blog.ub.ac.id/usfita/2010/11/01/data-warehouse/) Keuntungan dari bentuk data warehouse seperti ini adalah sistem mudah dibangun dengan biaya yang relatif murah sedangkan
25 kerugiannya adalah resiko kehilangan konsistensi data dan terbatasnya kemampuan dalam pengumpulan data bagi pengguna.
2.7.6.2 Data Warehouse Terpusat
Gambar 2.8 Data Warehouse Terpusat (http://blog.ub.ac.id/usfita/2010/11/01/data-warehouse/)
Bentuk ini terlihat seperti bentuk data warehouse fungsional, namun terlebih dahulu sumber data dikumpulkan dalam satu tempat terpusat, kemudian data disebar ke dalam fungsinya masing-masing, sesuai kebutuhan perusahaan. Data warehouse terpusat ini, biasa digunakan oleh perusahaan yang belum memiliki jaringan eksternal. Keuntungan dari bentuk ini adalah data benar-benar terpadu karena konsistensinya yang
26 tinggi, sedangkan kerugiannya adalah biaya yang mahal serta memerlukan waktu yang cukup lama untuk membangunnya.
2.7.6.3 Data Warehouse Terdistribusi Pada data warehouse terdistribusi ini, digunakan gateway yang berfungsi sebagai jembatan penghubung antara data warehouse dengan workstation yang menggunakan sistem beraneka ragam. Dengan sistem terdistribusi seperti ini memungkinkan perusahaan dapat mengakses sumber data yang berada di luar lokasi perusahaan (eksternal).
Gambar 2.9 Data Warehouse Terdistribusi (http://blog.ub.ac.id/usfita/2010/11/01/data-warehouse/)
27 Keuntungannya adalah data tetap bersifat konsisten karena sebelum data digunakan, data terlebih dahulu disesuaikan atau mengalami proses sinkronisasi. Sedangkan kerugiannya adalah lebih kompleks untuk diterapkan karena sistem operasi dikelola secara terpisah, juga biayanya yang paling mahal dibandingkan dengan dua bentuk data warehouse lainnya.
2.7.7 Keuntungan Data Warehouse Menurut Connolly dan Begg (2005, p1152), kesuksesan dari implementasi data warehouse dapat membawa keuntungan yang besar terhadap perusahaan meliputi : a. Pengembalian yang besar dari investasi Sebuah perusahaan harus mengeluarkan biaya yang besar untuk membangun dan mengimplementasi suatu data warehouse secara sukses. Menurut survei Internation Data Corporation (IDC) pada tahun 1996 melaporkan bahwa rata-rata 3 tahun ROI (Return On Investment) dalam data warehousing mencapai 401%, dengan lebih dari 90% perusahaan mencapai lebih dari 40% ROI, setengah perusahaan mencapai 160% ROI, dan seperempatnya mencapai lebih dari 600% ROI.
b. Keuntungan yang kompetitif Keuntungan kompetitif dapat diperoleh dengan mendukung para pengambil keputusan mengakses data yang dapat melihat apa yang
28 sebelumnya belum pernah dilihat dan diperkirakan sebelumnya. Contoh : pelanggan, tren, dan permintaan.
c. Meningkatkan produktivitas dari para pengambil keputusan Data warehouse dapat meningkatkan produktifitas para pengambil keputusan dengan membuat suatu database yang terintegrasi dari datadata yang konsisten, berorientasi
pada subjek, dan bersifat sejarah.
Dengan adanya data warehouse, data dari berbagai sistem dapat disatukan menjadi sebuah bentuk yang konsisten, yaitu dengan mentransformasikan data tersebut menjadi informasi yang berguna untuk para pengambil keputusan agar dapat melakukan analisis yang lebih nyata, akurat, dan konsisten.
2.7.8 Perancangan Data Warehouse Menurut Kimball (Connolly dan Begg, 2005, p1187), terdapat sembilan tahap dalam metodologi perancangan data warehouse, yaitu : 2.7.8.1 Menentukan Proses Proses (fungsi) mengacu pada subjek masalah dari data mart tertentu. Data mart yang pertama kali dibangun haruslah tepat waktu, sesuai dengan anggaran, dan dapat menjawab pertanyaan-pertanyaan bisnis yang penting.
29 2.7.8.2 Menentukan Grain Menentukan grain berarti memutuskan secara pasti apa yang dinyatakan oleh record dari tabel fakta. Dengan terpilihnya grain untuk tabel fakta, maka kita dapat mengidentifikasi dimensi. Keputusan grain untuk tabel fakta juga menentukan grain untuk setiap dimensi pada tabel fakta.
2.7.8.3 Mengidentifikasi dan Penyesuaian Dimensi Dimensi menentukan konteks untuk memberikan pertanyaan mengenai fakta-fakta dalam tabel fakta. Kumpulan dimensi yang dibangun dengan baik membuat data mart dapat dimengerti dan mudah untuk digunakan. Dimensi diidentifikasi dalam detail yang cukup untuk mendeskripsikan data seperti client dan properties dari grain yang tepat. Jika ada dimensi yang muncul dalam dua data mart, maka kedua data mart tersebut harus memiliki dimensi yang sama, atau salah satu data mart adalah subset matematis dari data mart yang lain. Hanya dengan cara ini dua data mart berbagi satu atau lebih dimensi pada aplikasi yang sama. Ketika sebuah dimensi digunakan oleh lebih dari satu data mart maka seluruh data warehouse akan gagal, karena dua data mart tidak dapat digunakan pada saat yang bersamaan.
30 2.7.8.4 Menentukan Fakta Grain dari tabel fakta menentukan fakta mana yang dapat digunakan pada data mart. Semua fakta harus dinyatakan berdasarkan tingkatan yang tersirat oleh grain. Fakta tambahan dapat ditambahkan ke dalam tabel fakta pada setiap waktu dengan catatan fakta tersebut konsisten dengan grain dari tabel.
2.7.8.5 Menyimpan Perhitungan Awal dalam Tabel Fakta Setelah dipilih, setiap fakta harus dikaji ulang untuk menentukan apakah ada kemungkinan untuk melakukan prakalkulasi yang muncul ketika fakta-fakta tersebut meliputi laporan untung rugi.
2.7.8.6 Menambahkan Atribut yang Dibutuhkan dalam Tabel Dimensi Pada tahapan ini, tabel dimensi kembali dikaji dengan menambahkan sebanyak mungkin deskripsi berbentuk teks. Deskripsi teks harus intuitif dan dapat dimengerti oleh pengguna. Kegunaan data mart ditentukan oleh cakupan dan sifat atribut pada tabel dimensi.
2.7.8.7 Menentukan Durasi Database Durasi mengukur seberapa lama tabel fakta dapat disimpan. Pada banyak perusahaan, ada kebutuhan untuk melihat pada waktu yang sama untuk periode satu atau dua tahun sebelumnya. Tabel
31 fakta yang sangat besar akan mengakibatkan munculnya minimal dua masalah dalam data warehouse. Pertama, meningkatnya kesulitan untuk menjadikan data lama yang semakin bertambah sebagai sumber data. Semakin lama umur data, semakin sulit dalam membaca dan menginterpretasikan datadata tersebut. Kedua, kewajiban dalam versi lama dari dimensi penting yang digunakan, bukan versi terbaru. Hal ini dikenal dengan masalah ‘slowly changing dimension’.
2.7.8.8 Menelusuri Perubahan dari Dimensi secara Perlahan Pada tahap ini, data warehouse memperhatikan proses dimensi yang semakin tua seiring dengan berjalannya waktu. Untuk itu perlu dilakukan update agar data warehouse selalu konsisten. Terdapat tiga tipe perubahan dimensi secara perlahan, yaitu perubahan data secara langsung atau update tabel dimensi, perubahan data membentuk record baru dengan surrogate key yang berbeda, dan perubahan data akan membentuk atribut atau kolom baru pada tabel dimensi.
2.7.8.9 Memutuskan Prioritas Query dan Tipe Query Pada tahap ini dipertimbangkan masalah desain fisikal. Masalah paling kritis yang muncul mempengaruhi persepsi pengguna akhir dari data mart adalah urutan penyusunan tabel fakta pada disk dan adanya ringkasan prapenyimpanan atau agregasi. Selain masalah
32 ini, ada lagi beberapa masalah fisikal yang mempengaruhi administrasi, backup, performa pengindeksan, dan keamanan.
2.7.9 Pemodelan Dimensional Menurut Connolly dan Begg (2005, p1183), pemodelan dimensional adalah sebuah teknik perancangan logikal yang bertujuan untuk menyajikan data ke dalam sebuah standar, bentuk intuitif yang dapat diakses dengan performa yang tinggi. Setiap model dimensional terdiri dari sebuah tabel dengan sebuah primary key komposit yang disebut dengan tabel fakta, dan sekumpulan tabel yang lebih kecil yang disebut dengan tabel dimensi. Setiap tabel dimensi memiliki sebuah primary key (non-komposit) sederhana yang berkorespondensi tepat dengan satu key komposit pada tabel fakta. Karakteristik dengan struktur seperti bintang ini disebut dengan star schema atau star join. Dalam pemodelan dimensional, semua natural keys diganti dengan surrogate key. Ini berarti setiap join antara tabel fakta dan tabel dimensi berdasarkan surrogate key, bukan natural key. Sebagai contoh, setiap cabang mempunyai natural key yang dinamakan cabang_kode, dan mempunyai surrogate key yang diberi nama cabangID. Berikut adalah keuntungan pemodelan dimensional : a. Efficiency Konsitensi
dari
struktur
database
pokok
memungkinkan
pengaksesan yang lebih efisien ke data dengan berbagai macam tools termasuk report writers dan query tools.
33 b. Ability to handle changing requirement Skema bintang dapat beradaptasi terhadap perubahan user’s requirement, sama halnya dengan semua dimensi yang menyediakan akses untuk tabel fakta. Ini berarti rancangan tersebut lebih mampu menunjang ad hoc user queries.
c. Extensibility Model
dimensional
dapat
dikembangkan.
Sebagai
contoh,
perubahan-perubahan yang harus ditunjang oleh model dimensional adalah : i.
Penambahan fakta baru selama fakta tersebut konsisten dengan granularity dasar dari tabel fakta yang telah ada.
ii.
Penambahan dimensi baru selama ada sebuah nilai tunggal dari dimensi tersebut yang mendefinisikan setiap record fakta yang ada.
iii.
Penambahan atribut dimensional baru.
iv.
Pemecah record dimensional yang ada ke level granularity yang lebih rendah dari titik tertentu dalam waktu ke depan.
d. Ability to model common business situation Ada banyak standar pendekatan yang sedang berkembang untuk menangani pemodelan situasi umum pada dunia bisnis. Setiap situasi ini memiliki kumpulan alternatif yang dimengerti dan dapat secara khusus diprogram di dalam report writers, query tools, dan antar muka lainnya. Sebagai contoh slowly changing dimension merupakan dimensi konstan
34 seperti ‘cabang’ dan ‘staf’ yang dapat berkembang secara lambat dan tidak serempak.
e. Predictable query processing Aplikasi data warehouse melakukan proses drill down dengan menambahan atribut dimensi dari sebuah skema bintang tunggal. Aplikasi melakukan proses drill across dengan menghubungkan beberapa tabel fakta dengan berbagai dimensi. Biarpun keseluruhan skema bintang dalam model dimensional perusahaan kompleks, namun proses query yang dilakukan dapat diprediksi karena pada level terendah, setiap tabel fakta harus diquery secara independen.
2.7.9.1 Skema Bintang Menurut Inmon (2002, p137), skema bintang adalah sebuah struktur data di mana data didenormalisasi untuk mengoptimalkan akses terhadap data; merupakan dasar dari rancangan data mart multidimensi. Menurut Connolly dan Begg (2005, p1163), skema bintang adalah sebuah struktur logikal yang mempunyai tabel fakta berisi data faktual yang berada di tengah, dan dikelilingi oleh tabel dimensi yang berisi referensi data yang biasanya dapat didenormalisasi.
35
Gambar 2.10 Skema Bintang
2.7.9.2 Skema Snowflake Menurut Connolly dan Begg (2005, p1184), skema snowflake adalah sebuah variasi dari star schema di mana tabel dimensinya tidak mengandung data yang terdenormalisasi sehingga tabel dimensi boleh memiliki dimensi. Snowflake memiliki sebuah tabel fakta sebagai pusatnya, dikelilingi tabel-tabel dimensi yang ternormalisasi.
36
Gambar 2.11 Skema Snowflake
2.7.9.3 Skema Starflake Menurut Connolly dan Begg (2005, p1185), skema starflake adalah struktur hybrid yang berisi campuran antara skema bintang dan skema snowflake. Skema starflake memiliki tabel fakta sebagai pusatnya, dikelilingi oleh tabel-tabel dimensi yang terdenormalisasi dan ternormalisasi.
37
Gambar 2.12 Skema Starflake
2.7.10 Komponen Pemodelan Dimensional 2.7.10.1 Fakta Menurut Kimball dan Ross (2002, p402), fakta adalah sebuah ukuran performansi bisnis, biasanya berupa numerik dan penjumlahan. Hal ini berlanjut pada pengertian dari tabel fakta sebagai lokasi penyimpanan untuk fakta yang ada.
2.7.10.2 Tabel Fakta Menurut Kimball dan Ross (2002, p402), tabel fakta adalah sebuah skema bintang (dimensional table); pusat tabel dengan pengukuran performansi bisnis dalam bentuk numerik yang memiliki karakteristik berupa sebuah composite key, yang
38 tiap-tiap elemennya adalah foreign key yang didapat dari tabel dimensi.
2.7.10.3 Dimensi Menurut Kimball dan Ross (2002, p399), dimensi adalah sebuah entitas independent pada sebuah model dimensional yang berfungsi sebagai pintu masuk atau berperan sebagai sebuah mekanisme untuk memecahkan pengukuran tambahan yang ada pada tabel fakta dari pemodelan dimensional.
2.7.10.4 Tabel Dimensi Menurut Kimball dan Ross (2002, p399), tabel dimensi adalah sebuah tabel pada model dimensional yang memiliki sebuah primary key tunggal dan kolom dengan atribut deskriptif.
2.7.10.5 Surrogate Key Menurut Kimball dan Ross (2002, p399), surrogate key adalah key berupa integer yang secara sekuensial ditambahkan sesuai keperluan pada staging area untuk membentuk sebuah tabel dimensi dan elemen yang menggabungkannya dengan tabel fakta. Pada tabel dimensi, surrogate key bertindak sebagai primary key. Sedangkan pada tabel fakta, surrogate key
39 bertindak sebagai foreign key yang menspesifikasikan dimensi. Surrogate key pada data warehouse dibutuhkan untuk menangani permasalahan yang timbul dari slowly changing dimensions serta data yang hilang atau pun data yang tidak dapat digunakan.
2.7.10.6 Granularity Menurut Inmon (2002, p391), granularity adalah tingkat detail yang terkandung pada setiap unit data. Semakin rinci tingkat datanya, maka semakin rendah tingkat granularitynya. Begitu juga sebaliknya, semakin rendah tingkat kerincian datanya, maka semakin tinggi tingkat granularitynya.
2.7.11 ETL ( Extract, Transform, and Load ) Menurut Prabhu dan Venatesan (2007, p112), ETL adalah proses migrasi dari database operasional menuju data warehouse. ETL merupakan suatu proses yang diperlukan dalam membentuk struktur model dimensi (dimensional model) dalam data warehouse yang terdiri dari 3 tahap, yaitu : 2.7.11.1 Extract Extract (ekstraksi) merupakan sebuah proses penarikan data dari satu atau lebih sistem operasional sebagai sumber data yang dibutuhkan oleh data warehouse yang akan digunakan di dalam proses selanjutnya. (Pada umumnya data ditarik dari
40 sistem database OLTP, tetapi dapat juga berasal dari sumbersumber eksternal yang lain).
2.7.11.2 Transform Setelah data diekstraksi, maka akan dilakukan proses transformasi (transform), yaitu sebuah proses untuk mengolah data sedemikian rupa, seperti membersihkan data (antara lain dengan membenarkan ejaan yang salah, menyelesaikan konflik domain,
mengembalikan
elemen
yang
hilang,
dan
menyatukannya ke dalam sebuah format yang standar agar data yang ada menjadi konsisten satu sama lain), menggabungkan data dari berbagai sumber eksternal yang lain, menghilangkan duplikasi data yang ada, dan juga memberikan surrogate key (sebuah key yang menghubungkan struktur data warehouse dan terpisah dari sistem sumber), selain itu data juga harus diagregasi untuk mempercepat analisis.
2.7.11.3 Load Setelah data telah ada dan telah ditransformasi sedemikian rupa sesuai dengan kebutuhan, maka hasil dari data tersebut akan disimpan dalam bentuk tabel dimensional yang berkualitas ke dalam sebuah database relasional baik berupa data warehouse maupun data mart. Proses penyimpanan data inilah yang dinamakan dengan load.
41 Jadi, tujuan dari proses ETL ini adalah untuk mengumpulkan, menyaring, mengolah, dan juga menggabungkan data-data dari berbagai sumber eksternal yang ada serta menyimpannya ke dalam data warehouse ataupun data mart.
2.8
Pengertian Pembelian Menurut Stevenson (2009, p518), pembelian adalah proses mendapatkan material, bagian-bagian, persediaan, dan layanan yang diperlukan untuk memproduksi sebuah produk atau menyediakan sebuah layanan.
2.9
Pengertian Logistik Menurut Chase (2006, p586), logistik adalah stok dari setiap barang atau sumber daya yang digunakan dalam sebuah organisasi. Sistem persediaan adalah serangkaian kebijakan dan pengendalian yang memonitor tingkat persediaan dan menentukan tingkat apa yang harus dipertahankan, saat saham harus diisi, dan berapa besar pesanan seharusnya. Menurut Schroeder (2007, p332), logistik adalah stok dari barang-barang yang digunakan untuk menfasilitasi produksi atau untuk meningkatkan kepuasan pelanggan.
42 2.10 Pengertian Microsoft SQL Server Mengacu pada pendapat Aldi Akbar (2011), SQL Server itu sendiri adalah bahasa yang dipergunakan untuk mengakses data dalam basis data relation. Bahasa ini secara de facto adalah bahasa standar yang digunakan dalam manajemen basis data relasional. Saat ini hampir semua server basis data yang ada mendukung bahasa ini dalam manajemen datanya. SQL Server merupakan salah satu produk dari Relational Database Management System (RDBMS). SQL Server termasuk SQL Server Management Studio, sebuah produk yang terintegrasi dengan fungsi untuk mengembangkan, menyebarkan, dan mengatasi masalah database SQL Server, serta perangkat tambahan untuk fungsi sebelumnya.
2.11 Pengertian Microsoft Visual Basic Menurut Patrice (2008, p4), Visual Basic adalah salah satu jenis dari bahasa pemrograman. Seperti bahasa lisan atau tulisan lainnya, Visual Basic memiliki peraturan-peraturan mengenai sintaks dan sekelompok seri dari katakata yang tersedia yang dapat digunakan untuk membuat aplikasi yang diinginkan oleh pengguna. Visual Basic adalah sebuah pilihan yang terkenal bagi para pemula karena beberapa orang menemukan bahwa penggunaan sintaksnya lebih sederhana daripada sintaks yang terdapat dalam bahasa pemrograman lainnya. Jika pernah menggunakan versi lama dari Visual Basic sebelumnya (seperti Visual Basic 4.0, 5.0, atau 6.0), maka akan ditemukan beberapa konstruksi dan
43 antar muka pengguna yang cukup familiar dalam Visual Basic 2008. Visual Basic 2008 adalah bahasa pemrograman yang bersifat orientasi subjek (OOP).
2.12 Metode Penyajian Data 2.12.1 Bar Chart
Gambar 2.13 Contoh Bar Chart (Aczel, 2002, p59)
Bar chart sering digunakan untuk menunjukkan data berkategori di mana ketika tidak ada penekanan pada persentase dari total yang direpresentasikan oleh setiap kategori. Bar chart dapat diplot secara vertikal maupun horizontal. Skala pengukuran adalah nominal atau ordinal. Bar chart dapat digunakan untuk menampilkan data kontinu seperti ukuran sepatu atau warna mata, dan data diskontinu seperti tinggi badan atau berat badan.
44 2.12.2
Line Chart
Gambar 2.14 Contoh Line Chart (Aczel, 2002, p60)
Line chart adala sebuah tipe grafik yang digunakan untuk menampilkan informasi dalam rangkaian titik data yang dihubungkan dengan segmen garis lurus. Line chart sering digunakan untuk memvisualisasikan trend data dalam interval waktu atau dalam kurun waktu tertentu, dengan demikian line chart sering digambarkan secara kronologis.
2.12.3
Pie Chart Pie chart adalah sebuah tampilan deskriptif sederhana dari data yang merupakan jumlah dari total yang diberikan. Pie chart mungkin adalah sebuah cara yang paling ilustratif untuk menampilkan kuantitas sebagai persentase dari total yang diberikan. Total area dari sebuah pie
45 chart merepresentasikan 100% dari kuantitas (jumlah dari nilai variabel pada seluruh kategori), dan ukuran dari setiap potongan adalah persentase dari total yang direpresentasikan oleh kategori yang ditunjukkan
potongan.
Pie
chart
biasanya
digunakan
untuk
mempresentasikan frekuensi atau data berkategori. Skala pengukuran dapat berupa nominal atau ordinal.
Gambar 2.15 Contoh Pie Chart (Aczel, 2002, p41)