BAB 2 LANDASAN TEORI
2.1
Sistem Basis Data Data adalah sesuatu yang disimpan di dalam database, sedangkan informasi adalah bagaimana data tersebut diartikan dan dimengerti oleh pengguna. Menurut Connoly dan Begg (2002,p14), database adalah suatu kumpulan logical data yang terhubung satu sama lain, dan deskripsi dari suatu data yang dirancang sebagai informasi yang dibutuhkan oleh organisasi. Sedangkan menurut Date (2000,p5), suatu sistem database adalah suatu sistem yang pada dasarnya menyimpan record-record di dalam suatu sistem yang dilakukan secara komputerisasi yang tujuannya secara keseluruhan adalah untuk memelihara informasi dan untuk membuat informasi tersebut tersedia berdasarkan permintaan. Database dapat diartikan sebagai kumpulan dari data - data yang saling berhubungan yang disimpan bersama - sama yang mempunyai kelebihan yaitu dapat melayani satu atau lebih aplikasi secara optimal.
Menurut Connoly dan Begg (2002,p18), ada 4 komponen penting dalam sistem database, yaitu : 1.
Data yang bergantung pada konfigurasi sistem. Konfigurasi sistem dapat mempengaruhi bentuk data yang dipakai, apakah data tersebut digunakan oleh satu orang atau beberapa orang dalam waktu sama. Suatu database 6
7 yang baik harus terintegrasi dan dapat dipakai bersama. Maksud dari terintegrasi adalah kumpulan data – data yang saling berhubungan, sehingga tidak terjadi pengulangan yang tidak perlu. 2.
Perangkat keras yang diperlukan oleh manajemen database dalam mengolah atau menyimpan database. Contohnya : media penyimpanan yang mempunyai kemampuan dalam mengolah database.
3.
Piranti lunak yang menghubungkan antara fisik database dengan pengguna yaitu Database Manajement System (DBMS). Semua kebutuhan pemakai dalam melakukan manipulasi data disediakan seperti membentuk file, penambahan data, penghapusan, pengeditan, dan lain – lain.
4.
Pengguna yang menggunakan data secara optimal, seperti pemograman piranti lunak untuk mengakses database, pengguna akhir yang menggunakan piranti lunak dalam mengakses database dan administrator yang bertanggung jawab atas kesalahan sistem database.
2.2
Data Warehouse 2.2.1
Pengertian Data Warehouse Menurut Connoly dan Begg (2002,p1047), Data Warehouse merupakan sebuah kumpulan data yang bersifat subject oriented, integrated, time variant, dan non-volatile yang dapat mendukung proses pembuatan keputusan manajemen. Sedangkan menurut Inmon (2002,p389), Data Warehouse adalah kumpulan database yang terintegrasi dan berorientasi subjek (subject-
8 oriented) yang didesain untuk mendukung fungsi DSS, dimana setiap unit data berhubungan dengan beberapa kejadian waktu. Data Warehouse berisi data atomic dan lightly summarized data. Sesungguhnya data warehouse adalah suatu bentuk dari database, namun data warehouse memiliki sifat interaktif dalam akses informasi dengan waktu respon yang tinggi. Dengan demikian data warehouse berbeda dengan database karena database digunakan pada proses operasional transaksi bisnis dan data warehouse berfokus pada proses analisis dan pengambilan keputusan bagi eksekutif.
2.2.2
Kegunaan Data Warehouse Menurut Williams (1998,p533), Data Warehouse biasanya digunakan untuk melakukan empat tugas yang berbeda yaitu : •
Pembuatan Laporan Penggunaan sederhana dalam Data Warehouse dapat menghasilkan informasi pertahun, perbulan, perminggu bahkan perhari.
•
Online Analytical Processing (OLAP) Data Warehouse digunakan untuk melakukan analisis bisnis guna menyelidiki kecenderungan pasar dan faktor penyebabnya.
9 •
Data Mining Penggunaan Data Warehouse dalam pencarian pola dan hubungan data, dengan tujuan membuat keputusan bisnis. Dalam hal ini, software dirancang untuk pola statistik dalam data untuk mengetahui kecenderungan yang ada.
•
Proses Informasi Eksekutif Data Warehouse digunakan untuk mencari informasi summary kunci yang penting, dengan tujuan membuat keputusan bisnis, tanpa harus menjelajahi keseluruhan data yang ada.
2.2.3
Karakteristik Data Warehouse Berikut karakteristik yang spesifik dari sebuah Data Warehouse (Anonim 2003,p1) : a.
Subject Oriented Informasi pada Data Warehouse ditampilkan menurut subjek atau area peminatan yang spesifik. Data dimanipulasi sedemikian rupa sehingga dapat menyediakan informasi mengenai sebuah subjek secara khusus.
b.
Integrated Data Warehouse menyediakan beragam kemampuan dari berbagai sumber tunggal informasi dan dapat mengerti area-area peminatan yang banyak sehingga menampung informasi dari beragam subjek.
10 c.
Non-Volatile Informasi yang stabil tidak akan berubah begitu saja setiap kali eksekusi proses operational terjadi.
d.
Time-Variant Data Warehouse mengandung histori sebuah subjek sama seperti
informasi
terkini.
Informasi
historikal
merupakan
komponen yang penting dari sebuah Data Warehouse. Time-Variant pada data warehouse dapat ditunjukkan pada beberapa cara, yaitu : a.
Dengan adanya data yang akurat selama jangka waktu tertentu, yaitu 5 sampai 10 tahun.
b.
Struktur key, baik secara eksplisit maupun implisit memiliki elemen waktu, seperti hari, minggu, bulan dan tahun. Elemen waktu ini biasanya terletak di bawah key pada data warehouse. .
c.
Tidak dapat di-update setelah selesai dibuat. Pada data operasional, karena bersifat akurat pada beberapa waktu pengaksesan, maka data warehouse dapat diupdate bila perlu.
e.
Accessible Fungsi utama dari sebuah Data Warehouse adalah untuk menyediakan informasi yang siap diakses oleh end-user.
11 f.
Process Oriented Adalah penting untuk menganggap Data Warehouse sebagai proses untuk menghantarkan informasi. Perawatan (Maintenance) dari sebuah Data Warehouse pada umumnya akan terus berlanjut (ongoing) dan sifatnya iterasi (iterative).
2.2.4
Anatomi Data Warehouse Penerapan
awal
dari
arsitektur
Data
Warehouse
dibuat
berdasarkan konsep bahwa Data Warehouse adalah mengambil data dari berbagai sumber dan memindahkannya ke dalam sebuah pusat pengumpulan data yang besar. Berikut ini adalah tiga jenis dasar sistem Data Warehouse: •
Functional
Data
Warehouse
(Data
Warehouse
Fungsional ) Suatu Data Warehouse yang mempergunakan pendekatan kebutuhan dari tiap bagian fungsi bisnis, misalnya departemen, divisi,dan lain-lain. Setiap unit fungsi mempunyai gambaran datanya masing-masing. Keuntungan dari Data Warehouse Fungsional ini adalah sistem dibangun dengan biaya yang murah sedangkan kerugiannya adalah resiko kehilangan konsistensi data besar dan kemampuan sistem pengumpulan data yang terbatas bagi user, atau apabila lingkungan diperbesar, konsistensi data perusahaan tidak dapat lagi dijamin.
12
source Functional Data Warehouse
source
Functional Data Warehouse
source
Operational
Workstation
Gambar 2.1 Functional Data Warehouse
•
Centralized
Data
Warehouse
(Data
Warehouse
Terpusat) Data Warehouse terpusat adalah pendekatan yang paling
banyak
digunakan,
sebagian
besar
karena
keterbiasaan pemakai dengan lingkungan mainframe yang terpusat. Data diambil dari seluruh sistem operasional dan disimpan di dalam pusat penyimpanan data. Pemakai kemudian bekerja dengan mempergunakan data yang telah terkumpul tersebut untuk membangun data warehouse fungsional
masing-masing.
Keuntungan
sistem
ini
dibandingkan dengan Data Warehouse fungsional adalah bahwa data benar-benar terpadu. Sistem ini mengharuskan pemasok data harus mengirimkan data tepat pada waktunya agar supaya tetap konsisten dengan pemasok lainnya. Disamping itu, pemakai hanya dapat mengambil
13 data dari bagian pengumpulan saja, dan tidak dapat secara langsung berhubungan dengan pemasok datanya sendiri.
source
Functional Data Warehouse
source
Centralized Data Warehouse
Functional Data Warehouse source
Workstation
Gambar 2.2 Centralized Data Warehouse
•
Distributed
Data
Warehouse
(Data
Warehoue
Terdistribusi) Data
Warehouse
Terdistribusi
dikembangkan
berdasarkan konsep gateway data warehouse sehingga memungkinkan user dapat langsung berhubungan dengan sumber data atau pemasok data maupun dengan pusat pengumpulan data lainnya. Menggunakan teknologi clientserver untuk mengambil data dari berbagai sumber, sehingga memungkinkan tiap divisi untuk membangun sistem operasionalnya sendiri serta dapat membangun pengumpulan
data
fungsionalnya
masing-masing.
Pendekatan ini akan menjadi sangat efektif bila data tersedia dalam bentuk yang konsisten dan user dapat
14 menambah data tersebut dengan informasi baru apabila ingin membangun gambaran baru atau informasi. Pendekatan ini memerlukan biaya yang sangat besar karena setiap pengumpulan data fungsional dan sistem operasinya dikelola secara terpisah. Selain itu, data yang ada harus disinkronisasikan untuk memelihara keterpaduan data.
source
Data warehouse Gateway source
source
Workstation
Gambar 2.3 Distributed Data Warehouse
2.2.5
Struktur Data Warehouse Data Warehouse memiliki struktur yang terdiri atas komponenkomponen sebagai berikut, yaitu : 1.
Current Detail Data Mengambarkan keadaan data yang sedang berjalan, data ini merupakan level data terendah dari Data Warehouse, cepat diakses dan memerlukan storage yang besar, sehingga sulit untuk diatur, karena data tersebut sangat kompleks.
15 2.
Older Detail Data Merupakan
data
yang
tersimpan
dalam
bentuk
penyimpanan yang besar. Older detail data adalah hasil back up dari current detail data yang lama, yang memiliki ukuran tahunan dan hampir tidak pernah diakses lagi. Biasanya disimpan pada media penyimpanan alternatif (terpisah), dan pada saat tertentu dapat di akses kembali bilamana dibutuhkan.
Penyusunan
direktori data ini menggambarkan umur data agar mempermudah pengaksesan berikutnya. 3.
Highly Summary Data Highly summary data adalah suatu hasil data yang bersifat “Total Summary”. Data ini tersusun rapi dan mudah diakses terutama untuk melakukan analisis perbandingan data berdasarkan urutan waktu dan analisis yang menggunakan data multi dimensi. Bagi eksekutif, hal ini sangatlah memudahkan karena mereka hanya perlu membaca atau melakukan analisa dalam waktu yang singkat.
4.
Lightly Summary Data Lightly summary data adalah ringkasan dari data tingkat rendah (current detail data) yang ada pada data detil yang sedang aktif tapi belum bersifat “Total Summary”. Data ini banyak ditampilkan dalam bentuk view dari kondisi yang sedang berjalan atau sudah berjalan.
16 5.
Meta Data Meta data bukan merupakan data-data hasil kegiatan operasional. Meta data merupakan jenis data yang memuat informasi penting dalam data warehouse. Dengan adanya meta data maka akan mempermudah end user dalam melakukan analisis dan menghemat waktu mereka. Meta data mengandung : •
Struktur Data Suatu direktori untuk membantu analisis DSS ( Decision Support Sistem) untuk mencari lokasi atau tempat data dalam Data Warehouse.
•
Algoritma untuk meringkas Data Suatu algoritma untuk proses summary data antara current detail data dengan lightly summarized data dan antara lightly summarized data dengan highly summarized data, dan lain-lain.
•
Pemetaan dari Data Operasional ke Data Warehouse Suatu panduan pemetaan data pada saat data ditransformasi atau diubah dari lingkup data operasional menjadi lingkup data warehouse.
17
Lightly summarized data
highly summarized data
M E T E D A T A
Current detail data
Older detail data
Gambar 2.4 Struktur Data Warehouse
2.2.6
Arsitektur Data Warehouse Menurut Connoly dan Begg(2002, p1052) arsitektur data warehoouse terdiri atas : 1.
Data operasional Sumber data untuk datawarehouse diambil dari : a. Mainframe data operasional menangani generasi pertama secara hirarkis dan database jaringan. Diperkirakan bahwa mayoritas data operasional perusahaan disimpan di sistem ini. b. Data masing – masing departemen tersimpan dalam sistem file kepemilikan seperti VSA, RMS, dan relational DBMS seperti Informix dan Oracle. c. Data pribadi yang tersimpan dalam workstation dan server pribadi.
18 d. Sistem
eksternal
seperti
komersial, atau database
internet,
database
yang berhubungan
dengan supplier dan customer. 2.
Opearational Data Store (ODS) Suatu Operational Data Store (ODS) adalah suatu media penyimpanan
dan
pengintegrasian
data
operasional
yang
digunakan untuk analisis. ODS menyediakan data dengan cara yang sama seperti data warehouse, tetapi sesungguhnya bertindak secara sederhana sebagai suatu tempat penampungan sementara sebelum data dipindahkan ke warehouse. ODS diciptakan ketika sistem operasional ditemukan tidak mampu untuk mencapai keberhasilan sistem pelaporan. ODS menyediakan manfaat yang berguna dari suatu relasional database dalam mengambil keputusan yang mendukung fungsi data warehouse. ODS merupakan langkah yang sangat membantu dalam pembuatan data warehouse sebab suatu ODS dapat menyediakan data yang telah diekstrak dari sistem sumber. Ini berarti bahwa proses integrasi dan restrukturisasi data untuk data warehouse menjadi lebih sederhana. 3.
Load Manager Load manager melaksanakan semua operasi yang berhubungan dengan pengambilan dan pemuatan data. Data diekstrak secara langsung dari sumber data atau data store
19 operasional. Pencapaian operasi oleh load manager dapat meliputi perubahan bentuk yang sederhana untuk mempersiapkan data tersebut agar dapat dimasukkan ke dalam warehouse. 4.
Warehouse Manager Warehouse manager melaksanakan semua operasi yang berhubungan dengan manajemen data. Operasi yang dilakukan warehouse manager meliputi : i.
Analisis data untuk memastikan konsistensi
ii.
Perubahan bentuk dan penggabungan data sumber dari gudang penyimpanan data temporer ke dalam tabel data warehouse.
5.
iii.
Membuat index dan mengacu pada tabel dasar.
iv.
Generasi denormalisasi
v.
Generasi agregasi
vi.
Backing-up dan archieving data
Query Manager Query Manager melaksanakan semua operasi yang berhubungan dengan manajemen user query. Komponen ini secara khusus dibangun menggunakan peralatan akses data end – user penjual, peralatan yang mengontrol data warehouse, fasilitas database, dan kebiasaan membangun program. Kompleksitas query manager ditentukan oleh fasilitas yang disajikan melalui peralatan akses para end-user database. Operasi yang dilakukan
20 oleh komponen ini meliputi pengarahan query pada tabel yang sesuai dan penjadwalan pelaksanaan query. 6.
Detailed data Area ini menyimpan semua data yang terperinci di dalam bagan database. Dalam banyak kasus, data yang terperinci tidaklah disimpan secara online tetapi dapat disediakan melalui agregasi data pada tingkatan detail berikutnya. Bagaimanapun, secara
reguler,
data
yang
terperinci
ditambahkan
untuk
melengkapi data yang dikumpulkan. 7.
Lightly and Highly Summarized Data Area ini menyimpan semua yang sudah dikenal dan kumpulan data yang sangat ringkas yang dihasilkan oleh warehouse manager. Area ini adalah tempat penampungan sementara dilakukan perubahan secara berkelanjutan untuk merespon perubahan profil query. Tujuan informasi ringkasan adalah untuk mempercepat pencapaian query. Meskipun biaya operasi akan meningkat sehubungan dengan proses peringkasan data tersebut, namun ini merupakan offset untuk melaksanakan operasi ringkasan ( seperti penyortiran dan pengelompokan ) secara terus menerus untuk menjawab user query. Data ringkasan diperbaharui secara terus menerus ketika ada data baru terisi ke dalam warehouse.
21 8.
Arsip / Backup Data Area ini menyimpan semua detail dan ringkasan data untuk kepentingan archieving dan backup. Walaupun ringkasan data dibangun dari detail data, akan memungkinkan untuk membuat cadangan ringkasan data secara online jika data ini ditunjukkan melebihi penyimpanan waktu untuk detail data. Data ditransfer ke gudang / penyimpanan seperti magnetik tab and optical disk.
9.
Metadata Area ini menyimpan semua definisi metadata yang digunakan oleh semua proses di dalam warehouse. Metadata digunakan untuk berbagai tujuan yang mencakup: i.
Ungkapan yang memuat proses/metadata yang digunakan untuk sumber data penuntun bagi suatu pandangan yang umum data dalam warehouse.
ii.
Proses manajemen warehouse/metadata digunakan untuk mengotomatisasi pembuatan tabel ringkasan.
iii.
Sebagai bagian proses manajemen query metadata digunakan untuk menghubungkan suatu query dengan sumber data yang tepat Struktur meta-data berbeda untuk masing – masing proses,
sebab memiliki tujuan yang berbeda. Ini berarti bahwa berbagai salinan metadata yang menggambarkan data item yang sama dipegang di dalam data warehouse. Manajemen metadata di
22 dalam data warehouse adalah suatu tugas yang sangat kompleks yang tidak boleh diremehkan. 10.
Peralatan Akses End-User Tujuan
prinsip
data
warehousing
adalah
untuk
menyediakan infomasi kepada para user bisnis untuk pengambilan keputusan strategis. Para user berinteraksi dengan warehouse menggunakan peralatan akses End-User.
Gambar 2.5 Arsitektur Data Warehouse
Karakteristik dari arsitektur Data Warehouse: 1.
Data diambil dari beberapa sumber, antara lain sistem, database, dan file
23 2.
Data
dari
sistem,
diintegrasikan
dan
ditransformasikan sebelum di gunakan dalam Data Warehouse 3.
Data Warehouse adalah sebuah database read-only terpisah yang dibangun secara khusus
4.
User mengakses Data Warehouse melalui frontend tools atau aplikasi
2.2.7
Infrastruktur Data Warehouse Infrastruktur Data Warehouse adalah software, hardware, pelatihan dan komponen-komponen lainnya yang memberikan dukungan yang dibutuhkan untuk mengimplementasikan arsitektur Data Warehouse (Poe,1996,p54). Salah
satu
instrumen
pengembangan data warehouse
yang
mempengaruhi
keberhasilan
adalah pengidentifikasian arsitektur
mana yang terbaik dan infrastruktur apa yang dibutuhkan Infrastruktur dan arsitektur sebuah Data Warehouse sangat penting dalam mengimplementasikannya karena arsitektur yang sama belum tentu menjamin bahwa infrastrukturnya akan sama, tergantung pada lingkungan perusahaan atau organisasi.
2.2.8
Data Warehouse Dataflow Berdasarkan pendapat Connoly dan Begg (2002,p1057), data warehouseing focuses on the management of five primary data flows,
24 namely the inflow, downflow, outflow dan metaflow, yang artinya data warehouse memusat pada manajemen 5 arus data primer antara lain : data flows, namely the inflow, downflow, outflow dan metaflow 1.
Inflow adalah proses ekstrasi, pembersihan dan pengisian data dari sistem sumber ke dalam data warehouse.
2.
Uplow adalah proses dimana di dalamnya terdapat nilai tambahan ke data dalam gudang melalui peringkasan, mempaket, dan distribusi data.
3.
Downflow adalah proses mengambil dan memback up data dalam gudang.
4.
Outflow adalah proses membuat data agar tersedia bagi end user.
5.
Metaflow adalah proses memanajemen meta data (Berdasarkan pendapat Inmon (2002,p393) metadata (1) data about data; (2) the description of structure, content, keys, indexes, etc; of data).
25
Warehouse Manager
Meta-flow Meta-Data
Operational Data Source 1
Reporting, Query, Application development, and EIS tools Highly Summarized Data
Inflow Load Manager
Lightly Summarized Data
Operational Data Source 2
Query Manager
Outflow OLAP tools
Upflow DBMS
Detailed Data
Operational Data Source n
Warehouse Manager Data mining tools Downflow
End-user access tools
Operational Data Store (ODS) Archive/backup data
Gambar 2.6 Data Warehouse Dataflow
2.2.9
Tahapan Membangun Data Warehouse Berdasarkan kutipan dalam Connoly dan Begg (2002,p1083), metodologi yang dikemukakan oleh Kimball dalam membangun data warehouse ada 9 tahapan, dikenal dengan nine-step methodology. Sembilan tahapan tersebut adalah : 1.
Memilih Proses ( Choosing the Process ) Pilihlah subjek dari permasalahan yang sedang dihadapi, kemudian identifikasi proses bisnisnya.
2.
Memilih Grain ( Choosing the Grain ) Tentukan tabel fakta dan identifikasi dimensinya.
26 3.
Identifikasi dan Penyesuaian Dimensi (Identifying and Comforting the Dimensions ) Identifikasi dimensi dalam detail yang secukupnya untuk mendeskripsikan sesuatu. Ketika suatu tabel dimensi ada pada dua atau lebih data mart, maka tabel dimensi tersebut harus mempunyai dimensi yang sama atau salah satu merupakan subset dari yang lainnya.
4.
Memilih Fakta ( Choosing the Fact ) Tentukan fakta-fakta dari tabel fakta yang akan digunakan pada data mart. Fakta-fakta tersebut harus numeric dan dapat ditambah.
5.
Menyimpan Pre-Calculation pada Tabel Fakta ( Storing PreCalculation in the Fact Table ) Setelah fakta-fakta dipilih maka lakukan pengkajian ulang untuk menentukan apakah ada fakta-fakta yang dapat di terapkan Pre-Calculation (kalkulasi awal) dan melakukan penyimpanan pada tabel fakta.
6.
Rounding out the Dimension Tables Dalam langkah ini, kita kembali pada tabel dimensi dan menambahkan
gambaran
teks
terhadap
dimensi
yang
memungkinkan. Gambaran teks harus mudah digunakan dan dimengerti oleh user.
27 7.
Memilih Durasi dari Database ( Choosing the Duration of the Database ) Tentukan waktu dari pembatasan data yang diambil dan dipindahkan ke dalam tabel fakta.
8.
Melacak Perubahan dari Dimensi secara perlahan ( Tracking Slowly Changing Dimensions ) Amati perubahan dari dimensi pada tabel dimensi. Ada 3 tipe dasar dari perubahan dimensi yang perlahan, yaitu : •
Perubahan atribut dimensi ditulis ulang (di-overwrite).
•
Perubahan atribut dimensi mengakibatkan pembuatan suatu dimensi baru.
•
Perubahan atribut dimensi mengakibatkan sebuah atribut alternatif dibuat, jadi antara atribut yang lama dan baru diakses secara bersama-sama.
9.
Memutuskan Prioritas dan Mode dari Query ( Deciding the Query Priorities and the Query Modes ) Pertimbangkan pengaruh dari perancangan fisikal, seperti keberadaan dari summaries dan aggregate. Selain itu, masalah administrasi back up, kinerja indeks dan keamanan juga merupakan faktor yang harus diperhatikan.
28 2.2.10 Keuntungan dan Kerugian Data Warehouse Berdasarkan Mallach (2000,p181-182) keuntungan menggunakan Data Warehouse adalah : 1.
Kinerja perangkat keras DSS (Decision Support Sistem) dapat dioptimalkan untuk tujuan tertentu.
2.
Response time dari DSS tetap terjaga.
3.
Lingkungan Data Warehouse lebih sederhana dan lebih baik dibandingkan dengan aplikasi client-server. Berdasarkan pendapat Mallach (2000, p182) kerugian dari
penerapan Data Warehouse adalah : 1.
Terdapat beban tambahan pada sistem pusat karena perlunya melakukan transfer data diantara dua sistem (sistem operasional dan Data Warehouse) untuk menjaga data tetap up-to-date.
2.
Harus mempunyai karyawan yang mengerti kedua sistem.
3.
Users yang mengakses kedua sistem memerlukan dua tipe terminal komputer atau prosedur jaringan yang rumit untuk berpindah sistem.
4.
Transfer data dari sistem operational ke Data Warehouse memerlukan waktu yang relatif lama.
2.3
Perancangan Data Warehouse Suatu hal penting yang menjadi perhatian dalam perancangan Data Warehouse adalah pengumpulan data. Data Warehouse yang dirancang dalam
29 pengembangan sistem sebaiknya dapat menunjang permintaan user dan selalu terfokus pada penyediaan informasi bagi user. Menurut Connolly (2002, p1078-1082) dalam merancang sebuah data warehouse sangatlah kompleks. Untuk memulai proyek data warehouse, pertama-tama kita mengidentifikasikan dan mengumpulkan kebutuhan pengguna. Pengidentifikasian tersebut dilakukan dengan wawancarai para pengguna, mempelajari kebutuhan para pengguna dan menemukan informasi apa yang mereka perlukan untuk mendukung kesuksesan bisnis mereka. Setelah itu, menentukan sumber data mana yang akan di pakai dalam data warehouse. Kemudian
dilakukan
perancangan
terhadap
data-data
tersebut
untuk
menghasilkan informasi yang dapat mendukung dalam pengambilan keputusan bisnis mereka. Dengan identifikasi kebutuhan pengguna dan sumber data yang akan digunakan, barulah proses perancangan basis data data warehouse dimulai. Komponen basis data dalam sebuah data warehouse digambarkan dengan menggunakan sebuah teknik yang disebut model dimensional.
2.3.1
Skema Bintang Menurut Poe (1996,p120), Skema bintang adalah suatu desain database yang paling sering digunakan untuk merealisasikan sebuah Data Warehouse, memiliki struktur sederhana dengan tabel-tabel yang relatif dan penggabungan yang telah diketahui. Skema ini memungkinkan respon yang cepat dalam menentukan query dan pemahaman yang mudah bagi analisis dari end-user, maupun pemakai yang tidak biasa dengan struktur database.
30 2.3.1.1 Keuntungan Skema Bintang Beberapa keuntungan dari skema bintang yaitu: •
Membentuk rancangan database yang memberikan waktu respon yang cepat.
•
Menghasilkan dimodifikasi
suatu dengan
rancangan mudah
yang
sesuai
dapat dengan
perkembangan Data Warehouse tersebut. •
Dapat menyamakan persepsi antara user dan Data Warehouse sehingga data dapat berguna bagi user.
•
Mempermudah pemahaman dan navigasi meta data baik bagi pemakai atau pengembang
•
Memperluas
pilihan
front-end
tools
dalam
pengaksesan data, sebagai beberapa produk yang memerlukan rancangan skema bintang.
2.3.1.2 Perancangan Skema Bintang Skema bintang terdiri dari dua macam tabel, yaitu : •
Tabel Fakta Tabel fakta sering disebut major table, merupakan inti dari skema bintang dan berisi data aktual yang akan dianalisis. Field-field di tabel fakta disebut measure yang biasanya berupa
31 numerik yang selalu berisikan foreign key dari masing-masing tabel dimensi. •
Tabel Dimensi Tabel dimensi disebut juga minor table, merupakan
tabel
dari
skema
bintang
yang
menyediakan jenis perspektif dari cara pandang terhadap data. Tabel dimensi mempunyai fieldfield dari level hirarki tabel dimensi. Nama dari field-field biasanya digunakan nama dari level dalam suatu hirarki. Ada beberapa jenis skema bintang, yaitu : 1.
Simple-star Schema Dalam simple-star schema atau skema bintang sederhana, tabel fakta atau tabel yang merupakan hasil summarized sebagai input bagi Data Warehouse, terdiri dari satu atau beberapa foreign key. Sebuah foreign key adalah sebuah kolom dalam suatu tabel yang nilainya ditentukan oleh primary key dari tabel lain.
32
Dimensi
Key 1
Dimensi
Fakta
Atribut Atribut Atribut
Key 3
Key 1
Atribut Atribut Atribut
Key 2 Key 3
Dimensi
Kolom Data Kolom Data Kolom Data
Key 2 Atribut Atribut Atribut
Gambar 2.7 Simple Star Schema
Pada gambar diatas dijelaskan bahwa ada sebuah tabel fakta dan tiga buah tabel dimensi atau pendukung. Dimana, tabel faktanya memiliki primary key yang terdiri dari tiga foreign key, yaitu key 1, key 2, dan key 3, yang masing-masing merupakan primary key dari tabel dimensi atau pendukung tersebut. 2.
Multi-star Schema Skema bintang juga dapat terdiri dari banyak tabel fakta. Hal ini terjadi karena mereka berisi kenyataan yang tidak saling berhubungan atau karena perbedaan waktu pemuatan data, disamping
itu
juga
dapat
meningkatkan
penampilan. Terutama jika data tersebut dalam jumlah besar.
33
Fakta Key 1 Dimensi
Key 2
Key 1
Key 3
Dimensi
Atribut Atribut Atribut
Kolom Data Kolom Data Kolom Data
Key 3
Dimensi Key 2 Atribut Atribut Atribut
Atribut Atribut Atribut
Fakta Key 1 Key 2 Key 3 Kolom Data Kolom Data Kolom Data
Gambar 2.8 Multiple Fact Star Schema
Kegunaan lain dari tabel fakta adalah untuk mendefinisikan hubungan many-to-many dari suatu tabel dimensi tertentu. Bentuk tabel seperti ini biasanya disebut tabel asosiasi. Tabel ini dibuat untuk menyelaraskan hubungan banyak ke banyak antara dimensi yang berbeda.
2.3.2
Skema Snowflake Pada snowflake, prinsip dasarnya tidak jauh berbeda dari skema bintang. Snowflake merupakan variasi lain dari skema bintang dimana tabel dimensi dari skema bintang di organisasi menjadi suatu hirarki dengan melakukan normalisasi. Penggunaan tabel dimensi sangatlah menonjol karena itulah perbedaan mendasar dari skema bintang dan skema snowflake. Skema snowflake menggunakan beberapa tabel fakta dan tabel dimensi yang
34 sudah mengalami normalisasi sedang skema bintang menggunakan tabel dimensi yang masih denormalisasi. Skema Snowflake dibuat berdasarkan OLTP sehingga semua data akan termuat detail dalam setiap tabel fakta dari tabel dimensi. Keuntungan dari skema snowflake terletak pada kecepatan memindahkan data dari data OLTP ke dalam metadata.
2.3.3
Agregasi Agregasi
adalah
proses
perhitungan
data
fakta
selama
pendefinisian atribut. Agregasi dapat dibuat selama proses transformasi berlangsung dan pada saat pemuatan data ke dalam data warehouse. Agregasi dapat juga berarti proses mengkombinasi beberapa objek menjadi satu bentuk objek yang baru. Menurut Poe (1996,p136), faktor yang mendorong pembuatan aggregasi : •
Meningkatnya penampilan pencarian (searching)
•
Mengurangi jumlah penggunaan kode produk universal. Suatu aggregasi yang baik dapat dibuat untuk digunakan oleh 300
user dalam satu hari, karena akan lebih bermanfaat jika dibandingkan dengan membuat aggregasi yang membutuhkan waktu 2 jam tapi hanya digunakan sekali dalam satu tahun oleh satu user saja. Salah satu teknik yang harus dicatat pada saat pemuatan data warehouse, kita tetap membutuhkan teknik database klasik seperti partisi
35 tabel secara fisik. Hal ini menjadi penting bilamana data warehouse mencapai gigabyte data.
2.3.4
Denormalisasi Denormalisasi adalah suatu prosedur yang mengelompokan kembali normalisasi data untuk suatu susunan yang lebih spesifik dari suatu proses dengan tujuan membuat proses ini lebih efisien (Aldeman dan Moss, 2000, p244) : 1.
Untuk mengurangi jumlah hubungan yang terjadi antar tabel-tabel yang harus mengalami proses pada waktu dilakukan pencarian. Dengan inilah penampilan basis data dapat ditingkatkan.
2.
Untuk membuat struktur fisik dari basis data yang semakin mendekati model dimensi dari pemakai. Membuat struktur tabel sesuai
dengan
yang
ingin
ditanyakan
oleh
pemakai,
memungkinkan terjadinya akses langsung, yang sekali lagi akan meningkatkan penampilan. Pada
dasarnya,
proses
denormalisasi
merupakan
proses
pembalikan dari normalisasi. Suatu database yang telah dinormalisasi, secara fantastis dapat menjadi beberapa tabel yang bebas dan terintegrasi penuh melalui relationship antara primary-key dan foreign-key. Proses denormalisasi dilakukan untuk menghindari ‘permainan’ query yang terlalu kompleks di dalam sistem data warehouse. Hal ini diperlukan
36 karena melihat data warehouse sebagai ‘gudang’ dan data yang telah berlalu dan dalam volume yang sangat besar.
2.3.5
Matriks Menurut Martin (1990), matriks adalah sebuah tabel yang terdiri dari kolom dan baris, serta menunjukkan hubungan tertentu antara kolom dan baris. Kolom mewakilkan fungsi tertentu, demikian pula halnya dengan baris. Apabila ada hubungan antara fungsi tertentu dari kolom dengan fungsi tertentu dari baris, maka titik temunya diberi tanda berupa tanda silang (X) atau dengan tanda centang (V). Sedangkan apabila tidak ada tanda, maka dianggap tak ada hubungan secara langsung. Terdapat empat prosedur yang digunakan dalam membuat analisis menggunakan matriks, yaitu : 1.
2.
Membuat analisis top level dari data perusahaan a.
Menentukan subjek data
b.
Dijabarkan ke dalam bentuk entitas
c.
Membuat diagram awal hubungan antar entitas
d.
Membuat matriks fungsi bisnis versus entitas
e.
Membuat matriks unit organisasi versus entitas
Menentukan enterprise model a.
Wawancara dengan pihak manajemen untuk menentukan enterprise model
b.
Membuat presentasi kepada pihak manajemen tentang enterprise model yang sudah diperbaiki.
37
3.
c.
Menentukan matriks entitas versus fungsi bisnis.
d.
Menentukan matriks entitas versus unit organisasi
e.
Meminta persetujuan enterprise model.
Mengelompokkan matriks fungsi a.
Menggunakan algoritma clustering
b.
Mengumpulkan ke depan semua fungsi create dalam entitas
c.
Memasukkan fungsi-fungsi yang lain dan entitas ke dalam cluster
d.
Mengelompokkna secara manual untuk mengetahui sistem yang ada
e.
Menentukan alur data dari sistem yang satu ke sistem yang lain.
f.
Membuat diagram hubungan yang menunjukkan hubungan antar sistem
g.
Menyusun
kelompok-kelompok
tersebut
untuk
menyederhanakan interaksi antar sistem 4.
Mengelompokkan matriks fungsi untuk menunjukkan area bisnis sebenarnya a.
mengatur matriks fungsi yang telah dikelompokkan ke dalam bentuk batasan – batasan analisis bisnis
b.
Menempatkan semua fungsi ke dalam area bisnis.
c.
Menentukan lokasi geografis untuk setiap area bisnis
38 d.
Mengatur area bisnis sehingga area – area tersebut saling berhubungan.
2.4
Data Mart Berdasarkan pendapat Connoly dan Begg (2002,p1067), Data mart diartikan sebagai suatu subset gudang data yang mendukung kebutuhan departemen atau fungsi bisnis tertentu. Berdasarkan pendapat McLeod, Jr. (2001,p191), Data mart adalah database yang berisi data yang menjelaskan satu segmen operasi perusahaan. Data mart adalah subset dari data warehouse. Data mart biasanya digunakan oleh satu departemen atau grup user dalam perusahaan untuk mendefinisikan serangkaian tugas. Data yang ada di dalam data mart merupakan merupakan subset data yang di temukan dalam data warehouse. Berdasarkan pendapat Connoly dan Begg (2002,p1067), karakteristik yang membedakan data mart dan data warehouse antara lain : •
Data mart memusat pada kebutuhan para pemakai yang berhubungan dengan satu departemen atau fungsi bisnis.
•
Data mart tidak secara normal berisi rincian data operasional, tidak sama dengan data warehouse.
•
Data mart berisi lebih sedikit data dibandingkan dengan data warehouse, data mart jadi lebih mudah dipahami. Ada beberapa pendekatan membangun data mart. Salah satu pendekatan
untuk membangun beberapa data mart adalah untuk pengintegrasian yang
39 akhirnya ke dalam suatu warehouse, pendekatan yang lain adalah membangun infrastruktur untuk suatu perusahaan data warehouse pada waktu yang sama dalam membangun satu atau lebih data mart untuk segera mencukupi kebutuhan bisnis. Arsitektur data mart dapat dibangun seperti two-tier atau three-tier aplikasi database. Data warehouse adalah tier pertama yang opsional (jika data warehouse menyediakan data tersebut untuk data mart). Data mart adalah tier yang kedua, dan pemakaian yang terakhir adalah tier yang ketiga seperti pada gambar 2.9, data di bagi-bagikan di antara tier. Reporting, Query, Application development, and EIS tools
Warehouse Manager
Operational Data Source 1 Highly Summarized Data
Meta-Data Load Manager
OLAP tools Query Manager
Lightly Summarized Data
Operational Data Source 2
Data mining tools DBMS
Detailed Data
End-user access tools
Warehouse Manager
Operational Data Source n (First Tier)
(Second Tier)
Operational Data Store (ODS)
Reporting, Query, Application development, and EIS tools
Archive/backup data Summarized Data (Relational Database)
Summarized Data (Multidimensional Database)
OLAP tools
Data mining tools (Third Tier)
Gambar 2.9 Typical data warehouse and data mart architecture
40 2.5
Pembelian Sistem pembelian mencakup seluruh tahap pemrosesan pembelian, persediaan dan pembayaran hutang dagang. Sistem pembelian menghasilkan informasi yang dibutuhkan oleh seorang manajer. 2.5.1
Pengertian Pembelian Menurut Mulyadi (2001,p299), pembelian digunakan dalam perusahaan untuk pengadaan barang yang diperlukan perusahaan. Transaksi pembelian dapat digolongkan menjadi dua : pembelian lokal dan impor. Pembelian lokal adalah pembelian dari pemasok dalam negeri, sedangkan impor adalah pembelian dari pemasok luar negeri. Menurut Mulyadi (2001,p300), fungsi pembelian bertanggung jawab untuk memperoleh informasi mengenai harga barang, menentukan pemasok yang dipilih dalam pengadaan barang, dan mengeluarkan order pembelian kepada pemasok yang dipilih dalam pengadaan barang, dan mengeluarkan order pembelian kepada pemasok yang dipilih.
2.5.2
Fungsi yang terkait dalam pembelian Menurut Mulyadi (2001,p302), fungsi terkait dalam sistem pembelian adalah : a.
Fungsi Gudang Bertanggung
jawab
untuk
mengajukan
permintaan
pembelian sesuai dengan posisi persediaan yang ada di gudang dan untuk menyimpan barang yang telah diterima oleh fungsi penerimaan.
41 b.
Fungsi Pembelian Bertanggung
jawab
untuk
memperoleh
informasi
mengenai harga barang, menentukan supplier yang dipilih dalam pengadaan barang dan mengeluarkan order pembelian kepada supplier yang terpilih. c.
Fungsi Penerimaan Bertanggung
jawab
untuk
melakukan
pemeriksaan
terhadap jenis, mutu, dan kualitas barang yang diterima dari supplier guna menentukan dapat atau tidaknya barang tersebut diterima oleh perusahaan. Fungsi ini juga bertanggung jawab untuk menerima barang yang berasal dari transaksi return penjualan. d.
Fungsi Akuntansi Dalam tranksaksi pembelian fungsi akuntansi yang terkait adalah fungsi pencatat hutang dan fungsi pencatat persediaan. Fungsi pencatat hutang bertanggung jawab untuk mencatat transaksi pembelian ke dalam register bukti kas keluar, dan untuk menyelenggarakan arsip bukti kas keluar yang berfungsi sebagai catatan hutang atau menyelenggarakan kartu hutang sebagai buku pembantu hutang. Fungsi pencatat persediaan bertanggung jawab untuk mencatat harga pokok persediaan barang yang dibeli ke dalam kartu persediaan.
42 2.6
Penjualan 2.6.1
Pengertian Penjualan Menurut Mulyadi ( 2001,p202 ), kegiatan penjualan adalah transaksi penjualan barang atau jasa, yang ditinjau dari cara pembayarannya (secara tunai atau kredit). Didalam perusahaan yang bergerak dalam bidang perdagangan, penjualan adalah suatu proses penting dalam melaksanakan tujuan dari perusahaan untuk memperoleh keuntungan maksimal. Secara umum, pengertian penjualan dapat dikatakan sebagai ilmu dan seni mempengaruhi pribadi yang dilakukan oleh penjual untuk mengajak orang lain membeli barang atau jasa yang ditawarkan. Jadi adanya penjualan dapat tercipta suatu proses pertukaran barang atau jasa antara penjual dan pembeli. Penjualan dapat di bagi menjadi dua jenis, yaitu: •
Penjualan Kredit Menurut
Mulyadi
(2001,p210),
jika
order
pelanggan telah dipenuhi dengan dikirimnya barang atau penyerahan jasa, untuk jangka waktu tertentu perusahaan mempunyai piutang terhadap pelanggan. •
Penjualan Tunai Menurut Mulyadi (2001,p455), barang atau jasa baru diserahkan oleh perusahaan kepada pembeli setelah perusahaan menerima pembayaran dari pembeli.
43 2.6.2
Pengertian Sistem Informasi Penjualan Sistem
informasi
penjualan
adalah
sebuah
sistem
yang
mengendalikan seluruh kegiatan transaksi penjualan barang atau jasa secara tunai maupun kredit sehingga menghasilkan informasi yang dibutuhkan oleh manajemen untuk menganalisa penjualan yang sedang berlangsung. Adapun kriteria dalam pengakuan penjualan terdiri dari 3, yaitu : 1.
Adanya bukti yang kuat bahwa pembeli mempunyai maksud untuk membeli, dan penjual mempunyai maksud untuk menjual.
2.
Adanya perjanjian atau kesepakatan harga antara pembeli dan penjual.
3.
Penentuan mengenai barang tertentu yang akan dijual dan yang sudah dalam keadaan siap untuk di jual.
2.7
Critical Success Factor (CSF) Menurut Martin ( 1990,p89 ), Critical Success Factor (CSF) adalah cara dalam jumlah terbatas dimana nilai kepuasan dapat menjamin kinerja yang kompetitif bagi seorang individu, departemen, atau organisasi. CSF merupakan salah satu area penting dimana “segala sesuatu harus berjalan dengan benar” bagi sebuah bisnis untuk berkembang dan goal seorang manajer dapat dicapai. Sebuah goal berarti keseluruhan tujuan. Sebuah CSF adalah apa yang harus dilakukan untuk mencapai goal tersebut.
44 Menurut Laudon (2004,p380), CSF adalah sejumlah kecil tujuan operasional yang dapat diidentifikasi, dibentuk oleh industri, perusahaan, manajer, dan lingkungan lebih luas yang dipercaya untuk memastikan sukses tidaknya sebuah organisasi. Digunakan untuk menentukan kebutuhan informasi dari sebuah organisasi. Menurut McLeod (2001,p109), sebuah CSF adalah satu dari aktivitas perusahaan yang mempunyai pengaruh kuat terhadap kemampuan perusahaan untuk memenuhi tujuannya. Sebuah perusahaan umumnya mempunyai banyak CSF. Kekuatan dari metode CSF adalah bahwa CSF menghasilkan kumpulan data yang lebih kecil untuk dianalisis daripada analisis perusahaan secara keseluruhan. Hanya manajer tingkat atas yang diwawancarai, dan pertanyaan berfokus pada sejumlah kecil CSF daripada pertanyaan yang luas sehinggan mendapat informasi apa yang dibutuhkan. Ini khususnya sesuai untuk manajer tingkat atas dan pembangunan DSS dan EIS.