BAB 2 LANDAS AN TEORI
2.1
Data Data adalah sebuah representasi dari obyek - obyek dan kejadian - kejadian yang
berarti dan penting di lingkungan pemakai. (Hoffer, Prescott, dan McFadden, 2002, p5). Data merupakan sesuatu yang belum mempunyai arti bagi penerimanya dan masih memerlukan adanya suatu pengolahan. Data bisa berwujud suatu keadaan, gambar, suara, huruf, angka, matematika, bahasa ataupun simbol - simbol lainnya yang bisa kita gunakan sebagai bahan untuk melihat lingkungan, obyek, kejadian ataupun suatu konsep. (http://kuliah.dinus.ac.id). Data adalah bentuk jamak dari datum, berasal dari bahasa Latin yang berarti “sesuatu yang diberikan”. Dalam penggunaan sehari - hari data berarti suatu pernyataan yang diterima secara apa adanya. Pernyataan ini adalah hasil pengukuran atau pengamatan suatu variabel yang bentuknya dapat berupa angka, kata- kata, atau citra. (http://id.wikipedia.org). M enurut Hoffer, Prescott, dan McFadden (2002, p5), informasi adalah data yang telah diproses melalui beberapa cara untuk meningkatkan pengetahuan dari orang yang menggunakan data. Informasi merupakan hasil pengolahan dari sebuah model, formasi, organisasi, ataupun suatu perubahan bentuk dari data yang memiliki nilai tertentu, dan bisa digunakan untuk menambah pengetahuan bagi yang menerimanya. Dalam hal ini, data bisa dianggap sebagai obyek dan informasi adalah suatu subyek yang bermanfaat bagi
8
9
penerimanya. Informasi juga bisa disebut sebagai hasil pengolahan ataupun pemrosesan data. (http://kuliah.dinus.ac.id). Informasi adalah istilah dengan banyak arti bergantung pada konteks, tetapi sebagai aturan berhubungan erat dengan konsep seperti arti, pengetahuan, negentrophy, komunikasi, kebenaran, representasi, dan rangsangan mental. Sekalipun banyak orang menyatakan munculnya “era reformasi”, “masyarakat informasi”, dan teknologi informasi, dan sungguhpun ilmu informasi dan ilmu komputer sering disorot, kata “informasi” sering dipakai tanpa pertimbangan dan hati - hati dari berbagai arti yang dimiliki. (http://id.wikipedia.org).
2.2
Database dan DBMS (Database Management System)
2.2.1 Definisi Database M enurut Conolly dan Begg (2002, p15), database merupakan suatu kumpulan data logikal yang terhubung satu sama lain dan deskripsi dari suatu data yang dirancang sebagai informasi yang dibutuhkan oleh organisasi, sedangkan menurut McLeod dan Schell (2004, p196), database adalah kumpulan seluruh sumber data berbasis komputer milik organisasi. Database yang dikendalikan oleh sistem manajemen database adalah suatu set catatan data yang berhubungan dan saling menjelaskan. Database sangat penting untuk membedakan database dan tempat penyimpanan. Tempat penyimpanan tersebut berisi tentang pengertian - pengertian dari data. Database adalah kumpulan informasi yang disimpan di dalam komputer secara sistematis sehingga dapat diperiksa menggunakan suatu program komputer untuk memperoleh informasi dari database tersebut. Perangkat lunak yang digunakan untuk mengelola dan memanggil query basis data disebut sistem manajemen basis data
10
(Database Management System / DBM S). Database system dipelajari dalam ilmu informasi. (http://id.wikipedia.org). Dari teori - teori di atas dapat disimpulkan bahwa sistem database adalah sekelompok elemen yang berupa data, saling terintegrasi dan berhubungan untuk mencapai tujuan tertentu.
2.2.2 Definisi DBMS (Database Management System) Conolly dan Begg (2002, p16) mengemukakan DBM S adalah suatu system software yang memungkinkan user dapat mengidentifikasikan, membuat, memelihara, dan mengatur akses dari database. McLeod dan Schell (2004, p196) menyimpulkan, sistem manajemen basis data (DBM S) adalah aplikasi perangkat lunak yang menyimpan struktur database, hubungan antar-data dalam database, serta berbagai formulir dan laporan yang berkaitan dengan database itu. Sedangkan menurut Hoffer, Prescott, dan McFadden (2002, p7), DBM S merupakan sebuah system software yang digunakan untuk menciptakan, memelihara dan menyediakan akses kontrol untuk pengguna database.
2.2.3 Kelebihan DBMS (Database Management System) Conolly dan Begg (2002, p26-29) menguraikan beberapa kelebihan penggunaan Sistem M anajemen Basis Data (DBM S), yaitu : a. Kontrol terhadap pengulangan data b. Data yang dihasilkan konsisten
11
c. Pada beberapa data yang sama akan semakin banyak informasi yang diperoleh d. Data dapat dipakai secara bersama-sama e. M eningkatkan integritas data f. M eningkatkan keamanan g. Penetapan standarisasi h. Perbandingan skala ekonomi i. M engatasi konflik kebutuhan j. M emperbaiki pengaksesan data secara bersama-sama k. M eningkatkan produktivitas l. M emperbaiki pemeliharaan data melalui data yang tidak tergantung dari data lain m. M emiliki backup data dan recovery
2.2.4 Kekurangan DBMS (Database Management System) Sedangkan kekurangan penggunaan DBM S menurut Conolly dan Begg (2002, p29 – 30) adalah : a. M emiliki sistem yang kompleks b. Karena sistem yang kompleks mengakibatkan DBM S memiliki ukuran yang semakin besar c. DBM S memiliki harga yang bervariasi tergantung fungsi dan kebutuhan d. Penambahan biaya untuk perangkat keras yang dibutuhkan e. Penambahan biaya konversi
12
f. Karena DBM S dirancang untuk mengakses lebih dari satu aplikasi sehingga performasinya menurun g. Kegagalan DBM S mengakibatkan operasi tidak dapat berjalan
2.2.5 Fasilitas yang disediakan DBMS (Database Management System) M enurut Conolly dan Begg (2002, p40) DBM S menyediakan fasilitas-fasilitas, yaitu : a. DDL (Data Definition Language) adalah suatu bahasa yang memperbolehkan DBA (Database Administrator) atau user untuk mendeskripsikan nama dari suatu entitas, atribut, dan relasi data yang diminta oleh aplikasi, bersamaan dengan integritas data dan batasan keamanan datanya. b. DM L (Data Manipulation Language) adalah suatu bahasa yang memberikan fasilitas pengoperasian data yang ada dalam basis data. M isalnya : insert, edit, delete, dan update. c.
SQL (Struktur Query Language) adalah sebuah fasilitas yang digunakan untuk melayani pengaksesan data. Bahasa query yang paling baik adalah secara de facto yang merupakan standar bagi DBM S.
2.3
Data warehouse
2.3.1 Definisi Data warehouse M enurut Conolly dan Begg (2002, p1151), data warehouse merupakan sekumpulan data yang berorientasi subyek, terintegrasi, tidak mudah berubah, dan berdasarkan kepada suatu rentang waktu tertentu yang berguna untuk mendukung dalam
13
proses pengambilan keputusan. Sebuah data warehouse merupakan data manajemen dan teknologi analisis data. M enurut Mcleod dan Schell (2004, p205), data warehouse adalah perkembangan dari konsep database yang menyediakan suatu sumber data, data yang lebih baik bagi para pemakai dan memungkinkan pemakai untuk memanipulasi dan menggunakan data tersebut secara intuitif. Data warehouse berukuran sangat besar, kualitas datanya tinggi, dan sangat mudah diambil datanya. Beberapa data warehouse berukuran sangat besar, kualitas datanya tinggi, dan sangat mudah diambil datanya. Beberapa data warehouse berisi sebanyak 200 gigabyte atau 200 juta byte data, tetapi ukuran besar tidak menyebabkan kualitas data tidak bagus. Karena data cleaning yang ekstensif, penghilangan data - data yang salah dan data yang tidak konsisten dapat mentransformasi data menjadi data dengan kualitas yang lebih tinggi daripada yang terdapat dalam database komersial.
2.3.2 Kegunaan Data warehouse Data warehouse yang digunakan selama ini memberikan kemudahan dan keuntungan, karena data warehouse biasanya digunakan untuk melakukan empat tugas berbeda. M enurut Williams (1998, p533), keempat tugas data warehouse tersebut adalah sebagai berikut : a. Pembuatan laporan Pembuatan laporan merupakan salah satu kegunaan data warehouse yang paling umum. Dengan menggunakan query - query sederhana dalam data warehouse, dapat dihasilkan informasi per tahun, per kuartal, per bulan bahkan per hari.
14
b. On-Line Analytical Processing (OLAP) Data warehouse digunakan dalam melakukan analisa bisnis untuk mengetahui kecenderungan pasar dan factor - faktor penyebabnya, karena dengan adanya data warehouse semua informasi baik detil maupun hasil ringkasan yang dibutuhkan dalam proses analisa mudah didapat. Dalam hal ini data warehouse merupakan tool yang handal untuk analisa data yang kompleks. M enurut Conolly dan Begg (2002, p1153), sebuah organisasi menerapkan beberapa sistem OLTP yang berbeda untuk menjalankan proses bisnis seperti kendali inventori, invoicing, dan point-of-sale. Sistem ini menghasilkan data operasional yang mendetil, up-to-date, dan dapat diubah ubah. Data di dalam OLTP diorganisir berdasarkan kebutuhan transaksi yang berhubungan dengan aplikasi bisnis serta mendukung pengambilan keputusan operasional harian. c. Data mining Penggunaan data warehouse dalam pencarian pola dan hubungan data, dengan tujuan membuat keputusan bisnis bagi para pihak manajemen. Dalam hal ini, perangkat lunak dirancang untuk pola statistik dalam data untuk mengetahui kecenderungan yang ada, misalnya kecenderungan pasar akan suatu produk tertentu. d. Proses Informasi Eksekutif Data warehouse digunakan untuk mencari informasi summary kunci yang penting, dengan tujuan membuat keputusan bisnis, tanpa harus menjelajahi keseluruhan data yang ada.
15
2.3.3 Karakteristik Data warehouse Dari definsi oleh Conolly dan Begg (2002, p1151), karakteristik dari data warehouse yaitu: a. Subject - oriented artinya data warehouse harus berorientasi pada subyek yaitu data warehouse dibuat berdasarkan subjek - subjek utama di dalam bisnis (seperti pelanggan, produk, dan penjualan) dibandingkan dengan area area aplikasi utama (seperti bon pembayaran pelanggan, kontrol stok, dan produk penjualan). b. Integrated artinya data warehouse harus terintegrasi karena sumber - sumber data warehouse berasal dari berbagai lingkungan bisnis dengan sistem aplikasi yang berbeda. Sumber data yang terintegrasi harus dibuat konsisten untuk menampilkan tampilan data kepada user. c. Time variant berarti data warehouse hanya akurat dan valid pada beberapa poin dalam waktu atau dalam interval waktu tertentu. d. Non-volatile yaitu data tidak di-update dalam waktu nyata (real time) tetapi data di-refresh dari sistem operasional. Data baru selalu ditambahkan sebagai sebuah suplemen ke dalam database, dibandingkan sebagai pergantian data. Database data warehouse akan selalu mengambil data baru, dan secara berkala diintegrasi dengan data yang sudah data.
2.3.4 Anatomi Data warehouse 1.
Data warehouse Fungsional Data warehouse fungsional menggunakan pendekatan kebutuhan dari tiap bagian
dari fungsi bisnis yang ada. M isalnya departemen atau divisi, untuk mendefinisikan jenis
16
data yang ditampung oleh sistem. Setiap unit fungsi dapat memiliki gambaran data masing-masing. Pendekatan ini banyak digunakan karena sistem memberikan solusi yang mudah untuk dibangun dengan biaya investasi yang relatif rendah dan dapat memberikan kemampuan sistem pengumpulan data yang terbatas kepada kelompok pemakai. Penerapan jenis sistem pengumpulan data seperti ini beresiko kehilangan konsistensi data diluar lingkungan fungsi bisnis yang bersangkutan. Bila lingkup pendekatan ini diperbesar dari lingkungan fungsional menjadi lingkup perusahaan, konsistensi data perusahaan tidak lagi dapat terjamin.
Gambar 2.1 Data warehouse Fungsional (Prabowo, 1996)
17
2.
Data warehouse Terpusat Data warehouse terpusat adalah pendekatan yang paling baik digunakan. Hal ini
dikarenakan oleh keterbiasaan pengguna dengan lingkungan mainframe terpusat. Data diambil dari seluruh sistem operasional dan disimpan di dalam pusat penyimpanan data. Pengguna kemudian menggunakan data yang telah terkumpul tersebut untuk membangun data warehouse fungsional, masing - masing sesuai dengan kebutuhannya. Keuntungan sistem ini dibanding dengan data warehouse fungsional adalah bahw a data benar-benar terintegrasi. Sistem ini mengharuskan data dikirim tepat pada waktunya, agar tetap konsisten dengan pemasok data lainnya. Disamping itu pengguna hanya dapat mengambil data dari pusat pengumpulan saja dan tidak dapat berhubungan secara langsung dengan pemasok datanya sendiri.
Gambar 2.2 Data warehouse Terpusat (Prabowo, 1996)
18
Penerapan sistem ini membutuhkan biaya pemeliharaan yang tinggi atas sistem pengumpulan data yang besar. Selain itu diperlukan waktu yang lama untuk membangun sistem tersebut.
3.
Data warehouse Terdistribusi Data warehouse terdistribusi dikembangkan berdasarkan konsep gateway data
warehouse, sehingga memungkinkan pengguna dapat langsung berhubungan dengan sumber data atau pemasok data maupun dengan pusat pengumpul data lainnya. Gambaran pengguna atas data adalah gambaran logika karena data mungkin diambil dari berbagai sumber yang berbeda.
Gambar 2.3 Data warehouse Terdistribusi (Prabowo, 1996)
19
Pendekatan ini menggunakan teknologi client / server untuk mengambil data dari berbagai sumber, sehingga memungkinkan tiap departemen atau divisi untuk membangun sistem operasionalnya sendiri serta dapat membangun pengumpul data fungsionalnya masing-masing dan menggabungkan bagian - bagian tersebut dengan teknologi client / server. Pendekatan ini akan menjadi sangat efektif bila data tersedia dalam bentuk yang konsisten dan pengguna dapat menambah data tersebut dengan informasi baru apabila ingin membangun gambaran baru atas informasi. Penerapan data warehouse terdistribusi ini memerlukan biaya yang sangat besar karena setiap pengumpul data fungsional dan sistem operasinya dikelola secara terpisah. Selain itu, agar berguna bagi perusahaan, data yang ada harus disinkronisasikan untuk memelihara keterpaduan data.
2.3.5 Arsitektur Data warehouse Conolly dan Begg (2002, p1156-1161) mengidentifikasi komponen data warehouse yang terdapat pada arsitektur data warehouse, yaitu: 1. Operational data Data operasional berfokus pada fungsi - fungsi transaksional. Data ini merupakan bagian dari infrastruktur perusahaan, detil, tidak ada redudansi (data tidak berulang-ulang), dapat di-update (diubah-ubah), dan data ini merefleksikan nilai sekarang. 2. Operational Datastore (ODS) ODS adalah tempat penyimpanan sementara dari data operasional saat ini yang terintegrasi yang digunakan untuk analisis. M embanguns ODS dapat merupakan tahap yang berguna dalam membangun data warehouse karena
20
sebuah ODS dapat menyuplai data yang sudah diekstrak dari sistem sumber dan dibersihkan. Ini berarti pekerjaan mengintegrasi dan merestrukturisasi data untuk data warehouse menjadi lebih sederhana. 3. Load manager Load manager menampilkan semua operasi yang terkait dengan ekstraksi dan loading data ke dalam data warehouse. Data bisa saja diekstrak secara langsung dari sumber data atau secara umum dari ODS. 4. Warehouse manager Warehouse manager menampilkan semua operasi yang terkait dengan manajemen data dari data warehouse. Operasi yang ditampilkan oleh warehouse manager meliputi : a. Analisis data untuk menjamin konsistensi b. Transformasi dan penggabungan sumber data dari tempat penyimpanan sementara ke tabel data warehouse c. Pembuatan indeks dan view pada tabel base d. M embuat denormalisasi (jika perlu) e. M embuat agregasi (jika perlu) f. Backing-up dan archiving data 5. Query manager Query manger menampilkan semua operasi yang terkait dengan manajemen query pengguna. Operasi yang ditampilkan oleh komponen ini meliputi mengarahkan query pada tabel yang cocok dan menjadwalkan pelaksanaan query.
21
6. Detailed data Komponen ini menyimpan semua detail data dalam skema database. Detail data terbagi 2 yaitu : a. Current detail data Data ini berasal langsung dari operasional database, dan selalu mengacu pada data perusahaan sekarang. Current detail data diatur sepanjang sisi - sisi subyek seperti data profil pelanggan,
data aktivitas
pelanggan,
data sales,
data
demografis, dan lain-lain. b. Old detail data Data ini menampilkan current detail data yang berumur atau histori dari subyek area. Data ini yang dipakai untuk menganalisis trend yang akan dihasilkan. 7. Lightly and highly summarized data Area data warehouse ini menyimpan semua data lightly dan highly summarized yang sudah terdefinisi sebelumnya yang dibuat oleh warehouse manager. Tujuan informasi yang terangkum ini adalah meningkatkan performansi query. 8. Archive / backup data Area warehouse ini menyimpan detail data dan summarized data dengan tujuan mengarsip dan melakukan backup data. 9. Meta data Meta data merupakan data mengenai data yang mendeskripsikan data warehouse. Meta data digunakan untuk membangun, memelihara, mengatur,
22
dan menggunakan
data warehouse. Meta data mengandung lokasi dan
deskripsi dari komponen – komponen data warehouse; nama, definisi, struktur, dan isi dari data warehouse dan end user view; identifikasi dari pembuat sumber – sumber data (record system); aturan – aturan integrasi dan transformasi yang digunakan untuk mempopulasikan data warehouse; history dari update dan refresh data warehouse; pola – pola matriks yang digunakan untuk performa menganalisis data warehouse; dan seterusnya. 10. End - user access tool Tool ini mencakup : a. Reporting and query tool b. Application development tool c. Executive information system (EIS) tool d. Online analytical processing (OLAP) tool e. Data mining tool
2.3.6 Tahapan Membangun Data warehouse M enurut Conolly dan Begg (2002, p1083), ada 9 tahapan dalam membangun data warehouse, yaitu : 1. M emilih Proces (Choosing the process) Pilihlah subjek dari permasalahan yang dihadapi, kemudian identifikasi proses bisnisnya. 2. M emilih Grain (Choosing the grain) Tentukan tabel fakta dan identifikasi dimensi dari tabel fakta.
23
Tabel fakta adalah tabel yang mengandung angka dan data history di mana key yang dihasilkan sangat unik karena merupakan kumpulan foreign key dari primary key yang ada pada masing - masing tabel dimensi yang berhubungan. Sedangkan, tabel dimensi adalah tabel yang berisikan kategori dengan ringkasan data detil yang dapat dilaporkan, seperti laporan keuntungan pada tabel fakta sebagai dimensi waktu (per bulan, per kuartal, per tahun). 3. Identifikasi dan penyesuaian dimensi Identifikasi dimensi dalam detil yang secukupnya untuk mendeskripsikan sesuatu. Ketika suatu tabel dimensi ada pada dua atau lebih data mart, maka tabel dimensi tersebut harus mempunyai dimensi yang sama atau salah satu harus merupakan subset dari yang lainnya. Apabila suatu tabel dimensi digunakan lebih dari satu data mart, maka dimensinya harus disesuaikan. 4. M emilih Fakta (Choosing the fact) Tentukan fakta - fakta dari tabel fakta yang akan digunakan pada data mart. Fakta - fakta tersebut harus numerik dan dapat ditambah. 5. M enyimpan Pre - Calculation pada tabel fakta (Storing pre-calculation in the fact table) Setelah fakta - fakta dipilih maka lakukan pengkajian ulang untuk menentukan apakah ada fakta- fakta yang dapat diterapkan pre - calculation (kalkulasi awal) dan lakukan penyimpanan pada tabel fakta. 6. Rounding Out The Dimension Tables Pada tabel dimensi, tambahkan penjelasan agar lebih dimengerti oleh pengguna.
24
7. M emilih durasi dari database (Choosing the duration of the database) Tentukan waktu dari pembatasan data yang diambil dan dipindahkan ke dalam tabel fakta. Seperti data perusahaan 3 tahun lalu atau lebih diambil dan dimasukkan dalam tabel fakta. 8. M elacak perubahan dari dimensi secara perlahan (Tracking slowly changing dimensions) Amati perubahan dari dimensi pada tabel dimensi. Ada tiga tipe dasar dari perubahan dimensi yang perlahan, yaitu : a. Perubahan atribut dimensi ditulis ulang (di overwrite). b. Perubahan atribut dimensi mengakibatkan pembuatan suatu dimensi baru. c. Perubahan atribut dimensi mengakibatkan sebuah atribut alternatif dibuat, jadi antara atribut yang lama dan baru diakses secara bersama-sama. 9. M emutuskan prioritas dan mode dari query (Deciding the query priorities and the query modes) Pertimbangkan pengaruh dari perancangan fisikal, seperti keberadaan dari ringkasan dan penjumlahan (aggregate). Selain itu, masalah administrasi, backup, kinerja indeks dan keamanan juga merupakan faktor yang harus diperhatikan.
2.3.7 Proses Transfer Data Dari Lingkungan Operasional ke Data warehouse M enurut Dyche (2000, p157), ada tiga proses pemindahan data dari lingkungan operasional ke data warehouse, yaitu :
25
1. Extraction Data ditemukan dan dipindahkan dari sistem operasional ke data warehouse atau platform transformasi. 2. Transformation Suatu program spesial atau softaware tool yang membersihkan data operasional agar sesuai dengan definisi awal aturan transformasi untuk data warehouse. 3. Loading Suatu program atau tool – tool seringkali yang sama yang digunakan untuk transformasi memindahkan data ke dalam tabel data warehouse.
2.3.6 Keuntungan Penggunaan Data warehouse M enurut Mallach (2000, p181-182), keuntungan menggunakan data warehous e adalah : 1. Kinerja perangkat keras DSS (Decision Support System) dapat dioptimalkan untuk tujuan tertentu. 2. Response time dari DSS tetap terjaga. 3. Lingkungan data warehouse lebih sederhana dan lebih baik dibandingkan dengan aplikasi client server.
M enurut Connoly dan Begg (2002, p1152), kesuksesan pengimplementasian data warehouse dapat memberikan keuntungan bagi organisasi maupun perusahaan antara lain :
26
1. Adanya kemungkinan balik modal yang tinggi pada investasi. Suatu organisasi harus memberikan sumber daya yang besar untuk menjamin kesuksesan pengimplementasian data warehouse dan biayanya bervariasi tergantung dari solusi teknis yang ada. Namun kemungkinan adanya kondisi balik modal terhadap biaya yang dikeluarkan untuk penginvestasian data warehouse relatif lebih besar. Sehingga tidak perlu ada kekhawatiran akan anggapan adanya pemborososan untuk investasi data warehouse ini. 2. Keuntungan yang kompetitif. Adanya kemungkinan balik modal yang besar terhadap investasi merupakan bukti adanya keuntungan yang kompetitif dengan adanya teknologi ini. Keuntungan kompetitif ini dicapai dengan memungkinkan para pengambil keputusan untuk mengakses data yang sebelumnya tidak tersedia, tidak diketahui, atau informasi yang tidak tercatat. 3. M eningkatkan produktifitas para pengambil keputusan di perusahaan. Data warehouse dapat memungkinan hal ini dengan mentransformasikan data menjadi informasi yang berarti. Teknologi ini menyediakan para manajer bisnis untuk dapat melakukan analisi yang lebih konsisten sehingga pada akhirnya terjadi peningkatan produktifitas.
M enurut Mallach (2008, p182) kerugian dari penerapan data warehouse adalah : 1. Terdapat beban tambahan pada sistem pusat karena perlunya melakukan pemindahan data diantara dua sistem (sistem operasional dan data warehouse) untuk menjaga dan tetep update. 2. Harus mempunyai karyawan yang mengerti kedua sistem.
27
3. Pengguna yang mengakses kedua sistem memerlukan dua tipe terminal komputer atau prosedur jaringan yang rumit untuk berpindah sistem. 4. Pemindahan data dari sistem operasional ke data warehouse memerlukan waktu yang relatif lama.
2.4
Skema Bintang M enurut Poe (1996, p33), skema bintang adalah metode perancangan yang
dilakukan dengan struktur yang sederhana dengan menggunakan beberapa tabel dan jalur yang terhubung dengan baik dan jelas. Dengan menggunakan skema bintang ini akan menghasilkan waktu respon yang lebih cepat dalam query data dibanding dengan proses transksional yang menggunakan struktur normalisasi. Selain itu skema bintang memudahkan end user untuk memahami struktur database pada data warehouse yang dirancang.
2.4.1 Keuntungan Menggunakan Skema Bintang Skema bintang memiliki beberapa keuntungan yang tidak terdapat pada struktur relasional yang biasa. Skema bintang menjadi standar perancangan database karena memiliki keuntungan-keuntungan sebagai berikut : a.
Dapat membuat perancangan database dengan respon time yang cepat.
b.
Dapat menyediakan suatu rancangan yang dapat dimodifikasi dengan mudah atau dapat ditingkatkan melalui pengembangan data warehouse.
c.
Dapat menyederhanakan pemahaman dan penelusuran metadata bagi end user.
d.
Paralel dalam perancangan database, bagaimana end user dapat menyesuaikan cara berpikir dan menggunakan data.
28
2.4.2 Perancangan S kema Bintang M enurut Poe (1996, p121-122), skema bintang terdiri dari dua jenis tabel, yaitu tabel fakta (fact table) dan tabel dimensi (dimension table). Tabel fakta terdiri dari data kuantitatif atau data fakta mengenai bisnis, informasi yang akan di query. Informasi sering berupa pengumpulan numerik dan terdiri dari banyak kolom dan jutaan baris sedangkan tabel dimensi lebih kecil dan menunjang data deskriptif yang mencerminkan dimensi dari baris. Query SQL kemudian digunakan untuk pendefinisian awal dan digunakan sebagai jalur penghubung antara tabel fakta dan tabel dimensi, dengan batasan pada data untuk mengembalikan informasi yang terpilih.
2.4.3 Jenis Skema Bintang 2.4.3.1 Skema Bintang Sederhana Pada skema bintang sederhana, setiap label harus mempunyai primary key yang terdiri atas satu kolom atau lebih. Primary key dari tabel fakta terdiri dari satu atau lebih foreign key.
Gambar 2.4 Skema Bintang Sederhana
29
Pada gambar di atas terlihat hubungan antara tabel fakta dan tabel dimensi. Terdapat satu tabel fakta dan tiga tabel dimensi. Tabel fakta memiliki primary key yang terdiri dari tiga foreign key yaitu key-1, key-2, key-3, yang masing-masing merupakan primary key pada ketiga tabel dimensi yang ada. Terjadi hubungan many to one antara foreign key pada tabel fakta dengan primary key pada tabel dimensi.
2.4.3.2 Skema Bintang dengan Beberapa Tabel Fakta Skema bintang juga dapat terdiri dari beberapa tabel fakta. Hal ini terjadi karena pada tabel fakta berisi kenyataan yang tidak saling berhubungan atau dikarenakan perbedaan waktu pemuatan data. Skema bintang juga dapat meningkatkan kinerja (perfomance), terutama jika data tersebut dalam jumlah yang besar. Skema bintang dengan banyak tabel fakta terlihat seperti pada gambar di bawah ini :
Gambar 2.5 Skema Bintang dengan Beberapa Tabel Fakta
30
2.4.3.3 Skema Bintang Majemuk Tabel fakta dalam skema bintang majemuk memiliki dua kumpulan foreign key, yang pertama mengandung suatu referensi dengan tabel dimensi sedangkan sisanya adalah primary key yang merupakan gabungan dari satu atau lebih kolom yang menghasilkan suatu identifikasi unik untuk setiap barisnya. Bedanya skema bintang majemuk dengan skema bintang sederhana adalah saling tidak identiknya primary key dan foreign key dalam skema bintang majemuk.
Gambar 2.6 Skema Bintang M ajemuk
2.4.3.4 Skema Snowflake Skema snowflake merupakan variasi dari skema bintang dimana struktur tabel dimensinya berada dalam normalisasi ketiga sedangkan struktur tabel faktanya tetap. M enurut Poe (1996, p128), berikut ini merupakan alasan utama digunakannya skema snowflake : a. Berkembangnya advanced decision support yang mendukung struktur snowflake ini.
31
b. Banyaknya departemen M IS (Management Information System) yang lebih menyukai struktur dalam bentuk normalisasi ketiga.
Gambar 2.7 Skema Snowflakes 2.5
Agregasi Berdasarkan Poe (1996, p136) Agregasi merupakan suatu proses perhitungan
data fakta selama pendefinisian atribut. Agregasi dapat dibuat selama proses transformasi dan pemuatan data ke dalam data warehouse. Faktor yang mendorong pembuatan agregasi sebagai berikut : a. M eningkatkan penampilan pencarian. b. M engurangi jumlah dari pengguna kode produk universal.
2.6
Denormalisasi Berdasarkan Peo (1996, p137) Denormalisasi merupakan proses penggabungan
tabel-tabel agar dapat meningkatkan penampilan yang ada. Proses ini merupakan suatu proses yang melanggar peraturan bentuk normal dalam proses normalisasi.
32
Denormalisasi dilakukan karena : a. M engurangi jumlah hubungan yang terjadi antara tabel - tabel yang menyebabkan terjadinya proses pada waktu dilakukan pencarian. b. Untuk membuat struktur fisik dari database semakin mendekati model dimensi dari pengguna. M embuat struktur tabel sesuai yang ingin ditanya pengguna, memungkinkan terjadinya akses langsung yang akan meningkatkan penampilan.
2.7
Metadata Berdasarkan Poe (1996, p169), M etadata adalah data tentang data dan
menyediakan informasi tentang struktur data dari hubungan antara data atau antar database, didalam lingkungan data warehouse terdapat 2 tipe utama metadata yaitu : •
M etadata Operasional M erupakan metadata untuk sistem operasional dimana menjelaskan informasi sistem operasi awal, baik berupa nama, tipe data dan sumber lainnya ke dalam tujuan transformasi data warehouse.
•
M etadata DSS (Decision Support System) M emetakan data dari data warehouse ke segi bisnis dan sebagai alat front end untuk memanipulasi data dalam menciptakan suatu laporan.