6
BAB 2 LANDASAN TEORI
2.1 Database 2.1.1 Definisi Database Menurut W.H Inmon(2002, p3), database diartikan sebagai suatu koleksi dari penyimpanan data yang terhubung yang sering digunakan dan mengurangi redudansi (pengurangan). Sebuah database dapat digunakan pada aplikasi tunggal atau jamak. Menurut Fathansyah (2000, p2) database adalah kumpulan data yang saling berhubungan yang disimpan secara bersama sedemikian rupa dan tanpa pengulangan (redudansi) yang tidak perlu, untuk memenuhi berbagai kebutuhan. Database operasional terdiri dari tiga operasi yaitu insert, update, delete. Menurut C.J Date(2000, p10)”a database is collection of persistent data that is used by the application system of some given enterprise” yang artinya database merupakan kumpulan dari data yang hampir tidak mengalami perubahan dan digunakan oleh aplikasi system pada tahap beberapa perusahaan. Sesungguhnya data warehouse adalah suatu bentuk dari database , namun data warehouse memiliki sifat interaktif dalam akses informasi dengan waktu respon yang tinggi. Dengan demikian data warehouse berbeda dengan database karena database digunakan pada proses operasional transaksi bisnis dan data warehouse fokus terhadap proses analisis dan pengambilan keputusan bagi eksekutif.
7 2.1.2 Database Life Cycle Database adalah komponen fundamental dari sistem informasi, dan pengembangannya dan penggunaannya harus bisa ditampilkan dari perspektif organisasi yang lebih luas. Karenanya daur hidup dari system informasi organisasi dihubungkan dengan daur hidup database yang mendukungnya. Tahap-tahap dari daur hidup database life cycle yaitu meliputi : 1.
Database Planning
Adalah aktivitas manajemen yang memungkinkan tahapan dalam aplikasi database dapat di realisasi seefisien dan seefektif mungkin. 2.
System Definition
Yaitu mendeskripsikan ruang lingkup dan batasan aplikasi database dan user view yang utama. 3.
Requirement collection and analysis
Adalah proses mengumpulkan dan menganalisis informasi tentang bagaimana organisasi yang didukung oleh aplikasi database 4.
Database design
Adalah proses membuat desain database yang mendukung operasi dan objektive perusahaan. 5.
DBMS Selection
Yaitu pemilihan database management system yang sesuai untuk mendukung aplikasi database.
8 6.
Application Design, Prototyping
Adalah proses mengkonstruksi model informasi yang digunakan dalam peusahaan berdasarkan model data yang spesifik, 7.
Implementation
Adalah realisasi fisikal database dan desain aplikasi . Membuat definisi database external, conceptual, dan internal, dan aplikasi program. 8.
Data Conversion and Loading
Yaitu mentransfer data yang ada ke database yang baru dan mengubah aplikasi yang ada agar dapat berjalan di database yang baru.. 9.
Testing
Adalah proses eksekusi program aplikasi dengan tujuan menemukan error atau aplikasi database dites dari eror dan validasi terhadap apa yang dibutuhkan oleh user. 10.
Operational Maintenance
Yaitu proses memonitor dan maintain system. Atau dapat dikatakan sebagai aplikasi database yang diimplementasikan secara penuh .
9 Database planning
System Definition
Requirement collection and analysis
Database design Conceptual database design Application design
DBMS selection Logical database design
Physical database design
Implementation
Prototyping Data conversion and loading
Testing
Operational maintenance
Gambar 2.1 Database Life Cycle
10 2.2 Data Warehouse 2.2.1 Definisi Data Warehouse Dari perkembangan model rancangan database muncullah apa yang disebutkan dengan data warehouse, disini data warehouse dapat ditampilkan dalam bentuk database untuk data histori, serta data warehouse dapat pula digunakan dalam menganalisa dari database yang telah ada, dan memperlihatkan sifat yang lebih interaktif. Data Warehouse ikut berperan dalam pengambilan keputusan database. Karena banyak organisasi kurang dapat menggunakan operational database dalam mendukung secara langsung pengambilan keputusan,maka terbentuklah data warehouse. Terdapat banyak sekali pengertian tentang data warehouse tapi semuanya memiliki arti yang sama, sebagai contoh : 1. Menurut Inmon (2002, p31) : ” A Data Warehouse is a subject oriented, integrated, non-volatile and time- variant collection of data in support of management’s decisions.” atau dapat diartikan “ Data Warehouse adalah kumpulan data yang berorientasi subjek, terintegrasi, tidak mengalami perubahan, mempunyai variasi waktu, yang digunakan untuk mendukung pengambilan keputusan oleh managemen.” Data warehouse merupakan sebuah kumpulan data yang bersifat subject oriented, integrated, time variant, dan non- volatile yang dapat mendukung proses pembuatan keputusan manajemen. 2. Menurut Mallach (2000, p484). Data warehouse adalah koleksi dari variasi data yang besar, terorganisasi, dan dibuat untuk dapat digunakan oleh end user dalam pembuatan keputusan. Data
11 warehouse ini digunakan oleh pihak eksekutif yang memerlukan akses terhadap data untuk menganalisis bisnis. 3. Menurut Ponniah (2001 , p13) definisi fungsional data warehouse adalah ”data warehouse adalah lingkungan informasi yang mempunyai sifat : •
Menyediakan pandangan (view) yang terintegrasi dan menyeluruh pada enterprise.
•
Membuat informasi historical dan informasi baru mudah didapat untuk pengambilan keputusan.
•
Membuat transaksi-transaksi yang mendukung pengambilan keputusan dapat diakses tanpa mengganggu sistem operasional
•
Menyebabkan konsistensi informasi dalam organisasi
•
Menyediakan sumber informasi strategis yang fleksibel dan interaktif.”
4. Menurut Paul Lane (2001, p30) “A data warehouse is a relational database that is design for query and analysis rather than for transaction processing, it usually contains historical data derived from transaction data, but it can include data from other sources. It separates analysis workload and enables an organization consolidate data from several source” atau dapat diartikan data warehouse adalah sebuah database yang saling berelasi yang didesain untuk query dan analisis dibandingkan dengan proses transaksi. Biasanya mengandung data histori yang berasal dari data transaksi , tetapi dapat termasuk data dari sumber-sumber lainya. Jadi dari definisi tersebut , dapat disimpulkan bahwa data warehouse adalah database yang saling bereaksi yang dapat digunakan untuk proses query data dan sebagai
12 analisa yang bersifat berorientasi objek (subject oriented), terintegrasi (integrated), tidak dapat berubah (nonvolatile), dan mempunyai variasi waktu (time variant) bagi para pengambil keputusan manajemen dari suatu perusahaan. Dengan adanya data warehouse akan dapat mempermudah pembuatan aplikasi-aplikasi DSS(decision support system) atau EIS(Executive Information system). Karena data warehouse memang digunakan khusus untuk mendukung proses analisa bagi para pengambil keputusan.
2.2.2
Karakteristik Data Warehouse Karakteristik data warehouse adalah sebagai berikut :
•
Subject Oriented
•
Time variant
•
Integrated
•
Nonvolatile
2.2.2.1 Subject Oriented Suatu data waerehouse bersifat subject oriented artinya data warehouse didesain untuk menganalisa data berdasarkan subjek-subjek tertentu dalam organisasi, bukan berorientasi pada proses atau fungsi aplikasi tertentu seperti pada data operasional. Perbedaan lain yaitu bahwa data warehouse berfokus terhadap pemodelan data dan desain data, bukan pada desain database dan proses. Selain itu data warehouse juga berisi data-data histori yang akan dipakai untuk proses analisis. Secara garis besar
13 perbedaan mendasar antara data operasional dan data warehouse antara lain sebagai berikut : Tabel 2.1 Perbandingan Subyek Oriented Antara Data Warehouse dengan Operational Data
Operasional Data
Data Warehouse
Dirancang berorientasi hanya Dirancang berdasarkan subyek-subyek pada
aplikasi
dan
fungsi tertentu ( utama )
tertentu Fokusnya
pada
desain Fokusnya pada pemodelan data dan
database dan proses
desain data
Berisi rincian data atau detail Berisi data Relasi
data-data
histori
yang
akan
dipakai untuk proses analisis antara
tabel-tabel Banyak aturan bisnis dapat tersaji antara
berdasarkan aturan terkini ( tabel-tabel selalu mengikuti rule terbaru)
14 2.2.2.2 Time Variant Data dalam suatu data warehouse berhubungan dengan suatu titik atau point dalam suatu periode waktu. Dengan demikian data dalam data warehouse akurat selama periode waktu tertentu. Sehingga dikatakan memiliki rentang waktu (time variance). Data warehouse juga memiliki tempat penyimpanan data untuk beberapa waktu tahun yang lalu. Yang mungkin nanti akan dapat digunakan untuk perbandingan trend atau forecasting.
2.2.2.3 Integrated Data warehouse bersifat integrated artinya data warehouse harus menyimpan data-data yang berasal dari sumber yang terpisah kedalam suatu format yang konsisten dan saling berintegrasi satu dengan yang lainnya. Dengan demikian data tidak dapat dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri. Data
warehouse
akan
sangat
berhasil
apabila
mampu
untuk
mengkombinasikan data dari banyak sistem operasi dan hal itu merupakan suatu yang efektif. Salah satu alasan utama dalam menyatukan data adalah kemampuannya melakukan referensi silang antara aplikasi. Data warehouse tidak hanya melayani penyatuan data untuk diaplikasi sekarang tetapi juga memiliki kemampuan untuk menyatukan data dari beberapa versi aplikasi yang telah digunakan sebelumnya.
15
2.2.2.4 Non Volatile Data warehouse tidak dapat mengalami perubahan. Lain halnya dengan database operasional dapat melakukan update,insert,delete terhadap data yang mengubah isi dari database. 1. Update Mengubah isi data yang sudah ada. 2. Insert Menambahkan data yang sudah ada. 3. Delete Menghapus data yang sudah ada. Sedangkan pada data warehouse hanya ada dua kegiatan memanipulasi data yaitu : 1. Loading Data Mengambil data dari data yang dibutuhkan dari data warehouse 2. Akses Data Proses
mengakses
data
warehouse,
seperti
melakukan
query
menampilkan laporan yang dibutuhkan (tidak ada kegiatan updating data).
atau
16
Gambar 2.2 Aspek Non volatille Data Warehouse
2.2.3 Struktur Data Warehouse Data warehouse memiliki struktur yang spesifik serta memiliki perbedaan dalam tingkatan ringkasan , detil data, dan unsur data. Sehingga data warehouse memiliki beberapa jenis struktur yaitu : •
Current Detail Data (detil data pada saaat ini)
•
Old Detail Data (Detail Data Historis)
•
Lightly Summarized Data (Ringkasan data level menengah)
•
Highly Summarized Data (Ringkasan data level tinggi)
•
Metadata
17
Gambar 2.3 Struktur Data Warehouse
2.2.3.1 Current Detail Data Current Detail Data adalah data yang keakuratannya tepat pada saat akses berdasarkan variansi waktu dan merupakan level terendah dalam data warehouse. Current detail data ini biasanya memerlukan media penyimpanan data yang besar. Berikut ini beberapa alasan mengapa current detail data menjadi pusat perhatian utama : 1. Menggambarkan kejadian yang baru terjadi dan selalu menjadi perhatian utama sangat banyak jumlahnya dan disimpan pada tingkat penyimpanan terendah 2. Hampir selalu disimpan di media penyimpanan karena cepat diakses tetapi mahal dan kompleks dalam pengaturannya. 3. Bisa digunakan dalam membuat rekapitulasi dan sehingga current detail data harus akurat
18 2.2.3.2 Old Detail Data Old Detail Data merupakan data histories, yang dapat berupa hasil backup yang disimpan dalam media penyimpanan yang terpisah dan pada saat waktu tertentu dapat diakses kembali. Data ini jarang diakses sehingga biasanya disimpan dalam media alternatif seperti tipe desk. Penyusunan direktori untuk data ini harus menggambarkan unsur dari data sehingga memudahkan dalam pengaksesan kembali.
2.2.3.3 Lightly Sumarrized Data Lightly Sumarrized Data adalah berupa ringkasan dari Current Detai Data. Di dalam tahap ini data belum dapat digunakan untuk pengambilan keputusan karena sifat data belum “total summary” yang artinya data masih bersifat detil . Lightly Summarized Data sering digunakan untuk gambaran dari keadaan yang sedang berlangsung maupun yang belum berlangsung. Data ini hampir selalu tersimpan dalam disk dan yang perlu diperhatikan adalah satuan waktu ringkasan dan atribut Lightly Summarized Data. Datadata ini memiliki tingkatan detil yang lebih tinggi dan mendukung kebutuhan data warehouse. Tingkatan ini disebut juga “data mart” .
2.2.3.4 Highly Summarized Data Highly Summarized Data (rangkuman data secara umum) merupakan hasil proses ringkasan bersifat total, solid, serta mudah untuk diakses. Digunakan untuk melakukan analisa perbandingan data berdasarkan urutan waktu dan analisa yang menggunakan database multi dimensi. Database multi dimensi adalah suatu teknologi software komputer yang dirancang untuk meningkatkan efisiensi dalam mencari tabel
19 (query) sehingga menjadi media penyimpanan yang lebih baik, serta memudahkan pengambilan data dengan volume yang besar.
2.2.3.5 Metadata Metadata bukan merupakan data hasil dari kegiatan operasional seperti keempat jenis data diatas. Metadata memuat informasi yang penting mengenai data dalam data warehouse yang berfungsi sebagai : 1. Direktori yang akan dipakai oleh user dalam mencari lokasi dalam data warehouse 2. Merupakan penuntun pemetaan (mapping) dalam proses transformasi dari operasional ke data warehouse 3. Panduan untuk proses summary data dari detail data menjadi lightly summarized data dan kemudian menjadi hightly summarized data. Metadata merupakan bentuk suatu jaringan yang sangat penting bagi pengguna data warehouse. Data yang tersedia haruslah dapat digunakan oleh user dengan istilah yang sesuai dengan cara user melakukan pekerjaannya. Karena data warehouse harus melayani banyak fungsi, maka metadata penting untuk menjawab kebutuhan dari suatu fungsi tertentu.
2.2.4 Arsitektur dan Infrastruktur Data Warehouse 2.2.4.1 Arsitektur Data Warehouse Menurut Poe ( 1996, p24 ) arsitektur adalah sekumpulan aturan atau struktur yang memberikan kerangka untuk keseluruhan rancangan suatu sistem atau produk. Ada
20 arsitektur client-server, arsitektur networking dan masih banyak arsitetur lainnya. Arsitektur data menyediakan kerangka dengan mengidentifikasikan dan memahami bagaimana data akan pindah melalui sistem dan digunakan dalam perusahaan. Arsitektur data untuk data warehouse mempunyai komponen utama yaitu database yang hanya dapat dibaca. Karakteristik arsitektur data warehouse ( Poe, 1996, p40-41) : 1.
Data diambil dari sistem asal ( sistem informasi yang ada ) , database dan file
2.
Data dari sistem asal diintegrasikan dan ditransformasi sebelum disimpan kedalam Data Base Management System ( DBMS ) seperti Oracle, Ms SQL Server, IBM DB2, Sybase dan masih banyak yang lainnya.
3.
Data warehouse adalah jenis database read-only yang diciptakan untuk mengambil keputusan.
4.
User mengakses data warehouse via front-end tool atau aplikasi Arsitektur dan infrastruktur dari data warehouse sangat erat hubungannya,
dan satu dengan yang lainnya saling berkaitan. Keberhasilan pengembangan data warehouse sangat dipengaruhi oleh pengidentifikasian arsitektur mana yang terbaik dan infrastuktur apa yang dibutuhkan. Arsitektur yang sama mungkin akan membutuhkan infrastruktur yang berbeda tergantung pada lingkungan perusahaan atau organisasi.
21
Gambar 2.4 Arsitektur Data Warehouse
2.2.4.2 Infrastruktur Data Warehouse Menurut Vidette Poe ( 1996, p54 ), Infrastruktur Data Warehouse adalah perangkat lunak, perangkat keras, pelatihan dan komponen-komponen lainnya yang menyediakan dukungan untuk mengimplementasikan arsitektur data warehouse. Infrastruktur teknikal berupa teknologi, platform, database, gateway, dan komponenkomponen penting yang mendukung arsitektur data warehouse yang dipilih. Untuk
mengaplikasikan
sebuah
arsitektur
data
warehouse
bisa
diimplementasiakan dengan beberapa cara yaitu dengan menggunakan infrastruktur berbeda. Arsitektur dan infrastruktur saling berkaitan erat dan satu sama lainnya saling mendukung. Pengaruh dari lingkungan atau organisasi juga otomatis mempengaruhi penentuan suatu infrastruktur yang akan kita pilih.
22 2.2.5 Bentuk Data Warehouse Penerapan awal dari arsitektur data warehouse dibuat berdasarkan konsep bahwa data warehouse mengambil data dari berbagai sumber dan memindahkannya ke dalam sebuah pusat pengumpulan data yang besar. Konsep ini sebenarnya cenderung pada sebuah lingkungan mainframe yang terpusat. Keunggulan
teknologi
client-server
memungkinkan
data
warehouse
diterapkan dalam berbagai macam cara untuk menampung kebutuhan pemakai sistem secara lebih proposional. Berikut ini adalah tiga jenis dasar system data warehouse : 1. Data Warehouse Fungsional 2. Data Warehouse Terpusat 3. Data Warehouse Terdistribusi
2.2.5.1 Data Warehouse Fungsional Data Warehouse Fungsional mempergunakan pendekatan kebutuhan dari tiap bagian fungsi bisnis, misalnya departemen, divisi, dan sebagainya, untuk mendefinisikan jenis data yang akan ditampung di dalam sistem. Setiap unit fungsi dapat mempunyai gambaran datanya masing-masing. Penerapan jenis sistem pengumpulan data seperti ini beresiko kehilangan konsistensi data di luar lingkungan bisnis yang bersangkutan. Apabila pendekatan ini lingkupnya diperbesar dari lingkungan fungsional menjadi lingkup perusahaan , konsistensi data perusahaan tidak lagi dapat dijamin.
23 Sebab utama dipergunakan pendekatan seperti ini adalah bahwa sistem ini dapat memberi solusi yang mudah untuk dibangun dengan biaya investasi yang relatif rendah dan dapat memberikan kelompok pemakai sebuah kemampuan sistem pengumpulan data yang terbatas.
Gambar 2.5 Bentuk Data Warehouse Fungsional
2.2.5.2 Data Warehouse Terpusat Data warehouse terpusat adalah pendekatan yang paling banyak digunakan, sebagian besar karena kebiasaan pemakai dengan lingkungan mainframe yang terpusat. Data diambil dari seluruh sistem operasional dan disimpan di dalam pusat penyimpanan data. Pemakai kemudian bekerja dengan mempergunakan data yang telah terkumpul tersebut untuk membangun data warehouse fungsional masing-masing. Keuntungan sistem ini dibandingkan dengan data warehouse fungsional adalah bahwa benar-benar terpadu.
24 Sistem ini mengharuskan pemasok data harus mengirimkan data tepat pada waktunya agar supaya tetap konsisten dengan pemasok lainya. Disamping itu , pemakai hanya dapat mengambil data dari bagian pengumpulan saja, dan tidak dapat secara langsung berhubungan dengan pemasoknya sendiri.
Gambar 2.6 Bentuk Data Warehouse Terpusat
2.2.5.3
Data Warehouse Terdistribusi
Data Warehouse Terdistribusi dikembangkan berdasarkan konsep data warehouse “gateway” yang memungkinkan pemakai untuk langsung berhubungan dengan sumber data maupun dengan pusat pengumpul data lainya. Gambaran pemakai atas data adalah berupa gambaran logik karena data mungkin diambil dari berbagai sumber yang berbeda. Pendekatan ini mengandalkan keunggulan teknologi “client-server” untuk mengambil data dari berbagai sumber. Pendekatan ini memungkinkan tiap departemen atau divisi untuk membangun pengumpul data fungsionalnya masing-masing atau bahkan
25 sistem operasionalnya dan memadukan bagian-bagian tersebut dengan teknologi clientserver. Pendekatan ini memerlukan biaya yang sangat besar karena setiap sistem pengumpulan data fungsional dan sistem operasinya dikelola secara terpisah. Di samping itu, supaya berguna bagi perusahaan, data harus disinkronisasi untuk memelihara keterpaduannya. Metode ini akan sangat efektif apabila data telah tersedia dalam bentuk yang konsisten dan pemakai ingin dapat menambah data tersebut dengan informasi baru apabila ingin memperoleh gambaran baru atas informasi.
Gambar 2.7 Bentuk Data Warehouse Terdistribusi
2.2.6 Kegunaan Data Warehouse Data warehouse yang digunakan selama ini memberikan kemudahan dan keuntungan karena data warehouse biasanya digunakan untuk melakukan tugas yang berbeda. Tugas data warehouse tersebut yaitu :
26 2.2.6.1 Pembuatan laporan Pembuatan laporan merupakan salah satu kegunaan data warehouse yang paling umum. Dengan menggunakan query sederhana dalam data warehouse, dapat dihasilkan informasi pertahun, perkuatral, perbualan bahkan perhari. 2.2.6.2 On –Line Analytical Processing (OLAP) Data warehouse digunakan dalam melakukan analisis bisnis untuk mengetahui kecenderungan pasar dan faktor – faktor penyebabnya, karena dengan adanya data warehouse, semua informasi baik detail maupun hasil summary yang dibutuhkan dalam proses analisis mudah didapat. Dalam hal ini data warehouse merupakan tool yang handal untuk analisa data yang komplek. OLAP menggunakan konsep data multidimensi dan memungkinkan pemakai untuk menganalisa data sampai mendetail, tanpa mengetikkan satupun perintah SQL (structured query language). Hal ini dimungkinkan karena pada konsep data multidimensi, maka data berupa fakta yang sama bisa dilihat dengan menggunakan dimensi yang berbeda. Fasilitas lain yang ada pada tool perangkat lunak OLAP adalah fasilitas drill-down dan roll-up. Drill-down adalah kemampuan untuk melihat detail dari suatu informasi yang ditampilkan sedangkan roll-up adalah kebalikan dari drill-down. 2.2.6.3 Data Mining Data mining adalah proses untuk mencari informasi dan pengetahuan baru dengan cara menggali ( mining ) data yang berjumlah banyak pada data warehouse, dengan menggunakan kecerdasan buatan ( artificial intelligence ) , statistic , dan matematika. Data mining merupakan teknologi yang diharapkan bisa menjembatani komunikasi antara data dan pemakai.
27 Beberapa solusi yang bisa diselesaikan dengan data mining diantaranya : 1. Menembak target pasar Data mining dapat melakukan pengelompokan (clustering) dari model-model pembeli dan melakukan klasifikasi terhadap setiap pembeli sesuai dengan karakteristik yang diinginkan seperti kesukaan yang sama, tingkat penghasilan yang sama, kebiasaan pembeli dan karakteristik lainnya. 2. Melihat pola beli pemakai dari waktu ke waktu Data mining dapat digunakan untuk melihat pola beli seseorang dari waktu ke waktu. 3. Cross- market Analysis Data mining dapat dimanfaatkan untuk melihat hubungan antara penjualan satu produk dengan produk lainnya. 4. Profil customer Data mining dapat membantu pengguna untuk melihat profil pembeli sehingga dapat diketahui kelompok pembeli tertentu suka membeli produk apa saja. 5. Informasi Summary Data mining dapat dimanfaatkan untuk membuat laporan summary yan bersifat multidimensi dan dilengkapi dengan informasi statistik lainnya.
2.2.6.4 Proses Informasi Eksekutif Data warehouse digunakan untuk mencapai ringkasan informasi yang penting dengan tujuan membuat keputusan bisnis, tanpa harus menjelajahi keseluruhan data. Dengan menggunakan data warehouse, segala laporan telah diringkas dan dapat pula diketahui rinciannya secara lengkap, sehingga mempermudah proses pengambilan
28 keputusan. Informasi dan data pada laporan data warehouse menjadi target informatif bagi user dalam hal ini adalah pihak eksekutif.
2.3 Tahapan Dalam Perancangan Data Warehouse 2.3.1
Kegiatan Analisis Data Warehouse Untuk melakukan penganalisaan dan pelaporan informasi bagi pihak-pihak
yang mengambil keputusan maka dalam merancang data warehouse terdapat kegiatankegiatan yang harus ada didalamnya, kegiatan – kegiatan itu adalah : 1. Memperoleh dan menggabungkan data Mendapatkan data dari berbagai sumber dan melakukan penggabungan pada suatu tempat tertentu, data-data yang digabung adalah data-data yang akan membantu kita dalam pembuatan laporan, karena data tersebut merupakan suatu bentuk kesatuan. 2. Transformasi Data Pengolahan data dari awal ke bentuk data yang telah disepakati. Dengan mengalami pemrosesan atau pengolahan terlebih dahulu, yang sama artinya dengan perubahan data ke bentuk yang diharapkan. 3. Pendistribusian Data Data-data yang akan kita gunakan dalam data warehouse berkaitan dengan lingkungan kerja dalam lingkungan perusahaan. Bagi perusahaan yang terhubung dengan jaringan, pemakaian data warehouse mendukung kegiatan ini secara lebih fleksibel dan merata pada masing-masing bagian yang ada dalam perusahaan.
29 4. Penggunaan Data Data yang telah disaring akan menghasilkan ringkasan-ringkasan yang akan dapat memudahkan pengguna dalam pengambilan suatu keputusan, disini kegiatan pemakaian data akan menjadi lebih sering jika para pengambil keputusan ingin menganalisa produk yang telah dipasarkan pada masyarakat.
2.3.2 Proses Analisa Matriks Terdapat empat prosedur yang digunakan dalam membuat analisis matriks clustering, yaitu : 1. Membuat analisa top level dari data perusahaan •
Menentukan subjek data
•
Dijabarkan ke dalam bentuk entitas
•
Membuat diagram awal hubungan antar entitas
•
Membuat matriks fungsi bisnis versus entitas
•
Membuat matriks unit organisasi versus entitas
2. Menentukan enterprise model dan entity relationship diagram •
Wawancara dengan pihak manajemen untuk menentukan enterprise model
•
Membuat presentasi kepada pihak manajemen tentang enterprise model yang sudah diperbaiki
•
Membuat Entity Relationship Diagram ( ERD )
•
Menentukan matriks entitas versus fungsi bisnis
•
Menentukan matriks entitas versus unit organisasi
•
Meminta persetujuan enterprise model
30 3. Mengelompokkan matriks fungsi atau entitas •
Menggunakan algoritma clustering
•
Mengumpulkan ke depan semua fungsi create dalam entitas
•
Memasukan fungsi-fungsi yang lain dan entitas ke dalam cluster
•
Mengelompokkan secara manual untuk mengetahui sistem yang ada
•
Menentukan alur data dari sistem yang satu ke sistem yang lain
•
Membuat diagram hubungan yang menunjukan hubungan antar sistem
•
Menyusun kelompok-kelompok tersebut untuk menyederhanakan interaksi antar sistem
4. Mengelompokkan matriks fungsi dan entitas untuk menunjukan area bisnis sebenarnya •
Mengatur matriks fungsi atau entitas yang telah dikelompokkan ke dalam bentuk batasan-batasan analisa bisnis
•
Menempatkan semua fungsi ke dalam area bisnis
•
Menentukan lokasi geografis untuk setiap area bisnis
•
Mengatur area bisnis sehingga area-area tersebut saling berhubungan
2.3.3 Critical Success Factor ( CSF ) Menurut McLeod ( 2001,p109), sebuah CSF adalah satu dari aktifitas perusahaan yang mempunyai pengaruh kuat terhadap kemampuan perusahaan untuk memenuhi tujuannya. Sebuah perusahaan umumnya mempunyai banyak CSF.
31 Kekuatan dari metode CSF adalah bahwa CSF menghasilkan set data yang lebih kecil untuk dianalisa daripada analisa perusahaan (enterprise analysis) secara keseluruhan.
2.3.4 Perancangan Data Warehouse dengan Skema Bintang Menurut Poe ( 1996,p133), alat yang digunakan dalam merancang Data Warehouse adalah skema bintang ( star schema ) . Skema bintang merupakan struktur sederhana dengan tabel-tabel yang relatif sedikit dan hubungan antar tabel yang jelas. Rancangan ini mampu melakukan query dengan cepat serta mudah dimengerti bahkan oleh analis dan pengguna akhir atau orang awam yang tidak mengerti struktur database.
2.3.4.1 Skema Bintang ( Star Schema ) Menurut Poe ( 1996, p33 ) metode yang digunakan untuk merancang data warehouse adalah dengan menggunakan skema bintang, yaitu metode perancangan yang dilakukan dengan struktur sederhana dengan mengguanakan beberapa tabel dan jalur yang terhubung dengan baik dan jelas. Dengan menggunakan skema bintang ini akan menghasilkan waktu respon yang lebih cepat dalam query data dibanding dengan proses transaksional yang mengguanakan struktur normalisasi. Selain itu skema bintang memudahkan end user untuk memahami struktur data warehouse yang dirancang.
32 2.3.4.2 Keuntungan menggunakan Skema Bintang Skema bintang memliki beberapa keuntungan yang tidak terdapat pada struktur relational biasa. Berikut keuntungan dari penggunaan skema bintang : 1.Respon data lebih cepat daripada perancangan database operasional. 2.Mempermudah dalam hal modifikasi atau pengembangan data warehouse yang terus menerus. 3.Menyederhanakan pemahaman dan penelusuran metadata bagi pemakai dan pengembang.
2.3.4.3 Tabel dalam Skema Bintang Dalam skema bintang terdapat dua tipe tabel yaitu tabel fakta dan tabel dimensi. Tabel fakta disebut juga sebagai tabel mayor, terdiri dari data kuantitatif atau data fakta mengenai bisnis, informasi yang diquery. Informasi ini sering diukur secara numeric dan dapat mengandung banyak kolom dan baris. Tabel dimensi disebut juga sebagai tabel mino karena lebih kecil dan describe yang mencerminkan dimensi bisnis.
2.3.4.4 Ketentuan Pembacaan Skema Bintang Adapun ketentuan pembacaan skema bintang adalah sebagai berikut : •
Bagian yang ada dibawah tabel adalah kolom-kolom dari tabel
•
Primary key dan foreign key diberi kotak
•
Primary key diarsir, sedangkan foreign key yang bukan primary key tidak diarsir.
•
Foreign key yang berhubungan ditunjukan dengan garis yang menghubungkan tabel-tabel.
33 •
Kolom yang bukan primary key atau foreign key disebut kolom data pada tabel fakta dan atribut pada tabel dimensi.
2.3.4.5 Jenis-Jenis Skema Bintang Dalam penggunaannya terdapat dua buah jenis skema bintang yang tergantung dengan kebutuhan , yaitu Skema Bintang Sederhana dan Skema Bintang Majemuk yang akan lebih rinci dijelaskan sebagai berikut ini :
2.3.4.5.1 Skema Bintang Sederhana Dalam skema bintang sederhana, setiap tabel harus mempunyai primary key yang terdiri dari sebuah kolom atau lebih . Primary key tersebut membuat setiap baris menjadi unik. Dalam skema bintang sederhana, primary key pada tabel fakta terdiri satu atau lebih foreign key.
Gambar 2.8 Hubungan antar tabel dimensi pada skema bintang sederhana Pada gambar menunjukan hubungan antara satu tabel fakta dan tiga tabel dimensi. Tabel utama terdapat primary key yang terdiri dari tiga foreign key yaitu kunci-
34 1, kunci-2, kunci-3, yang masing-masing merupakan primary key di tabel masingmasing. Alasan memilih skema bintang sederhana yaitu : 1. Menyediakan response time yang baik 2. Struktur rancangan yang sederhana mudah dimengerti pemakai Dalam sebuah skema bintang, dapat juga terdiri dari lebih dari satu tabel fakta, karena adanya fakta yang tidak saling berhubungan atau karena perbedaan waktu pengambilan data. Tabel semacam ini umumnya digunakan untuk jumlah data besar dan untuk berbagai macam level data yang teragregasi.
Gambar 2.9 Skema Bintang Dengan Berbagai Tabel Fakta Pada gambar terdapat dua tabel fakta dan tiga tabel dimensi yang memperlihatkan hubungan many to one antara foreign key pada kedua tabel fakta tersebut dengan primary key pada masing – masing tabel dimensi
35 Tabel fakta juga dapat digunakan untuk menggambarkan hubungan many to many antara berbagai tabel dimensi yang sudah jelas dalam bisnis. Jenis skema bintang ini dikenal dengan tabel asosiasi pada gambar. Tabel asosiasi berguna untuk menyelaraskan hubungan many to many di antara dimensi yang berbeda.
Gambar 2.10 Skema Bintang sebagai Tabel Asosiasi Tabel dimensi mungkin mengandung foreign key yang mereferensikan primary key di tabel dimensi lain. Tabel dimensi yang direferensikan ini yang dinamakan outboard table atau secondary dimension table. Pada gambar terdapat skema bintang dengan outboard table atau secondary dimension table. Tabel dimensi tiga mempunyai dua outboard table yaitu tabel dimensi empat dan tabel dimensi lima.
36
Gambar 2.11 Skema Bintang dengan Tabel Dimensi Tambahan
2.3.4.5.2 Skema Bintang Majemuk
Gambat 2.12 Skema Bintang Majemuk
37 Tabel fakta dalam skema bintang majemuk memiliki dua kumpulan foreign key , yang pertama mengandung suatu referensi dengan tabel dimensi sedangkan sisanya adalah primary key yang merupakan gabungan dari satu atau lebih kolom yang menghasilakn suatu identifikasi unik untuk setiap barisnya. Bedanya skema bintang majemuk dengan skema bintang sederhana adalah saling tidak indentiknya primary key dan foreign key dalam skema bintang majemuk.
2.3.4.5.3 Skema Snowflake Skema snowflake merupakan variasi pada skema bintang yang menyimpan seluruh informasi tabel dimensi dalam bentuk normal ketiga dan tabel fakta tetap dalam keadaan semula, seperti yang terlihat pada gambar. Prinsip dasar dari skema ini tidak jauh berbeda dari skema bintang. Penggunaan tabel dimensi sangatlah menonjol, karena itulah perbedaan mendasar dari skema bintang dan skema snowflake. Skema snowflake menggunakan beberapa tabel fakta dan tabel dimensi yang sudah mengalami normalisasi, sedangkan skema bintang menggunakan tabel dimensi yang masih denormalisasi. Skema snowflake dibuat berdasarkan OLTP sehingga semua data akan termuat detail dalam setiap tabel fakta dan tabel dimensi. Ciri-ciri Skema Snowflake adalah : 1. Tidak terdapat level pada dimensi 2. Tabel dimensi dinormalisasi dengan dekomposisi pada level atribut 3. Setiap dimensi mempunyai satu key untuk setiap level pada hiraki dimensi
38 4. Kunci level terendah menghubungkan tabel dimensi dengan tabel fakta dan tabel atribut berlevel terendah. Keuntungan dari skema Snowflake adalah : •
Kecepatan memindahkan data dari OLAP ke dalam metadata
•
Sebagai kebutuhan dari alat pengambil keputusan tingkat tinggi dimana denagn tipe yang seperti ini seluruh struktur dapat digunakan sepenuhnya.
•
Banyak yang beranggapan lebih nyaman merancang dalam bentuk normal ketiga Sedangkan kerugiaannya adalah mempunyai masalah yang besar dalam hal
kinerja (performance), hal ini disebabkan semakin banyaknya join antar tabel-tabel yang dilakukan dalam skema snowflake ini, maka semakin lambat juga kinerja yang dilakukan. Sebuah skema bintang yang menyediakan atribut yang lengkap , konsisten dan mudah dimengerti memungkinkan bagi pemakai untuk memperoleh penampilan data yang mudah digunakan dan mudah dimengerti,. Perancangan skema bintang yang baik membantu pemakai untuk menulis pencarian yang diinginkan dengan cara yang dimengerti.
39
Gambar 2.13 Skema Bintang Snowflake