BAB 2 LANDASAN TEORI
2.1.
Teori Umum 2.1.1
Data dan Informasi Menurut Inmon (2005, p493), data adalah kumpulan dari fakta,
konsep atau perintah pada sebuah media penyimpanan yang digunakan untuk komunikasi, pengambilan dan pemrosesan pengertian secara otomatis dan menyajikannya dalam bentuk informasi yang dapat dimengerti oleh manusia. Menurut Indrajani (2009, p2), data adalah fakta atau observasi mentah yang biasanya mengenai fenomena fisik atau transaksi bisnis. Jadi, data adalah fakta mengenai fenoma fisik atau transaksi bisnis yang digunakan untuk mendapatkan informasi. Menurut Inmon (2005, p498), informasi adalah data yang dimengerti dan dievaluasi oleh manusia untuk memecahkan permasalahan atau membuat keputusan. Jadi, informasi adalah data – data yang telah diolah sehingga dapat digunakan untuk memecahkan permasalahan serta membuat keputusan.
2.1.2
Database Menurut Connolly dan Begg (2005, p15), database adalah
sekumpulan koleksi dari data yang terhubung secara logikal, dan deskripsi 8
9 dari data-data tersebut, yang dirancangkan untuk memenuhi kebutuhan informasi dari suatu organisasi atau perusahaan. Menurut Inmon (2005, p493), database adalah sekumpulan data yang saling berhubungan (seringkali dengan redundansi yang terkontrol dan terbatas) yang disimpan menurut sebuah skema. Jadi, database adalah sekumpulan data dan deskripsi data yang terhubung secara logikal serta memiliki redudansi yang terkontrol dan terbatas, yang dirancangkan untuk menyediakan informasi yang dibutuhkan oleh sebuah organisasi atau perusahaan.
2.1.3
Database Management System (DBMS) Menurut Inmon (2005, p494), Database Management System
merupakan sebuah sistem perangkat lunak berbasis komputer yang dipakai untuk membuat dan mengatur data. Menurut Connolly dan Begg (2005, p16), Database Management System adalah sebuah sistem perangkat lunak yang memampukan user untuk mendefinisikan, membuat, memelihara, dan mengontrol akses ke database. Jadi, Database Management System adalah suatu sistem perangkat lunak berbasis komputer yang dapat digunakan oleh user untuk membuat, mengatur, dan memelihara database.
10 2.1.4
Online Transaction Processing (OLTP) Menurut Inmon (2005, p501), OLTP merupakan lingkungan
pemrosesan transaksi yang memiliki performa tinggi. Menurut Connolly dan Begg (2005, p1149), OLTP adalah sistem yang dirancang untuk menangani jumlah hasil transaksi yang tinggi, dengan transaksi yang biasanya membuat perubahan kecil pada data operasional perusahaan, yaitu data yang diperlukan oleh perusahaan untuk menangani operasi dari hari ke hari. Berdasarkan definisi-definisi di atas, maka dapat disimpulkan bahwa OLTP adalah suatu sistem berperforma tinggi yang dirancang untuk menangani proses transaksi yang terjadi setiap hari pada perusahaan, dan data dari hasil transaksi tersebut dimasukkan ke dalam database secara berkala.
2.1.5
Data Mart Menurut Inmon (2005, p494), data mart adalah sebuah struktur data
yang terbagi-bagi, dimana struktur data tersebut diambil dari data warehouse dan data telah didenormalisasi berdasarkan kebutuhan informasi pada tiap-tiap bagian perusahaan. Menurut Connolly dan Begg (2005, p1171), data mart merupakan bagian dari data warehouse yang mendukung kebutuhan dari suatu departemen atau fungsi bisnis tertentu.
11 Jadi bisa disimpulkan bahwa data mart adalah bagian dari data warehouse yang dirancang untuk mendukung kebutuhan informasi pada suatu departemen tertentu di dalam perusahaan.
2.1.6
Data Warehouse Menurut Inmon (2005, p495), data warehouse adalah sekumpulan
dari database yang saling berintegrasi dan berorientasi subjek untuk mendukung proses pengambilan keputusan, dimana setiap unit data cocok dan relevan dengan beberapa saat dalam waktu tertentu. Menurut Connolly dan Begg (2005, p1151), data warehouse adalah sekumpulan data yang bersifat subject-oriented, integrated, time variant, dan non-volatile untuk mendukung proses pengambilan keputusan. Subjectoriented berarti data warehouse disusun pada sekitar subjek utama dari perusahaan (seperti pelanggan, produk, dan penjualan) daripada area aplikasi utama (seperti faktur pelanggan, kontrol stok, dan penjualan produk). Data warehouse mengumpulkan data yang bersifat integrated, karena sumber data datang dari sistem aplikasi perusahaan yang bermacammacam. Seringkali sumber data tidak konsisten, seperti terdapat format data yang berbeda antara data yang satu dengan data yang lain. Data warehouse memiliki data yang time variant karena data di dalam data warehouse hanya akurat dan valid untuk beberapa titik waktu atau jangka waktu tertentu. Data di dalam data warehouse bersifat non-volatile karena data tidak diperbarui secara real time, tetapi di-refresh dari sistem operasional secara teratur. Data baru selalu ditambahkan ke dalam database.
12 Jadi, data warehouse adalah tempat penyimpanan data yang berorientasi subjek, terintegrasi, tidak mudah berubah, dan memiliki rentang waktu tertentu, yang mana data-data yang dikumpulkan merupakan data yang diambil dari database operasional, yang diproses agar dapat dianalisis untuk mendukung proses pengambilan keputusan.
2.1.7
Keuntungan Data Warehouse Menurut Connolly dan Begg (2005, p1152), data warehouse dapat
memberikan keuntungan kepada perusahaan seperti: 1.
Potensi pengembalian yang besar dari investasi (potential high returns on investment) Sebuah perusahaan harus mengeluarkan sejumlah besar dana untuk memastikan keberhasilan penerapan data warehouse dan biayanya dapat bervariasi tergantung dari solusi teknis yang diberikan. Potensi pengembalian dari investai ke dalam data warehouse sangat besar. Tergantung dari bagaimana para pengambil keputusan memakai data warehouse dalam proses pengambilan keputusan.
2.
Keuntungan kompetitif (competitive advantage) Pengembalian yang besar atas investasi perusahaan merupakan hasil dari keuntungan kompetitif yang didapatkan dari penggunaan teknologi ini. Keuntungan kompetitif dapat diperoleh dengan memfasilitasi para pengambil keputusan mengakses data yang dapat memperlihatkan apa yang sebelumnya tidak dapat dilihat karena keterbatasan teknologi, seperti pelanggan, tren, dan permintaan.
13 3.
Meningkatkan produktivitas dari para pengambil keputusan (increased productivity of corporate decision-makers) Data warehousing dapat meningkatkan produktivitas dari para pengambil keputusan dengan membuat sebuah database terpadu dari data-data yang konsisten, berorientasi subjek, dan bersifat historis. Data warehouse menyatukan data dari berbagai sistem dan dijadikan data yang lebih konsisten. Dengan mengubah data menjadi informasi yang berguna, data warehouse memungkinkan para pengambil keputusan untuk melakukan analisis yang lebih nyata, akurat, dan konsisten.
2.1.8
Extraction Transformation Loading (ETL) Menurut Inmon (2005, p497), ETL merupakan proses mengambil
data aplikasi yang dibutuhkan dan mengintegrasikannya ke dalam data warehouse. Menurut Steinacher (2000, p74), ETL merupakan proses yang umumnya digunakan untuk memindahkan data dari satu sistem ke sistem lain. Secara tradisional, dalam dunia bisnis, ETL dipakai untuk mentransfer data dari aplikasi lama ke aplikasi baru, atau untuk memindahkan data operasional ke dalam sistem seperti data warehouse dan data mart. Jadi, ETL adalah proses meyiapkan data yang meliputi pengambilan data yang dibutuhkan, pengubahan dan pengintegrasian data, serta pemuatan data dari sumber data ke dalam data warehouse. Di dalam jurnal yang ditulis oleh Steinacher (2000, p74), proses ETL dibagi menjadi 3 bagian, yaitu:
14 1. Data extraction Untuk memulai proses ETL, programmer akan menjalankan rutin extraction untuk membaca record dari database sumber dan membuat data pada record dapat dipakai untuk proses transformasi. 2. Data transformation Setelah
melakukan
proses
extraction,
data
kemudian
ditransformasikan ke dalam bentuk yang cocok dengan lingkungan data warehouse. Terdapat beberapa teknik tranformasi yang sering dilakukan, yaitu aggregation, value translation, field derivation, dan cleansing. Sebelum melakukan loading ke data mart, biasanya programmer akan melakukan aggregate data terlebih dahulu. Aggregation akan menggantikan sejumlah record detail dengan beberapa baris record ringkasan. Sebagai contoh, andaikan data penjualan dalam setahun disimpan dalam beberapa ribu record dalam database yang sudah dinormalisasi. Melalui aggregation, data tersebut ditransformasi menjadi data ringkas yang akan ditulis dalam data mart penjualan. Value
translation
merupakan
salah
satu
teknik
dalam
transformasi data. Database operasional menyimpan kode informasi untuk membatasi redudansi data dan merupakan syarat penyimpanan. Sebagai contoh, kode barang ditulis di dalam file faktur karena panjangnya yang pendek, daripada menulis deskripsi produk dalam faktur. Karena data mart mengandung informasi ringkasan dan dirancang untuk kemudahan penggunaan, programmer biasanya
15 mengganti kode tersebut dengan deskripsi yang lebih jelas. Inilah yang disebut sebagai value translation. Field
derivation
merupakan
teknik
ketiga
dalam
mentransformasikan data. Melalui field derivation, informasi baru diciptakan untuk pengguna. Sebagai contoh, andaikan database operasional mengandung kolom untuk jumlah penjualan dan harga per unit.
Daripada
membuat
pengguna
menghitung
penghasilan,
programmer dapat membuat kolom penghasilan selama proses transformasi. Produk-produk ETL telah memampukan programmer untuk menggunakan operasi matematika, fungsi statistik, manipulasi string, date arithmetic, dan logika kondisional untuk menurunkan kolom baru. Teknik transformasi yang keempat, cleansing, mempunyai banyak kegunaan. Programmer bergantung pada algoritma cleansing untuk menjaga agar data yang tidak akurat tidak masuk ke dalam sistem. Sebagai contoh, cleansing biasanya memastikan bahwa kolom numeric mengandung data angka. Cleansing dapat juga digunakan dalam kasus dimana satu nilai unik direpresentasikan dalam banyak cara di database. Sebagai contoh, IBM dapat digambarkan sebagai IBM Co. atau International Businesss Machines, dan lain sebagainya. Selama proses cleansing, versi-versi lain dari elemen data yang sama diganti dengan nilai tunggal. 3. Data loading
16 Setelah data ditransformasikan, programmer menggunakan prosedur load untuk menulis data tersebut ke dalam database yang menjadi target. Selama tahap ini, kita harus menentukan apakah akan menyebarkan data secara berkala atau terus-menerus. Penambahan terjadi secara teratur, seperti harian, mingguan, atau bulanan. Pendekatan ini merekam kondisi sistem operasional pada saat-saat spesifik. Jika pengguna menginginkan informasi terkini, continuous propagation dapat memuat data ke dalam database target pada basis waktu real-time. Kita bisa mengkategorikan data loading berdasarkan metode yang dipakai untuk mereplikasi data. Dalam replikasi push, aplikasi sumber „mendorong‟ data yang telah ditransformasi ke aplikasi target. Dalam replikasi pull, aplikasi target „menarik‟ data yang diperlukan olehnya, seperti ketika pengguna menjalankan sebuah query. Kita juga bisa merancang prosedur load yang menggunakan proses pull dan push. Pada pendekatan tipe ini, aplikasi sumber biasanya mendorong data ke Staging database, dimana data tersebut akan ditransformasi dan kemudian ditarik ke dalam aplikasi target ketika diperlukan saja. Pendekatan tipe ini memerlukan ruang disk yang lebih besar, tapi dapat meningkatkan performa.
17
Gambar 2.1 Proses ETL 2.1.9
Online Analytical Processing (OLAP) Menurut Inmon (2005, p500), OLAP merupakan bagian pemrosesan
untuk lingkungan data mart. Menurut Connolly dan Begg (2005, p1205), OLAP adalah sintesis, analisis, dan konsolidasi dinamis dari sejumlah besar data multidimensional. OLAP merupakan sebuah istilah yang mendeskripsikan teknologi yang menggunakan tampilan multi-dimensional dari data agregat untuk menyediakan akses cepat kepada informasi strategis yang akan digunakan untuk tujuan analisis tingkat lanjut. Menurut Kimball (2002, p408), OLAP dapat diartikan secara bebas sebagai sekumpulan prinsip yang menyediakan kerangka kerja dimensional untuk mendukung keputusan. Jadi, OLAP merupakan teknologi yang menggunakan sekumpulan prinsip kerangka kerja dimensional yang memakai data agregat untuk
18 menyediakan akses cepat kepada informasi strategis sehingga dapat dipakai untuk melakukan analisis tingkat lanjut dalam untuk mendukung proses pengambilan keputusan.
2.1.10 Model Data Menurut Inmon (2005, p494), model data dapat memiliki 2 pengertian. Pengertian pertama, model data merupakan struktur data logikal, termasuk operasi dan constraint yang disediakan oleh DBMS untuk pemrosesan database secara efektif. Pengertian kedua, model data adalah sistem yang dipakai untuk merepresentasikan data (contohnya adalah ERD atau relational model). Menurut Connolly dan Begg (2005, p43), model data merupakan sekumpulan
konsep
yang
terintegrasi
untuk
mendeskripsikan
dan
memanipulasi data, hubungan antar data, dan constraint pada data dalam suatu perusahaan. Tujuan dari model data adalah untuk merepresentasikan data sehingga data lebih mudah untuk dimengerti. Sebuah model data berisikan tiga buah komponen, yaitu: 1. Bagian struktural, terdiri dari sekumpulan aturan berdasarkan pada database mana yang dapat dikonstruksi. 2. Bagian
manipulatif,
mendefinisikan
tipe
operasi
apa
yang
diperbolehkan pada data (ini termasuk operasi yang digunakan untuk melakukan pembaruan ataupun pengambilan data dari database dan operasi untuk mengubah struktur database). 3. Sekumpulan integrity constraint, yang memastikan data tetap akurat.
19 Dapat disimpulkan model data adalah struktur data logikal yang juga berisi operasi dan constraint yang terdapat pada data, yang dipakai untuk merepresentasikan data sehingga data lebih mudah untuk dimengerti oleh pihak pengembang dan pengguna.
2.1.11 Konsep Pemodelan Data Warehouse 2.1.11.1 Star Schema Menurut Connolly dan Begg (2005, p1183), star schema adalah struktur logikal yang dibentuk dari sebuah tabel fakta yang mengandung data fakta pada bagian tengah, dikelilingi oleh tabeltabel dimensi yang mengandung data referensi (yang mana data tersebut dapat didenormalisasi). Star schema mengeksploitasi karakteristik dari data faktual seperti fakta yang dihasilkan oleh peristiwa yang muncul pada waktu yang lalu dan tidak berubah, tanpa memperhatikan bagaimana mereka dianalisis. Penting untuk memperlakukan data fakta sebagai data referensi yang bersifat read-only.
20
Gambar 2.2 Star schema dari penjualan properti DreamHome (Connolly dan Begg, 2005, p1184) Star schema dapat dipakai untuk meningkatkan kecepatan performa informasi
kinerja
query dengan melakukan
referensi
ke
dalam
tabel
denormalisasi
dimensi
tunggal.
Denormalisasi dianjurkan ketika terdapat sejumlah entitas yang berhubungan dengan tabel dimensi yang sering diakses.
21 2.1.11.2 Snowflake Schema Menurut Connolly dan Begg (2005, p1184), snowflake schema adalah variasi lain dari star schema dimana tabel dimensi tidak berisi data yang didenormalisasi. Pada snowflake schema, sebuah tabel dimensi dapat mempunyai tabel dimensi lainnya. 2.1.11.3 Starflake Schema Menurut Connolly dan Begg (2005, p1185), starflake schema merupakan struktur gabungan antara star schema dan snowflake schema. Beberapa dimensi mungkin menggunakan schema ini untuk memenuhi kebutuhan query yang berbeda.
2.1.12 Model Relasional Menurut Inmon (2005, p357), salah satu permasalahan yang dihadapi pihak pengembang data warehouse adalah masalah model yang dipakai untuk
rancangan database data warehouse. Terdapat dua model untuk
rancangan database yaitu model relasional dan model multidimensional. Pendekatan model relasional untuk desain database dimulai dengan organisasi data ke dalam tabel. Kolom yang berbeda berada pada setiap baris dalam tabel, seperti yang terlihat pada gambar di bawah ini.
22 Gambar 2.3 Tabel sederhana (Inmon, 2005, p358) Tabel relasional dapat mempunyai properti yang berbeda-beda. Kolom data mempunyai karakteristik fisik yang berbeda. Kolom yang berbeda dapat diindeks dan dapat berlaku sebagai pengidentifikasi. Kolom tertentu dapat berisi null pada saat implementasi. Semua kolom didefinisikan dalam pernyataan data definition language (DDL). Pendekatan model relasional untuk desain database telah ada sejak 1970-an dan dibangun dengan baik melalui implementasi relasional dari teknologi seperti DB2, produk Oracle, dan produk DBMS Teradata. Teknologi relasional menggunakan keys dan foreign keys untuk membangun relasi antar baris data. Teknologi relasional memakai SQL, yang mana dipakai secara luas sebagai bahasa yang menghubungkan antara program dengan data. Gambar 2.9 menunjukkan rancangan database relasional.
Gambar 2.4 Rancangan database relasional (Inmon, 2005, p358)
23 Gambar 2.9 menunjukkan bahwa terdapat banyak tabel yang berbedabeda, dan tabel-tabel tersebut saling terhubung oleh hubungan key ke foreign key. Hubungan key-foreign key ini merupakan hubungan dasar dimana data yang sama tersimpan pada kedua tabel, sebagaimana yang terlihat pada gambar 2.10.
Gambar 2.5 Hubungan key-foreign key (Inmon, 2005, p359) Data di dalam model relasional berada pada tingkat normalisasi. Normalisasi data yang terjadi pada rancangan database ini menyebabkan data dipecah sampai tingkat granularity yang rendah. Data yang telah dinormalisasi memiliki hubungan yang sangat teratur. Ketika dinormalisasi, data di dalam satu tabel mempunyai hubungan dengan data lain yang tersimpan dalam tabel. Normalisasi biasanya memiliki tiga tingkatan, yaitu bentuk normal pertama, bentuk normal kedua, dan bentuk normal ketiga. Database yang dirancang dengan model relasional memiliki keteraturan, sehingga memudahkan untuk dibuat menjadi data warehouse. Dengan kata lain, model relasional menghasilkan desain yang fleksibel bagi data warehouse. Elemen data dapat dibentuk dan dibentuk ulang dalam banyak cara. Fleksibilitas merupakan keunggulan utama dari model relasional. Oleh karena data detail dikumpulkan dan dapat dikombinasikan,
24 banyak view data yang dapat dihasilkan ketika desain data warehouse didasarkan pada model relasional.
2.1.13 Metodologi Perancangan Data Warehouse Menurut Kimball (Connolly dan Begg, 2005, p1187), ada sembilan langkah yang harus dijalankan dalam merancang database untuk data warehouse, yaitu: Langkah 1: Memilih proses Proses ini merujuk pada subjek data mart tertentu. Data mart yang dibangun pertama kali haruslah data mart yang dapat dikerjakan dan selesai tepat waktu, biaya yang cukup, dan menjawab pertanyaan bisnis paling penting. Pilihan terbaik untuk data mart yang pertama adalah yang berkaitan dengan penjualan.
Langkah 2: Memilih grain Memilih grain berarti kita memutuskan secara tepat apa yang direpresentasikan oleh record pada tabel fakta. Sebagai contoh, entitas PropertySale merepresentasikan fakta tentang tiap-tiap penjualan properti dan menjadi tabel fakta dari star schema penjualan properti. Oleh karena itu, grain dari tabel fakta PropertySale adalah setiap record penjualan properti. Ketika kita sudah memilih grain dari tabel fakta, maka kita bisa mengidentifikasikan dimensi-dimensi dari tabel fakta.
25 Langkah 3: Identifikasi dan membuat dimensi yang sesuai Dimensi mengatur konteks untuk mengajukan pertanyaan tentang fakta-fakta dalam tabel fakta. Dimensi yang dirancang dengan baik membuat data mart lebih mudah dimengerti dan digunakan. Dimensi yang tidak lengkap dan kurang akan menurunkan manfaat dari sebuah data mart bagi perusahaan. Jika terdapat dimensi yang muncul dalam dua data mart, mereka harus merupakan dimensi yang persis sama, atau salah satu harus merupakan subset matematis dari yang lain. Hanya dengan cara ini, dua data mart dapat saling berbagi satu atau lebih dimensi pada aplikasi yang sama. Ketika sebuah dimensi digunakan pada lebih dari satu data mart, maka dimensi itu disebut sedang disesuaikan. Kalau dimensi tersebut tidak disinkronisasi, maka keseluruhan data warehouse akan gagal karena kedua data mart tidak akan dapat digunakan secara bersama-sama.
Langkah 4: Memilih fakta Grain pada tabel fakta menentukan fakta mana yang dapat digunakan dalam data mart. Semua fakta harus diekspresikan pada tingkatan yang telah dinyatakan oleh grain. Dengan kata lain, kalau grain dari tabel fakta adalah setiap record pada penjualan properti, maka semua fakta numerik harus merujuk pada penjualan jenis ini. Dan juga, fakta harus berupa numerik dan hasil penjumlahan.
Langkah 5: Menentukan data pre-kalkulasi dari tabel fakta
26 Ketika fakta telah dipilih, maka masing-masing fakta tersebut harus diperiksa ulang untuk menentukan apakah ada kemungkinan untuk menggunakan
pre-kalkulasi.
Contoh
umum
akan
kebutuhan
menyimpan pre-kalkulasi terjadi ketika terdapat fakta yang terdiri dari pernyataan laba dan rugi. Situasi ini akan sering terjadi ketika tabel fakta berdasarkan penjualan atau invoice.
Langkah 6: Melengkapi tabel dimensi Pada
langkah
ini,
kita
melengkapi
tabel
dimensi
dengan
menambahkan keterangan ke dalamnya. Deskripsi ini harus intuitif dan mudah dimengerti oleh pengguna.
Langkah 7: Memilih durasi dari basis data Kita harus menentukan seberapa jauh durasi waktu yang ditampung di dalam tabel fakta. Untuk perusahaan seperti perusahaan asuransi, mengharuskan untuk menyimpan data sampai 5 tahun atau lebih. Tabel fakta yang sangat besar menimbulkan setidaknya dua masalah signifikan pada data warehouse. Pertama, semakin tua suatu data, maka akan ada masalah dalam membaca dan menginterpretasikan file tua tersebut. Kedua, wajib untuk menggunakan versi lama dari dimensi penting, bukan versi yang baru. Ini dikenal sebagai masalah pada slowly changing dimension.
Langkah 8: Melacak dimensi yang berubah secara perlahan
27 Ada tiga tipe dimensi yang berubah secara perlahan (slowly changing dimension), yaitu: Tipe 1. Perubahan dimensi menyebabkan data lama di-overwrite. Tipe 2. Perubahan dimensi menyebabkan pembentukan record baru. Tipe 3.Perubahan dimensi menyebabkan pembuatan atribut alternatif sehingga nilai yang lama dan nilai yang baru dapat diakses secara bersama pada dimensi yang sama.
Langkah 9: Menentukan prioritas dan mode dari query Pada langkah ini, kita mempertimbangkan permasalahan desain fisik. Permasalahan desain fisik paling kritis yang mempengaruhi persepsi pengguna terhadap data mart adalah urutan fisik dari tabel fakta pada disk dan kehadiran ringkasan atau aggregation yang telah disimpan.
2.1.14 State Diagram Menurut Connolly dan Begg (2005, p841), state diagram merupakan bagan yang menunjukkan bagaimana objek-objek dapat berubah akibat dari event luar. Gambar di bawah ini memberi contoh state diagram.
28
Gambar 2.6 Contoh state diagram (Connolly dan Begg, 2005, p842)
State direpresentasikan dengan kotak bersudut melengkung.
Transition direpresentasikan dengan tanda panah antar state yang diberi label dengan „nama event/action‟ (event memicu transisi dan action merupakan hasil dari transisi). Sebagai contoh, pada gambar di atas, transisi
dari
state
approveProperty
Pending
dan
ke
Available
menghasilkan
dipicu
action
oleh
yang
event disebut
makeAvailable().
Initial state (state dari objek sebelum terjadi transisi apapun) direpresentasikan dengan lingkaran hitam dengan tanda panah ke arah initial state.
Final state (state yang menandai objek dihapus) direpresentasikan dengan lingkaran hitam yang berada dalam lingkaran putih, dan terdapat tanda panah yang masuk dari state sebelumnya.
29 2.1.15 Sequence Diagram Menurut Connolly dan Begg (2005, p839), sequence diagram memodelkan interaksi antar objek-objek dalam urutan waktu, menangkap perilaku dalam satu use case. Sequence diagram menampilkan objek dan pesan yang dikirimkan antara objek-objek dalam use case. Dalam sebuah sequence diagram, objek dan aktor ditampilkan seperti kolom, dengan lifeline yang mengindikasikan waktu hidup objek-objek di dalamnya. Sebuah kontrol aktivasi/fokus, yang mana mengindikasikan kapan objek melakukan suatu aksi, dimodelkan dengan sebuah kotak segi empat di dalam lifeline. Sebuah lifeline digambarkan dengan garis vertikal berupa titik-titik yang digaris mulai dari objek ke bawah. Penghapusan objek ditandai dengan tanda X pada titik tertentu pada lifeline-nya. Gambar di bawah ini menunjukkan contoh dari sequence diagram.
Gambar 2.7 Contoh sequence diagram (Connolly dan Begg, 2005, p841)
30 2.1.16 Use Case Diagram Menurut Connolly dan Begg (2005, p838), use case diagram memodelkan fungsionalitas yang disediakan oleh sistem, pengguna yang berinteraksi dengan sistem, dan asosiasi antara pengguna dan fungsionalitas tersebut. Biasanya use case digunakan dalam proses pengumpulan kebutuhan pengguna dan dalam fase analisis dari life cycle pengembangan perangkat lunak untuk mewakili kebutuhan tingkat tinggi dari sistem. Sebuah use case digambarkan dengan sebuah bentuk elips, aktor digambarkan dengan stick figure, dan hubungan antara keduanya digambarkan dengan sebuah garis yang menghubungkan antara aktor dan use case. Peran aktor ditulis berdekatan dengan ikon stick figure. Aktor di dalam use case tidak hanya manusia. Jikalau sebuah sistem berkomunikasi dengan aplikasi lain, dan memerlukan masukan(input) atau menghasilkan keluaran(output), maka aplikasi lain tersebut bisa dianggap sebagai aktor. Sebuah use case biasanya direpresentasikan oleh sebuah kata kerja yang diikuti sebuah objek, seperti melihat properti, melakukan login, dan lain sebagainya. Sebuah contoh dari use case diagram untuk Client dengan empat use case dapat terlihat pada gambar di bawah ini. Notasi use case ini sederhana, sehingga use case merupakan alat yang sangat baik untuk berkomunikasi antara pihak pengguna dengan pihak pengembang.
31
Gambar 2.8 Contoh use case diagram (Connolly dan Begg, 2005, p840) 2.1.17 Navigation Diagram Menurut Mathiassen (2000, p159), navigation diagram merupakan sebuah diagram yang menampilkan gambaran umum dari komponenkomponen tampilan antar muka pengguna dan gambaran umum bagaimana proses transisi tampilan antar muka. Navigation diagram terdiri atas gambar-gambar dari setiap tampilan antar muka, dan tanda panah yang menunjukkan bagaimana penggunaan tombol-tombol tertentu dan hal-hal lain dapat mengaktifkan fungsi tertentu atau membuka window lain. Gambar di bawah ini menunjukkan sebuah contoh navigation diagram.
32
Gambar 2.9 Contoh navigation diagram (http://www.docstoc.com/docs/4202730/Navigation-Diagram) 2.1.18 Metadata Menurut Inmon (2005, p500), metadata adalah data tentang data. Metadata juga dapat diartikan sebagai deskripsi akan struktur, isi, kunci, index, dan lain sebagainya mengenai data. Metadata merupakan komponen penting dari data warehouse. Menurut Kimbal (2002, p14), metadata adalah semua informasi dalam lingkungan data warehouse yang bukan merupakan data itu sendiri. Metadata sama dengan sebuah ensiklopedi lengkap mengenai keberadaan data dari data warehouse, meliputi definisi tabel dan field serta source tabel tersebut. Metadata hadir dalam berbagai macam bentuk untuk mendukung kebutuhan teknis, administratif, dan kelompok pengguna bisnis yang berbeda-beda dari data warehouse.
33 Menurut Connolly dan Begg (2005, p1159), metadata digunakan untuk berbagai macam tujuan, yaitu: 1. Untuk proses pengambilan data dan pemuatan data, dimana metadata dipakai untuk memetakan sumber data ke dalam suatu view data di dalam data warehouse. 2. Untuk proses manajemen di dalam data warehouse, dimana metadata digunakan untuk memproduksi tabel rangkuman data secara otomatis. 3. Sebagai bagian dari proses manajemen query, dimana metadata dipakai untuk mengarahkan sebuah query ke sumber data yang paling tepat.
2.2.
Teori Khusus 2.2.1 Business Intelligence Business Intelligence adalah analisis atas informasi sebuah perusahaan dimana tujuannya untuk membuat keputusan yang berhubungan dengan bisnis. Business intelligence dan aplikasi analitis didominasi oleh aksi-aksi seperti membuka hirarki dan membandingkan nilai aggregate. Menurut Ponniah (2010, p558), Business Intelligence merupakan istilah yang pada umumnya digunakan untuk mengacu pada informasi yang terdapat pada perusahaan, yang mana informasi tersebut digunakan untuk mengambil keputusan-keputusan strategis.
34 2.2.2 Slowly Changing Dimensions (SCD) Slowly Changing Dimension (SCD) merupakan dimensi yang menyimpan dan mengelola data sekarang dan historis dari waktu ke waktu di dalam data warehouse. Terdapat 3 tipe SCD di dalam data warehouse, yaitu:
SCD tipe 1 Dalam tipe ini, data baru yang masuk ke dalam data warehouse akan menghapus data yang telah ada di dalamnya. Biasanya, jenis ini tidak dianggap sebagai SCD dan kebanyakan dimensi masuk ke dalam jenis ini. Jadi data yang ada akan hilang karena tidak disimpan di tempat lain, ketika ditambahkan data yang baru. Ini adalah tipe default dari dimensi yang dibuat. Tidak perlu menentukan informasi tambahan untuk membuat SCD tipe 1.
SCD tipe 2 Pada tipe ini, data baru yang masuk ke dalam data warehouse tidak menghapus data yang telah ada di dalamnya. Jadi dimensi menyimpan banyak versi untuk record yang sama. Ketika sebuah record dalam dimensi dimodifikasi, maka record versi yang baru akan dibuat sambil record versi lama tetap dipertahankan. Setiap record mengandung
tanggal
efektif
dan
tanggal
kadaluwarsa
mengidentifikasikan periode waktu record dalam kondisi aktif.
SCD tipe 3
untuk
35 SCD tipe 3 menyimpan dua versi nilai untuk atribut tingkat tertentu yang dipilih. Setiap record menyimpan nilai sebelumnya dan nilai saat ini dari atribut berversi. Ketika nilai dari setiap atribut berversi berubah, nilai saat ini disimpan sebagai nilai lama dan nilai baru menjadi nilai saat ini. Setiap record menyimpan tanggal efektif yang mengidentifikasi tanggal dari mana nilai saat ini aktif. Ini menggandakan jumlah kolom untuk atribut berversi dan jarang digunakan. Tabel 2.1 Detail Level Dimensi Produk
(http://download.oracle.com/docs/cd/E11882_01/owb.112/e10935/di m_objects.htm#CIHBAEBJ) Dimensi PRODUK yang terdapat pada gambar di atas, dapat dijadikan
sebagai SCD tipe 3. Atribut PACKAGE_TYPE dan
PACKAGE_SIZE pada level Product dapat menjadi berversi.
36 Tambahkan dua atribut tambahan untuk menyimpan nilai sebelumnya, yaitu PREV_PACK_SIZE dan PREV_PACK_TYPE pada level Product. Misalkan nilai pada PACKAGE_TYPE berubah, maka nilai sekarang akan disimpan ke dalam PREV_PACK_TYPE dan nilai yang baru akan disimpan ke dalam atribut PACKAGE_TYPE. Atribut tanggal efektif dapat diatur ke tanggal sistem saat ini atau untuk tanggal tertentu lainnya.
Thank you for evaluating Wondershare PDF Splitter. A watermark is added at the end of each output PDF file.
To remove the watermark, you need to purchase the software from
http://store.wondershare.com/shop/buy/buy-pdf-splitter.html