BAB 2 LANDASAN TEORI
2.1
Teori Umum Berikut ini akan dijelaskan teori umum atau dasar yang digunakan, yaitu sebagai berikut: 2.1.1 Pengertian Data Menurut Hoffer & Venkataraman (2011: 5) menjelaskan bahwa data adalah suatu gambaran dari objek dan kejadian yang memiliki arti penting bagi user. Kemudian menurut Turban (2010: 41) data adalah deskripsi dari benda, kejadian, aktifitas dan transaksi yang dilakukan, dikelompokan serta di simpan tetapi belum teroganisir untuk menyampaikan hal tertentu. Sedangkan
menurut
Williams
&
Sawyer
(2010:
25) mengartikan data sebagai kumpulan fakta-fakta dan gambaran yang akan di proses menjadi informasi.
2.1.2 Pengertian Informasi Menurut O'Brien & Marakas (2010: 32) berpendapat bahwa informasi merupakan data yang telah diubah ke dalam bentuk yang memiliki arti dan bermanfaat bagi end user tertentu. Kemudian Williams & Sawyer (2010: 25) menjelaskan informasi merupakan data yang telah di summarize atau dimanipulasi ke dalam bentuk lain untuk digunakan dalam pengambilan keputusan.
7
8 Sedangkan Hoffer & Venkataraman (2011: 6) mengungkapkan bahwa informasi adalah data yang telah di proses dengan suatu cara untuk meningkatkan pengetahuan user.
2.1.3
Pengertian Database O’Brien & Marakas (2010: 174) berpendapat database adalah sekumpulan elemen data yang terintegrasi dan berhubungan secara logikal. Kemudian Connolly & Begg (2010: 65) menjelaskan bahwa database adalah sekumpulan data yang saling berhubungan secara logikal dan beserta deskripsinya, yang dirancang untuk memenuhi kebutuhan informasi dari sebuah organisasi. Sedangkan Hoffer & Venkataraman (2011: 5) mengungkapkan database adalah sebuah kumpulan terorganisir dari data logikal yang saling terkait atau berhubungan.
2.1.4 Pengertian Database Management System (DBMS) Connolly & Begg (2010: 66) mengungkapkan bahwa database management system (DBMS) adalah sebuah sistem software yang memungkinkan user untuk mendefinisikan, membuat, mengelola, dan mengontrol akses ke dalam database.
2.1.5 Pengertian Data Warehouse Berdasarkan jurnal yang dibuat oleh Golfarelli & Rizzi (2009: 1) data warehouse adalah tempat penyimpanan informasi khusus untuk mendukung pengambilan keputusan yang biasanya terdiri dari beberapa sumber data dan berisi data periodik.
9 O’Brien & Marakas (2010: 190) menjelaskan bahwa data warehouse adalah kumpulan data yang telah diekstrak dari berbagai sumber data
operasional, eksternal dan database
lain dalam
organisasi yang telah dibersihkan, diubah, dan dikelompokkan sehingga dapat digunakan atau di analisis oleh manager untuk pengambilan keputusan. Sedangkan Connolly & Begg (2010: 1197) menjelasakan data warehouse adalah sekumpulan data yang berorientasi subjek, terintegrasi, time-variant, dan non-volatile yang digunakan untuk mendukung proses pengambilan keputusan.
2.1.6 Karakteristik Data Warehouse Inmon (2005: 29) mengungkapkan karakteristik yang dimiliki oleh data warehouse yaitu subject-oriented, integrated, non-volatile, dan time-variant. Berikut ini adalah karakteristik data warehouse: a. Subject oriented Data Warehouse berorientasi subjek artinya data warehouse digunakan untuk menganalisis data berdasarkan subjek tertentu dalam organisasi seperti yang terlihat dalam gambar 2.1, yang memudahkan user untuk pengambilan keputusan.
10
Gambar 2.1
Karakteristik Data Warehouse: Subject Oriented (Sumber: Inmon, 2005: 30)
b. Integrated Data Warehouse bersifat terintegrasi artinya data warehouse menyimpan data dari berbagai sumber yang berbeda dan disimpan ke dalam suatu format yang konsisten, dan data tersebut terintegrasi satu sama lain seperti yang terlihat dalam gambar 2.2. Sumber data dapat diintegrasi dengan berbagai cara seperti konsisten dalam penamaan dan ukuran variabel, struktur coding, dan atribut fisik data.
11
Gambar 2.2
Karakteristik Data Warehouse: Integrated (Sumber: Inmon, 2005: 31)
c.
Non Volatile Data Warehouse bersifat non volatile yaitu data di dalam data warehouse tidak mengalami perubahan seperti yang terlihat dalam gambar 2.3. Berbeda dengan database operasional yang memiliki tiga kegiatan operasi, yaitu insert, update, dan delete, sedangkan pada data warehouse hanya memiliki dua kegiatan yaitu loading dan akses data.
12
Gambar 2.3
Karakteristik Data Warehouse: Non volatile (Sumber: Inmon, 2005: 32)
d.
Time Variant Data Warehouse bersifat time variant yaitu data di dalam data warehouse selalu akurat hanya dalam periode tertentu seperti yang terlihat dalam gambar 2.4. Dalam satu sisi, sebuah record dalam database memiliki waktu yang telah ditetapkan secara langsung. Di sisi lain, sebuah record mempunyai waktu transaksi. Dalam setiap lingkungan, baik operasional maupun data warehouse, memiliki time horizon. Time horizon merupakan sebuah parameter waktu yang ditunjukkan dalam lingkungan tersebut. Batas waktu pada data warehouse lebih lama daripada sistem operasional. Karena perbedaan batas waktu, maka data warehouse mempunyai lebih banyak data historis. Selain itu, data pada data warehouse memiliki dimensi waktu sehingga data pada data warehouse akurat selama periode waktu tertentu dan digunakan untuk mempelajari trend.
13
Gambar 2.4
Karakteristik Data Warehouse: Time Variant (Sumber: Inmon, 2005: 32)
2.1.7 Struktur Data Warehouse Pada gambar 2.5, menurut Inmon (2005: 33) menjelaskan level detail dalam lingkungan data warehouse, dikategorikan ke dalam empat level, yaitu older level of detail, current level of detail, lightly summarized data, dan level of highly summarized data. Apabila data dalam data warehouse semakin lama maka data tersebut akan berpindah dari current level of detail ke older level of detail. Apabila data di rangkum maka data tersebut akan berpindah dari current level of detail ke lightly summarized data kemudian dari lightly summarized data ke highly summarized data.
Gambar 2.5 Struktur Data Warehouse (Sumber: Inmon, 2005: 34)
14 2.1.8 Denormalisasi Inmon (2005: 494) menjelaskan bahwa denormalisasi adalah teknik penempatan data normalisasi dalam lokasi fisik yang bertujuan untuk mengoptimalkan kinerja sistem. Denormalisasi digunakan untuk mengurangi penggabungan jumlah tabel yang diproses dalam query, sehingga dapat meningkatkan kinerja.
2.1.9
Skema Bintang Skema bintang atau star schema merupakan salah satu konsep pemodelan data warehouse. Connolly & Begg (2010: 1227) menjelaskan skema bintang adalah struktur logika yang memiliki tabel fakta sebagai pusatnya dan dikelilingi oleh tabel dimensi yang yang dapat didenormalisasi yang terlihat dalam gambar 2.6.
Gambar 2.6 Skema Bintang (Sumber, Connolly & Begg, 2010: 1228)
15 2.1.10 Tipe Tabel Skema Bintang Dibawah ini akan dijelaskan beberapa tipe tabel skema bintang, sebagai berikut: 1. Fact Table Connolly & Begg (2010: 1227) mengemukakan tabel fakta merupakan suatu tabel dengan gabungan primary key yang dapat dilihat dalam gambar 2.7.
Gambar 2.7 Tabel Fakta (Sumber Connolly & Begg, 2010: .1228 ) 2. Dimension Table Menurut Inmon (2005: 128) tabel dimensi merupakan tempat dimana data dihubungkan dengan fact table dan keduanya diletakkan pada tabel multidimensi. Connolly & Begg (2010: 1227) mengemukakan bahwa yang disebut tabel dimensi pada gambar 2.8 adalah suatu set dari tabel yang lebih kecil.
Gambar 2.8 Tabel Dimensi (Sumber Connolly & Begg, 2010: 1228 )
16 2.1.11 Snowflake Schema Connolly & Begg (2010: 1229) menjelaskan bahwa snowflake schema adalah sebuah model data dimensional yang memiliki tabel fakta pada pusatnya dan dikelilingi oleh tabel dimensi yang sudah di normalisasi, yang dapat dilihat dalam gambar 2.9.
Gambar 2.9 Snowflake Schema (Sumber Connolly & Begg, 2010: 1229)
2.1.12 Starflake Schema Connolly & Begg (2010: 1230) menjelaskan bahwa starflake schema merupakan sebuah struktur hybrid yang berisi gabungan dari star schema dan snowflake schema yang dapat di lihat pada gambar 2.10.
Gambar 2.10 Starflake Schema (Sumber Mishra, Yazici, & Başaran, 2009: 83)
17 2.1.13 Kekurangan dan Kelebihan Konsep Pemodelan Data Warehouse Me nurut
Mishra, Yazici, & Başaran (2009: 85), tabel 2.1
merupakan perbandingan konsep pemodelan data warehouse sebagai berikut: Tabel 2.1 Kekurangan dan Kelebihan Konsep Pemodelan Data Warehouse
2.1.14
Star Schema
Starflake Schema
Snowflake Schema
Efficiency
Tinggi
Tinggi
Sedang
Usability
Tinggi
Sedang
Sedang
Reusability
Rendah
Rendah
Tinggi
Flexibility
Tinggi
Tinggi
Sedang
Redundancy
Tinggi
Tinggi
Rendah
Complexity
Rendah
Sedang
Sedang
Keuntungan Data Warehouse Menurut Connolly & Begg (2010: 1198), data warehouse yang telah diimplementasikan dengan baik dapat memberikan keuntungan bagi perusahaan, yaitu : 1.
Berpotensi mengembalikan nilai yang tinggi atas investasi yang dilakukan perusahaan. Suatu organisasi harus mengeluarkan uang dan sumber daya yang
cukup
besar
untuk
memastikan
diimplementasikan dengan baik.
data
warehouse
18
2.
Keuntungan kompetitif. Didapatkan jika pengambil keputusan mengakses data bahwa informasi yang sebelumnya tidak tersedia, tidak diketahui dan tidak dipergunakan misalnya informasi mengenai konsumen, trend, dan permintaan.
3. Meningkatkan
produktifitas
para
pengambil
keputusan
perusahaan. Data warehouse meningkatkan produktifitas para pengambil keputusan
perusahaan
dengan
membuat
database
yang
terintegrasi secara konsisten, berorientasi pada subjek, dan data historis.
2.1.15 Proses ETL (Extract - Transform - Load) Berdasarkan jurnal yang dibuat oleh Christian (2010: 105) ETL merupakan proses-proses dalam pengembangan data warehouse. Proses tersebut dapat di lihat dalam gambar 2.11.
Gambar 2.11
Proses pengembangan dan pemanfaatan data warehouse (Sumber Christian, 2010: 105)
2.1.15.1
Extraction Connolly & Begg (2010: 1208) menjelaskan bahwa extraction adalah sebuah tahap pengambilan data dari
19 sumbernya bagi EDW (Environment Data Warehouse), sumber tersebut terdiri dari database OLTP dan terdapat sumber lainnya, seperti database pribadi, data ERP, dan data penggunaan dari web. 2.1.15.2
Transformation Connolly & Begg (2010: 1208) menjelaskan bahwa transformation adalah tahap yang menggunakan beberapa rules atau function dari data yang sudah diambil untuk mengukur bagaimana data tersebut dapat digunakan untuk analisis, seperti penjualan data, encoding data penggabungan data pemisahan data penghitungan data, dan pembuatan surrogate keys.
2.1.15.3
Load Connolly & Begg (2010: 1209) menjelaskan bahwa loading pada data warehouse adalah tahap mememasukkan data yang sudah di transformasi ke dalam data warehouse.
2.1.16 Data Mart Connolly & Begg (2010: 1214) mengemukakan data mart merupakan subset dari data warehouse yang mendukung fungsi bisnis dan kebutuhan departemen tertentu.
2.1.17 OLTP (Online Transaction Processing) Menurut Connolly & Begg (2010: 1198), OLTP merupakan sebuah sistem yang di rancang untuk memaksimalkan kapasitas proses transaksi, yaitu data organisasi dari hasil operasinya seharihari.
20 2.1.18 Perbedaan Sistem OLTP dan Data Warehouse Connolly & Begg (2010: 1199) menjelaskan perbedaan antara sistem OLTP dan sistem data warehouse dapat dilihat dalam tabel 2.2. Tabel 2.2 Perbedaan sistem OLTP dan data warehouse (Sumber: Connolly & Begg, 2010: 1198) Karakteristik Main purpose
Sistem OLTP
Sistem Data Warehouse
Mendukung proses Mendukung proses analisis operasional
Data age
Current
Menangani data-data historis
Data latency
Real-time
Tergantung
pada
panjang
siklus untuk suplemen data warehouse
(tetapi
trend
menuju suplemen real-time) Data
Detailed data
Detail
data,
lightly,
dan
highly summarize data
granularity Data
High
level
processing
transaction
of Medium to low level of transaction throughput
throughput Reporting
Dapat
diprediksi, Tidak
one-dimensional, relatively
dapat
multidimensional,
diprediksi, dynamic
static reporting
fixed reporting Users
Melayani sejumlah Melayani
sebagian
kecil
pengguna
pengguna manajerial (tetapi
operasional
trend analisis
juga trend
operational)
mendukung dari
user
21 2.1.19 Online Analytical Processing (OLAP) Connolly & Begg (2010: 1250), OLAP adalah perpaduan dinamis antara analisis dan gabungan data multidimensional dalam jumlah besar. Kemudian Hoffer (2011: 414) menyatakan bahwa OLAP, merupakan sebuah tools grafis yang memberikan user dengan tampilan data multidimensional dan memungkinkan user untuk menganalisis data menggunakan teknik presentasi yang sederhana.
2.1.20 Arsitektur Data Warehouse
Gambar 2.12 Independent Data Mart Architecture (Sumber: Ariyanchandra & Watson, 2006: 5)
22 Pada gambar 2.12, Ariyanchandra & Watson (2006: 5) menjelaskan terdapat beberapa arsitektur data warehouse: 1. Independent Data Marts Architecture Data yang diambil dari sistem operasional akan dimasukkan ke staging area, lalu data akan di ringkas terlebih dahulu dalam independent data mart sebelum di tampilkan ke aplikasi end user. 2. Data Mart Bus Architecture with Linked Dimensional Data Marts menurut Kimball Data yang diambil dari beberapa sistem operasional akan dimasukkan ke staging area, dimensional data mart dikaitkan pada conformed dimensions untuk di ringkas, lalu dapat di tampilkan ke aplikasi end user. Keuntungan arsitektur ini merupakan efisien karena tidak perlu melakukan sinkronisasi perubahan ke dimensi waktu dan konsistensi daa tinggi sehingga mudah dimengerti. Selain itu kerugiannya yaitu membuthkan biaya besar dalam membangun data mart. 3. Hub and Spoke Architecture (Corporate Information Factory) menurut Inmon Data yang diambil dari sistem operasional akan dimasukkan ke staging area, lalu
data akan di normalisasi
sebelum di
tampilkan ke aplikasi end user dalam bentuk yang ringkas, jika terjadi perkembangan pada perusahaan maka akan dipindahkan atau dibuatkan data marts yang baru. Keuntungan arsitektur ini merupakan memberikan kemudahan dalam pembaharuan tampilan dan laporan. Selain itu kerugiannya yaitu biaya database administrator dan operasional yang relatif mahal dan membutuhkan biaya yang relatif besar untuk membangun data mart. 4. Centralized Data Warehouse Architecture Data yang diambil dari beberapa sistem operasional akan dimasukkan ke staging area, lalu sebagian data akan di ringkas ke
23 dalam bentuk yang telah di normalisasi sebelum di tampilkan ke aplikasi end user. Keuntungannya yaitu konsistensi rancangan dan kualitas data yang baik dan kekurangannya yaitu membutuhkan kepemimpinan perusahaan dan visi atau tujuan 5. Federated Architecture Data warehouse, data mart, dan sistem akan di integrasi secara logikal atau fisikal dari elemen data yang umum sebelum di tampilkan pada aplikasi end user. Keuntuntungan arsitektur ini yaitu tidak diperlukan proses ETL dan platform yang berbeda. Selain itu kekurangannya yaitu hanya dapat berjalan pada volume kecil. Arsitektur data warehouse yang digunakan pada CV. Gilang Gemilang yaitu independent data mart architecture karena pada arsitektur ini memungkinkan data mart yang dapat di ringkas secara independent, mudah diterapkan didalam organisasi dan operasional mudah diterapkan.
2.1.21 Metodologi Perancangan Data Warehouse Pada proses independent data mart dalam arsitektur data warehouse, metodologi yang digunakan yaitu nine step methodology. Menurut Kimball & Ross (2010: 210) menjelaskan terdapat sembilan langkah dalam perancangan data warehouse, yaitu: 2.1.21.1 Choose the Process (Memilih Proses) Memilih proses atau menentukan subjek utama, yang menjelaskan suatu aktifitas bisnis yang dapat menjawab
pertanyaan-pertanyaan
bisnis
diketahui serta memiliki ciri-ciri tertentu.
yang
ingin
24 2.1.21.2
Choose the Grain (Memilih Grain) Memilih grain yaitu menentukan apa yang akan dijelaskan atau direpresentasikan dalam tabel fakta. Setelah menentukan grain dari tabel fakta, maka dapat ditentukan tabel-tabel dimensi yang berhubungan dengan tabel fakta tersebut.
2.1.21.3 Identify and Conform the Dimensions (Mengidentifikasi dan Menyesuaikan Dimensi) Mengidentifikasi
dan
menghubungkan
tabel
dimensi dengan tabel fakta. Dimensi merupakan kumpulan sudut pandang yang berbeda untuk menggambarkan faktafakta yang ada pada tabel fakta. 2.1.21.4
Choose the Facts (Memilih Fakta) Grain dari suatu tabel fakta menentukan faktafakta yang dapat digunakan. Serta menentukan pengukuran yang dibutuhkan pada tabel fakta.
2.1.21.5 Store Precalculations in the Fact Table (Menyimpan PreCalculation di Tabel Fakta) Ketika tabel fakta telah ditentukan, maka harus dilakukan pengujian apakah pada tabel fakta tersebut dapat melakukan
pre-kalkulasi,
setelah
itu
melakukan
penyimpanan pada tabel fakta untuk meningkatkan performance hasil query. 2.1.21.6 Round Out the Dimension Tables (Melengkapi Tabel Dimensi) Mendeskripsikan atribut pada tabel dimensi. Tabel dimensi diberi keterangan yang lengkap dan mudah dipahami oleh user.
25 2.1.21.7 Choose the Durations of the Database (Memilih Durasi Database) Menentukan durasi atau periode waktu dari datadata yang akan digambarkan dalam tabel fakta dan yang akan dimasukan ke dalam data warehouse. 2.1.21.8 Determine
the
Need
to
Track
Slowly
Changing
Dimensions (Menentukan Kebutuhan untuk Melacak Perubahan dari Dimensi secara Perlahan) Data warehouse harus menetapkan key yang digeneralisasi
pada
dimensi
dengan
tujuan
untuk
menghilangkan snapshot yang berulang dari pelanggan dan produk selama rentang waktu tersebut. 2.1.21.9 Decide the Physical Design (Menetapkan Rancangan Fisik) Pada tahap ini, mengurutkan tabel fakta dalam media penyimpanan, serta menampilkan summary dan agregasi yang telah ditentukan sebelumnya. Selain itu, menentukan masalah yang mungkin ada pada physical design seperti administrasi, backup, indexing, dan security.
2.1.22 Entity Relationship Diagram (ERD) Berdasarkan jurnal yang dibuat oleh Brady & Loonam (2010: 232) mengemukakan bahwa Entity Relationship diagram (ERD) merupakan teknik yang digunakan untuk memodelkan kebutuhan data dari suatu organisasi, biasanya oleh System Analyst dalam tahap analisis persyaratan proyek pengembangan system. Sementara seolah-olah teknik diagram yang memberikan dasar untuk desain database relasional yang mendasari sistem informasi yang dikembangkan. ERD bersama-sama dengan detail pendukung merupakan model data yang pada gilirannya digunakan sebagai spesifikasi untuk database.
26 2.1.23 Data Flow Diagram (DFD) Berdasarkan jurnal yang dibuat oleh Adelia & Setiawan (2011: 116) mengemukakan bahwa data flow diagram adalah suatu grafik yang menjelaskan sebuah sistem dengan menggunakan bentuk-bentuk dan simbolsimbol untuk menggambarkan aliran data dari proses-proses yang saling berhubungan. Data flow diagram ini adalah salah satu alat pembuatan model yang sering digunakan, khususnya bila fungsi-fungsi sistem merupakan bagian yang lebih penting dan kompleks dari pada data yang dimanipulasi oleh sistem.
2.2
Teori Khusus Berikut ini merupakan teori khusus yang berkaitan dengan topik yang dibahas, yaitu sebagai berikut: 2.2.1 Analisis dan Perancangan Berikut ini merupakan analisis dan perancangan dalam topik yang dibahas, yaitu sebagai berikut:
2.2.1.3 Pengertian Logistik Menurut Ghiani (2013: 1) menjelaskan bahwa logistik adalah disiplin yang mempelajari aktifitas fungsional untuk menentukan aliran material (dan informasi relatif) dalam suatu perusahaan, berasal dari pemasok hingga pengiriman produk jadi kepada pelanggan dan layanan pasca-penjualan.
27 2.2.1.4 Pengertian Perusahaan Jasa Menurut Anggawirya (2000: 100) menyebutkan bahwa terdapat beberapa kegiatan usaha perusahaan yaitu perusahaan jasa, dagang, dan industri. Dalam perusahaan penelitian ini merupakan kegiatan usaha perusahaan jasa. Perusahaan jasa adalah perusahaan yang menjual jasa pada konsumen, seperti bank perusahaan asuransi, kantor akuntan, dan lain-lain.
28