BAB I PENDAHULUAN
1.1 Latar Belakang Dewasa ini informasi merupakan hal yang sangat penting bagi suatu perusahaan atau organisasi dalam menentukan kebijakan-kebijakan strategis perusahaan terkait dengan perkembangan perusahaan ke arah yang lebih baik. Dalam rangka penyediaan informasi ini, banyak perusahaan maupun organisasi yang telah mengimplementasikan suatu sistem informasi basis data atau yang biasa disebut dengan DBMS (Database Management System). Dengan membuat sistem DBMS ini, perusahaan berharap untuk mendapatkan suatu informasi yang berkualitas, yang bisa digunakan dalam mendukung sistem pengambilan keputusan. Mahalnya sistem informasi yang terintegrasi dan juga karena kurangnya pengetahuan tentang pengembangan suatu sistem informasi DBMS menyebabkan banyak perusahaan ataupun organisasi membeli sistem informasi DBMS secara terpisah. Akibatnya akan terdapat multi sistem informasi yang sekaligus juga akan menyebabkan adanya multi sumber data. Dengan adanya multi sumber data, apalagi masing-masing sumber data tersebut ditulis dengan format DBMS yang berbedabeda akan memunculkan adanya potensi ketidak seragaman pada data. Ketidak seragaman data akibat dari penerapan sistem DBMS yang berbeda-beda dapat menimbulkan fenomena yang dikenal dengan spider web. Dalam fenomena spider web, penerapan sistem DBMS yang berbeda-beda dapat
1
2
menyebabkan permasalahan lack of credibility, problem with productivity, dan inability to transform data into information (Inmon, 2005:p.7). Dengan adanya permasalahan-permasalahan seperti yang telah disebutkan di atas maka diperlukan suatu konsepsi model pengolahan data yang mampu memberikan solusi data yang terintegrasi dengan format yang standar/seragam yang nantinya akan dapat menghasilkan informasi yang berkualitas yang dapat dipakai dalam pengambilan keputusan pada suatu perusahaan ataupun organisasi. Model data yang terintegrasi inilah yang dikenal dengan data warehouse (DWH). Data warehouse adalah suatu sistem yang mengambil, membersihkan, menyesuaikan, dan mengirimkan sumber data ke dalam penyimpanan data dimensional dan kemudian mendukung serta mengimplementasikan query dan analisis untuk tujuan pengambilan keputusan (Kimball, 2004:p.23). Inmon (2005:p.34) menjelaskan salah satu sifat dari data warehouse adalah time variant. Time variant disini menjelaskan bahwa data warehouse hanya bisa menyediakan data yang akurat pada suatu rentang waktu. Hal ini disebabkan karena pada data warehouse pembaruan data dilakukan secara periodik, tidak diperbarui setiap terjadi transaksi. Beberapa tahun yang lalu, data warehouse yang diperbarui secara periodik dalam suatu jangka waktu tertentu mungkin masih cukup mampu untuk memenuhi kebutuhan informasi dalam rangka menunjang sistem pengambilan keputusan pada suatu perusahaan atau organisasi. Akan tetapi, saat ini para pemakai data warehouse ingin melihat suatu data warehouse yang diperbarui setiap dua menit atau bahkan secara real time (Rainardi, 2008:p.27). Hal ini terkait dengan
3
perkembangan dunia bisnis yang dapat berubah dalam hitungan detik sehingga diperlukan data terbaru pada saat transaksi akan dilakukan. Hal inilah yang memunculkan konsep real time data warehouse. Pada saat implementasi real time data warehouse, dikarenakan ada beberapa hal yang harus dilakukan oleh proses Extract Transform Load (ETL) maka akan ada waktu tunggu (latency) (Technet, 2015). Dengan adanya waktu tunggu ini maka konsepsi realtime data warehouse lebih dikenal dengan istilah nearly real time data warehouse (NRTDWH). Waktu tunggu untuk konsepsi NRTDWH adalah kurang dari satu jam, biasanya antara 30 menit sampai dengan 10 menit (Rainardi, 2008:p270). Pembuatan NRTDWH ini dapat dilakukan dengan menggunakan metode change data capture (CDC).
CDC adalah kemampuan untuk mendeteksi
perubahan data yang terjadi pada sistem asal dan kemudian menangkap perubahanperubahan ini. Ada beberapa teknik dan teknologi yang dapat diterapkan untuk menangani proses CDC, diantaranya yaitu: (1) Transaction Log, (2) Trigger Method; (3) RDMS Replication (Bokade dkk, 2013). Pada penelitian ini akan dikembangkan model NRTDWH menggunakan metode change data capture berbasis transaction log. Setelah NRTDWH terbentuk maka biasanya akan dibangun suatu sistem penunjang keputusan (SPK) yang berfungsi untuk mengakses isi dari NRTDWH. Pembangunan sistem aplikasi ini akan sangat tergantung pada jenis DBMS yang dipakai untuk mengimplementasikan NRTDWH. Sebagai contoh, jika NRTDWH dikembangkan dengan DBMS MySQL maka SPK yang dikembangkan harus
4
berbasis DBMS MySQL. Disamping itu juga, jika terjadi perubahan struktur data pada sisi NRTDWH maka hal ini akan mempengaruhi aplikasi SPK yang dijalankan oleh end user. Hal ini akan memunculkan ketergantungan terhadap DBMS dari NRTDWH. Untuk mengantisipasi kebutuhan akses informasi oleh end user application yang berbeda-beda serta untuk mengantipasi ketergantungan terhadap jenis DBMS dari NRTDWH maka pada penelitian ini akan dikembangkan model distribusi dengan menggunakan pendekatan service oriented architecture (SOA). Implementasi model SOA dalam penelitian ini adalah dalam bentuk web services. Dengan penerapan model SOA ini maka diharapkan layanan penyediaan informasi dari NRTDWH akan memiliki skalabilitas dan modularitas yang lebih baik dibandingkan dengan model pengaksesan informasi tradisional seperti client-server (Cristian, 2010). Skalabilitas disini terkait dengan penerapan SOA sehingga NRTDWH dimungkinkan untuk dapat diakses oleh end user application yang berbeda-beda yang independen terhadap DBMS dari NRTDWH. Sedangkan modularitas disini terkait dengan pengembangan layanan-layanan untuk pengaksesan informasi pada NRTDWH dalam bentuk modul-modul (services). Dengan penerapan model SOA, penambahan dan pengurangan services menjadi sangat mudah untuk dilakukan tanpa mempengaruhi unjuk kerja sistem yang sedang berjalan. Konsep modularitas ini juga membuat end user application dapat memilih service-service mana saja yang akan mereka implementasikan untuk mendapatkan informasi yang mereka butuhkan dalam menunjang pengambilan keputusan.
5
Dari penelusuran kajian pustaka yang telah dilakukan, ditemukan satu penelitian yang dilakukan oleh Cristian (2010) yang membahas pemodelan data warehouse dengan service oriented architecture untuk menunjang sistem informasi eksekutif. Penelitian ini terbatas pada model data warehouse tradisional bukan model real time data warehouse. Pada usulan penelitian ini penulis akan mencoba untuk mengintegrasikan pemodelan nearly real time data warehouse dengan service oriented architecture berbasis web services untuk menunjang sistem informasi retail. Penelitian ini diharapkan akan menghasilkan model NRTDWH yang mampu menyediakan informasi yang paling terkini yang dapat diakses dari mana saja oleh end user application yang berbeda-beda. 1.2 Rumusan Masalah Dari uraian pada latar belakang maka terdapat beberapa rumusan masalah sebagai berikut: 1. Bagaimana membuat model nearly real time data warehouse menggunakan metode change data capture berbasis transaction log pada aplikasi sistem informasi retail? 2. Bagaimana mengintegrasikan pemodelan nearly real time data warehouse dengan service oriented architecture berbasis web service untuk menunjang sistem informasi retail?
6
1.3 Tujuan Penelitian Tujuan dari penelitian ini adalah sebagai berikut: 1. Untuk menghasilkan model nearly real time data warehouse menggunakan metode change data capture berbasis transaction log pada aplikasi sistem informasi retail. 2. Untuk mendapatkan model nearly real time data warehouse yang terintegrasi dengan service oriented architecture berbasis web service untuk menunjang sistem informasi retail. 1.4 Manfaat Penelitian Manfaat yang diharapkan dari penelitian ini adalah: 1. Manfaat Akademis Hasil pengintegrasian antara model NRTDWH dengan SOA berbasis web service pada penelitian ini diharapkan dapat memberikan alternatif solusi dalam pengembangan traditional data warehouse,
misalnya dengan menerapkan
metode CDC berbasis transaction log untuk mengurangi waktu yang dibutuhkan oleh proses ETL dan mengintegrasikan model SOA dengan traditional data warehouse untuk mempermudah sisi pengembangan end user application sehingga tidak tergantung kepada jenis DBMS dari data warehouse. 2. Manfaat Praktis Hasil pengintegrasian antara model NRTDWH dengan SOA berbasis web service pada penelitian ini diharapkan dapat menghasilkan suatu data warehouse yang mampu untuk menyediakan informasi terkini, yang setiap saat akan diperbarui jika terjadi perubahan data pada sistem sumber, yang akan dapat
7
diakses oleh berbagai end user application yang berbeda-beda tanpa dipengaruhi lagi oleh ketergantungan terhadap jenis DBMS dari NRTDWH. Dengan tersedianya informasi terkini yang bisa diakses dari mana saja ini maka diharapkan para pengguna informasi dapat mengambil keputusan secara cepat, tepat, dan akurat dalam menyikapi perubahan yang terjadi sehingga hal ini dapat meningkatkan tingkat keuntungan dari usaha retail, khususnya di bagian penjualan. 1.5 Ruang Lingkup Penelitian Ruang lingkup penelitian ini mencakup hal-hal pokok sebagai berikut: 1. Pemodelan tabel dimensi dan tabel fakta dengan menggunakan star schema untuk membuat data warehouse. 2. Pembuatan model CDC berbasis transaction log untuk menangkap perubahan data yang terjadi pada source system dan kemudian mengirimkan perubahan tersebut ke data warehouse sehingga terwujud NRTDWH. 3. Pemodelan NRTDWH pada penelitian ini menggunakan bahasa pemrograman T-SQL. 4. Penerapan model NRTDWH ini dilakukan dengan menggunakan aplikasi uji berupa Sistem Informasi Retail khususnya di bagian penjualan (Point of Sales). 5. Pembuatan aplikasi web service yang akan berfungsi sebagai middleware antara NRTDWH dengan end user application. Aplikasi web service dibuat dengan dengan memanfaatkan bahasa pemrograman PHP dan library NuSOAP. 6. Pengujian integrasi NRTDWH dengan SOA berbasis web service dilakukan dengan menggunakan aplikasi web service client yang dibuat dengan beberapa
8
platform bahasa pemrograman yang berbeda seperti PHP, MS VISUAL BASIC .NET, dan J2ME. 7. Pengujian yang dilakukan pada penelitian ini hanya uji fungsionalitas saja. Pengujian ini dilakukan dengan model jaringan client server yang diimplementasikan pada satu komputer. Server-server yang digunakan adalah virtual server yang dibuat dengan fasilitas multiple instance dari MS SQL Server 2008 R2. Untuk virtual web server digunakan web server Apache. 1.6 Keaslian Penelitian Beberapa penelitian yang berkaitan dengan pengembangan model untuk NRTDWH telah dilakukan, diantaranya penelitian yang dilakukan oleh Ni Wayan Wisswani, dkk, (2012) yang melakukan pemodelan change data capture untuk nearly real time data warehouse dengan meletakkan trigger pada sisi On Line Transactional Processing (OLTP), sementara itu Mayuri B Bokade, dkk, (2013) melakukan penelitian yang membahas tentang framework dari change data capture berdasarkan pada transaction log file dari suatu basis data dan proses ekstraksi data pada real time data warehouse. Joko Cristian (2010) melakukan penelitian tentang pembuatan model data warehouse dengan menggunakan metode service oriented architecture untuk menunjang sistem informasi eksekutif pada Universitas Budi Luhur. Penelitian tentang SOA juga telah banyak dilakukan, diantaranya penelitian Kunjal B. Mankad dan Priti S. Sajja, (2010) yang membahas bagaimana arsitektur Procedural Developments, Structured Design, Client Server Technology, Transaction Processing, Component Oriented N tier, World Wide Web, Object
9
Oriented Architecture telah berhasil membuktikan bahwa mereka sudah mampu memberikan keuntungan dalam perancangan suatu perangkat lunak tertentu. Akan tetapi disaat yang bersamaan mereka kurang efisien untuk memenuhi kebutuhan yang cepat dalam penyediaan beberapa aplikasi seperti aplikasi terintegrasi. Dalam penelitian ini dijelaskan bahwa arsitektur SOA mampu memberikan solusi terhadap kekurangan dari arsitektur seperti yang telah disebutkan sebelumnya. Pada penelitian ini penulis akan mencoba mengintegrasikan pemodelan nearly real time data warehouse dengan service oriented architecture berbasis web services untuk menunjang sistem informasi retail. Untuk lebih jelasnya pemetaan dari penelitian yang penulis lakukan terhadap penelitian-penelitian lain yang terkait dapat dilihat pada tabel 1.1: Tabel 1.1 Tabel Pemetaan Keaslian Penelitian Area Penelitian No
1 2 3 4
5
Judul Penelitian Model Data Warehouse dengan Service Oriented Architecture untuk Menunjang Sistem Informasi Eksekutif Utilization of Web Services for Service Oriented Architecture Change Data Capture on OLTP Staging Area for Nearly Real Time Data Warehouse base on Database Trigger Framework Of Change Data Capture And Real Time Data Warehouse Pemodelan Integrasi Nearly Real Time Data Warehouse dengan Service-OrientedArchitecture untuk Menunjang Sistem Informasi Retail
Tahun
DWH
NRT
SOA
2010
√
X
√
2010
X
X
√
2012
√
√
X
2013
√
√
X
2015
√
√
√
10
Dari isi tabel 1.1 terlihat bahwa keaslian dari penelitian yang penulis lakukan ini adalah belum ada yang menggabungkan antara model NRTDWH dengan model SOA berbasis web service untuk menunjang sistem informasi retail. Gambar yang lebih detail, sampai pada metode-metode yang penulis gunakan dalam penelitian ini dapat dilihat melalui diagram fishbone pada gambar 1.1:
Model SOA
NRTDWH
UDDI
Column TimeStamp
WSDL JSON REST
Change Tracking Change Data Capture
SOAP
Integrasi NRTDWH dengan SOA
NRTDWH-SOA DWH-SOA SOA NRTDWH
Transaction Log
Database Triggers RDBMS Replication
DWH DWH dan SOA
Teknik Change Data Capture
Gambar 1.1 Diagram Fishbone Integrasi NRTDWH dengan SOA