BAB 2 LANDASAN TEORI 2.1 Teori–teori Dasar/Umum 2.1.1 Pengertian Data Menurut Turban (2005, p38), data adalah deskripsi dasar dari suatu kejadian, aktivitas, dan transaksi yang ditangkap, direkap, dikelompokkan dan disimpan namun tidak terorganisir untuk menyampaikan suatu arti tertentu. Menurut Inmon (2005, p388), data adalah pengumpulan berdasarkan fakta, konsep, dan instruksi yang disimpan dalam media penyimpanan, digunakan untuk komunikasi dan diproses menjadi informasi sehingga dapat dimengerti oleh manusia (user). Menurut O’Brien (2006, p696), data adalah kumpulan fakta atau hasil observasi mengenai fenomena fisik atau transaksi bisnis. Lebih khusus lagi, data adalah ukuran objektif dari atribut (karakteristik) dan entitas seperti manusia, tempat, benda atau kejadian. Berdasarkan definisi di atas, dapat disimpulkan bahwa data adalah kumpulan fakta mengenai kejadian, aktivitas, dan transaksi namun tidak memberikan informasi tertentu bagi manusia (user) karena belum dilakukan pemrosesan terhadap data tersebut.
9
10
2.1.2 Pengertian Sistem Menurut Satzinger (2005, p6), sistem sebagai sekumpulan komponen yang saling terkait secara bersamaan memiliki tujuan mencapai hasil tertentu. Menurut Williams dan Sawyer yang diterjemahkan oleh Rahayu, N.W. Prabawati T.A. (2007, p510), mendefinisikan sistem sebagai berikut: “Sistem merupakan kumpulan dari komponen-komponen yang berhubungan dan saling berinteraksi untuk melakukan suatu tugas guna mencapai sebuah tujuan. Dengan memahami aktivitas-aktivitas yang
dilakukan oleh sistem, programmer dapat mencari cara yang
lebih bagus untuk mencapai suatu tujuan” Menurut Philip Kotler (2006, p57), sistem adalah sebuah elemen yang sangat penting keberadaannya dalam perusahaan dan berperan penting bagi bisnis perusahaan , dimana elemen ini merupakan gabungan dari beberapa elemen yang berkolaborasi antara satu sama lain. Berdasarkan definisi diatas dapat disimpulkan bahwa sistem merupakan sekumpulan komponen yang saling terkait satu sama lain dan memiliki peranan penting dalam perusahaan suatu tujuan tertentu.
untuk mencapai
11
2.1.3 Pengertian Informasi Menurut Turban (2008, p5), informasi mengacu pada data yang telah terorganisir sehingga informasi tersebut memiliki makna dan nilai kepada penerima informasi. Menurut Inmon(2005,p391), informasi adalah data yang telah dipilih dan dievaluasi oleh manusia untuk dapat menyelesaikan masalah atau mengambil keputusan (decision making). Menurut Kelly (2006, p3), informasi adalah sekumpulan data yang telah diolah dan melalui sebuah proses di dalamnya sehingga yang pada awalnya tidak memiliki nilai (value) apa-apa kemudian berubah memiliki nilai yang terkandung di dalamnya dan nilai tersebut memiliki arti bagi penerimanya. Berdasarkan definisi di atas, dapat disimpulkan bahwa informasi adalah data yang telah terorganisir sehingga memiliki makna dan nilai bagi penerima informasi.
2.1.4 Pengertian Sistem Informasi Menurut Satzinger (2005, p7), sistem informasi adalah sekumpulan komponen terkait yang mengumpulkan, memproses, menyimpan, dan menyediakan hasil (output) dari informasi yang dibutuhkan untuk menyelesaikan tugas bisnis. Menurut Turban (2008, p8), sistem informasi adalah proses mengumpulkan,
memproses,
menyimpan,
menyebarkan informasi untuk tujuan tertentu.
menganalisis,
dan
12
Menurut Rainer (2011, p38-40), sistem informasi adalah sebuah kerja sama dan kolaborasi antara beberapa komponen yang ada agar dapat berkerja secara bersamaan dan sinergi untuk dapat menghasilkan beberapa tindakan yang terdiri dari mengumpulkan, memproses, menyimpan, menganalisis, dan menyebarkan informasi yang ada dengan tujuan yang sudah ditetapkan sebelumnya.Rainer juga mengutarakan bahwa dalam sistem informasi terdapat beberapa komponen vital atau utama yang bergerak di dalamnya antara lain sebagai berikut : •
Hardware adalah sekumpulan perangkat keras (hardware) yang digunakan untuk menerima data dan informasi, memprosesnya, dan menampilkannya kembali.
•
Software adalah sekumpulan program yang dapat memberikan perintah kepada perangkat keras (hardware) yang ada untuk melakukan pemprosesan data.
•
Database adalah basis data yang berisikan sekumpulan file atau tabel yang saling berhubungan antara satu sama lain dan di dalamnya berisikan data tersebut.
•
Network adalah sebuah system penghubung yang dapat menggunakan kabel (wireline) atau tidak menggunakan kabel sama sekali (wireless) yang memiliki peranan penting dalam menghubungkan beberapa
13
komputer berbeda agar dapat berbagi sumber daya yang dimiliki oleh satu sama lain. •
Procedures adalah sebuah instruksi, aturan, dan prosedur yang berisikan bagaimana cara untuk menggabungkan komponen-komponen di atas dalam rangka melakukan kegiatan pemprosesan informasi dan menghasilkan apa yang dibutuhkan.
•
People Adalah sumber daya manusia (SDM) yang akan mengoperasikan perangkat keras (hardware) dan perangkat lunak (software), saling berhubungan satu sama lain dan menggunakan hasil pemprosesan tersebut. Berdasarkan definisi di atas, dapat disimpulkan bahwa sistem
informasi terdiri dari beberapa proses penting yakni : pengumpulan data, transformasi data, penyimpanan data, dan penyebaran data.
2.1.5 Database 2.1.5.1
Pengertian Database Menurut Connolly dan Begg (2010, p65), database
adalah kumpulan data yang saling berhubungan satu sama lain yang digunakan secara bersamaan, dan kumpulan data ini didesain
untuk
memenuhi
kebutuhan
informasi
suatu
perusahaan. Menurut
W.H
Inmon
(2005,
p493),
database
merupakan kumpulan data-data yang saling berhubungan yang
14
tersimpan (biasanya dengan redudansi yang terkendali dan terbatas)berdasarkan suatu skema tertentu.Database dapat digunakan untuk aplikasi tunggal maupun ganda. Menurut Kelly (2006, p15), database adalah basis data yang berisikan sekumpulan file atau tabel yang saling berkaitan dan di dalamnya berisikan data. Berdasarkan definisi di atas dapat disimpulkan bahwa databaseadalah kumpulan data dalam bentuk file atau tabel yang saling berhubungan, tersimpan berdasarkan skema tertentu, dan digunakan
untuk
memenuhi
kebutuhan
informasi
suatu
perusahaan.
2.1.5.2
Database Language Di dalam sebuah aplikasi basis data memiliki
ketentuan-ketentuanyang berlaku dan harus diperhatikan oleh pengguna (user), serta perancangan juga harus memperhatikan penggunaan bahasa dalam sistem basis data.
2.1.5.2.1
Data Definition Language (DDL) Menurut Connolly dan Begg (2010,p92), Data
Definition Language (DDL) didefinisikan sebagai bahasa yang memungkinkan database administrator untuk menambahkan dan menamakan entitas, atribut, dan hubungan yang dibutuhkan dalam aplikasi, terkait dengan integritas dan kendala keamanan dari aplikasi.
15
2.1.5.2.2
Data Manipulation Language (DML) Menurut Connolly dan Begg (2010, p92), Data
Manipulation Language (DML) didefinisikan sebagai bahasa yang menyediakan suatu fungsi agar dapat memanipulasi datadata yang terdapat di dalam sebuah database.
2.1.5.3
Pengertian DBMS (Database Management System) Menurut Connolly dan Begg (2010, p66), “Database
Management System (DBMS) is a software system that enables users to define, create, maintain, and control access to the database”. Yang dapat diartikan bahwa DBMS adalah perangkat lunak (software) yang memungkinkan pengguna (user) untuk mendefinisikan, membuat, memelihara dan mengontrol akses terhadap database. Sebuah DBMS harus menyediakan fasilitas sebagai berikut : 1. Mampu mendifinisikan database, biasanya melalui Data DefinitionLanguage (DDL). DDL memungkinkan pengguna (user)untuk menentukan tipe data, struktur, dan batasan terhadap data yang akan disimpan ke dalam database. 2. Memungkinkan
pengguna
(user)
untuk
memasukkan
(insert), mengubah (update), menghapus (delete) dan mengambil (retrieve) data dari database, biasanya melalui Data Manipulation Language (DML). DML memungkinkan pengguna (user)untuk melakukan query.
16
3. Menyediakan hak akses ke database. Sebagi contoh DBMS dapat menyediakan : a. Sistem keamanan yang memungkinkan untuk mencegah user yang tidak berkepentingan untuk melakukan akses terhadap database. b. Sistem integrasi untuk menjaga konsistensi data yang tersimpan. c. Sistem kendali atau kontrol yang memungkinkan database dapat diakses secara bersamaan. d. Sistem pemulihan atau recovery yang memungkinkan untuk dapat mengembalikan keadaan database ke kondisi konsisten seperti semula jika terjadi kesalahan. e. Sebuah katalog yang bisa diakses oleh pengguna (user) yang di dalamnya terdapat deskripsi atau penjelasan dari data yang terdapat di dalam database.
2.1.5.3.1
Fungsi DBMS DBMS sangat bermanfaat bagi perusahaan dalam
menjalankan
proses
bisnisnya.
Dengan
adanya
DBMS
perusahaan diharapkan mampu bersaing dengan perusahaan lain pada era globalisasi seperti sekarang ini.Menurut Connolly dan Begg (2010, p99-p104) fungsi DBMS adalah sebagai berikut :
Penyimpanan, pengambilan, dan peng-update-an data
17
Sebuah
DBMS
harus
dapat
menyediakan
suatu
kemampuan/fitur untuk menyimpan, mengambil, dan mengupdate data bagi pengguna (user) dalam sebuah DBMS.
Katalog User-Accesible Sebuah DBMS harus menyediakan sebuah katalog yang menyimpan deskripsi tentang item data dan mudah diakses oleh pengguna (user).
Mendukung transaksi Sebuah DBMS harus menyediakan mekanisme yang memastikan setiap peng-update-an data dilakukan sesuai dengan transaksi yang diberikan.
Layanan kendali konkurensi Sebuah DBMS harus menyediakan sebuah mekanisme untuk memastikan bahwa basis data di-updatedengan benar ketika banyak pengguna (user) melakukan update basis data secara bersamaan.
Layanan Perbaikan Sebuah DBMS harus menyediakan sebuah mekanisme untuk memperbaiki basis data ketika sebuah basis data mengalami kerusakan (recovery).
Layanan Autorisasi Sebuah DBMS harus menyediakan sebuah mekanisme untuk memastikan bahwa pengguna (user) memiliki otoritas/hak untuk mengakses basis data.
Mendukung komunikasi data
18
Sebuah DBMS harus mampu diintegrasikan dengan perangkat lunak (software) komunikasi.
Layanan Integritas Sebuah DBMS harus mampu memastikan bahwa data di dalam basis data tersimpan dengan baik dan perubahan yang terjadi pada data harus mengikuti aturan tertentu yang telah ditetapkan.
Layanan peningkatan keterbatasan data Sebuah DBMS harus memasukkan sebuah fasilitas tambahan untuk mendukung keterbatasan program dari struktur basis data yang sebenarnya agar menjadi lebih lengkap.
Layanan Utilitas Sebuah DBMS harus dapat menyelesaikan seperangkat layanan
utilitas
yang
membantu
database
admin
mengelola basis data secara efektif. 2.1.5.3.2
Komponen DBMS DBMS merupakan sebuah aplikasi perangkat lunak
(software) yang tentunya
memiliki
komponen-komponen
penting di dalamnya agar menjadi satu kesatuan di dalam sebuah sistem. Menurut Connolly dan Begg (2010, p68-71), terdapat lima komponen yang sangat penting, yaitu : 1. Perangkat keras (Hardware)
19
DBMS dan aplikasinya membutuhkan perangkat keras (hardware) untuk dapat mengoperasikannya. Perangkat keras (hardware) tersebut dapat berupa PC, sebuah mainframe, dan jaringan komputer. Sedangkan, jenis perangkat
keras
tertentu
tergantung
pada
kebutuhan
organisasi dan DBMS yang digunakan. Beberapa DBMS hanya dapat bekerja pada perangkat keras atau sistem operasi tertentu. DBMS membutuhkan jumlah minimum dari main memory dan disk space untuk bekerja. 2. Perangkat Lunak (Software) Komponen perangkat lunak terdiri dari software DBMS itu sendiri dan program aplikasi yang dibutuhkan untuk menjalankan sistem, termasuk network software jika digunakan pada jaringan. Pada umumnya, program aplikasi ditulis dalam bahas pemprograman 3GL, seperti C, C++, Java, Visual Basic, Cobol, Fortran, Ada, atau Pascal, atau menggunakan 4GL, seperti SQL yang di- embed dalam generasi ketiga. 3. Data Komponen terpenting dalam DBMS, terutama dalam sudut pandang
end-user,
Data
berperan
sebagai
jembatan
antarakomponen mesin dan komponen manusia. Basis data memiliki data operasional dna metadata.
4. Prosedur
20
Merupakan instruksi atau aturan yang mengatur desain dan penggunaan basis data. Pengguna system dan staf yang mengatur basis data membutuhkan dokumentasi prosedur untuk menjalankan atau mengoperasikan sistem. Instruksiinstruksi tersebut, antara lain : o Log on pada DBMS o Menggunakan fasilitas DBMS tertentu atau aplikasi program o Memulai dan menghentikan DBMS o Membuat salinan backup dari basis data o Mengatasi kegagalan perangkat keras (hardware) dan perangkat lunak (software). Termasuk prosedur untuk mengidentifikasi
komponen
yang
gagal,
dan
mengembalikan basis data ke keadaan semula. o Mengubah struktur dari tabel, mengatur ulang basis data melalui multiple disks, meningkatkan performa, atau menyimpan data pada secondary storage.
5. Manusia Merupakan komponen yang terakhir yang terlibat dalam sistem. Terdapat lima tipe komponen manusia yang terlibat dalam
sistem,
Administrators,
yaitu
Data
Database
Developers, dan End users.
Administrators, Designers,
Database Application
21
2.1.6
Data Warehouse
2.1.6.1
Pengertian Data Warehouse Menurut Turban (2011, p52), data warehouse adalah
kumpulan data yang dihasilkan untuk mendukung proses pengambilan keputusan, tetapi juga dapat berfungsi sebagai tempat penyimpanan data saat ini dan historikal data yang potensial bagi manajer dalam organisasi. Menurut W.H Inmon (2005, p495) data warehouse merupakan
kumpulan
dari
database
yang
memiliki
sifat
berorientasi subjek, terintegrasi, yang dirancang untuk dapat mendukung pengambilan keputusan dalam organisasi, dimana tiap datanya berhubungan dengan suatu kejadian yang terjadi pada suatu waktu tertentu. Menurut Connolly dan Begg (2010,p1197), data warehouse adalah kumpulan data yang berorientasi subjek, terintegrasi, timevariant,dan non-volatile, yang mendukung proses pengambilan keputusan dalammanajemen. Berdasarkan teori di atas dapat disimpulkan, datawarehouse adalah adalah kumpulan dari database yang berorientasi subjek, terintegrasi, time-variant dan non-volatile, yang mendukung proses pengambilan keputusan.
22
2.1.6.2
Karakteristik Data Warehouse Menurut W.H Inmon (2005, p29), karakteristik dari data
warehouse adalah sebagai berikut a) Subject Oriented (Berorientasi Subjek) Data warehouse bersifat subject oriented artinya data warehouse digunakan untuk menganalisa data berdasarkan subjek-subjek tertentu dalam organisasi, bukan berorientasi pada
berbagai
aplikasi
tertentu,
yang
mempermudah
pengguna(user dalam melakukan pengambilan keputusan. Beberapa perbedaan antara data primitif (data operasional) dan data warehouse diantaranya sebagai berikut :
Tabel 2.1 Perbedaan antara Data Operasional dan Data Warehouse Data Operasional
Data Warehouse
Berorientasi pada aplikasi
Berorientasi subyek
Dapat berubah
Tidak dapat berubah
Dapat diakses oleh sebuah unit
Dapat diakses oleh sebuah set
dalam satu waktu
unit dalam satu waktu
Jumlah data yang diproses kecil
Jumlah data yang diproses besar
Tidak ada redudancy data
Ada redudancy data
Untuk komunitas karyawan
Untuk komunitas manajer
23
Gambar 2.1 Karakteristik Data Warehouse : Subject Oriented (Sumber : W.H Inmon, 2005, p30)
b) Integrated (Terintegrasi) Data warehouse bersifat integrated artinya data warehouse menyimpan data dari berbagai sumber
berbeda
yang disimpan ke dalam suatu format yang konsisten dan data tersebut terintegrasi satu sama lain, dimana data-data tersebut merupakan suatu kesatuan sehingga tidak dapat dipecah-pecah. Syarat integrasi sumber data dapat dipenuhi dengan berbagaicara seperti konsistensi dalam penamaan dan ukuran variabel, konsistendalam struktur pengkodean, dan konsisten dalam atribut fisik daridata.
24
Gambar 2.2 Karakteristik Data Warehouse : Integrated (Sumber : W.H Inmon, 2005, p31)
c) Non - volatile (Tidak dapat diubah) Data warehouse bersifat non volatile, artinya data warehousetidak dapat diubah. Pengguna (user) tidak dapat mengubah data warehouseyang sudah ada. Berbeda dengan database operasional yang memiliki tiga kegiatan operasi sepertiinsert, update, dan delete, data warehousehanya memiliki dua kegiatan yaitu loading dan akses data.
25
Gambar 2.3 Karakteristik Data Warehouse : Non volatile (Sumber : W.H Inmon, 2005, p32)
d) Time Variant Dalam OLTP, record yang ada merupakan record terbaru sebab OLTP tidak menyimpan record-record yang lama untuk mempercepat proses karena semakin sedikit data yang disimpan maka waktu pemrosesan data semakin cepat. Lain halnya dengan data warehouse yang berisi record-record yang bersifat historis dan dapat tetap berada dalam sistem untuk jangka waktu 5-10 tahun sehingga dapat digunakan sebagai bahan analisis pengambilan keputusan. Tetapi, record yang terlalu lama juga tidak efektif karena bisa memberikan hasil analisa yang kurang sesuai dengan trend di masa mendatang. Oleh karena itulah, data pada datawarehouse bersifat time variant atau akurat pada periode tertentu. Selain itu, data pada data warehouse dikatakan memilikiperbedaan/rentang waktu (time variance) karena data warehousejuga mempunyai dimensi waktu sehingga data warehouse akuratselama periode waktu tertentu dan dapat
26
digunakan untukmempelajari trend dan perubahan. Hal ini sangat berbeda dengan datapada OLTP, dimana data hanya akurat
untuk
waktu
sesaat
setelahdiakses.Aspek
yang
menunjukkan karakteristik time variant dalamdata warehouse adalah sebagai berikut : • Data warehouse merepresentasikan data untuk kurun waktu 5-10 tahun, sedangkan OLTP merepresentasikan data untuk jangka waktu yang lebih singkat, yaitu sekitar 60-90 hari. Karena aplikasi yang digunakan pada OLTP harus memiliki waktu respon yang singkat maka data yang diproses harus optimal. • Setiap struktur data pada data warehouse mengandung elemenwaktu seperti tahun, bulan, minggu, hari, dan sebagainya. • Data pada data warehouse merupakan serangkaian snapshot, yaitu potongan data yang dikelompokkan sesuai dengan urutan waktu.
Gambar 2.4 Karakteristik Data Warehouse : Time-variant (Sumber : W.H Inmon, 2005, p32)
27
2.1.6.3
Anatomi Data Warehouse Dalam menentukan bentuk dasar dari data warehouse yang
akan digunakan dalam perusahaan, terlebih dahulu kita harus mengetahui kebutuhan informasi yang diperlukan oleh perusahaan. Data warehouse terdiri atas tiga jenis dasar sistem, yaitu : 1. Data warehouse fungsional (Functional Data Warehouse) Data warehouse fungsional dibangun berdasarkan kebutuhan informasi dari tiap bagian fungsi bisnis perusahaan. Data warehouse fungsional merupakan pendekatan yang digunakan untuk membangun suatu sistem data warehouse dengan biaya investasi yang rendah. Keuntungan dari bentuk ini adalah sistem mudah dibangun dengan biaya yang relatif murah sedangkan kerugiannya adalah resiko kehilangan konsistensi
data
dan
terbatasnya
kemampuan
dalam
pengumpulan data bagi pengguna (user).
Gambar 2.5 Data Warehouse Fungsional (Sumber : http://zhang90.files.wordpress.com/2010/12/data-ware-house.ppt)
28
2. Data warehouse terpusat (Centralized Data Warehouse) Data warehouse terpusat dibangun dari data operasional yang dikumpulkan dalam pusat penyimpanan data yang digunakan oleh pengguna untuk membangun data warehouse fungsional masing-masing. Menurut W.H Inmon (2005, p193), kebanyakan organisasi membangun dan memelihara lingkungan data warehouse terpusat yang tunggal. Pengaturan ini masuk akal karena alasan sebagai berikut : a. Data di dalam data warehouse saling terintegrasi antar cabang perusahaan dengan pusat dan gambaran integrasi tersebut hanya terdapat pada kantor pusat. b. Perusahaan beroperasi pada model bisnis terpusat c. Volume dari data dalam data warehouse seperti tempat penyimpanan yang bersifat tunggal dan terpusat d. Sekalipun data dapat terintegrasi dan diedarkan antar area lokal yang beragam, data tersebut akan tidak praktis untuk diakses. Keuntungan dari bentuk ini adalah data benar-benar terpadu karena konsistensinya yang tinggi sedangkan kerugiannya adalah biaya yang mahal serta perlu waktu yang cukup lama dalam membangun bentuk ini.
29
Gambar 2.6 Data Warehouse Terpusat (Sumber :http://zhang90.files.wordpress.com/2010/12/data-ware-house.ppt)
3. Data warehouse terdistribusi (Distributed Data Warehouse) Perusahaan yang memiliki cabang tersebar di seluruh dunia membutuhkan informasi yang mencakup tidak hanya wilayah lokal saja tetapi juga wilayah global. Global data warehouse
membutuhkan
informasi
terpadu
dari
data
warehouse tempat infomasi dikumpulkan. Disamping itu, ada kebutuhan yang lain untuk data warehouse yang terpisah di setiap cabang perusahaan. Dalam kasus ini, menurut W.H Inmon (2005, p193), data warehouse terdistribusi dibutuhkan. Tiga tipe dari data warehouse terdistribusi : a. Data warehouse yang terdistribusi secara geografi terdiri dari data warehouse lokal dan data warehouse global.
30
b. Data warehouse yang terdistribusi dalam banyak prosesor, secara logis ada satu data warehouse tetapi secara fisiknya ada banyak data warehouse yang saling berhubungan. c. Data warehouse yang tumbuh dalam sumber yang tidak terkoordinasi. Keuntungan dari bentuk ini adalah kelebihan dalam mengakses data dari luar perusahaan yang telah mengalami sinkronisasi terlebih dahulu dan tetap terjaga konsistensinya, namun kerugian dari bentuk ini adalah bentuk yang paling mahal dan kompleks untuk diterapkan, karena sistem operasinya dikelola secara terpisah.
Gambar 2.7 Data Warehouse Terdistribusi (Sumber :http://zhang90.files.wordpress.com/2010/12/data-ware-house.ppt)
31
2.1.6.4
Arsitektur Data Warehouse Menurut Kimball dan Ross, arsitektur data warehouse
digambarkan sebagai berikut : Berdasarkan gambar arsitektur data warehouse di atas dijelaskan sebgaai berikut : 1. Program/Project Planning and Management Menurut Kimball dan Ross (2010, p98), kotak pertama pada roadmap berfokus pada memulai program/proyek yang dijalankan termasuk assessing readiness, justification, scooping, dan staffing. Pada seluruh daur hidup, program dan manajemen proyek yang terus menerus membuat aktivitas tetap pada jalurnya. Menurut Kimball dan Ross (2002, p334-337), perencanaan proyek terbagi menjadi lima kegiatan, yaitu : a. Assessing Readiness Sebelum bergerak maju dengan pengeluaran data warehouse yang signifikan, akan lebih bijaksana terlebih dahulu menilai kesiapan organisasi untuk melanjutkannya. Ada 5 faktor yang menjadi indikator kesiapan organisasi yaitu :
Sponsor bisnis yang kuat
Memiliki motivasi bisnis yang menarik dan kuat dalam membangun data warehouse.
Kelayakan
Hubungan bisnis dengan organisasi IT
Budaya analisis yang sekarang berjalan dalam perusahaan.
32
b. Scoping Setelah
organisasi
siap,
langkah
berikutmya
adalah
memberikan batasan disekitar proyek yang akan dilaksanakan. Scoping membutuhkan gabungan input yang baik dari organisasi IT maupun manajemen bisnis. Scope atau ruang lingkup dari data warehouse harus memiliki arti atau nilai bagi organisasi dan dapat diatur. c. Justification Justification memerlukan perkiraan keuntungan dan biaya terkait dengan data warehouse. IT biasanya bertanggung jawab dalam menentukan pengeluaran. Perkiraan biaya dibutuhkan untuk pengadaan hardware dan software. d. Staffing Proyek data warehouse membutuhkan integrasi dari tim cross – functional dengan sumber daya dari bisnus dan komunitas IT. Penugasan dari sumber daya manusia untuk mengisi peran tersebut tergantung pada besarnya dan cakupan dari proyek, maupun ketersediaan, kapasitas, dan pengalaman individu. e. Developing and Maintaining the Project Plan Mengembangkan suatu proyek data warehouse melibatkan pengidentifikasian setiap pekerjaan yang penting dalam mengimplementasikan data warehouse. Sumber daya tersebut banyak tersedia di pasar untuk membantu menyusun daftar pekerjaan proyek.
33
2. Business Requirements Definition Menurut Menurut Kimball dan Ross (2010:98), memunculkan kebutuhan bisnis merupakan tugas utama dalam Kimball Lifecycle karena temuan ini mendorong sebagian besar keputusan upstream dan downstream. Kebutuhan dikumpulkan untuk menentukan faktor kunci yang mempengaruhi bisnis dengan berfokus pada apa yang dilakukan oleh pengguna bisnis (atau apa yang akan dilakukan di masa mendatang), daripada bertanya “apa yang anda inginkan dalam data warehouse?” Kesempatan utama di seluruh perusahaan diidentifikasi, diberikan prioritas berdasarkan pada nilai
bisnis dan kelayakan, kemudian rincian kebutuhan
dikumpulkan untuk iterasi pertama dari pembangunan sistem DW/BI. Menurut Kimball dan Ross(2002:341-346), business requirement dapat terbagi menjadi tiga kegiatan, yaitu: a. Requirements Preplanning Sebelum
bertemu
dengan
komunitas
bisnis
untuk
mengumpulkan kebutuhan, sebaiknya dilakukan pembahasan secara produktif dengan mempertimbangkan hal-hal berikut: •
Choose the Forum Pengumpulan requirement pada saat menemui perwakilan pengguna bisnis sementara serta para pakar sistem dan ahli permasalahan yang ada. Langkah dua arah ini memberikan wawasan pada dua kebutuhan bisnis dalam hubungannya dengan kenyataan data.
34
•
Identify and Prepare the Requirements Team Pada tahap ini akan dilakukan pengidentifikasian dan persiapan anggota tim proyek yang akan terlibat.
•
Select, Schedule, and Prepare Business Representatives Pada tahap ini diperlukan berbicara pada pengusaha yang mewakili wawasan di seluruh organisasi secara horizontal. Cakupan ini sangat penting untuk memformulasi blue print pada data warehouse bus.
b. Collecting and Business Requirements Pada saat mengumpulkan kebutuhan bisnis biasanya proses berjalan mengalir dimulai dari perkenalan, pertanyaan secara terstruktur, sampai dengan penarikan kesimpulan (wrap up). •
Launch Tanggung jawab untuk melakukan wawancara harus dipersiapkan terlebih dahulu. Diharuskan berfokus pada tujuan proyek dan wawancara, tetapi tidak berbicara berlebihan tentang hardware, software, dan jargon-jargon teknis.
•
Interview Flow Tujuan dari wawancara adalah mendapatkan pengguna berbicara tentang apa yang mereka lakukan dan apa yang mereka inginkan. Mewawancarai orang yang memiliki pengalaman, terutama pada penanganan data sehingga memungkinkan mengerti tentang dimensionalitas dari bisnis.
35
•
Wrap – Up Menarik kesimpulan dengan bertanya pada narasumber tentang kriteria kesuksesannya pada proyek tersebut.
•
Conducting Data-Centric Interviews Selain memahami kebutuhan bisnis, kita perlu menyisihkan waktu untuk berbicara dengan ahli data pada sistem sumber atau ahli subjek untuk menilai kelayakan mendukung kebutuhan bisnis.
c. Postcollection Documentation and Follow-up Setelah
melakukan
wawancara,
pewawancara
harus
melakukan wawancara ulang. Hal ini untuk memastikan bahwa memiliki pemahaman yang sama. Selain itu, perlu dilakukan pemeriksaan laporan-laporan untuk mendapat pemahaman
lebih
tentang
dimensionalitas
yang
harus
didukung data warehouse. Prioritization and Consensus Setelah
berbagai
informasi
dan
dokumen
terkumpul,
dibutuhkan penetapan prioritas dari setiap requirement yang didapatkan dengan mempertimbangkan dampaknya bagi bisnis serta kelayakannya.
3. Technology Track Lingkungan DW/BI mewajibkan adanya integrasi dari banyak teknologi, penyimpanan data, dan metadata terkait. Technology track dimulai dari desain arsitektur sistem untuk menetapkan
36
daftar belanja dari kemampuan yang dibutuhkan, dilanjutkan dengan pemilihan dan instalasi produk untuk memenuhi kebutuhan arsitektur. Menurut Kimball dan Ross(2002:347-352), technology track dapat terbagi menjadi dua kegiatan, yaitu : a. Technical Architecture Design Technical Architecture Design merupakan blue print dari layanan teknis dan unsur-unsur data warehouse. Rencana arsitektur melayani sebagai framework pengorganisasian untuk mendukung integrasi teknologi. Arsitektur teknis terdiri dari serangkaian model yang mempelajari pada detail yang lebih besar mengenai setiap komponen utama. b. Product Selection and Installation Setelah menyusun perencanaan arsitektur, akan dilakukan pemilihan produk yang sesuai dengan framework yang direncanakan untuk menyampaikan fungsionalitas
yang
penting. Tugas dalam pemilihan produk biasanya berjalan dalam fase yang cepat karena sebagian besar konsep evaluasi dapat diterapkan pada setiap pilihan teknologi. 4. Data Track Menurut Kimball dan Ross (2010:98), data track dimulai dengan merancang sasaran dari model dimensional untuk memenuhi kebutuhan bisnis, dengan tetap mempertimbangkan data pokok yang sebenarnya.
37
Model dimensional diubah menjadi rancangan fisik saat strategi penyesuaian kinerja dipertimbangkan, lalu tantangan rancangan dan pembangunan sistem Extract, Transform, Load (ETL) ditangani. Menurut Kimball dan Ross (2002:353), data track
dapat
terbagi menjadi tiga kegiatan, yaitu : a. Dimensional Modelling Menurut Kimball dan Ross, (2010:211), dimensional modeling dapat dilakukan melalui sembilan langkah sebagai berikut: 1. Choose the process (memilih proses) Menurut Kimball dan Ross (2010:211), langkah pertama dalam dimensional modeling adalah pemilihan proses, dimana proses merupakan aktivitas operasional tertentu. Proses bisnis pada area subjek yang harus dipilih adalah yang paling bersentuhan dengan masalah keuangan. Proses yang dibuat juga harus menjawab pertanyaan bisnis yang penting dan paling banyak diakses dari sudut pandang ekstraksi data. 2. Choose the grain (memilih grain) Menurut Kimball dan Ross (2010:211), memilih grain berarti menentukan secara pasti apa yang akan diwakili oleh tiap record pada tabel fakta. 3. Identify and conform the dimensions (mengidentifikasi dan menyesuaikan dimensi)
38
Menurut
Kimball
dan
Ross
(2010:211),
dimensi
merupakan sumber bagi constraint pada query dan baris header pada laporan bagi pengguna. Dimensi memuat kamus perusahaan bagi pengguna. Dimensi yang dibuat dengan baik akan membuat model mudah dimengerti dan mudah digunakan. 4. Choose the facts (memilih fakta) Menurut Kimball dan Ross (2010:213), grain dari tabel fakta menentukan fakta mana yang dapat digunakan untuk proses bisnis tertentu. Semua fakta harus diekspresikan pada tingkatan yang sama. 5. Store pre-calculations in the fact table (menyimpan precalculation di tabel fakta) Menurut Kimball dan Ross (2010:213), setelah tabel fakta telah dibuat, perlu dilakukan pengujian ulang untuk masing-masing fakta, apakah ada kemungkinan melakukan prekalkulasi. Fakta hasil kalkulasi sebaiknya disimpan ke dalam tabel fakta untuk meningkatkan kinerja hasil query.
6. Round out the dimension tables (melengkapi tabel dimensi) Menurut Kimball dan Ross (2010:214), pada titik ini tabel fakta telah lengkap, dan peran tabel dimensi dalam menyediakan dukungan bagi tabel fakta melalui constraint pada atribut dimensional dapat dipahami. Pada tahap ini
39
dapat ditambahkan deskripsi berbentuk teks sebanyak mungkin ke dalam dimensi.
7. Choose the duration of database (memilih durasi database) Menurut Kimball dan Ross (2010:215), durasi mengukur seberapa jauh waktu yang akan digambarkan dalam tabel fakta. Dalam banyak bisnis, perlu melihat periode waktu yang sama seperti tahun sebelumnya.
8. Determine the need to track slowly changing dimensions (menentukan kebutuhan untuk melacak perubahan dari dimensi secara perlahan) Menurut Kimball dan Ross (2010:215), deskripsi yang tepat dari produk dan pelanggan lama harus digunakan untuk histori transaksi lama. Data warehouse harus menetapkan key yang digeneralisasi pada dimensi yang penting ini dengan tujuan untuk menghilangkan snapshot berulang dari pelanggan dan produk selama rentang waktu tersebut.
9. Decide the physical design (menetapkan rancangan fisik) Menurut Kimball dan Ross (2010:211), setelah melakukan delapan langkah sebelumnya, dan melengkapi logical
40
design, berikutnya perlu dilakukan physical design. Pada tahap ini dilakukan proses seperti mengurutkan tabel fakta dalam media penyimpanan, serta menampilkan rangkuman dan agregasi yang telah ditentukan sebelumnya. Selain itu, physical design juga menyangkut administrasi, backup, indexing, dan keamanan. b. Physical Design Menurut Kimball dan Ross (2002:355), model dimensional yang
telah
dibangun
pada
bagian
sebelumnya
perlu
diterjemahkan ke dalam physical design. Dalam dimensional modeling, logical dan physical design memiliki kemiripan yang sangat dekat. •
Aggregation Strategy Menurut Kimball dan Ross (2002:356), setiap data warehouse harus memuat tabel agregasi yang dihitung dan disimpan terlebih dahulu. Setiap agregasi tabel fakta harus menempati tabel fakta fisikalnya sendiri.
•
Initial Indexing Strategy Menurut Kimball dan Ross (2002:357), tabel dimensi akan memiliki index yang unik pada primary key kolom tunggal. Tabel fakta merupakan raksasa dalam data warehouse, jadi perlu memberikan index secara berhati-hati. Primary key dari tabel fakta hampir selalu berupa sekumpulan dari foreign key. Biasanya kita perlu menempatkan index gabungan secara tunggal pada dimensi utama dari tabel
41
fakta. Karena banyak query dimensional diwakili oleh dimensi waktu, maka foreign key waktu harus menjadi index term utama. c. ETL Design and Development Aktivitas terakhir dari data track adalah merancang dan mengembangkan staging atau sistem ETL, yang terdiri dari: •
Dimension Table Staging Menurut Kimball dan Ross (2002:359), karena tabel dimensi perlu selaras dan dapat digunakan kembali untuk tiap model dimensional, secara khusus mereka memiliki pengaruh
yang
lebih
terpusat.
Pengaruh
dimensi
bertanggung jawab untuk menentukan, memelihara, dan menyebarkan dimensi tertentu untuk data mart yang tepat. Dimensi dapat diproses secara bersamaan. Tetapi semua dimensi yang terlibat dalam skema harus dimasukkan terlebih dahulu ke staging dari data fakta. Staging tabel dimensi melibatkan langkah-langkah berikut : a. Mengekstrak data dimensional dari sumber sistem operasional b. Membersihkan nilai atribut c. Mengatur penugasan surrogate key
•
Fact Table Staging Menurut Kimball dan Ross (2002:361-362), pada saat tabel dimensi direplikasi ke semua data mart yang sesuai, tabel
42
fakta secara tegas tidak digandakan. Dengan data warehouse bus architecture, batasan disekitar tabel fakta didasarkan pada sumber proses bisnis, bukan garis organisasi. Dalam staging tabel fakta dilakukan langkah-langkah : a. Mengekstrak data dari sumber sistem operasional b. Menerima update dimensi dari penanggung jawab dimensi c. Memisahkan data fakta sesuai granularitas yang dibutuhkan d. Mengubah data fakta sesuai kebutuhan e. Mengganti key sumber operasional dengan surrogate key f. Menambahkan key tambahan untuk konteks yang diketahui, g. Memastikan kualitas data tabel fakta, h. Membangun atau memperbaharui agregasi tabel fakta, i. Bulk load data, j. Memberi tahu pengguna bahwa tabel fakta siap digunakan.
5. Business Intelligence Track Menurut Kimball dan Ross (2010:99), pada saat beberapa anggota proyek berkonsentrasi pada teknologi dan data, anggota lain berfokus untuk mengidentifikasi dan membangun aplikasi BI
43
dengan cakupan yang besar, termasuk laporan standar, query berparameter, dashboard, scorecard, model analisis, dan aplikasi data
mining,
bersamaan
dengan
navigasi
interface
yang
berhubungan. Menurut Menurut Kimball dan Ross (2002:363-364), business intelligence track dapat terbagi menjadi dua kegiatan, yaitu: a. Analytic Application Specification Sebelum mulai mendesain aplikasi, akan sangat membantu jika designer menetapkan standar aplikasi, seperti menu pulldown dan tampilan serta output yang konsisten. Dengan menggunakan standar, kita perlu menentukan template tiap aplikasi, merekam informasi yang cukup tentang tata letak, variable input, perhitungan, dan istirahat sehingga baik pengembang aplikasi maupun perwakilan bisnis memiliki pemahaman yang sama. Tahap ini perlu menentukan struktur alur navigasi untuk mengakses aplikasi, menggambarkan cara pengguna berpikir tentang bisnis mereka.
b. Analytic Application Development Saat berpindah pada fase pengembangan dari analisis aplikasi, diperlukan fokus pada standar (seperti yang telah ditetapkan pada Analytic Application Specification). Standar untuk konvensi penamaan, perhitungan, libraries, dan coding harus ditetapkan untuk mengurangi mengulang pekerjaan di masa mendatang. Aktivitas pengembangan aplikasi dapat dilakukan
44
setelah desain database, tools akses data dan metadata telah diterapkan, dan data historis telah dimasukkan.
6. Deployment, Maintenance and Growth Menurut Kimball dan Ross (2002:364), jalur teknologi, data, dan analisis aplikasi akan bertemu pada deployment. Deployment tidak akan terjadi secara alami, tetapi membutuhkan perencanaan terlebih dahulu. Menurut Kimball dan Ross (2002:365-366), setelah
melewati
tahap
deployment,
diharuskan
tetap
menginvestasikan sumber daya di beberapa area seperti support, pendidikan, dukungan teknis, dan dukungan program. Menurut Connolly dan Begg (2010, p1204), arsitektur data warehouse dapat digambarkan sebagai berikut :
Gambar 2.8Arsitektur Data Warehouse
45
Sumber : Thomas Connolly, C. B. (2010). Database Systems : A Practical Approach To Design, Implementation, and Management Fifth Edition Berdasarkan gambar arsitektur data warehouse menurut Connolly dan Begg (2010), komponen arsitektur data warehouse dijelaskan sebagai berikut: 1.
Operational data source Sumber data untuk data warehouse dapat berasal dari :
•
Mainframe data operasional yang berada pada tingkatan database dan jaringan database generasi pertama dimana sebagian besar data operasional perusahaan disimpan pada sistem tersebut.
•
Data departemen yang berada pada sistem file DBMS relasional (seperti Oracle, SQL Server).
•
Data pribadi atau private data yang berada pada server dan workstation pribadi.
•
Berbagai sistem eksternal seperti internet, database yang tersedia secara komersil, dan database yang berhubungan dengan supplier atau pemasok dan pelanggan perusahaan.
2.
Operational data store(ODS) Sebuah Operational data store (ODS) merupakan sebuah tempat penyimpanan data operasional yang sedang terjadi dan terintegrasi, yang digunakan untuk memenuhi kebutuhan analisa. ODS mempunyai struktur dan sumber data yang sama dengan data warehouse dan memiliki peran sebagai tempat
46
penyimpanan sementara data sebelum dipindahkan ke data warehouse. Data yang telah diekstrak dari sumber sistem dan telah dibersihkan kemudian akan disimpan di dalam ODS. 3.
ETL Manager ETL Manager dapat melakukan berbagai kegiatan operasi yang berhubungan dengan proses ETL dari data ke dalam data warehouse.
4.
Warehouse Manager Warehouse
manager
melakukan
seluruh
operasi
yang
berhubungan dengan kegiatan manajemen data pada data warehouse. Operasi-operasi tersebut meliputi : a. Analisa terhadap data untuk menjaga konsistensi data; b. Melakukan transformasi dan penggabungan sumber data dari tempat penyimpanan sementara menjadi tabel-tabel data warehouse; c. Membuat atau menghasilkan indeks-indeks dan tampilantampilan (views) berdasarkan tabel-tabel dasar; d. Melakukan denormalisasi (jika dibutuhkan); e. Melakukan agregasi; f. Melakukan backup dan pengarsipan data.
5.
Query Manager Query
manager
dapat melakukan semua
operasi yang
berhubungan dengan manajemen query dari pengguna (user). Tingkat kesulitan dari query manager dapat diukur dengan
47
fasilitas yang disediakan oleh alat pengaksesan pengguna (enduser access tools) dan database. 6.
Detailed Data Detailed data merupakan area dari data warehouse yang menyimpan seluruh detil data dalam skema database. Secara periodik detil data ditambahkan ke dalam data warehouse untuk mendukung kegiatan agregasi data.
7.
Lightly dan highly summarized data Komponen ini menyimpan semua data yang diringkas oleh data warehouse
manager
dengan
tujuan
untuk
mempercepat
performa dari query data. Tujuan dari informasi yang telah diringkas adalah untuk meningkatkan kinerja proses query. Ringkasan data akan diperbaharui secara terus – menerus sebagai data baru yang dimasukkan ke dalam data warehouse. 8.
Achive/ backup data Achive/backup data merupakan area dari data warehouse yang menyimpan detailed dan summarized data dengan tujuan untuk menyimpan dan melakukan backup data.
9.
Metadata Metadata merupakan area dalam data warehouse yang menyimpan semua definisi metadata yang digunakan untuk semua proses dalam data warehouse. Metadata digunakan untuk beberapa tujuan antara lain :
Proses ekstraksi dan memasukkan data
48
Metadatadigunakan untuk memetakan sumber data ke dalam sudut pandang umum data yang berada dalam data warehouse.
Proses manajemen data warehouse Metadata
digunakan
untuk
melakukan
otomatisasi
pembuatan tabel ringkasan (summary).
Bagian dalam proses manajemen query Metadata digunakan untuk mengarahkan query menuju sumber data yang sesuai.
10. End-User Access Tools Tujuan utama dari data warehouse adalah untuk mendukung pembuat keputusan (decision makers) dengan menyediakan informasi yang akurat. Para pengguna (user) berinteraksi dengan data
warehouse
menggunakan
End-User
access
tools,
diantaranya seperti : •
Reporting and Query Tools Peralatan laporan meliputi alat membuat laporan dan alat untuk menulis laporan. Alat query pada data warehouse relasional yang dirancang untuk menerima SQL atau menciptakan pernyataan SQL untuk melakukan query data yang tersimpan dalam data warehouse.
•
Application Development Tools Seringkali kebutuhan pengguna (user) akan laporan dan alat untuk melakukan query masih dinilai belum cukup untuk mendukung aplikasi yang sudah ada sebelumnya.
49
Oleh sebab itu, harus dibangun sebuah aplikasi yang dapat mendukung graphical data access tools dan biasanya dikembangkan untuk lingkungan client-server. •
Executive Information System Tools (EIS) Executive Information System, dikembangkan dengan tujuan untuk mendukung pembuatan keputusan tingkat eksekutif. EIS tools berhubungan dengan mainframe pengguna (user) untuk membangun kebiasaan-kebiasaan, aplikasi grafik pendukung keputusan untuk menyediakan sebuah gambaran mengenai data-data dalam perusahaan atau organisasi dan akses ke sumber data luar.
•
Online Analytical Processing Tools (OLAP) Online
Analytical
Processing
Tools
(OLAP)
didasarkan pada konsep database multidimensional dan mendukung pengguna (user) untuk dapat menganalisis data yang kompleks dengan sudut pandang multidimensional. •
Data Mining Tools Data Mining merupakan sebuah proses pencarian dan menjelajah hubungan baru yang memiliki arti, mencari pola dan tren dengan cara menampung sejumlah data yang besar dengan menggunakan teknik statistical, matematik, dan artificial intelligence.
50
Menurut Suparto Darudiato (2008,p61), arsitektur data warehouse dibagi menjadi 3 komponen, yaitu : •
Data warehouse yang mencakup data dan perangkat lunak yang terkait;
•
Perangkat lunak akuisisi data (back-end) yang mengekstraksi data dari sumber legacy dan sumber eksternal, memperkuat dan meringkasnya, dan memuatnya ke dalam data warehouse;
•
Perangkat lunak klien (front-end) yang mengizinkan para pengguna untuk mengakses dan meneliti data pada data warehouse.
Gambar 2.9Arsitektur Data Warehouse (Sumber : Suparto Darudiato (2008, p62)
Berdasarkan gambar aristektur data warehouse di atas, proses dimulai
dengan
operasional
dan
melakukan sumber
ekstraksi data
data
dari
eksternal,
basisdata dibersihkan
51
untukmeminimalisasi error dan mengisikan informasi yang kurang jika dimungkinkan, danditransformasikan untuk memperbaiki ketidakcocokan
semantik.
Loading
data
terdiri
darimematerialisasikan view dan menyimpannya dalam warehouse. Oleh karena itu, berbeda dengan viewstandar dalam DBMS relasional, view disimpan dalam warehouse yang berbeda dari basisdata yangterdapat dalam tabel yang didefinisikan. Kemudian, data yang dibersihkan dan ditransformasikan akhirnya di-load ke dalam warehouse.Pengolahan awal tambahan, misalnya sorting dan pembuatan informasi ringkasan dilakukan padatingkat ini. Data dipartisi dan indeks dibuat demi efisiensi. Berkaitan dengan volume data yang besar,loading merupakan proses yang lambat. Loading terabyte data secara berurutan memerlukan waktudalam hitungan minggu dan loading gigabyte memerlukan waktu berjam-jam. Oleh karena itu,paralelisme perlu untuk loading warehouse. Setelah data di-load ke dalam warehouse, pengukuran tambahan harus dilakukan untukmenjamin data dalam warehouse di-refresh secara periodik untuk merefleksikan pembaruan sumberdata dan secara periodik membuang data lama. Tugas penting dalam mengatur warehouse adalahmencatat data yang sedang disimpan di dalamnya, pembukuan itu dilakukan dengan menyimpaninformasi tentang data warehouse dalam katalog sistem. Katalog sistem yang berhubungan denganwarehouse sangat
52
besar dan sering disimpan dan diatur dalam basisdata terpisah yang disebutrepository metadata. Nilai warehouse pada akhirnya berada dalam analisis yang dienable-nya. Data dalamwarehouse biasanya diakses dan dianalisis menggunakan
berbagai
alat,
termasuk
mesin
query
OLAP,algoritma data mining, alat visualisasi informasi, paket statistik, dan report generator.
2.1.6.5
Struktur Data Warehouse Menurut W.H Inmon (2005, p33), data yang ada dalam data
warehouse maupun perubahan data yang di dalamnya berasal dari lingkungan database operasional dimana data akan mengalami transformasi yang diperlukan dalam proses perpindahannya. Apabila data yang ada dalam data warehousesudah kadaluarsa atau menua (data yang lama) maka data tersebut akan berpindah dari current level of detail ke older level of detail.Jika data telah diringkas maka data akan berpindah dari current level of detail ke level of lightly summarized data dan selanjutnya akan berpindah ke level of highly summarized data.Struktur data warehouse digambarkan pada gambar dibawah ini :
53
Gambar 2.10 Struktur Data Warehouse (Sumber : W.H Inmon, 2005, p34)
Menurut Vikas R. Agrawal (2005, p13), tingkatantingkatan data menurut perbedaan pada tingkatan ringkasan data (summary data) dan umur data warehouse dijelaskan sebagai berikut : • Current Detail Data (detil data sekarang) Current Detail Data adalah detil data yang aktif pada masa sekarang, yang merupakan level terendah dari data warehouse serta mencerminkan keadaan data warehouse yang sedang berjalan. Current Detail Data biasanya membutuhkan tempat penyimpanan yang cukup besar. • Old Detail Data (detil data historis)
54
Old Detail data merupakan data historis yang dapat berupa hasil backup yang disimpan dalam media penyimpanan (storage) yang terpisah dan dapat diakses sewaktu-waktu ketika dibutuhkan. Penyusunan direktori dari data ini harus dapat menggambarkan
umur
dari
data
dengan
tujuan
untuk
memudahkan pengaksesan kembali ketika dibutuhkan. • Highly Summarized Data (ringkasan data level tinggi) Highly Summarized Data merupakan hasil ringkasan data yang bersifat total atau menyeluruh dan mudah untuk diakses. Digunakan
untuk
melakukan
analisa
perbandingan
data
berdasarkan urutan waktu dan analisa yang menggunakan data multi dimensi. Database multi dimensi merupakan sebuah teknologi perangkat lunak computer yang dirancang untuk meningkatkan efisiensi dalam melakukan pencarian tabel atau query sehingga media penyimpanan menjadi lebih baik, serta memudahkan pengambilan data dalam jumlah yang besar. • Lightly Summarized Data (ringkasan data level menengah) Lightly Summarized Data merupakan ringkasan dari detil data namun belum bersifat total summary. Data-data ini memiliki tingkatan yang lebih tinggi dan mendukung kebutuhan dari data warehouse pada tingkat departemen. Tingkatan data ini juga disebut dengan data mart. Akses terhadap data jenis ini banyak digunakan untuk view dari suatu kondisi yang sedang dan sudah berjalan. • Metadata
55
Menurut W.H Inmon (2005, p102), metadata (atau data mengenai data) adalah
komponen terpenting di dalam
lingkungan data warehouse, yang merupakan sebuah bagian dari aturan pemprosesan informasi dimana jika masih terdapat program dan data. Dalam lingkungan data warehouse, metadata memiliki tingkat kepentingan yang berbeda, karena metadata memungkinkan cara penggunaan data warehouse yang paling efektif. Metadata menungkinkan end-user atau DSS analyst untuk melakukan navigasi melalui kemungkinan-kemungkinan yang ada di dalam metadata tersebut. Di lain pihak, ketika pengguna (user) melakukan pendekatan terhadap data warehouse yang tidak memiliki metadata, maka pengguna (user) tidak tahu harus memulai analisis dari mana. Pengguna harus mencari tahu terlebih dulu di dalam data warehouse data apa saja yang tidak terdapat di dalamnya sehingga banyak waktu akan terbuang sia-sia. Bahkan setelah pengguna berhasil mencari tahu, tetap tidak ada jaminan bahwa
dia
akan
menemukan
data
yang
benar
atau
menerjemahkan data tersebut dengan benar. Dengan bantuan metadata maka end-user dapat langsung menemukan data yang dibutuhkan atau dapat mengetahui ada tidaknya data tersebut. Jadi dapat disimpulkan bahwa metadata berperan seperti daftar isi dalam sebuah buku.
56
Ada beberapa item dalam penyimpanan metadata sebagai berikut : •
Struktur dari data yang dapat digunakan oleh programmer;
•
Struktur dari data yang dapat digunakan oleh DSS Analyst;
•
Sumber data yang mendukung data warehouse;
•
Transformasi data didalam perpindahan ke data warehouse;
•
Model data;
•
Hubungan antara model data dan data warehouse;
•
Catatan dari penggunaan data (History of Extracts)
Metadata menyimpan informasi yang penting mengenai data dalam data warehouse yang berfungsi sebagai : 1. Direktori yang akan digunakan oleh user dalam mencari lokasi dalam data warehouse. 2. Suatu panduan untuk summary data dari detail data menjadi lightly summarized data, kemudian menjadi highly summarized data. 3. Merupakan penuntun pemetaan (mapping) dalam proses transformasi dari operasional ke data warehouse. Karena data warehouse harus bersifat multi fungsional atau harus dapat melayani banyak fungsi, maka metadata penting untuk menjawab berbagai kebutuhan dari suatu fungsi tertentu, karena setiap departemen dalam sebuah perusahaan biasanya menggambarkan struktur data yang spesifik walaupun data tersebut berasal dari sumber yang sama.
57
2.1.6.6
Kegiatan Inti Data Warehouse Kegiatan inti data warehouse digunakan untuk melakukan
kegiatan analisa dan pelaporan informasi bagi pihak eksekutif perusahaan, maka dalam melakukan perancangan data warehouse, terdapat beberapa kegiatan inti yang harus ada di dalamnya. Kegiatan-kegiatan inti tersebut antara lain: •
Memperoleh dan menggabungkan data Memperoleh data dari berbagai sumber dan melakukan penggabungan pada suatu tempat penyimpanan data (storage), data-data yang telah digabungkan merupakan data-data yang akan membantu kita dalam proses pembuatan laporan, karena data tersebut merupakan suatu bentuk kesatuan.
•
Transformasi data Pengolahan data dari bentuk awal ke bentuk yang telah disepakati. Dengan melakukan pemprosesan atau pengolahan data terlebih dahulu, dalam arti dengan melakukan pengubahan data ke bentuk yang dibutuhkan atau diharapkan.
•
Pendistribusian data Data-data yang akan digunakan dalam data warehouse berhubungan dengan lingkunga kerja dalam perusahaan. Bagi perusahaan yang berhubungan dengan jaringan, pemakaian data warehouse mendukung kegiatan ini, dimana pengguna dapat menggunakan data warehouse ini secara fleksibel, efektif, dan efisien. serta merata pada masing – masing bagian dalam perusahaan.
58
•
Penggunaan Data Data yang telah diseleksi atau disaring akan menghasilkan ringkasan
yang
dapat
memudahkan
pengguna
dalam
mengambil keputusan.
2.1.6.7
Data Flow Data Warehouse Proses ini terdiri dari :
•
Inflow Berhubungan dengan proses loading, pembersihan (cleaning) dan pembacaan data sumber yaitu sistem ke dalam data warehousing.
•
Upflow Proses ini berhugungan dengan penambahan nilai data dalam data
warehousing
seperti
ringakasan
(summary),
penggelompokkan, dan pendistribusian data. •
Downflow Proses ini berhubungan dengan pengarsipan dan backup data dalam data warehousing.
•
Outflow Proses ini berhubungan dengan pembuatan data yang dapat dipakai oleh end- users. Dua kunci utama dari aktivitas ini, yaitu:
Accessing: Berkonsentrasi terhadap kepuasan permintaan dari pengguna atas data yang mereka butuhkan.
59
Delivering : Berkonsentrasi pada proses pengiriman informasi yang proaktif kepada workstation pengguna.
Metaflow: Proses ini berhubungan dengan deskripsi mengenai isi dari data dalam data warehousing.
2.1.6.8
Granularity Salah satu factor penting yang harus diperhatikan oleh
pengembang
data
warehouse
adalah
granularity.
Granularitymempengaruhi efisiensi dari penggunaan data dalam melakukan analisis. Menurut W.H Inmon (2005,p41), granularity merupakan sebuah level kedetilan/ summarization dari unit data yang ada dalam data warehouse. Semakin tinggi tingkat kedetilan data maka semakin rendah level granularity dan begitu sebaliknya semakin rendah tingkat kedetilan data maka semakin tinggi level granularity.
2.1.6.9
Agregasi Menurut W.H Inmon (2005, p114), terdapat banyak kasus
dimana data dalam warehouse tidak memenuhi kriteria stabilitas dan tidak sering berubah, kasus lainnya dimana jumlah data terlalu banyak, sering terjadi perubahan isi data, dan sebagainya. Dalam kasus-kasus
tersebut,
dapat
dilakukan
agregasi
yang
60
mengelompokkan beberapa data detil operasional yang berbeda ke dalam satu record tunggal. Record tunggal disebut sebagai profile record atau aggregate record. Sebuah profile record dibuat dengan tujuan mengelompokkan record detil yang sangat banyak jumlahnya. Sebagai contoh, sebuah perusahaan telepon pada akhir bulan mengumpulkan semua data-data aktivitas telepon para pelanggan dalam sebulan ke dalam data record pelanggan padadata warehouse. Agregrasi
dari
data
operasional
kedalam
sebuah
record
tunggaldalam data warehouse dapat dilakukan dengan menggunakan cara sebagai berikut : •
Nilai-nilai yang diambil dari data operasional yang dapat diringkas.
•
Unit-unit
data
operasional
dapat
dihitung/dijumlahkan,
dimanajumlah dari unit data tersebut disimpan. •
Unit-unit data dapat diproses untuk menentukan yang paling tinggi,paling rendah, rata-rata, dan lain-lain.
•
Kemunculan pertama dan terakhir sebuah data dapat ditangkap.
•
Tipe data tertentu, yang berbeda pada batasan parameter tertentudapat diukur.
•
Data yang efektif pada momem waktu tertentu dapat terperangkap.
•
Data yang paling muda dan yang paling tua dapat ditangkap.
Faktor yang mendukung pembuatan agregrasi adalah :
meningkatkan performa query.
61
mengurangi jumlah penggunaan CPU cycle.
Gambar 2.11 Pembentukan satu profile record dari beberapa record ( Sumber : W.H Inmon, 2005, p115)
2.1.6.10 Keuntungan Data Warehouse Menurut Connolly dan Beg (2010, p1198),keuntungan yang didapat dari pemanfaatan data warehouse antara lain : •
Keuntungan potensial yang besar dalam investasi Sebuah organisasi atau perusahaan harus memiliki sumber daya yang memadai yaitu dalam jumlah yang cukup besar untuk memastikan keberhasilan pengimplementasian sebuah data warehouse. Besarnya biaya yang harus dikeluarkan dapat bervariasi tergantung pada solusi teknis yang tersedia. Walaupun demikian, investasi dalam data warehouse akan memberikan keuntungan yang cukup besar setelah dilakukan pengimplentasian dimasa mendatang.
62
•
Keuntungan Kompetitif Salah satu keuntungan kompetitif yang didapatkan oleh organisasi atau perusahaan yang telah berhasil dalam mengimplementasikan data warehouse seperti, pihak eksekutif perusahaan diperbolehkan untuk melakukan pengambilan keputusan dengan mengakses data yang dapat menjelaskan analisa dari data tersebut yang awalnya tidak tersedia, tidak diketahui, dan tidak tercatatnya informasi tersebut.
•
Meningkatkan produktivitas bagi para pengambil keputusan atau pihak eksekutif perusahaan Data warehouse meningkatkan produktivitas dari para pengambil keputusan atau pihak eksekutif perusahaan dengan membuat sebuah database yang terintegrasi, konsisten, dan berorientasi subjek. Dengan melakukan transformasi data menjadi sebuah informasi yang memiliki arti dan nilai, data warehouse memperbolehkan bagi para manajer bisnis untuk dapat melakukan analisa yang lebih konsisten, akurat, dan substantif.
Selain itu, Mutaz M. Al-Debei (2011, p156) juga menjabarkan keuntungan data warehouse seperti gambar berikut.
63
Gambar 2.12Keuntungan Data Warehouse (Sumber : Mutaz M. Al-Debei, 2011, p156)
2.1.7 Dimensionality Modelling (Permodelan Dimensional) Menurut Connolly and Begg (2010,p1227), dimensionality modelling (permodelan dimensional) merupakan suatu teknik desain logikal yang bertujuan untuk merepresentasikan data dalam bentuk dasar atau standar serta desain ini memungkinkan untuk melakukan pengaksesan data dengan performa yang tinggi. Setiap model dimensional yang terbentukdan terbuat dari gabungan beberapa primary key yang disebut tabel fakta (fact table) dan sekumpulan tabel yang lebih kecil didalamnya yang disebut tabel dimensi (dimensional table). Setiap tabel dimensi memiliki sebuah primary key yang berhubungan secara langsung dengan sebuah key lain yang berada dalam tabel fakta. Keuntungan menggunakan pemodelan dimensional antara lain : 1. Pengaksesan data dapat dilakukan dengan lebih efisien; 2. Model dimensi dapat diperluas lagi jika dibutuhkan;
64
3. Kemampuan untuk menggambarkan keadaan bisnis secara umum; 4. Kemampuan untuk menangani perubahan akan kebutuhan.
2.1.7.1
Fact Table (Tabel Fakta) Menurut Connolly dan Begg (2010), tabel fakta adalah tabel
yang berisikan composite primary key yang terdapat pada dimensional model. Primary key dari tabel fakta dibuat dari 2 atau lebih foreign key. Tabel fakta mengandung sesuatu yang dapat diukur seperti harga, jumlah barang dan lain-lain.
Gambar 2.13Contoh Tabel Fakta Sumber : Thomas Connolly, C. B. (2010). Database Systems : A Practical Approach To Design, Implementationand Management Fifth Edition 2.1.7.2
Dimensional Table (Tabel Dimensi) Menurut Connolly dan Begg (2010), tabel dimensi adalah
kumpulan dari tabel yang lebih kecil dibandingkan tabel fakta pada dimensional model. Setiap tabel dimensi mempunyai simple (noncomposite) primary key yang berhubungan dengan salah satu komponen composite key pada tabel fakta.
65
Gambar 2.14Contoh Tabel Dimensi Sumber : Thomas Connolly, C. B. (2010). Database Systems : A Practical Approach To Design, Implementation, and Management Fifth Edition
2.1.7.3
Skema Bintang (Star Schema) Menurut Connolly dan Begg (2010, p1227), skema bintang merupakan struktur logikal yang terdapat tabel fakta yang berisi data faktual, serta dikelilingi oleh tabel dimensi yang berisikan data referensi (dimana dapat didenormalisasikan).
66
Gambar 2.15Contoh Star Schema Sumber : Thomas Connolly, C. B. (2010). Database Systems : A Practical Approach To Design, Implementation, and Management Fifth Edition
2.1.7.3.1
Keuntungan Menggunakan Skema Bintang Menurut
Connolly
dan
Begg
(2010,
keuntungan menggunakan skema bintang antara lain :
p1230)
67
• Efisiensi, dalam arti struktur database yang konsisten menjadikan akses data lebih efisien dengan menggunakan alat untuk menampilkan data termasuk laporan tertulis dan query. • Kemampuan untuk mengatasi perubahan kebutuhan, skema bintang dapat beradaptasi terhadap perubahan kebutuhan yang terjadi, karena sebuah tabel diemensi memiliki kesamaan dalam hal menyediakan akses ke tabel fakta. • Extensibility,
dalam
arti model
dimensional
ini
dapat
dikembangkan lebih lanjut. Contohnya, dengan menambah tabel fakta selama data tersebut masih konsisten, menambah tabel dimensi selama masih terdapat nilai tunggal pada tabel dimensi tersebut yang mendefinisikan setiap record yang terdapat dalam tabel fakta. • Proses query yang dapat diprediksi, aplikasi data warehouse yang mencari data dari level bawah akan lebih mudah dengan menambahkan jumlah atribut pada tabel dimensi sebuah skema bintang.
2.1.7.3.2
Jenis Skema Bintang Skema bintang merupakan suatu rancangan database
yang terdapat dalam data warehouse yang menggambarkan secara jelas hubungan antara struktur tabel fakta dan tabel dimensi.Skema bintang terdiri dari beberapa jenis, yaitu sebagai berikut :
68
1. Skema bintang sederhana Dalam skema bintang sederhana, setiap tabel harus mempunyai primary key yang terdiri dari satu atau lebih foreign key dan primary key tersebut harus bersifat unique.Gambar berikut ini menggambarkan hubungan antara tabel fakta dan dimensi.
Gambar 2.16Skema Bintang Sederhana ( Sumber : W.H Inmon, 2005, p129)
2. Skema bintang dengan banyak tabel fakta Skema bintang juga dapat memiliki lebih dari satu tabel fakta.Hal tersebut terjadi dikarenakan skema ini berisi lebih banyak tabel fakta pembelian dan tabel fakta persediaan. Walaupun
terdapat
banyak
tabel
fakta,
menggunakan tabel dimensi secara bersamaan.
skema
ini
69
2.1.7.4
Snowflake Schema Selain skema bintang (star schema), juga terdapat snowflake schema. Menurut Thomas Connolly (2010, p.1229), snowflake schema adalah sebuah model data dimensional yang terdiri dari tabel fakta yang diletakkan di tengah-tengah dan dikelilingi oleh tabel dimensi yang sudah mengalami proses normalisasi.
Gambar 2.17Snowflake Schema Sumber : Thomas Connolly, C. B. (2010). Database Systems : A Practical Approach To Design, Implementation, and Management Fifth Edition
70
2.1.7.5
Starflake Schema Selain star schema dan snowflake schema masih terdapatstarflake schema. Menurut Thomas Connolly (2010, p.1230), starflakeschema adalah sebuah model data dimensional yang terdiri dari tabel fakta yang diletakkan di tengah-tengah dan dikelilingi oleh tabel dimensi yang sudah mengalami proses normalisasi maupun denormalisasi.
2.1.7.6
Surrogate Key Surrogate Key adalahKey yang digunakan dalam tabel dimensi adalah surrogate key dan menurut Thomas Connolly (2010, p.1079), surrogate key adalah salah satu fitur penting dalam tabel dimensi yang dibuat berdasarkan bilangan bulat, yang berfungsi untuk menggabungkan antara tabel dimensi dengan tabel fakta.
2.1.8 Data Warehousing Tools and Technique 2.1.8.1
Extraction, Transformation, Loading (ETL)
2.1.8.1.1
Extraction Tahapan
extraction.Menurut
pertama Thomas
dalam
proses
Connolly
ETL
(2010,
adalah p1208),
extractionadalah sebuah tahapan dimana mengambil data dari sumber data bagi Environment DataWarehouse (EDP), sumber inibiasanya terdiri dari database OLTP dan juga bisa terdapat beberapa sumber lainnya seperti database pribadi, data ERP
71
dan data penggunaan dari web.Selain itu, menurut Fahad Sultan (2010, p411), data extraction merupakan proses ekstraksi data yang bersumberdari data operasional organisasi dan juga sumbereksternal lain, seperti file, html, dokumen, dan lainnya untuk data pada data warehouse. Berdasarkan definisi di atas dapat disimpulkan bahwaextractionmerupakan
kegiatan
ekstraksi
data
yangbersumberdaridata operasional dan data eksternal untuk dimasukkan ke- dalam lingkungan data warehouse.
2.1.8.1.2
Transformation Tahapan
kedua
dalam
proses
ETL
adalah
transformation. Menurut Connolly dan Begg (2010, p1208), transformation merupakan
tahapan
yang
menggunakan
beberapaperaturanatau fungsi dari data yang sudah diambil dan mengukur bagaimana data tersebut dapat
digunakan untuk
analisis dan dapat meliputi transformasi seperti penjumlahan data,
encoding
data,
penggabungan
data,
pemisahan
data,penghitungan data dan pembuatan surrogate keys. Menurut Fahad Sultan (2010, p411), transformation merupakan teknik transformasi data yang telah diterapkan pada data untuk membuat data yang ada menjadi lebih seragam, Setelah proses transformasi, data yang dihasilkan akan menjadi lebih homogen (sama), serta menjadi lebih konsisten dan
72
meminimalkan error atau kesalahan. Tindakan ini dapat meningkatkan kinerja data warehouse. Berdasarkan
definisi
diatas
dapat
disimpulkan
bahwa,transformation merupakan proses penggabungan dan pengubahan data agar data yang ada menjadi seragam sehingga data tersebut bisa dimuat ke dalam satu tabel baru yang disebut tabel fakta / tabel dimensi, dimana tabel tersebut berisikan surrogate key yang digunakan untuk menghubungkan antara tabel dimensi dan tabel fakta dalam data warehouse.
2.1.8.1.3
Loading Tahapan ketiga dalam proses ETL adalah loading.
Menurut Thomas Connolly (2010, p1209), loading adalah tahapan untuk memasukkan data yang sudah mengalami prosestransformasi ke dalam data warehouse.Menurut Fahad Sultan, loading merupakanproses peletakan data yang telah dibersihkan dan ditransformasi ke dalam data warehouse. Berdasarkan definisi diatas dapat disimpulkan bahwa, loading merupakan proses memasukkan data yang telah dibersihkan dan ditransformasikan ke dalam data warehouse. 2.1.8.1.4
ETL Tools Tahapan keempat dalam proses ETL adalah proses
ETL(ETL tools). MenurutConnolly dan Begg(2010, p1209), proses ETL dapat dibuat dengan membuat sebuah program
73
sendiri atau dengan membeli sebuah program ETL yangberada di pasaran. 2.1.8.1.5
Data Profilling and Data Quality Control Tahapan kelima dalam proses ETL adalah data
profiling and data quality control. Menurut Connolly dan Begg (2010,p1209), data profilling and data quality control menyediakan informasi penting tentang jumlah dan kualitas data yang bersumber dari sistem. Misalnya data profilling dapat mengindikasikan berapa banyak baris yang telah hilang, salah dan pemasukkan atau input datayang kurang lengkap.
2.1.8.1.6
Metadata Management Tahapan terakhir dalam proses ETL adalah metadata
management. Menurut Thomas Connolly (2010, p1209), metadata management adalah sebuah penyimpanan yang diatur oleh peralatan ETL yang akan menjelaskan tentang rincian sumber sistem, rincian pengubahan data danrincian dari pengubahan atau pemisahan data.
2.1.8.2
Data Warehouse DBMS Sama seperti halnya dengan relational database maka
datawarehouse juga membutuhkan sebuah database management system yang baik. Menurut Menurut Thomas Connolly (2010, p1209), adabeberapa masalah yang berhubungan dengan database datawarehouse.
Parallelism
menjadi
masalahyang
utama
74
sepertiperformance, scalability, availability dan manageability semuanyaharus dipertimbangkan dalam pemilihan DBMS. Dalam pemilihanDBMS dipelukan adanya identifikasi, kebutuhan untuk proses datawarehouse DBMS dan bagaimana kebutuhan data warehousemendukung teknologi secara paralel, yaitu terdiri dari :
Load Performance Load performance dalam data warehouse dibutuhkan untukmemuat data dalam waktu yang cepat secara periodik dan data yang masuk ke dalam data warehouse harus cepat dan tanpa ada batasan maksimum.Data warehouse membutuhkan peningkatan dalam memasukkan data dengan waktu yang cepat secara periodik. Kinerja dalam proses masuknya data seharusnya diukur dalam jumlah ratusan juta baris atau gigabyte data per-jam dan tidak adanya batasan maksimum.
Load Processing Banyak tahap yang harus dilakukan untuk memuat data baru atau meng-update data ke data warehouse mencakup Data conversion, filtering, reformating, integrity checks, fisical storage dan metadata update. Meskipun masing-masing tahap dalam prakteknya adalah atomik, proses memasukkan data seharusnya dieksekusi dalam satu kali pekerjaan.
Data quality management Tahapan ini untuk menjamin kualitas data yang baik, untuk menjamin local consistency,
global consistency,
75
referensial integrity. Meskipun sumber-sumber luar dan ukuran databaseyang besar.
Query performance Fact based management dan ad hoc analysis seharusnya tidak memperlambat kinerja data warehouse. Query yang rumit harus dapat dieksekusi dalam waktu yang cepat untuk mendukungpengambilan keputusan.
Terabyte scalability Ukuran data warehouse yang berkembang begitu cepat dari ukuran ratusan gigabyte ke terabyte dan petabyte seharusnya dapat ditangani oleh Database Management System (DBMS) yang tidak mempunyai batasan ukuran data dan seharusnya mendukung modular dan paralel manajemen dan bila terjadi kesalahan Database Management System (DBMS) harus dapat mendukung availability yang berkelanjutan dan menyediakan mekanisme untuk perbaikan (recovery).
Mass user scalability Database Management System(DBMS) harus mampu mendukung ratusan maupun ribuan query user dalam saat yang bersamaan.
Networked data warehouse Sistem data warehouse harus mampu beroperasi dalam jaringan data warehouse yang lebih besar. Data warehouse harus mencakup tools yang mengkordinasikan aliran data dalam data warehouse tersebut. User seharusnya mampu untuk
76
melihat dan bekerja dengan multiple data warehouses dari sebuah sebuahclient workstation.
Warehouse administration Data-data yang sangat besar dalam data warehouse dibutuhkan fleksibilitas dan kemudahan dalam administrasinya. Database Management System (DBMS) harus menyediakan control untuk membatasi sumber daya prioritas query untuk memenuhi kebutuhan bagi pemakai dan aktivitas yang berbedabeda.
Integrated Dimensional Analysis Kemampuan cara pandang multidimensi dalam data warehousemendukung kemampuan tinggi untuk menyediakan peralatan relasional Online Transaction Processing (OLAP). Database
Management
System
(DBMS)
harus
dapat
mendukung secara cepat dan mudah dalam pembuatan rangkuman di dalam data warehouse yang besar dan menyediakan peralatan perawatanuntuk dapat mengotomatisasi pembuatan rangkuman tersebut.
Advanced query functionality Para pengguna membutuhkan perhitungan analisis, pengurutan,perbandingan analisis dan daya akses yang konsisten untukmengambil data rangkuman dan data rincian.
2.1.9 Online Transaction Processing (OLTP) Menurut Thomas Connolly (2010, p1198), OLTP adalah sebuah sistem yang dirancang untuk memaksimalkan kapasitas
77
pemrosesan transaksi. Dapat diartikan bahwa OLTP adalah sebuah sistem yang dirancang untuk memasukkan data yang sesuai ke dalam database dan dirancang untuk memaksimalkan kapasitas pemrosesan transaksi. 2.1.10 Online Analytical Processing (OLAP) Menurut Connolly dan Begg (2010, p1250) Online Analytical Processing(OLAP)
merupakansintesisdinamis,
analisisdan
konsolidasi volume terbesardari multidimensional data. Teknologi OLAP memungkinkandata warehousedigunakansecaraefektifuntuk proses
online
memberikanresponyangcepatterhadapanalytical
analysis, queries
yang
kompleks.Berikutinibeberapakeuntungan
yang
diperolehdenganmenerapkan OLAp, yaitu : 1. Meningkatkanproduktivitasdariend-users bisnisdanpengembangteknologiinformasi. 2. Meningkatkanpenghasilandankeuntunganpotensialdenganmemung kinkanperusahaanuntukmeresponpermintaanpasarlebihcepat. 3. Mengurangiback-log daripengembanganaplikasiuntukstafteknologiinformasidenganme mbuat
end-user
bebasuntukmembuatperubahanskema
danmemungkinkanorganisasiuntukmeresponpermintaanpasarlebih cepat. 4. Mengurangilalulintasjaringandalamsistem ataudalamdatawarehouse.
OLTP
78
2.1.11 Entity Relational Diagram Menurut Connolly dan Begg (2010, p.330) Entity Relationship (ER)
modeladalah
perancangan
basis
sebuah
pendekatan
data(database)
yang
terstruktur
dalam
dimulai
dengan
mengidentifikasi data penting yangdisebut entitas dan hubungan antara data yang direpresentasikan dalamsebuah model.
2.1.12 IBM Infosphere Datastage IBM InfoSphere DataStage digunakan untuk melakukan transformasi data dan gerakan dari sumber sistem untuk menargetkan sistem batch dan real time. Sumber data seperti file indeks, file sekuensial, relasional database, arsip, sumber data eksternal, dan aplikasi perusahaan.
2.1.13 IBM Cognos IBM Cognos Business Intelligence merupakan perangkat lunak (software) yang menyediakan ruang kerja terpadu untuk business intelligence dan analisis terhadap organisasi agar dapat digunakan dalam menjawab pertanyaan-pertanyaan bisnis dan menghadapi persaingan dengan competitor. Dengan Cognos Business Intelligence, pengguna (user) dapat meperoleh keuntungan dari kemampuan sebagai berikut :
Kemudahan dalam melihat, merakit, dan personalisasi informasi
Kemudahan dalam menjelajahi semua jenis informasi dari berbagai sudut untuk menilai situasi bisnis pada saat ini
79
Menganalisis fakta dan mengantisipasi implikasi taktis dan strategis dengan peegeseran dari melihat data ke melakukan analisi yang lebih canggih dan prediktif
Melakukan kolaborasi dengan tujuan membangun jaringan keputusan untuk berbagi pengetahuan dan mencapai kecerdasan kolektif
Memberikan transparansi dan akuntabilitas untuk mendorong keselarasan dan consensus
Melakukan komunikasi dan mengkoordinasikan tugas untuk melibatkan orang yang tepat pada waktu yang tepat
Akses informasi dan mengambil tindakan di mana saja, seperti mengambil keuntungan dari perangkat mobile dan analisis secara real-time
Mengintegrasikan dan menghubungkan analisis dalam pekerjaan sehari-hari untuk alur kerja
2.1.14 Metodologi Perancangan Data Warehouse Menurut Kimball (2010, p210) terdapat 9 langkah dalam perancangan data warehouse yang dikenal dengan nine- step methodology, yaitu : •
Memilih Proses (Choosing the Process) Memilih proses berarti menetukan subjek utamanya. Subjek Utama merujuk pada suatu kegiatan bisnis perusahaan yang dapat menjawab semua pertanyaan bisnis yang penting serta memiliki ciri khas tersendiri.
80
•
Memilih Grain (Choosing the Grain) Memilih grain artinya menentukan apa yang akan disajikan atau dipresentasikan oleh sebuah tabel fakta. Setelah menentukan grain dari tabel fakta, selanjutnya dapat menentuka tabel dimensi yang berhubungan dengan tabel fakta tersebut. Grain pada tabel fakta juga menentukan grain untuk tabel dimensinya.
•
Identifikasi dan Membuat Dimensi yang Sesuai (Identifying and Conforming the Dimensions) Identifikasi dan menghubungkan tabel dimensi dengan tabel fakta. Dimensi merupakan kumpulan sudut pandang yang penting untuk menggambarkan berbagai fakta yang terdapat dalam tabel fakta.
•
Memilih Fakta (Choosing the Facts) Grain dari suatu tabel fakta menentuka fakta-fakta apa saja yang dapat digunakan. Pada tahap ini, dilakukan penentuan measure (ukuran) yang dibutuhkan pada tabel fakta tersebut.
•
Menyimpan Pra-Kalkulasi Dalam Tabel Fakta Umumnya hasil perhitungan dari atribut pada database tidak disimpan pada suatu atribut khusus pada database, namun dalam tahap ini, perlu dilakukan pertimbangan kembali mengenai penyimpanan hasil perhitungan pada suatu atribut tersendiri pada database, dengan tujuan untuk mengurangi resiko kesalahan pada program setiap kali melakukan perhitungan pada atribut-atribut tersebut.
81
•
Melengkapi Tabel Dimensi Dari banyak dimensi yang telah teridentifikasi, pada tahap ini dilakukan deskripsi yang memuat informasi secara terstruktur mengenai atribut-atribut pada tabel dimensi. Tabel dimensi tersebut harus diberi keterangan secara lengkap, jelas, dan mudah dipahami oleh pengguna (user).
•
Memilih Durasi dari Database Pada tahap ini dilakukan penentuan durasi atau periode waktu dari data-data yang akan dimasukkan ke dalam data warehouse. Contohnya, pada perusahaan distributor IT, data biasanya disimpan selama 5 tahun atau lebih.
•
Mencari Perubahan pada Dimensi Dimensi dapat terjadi perubahan sewaktu-waktu, sehingga untuk mengantisipasinya ada tiga cara untuk melakukan pengubahan data pada dimensi tersebut, yaitu : a
Menulis ulang atribut yang mengalami perubahan
b Membuat record baru pada dimensi tersebut c
Membuat suatu atribut alternative untuk menampung nilai baru, sehingga nilai lama dan nilai baru dari atribut tersebut dapat diakses secara bersamaan.
•
Memutuskan Prioritas dan Cara query Pada tahap terakhir, dilakukan perancangan fisik dari data warehouse dan menentukan masalah-masalah apa yang mungkin ada dala perancangan fisik seperti administrasi, backup data, indexing, dan security.
82
2.2 Teori – teori Khusus 2.2.1 Pembelian (Purchasing) Pembelian merupakan proses bisnis yang dilakukan antar dua pihak yaitu pihak supplier dan pihak perusahaan untuk mendapatkan bahan-bahan produk yang akan dijual oleh perusahaan. MenurutRender (2011, p414), pembelian adalah perolehan barang dan jasa.Secara umum definisi pembelian adalah suatu usaha pengadaan barangatau jasa dengan tujuan yang akan digunakan sendiri, untuk kepentinganproses produksi maupun untuk dijual kembali. Menurut Stevenson (2009, p518), pembelian adalah proses mendapatkanmaterial, bagian-bagian, persediaan, dan layanan yang diperlukan untuk memproduksi sebuah produk atau menyediakan sebuah layanan. Menurut William B. Joyce (2006, p202), pembelian adalah sebuah kegiatan untuk mendapatkan material, layanan, yang dibutuhkan untuk menghasilkan produk atau jasa layanan. Menurut Andreas P. Kakorius (2006, p709-711), membagi proses pembelian menjadi lima langkah, yaitu : • Initiation Phase Proses pembelian diawali dengan adanya kebutuhan akan jasa maupun suatu barang. • Planning Phase Merupakan siklus utama dari suatu siklus pembelian dimana terjadi perencanaan terhadap list barang yang akan dibeli agar tidak terjadi kesalahan dalam pembelian yang dapat menyebabkan kerugian.
83
•
Qualification Phase Pemilihan pemasok melalui tingkat kualitas barang yang dihasilkan agar barang tersebut terjamin kualitasnya.
•
Winning Phase Merupakan tahap akhir untuk memilih pemasok yang tepat untuk menjadi distributor tetap.
•
Monitoring and Review Phase Pembeli harus secara teratur dalam melakukan pemantauan agar barang yang dihasilkan oleh pemasok dapat terpantau terus kualitasnya. Berdasarkan pengertian di atas dapat disimpulkan bahwa
pembelian adalah suatu proses bisnis dalam perusahaan ebagai upaya mendapatkan produk untuk barang-barang yang akan dijual oleh perusahaan kepada pelanggan.
2.2.2 Penjualan (Selling) Penjualan merupakan suatu proses bisnis yang penting bagi perusahaan dalam tujuannya untuk mencari keuntungan yang maksimal.Untuk mendapat keuntungan yang semaksimal mungkin diperlukan teknik-teknik khusus agar produk yang dihasilkan dapat disukai oleh pasar dan berkualitas sehingga menarik minat para pelanggan. Menurut Kotler et al (2006, p470), menerangkan bahwa proses penjualan merupakan serangkaian langkah-langkah yang dilakukan untuk menjual suatu produk kepada pelanggan oleh bagian penjualan.
84
Menurut Fess (2006, p300), menerangkan bahwa penjualan merupakan jumlah tukar uang yang dibebankan kepada pelanggan atassuatu barang yang dipesan. Berdasarkan pengertian di atas dapat disimpulkan bahwa penjualan merupakan suatu proses bisnis untuk menjual barang atau produk kepada pelanggan untuk mendapatkan keuntungan bagi perusahaan.
2.2.3 Persediaan Barang (Inventory Stock) Persediaan merupakan suatu kegiatan dalam perusahaan untuk menyimpan produk yang akan dijual untuk dijadikan sebagai persediaan.Persediaan barang ini biasanya disimpan dalam suatu gudang (warehouse). Menurut Alfredson et. al. (2007, p342), persediaan merupakan aset yang tersediauntuk dijual dalam proses bisnis biasa atau set yang ada dalam proses produksi. Persediaan dibagi menjadi beberapa jenis oleh Horngren et. al. (2002,p759)menjadi sebagai berikut : a. Persediaan bahan mentah Persediaan ini akan digunakan dalam proses manufaktur untuk diolah kembali. b. Persediaan barang dalam proses Yaitu barang yang sudah melalai beberapa tahap pada proses manufaktur, tetapi masih perlu diolah kembali. c. Persediaan barang jadi
85
Persediaan barang yang sudah diproses dan siap untuk dijual. Menurut Alfredson, K.,etal (2007, p342), menerangkan bahwa persediaan merupakan harta atau aset perusahaan yang tersedia untuk dijual kepada pelanggan. Menurut I Nyoman Yudha Astana (2007, p185), terdapat enam fungsi penting yang terdapat dalam persediaan dalam memenuhi kebutuhan perusahaan, sebagai berikut : 1.
Meminimalkan
resiko
keterlambatan
pengiriman
barang
yangdibutuhkan oleh perusahaan 2.
Menghilangkan resiko akan adanya barang rusak ketika memesan barang
3.
Meminimalkan resiko terhadap kenaikan harga
4.
Untuk menyimpan barang-barang secara aman sehingga jika dibutuhkan sewaktu-waktu dapat tersedia.
5.
Mendapatkan potongan harga atas pembelian barang
6.
Menyediakan barang yang diperlukan oleh pelanggan agar kebutuhannya dapat terpenuhi Berdasarkan pengertian di atas dapat disimpulkan bahwa
persediaan merupakan sebuah aset atau kekayaan perusahaan berupa barang-barang dagangan hasil produksi yang disimpan di dalam suatu tempat atau gudang yang kemudian akan dijual kepada pelanggan.
86
2.3 Kerangka Pikir Berdasarkan Kimball Lifecycle diatas kami membuat kerangka pikir dalam merancang data warehouse ini agar lebih matang dalam melakukan perencanaan, implementasi, dan evaluasi, sehingga hasil yang diharapkan lebih optimal dan tepat waktu
1.1 Latar Belakang
1.2 Ruang Lingkup 1.3 Tujuan dan Manfaat
4.2 Perancangan Data Warehouse (Nine-Step Methodology) 4.3 Implementasi
4.4 Evaluasi
Gambar 2.18Kerangka Pikir