BAB 2 TINJAUAN PUSTAKA DAN LANDASAN TEORI
A.
Tinjauan Pustaka Berdasarkan Penelitian dan studi kasus yang pernah dilakukan Computer
Economic 2008. Data warehouse terbukti dapat mempermudah end user dalam mendapatakan informasi yang dibutuhkan, dan dapat mempercepat proses pengolahan data. Sistem Data warehouse dalam konteks perusahaan finance memiliki fungsi yang luas tentang kinerja penjualan, credit, collection, serta pelaporan untuk pengawasan Presthus, W,. Ghinea, G. & Utvik, K.-R., 2012. Aplikasi business intelligence sebagai tools untuk mengolah dan menyediakan laporan mebutuhkan data warehouse sebagai sumber data yang terintegrasi, sehingga dapat mempermudah penyediaan informasi dengan cepat serta dapat pula menganalisa permasalahannya dengan cepat Ponelis, S.R., 2011. Dalam
penelitian
mengenai
performance
dashboard
pada
beberapa
perusahaan Olszak, C.M & Ziemba, E., 2012 Telah terbukti bahwa sebuah kinerja dashboard yang memungkinkan eksekutif untuk mengukur, memonitor dan mengelola organisasi kinerja yang lebih efektif.Dalam penelitian ini juga dijelaskan bagaimana dashboard mendukung pengambilan keputusan yang lebih baik, dimana dan bagaimana mereka digunakan.
9
10 B.
LANDASAN TEORI
2.1
Pengertian Data Menurut Williams dan Sawyer (2011, p25) berpendapat bahwa data terdiri dari fakta-fakta dan gambar mentahan yang akan di proses menjadi sebuah informasi. Menurut Inmon (2005, p493), “a recording of facts, concepts, or instructions on a storage medium for communication, retrieval, and processing by automatic means and presentation as
information that is
understandable by human beings.” Yang berarti data adalah catatan dari fakta-fakta, konsep, atau instruksi dalam suatu tempat penyimpanan tertentu untuk keperluan komunikasi, pengambilan, dan pemrosesan secara otomatis untuk kemudian merepresentasikan informasi yang dapat dimengerti oleh manusia Menurut Stair and Reynolds (2005, p5), “Data is raw facts, such as employee’s name and number of hours worked in a week, inventory part numbers, or sales order”, yang memiliki arti bahwa data adalah fakta mentah, seperti nama karyawan dan jam kerja karyawan dalam seminggu, nomor persediaan, atau sales order. Jadi dapat disimpulkan bahwa data adalah catatan fakta mentah yang disimpan, dimana nantinya akan diolah untuk ditampilkan sebagai informasi yang berguna.
2.2
Pengertian Informasi Menurut Inmon (2005, p498), “data that human beings assimilate and evaluate to solve a problem or make a decision.” Yaitu informasi merupakan
11 data yang telah diasimilasi dan dievaluasi oleh manusia untuk dapat memecahkan suatu permasalahan atau pengambilan keputusan tertentu.
2.3
Pengertian Database Menurut Turban, Rainer, dan Potter (2006,p49) mengartikan database Atau basis data sebagai sekumpulan arsip (File), tabel, relasi, dan lain-lainnya Yang saling berkaitan dan menyimpan data serta berbagai hubungan di antranya. Menurut Connolly and Begg (2011, p15), ‘database is a shared collection of logically re lated data, designed to meet an information needs of an organization’. Yang diartikan sebagai sekumpulan data yang terkait secara logis, yang dirancang untuk memenuhi kebutuhan informasi dalam suatu organisasi. Menurut O’Brien (2005, p141), ”Database is an integrated collection of logically related data elements”, yang artinya bahwa database merupakan suatu koleksi yang terintegrasi dari elemen data yang saling terhubung secara logika. Jadi dapat disimpulkan bahwa database merupakan kumpulan atau koleksi dari data yang saling terhubung secara logis.
2.4
Pengertian On-Line Transaction Processing (OLTP) Menurut Connolly and Begg (2005, p1149), “system have been designed to handle high transaction throughput, with transactions typically making small changes to the organisation’s operational data, that is the organisations requires to handle its day to day operations”, yang berarti
12 OLTP adalah sebuah sistem yang dirancang untuk menangani hasil proses transaksi dengan performa yang tinggi dengan transaksi yang secara umum membuat perubahan kecil terhadap data operasi organisasi, yang dibutuhkan untuk menangangi operasi sehari-hari pada perusahaan. Menurut Inmon (2005, p500), “the high-performance transaction processing environment”, yang berarti lingkungan dimana terjadi proses transaksi dengan performa yang tinggi. Pada OLTP, setiap transaksi yang masuk ke dalam sistem harus dapat diakses. Jadi dapat disimpulkan bahwa OLTP adalah sistem untuk menangani transaksi operasional sehari-hari dengan performa yang tinggi.
2.5
Pengertian On-Line Analytical Processing (OLAP) Menurut Connolly and Begg (2005, p1205), “OLAP is a term that describe a technology that users a multi-dimensional views of aggregate data to provide quick access to strategic information to the purpose of advance analysis”. OLAP adalah istilah yang mendeskripsikan suatu teknologi yang menggunakan multi – dimensional view dari aggregate data untuk menyediakan akses yang cepat bagi informasi strategis dengan tujuan dari advanced analysis
2.6
Entity Relationship (ER) Modeling Menurut Connolly and Begg (2005, p345), Entity Relationship (ER) Modeling adalah pendekatan top-down untuk mendesain database yang diawali dengan mengidentifikasikan data penting yang disebut dengan entities dan relationships di antara data-data yang harus direpresentasikan dalam model. Kemudian ditambahkan detil-detil seperti informasi yang ingin
13 ditambahkan tentang entities dan relationships yang disebut attributes dan berbagai constraints pada entities, relationships dan attributes.
2.7
Konsep Data Warehouse
2.7.1 Pengertian Data Warehouse Menurut Inmon (2005, p29), “A data warehouse is a subject-oriented, integrated, nonvolatile, and time-variant collection of data in support of management’s decisions” atau data warehouse adalah koleksi data yang mempunyai sifat subject-oriented, integrated, nonvolatile, dan time variant untuk mendukung proses pengambilan keputusan dalam manajemen Menurut McLeod (2004, p406), “Data warehouse, warehousing a data storage capacity is very large-scale, the data is accumulated by adding new records rather than kept current by updating existing records with new information, the data is very easily retrievable, and the data is used for decision making and is not used with the firm’s daily operations. ” yang berarti data warehouse adalah sebuah sistem penyimpanan data yang berkapasitas besar, dimana data dikumpulkan dengan menambahkan record baru daripada mengupdate record baru yang sudah ada dengan informasi baru. Data jenis ini digunakan hanya untuk proses pengambilan keputusan dan bukan kegiatan operasional perusahaan sehari-hari. Menurut Farhan (2011,p46-57) data warehouse adalah sebuah proses kompleks yang terdiri dari banyak tugas seperti ekstraksi, transformasi, integrasi, membersihkan, manajemen kunci, sejarah manajemen, dan loading. Untuk memenuhi keputusan dukungan kebutuhan data warehouse dapat menggunakan data dari berbagai sumber internal dan external.
14 Menurut Huda (2010, p437-448) dengan data warehouse, data-data terkait dalam pengambilan keputusan dapat di simpan dalam lintas waktu yang mencukupi, serta dapat menghasilkan media penyajian informasi yang lengkap, dinamis, dan cepat. Jadi dapat disimpulkan bahwa data warehouse adalah kumpulan data yang telah diringkas dan terintegrasi dari data operasional maupun data external,
yang
memiliki
karakteristik
subject-oriented,
integrated,
nonvolatile, dan time variant yang berguna dalam proses pengambilan keputusan .
2.7.2 Pengertian Data Mart Menurut Connolly and Begg (2005, p1171), “Data Mart is a subset of a Data warehouse that support the requirement of a particular department of business function”, yang berarti Data Mart adalah bagian dari data warehouse yang mendukung kebutuhan informasi dari suatu departemen atau fungsi bisnis tertentu. Menurut Inmon (2005, p494), “Data Mart is a departmentalizes structure of data feeding from the data warehouse where data is denormalized based on the department’s need for information ”, yang dapat diartikan bahwa Data Mart adalah struktur bagian dari data warehouse dimana data tersebut tidak dinormalkan berdasarkan kebutuhan informasi tiap departemen. Jadi dapat disimpulkan bahwa data mart adalah bagian dari data warehouse yang hanya menangani kebutuhan informasi suatu departemen.
15 2.7.3 Karakteristik Data Warehouse Menurut Inmon (2005, p29-p33), sebuah data warehouse memiliki karakteristik sebagai berikut :
2.7.3.1 Subject-Oriented Data warehouse bersifat subject oriented berarti bahwa data warehouse bukan berorientasikan pada proses atau fungsi aplikasi tertentu, melainkan pada subyek-subyek tertentu dalam perusahaan, yang memiliki subyeksubyek yang unik untuk tiap perusahaannya. Misalnya: untuk perusahaan asuransi subyeknya adalah pelanggan, kebijakan, premi, dan keluhan; dalam pabrik subyeknya adalah produk, pesanan, vendor, tagihan material, bahan baku; dan sebagainya
2.7.3.2 Integrated Karakteristik integrasi ini dapat dikatakan merupakan aspek terpenting dari data warehouse. Integrasi disini dimaksudkan bahwa data dalam data warehouse memiliki satu bentuk tunggal fisikal yang sama dan konsisten walau berasal dari sumber yang berbeda-beda. Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara seperti konsisten dalam penamaan dan ukuran variabel, konsisten dalam struktur pengkodean, dan konsisten dalam atribut fisik dari data.
16 2.7.3.3 Time-Variant Maksud dari time variant dalam data warehouse adalah bahwa data dalam data warehouse merupakan data yang bersifat akurat dalam jangka waktu tertentu. Waktu merupakan tipe atau bagian data yang sangat penting di dalam data warehouse karena data warehouse menyimpan data historis.
2.7.3.4 Non volatile Data warehouse bersifat non-volatile, artinya data warehouse tidak dapat diubah. User tidak dapat mengubah data warehouse yang sudah ada karena data warehouse hanya memiliki dua kegiatan yaitu loading dan access data. Berbeda dengan database operasional yang memiliki tiga kegiatan operasi yaitu insert, update, dan delete.
2.7.4 Perbandingan antara OLTP dengan Data Warehouse Berikut ini adalah tabel perbandingan antara OLTP dan data warehouse (Connolly and Begg, 2005, p1153) : Data Warehouse (Connolly and Begg, 2005, p1153) Tabel 2.1 Perbandingan Sistem OLTP dengan Sistem Sistem OLTP
Sistem Data Warehouse
Menyimpan data sekarang
Menyimpan data histories
Menyimpan data detil
Menyimpan detailed, lightly, highly summarized data
Data bersifat dinamis
Data bersifat statis
Proses yang dilakukan secara
Ad hoc, tidak terstruktur, heuristic
berulang
processing
17 High level dari transaction
Medium ke low level dari
throughput
transaction throughput
Pemakaian dari pola yang dapat
Pemakaian dari pola yang tidak
diprediksi
dapat diprediksi
Mengarah pada transaksi
Mengarah pada analisis
Berorientasi pada aplikasi
Berorientasi pada subyek
Mendukung keputusan sehari-hari
Mendukung keputusan strategi
Operational user dalam jumlah
Manajerial user dalam tingkat yang
yang besar
relatif rendah
2.7.5 Struktur Data Warehouse Dalam struktur data warehouse terdapat older level of detail, current level of detail, level of summarized data (level data mart), dan level of highly summarized data. Data yang berada pada data warehouse berasal dari lingkungan operasional. Biasanya transformasi signifikan terjadi dari data yang ada di level operasional menuju ke level data warehouse. (Inmon, 2005, p33).
Gambar 2.1 Struktur Data Dalam Data Warehouse (Inmon, 2005, p34)
18 2.7.5.1 Older Detail Data Older detail data merupakan data back-up (cadangan) yang jarang diakses. Data back-up seperti ini biasanya disimpan pada media penyimpanan yang berbeda. Penyusunan direktori dilakukan berdasarkan urutan umur data, sehingga data dapat tersusun rapi dan mempermudah dalam melakukan akses selanjutnya
2.7.5.2 Current Detail Data Current detail data menggambarkan data detil yang aktif pada saat ini dan keadaan yang sedang berjalan. Data jenis ini memerlukan media penyimpanan yang besar dan merupakan data yang sering diakses. Current detail data ini cepat diakses, tetapi mahal dan kompleks dalam pemeliharaannya.
2.7.5.3 Lightly Summarized Data Lightly summarized data merupakan data ringkasan dari current detail data. Di dalam tahap ini, data masih belum bersifat total summary. Akses terhadap data jenis ini biasanya digunakan untuk memantau kondisi yang sedang dan sudah berjalan.
2.7.5.4 Highly Summarized Data Highly summarized data merupakan data yang bersifat total summary. Pada level ini, data sangat mudah diakses terutama untuk melakukan analisis perbandingan data berdasarkan urutan waktu dan analisis yang menggunakan data multidimensi. Data multidimensi adalah suatu teknologi software
19 komputer yang dirancang untuk meningkatkan efisiensi dalam query data sehingga menjadi media penyimpanan yang lebih baik, serta memudahkan pengambilan data dalam volume besar.
2.7.5.5 Metadata Menurut Inmon (2005, p500), ”metadata is data about data. Or the description of the structure, content, key, indexes, and so forth, of data ” atau metadata merupakan data tentang data. Metadata merupakan gambaran tentang struktur, isi, kunci, indeks dari data.
2.7.6 Arsitektur Data Warehouse Menurut Inmon (2005, p193-p194), arsitektur data warehouse terdiri dari 2 bagian, yaitu :
2.7.6.1 Data Warehouse Terpusat Pembentukan dan pemeliharaan data warehouse terpusat adalah pengelolaan yang terbaik. Hal ini dilakukan karena beberapa alasan, yaitu : 1. Data dalam data warehouse terpusat terintegrasi antar perusahaan dan gambaran terintegrasi hanya digunakan di kantor pusat. 2. Perusahaan mengoperasikan sebuah model bisnis terpusat. 3. Volume dari data di dalam data warehouse terpusat seperti sebuah penyimpanan tunggal yang terpusat dari data yang pasti. 4. Sekalipun data dapat diintegrasikan, jika data diedarkan melalui banyak local sites, maka akan mempersulit dalam pengaksesan.
20 2.7.6.2 Data Warehouse Terdistribusi Bisnis yang tersebar secara geografis atau kebanyak tempat, membedakan produk yang dihasilkannya. Dalam hal ini, ada yang dapat disebut sebagai lokal data warehouse dan global data warehouse. Lokal data warehouse menampilkan data dan prosesnya pada bagian yang dikendalikan, dan global data warehouse menampilkan bagian dari bisnis yang terintegrasi diantara keseluruhan bisnis. Data warehouse berisi banyak data, dan isi dari data akan didistribusikan ke banyak prosesor. Secara logis terdapat data warehouse tunggal, tetapi secara fisik terdapat banyak data warehouse yang berhubungan erat tetapi pada prosesor yang berbeda. Konfigurasi ini dapat disebut teknologi data warehouse terdistribusi Data warehouse terdistribusi berkembang pada kondisi yang tidak terkoordinasi. Kurangnya koordinasi pada perkembangan data warehouse yang berbeda biasanya merupakan hasil dari perbedaan politik dan organisasi. Dalam kasus ini dapat disebut sebagai perkembangan yang mandiri dari data warehouse terditribusi.
2.7.7
Keuntungan Data Warehouse
Menurut Connolly and Begg (2005, p1152), data warehouse yang telah diimplementasikan dengan baik dapat memberikan keuntungan bagi organisasi, yaitu •
Nilai kembali investasi yang berpotensi tinggi. Sebuah organisasi harus mengeluarkan sumber daya dalam jumlah yang cukup besar untuk memastikan bahwa data warehouse telah diimplementasikan dengan baik.
21 •
Keuntungan kompetitif Pengembalian investasi yang besar untuk perusahaan yang sukses mengimplementasikan
data
warehouse
menjadi
bukti
besarnya
keuntungan kompetitif yang menyertai teknologi ini. Keuntungan kompetitif akan didapatkan jika pengambil keputusan mengakses data yang dapat mengungkapkan informasi yang sebelumnya tidak diketahui atau tidak tersedia, misal informasi mengenai tren, konsumen dan permintaan. •
Meningkatkan produktivitas dari para pengambil keputusan perusahaan Data warehouse meningkatkan produktivitas para pengambil keputusan perusahaan dengan menciptakan sebuah database yang terintegrasi secara konsisten, berorientasi subjek, dan data historis. Data warehouse mengintegrasikan data dari beberapa sistem yang tidak kompatibel ke dalam bentuk yang menyediakan satu pandangan yang konsisten dari organisasi. Dengan mengubah data menjadi informasi yang berguna, maka seorang manajer bisnis dapat membuat analisa yang lebih akurat dan konsisten.
2.7.8 Pemodelan Dimensional Menurut Connolly and Begg ( 2005, p1183), ”Dimensionality modelling is a logical design technique that aims to present the data in a standard, intuitive form that allows for high performance access ”, yang berarti pemodelan dimensional adalah teknik desain logika yang bertujuan untuk menyajikan data dalam standar bentuk intuitif yang mempunyai akses performa tinggi.
22 2.7.8.1 Star Schema Menurut Connolly and Begg ( 2005, p1183 ), ‘star scema is a logical structur that has a fact table containing factual data in the center surrounded by dimension tables containing reference data (which can be denormalized)’, yang berarti skema bintang merupakan struktur logikal yang mempunyai tabel fakta yang mengandung data faktual di pusat, dikelilingi dengan tabel dimensi yang memiliki reference data (yang dapat didenormalisasi). “A star schema is a simple database design in which dimensional data are saparated from fact or event data (describing individual bussiness transaction)”. Yang berarti skema bintang adalah desain database yang sederhana dimana data dimensional dipisahkan dari fakta atau event data (menjelaskan transaksi bisnis individu). (Hoffer et al, 2005, p467) Jadi dapat disimpulkan bahwa star schema adalah struktur logika yang berisi tabel fakta dan tabel dimensi.
2.7.8.1.1 Tabel Fakta Menurut Connolly and Begg (2005,p1183), “every dimentioanl model is composed of oe table with composite primary key, called the fact table”, yang berarti table fakta adalah satu table pada dimensional model yang isinya composite primary key. Jadi key pada table fakta merupakan foreign key. Menurut Hoffer et al (2005, p467), “tables contain factual or quantitative data about a bussiness such as unit sold, orders booked and so on ”. Yaitu tabel fakta berisi data faktual atau data kuantitatif tentang bisnis, seperti penjualan barang, pemesanan dan lain-lain. Key dari tabel fakta adalah composite key yang berisi gabungan dari semua foreign key ditambah dengan
23 komponen lain. Jadi dapat disimpulkan bahwa tabel fakta berisikan data faktual atau kuantitatif yang memiliki composite key.
2.7.8.1.2 Tabel Dimensi Menurut Connolly and Begg (2005,p1183), “a set of smaller tables called dimension tables”, yang berarti table dimensi adalah sekumpulan tabletabel yang lebih kecil dari table fakta pada dimensional model. Menurut Hoffer et al (2005, p467), “dimension tables hold descriptive data about the subjects of the bussiness”. Yaitu tabel dimensi berisi data deskriptif mengenai subjek dari bisnis. Tabel dimensi biasanya berisi atribut yang digunakan untuk mengkualifikasi, mengkategorikan atau merangkum data didalam query, record, atau grafik. Setiap tabel dimensi mempunyai hubungan one-to-many ke tabel fakta. Setiap tabel dimensi pada umumnya berisi sebuah primary key yang sederhana dan juga atribut lainnya. Primary key pada tabel dimensi menjadi foreign key pada tabel fakta Jadi dapat disimpulkan bahwa tabel dimensi merupakan tabel yang lebih kecil dari tabel fakta yang berisi data deskriptif mengenai subjek dari bisnis.
2.7.8.2 Snowflake Schema Skema snowflake menurut Connolly and Begg (2005,p1184), “A variant of the star schema where the dimension table do not contain denormalized data ” yang artinya adalah sebuah variasi dari skema bintang dimana tabel dimensi sudah ternormalisasi. Skema ini dapat melibatkan lebih
24 dari satu lapis penggabungan tabel dimensi sebelum bergabung dengan tabel fakta. Dalam skema snowflake suatu tabel dimensi dapat terhubung dengan tabel dimensi yang lain.
2.7.8.3 Starflake Schema Skema starflake menurut Connolly and Begg (2005, p1185), “a hybrid structure that contains a mixture of star and snowflake schemas.” Yang dapat diartikan bahwa skema starflake merupakan struktur gabungan dari skema bintang dan snowflake.
2.7.9 Metodologi Perancangan Data Warehouse Menurut Connolly and Begg (2005, p1187–p1193), terdapat metodologi perancangan data warehouse, dengan terlebih dahulu merancang data mart kemudian menyatukannya. Metode tersebut terdiri dari sembilan langkah, yaitu:
2.7.9.1 Penentuan Proses (Choosing the process) Pada tahap ini ditentukan, pada proses bisnis apa data warehouse (data mart) akan dirancang
2.7.9.2 Penentuan Grain (Choosing the grain) Menentukan secara tepat apa yang akan dipresentasikan oleh record tabel fakta. Apabila tahap ini telah selesai barulah dapat diidentifikasikan tabel-tabel dimensi yang diperlukan untuk tiap tabel fakta.
25 2.7.9.3 Mengidentifikasi dan Penyesuaian Dimensi ( Identifying and conforming the dimension) Pada tahapan ini, akan diidentifikasikan tabel-tabel dimensi yang diperlukan. Tabel dimensi berisi data yang menggambarkan dimensi dari bisnis. Dimension atribut adalah kolom dalam tabel dimensi. Pada dimensi karyawan misalnya, atributnya dapat berupa kode karyawan, jabatan, jenis staf. Apabila suatu tabel dimensi muncul atau digunakan pada lebih dari satu tabel fakta maka tabel dimensi itu disebut sebagai ‘conformed’dan tabel dimensi tersebut haruslah merupakan tabel dimensi yang sama. Dengan demikian , tiap tabel fakta dapat ‘berbagi’ tabel dimensi yang sama. Contoh dari tabel dimensi seperti ini misalnya tabel dimensi waktu, karyawan, dan sebagainya.
2.7.9.4 Penentuan Fakta (Choosing the facts) Pada tahap ini akan diidentifikasi apa sajakah data (atribut) yang diperlukan dalam tabel fakta yang telah dipilih pada tahapan ke-2. Data-data tersebut berupa key dan data kuantitatif.
2.7.9.5 Menyimpan Pre-calculations pada Tabel Fakta (Storing pre-calculation in the fact table) Pada tahap ini, tabel fakta yang telah dipilih akan diperiksa apakah terdapat pre-calculations (data hasil kalkulasi). Dan pada tahap ini akan disimpan proses kalkulasinya. Sebagai contoh yang umum terjadi adalah pada fakta penjualan, akan disimpan total biaya atau total harga yang didapat dari
26 jumlah jual dikali harga jual.
2.7.9.6 Melengkapi Tabel Dimensi (Rounding out the dimension table) Pada tahap ini dilakukan pemeriksaan ulang pada tabel dimensi dan menambahkan deskripsi teks terhadap dimensi untuk mempermudah proses analisis. Gambaran dari teks harus mudah digunakan dan dimengerti oleh user.
2.7.9.7 Penentuan Durasi Database (Choosing the duration of the database) Pada tahapan ini akan dipilih durasi database, yaitu ukuran seberapa jauh periode waktu (tiga tahun, lima tahun atau lebih) untuk data-data yang akan disimpan dalam database pada data warehouse.
2.7.9.8 Melacak Perubahan Dimensi Secara Perlahan (Tracking slowly changing dimension) Pada tahapan ini akan dilacak permasalahan yang berkaitan dengan dimensi yang mengalami perubahan sedikit demi sedikit karena perbedaan periode waktu. Ada tiga cara mengatasi perubahan tersebut yaitu perubahan atribut dimensi ditulis ulang, menyebabkan pembentukan record dimensi baru, dan menyebabkan pembentukan atribut pengganti, sehingga nilai lama dan nilai baru dapat diakses secara bersamaan pada record dimensi yang sama.
27 2.7.9.9 Memutuskan prioritas dan mode query (Deciding the query priorities and the query modes) Pada tahapan ini perlu diperhatikan masalah rancangan fisikal dan menentukan masalah-masalah yang mungkin ada pada perancangan fisik seperti transformasi, backup, dan security.
2.7.10 Proses Transfer Data Dari Lingkungan Operasional ke Data warehouse Menurut Dyche (2000, p157), ada tiga proses pemindahan data dari lingkungan operasional ke data warehouse, yaitu : 1. Extraction Data ditemukan dan dipindahkan dari sistem operasional ke data warehouse atau platform transformasi. 2. Transformation Suatu program spesial atau
software tool yang membersihkan data
operasional agar sesuai dengan definisi awal aturan transformasi untuk data warehouse. 3. Loading Suatu program atau tool-tool seringkali yang sama yang digunakan untuk transformasi memindahkan data ke dalam tabel data warehouse.
2.7.11 Transformasi Data Menurut Hoffer et al (2005, p461-p463), “the component of data reconciliation that converts data from the format of the source operational systems to the format of the enterprise data warehouse”. Yang berarti transformasi data adalah komponen rekonsiliasi data yang meng-convert data
28 dari format sumber sistem operasional ke dalam format data warehouse perusahaan.
Fungsi transformasi data terbagi ke dalam dua kategori, yaitu : • Record – Level Functions Operasi pada sebuah set record (seperti file atau tabel) adalah record level functions yang paling penting : selection, joining, dan aggregation. • Field- Level Functions Field- level functions meng – convert data dari format sumber record ke format target record yang berbeda.
2.7.12 Agregasi Menurut Inmon ( 2005, p114 ), terdapat banyak kasus dimana data dalam data warehouse, jumlah datanya menjadi terlalu banyak. Dalam kasus seperti demikian, dapat dilakukan agregasi yang mengelompokkan beberapa data detil operasional yang berbeda ke dalam satu record tunggal. Record tunggal itu disebut sebagai profile record atau aggregate record.
2.7.13 Denormalisasi Menurut Inmon ( 2005, p495 ), “the technique of placing normalized data in a physical location that optimizes the performance of the system.” Yaitu denormalisasi merupakan suatu teknik untuk menempatkan data hasil normalisasi ke dalam lokasi fisikal yang dapat mengoptimisasi kinerja sistem.
29 Tujuan dari denormalisasi ini adalah untuk meningkatkan kinerja semaksimal mungkin dengan menghemat penggunaan sumber daya I/O yang diperlukan.
2.7.14 Cube Menurut Mannino (2001, p462), “A Multidimensional format in which cells contain numeric data called measures organized by subjects called dimension”. Yang berarti cube adalah format multidimensional dimana kolom-kolomnya mengandung data numeric yang disebut measure yang disusun berdasarkan subjek yang disebut dimensi.
2.7.15 Fact Finding Menurut Connolly and Begg (2005, p315), “the formal process of using techniques such as interviews and questionair to collects facts about systems, requirements and preferences”, yang diartikan sebagai proses formal yang menggunakan teknik seperti interview dan kuisioner untuk mengumpulkan fakta tentang sistem, kebutuhan serta pilihan-pilihannya. Ada lima teknik pencarian fakta yang digunakan yaitu menguji dokumentasi, wawancara, observasi operasi perusahaan, riset, kuisioner.