BAB 2 LA NDASAN TEORI 2.1 Teori-teori umum 2.1.1 Pengertian Data Menurut Inmon(2005, p493), Data adalah sebuah r ekam an dari fakta , konsep, ataupun instruksi p ada sebuah media penyimpanan untuk komunikasi, pen gambilan, maupun p emp rosesan dari p engertian otomatis dan p resentasi dari informasi yang d ap at di mengerti oleh manusia. 2.1.2 Pengertian Database Menurut Connoly (2005,p 15). Database adalah suatu kumpulan dari data yang terselubung secara logis, dan deskripsi dari data. Dan data tersebut dap at digunakan secara bersama-sama. Menurut Kroenke (2007,p 11). Database adalah kumpulan dari tabeltabel yang salin g terintegr asi dan memiliki suatu deskrip si. Tabel y ang terintegrasi adalah tabel y ang menyimpan baik d ata dan hubun gan antar data. 2.1.3 Data Mart Menurut Prabhu(2007,p 95). Data mart adalah p eny imp anan data untuk p engguna tertentu. Data tersebut sudah diringk as dari d ata sebelumnya sehingga p engguna d apat dengan mudah untuk m emahami, memp roses dan menerap kanny a. Dan data mart tidak dap at berdiri sendiri, melainkan m emer lukan sebuah data di data warehouse. Karena setiap data y ang terdapat di data warehouse adalah unik.
7
8 Yang harus di perhatikan dalam membuat data mart: a. M emahami bisnis yang terlibat. b. Tanggap terhadap tujuan dari pengguna. c. Fasilitas yang memadai dengan pemodelan database dan desain untuk menghasilkan tabel baru dengan cepat. d. Alat untuk mengkonversi model menjadi data mart dengan cepat. M enurut Hoffer (2004,p444). Data mart adalah data warehouse yang terbatas dalam ruang lingkup, dimana datanya diperoleh dengan memilih dan meringkas data dari data warehouse yang telah diekstrak, diubah, dan diproses secara terpisah dari sumber sistem data. Data mart dapat dibagi kedalam 2 kategori yaitu: 2.1.3.1 Data mart independen Data mart independen adalah data mart yang diisi oleh data yang di dapat dari bagian operasional, tanpa memanfaatkan data warehouse. 2.1.3.2 Data mart dependen Data mart dependen adalah data mart yang datanya berasal dari enterprise data warehouse dan sudah disesuaikan. 2.1.4 Pengertian Data warehouse M enurut Rainardi (2008, p1). Data warehouse adalah sistem yang mengambil dan mengkonsolidasikan data secara berkala dari sistem sumber ke dalam sebuah dimensi atau data store yang sudah dinormalisasikan. M enurut Inmon (2007, p7). Data warehouse ialah suatu basis untuk proses informasi yang didefinisikan sebagai subject oriented, integrated,
9 nonvolatile, time variant dan a collection of data in support of management’s decision. M enurut Ponniah (2001, p13). Data warehouse adalah sebuah kumpulan informasi yang mampu : a. M enyediakan informasi yang terintegrasi dan pandangan (view) total untuk perusahaan. b. M enyediakan informasi saat ini dan informasi historical perusahaan untuk membuat keputusan. c. M emungkinkan decision-support transaction tanpa mengganggu system operasional. d. M enyediakan informasi yang konsisten untuk perusahaan. e. M enyediakan sebuah informasi strategis
yang fleksibel dan
interaktif. 2.1.5 Keuntungan Data warehouse Berdasarkan Connolly (2005, p1152), M engimplementasikan sebuah data warehouse dapat memberikan suatu keuntungan seperti : a
Keuntungan Potensial yang besar dalam Investasi Suatu Organisasi harus memiliki sumber daya dalam jumlah besar untuk kesuksesan dalam mengimplementasikan Data warehouse dan jumlah biaya yang dikeluarkan bervariasi, besarnya tergantung dari solusi teknik yang tersedia. Tetapi investasi dalam Data warehouse
dapat
memberikan keuntungan yang besar setelah pengimplementasiannya. b Keuntungan yang Kompetitif
10 Keuntungan
yang
kompetitif
dapat
dicapai
dengan
memungkinkan para pengambil keputusan untuk mengakses data yang dapat mengungkapkan data-data yang belum tersedia, tidak diketahui, dan informasi yang tidak tercatat. c
Meningkatkan para pengambil keputusan perusahaan Dengan melakukan transformasi data menjadi informasi yang berarti. Data warehouse memungkinkan para manejer bisnis melakukan analisa yang lebih konsisten, akurat, dan substantive. Sehingga terjadi peningkatan produktifitas dari pengambilan keputusan perusahaan.
2.1.6 Karakteristik Data warehouse M enurut Inmon (2005,p29), Data warehouse didefinisikan dengan karakteristik sebagai berikut : 2.1.6.1 Subject oriented Subject oriented berarti data warehouse dibuat atau disusun berdasarkan pada subjek utama dalam lingkungan perusahaan, bukan berorientasi pada proses atau fungsi aplikasi seperti yang terjadi pada lingkungan operasional. Sebagai contoh adalah sebuah perusahaan asuransi aplikasi terdiri dari mobil, kesehatan, jiwa, dan kehilangan. Sedangkan pada data warehouse diatur berdasarkan pelanggan, polis, premi dan klaim.
11
Gambar 2. 1 Subject oriented dalam data warehouse (Sumber : Inmon, 2005, p30)
2.1.6.2 Integrated Data dalam data warehouse bersifat terintegrasi karena bersumber dari sistem – sistem aplikasi yang berbeda dalam perusahaan. Sumber data demikian sering tidak konsisten, misalnya karena berbeda format. Sumber data yang terintegrasi ini harus dibuat konsisten untuk memberikan data yang seragam pada para pengguna.
12
Gambar 2. 2 Integrated data dalam data warehouse (Sumber : Inmon, 2005, p31)
2.1.6.3 Non-volatile Data dalam data warehouse tidak di-update dalam real time melainkan diperbarui secara periodik dari sistem operasional. Data baru selalu ditambahkan sebagai tambahan bagi database, bukan sebagai pengganti. Database secara terus–menerus mengambil data baru, menambahnya, dan mengintegrasikannya dengan data sebelumnya.
13
Gambar 2. 3 Non-volatility dalam data warehouse (Sumber : Inmon, 2005, p32)
2.1.6.4 Time Variant Data dalam data warehouse bersifat tepat dan valid dalam jangka waktu tertentu. Data dalam data warehouse terdiri dari serangkaian snapshot, masing–masing menunjukkan data operasional yang diambil pada suatu waktu tertentu.
Gambar 2. 4 Time variancy dalam data warehouse (Sumber : Inmon, 2005, p32)
2.1.7 S truktur Data warehouse Berdasarkan
Inmon
(2005,
p33-34).
Struktur
data
warehouse
menunjukan level detail yang berbeda dalam data warehouse. Terdapat older
14 level of detail, current level of detail, level of lightly summarized data (level data mart), dan level of highly summarized data. Data mengalir kedalam data warehouse dari lingkaran operasional. Biasanya transformasi penting dari data terjadi pada jalur dari level data operasional ke level data warehouse.
Gambar 2. 5 Struktur dari data warehouse (Sumber : Inmon, 2005, p34)
Sekali data disimpan, data melalui current detail ke older detail. Selama data diringkas, data melalui current detail ke older detail. Selama data diringkas, data melalui current detail ke lightly summarixed data,kemudian dari lightly summarized data ke highly summarized data. 2.1.7.1 Current Detail Data Current detail data adalah data detail yang sedang aktif saat ini, mencerminkan keadaan yang sedang berjalan saat ini dan merupakan tingkat terendah dalam data warehouse. Current detail data ini biasanya
15 memerlukan media penyimpanan data yang cukup besar. Alasan perlu diperhatikan current detail data adalah sebagai berikut : a. M enggambarkan kejadian yang baru terjadi dan selalu menjadi perhatian utama. b. Hampir selalu disimpan di media penyimpanan karena cepat diakses tetapi mahal dan kompleks dalam pengaturannya. c. Dapat digunakan dalam membuat rekapitulasi sehingga current detail data harus akurat. d. Jumlahnya sangat banyak dan disimpan pada tingkat penyimpanan rendah. 2.1.7.2 Old Detail Data Old detail data adalah data historis dapat berupa hasil back-up yang dapat disimpan dalam media penyimpanan yang terpisah dan dapat diakses kembali pada saat tertentu. Data ini jarang diakses sehingga disimpan dalam media penyimpanan alternatif seperti tape dan disk..Data ini biasanya memiliki tingkat frekuensi akses yang rendah. Penyusunan file atau directory dari data ini disusun berdasarkan umur dari data yang bertujuan mempermudah untuk pencarian atau pengaksesan kembali. 2.1.7.3 Lightly S ummarized Data Data ini merupakan ringkasan atau rangkuman dari current detail data. Data ini dirangkum berdasarkan periode atau dimensi lainnya sesuai dengan kebutuhan. Ringkasan dari current detail data belum bersifat total summary. Data-data ini memiliki detail tingkatan yang lebih tinggi dari current detail data dan mendukung kebutuhan warehouse pada
16 tingkat departemen. Tingkatan data ini disebut juga dengan data mart. Akses terhadap data jenis ini banyak digunakan untuk view suatu kondisi yang sedang atau sudah berjalan. 2.1.7.4 Highly Summarized Data Data ini merupakan tingkat lanjutan dari lightly summarized data, yang merupakan hasil ringkasan yang bersifat totalitas, dapat diakses misalnya untuk melakukan analisis perbandingan data berdasarkan urutan waktu tertentu dan analisis menggunakan data multidimensi. 2.1.7.5 Metadata Metadata adalah data mengenai data yang berisi lokasi dan deskripsi sistem komponen data warehouse seperti nama, definisi, struktur, dan isi dari data warehouse, identifikasi dari sumber data yang berwenang, dan lainnya (Berson, 1999, p27) Metadata merupakan data yang menjelaskan tentang data dan merupakan suatu bentuk jaringan yang sangat penting bagi penggunaan data warehouse. Metadata dibuat untuk menjawab kebutuhan dari suatu fungsi tertentu karena setiap departemen biasanya menggunakan struktur data yang spesifik meskipun sumber datanya sama. Peranan Metadata yaitu : a.
Sebagai directory untuk membantu penggunaan data warehouse menempatkan isi data dan mengetahui lokasi data dalam data warehouse.
b. Sebagai panduan untuk menempatkan (mapping) data pada saat data ditransformasikan dari OLTP ke dalam lingkungan data warehouse.
17 c. Sebagai panduan untuk menghasilkan rangkuman dari current detailed data menjadi lightly summarized data dan dari lightly summarized data menjadi highly summarized data. 2.1.8 Aliran Data dalam Data warehouse M enurut Connoly dan Begg (2005, p1161-1165), data warehouse fokus pada manajemen lima arus data primer, yaitu : 2.1.8.1 Inflow M erupakan proses ekstraksi, pembersihan, dan pengisian data dari sumber data ke dalam data warehouse. Proses inflow ini berkonsentrasi pada proses mengambil data dari sumber sistem dan memasukannya ke dalam data warehouse. Cara lainnya yaitu data dimasukan ke dalam operational data store (ODS) sebelum dikirim ke data warehouse. Proses rekontruksi data meliputi : a. M embersihkan data yang kotor b.
Restrukturisasi data untuk dicocokan dengan kebutuhan dari data warehouse, contohnya menambah atau membuang field-field, dan denormalisasi data.
c. M emastikan bahwa sumber data konsisten dengan dirinya sendiri dan dengan data lainnya yang sudah ada di data warehouse. 2.1.8.2 Upflow M erupakan penambahan nilai ke dalam data di dalam data warehouse melalui peringkasan, pemaketan, dan distribusi data. Aktifitas yang berhubungan dengan upflow yaitu sebagai berikut :
18 a . M eringkas
data dengan
proses
memilih,
memperhitungkan,
menggabungkan dan mengelompokan data relasional ke dalam tampilan yang lebih berguna bagi user. b . Pengepakan data dengan mengubah data detail ke dalam format yang lebih berguna seperti spreadsheets, teks dokumen, diagram, tampilan grafik yang lain, database pribadi dan animasi. c . M endistribusikan data ke kelompok-kelompok yang tepat untuk meningkatkan ketersediaan dan dapat diakses. 2.1.8.3 Downflow M erupakan proses mengambil dan mem-backup data dalam data warehouse. menyimpan data lama memainkan peranan yang penting di dalam mempertahankan penampilan dan efektifitas dari warehouse dengan mengirimkan data lama dengan nilai yang terbatas ke sebuah tempat penyimpanan seperti magnetic tape dan optical disk. Downflow dari data juga meliputi proses yang memastikan bahwa kondisi yang sekarang dari data warehouse dapat dibangun kembali jika terjadi kehilangan data, kegagalan software atau hardware. 2.1.8.4 Outflow M erupakan proses membuat data agar tersedia bagi enduser. Outflow merupakan kondisi dimana manfaat dari data warehouse benarbenar dirasakan oleh sebuah organisasi. Dua aktifitas kunci terdapat pada outflow yaitu sebagai berikut : a . Pengaksesan, dimana berhubungan dengan proses memuaskan pemakai akhir dengan menyediakan data yang dibutuhkan oleh
19 mereka. Yang menjadi perhatian utama yaitu membuat suatu lingkungan jadi user dapat dengan efektif menggunakan query tool untuk mengakses sumber data yang paling tepat. Frekuensi dari pengaksesan ini dapat bervariasi mulai dari ad hoc, secara rutin, sampai real time. Selain itu juga harus dipastikan bahwa sumber sistem digunakan dengan cara yang paling efektif di dalam menjadwalkan pengeksekusian terhadap query dan user. b . Pengiriman, dimana berhubungan dengan secara aktif mengirimkan informasi ke workstation dari user. Ini merupakan area yang baru dari data warehouse dan sering dihubungkan dengan proses publish dan subcribe. Warehouse akan mempublish objek bisnis bermacammacam dan user akan men-subcribe terhadap objek bisnis yang dibutuhkan mereka. 2.1.8.5 Metaflow M erupakan proses manajemen Metadata. Metaflow merupakan proses yang memindahkan Metadata (data tentang flow yang lainnya). Metadata merupakan deskripsi dari data yang ditampung di dalam data warehouse, apa yang telah dilakukan terhadap data tersebut dengan cara cleansing, integrating, dan summarizing. 2.1.9 Metodologi data warehouse M enurut
Connoly (2005,p1187), metodologi data warehouse yaitu
step – nine methodolgy. Dimana terdiri dari beberapa step yaitu:
20 2.1.9.1 Memilih Proses Fungsi dari pemilihan proses mengacu pada sebuah permasalahan subjuk yang merupakan bagian dari data mart. Data mart yang sering digunakan adalah data yang sering digunakan untuk memenuhi sebuah kebutuhan dan menjawab sebuah permasalahan bisnis. 2.1.9.2 Memilih Grain M emutuskan dengan tepat apa yang akan ditampilkan di tabel fakta.
Dengan
memilih
grain
kita
dapat
menentukan
atau
mengidentifikasi dimensi-dimensi apa saja yang terdapa di tabel fakta. 2.1.9.3 Identifikasi dan membuat dimensi yang sesuai Sebuah dimensi yang baik dapat membuat data mart mudah di mengerti dan digunakan. 2.1.9.4 Memilih Fakta Grain dari tabel fakta dapa menentukan data apa saja yang di gunakan untuk data mart. 2.1.9.5 Menentukan pra- kalkulasi dalam tabel fakta Setiap fakta-fakta yang sudah terpilih harus diuji ulang terlebih dahulu untuk menentukan apakah terdapat peluang untuk menentukan pra-kalkulasi. 2.1.9.6 Melengkapi tabel dimensi Pada tahap ini kita melengkapi sebanyak mungkin untuk mendeskripsikan tabel dimensi tersebut yang memiliki hubungan dengan tabel dimensi itu sendiri.
21 2.1.9.7 Memilih durasi dari database Durasi menunjukan waktu yang digunakan untuk menjalankan sebuah tabel fakta. Pada tahap ini yang dilakukan adalah menentukan batas waktu dari data yang akan di masukan ke dalam datawarehouse. 2.1.9.8 Melacak perubahan dari dimenesi secara acak Dalam melacak perubahan dimensi,ada 3 tipe yang dapat digunakan. Antara lain: Tipe
1:
Perubahan
atribut pada
sebuah
dimensi
akan
menyebabkan atribut tersebut akan terganti (overwrite). Tipe
2:
Perubahan
atribut pada
sebuah
dimensi
akan
menyebabkan dimasukannya data baru kedalam dimensi tersebut. Tipe 3: atribut pada sebuah dimensi akan menyebabkan penambahan atribut alternatif, sehingga data yang lama dengan data yang baru dapat diakses secara bersamaan dengan dimensi yang sama. 2.1.9.9 Memutuskan prioritas dan cara query Pada tahap ini sudah mempertimbangkan perancangan fisikal yang mempengarhi persepsi pengguna dalam menggunakan data mart. Yaitu urutan dari tabel fakta secara fisik dan kemunculan ringkasan 2.1.10 Arsitektur Data warehouse M enurut Connolly (2005, p1156), komponen – komponen utama sebuah data warehouse antara lain :
22 2.1.10.1 Operational Data Data untuk data warehouse berasal dari : a. Mainframe data operasional yang berada pada tingkatan database generasi pertama dan database jaringan. Diperhatikan sebagian besar data operasional perusahaan disimpan pada sistem tersebut. b. Data departemen yang berada di sistem file DBM S relasional (seperti SQL Server 2008). c. Data pribadi yang berada di server dan workstation pribadi. d. Sistem – sistem eksternal seperti internet, database yang tersedia secara komersil, dan database yang berhubungan dengan pemasok atau pelanggan perusahaan. 2.1.10.2 Operational Datastore Sebuah operational datastore (ODS) adalah sebuah tempat penyimpanan data operasional terkini dan terintegrasi, yang digunakan untuk kebutuhan analisis. ODS memiliki struktur dan sumber data yang sama dengan data warehouse, berperan sebagai tempat penyimpanan data sebelum dipindahkan ke data warehouse. ODS menyimpan data yang telah di-extract dari sistem sumber dan telah dibersihkan. Dengan demikian, proses pengintegrasian dan rekontruksi data untuk data warehouse menjadi lebih sederhana. 2.1.10.3 Load Manager Load Manager melakukan semua operasi yang berhubungan dengan fungsi extracting / mengambil data dan fungsi loading /
23 meletakkan data ke dalam data warehouse. Data dapat di-extract dari sumber – sumber data atau pada umumnya diambil dari operational datastore. Operasi yang dilakukan Load Manager dapat berupa transformasi data yang sederhana untuk mempersiapkan pemasukan data ke dalam data warehouse. Ukuran dan kompleksitas komponen ini akan berbeda sesuai dengan data warehouse yang dirancang dan dapat dibangun menggunakan kombinasi antara vendor loading dan custombuild programs. 2.1.10.4 Warehouse Manager Warehouse manager melakukan semua operasi yang berhubungan dengan manajemen data dalam data warehouse. Komponen ini dibangun menggunakan vendor dan management tools dan custom-build programs. Operasi yang dilakukan oleh data warehouse manager berupa : a. M elakukan analisis data untuk menjaga konsistensi data. b. M elakukan transformasi dan penggabungan sumber data dari penyimpanan sementara ke dalam table – table data warehouse. c. M enciptakan index dan view pada base tables. d. M elakukan denormalisasi (jika diperlukan). e. M elakukan agregasi (jika diperlukan) f. M elakukan back-up dan archive / back-up data 2.1.10.5 Query Manager Query manager melakukan semua operasi yang berhubungan dengan management user queries. Komponen ini dibangun menggunakan vendorend-user data access tools, data warehouse monitoring tools,
24 fasilitas database, dan custom build-in programs. Kompleksitas queries manager ditentukan oleh fasilitas yang disediakan end-user access tools dan database. Operasi yang dilakukan komponen ini berupa pengarahan query pada table – table yang tepat dan penjadwalan eksekusi query. 2.1.10.6 Detailed Data Komponen ini menyimpan semua detil dalam skema basis data. Pada umumnya beberpa data tidak disimpan secara fisik, tetapi dapat dilakukan dengan cara agregasi. Secara periodik data detil ditambahkan ke data warehouse untuk mendukung agregasi data. 2.1.10.7 Lighly and Highly S ummarized Data Komponen ini menyimpan semua data yang diringkas oleh warehouse manager. Data perlu diringkas dengan tujuan untuk mempercepat performa query. Ringkasan data terus diperbaharui seiring dengan adanya data yang baru yang masuk ke dalam data warehouse. 2.1.10.8 Archive / Backup Data Komponen ini menyimpan data detil dan ringkasan data dengan tujuan untuk menyimpan dan backup data. Walaupun ringkasan yang diperoleh dari data mendetil, ringkasan perlu di backup juga apabila data tersebut disimpan melampaui periode penyimpanan data detil. Data kemudian dipindahkan ke media penyipanan seperti magnetic tape atau optical disc.
25 2.1.10.9 Meta-data Komponen ini menyimpan semua definisi meta-data(informasi mengenai data) yang digunakan dalam proses dalam data warehouse. Meta-data digunakan untuk berbagai tujuan, antara lain : a . Proses extracting dan loading, meta-data digunakan untuk memetakan sumber data dalam data warehouse. b . Proses manajemen warehouse, meta-data digunakan untuk menghasilkan tabel ringkasan (summarized tables). c . Sebagai bagian dari proses manajemen query, meta-data digunakan untuk mengarahkan sebuah query pada sumber data yang tepat. 2.1.10.10 End-User Access Tools Tujuan utama dari data warehouse adalah dengan menyediakan informasi bagi pengguna untuk pembuatan keputusan yang strategis dalam berbisnis. Para pengguna berinteraksi dengan data warehouse menggunakan end-user access tools. Berdasarkan kegunaan data warehouse, terdapat lima kategori end-user access tools, yaitu : a. Reporting and Query Tools Reporting tools meliputi production reporting tools dan reports writers. Production reporting tools digunakan untuk menghasilkan laporan operasional secara berkala. Query tools untuk relasional data warehouse dirancang untuk menerima SQL atau menghasilkan SQL statements untuk proses query data yang tersimpan di warehouse.
26 b. Application Development Tools Application development tools menggunakan graphical data acsesss tools yang dirancang khusus untuk lingkungan clientserver. Beberapa aplikasi perlu diintegrasikan dengan OLAP tools, dan dapat mengakses semua sistem basis data utama. c. Executive Information S ystem (EIS ) Tools EIS sering dikenal sebagai ‘everyone’s information systems’ (sistem informasi setiap orang). Awalnya dikembangkan untuk mendukung pembuatan kebutuhan toplevel yang strategis. Akan tetapi, kemudian meluas mendukung semua tingkat manajemen. EIS tools pada awalnya berhubungan dengan mainframes yang memungkinkan
para pengguna
untuk
membangun
aplikasi
pendukung keputusan yang bersifat grafik untuk menyediakan sebuah overview mengenai data perusahaan dan akses pada sumber data eksternal. Kini, EIS banyak dilengkapi dengan fasilitas query dan menyediakan custombuild applications untuk area bisnis seperti penjualan, pemasaran, dan keuangan. d. Online Analytical Processing (OLAP) Tools OLAP tools didasarkan pada konsep basis data yang bersifat multi-dimensi dan memperbolehkan pengguna untuk menganalisis data dari sudut pandang yang kompleks dan multidimensi. Alat bantu ini mengasumsikan bahwa data diatur dengan model multidimensi yang khusus (M DDB) atau sebuah relational basis data yang dirancang untuk memungkinkan query multi-dimensi.
27 e. Data Mining Tools Data mining adalah proses menemukan kolerasi, pola, dan tren yang baru yaitu dengan melakukan penggalian pada sejumlah data menggunakan teknik statistik, matematis, dan artificial intelligenten
(AI).
Data
mining
memiliki
potensi
untuk
menggantikan kemampuan OLAP tools.
Gambar 2. 6 Arsitektur data warehouse
(Sumber : Connolly, 2005, p1157)
2.1.11 Konsep Pemodelan Data warehouse M enurut
Connolly
(2005,p1183),
permodelan
dimensional
menggunakan konsep permodelan Entity-Relationship (ER) dengan beberapa batasan - batasan penting. Setiap model dimensional tersusun dari satu tabel dengan sebuat composite primary key , dinamakan tabel fakta, dan satu set tabel - tabel yang lebih kecil yang bernama tabel dimensi. Setiap table dimensi mempunyai sebuah primary key sederhana (non-composite) yang berhubungan
28 dengan satu komponen dari composite key di tabel fakta. Dengan kata lain, primary key dari tabel fakta dibuat dari dua atau lebih foreign key . 2.1.11.1
Tabel Fakta
M enurut Ralph Kimbal,M argy Ross(2002,p16) tabel fakta adalah tabel utama dalam model dimensi dimana numerik pengukuran kinerja bisnis yang disimpan.
Gambar 2. 7 Contoh
Tabel Fakta (Sumber : Kimball, 2002, p17)
Tabel fakta pada umumnya memiliki sebuah primary key, dan biasanya di sebut composite atau concatenated key. Setiap tabel dalam model dimensi memiliki composite key, dan tabel yang memiliki composite key adalah tabel fakta.
Dan setiap tabel yang memiliki
hubungan meny to meny (banyak –ke -banyak) harus menjadi tabel fakta dan yang lainnya menjadi tabel dimensi. 2.1.11.2
Tabel Dimensi
M enurut Ralph Kimbal,M argy Ross(2002,p18) tabel dimensi adalah sebuah tabel yang memiliki banyak kolom atau atribut. Atribut ini menggambarkan baris dalam tabel dimensi, dan setiap dimensi didefinisikan oleh satu primary key. Ditunjuk oleh notasi PK, yang berfungsi sebagai dasar untuk penghubung antara tabel dimensi dengan tabel fakta.
29
Gambar 2. 8 Contoh
2.1.11.3
Tabel Dimensi (Sumber : Kimball, 2002, p20)
S tar schema
M enurut
Ralph
Kimbal,M argy
Ross(2002,p
414)
star
schema(skema bintang) adalah representasi generik model dimensi dalam database relasional dimana tabel fakta yang memiliki composite key bergabung ke sejumlah tabel dimensi, dimana masing – masing memiliki primary key. M enurut Connolly(2005, p1183) keuntungan Star schema: a . Respon data lebih cepat dari pada perancangan databas e oprasional. b . M empermudah dalam hal modifikasi atau pengembangan data warehouse yang terus menerus. c . End-user dapat menyesuaikan cara berfikir dan menggunakan data.
30 d . M enyederhanakan pemahaman dna penelusuran Metadata bagi pemakai dan pengembang. Beberapa jenis star schema, antara lain: 1. Skema bintang sederhana Dalam skema bintang sederhana, terdapat sebuah tabel di kelilingi oleh tabel dimensi. Tabel fakta dan tabel dimens i dihubungkan dengan surrogate key. 2.
Skema bintang dengan beberapa Tabel Fakta Skema bintang juga dapat berisi dengan beberapa tabel fakta.
Tabel semacam ini digunakan untuk jumlah data besar dan bermacam tingkat data yang terintegrasi. 3. Skema bintang dengan tabel dimensi tambahan Tabel dimensi mungkin juga mengandung foreign key yang mereferensikan foreign key di tabel dimensi lain. Tabel dimens i yang direferensikan ini dinamakan outbord atau secondary dimension table.
Gambar 2. 9 Contoh Star
schema (Sumber : Kimball, 2002, p22)
31 2.1.11.4
Snowflake S chema
M enurut Connolly(2002, p1080) skema snowflake adalah bentuk lain dari skema bintang dimana tabel dimensi tidak mengandung data yang telah didenormalisasi. Keuntungan Snowflake Schema, antara lain: a. Kecepatan memindahkan data dari data OLTP ke dalam Metadata. b. Sebagai kebutuhan dari alat pengambil keputusan tingkat tinggi dimana dengan tipe yang seperti ini seluruh struktur dapat digunakan sepenuhnya. c. Banyak yang beranggapan lebih nyaman merancang dalam bentuk normal ketiga.
32
Gambar 2. 10 Contoh Snowflake Schema (Sumber : Boyle, 2005
2.1.12 Anatomi Data warehouse Penerapan awal dari arsitektur data warehouse dibuat berdasarkan konsep bahwa
data
warehouse
mengambil
data
dari
berbagai
sumber
dan
memindahkannya ke dalam pusat pengumpulan data yang besar. Konsep ini sebenarnya lebih cenderung kepada sebuah lingkungan mainframe yang terpusat. Keunggulan teknologi Client Server memungkinkan data warehouse diterapkan dalam berbagai macam cara untuk menampung kebutuhan pemakai sistem secara lebih proposional. Dalam suatu kasus, misalkan saja pemakai tertentu perlu menggabungkan data dari sebuah sistem pengumpulan data yang
33 statis dengan data dari sistem operasional yang dinamis hanya dengan sebuah query saja. Berikut ini adalah tiga jenis dasar sistem Data warehouse : 1. Functional Data warehouse (Data warehouse Fungsional) Kata operasional disini merupakan database yang diperoleh dari kegiatan
sehari-hari. Data
warehouse dibuat
lebih
dari satu
dan
dikelompokkan berdasar fungsi-fungsi yang ada di dalam perusahaan seperti fungsi keuangan(financial), marketing, personalia dan lain-lain. Keuntungan dari bentuk data warehouse seperti ini adalah, sistem mudah dibangun dengan biaya relatif murah sedangkan kerugiannya adalah resiko kehilangan konsistensi data dan terbatasnya kemampuan dalam pengumpulan data bagi pengguna. 2. Centralized Data warehouse (Data warehouse Terpusat) Bentuk ini terlihat seperti bentuk data warehouse fungsional, namun terlebih dahulu sumber data dikumpulkan dalam satu tempat terpusat, kemudian data disebar ke dalam fungsinya masing-masing, sesuai kebutuhan persuhaan. Data warehouse terpusat ini, biasa digunakan oleh perusahaan yang belum memiliki jaringan eksternal. Keuntungan dari bentuk ini adalah data benar-benar terpadu karena konsistensinya yang tinggi sedang kerugiannya adalah biaya yang mahal serta memerlukan waktu yang cukup lama untuk membangunnya. 3. Distributed Data warehouse (Data warehouse terdistribusi) Pada data warehouse terdistribusi ini, digunakan gateway yang berfungsi sebagai jembatan penghubung antara data warehouse dengan
34 workstation yang menggunakan sistem beraneka ragam. Dengan sistem terdistribusi seperti ini memungkinkan perusahaan dapat mengakses sumber data yang berada diluar lokasi perusahaan(eksternal). Keuntungannya adalah data tetap konsisten karena sebelum data digunakan data terlebih dahulu di sesuaikan atau mengalami proses sinkronisasi.
Sedangkan
kerugiannya adalah
lebih
kompleks
untuk
diterapkan karena sistem operasi dikelola secara terpisah juga biaya nya yang paling mahal dibandingkan dengan dua bentuk data warehouse lainnya. 2.1.13 SQL IndraJani(2008,page
178).
SQL adalah
bahasa basis
data yang
memungkinkan user untuk melakukan pembuatan struktur relasi dan basis data,melakukan operasi penyisipan,perubahan, dan penghapusan data dari tabel, dan melakukan query sederhana dan kompleks. Harus dapat dipindahkan sehingga memungkinkan untuk pindah dari satu DBM S ke DBM S lainnya. Create nama table ( namaID varchar, nama varchar ) insert into nama table values() 2.1.14 Istilah-Istilah dalam Data warehouse Beberapa istilah-istilah yang berhubungan dengan data warehouse antara lain :
35 2.1.15.1 ETL M enurut
Ralph
Kimbal,M argy
Ross(2002,p
401)
Extract-
transform-load (ETL) adalah Serangkaian proses dimana operasional sumber data dipersiapkan untuk gudang data. Dan merupakan proses utama dari backroom data staging area dari data warehouse, untuk memprioritaskan persentasi atau query. Yang terdiri dari penggalian data operasional dari suatu source,application, transforming, loading and indexing , quality-assuring, and publishing . M enurut Vincent Rainardi(2008,p2) ETL adalah system yang memiliki kemampuan untuk terhubung ke sumber system, membaca data, dan mengubah data, sistem ETL kemudian mengintegrasikan, mengubah,
dan muatan data ke dalam penyimpanan data dimensi
(DDS). 2.1.15.2 DDS M enurut Vincent Rainardi (2008,p2) DDS adalah database yang menyimpan data warehouse di dalam OLTP dengan format yang berbeda. Alasan pertama untuk mendapatkan suatu data dari system sumber ke dalam DDS dan kemudian query system sumber secara langsung disusun ke dalam format dimensi yang lebih baik untuk melakukan analisis. Alasan kedua karena DDS berisikan data yang terintegrasi dari beberapa system sumber.
36 2.1.15.3 OLTP (On-Line Transaction Processing) M enurut Rainardi (2008,p2) OLTP adalah adalah sistem yang tujuan utamanya adalah untuk menangkap dan menyimpan transaksi bisnis. M enurut Connoly dan Begg (2005, p1149), “Online Transaction Processing (OLTP) is the systems that have been designed to handle high transaction throughput, with transactions typically making small changes to the organization's operational data, that is, data that the organization requires to handle it day-today ooperations”, yang berarti OLTP adalah suatu sistem yang telah dirancang untuk menangani jumlah hasil transaksi yang tinggi, dengan transaksi yang pada umumnya membuat perubahan yang kecil bagi data operasional organisasi. Oleh karena itu, data organisasi memerlukan penanganan operasinya setiap hari. 2.1.15.4 Online Analytical Processing (OLAP) M enurut Vincent Reinardi (2008, p14) OLAP adalah aktivitas interaktif dalam menganalisis data transaksi bisnis yang disimpan dalam dimensi, data warehouse untuk membuat keputusan bisnis yang taktis dan strategis. Contoh OLAP adalah untuk menganalisa dampak kenaikan harga terhadap penjualan produk diberbagai daerah dan kelompok produk pada priode waktu yang sama. M enurut
S.Prabhu.N
Venatesan(2007,p95)
adalah
kategori
teknologi perangkat lunak yang memungkinkan analis, manajer dan eksekutif untuk mendapatkan informasi tentang data dengan cepat,
37 konsisten, interaktif akses ke berbagai pandangan yang mungkin informasi yang telah berubah dari data mentah untuk mencerminkan dimensi nyata dari perusahaan sebagaimana yang dipahami oleh pengguna. Fungsi OLAP adalah ditandai dengan dinamis multi-dimensi analisis data perusahaan mendukung konsolidasi akhir pengguna analitis dan navigasi kegiatan termasuk: a. perhitungan dan pemodelan diterapkan di seluruh dimensi, melalui hierarki. b. analisis kecenderungan selama periode waktu berurutan. c. mengiris subset untuk on-layar tampilan. d. drill-down ke tingkat yang lebih dalam konsolidasi. e. mencapai-melalui data detail yang mendasari. 2.1.15 Perbedaan OLTP dengan Data warehouse M enurut S.Prabhu.N Venatesan(2007,p 84) perbedaan antara OLTP dengan Data warehouse adalah : Tabel 2. 1 Perbedaan Data Warehouse dan OLTP
Data warehouse Dirancang
utk
OLT P analisa
bisnis Dirancang untuk real time operasi
tindakan berdasarkan kategory dan bisnis attribut
38 Dioptimalkan untuk beban masal dan Dioptimalkan
untuk
besar kompleks,permintaan akses yg transaksi,biasanya
seperangat
menambahkan
atau mengambil satu baris pada
tak terduga
suatu waktu per table Sarat dengan konsisten data yg valid Dioptimalkan untuk validasi data tidak memerlukan real time
yg
masuk
Selama
transaksi
menggunakan data validasi tabel Mendukung
be berapa
pengguna Mendukung
ribuan
pengguna
secara bersamaan relatif terhadap secara bersamaan OLT P
2.1.16 Perbedaan OLTP dengan OLAP M enurut S.Prabhu.N Venatesan(2007,p86) perbedaan antara OLTP dengan OLAP adalah : Tabel 2. 2 Perbedaan OLTP dan OLAP
ADMIN Fungsi DB desain Data
Akses unit kerja Catatan diakses USER Ukuran DB Metrik
OLT P petugas, profesional T I operasi sehari-hari aplikasi berorientasi saat ini, up-to-date rinci, relasional datar terisolasi membaca / menulis index pendek, transaksi sederhana puluhan
OLAP pekerja pengetahuan pendukung keputusan subjek berorientasi multidimensi terintegrasi , konsolidasi banyak scan query yang kompleks juta
ribuan 100MB-GB
ratusan 100GB-T B
transaksi seluruh
seluruh permintaan, respon
39 2.2 Teori Khusus 2.2.1 Penjualan M enurut Basu Swastha dan Irawan (2003 : 18) definisi penjualan adalah "ilmu dan seni yang mempengaruhi pribadi yang dilakukan oleh pihak penjualan untuk mengajak orang lain agar bersedia membeli barang-barang atau jasa yang ditawarkan". M enurut Boockholdt(1999,p527),penjualan merupakan komponen ke4 dalam siklus aktifitas bisnis yang didefinisikan sebagai kegiatan menjual barang atau jasa guna meraup penghasilan bagi bisnis M enurut M ulyadi (2001,p204) kegiatan penjualan terdiri dari transaksi penjualan barang atau jasa baik secara kredit maupun tunai. Proses penjualan menurut cara pembayarannya dapat dibedakan sebagai berikut: a . penjualan tunai: Penjualan yang dilaksanakan oleh perusahaan dengan
cara
mewajibkan
pembeli
dengan
melakukan
pembayaran harga barang terlebih dahulu sebelum baran g diserahkan kepada pembeli. b . Penjualan Kredit:
Penjualan yang dilakukan dengan cara
memenuhi order dari pelanggan dengan mengirimkan baran g atau menyerahkan jasa dan untuk jangka waktu tertentu perusahaan memiliki piutang kepada pelanggannya.
40 2.2.2 Fungsi Penjualan M enurut M ulyadi(2001,p204) fungsi penjualan memiliki tanggung jawab untuk menerima order mengedit order meminta otorisasi kredit menentukan segala pengiriman dan transaksi penjualan. 2.2.3 E-Commerce M enurut O'Brien dan M arakas (2006,p23) E-commerce adalah proses pembelian dan penjualan serta pemasaran dan pelayanan dari produk servis dan informasi melalui jaringan komputer yang beragam. M enurut Chaudhury
dan Kuilboer (2002,p6), E-commerce
merupakan kegiatan pembelian dan penjualan pemasaran dan pelayanan pengiriman serta pembayaran barang jasa dan informasi melalui internet,intranet dan ekstranet dan jaringan lainnya antara perusahaan yang berbasis internet dengan palanggan,pemasok, dan rekan bisnis. 2.2.4 Framework M enurut Larry tenny and Zeeshan hirani(2010,p2) Framework adalah kumpulan dari teknologi untuk mengembangkan aplikasi yang menggunakan data. 2.2.5 Rancangan Framework M enurut Larry tenny dan Zeeshan Hirani(2010,p2) Rancangan Framework terbagi atas 3jenis yaitu: a. Conseptual layer mendefinisikan menciptakan entitas dan hubungannya
oleh
Language(CSDL).
Conceptual
Schema
Definition
41 b. Storage layer mendefinisikan penyimpanan data, termasuk tabel kolom dan tipe data oleh Store Skema Definition Language (SSDL). c. Mapping layer mendefinisikan bagaimana sifat pada entitas peta untuk kolom pada table. 2.2.6 Metode Framework M enurut Srivastava, A. & Thomson, S. B. (2009), yang di kutip dalam Research Note, terdapat 5(Lima) tahap dalam pembuatan suatu Framework, antara lain : a. Familiarization (S osialisasi) Familiarization
merupakan
suatu
proses
dimana
mengumpulkan sebuah data-data yang digunakan dengan sebuah metode seperti observasi. Dan melakukan pemilihan set data yang akan digunakan, Pemilihan akan tergantung pada beberapa aspek data koleksi proses seperti dalam kasus Generalisasi Data Warehouse memilih
data-data apa saja yang digunakan
berdasarkan dari database yang sudah ada dan menghasilkan sebuah hasil akhir berupa tabel yang dibutuhkan untuk data warehouse nantinya. b. Identifying
a
thematic
Framework
(Identifikasi
Kerangkan tematik) Identfikasi kerangka tematik, merupakan tahap kedua setelah melakukan Familiarization dimana melihat masalah yang ada pada data. Pada tahap ini mengambil informasi apa saja yang
42 dibutuhkan
melalui
Familiarization.
catatan
Dalam
yang
merancang
dibuat dan
selama
proses
menyempurnakan
kerangka tematis bukan merupakan proses yang otomastis tetapi membutuhkan pola fikir yang logis dan intuitif. Hal ini melibatkan pembuatan penilaian tentang relevansi dan hubungan implisit antara ide-ide.
Dalam kasus Generalisasi Data
Warehouse dibuatnya suatu pola fikir dimana tabel-tabel yang dibutuhkan akan berhubungan dengan dimensi-dimensi yang dibuat dan membuat pola atau rancangan yang nantinya akan dibutuhkan
untuk
perusahaan
yang
bergerak
dibidang
multifinance. c. Indexing (Pengindeksan) Indexing merupakan suatu proses yang merupakan bagian untuk mengidentifikasi semua data-data yang dibutuhkan. Dalam kasus Generalisasi Data Warehouse dimana melakukan observasi data seperti apa yang dibutuhkan oleh perusahaan yang bergerak dibidang multifinance. d. Charting Charting merupakan tahap ke 4(empat), dari tahap indexing dimana data-data yang di indekskan sudah diatur menjadi rapih, sehingga sudah dapat dilihat data-data yang benar-benar dibutuhkan. Dalam kasus Generalisasi Data Warehouse dimana ketika data-data yang dibutuhkan sudah terlihat akan dimulai membuat database yang baru sebagai hasil penyaringan dari data
43 awal, sehingga database ini akan digunakan dalam membuat data warehouse. e. Mapping
and
Interprestation
(Pemetaan
dan
Interprestasi) M erupakan tahap akhir, yaitu pemetaan dan interprestasi. Dimana pada tahap ini melibatkan analisis karateristik. Dan analisis ini harus sudah mampu untuk membimbing
dalam
menafsirkan terhadap data-data yang dibutuhkan. Dalam kasus Generalisasi Data Warehouse, ketika sudah melakukan analisis dari tahap-tahap sebelumnya maka kita sudah dapat membuatkan tabel-tabel yang dibutuhkan dari data awal sebelum dilakukannya generelisasi. Sehingga tabel-tabel tersebut sudah siap untuk digunakan dalam membangun data warehouse.