BAB 2 LANDASAN TEORI
2.1
Teori – Teori Umum
2.1.1 Pengertian Database Menurut Thomas Connolly dan Carolyn Begg (2010, p65), database adalah koleksi dari berbagai data secara logis yang terkait, dan deskripsi dari data ini dirancang untuk memenuhi kebutuhan informasi suatu organisasi. Menurut Coronel, Morris, dan Rob (2012, p7), database adalah struktur komputer yang terintegrasi yang menyimpan koleksi dari end-user data(fakta baku untuk kepentingan pengguna) dan metadata(data yang menjelaskan data).
2.1.2 Pengertian Data Warehouse Menurut Ajit Singh (2011, p1, volume1), data warehouse adalah sistem kompleks yang terdiri dari banyak komponen yang menyimpan highly-aggregated data for decision support. Menurut Thomas Connolly dan Carolyn Begg (2010, p1197), data warehouse adalah sebuah koleksi data yang terdiri dari subject-oriented, integrated, time variant, dan non volatile yang mendukung manajemen dalam proses pengambilan keputusan.
8
9
Menurut Thomas Connolly, Carolyn Begg, dan Richard Holowczak (2008, p444), data warehouse adalah sebuah sistem basis data yang dirancang untuk mendukung keputusan dengan menyajikan sudut pandang yang terintegrasi terhadap data perusahaan yang disalin dalam sumber data yang berbeda. Menurut Steve Williams dan Nancy Williams (2007, p201) data warehouse adalah sebuah struktur data yang dioptimalkan untuk distribusikan. Ia mengoleksi dan menyimpan data historis yang diintegrasikan dari berbagai sistem operasional dan mengumpan satu atau lebih datamart. (Standar definisi dari institusi data warehouse). Menurut Coronel, Morris, dan Rob (2012, p10),data warehouse adalah database khusus untuk menyimpan data dalam bentuk optimal untuk mendukung keputusan.
2.1.3 Karakteristik Data Warehouse Karakteristik pada data warehouse menurut Thomas Connolly dan Carolyn Begg (2010, p1197) adalah sebagai berikut: a. Subject-oriented Data warehouse harus berorientasi pada subjek yaiu data warehouse dibuat berdasarkan subjek-subjek utama di didalam bisnis (seperti kontrak konstruksi, nilai kontrak, dan jenis bangunan). b. Integrated Data warehouse harus terintegrasi karena sumber-sumber data warehouse berasal dari berbagai lingkungan bisnis dengan sistem aplikasi yang berbeda.
10
Sumber data yang terintegrasi harus dibuat konsisten untuk menampilkan tampilan data kepada user. c. Time variant Data warehouse hanya akurat dan valid pada beberapa poin dalam waktu atau dalam waktu atau dalam interval waktu tertentu. d. Non-volatile Data tidak di update dalam waktu nyata tetapi di refresh dari sistem orepasional secara rutin. Data baru selalu ditambahkan sebagai suplemen untuk database, bukan pengganti. 2.1.4 Manfaat Data Warehouse Menurut Mutaz M. Al-Debei (2011, p155-156, Issue33), berbagai macam manfaat berwujud dan tidak berwujud dapat diperoleh dari aplikasi data warehouse. Teknologi data warehouse dapat membantu manajer membuat keputusan yang lebih efektif dengan menyediakan informasi yang digunakan dalam operasi bisnis sehari – hari mereka.
Gambar 2.1 Manfaat data warehouse (European Journal of Economics, Finance and Administrative Sciences, 2011, p156)
11
Menurut Thomas Connolly dan Carolyn Begg (2010, p1198), kesuksesan dalam mengimplementasi data warehouse bisa memberikan manfaat besar bagi organisasi, meliputi: 1. Adanya kemungkinan balik modal yang tinggi pada investasi.
Suatu organisasi harus memberikan sumber daya yang besar untuk menjamin kesuksesan dalam membuat data warehouse dan biayanya bervariasi tergantung dari solusi teknis yang ada. Namun, kemungkinan adanya kondisi balik modal terhadap biaya yang dikeluarkan untuk investasi data warehouse relatif lebih besar. Sehingga tidak perlu ada kekhawatiran akan anggapan adanya pemborosan untuk investasi data warehouse ini. 2. Keuntungan yang kompetitif
Adanya kemungkinan balik modal yang besar terhadap investasi merupakan bukti adanya keuntungan kompetitif dengan adanya teknologi ini. Keuntungan kompetitif ini dicapai dengan memungkinkan para pengambil keputusan untuk mengakses data sebelumnya tidak tersedia, tidak diketahui, atau informasi yang tidak tercatat. 3. Meningkatkan produktivitas para pengambil keputusan di perusahaan.
Data warehouse dapat memungkinkan hal ini dengan mengtransformasikan data menjadi informasi yang berarti. Teknologi ini menyediakan para manajer bisnis untuk dapat melakukan analisis yang lebih konsisten sehingga pada akhirnya terjadi peningkatan produktivitas.
12
2.1.5 Online Transaction Processing (OLTP) Menurut Steve Williams dan Nancy Williams (2007, p201), OLTP adalah program pengolahan real-time untuk tujuan operasional (bukan analitis) seperti pencatatan deposit nasabah bank di mesin teller otomatis atau pelacakan pesanan pelanggan baru. Menurut Coronel, Morris, dan Rob (2012, p9), OLTP adalah database yang dirancang untuk mendukung operasi perusahan sehari-hari. Menurut Thomas Connolly, Carolyn Begg, dan Richard Holowczak (2008, p548), OLTP adalah sistem database untuk proses bisnis seperti pengendalian persedian, faktur pelanggan, dan point-of-sale. Sistem ini menghasilkan data operasional yang rinci, saat ini, dan dapat berubah. Menurut Thomas Connolly dan Carolyn Begg (2010, p1199) perbandingan karakteristik utama sistem OLTP dan data warehouse dijelaskan pada tabel berikut ini: Tabel 2.1 Perbedaan OLTP system dan data warehouse (Thomas Connolly dan Carolyn Begg, 2010, p1199)
13
2.1.6 Arsitektur Data Warehouse
Gambar 2.2 Arsitektur Data Warehouse (Thomas Connolly dan Carolyn Begg, 2010, p1204)
Menurut Thomas Connolly, dan Carolyn Begg (2010, p1203-1207), Komponenkomponen utama data warehouse terdiri atas: 1. Operational Data Source Sumber data untuk data warehouse diberikan dalam bentuk: -
Mainframe operasional data dalam database hirarki generasi pertama dan jaringan database.
-
Departmental data dalam sistem file prorietary seperti VSAM, RMS, dan relational DBMS seprti informix dan oracle.
-
Private data diselenggarakan pada workstation dan private servers.
-
External system seperti database, internet tersedia secara komersial atau database yang terkait dengan suppliers organisasi atau customers.
2. Operational Data Store Arus repositori dan integrasi data operasional yang digunakan untuk analisis.
14
3. Load Manager Load manager bertugas melaksanakan semua operasi yang berhubungan dengan extraction dan loading data ke dalam warehouse, termasuk transformasi data sederhana sebagai persiapan data untuk dimasukkan ke dalam warehouse. Menurut Karina Novita Suryani dan Hira Laksmiwati Zoro (2012, p165, vol.1) bahwa secara umum proses ETL bisa dibagi menjadi empat modul utama yaitu: -
Ekstrasi Data, data dari sumber diekstraksi dan biasanya langsung ditulis ke dalam sebuah disk sementara dengan beberapa rekonstruksi minimal (karena nantinya akan ada tahapan konversi/transformasi)
-
Pembersihan Data, untuk menyaring data yang tidak diperlukan seperti data yang tidak lengkap, data yang hilang, data yang terduplikasi, dan lainlainnya.
-
Transformasi Data, data yang telah dibersihkan kemudian diubah agar sesuai dengan format basis data sumber.
-
Pemasukan Data, data akan dimasukkan ke dalam relasi target di dalam data warehouse agar data siap di-query.
4. Warehouse Manager Warehouse manager berupa: -
Melakukan analisis data untuk menjaga konsistensi data.
-
Melakukan transformasi dan penggabungan sumber data dari penyimpanan sementara ke dalam tabel-tabel data warehouse.
-
Menciptakan index dan view pada base tables.
-
Melakukan agregasi. (jika diperlukan)
-
Melakukan back-up dan archieve / back-up data.
15
5. Query Manager Query manager melakukan semua operasi yang berhubungan dengan management user queries. Kompleksitas queries manager ditentukan oleh fasilitas yang disediakan oleh end-user access tools dan basis data. Operasi yang dilakukan komponen ini berupa pengarahan query pada tabel yang tepat dan penjadwalan eksekusi query. 6. Detailed Data Komponen ini menyimpan semua data detail dalam skema database. Pada umumnya beberapa data tidak disimpan secara fisik tetapi dapat dilakukan dengan cara agregasi. Secara periodik data detail ditambahkan ke data warehouse untuk mendukung agregasi data. 7. Lightly and Highly Summarized Data Komponen ini menyimpan semua data yang diringkas oleh warehouse manager. Data perlu diringkas dengan tujuan untuk mempercepat kinerja query. Rangkuman data turut diperlukan seiring dengan adanya data yang baru masuk ke dalam data warehouse. 8. Archieve / Back-up Data Komponen ini menyimpan data detail dan ringkasan data dengan tujuan untuk menyimpan dan back-up data. Walaupun ringkasan yang diperoleh dari data mendetail, ringkasan perlu di back-up juga apabila data tersebut disimpan melampaui periode penyimpanan data detail.
16
9. Metadata Komponen ini menyimpan semua definisi metadata (informasi mengenai data) yang digunakan dalam proses dalam data warehouse. Metadata digunakan untuk berbagai tujuan, antara lain: -
Proses extracting dan loading, metadata digunakan untuk menentukan sumber data dalam data warehouse.
-
Proses warehouse management, metadata digunakan untuk menghasilkan tabel ringkasan.
-
Sebagai bagian dari proses query management, metadata digunakan untuk mengarahkan sebuah query pada sumber data yang tepat.
10. End-user Access Tools Tujuan utama dari data warehouse adalah menyediakan informasi bagi pengguna untuk pembuatan keputusan yang strategis dalam berbisnis. Para pengguna berintetaksi dengan data warehose menggunakan end user access tools. Berdasarkan kegunaan data warehouse, terdapat lima kategori end-user access tools, yaitu: -
Reporting and Query Tools Reporting tools meliputi production reporting tools dan report writers. Production reporting tools digunakan untuk menghasilkan laporan operasional secara berkala. Query Tools untuk relasional data warehouse dirancang untuk menerima SQL, dan proses query data yang tersimpan di warehouse.
17
-
Application Development Tools Application Development Tools menggunakan graphical data access tools yang dirancang khusus untuk lingkungan client-server. Beberapa aplikasi tersebut diintegrasikan dengan OLAP tools, dan dapat mengakses semua database system utama.
-
Executive Information System (EIS) Tools EIS sering dikenal sebagai “everyone’s information system” (sistem informasi setiap orang). Awalnya dikembangkan untuk mendukung pembuatan kebutuhan top-level yang strategis. Akan tetapi, kemudian meluas untuk mendukung semua tingkat manajemen. EIS
tools
pada
awalnya
berhubungan
dengan
mainframes
yang
memungkinkan para pengguna untuk membangun aplikasi pendukung keputusan yang bersifat grafik untuk menyediakan sebuah overview mengenai data perusahaan dan akses pada sumber data eksternal. Kini, EIS banyak dilengkapi dengan fasilitas query dan menyediakan custom-build applications untuk area bisnis seperti penjualan, pemasaran dan keuangan. -
Online Analytical Processing (OLAP) Tools OLAP
tools
didasarkan
pada
konsep
database
yang
bersifat
multidimensional dan memperbolehkan pengguna untuk menganalisis data dari sudut pandang yang kompleks dan multidimensi. Alat Bantu ini mengasumsikan bahwa data diatur dengan model multidimensi yang khusus (MDDB) atau oleh sebuah relationaldatabase yang dirancang untuk memungkinkan query multidimensi.
18
-
Data Mining Tools Data mining adalah proses menemukan korelasi, pola dan tren yang baru, yaitu dengan melakukan penggalian sejumlah data menggunakan teknik statistik, matematis, dan artificial intelligent (AI). Data mining memiliki potensi untuk menggatikan kemampuan OLAPtools.
2.1.7 Konsep Pemodelan Data Warehouse 2.1.7.1 Entity Relationship Modelling (ER Modelling) Menurut Thomas Connolly dan Carolyn Begg (2010, p342), ERModelling adalah sebuah pendekatan top–down untuk perancangan basis data yang mulai dengan mengindentifikasi data yang penting disebut entites dan relationship antar data harus direpresentasikan dalam model. Menurut Ms. Alpa R. Patel dan Jayesh M. Patel(2012, p240, vol2(2)), model ER diwakili oleh diagram ER, yang menggunakan tiga simbol grafis dasar untuk konsep data: entitas, relasi, dan atribut. -
Entitas Entitas didefinisikan sebagai orang, tempat, benda, atau peristiwa yang menarik bagi bisnis atau organisasi. Entitas merupakan kelas obyek, dimana merupakan hal-hal di dunia nyata yang dapat diamati dan digolongkan oleh sifat dan karakteristik.
-
Relasi Sebuah relasi dihubungkan dengan garis yang ditarik antara entitas. Ini menggambarkan interaksi struktural dan asosiasi di antara entitas dan model. Sebuah hubungan gramatikal ditunjuk oleh kata kerja, seperti memiliki,
19
milik, dan memiliki. Hubungan antara dua entitas dapat didefinisikan dalam hal kardinalitas. Ini adalah jumlah maksimum contoh satu kesatuan yang berhubungan dengan satu kejadian di tabel lain dan sebaliknya. Kardinalitas yang mungkin adalah: satu-ke-satu(1:1), satu-ke-banyak (1:M), dan banyakke-banyak (M:M). -
Atribut Atribut menggambarkan karakteristik properti dari entitas. Untuk klarifikasi, penamaan atribut konvensi adalah hal yang sangat penting. Nama atribut harus unik dalam suatu entitas dan harus cukup jelas. Ketika sebuah instance tidak memiliki nilai atribut, kardinalitas minimum atribut adalah nol, yang berarti baik nullable atau opsional. Dalam pemodalan ER, jika kardinalitas maksimum
atribut
lebih
dari
1,
pemodel
akan
mencoba
untuk
menormalisasikan entitas dan akhirnya meningkatkan entitas lainnya. Oleh karena itu, biasanya kardinaliatas maksimum atribut adalah 1.
2.1.7.2 Dimensionality Modelling Menurut Thomas Connolly dan Carolyn Begg (2010, p1227) dimensionality modeling adalah teknik logical design yang bertujuan untuk menyajikan data standar, bentuk intuitif yang memungkinkan untuk mengakses high performance. Dimensionality modeling menggunakan konsep dari Entity Relationship (ER) dengan beberapa batasan yang penting. Setiap Dimensional model terdiri dari satu buat tabel yang memiliki banyak Primary key (composite Primary key), yang disebut tabel dimensi (dimensional table). Setiap tabel dimensi memiliki satu buah (non-composite)
20
primary key yang berhubungan dengan salah satu
primarykey di tabel fakta.
Karakteristik ini disebut skema bintang (strar schema) atu starjoin.
Menurut Ms. Alpa R. Patel dan Jayesh M. Patel(2012, p242, vol2(2)), Pemodelan multidimensi adalah teknik untuk konseptualisasi dan memvisualisasi model data sebagai serangkaian langkah-langkah yang dijelaskan oleh aspek umum dari bisnis. Hal ini terutama berguna untuk merangkum dan menata ulang data dan menyajikan view dari data untuk mendukung analisis data. Pemodelan multidimensi berfokus pada data numerik, seperti nilai-nilai, jumlah, berat, saldo, dan kejadian pemodelan. Multidimensi memiliki beberapa konsep dasar: fakta, dimensi, dan ukuran (variable).
2.1.8 Komponen Dimensionality Modeling 2.1.8.1 Tabel Fakta (Fact table) Menurut Thomas Connolly dan Carolyn Begg (2010, p1227), every dimensional model (DM) is composed of one table with a composite primary key, called the fact table”, yang berarti suatu tabel pada dimensional model (DM) yang isinya satu table dengan composite primary key (PK), di sebut dengan fact table. Jadi primary key (PK) pada tabel fakta merupakan beberapa foreign key. Disebut juga tabel utama (major table), merupakan inti dari skema bintang dan berisi data aktual yang akan dianalisis (data kuantitatif dan transaksi). Tabel fakta adalah tabel yang umumnya mengandung angka dan data historis di mana key (kunci) yang dihasilkan sangat unik karena key-nya merupakan kumpulan foreign key dan primary key yang ada pada masing-masing tabel dimensi yang berhubungan atau merupakan tabel terpusat dari skema bintang. Tabel fakta menyimpan tipe-tipe measure
21
yang berbeda, seperti measure, yang secara langsung terhubung dengan tabel dimensi dan measure yang tidak berhubungan dengan tabel dimensi.
2.1.8.2 Tabel Dimensi (Dimensional Table) Menurut Thomas Connolly dan Carolyn Begg(2010, p1227),
tabel dimensi
(Dimensional Table) a set of smallertables called dimension tables”, yang berarti sekumpulan tabel-tabel yang lebih kecil dari fact table pada dimensional model (DM), disebut dimension tables. Setiap dimension tables mempunyai non-composite primary key. Disebut juga tabel kecil (minor table), biasanya lebih kecil dan memegang data deskriptif yang mencerminkan dimensi suatu bisnis. Tabel dimensi adalah tabel yang berisikan kategori dengan ringkasan detail data yang dapat dilaporkan seperti laporan keuntungan pada tabel fakta dapat dilaporkan sebagai dimensi waktu (yang berupa per bulan, perkuartal, dan pertahun).
2.1.9 Komponen Dimensionality Modeling 2.1.9.1 Star Schema Menurut Thomas Connolly dan Carolyn Begg(2010, p1227), Star Schema adalah model dimensional datayang memiliki fact table di tengah,dikelilingi oleh denormalized dimension tables. Selain itu star schema memudahkan end user untuk memahami struktur database pada data warehouse yang di rancang. Keuntungan dari penggunaan star schema: 1. Respon data lebih cepat daripada perancangan database operasional.
22
2. Mempermudah dalam hal modifikasi atau pengembangan data warehouse yang terus menerus. 3. End-user dapat menyesuaikan cara berpikir dan menggunakan data. 4. Menyederhanakan pemahaman dan penulusuran metadata bagi pemakai dan pengembang.
Gambar 2.3Star Schema (dimensional model) for property sales of Dream Homes (Thomas Connolly dan Carolyn Begg, 2010, p1228)
2.1.9.2 Snowflake Schema Menurut Thomas Connolly dan Carolyn Begg(2010, p1229), snowflake schema adalah model dimensional data yang memiliki fact table di tengah, dikelilingi oleh normalized dimension tables. Keuntungan dari skema snowflake: 1. Kecepatan memindahkan data dari data OLTP ke dalam metadata.
23
2. Sebagai kebutuhan dari alat pengambilan keputusan tingkat tinggi dimana dengan tipe yang seperti ini seluruh struktur dapat digunakan sepenuhnya. 3. Banyak yang beranggapan lebih nyaman merancang dalam bentuk normal ketiga.
Gambar 2.4 Part of star schema (dimensional model) for property sales of Dream Home with normalized version of Branch dimension table (Thomas Connolly dan Carolyn Begg, 2010, p1229)
2.1.9.3 Starflake Schema Menurut Thomas Connolly dan Carolyn Begg(2010, p1229), starflake schema adalah modeldimensional data yang memilikifact table di tengah,dikelilingi olehnormalized dan denormalized dimension tables.
24
Gambar 2.5Starflake Schema (Thomas Connolly dan Carolyn Begg, 2010, p1229)
2.1.10 Kekurangan Data Warehouse Menurut Ofori Boateng (2011, p230, vol5(2)), data warehouse tidak optimal dalam lingkungan data tidak terstruktur dikarenakan: -
Karena data harus diekstrak, transform, dan dimuat ke dalam data warehouse, ada unsur keterlambatan data dalam data warehouse.
-
Biaya yang tinggi.
-
Data warehouse bisa usang dalam tempo yang relatif cepat.
-
Duplikasi fungsional mahal mungkin harus dikembangkan.
25
2.2 Teori Khusus 2.2.1 Teori Penjualan Mengacu pada pendapat Kotler (2006, p457), penjualan merupakan proses dimana pembeli dan penjual dipertemukan karena adanya suatu kebutuhan, melalui pertukaran informasi dan ketertarikan suatu kebutuhan. Penjualan membutuhkan dorongan dengan menggunakan iklan atau publish kepada masyarakat luas untuk menampilkan dorongan efektivitas antara penjual dan pembeli. Dengan adanya informasi yang ditarik keluar, maka penjualan barang atau jasa tertentu menjadi meningkat sesuai berjalannya waktu Penjualan merupakan kegiatan yang dilakukan oleh para pengusaha untuk menawarkan barang atau jasa sesuai dengan kebutuhan masing – masing pihak. Penjualan sendiri memiliki fungsi yang penting dalam perputaran suatu nilai, dimana nilai tersebut berguna untuk memenuhi kebutuhan hidup setiap orang 2.2.2 Teori Pembelian Menurut Mulyadi (2008,p316), Pembelian adalah serangkaian tindakan untuk mendapatkan barang dan jasa melalui pertukaran, dengan maksud untuk digunakan sendiri atau dijual kembali. 2.2.3 Teori Retur Menurut Achun (2010,p1), retur penjualan adalah pengembalian barang dari pelanggan karena hal tertentu mungkin karena rusak dalam perjalanan atau pengiriman barang yang tidak memenuhi spesifikasi yang diinginkan pelanggan.