BAB 2 LANDAS AN TEORI
2.1
Teori Umum 2.1.1 Pengertian Data dan Informasi M enurut Turban(2003, p15), data ialah fakta mentah atau deskripsi dasar dari benda, peristiwa, aktivitas, dan transaksi yang didapatkan, direkam, disimpan, diklasifikasi tapi belum terorganisir untuk menyampaikan suatu arti spesifik. Contoh dari data, yaitu : nilai kuliah, saldo tabungan, dan gaji karyawan. M enurut Turban(2003, p15), informasi ialah suatu koleksi fakta (data)
yang telah
terorganisir
dengan
beberapa cara sehingga
memberikan suatu arti yang dipahami oleh penerima. Contoh dari informasi, yaitu : nilai kuliah yang disertai nama mahasiswa, saldo bank yang disertai nama nasabah, dan gaji yang disertai dengan nama karyawan. 2.1.2 Pengertian Basis Data M enurut Date(2000, p10), basis data ialah kumpulan data tetap yang digunakan oleh suatu sistem aplikasi pada beberapa perusahaan. Sedangkan menurut Connoly(2002, p14), basis data ialah suatu kumpulan data yang berhubungan secara logis disertai dengan deskripsi dari data tersebut yang dirancang khusus untuk memenuhi kebutuhan informasi suatu organisasi. 9
10
2.1.3 Pengertian Data Warehouse M enurut Inmon (2007,p7), data warehouse ialah suatu basis untuk proses informasi yang didefinisikan sebagai subject oriented, integrated, nonvolatile, time variant, dan a collection of data in support of management's decision. Sedangkan menurut Lane (2005,p1-1), data warehouse ialah suatu basis data relasional yang dirancang untuk query dan analisis dibandingkan untuk proses transaksi. Dilengkapi oleh Imhoff (2003,p13), yang menyatakan data warehouse berperan sebagai pusat integrasi. Dimana data yang terintegrasi menjadi langkah awal dalam menghasilkan sebuah informasi. Dari definisi-definisi tersebut, adapun tujuan yang ingin dicapai data warehouse yaitu : 1. Data warehouse menyediakan suatu pandangan ( view ) sehingga data
umum,
warehouse akan memiliki keleluasaan untuk
mengakomodasi bagaimana data akan ditafsirkan atau dianalisis selanjutnya. 2. Data warehouse merupakan tempat penyimpanan seluruh data historis. Data warehouse akan bertumbuh menjadi sangat besar sehingga harus dirancang untuk mengakomodasi pertumbuhan data. 3. Data warehouse dirancang untuk menyediakan data bagi berbagai teknologi analisis dalam komunitas bisnis. 2.1.4 Karakteristik Data Warehouse M enurut Inmon (2007,p7), Data Warehouse didefinisi dengan karakteristik sebagai berikut:
11
1. Subject oriented Subject oriented berarti bahwa data warehouse dibuat atau disusun
berdasarkan
pada
subjek
utama
dalam
lingkungan
perusahaan, bukan berorientasi pada proses atau fungsi aplikasi seperti yang terjadi pada lingkungan operasional. Sebagai contoh adalah sebuah perusahan asuransi, aplikasinya terdiri dari mobil, kesehatan, jiwa, dan kehilangan sedangkan pada data warehouse diatur berdasarkan pelanggan, polis, premi, dan klaim. 2. Integrated Data dalam data warehouse bersifat terintegrasi karena bersumber
dari
sistem-sistem
aplikasi yang berbeda
dalam
perusahaan. Sumber data demikian sering tidak konsisten, misalnya karena berbeda format. Sumber data yang terintegrasi ini harus dibuat konsisten untuk memberikan data yang seragam pada para pengguna. 3. Nonvolatile Data dalam data warehouse tidak di-update dalam real time melainkan diperbarui secara periodik dari sistem operasional. Data baru selalu ditambahkan sebagai tambahan bagi basis data, bukan sebagai pengganti. Basis data secara terus-menerus mengambil data baru,
menambahnya,
sebelumnya.
dan
mengintegrasikannya
dengan
data
12
4. Time Variant Data dalam data warehouse bersifat tepat dan valid dalam jangka waktu tertentu. Data dalam data warehouse terdiri dari serangkaian snapshot, masing-masing menunjukkan data operasional yang diambil pada suatu waktu tertentu. 5. A collection of data in support of management's decision Fungsi dari data historis dan manfaat dari data warehouse ialah untuk mendukung keputusan manajemen perusahaan. Sehingga dalam perancangan data warehouse harus disesuaikan dengan kebutuhan-kebutuhan tersebut.
13
2.1.5 Arsitektur Data Warehouse
Gambar 2.1 Arsitektur Data Warehouse M enurut Connolly (2002,p1052), komponen-komponen utama sebuah data warehouse antara lain : 1. Operational Data Data untuk data warehouse berasal dari: • Mainframe data operasional yang berada pada tingkatan basis data generasi pertama dan basis data jaringan. Diperhatikan sebagian besar data operasional perusahaan disimpan pada sistem tersebut. • Data departemen yang berada di sistem file seperti VSAM , RM S dan DBM S relasional (sepeti Infomix dan Oracle). • Data pribadi yang berada di server dan workstation pribadi.
14
• Sistem-sistem eksternal seperti internet, basis data yang tersedia secara komersil, dan basis data yang berhubungan dengan pemasok atau pelanggan perusahaan. 2. Operational Datastore Sebuah operational datastore (ODS) adalah sebuah tempat penyimpanan data operasional terkini dan terintegrasi, yang digunakan untuk kebutuhan analisis. ODS memiliki struktur dan sumber data yang sama dengan data warehouse, berperan sebagai tempat penyimpanan data sebelum dipindahkan ke data warehouse. ODS menyimpan data yang telah di-extract dari sistem sumber dan telah dibersihkan. Dengan demikian, proses pengintegrasian dan rekontruksi data untuk data warehouse menjadi lebih sederhana. 3. Load Manager Load manager melakukan semua operasi yang berhubungan dengan fungsi extracting / mengambil data dan fungsi loading / meletakkan data ke dalam data warehouse. Data dapat di-extract dari sumber-sumber data atau pada umumnya diambil dari operational datastore. Operasi yang dilakukan load manager dapat berupa transformasi data yang sederhana untuk mempersiapkan pemasukan data ke dalam data warehouse. Ukuran dan kompleksitas komponen ini akan berbeda sesuai dengan data warehouse yang
15
dirancang dan dapat dibangun menggunakan kombinasi antara vendor loading tools dan custom-build programs. 4. Warehouse Manager Warehouse manager
melakukan
semua operasi yang
berhubungan dengan manajemen data dalam data warehouse. Komponen ini dibangun menggunakan vendor data management tools dan custom-build programs. Operasi yang dilakukan oleh data warehouse manager berupa: • M elakukan analisis data untuk menjaga konsistensi data. • M elakukan transformasi dan penggabungan sumber data dari penyimpanan sementara ke dalam tabel-tabel data warehouse. • M enciptakan index dan view pada base tables. • M elakukan denormalisasi (jika diperlukan). • M elakukan agregasi (jika diperlukan). • M elakukan back-up dan archive / backup data. 5. Query Manager Query manager melakukan semua operasi yang berhubungan dengan management user queries. Komponen ini dibangun menggunakan vendor end-user data access tools, data warehouse monitoring tools, fasilitas basis data, dan custom build-in programs. Kompleksitas queries manager ditentukan oleh fasilitas yang disediakan oleh end-user access tools dan basis data. Operasi yang
16
dilakukan komponen ini berupa pengarahan query pada tabel-tabel yang tepat dan penjadwalan eksekusi query. 6. Detailed Data Komponen ini menyimpan semua data detil dalam skema basis data. Pada umumnya beberapa data tidak disimpan secara fisik, tetapi dapat dilakukan dengan cara agregasi. Secara periodik data detil ditambahkan ke data warehouse untuk mendukung agregasi data. 7. Lightly and Highly Summarized Data Komponen ini menyimpan semua data yang diringkas oleh warehouse manager. Data perlu diringkas dengan tujuan untuk mempercepat performa query. Ringkasan data terus diperbarui seiring dengan adanya data yang baru yang masuk ke dalam data warehouse. 8. Archive / Backup Data Komponen ini menyimpan data detil dan ringkasan data dengan tujuan untuk menyimpanan dan backup data. Walaupun ringkasan yang diperoleh dari data mendetil, ringkasan perlu dibackup juga apabila data tersebut disimpan melampaui periode penyimpanan data detil. Data kemudian dipindahkan ke media penyimpanan seperti magnetic tape atau optical disc.
17
9. Meta-data Komponen
ini menyimpan
semua definisi meta-data
(informasi mengenai data) yang digunakan dalam proses dalam data warehouse. Meta-data digunakan untuk berbagai tujuan, antara lain: • Proses extracting dan loading, meta-data digunakan untuk memetakan sumber data dalam warehouse. • Proses manajemen warehouse, meta-data digunakan untuk menghasilkan tabel ringkasan (summarized tables). • Sebagai bagian dari proses manajemen query, meta-data digunakan untuk mengarahkan sebuah query pada sumber data yang tepat. 10. End-User Access Tools Tujuan utama dari data warehouse adalah menyediakan informasi bagi pengguna untuk pembuatan keputusan yang strategis dalam berbisnis. Para pengguna berinteraksi dengan data warehouse menggunakan end-user access tools. Berdasarkan kegunaan data warehouse, terdapat lima kategori end-user access tools, yaitu: • Reporting and Query Tools Reporting tools meliputi production reporting tools dan report writers. Production reporting rools digunakan untuk menghasilkan laporan operasional secara berkala.
18
Query tools untuk relasional data warehouse dirancang untuk menerima SQL atau menghasilkan SQL statements untuk proses query data yang tersimpan di warehouse. • Application Development Tools Application development tools menggunakan graphical data access tools yang dirancang khusus untuk lingkungan client-server. Beberapa aplikasi tersebut diintegrasikan dengan OLAP tools, dan dapat mengakses semua sistem basis data utama. • Executive Information System (EIS) Tools EIS sering dikenal sebagai ‘everyone’s information systems’
(sistem
informasi
setiap
orang).
Awalnya
dikembangkan untuk mendukung pembuatan kebutuhan top-level yang strategis. Akan tetapi, kemudian meluas untuk mendukung semua tingkat manajemen. EIS tools pada awalnya berhubungan dengan mainframes yang memungkinkan para pengguna untuk membangun aplikasi pendukung keputusan yang bersifat grafik untuk menyediakan sebuah overview mengenai data perusahaan dan akses pada sumber data eksternal. Kini, EIS banyak dilengkapi dengan fasilitas query dan menyediakan custom-build applications untuk area bisnis seperti penjualan, pemasaran dan keuangan.
19
• Online Analytical Processing (OLAP) Tools OLAP tools didasarkan pada konsep basis data yang bersifat multi-dimensi dan memperboleh pengguna untuk menganalisis data dari sudut pandang yang kompleks dan multidimensi. Alat bantu ini mengasumikan bahwa data diatur dengan model multi-dimensi yang khusus (M DDB) atau oleh sebuah relational basis data yang dirancang untuk memungkinkan quer y multi-dimensi. • Data Mining Tools Data mining adalah proses menemukan kolerasi, pola, dan tren yang baru yaitu dengan melakukan penggalian pada sejumlah data menggunakan teknik statistik, matematis, dan artificial intelligent (AI). Data mining memiliki potensi untuk menggantikan kemampuan OLAP tools.
20
2.1.6 Anatomi Data Warehouse Berikut adalah tiga jenis dasar dari sistem anatomi data warehous e yaitu: 1.
Functional Data Warehouse Data
warehouse
dibuat
lebih
dari
satu
dan
dikelompokkan berdasarkan masing-masing fungsi yang ada didalam perusahaan seperti fungsi keuangan, fungsi marketing, fungsi kinerja personalia, dan lain-lainnya. Keuntungan dari bentuk ini adalah sistem mudah dibangun dengan biaya yang relatif murah sedangkan kerugiannya adalah resiko kehilangan konsistensi data dan terbatasnya kemampuan dalam pengumpulan data bagi pengguna.
Gambar 2.2 Functional Data Warehouse
21
2.
Centralized Data Warehouse Data warehouse terpusat adalah pendekatan yang paling baik digunakan. Hal ini disebabkan karena pemakai sudah biasa dengan lingkungan mainframe terpusat. Data diambil dari seluruh sistem operasional dan disimpan di dalam pusat penyimpanan data. User kemudian menggunakan data yang telah terkumpul tersebut untuk membangun data warehouse fungsional, masingmasing sesuai dengan kebutuhannya. Keuntungan sistem ini dibandingkan dengan data warehouse fungsional adalah bahwa data benar-benar terpadu. Jika ada perubahan pada data warehouse pusat, maka perubahan data harus disalurkan kepada data warehouse fungsional. Pada sistem ini pengguna hanya dapat mengambil data dari pusat pengumpulan saja dan tidak dapat berhubungan secara langsung dengan pemasok datanya sendiri.
22
Penerapan sistem ini membutuhkan biaya pemeliharaan yang tinggi untuk sistem pengumpulan data yang besar. Selain itu diperlukan waktu yang lama untuk membangun sistem tersebut.
Gambar 2.3 Centralized Data Warehouse 3.
Distributed Data Warehouse Data warehouse terdistribusi dikembangkan berdasarkan konsep gateway data warehouse, sehingga memungkinkan user dapat langsung berhubungan dengan sumber data atau pemasok data maupun dengan pusat pengumpul data lainnya. Pada sistem ini data akan ditampilkan kepada pengguna seolah-olah berasal dari satu sumber, namun sebenarnya data dapat saja diambil dari berbagai sumber yang berbeda.
23
Pendekatan ini menggunakan teknologi client-server untuk mengambil data dari berbagai sumber, sehingga memungkinkan tiap departemen atau divisi untuk membangun sistem operasionalnya sendiri serta dapat membangun pengumpulan data fungsionalnya masingmasing dan menggabungkan bagian-bagian tersebut dengan teknologi client-server. Pendekatan ini akan menjadi sangat efektif bila data tersedia dalam bentuk yang konsisten dan user dapat menambahkan data tersebut dengan informasi baru apabila ingin membangun gambaran baru atas informasi. Penerapan data warehouse terdistribusi ini memerlukan biaya yang sangat besar karena setiap pengumpulan data fungsional dan sistem operasinya dikelola secara terpisah. Selain itu, supaya berguna bagi perusahaan, data yang ada harus disinkronisasikan untuk memelihara keterpaduan data.
Gambar 2.4 Distributed Data Warehouse
24
2.1.7
Data Mart Data mart adalah sebuah bagian dari data warehouse yang mendukung kebutuhan sebuah departemen atau fungsi bisnis tertentu. Sebuah data mart menyimpan sebagian data dalam data warehouse, biasanya berupa data berisi ringkasan yang berhubungan dengan sebuah departemen atau fungsi bisnis tertentu. Karakteristik yang membedakan data mart dan data warehouse antara lain: • Se buah data mart berfokus hanya pada kebutuhan pengguna yang berhubungan dengan sebuah departemen atau fungsi bisnis. • Data mart biasanya tidak berisi data operasional yang mendetil, tidak seperti data warehouse. • Karena data mart berisi data yang lebih sedikit dibandingkan dengan data warehouse, data mart lebih mudah dimengerti. Ada beberapa pendekatan untuk membangun data mart. Salah satunya adalah membangun beberapa data mart yang akan berkelanjutan untuk diintegrasikan menjadi sebuah data warehouse. Pendekatan lainnya adalah dengan membangun infrastruktur data warehouse perusahaan pada saat yang bersamaan dibangun pula satu data mart atau lebih untuk memenuhi kebutuhan bisnis yang berlangsung.
25
2.1.8 ETL (Extraction Transformation Loading) ET L merupakan suatu proses yang diperlukan dalam membentuk struktur model dimensi (Dimensional Model). Proses ini terdiri dari 3 tahap yaitu : 1. Extraction Merupakan sebuh proses penarikan data dari satu atau lebih sistem operasional sebagai sumber data (pada umumnya diambil dari sistem database OLTP, namun dapat juga berupa sumber data di luar sistem database). 2. Transformation Merupakan
sebuah
proses
untuk
mempersiapkan
atau
membersihkan data yang telah diambil pada proses extract sehingga data tersebut dapat sesuai dengan struktur data warehouse atau data mart. Hal ini tidak mudah dilakukan, karena : •
Data harus digabungkan dari beberapa sistem yang terpisah, misalnya beberapa sumber dapat saja menyimpan data yang sama namun dengan struktur yang berbeda.
•
Data harus dibersihkan sehingga konsisten, dan diterapkannya penggunaan surrogate key yang merupakan sebuah key yang menghubungkan struktur data warehouse dan terpisah dari sistem sumber.
•
Data harus diagregasi untuk mempercepat analisis.
26
3. Loading Merupakan sebuah proses penyimpanan data yang telah ditransformasi ke dalam sebuah database relational baik berupa data warehouse ataupun data mart. Selanjutnya data dapat dipindahkan dari data mart ke dalam data warehouse, atau dapat juga dari data warehouse pusat didistribusikan ke data mart. Komponen dari ETL melakukan banyak tugas, antara lain: •
Konversi data secara logika
•
Verifikasi domain
•
Konversi dari satu DBMS ke yang lain
•
Menghasilkan nilai default jika diperlukan
•
Meringkas data
•
Menambahkan waktu pada kunci
•
Rekontruksi kunci
•
Menggabungkan records
•
Menghapus data berlebih atau redundant.
27
2.1.9 Perbedaan Antara OLTP dan Data Warehouse 1
Workload Data warehouse dirancang untuk menyediakan data yang terintegrasi yang dapat mengakomodasi ad hoc queries maupun segala bentuk query yang mungkin dieksekusi oleh pengguna. Sedangkan suatu sistem OLTP hanya perlu mendukung operasi yang telah ditentukan, sehingga sistem tersebut dipercepat dan dirancang khusus untuk mendukung operasi tersebut.
2
Data Modification Data warehouse di-update secara periodik melalui proses ETL (Extract, Transportation, Tranform and Load) dan pengguna tidak
secara
langsung
melakukan
update
terhadap
data
warehouse. Sedangkan suatu sistem OLTP, pengguna secara rutin menjalankan perintah untuk melakukan modifikasi terhadap data dalam basis data, sehingga data dalam basis data OLTP selalu terupdate untuk merefleksi status pada setiap transaksi bisnis.
28
3
Schema Design Data warehouse biasanya menggunakan skema yang telah didenormalisasi
seluruhnya
maupun
sebagian
untuk
mengoptimalisasi performa query. Sedangkan sistem OLTP biasanya menggunakan skema yang telah dinormalisasi untuk mengoptimalkan
performa
update/insert/delete,
dan
untuk
menjamin konsistensi data. 4
Typical Operations Query data warehouse biasanya men-scan ribuan atau miliyaran baris data. Query OLTP biasanya hanya mengakses beberapa baris.
5
Historical Data Data warehouse biasanya menyimpan data berbulan-bulan bahkan
bertahun-tahun,
sedangkan
sistem
OLTP
hanya
menyimpan data historis yang diperlukan agar kesuksesan transaksi sekarang.
29
2.1.10 Model Data 2.1.10.1 Entity Relationship Modelling (ER Modelling) M enurut Connolly (2005, p342), ER Modelling adalah sebuah pendekatan top-down untuk perancangan basis data yang dimulai dengan mengidentifikasi data yang penting yang disebut entites dan relationship antar data harus direpresentasikan dalam model. 2.1.10.2 Di mensi onali ty Modeli ng Dimensionality modeling merupakan sebuah t eknik perancangan logikal yang bert ujuan unt uk menampilkan dat a dalam bent uk st andar dan memiliki akses performa t inggi. Dimentionality Modeling menggunakan konsep ER modeling dengan beberap a larangan. Set iap Dimentionality Model t erbent uk dari sat u t abel dengan primary k ey yang biasa disebut dengan t abel fakt a, dan serangkaian t abel yang lebih kecil yang disebut t abel dimensi. T iap t abel dimensi memiliki sebuah primary k ey yang berhubungan dengan sebuah komponen composite k ey pada t abel fakt a. Dengan kat a lain, primary k ey pada t abel fakt a, t erbent uk dari dua at au lebih foreign k ey. St rukt ur karakt erist ik yang menyerupai bint ang ini disebut skema bint ang.
30
Hal pent ing lainnya dari Dimensionality Model yait u semua Natural k ey digant ikan dengan surrogate k ey, dimana set iap penggabungan dengan t abel fakt a harus menggunakan surrogate k ey, bukan natural k ey. Set iap surrogate k ey harus memiliki st rukt ur umum berdasarkan integer
yang
sederhana.
Penggunaan
surrogate
k ey
memperbolehkan dat a pada data warehouse t idak memiliki ket ergant ungan dengan dat a pada sist em OLT P. 2.1.10.3 Perbedaan model Dimensionality Modelling dan Entity Relationship Entity Relationship Modelling merupakan sebuah t eknik unt uk mengident ifikasi hubungan ant ara ent itas. Fungsi ut ama dari model ER adalah unt uk menghilangkan perulangan dat a (data redundancy). Hal ini mengunt ungkan dalam pemrosesan t ransaksi, karena t ransaksi-t ransaksi t ersebut menjadi lebih sederhana. Cont ohnya: Pada proses updat e nama produk, akan lebih mudah apabila hanya melakukan updat e unt uk satu record pada t abel master daripada harus mengupdat e banyak record unt uk set iap t ransaksi. M odel ER t idak mendukung perancangan data mart, karena performanya kurang baik dala m analisis dat a secara masal.
31
Kunci ut ama yang dapat
digunakan
dalam
memahami hubungan ant ara ER dengan DM yait u: sebuah model ER pada umumnya dibagi menjadi beberapa model DM . M odel DM saling berhubungan melalui t abel-t abel dimensi. 2.1.11 Tabel Fakta dan Tabel Dimensi Dalam skema bintang terdapat 2 tipe tabel yaitu tabel fakta dan tabel dimensi. Skema bint ang memiliki dua macam t abel, yait u: 1. T abel Fakt a (fact table) T abel fakt a sering disebut juga seba gai t abel mayor. T abel ini merupakan int i dari skema bint ang dan berisi dat a akt ual yang akan dianalisis. Kolom-kolom yang dapat dianalisis pada t abel fakt a disebut measure. Primary k ey pada t abel ini berupa gabungan foreign k ey ke t abel-t abel dimensi (composite k ey). T abel ini dapat t erdiri dari banyak kolom dan ribuan baris dat a. Measure pada t abel fakt a biasanya berupa bilangan numerik dan dapat dijumlahkan karena aplikasi data mart hampir t idak pernah mengakses sat u baris record saja, melainkan mengakses rat usan, ribuan, bahkan jut aan record pada saat yang bersamaan.
32
2. T abel Dimensi (dimension table) T abel dimensi sering disebut sebagai t abel minor. T abel dimensi biasanya lebih kecil dan berisi dat a yang merupakan deskripsi lebih lanjut dari dat a yang ada pada t abel fakt a. M engandung informasi yang berupa t eks dan bersifat deskript if. At ribut dimensi digunakan sebagai bat asan pada query data warehouse. 2.1.12 Skema Bintang Sederhana dan S kema Bintang Majemuk Dengan penggunaanya terdapat 2 jenis skema bintang yang tergantung dengan kebutuhan, yaitu Skema Bintang Sederhana dan Skema Bintang M ajemuk yang akan terinci lebih lanjut berikut ini: 1. Skema Bintang Sederhana Dalam skema bintang sederhana, setiap tabel mempunyai primary key yang terdiri dari sebuah kolom atau lebih. Primary key akan membuat setiap baris menjadi unik. Primary key tersebut pada tabel fakta akan menjadi foreign key. Primary key pada tabel fakta, terdiri dari satu atau lebih foreign key.
33
Gambar 2.5 Skema Bintang Sederhana Pada gambar menunjukan hubungan antara satu tabel fakta dan tiga tabel dimensi. Tabel utama terdapat primary key yang terdiri dari tiga foreign key, yaitu kunci-1, kunci-2 dan kunci-3, yang masing–masing merupakan primary key di tabel masingmasing. Dalam sebuah skema bintang, dapat juga memiliki lebih dari satu tabel fakta, karena adanya fakta yang tidak saling berhubungan. Tabel semacam ini umumnya digunakan untuk jumlah data yang besar dan untuk berbagai macam tabel data yang teragregasi
34
Gambar 2.6 Skema Bintang Dengan Beberapa Tabel Fakta Pada gambar diatas terdapat dua tabel fakta dan tiga tabel dimensi yang memperlihatkan hubungan many to one antara foreign key pada kedua tabel fakta tersebut dengan primary key pada masing-masing tabel dimensi. Tabel dimensi mungkin juga mengandung foreign key yang mereferensikan primary key di tabel dimensi yang lain. Tabel dimensi yang direferensikan secondary dimension table.
ini dinamakan outboard atau
35
Gambar 2.7 Skema Bintang Dengan Tabel Dimensi Tambahan 2. Skema Snowflake M enurut Connoly (2002,p1080), “Snowflake schema is a variant of the star schema where dimension table do not contain denormalized data.”, dapat diartikan skema bintang adalah bentuk lain dari skema bintang dimana tabel dimensi tidak berisi data yang didenormalisasi. Suatu tabel dimensi dapat memiliki tabel dimensi lainnya. Ciri-ciri snowflake adalah: 1. Tabel dimensi dinormalisasi dengan dekomposisi pada
level
atribut. 2. Setiap dimensi mempunyai satu key untuk setiap level pada hirarki dimensi.
36
3. Kunci level terendah menghubungkan tabel dimensi dengan tabel fakta dan tabel atribut berlevel rendah.
Gambar 2.8 Skema Snowflake
37
2.1.13 Tipe Model Data
Gambar 2.9 Tipe-tipe M odel Data Sebuah model data ialah suatu abstraksi atau representasi dari data pada lingkungan tertentu. Setiap model data biasanya terdiri dari entitas, atribut dan hubungan antar entitas. M enurut Imhoff (2003, p35), terdapat beberapa tipe model data, yaitu: a) Subject Area Model M odel area subjek ialah pengelompokkan benda (barang, manusia, peristiwa, konsep, dan lainnya) yang bersangkutan dengan suatu perusahaan. Selain memiliki manfaat sebagai cetakan biru untuk business data model, model ini juga bermanfaat sebagai panduan
dalam pemilihan
warehouse.
dan
pengembangan
proyek data
38
SAM terdiri dari dua komponen yaitu : 1. Subject Area Subject Area sesuai dengan penamaannya merupakan suatu area atau pengelompokkan atas beberapa benda yang berhubungan secara erat. Contohnya, prospect/calon pembeli, owner/pemilik
dan
debtor/pelangan
yang
menanggung
pembayaran dapat dikelompokkan menjadi suatu subject area customers/pelanggan yang merupakan penamaan umum yang dapat merepresentasikan ketiga jenis pelanggan tersebut.
Custom
Debtor
Prospe t
Customers
Owner
Gambar 2.10 Contoh penentuan subject area
39
2. Connection Connection ini melambangkan hubungan antar 2 subject area yang berhubungan secara langsung. Contoh dari connection ini dapat dilihat pada transaksi reservasi unit properti yang telah dikelompokkan menjadi bagian dari subject area sales dan prospect. Sebab proses reservasi tersebut memerlukan prospect maka dapat disimpulkan bahwa subject area customers berhubungan dengan subject area sales.
Reservation Transaction
Reservation
Prospect
Customers
Sales
Gambar 2.11 Contoh penentuan connection dalam suatu proses bisnis
b) Business Data Model M odel ini memberikan pandangan (view) yang konsisten dan stabil terhadap informasi-informasi perusahaan dan hubungan antara informasi tersebut. M odel ini dapat dijadikan sebagai dasar dalam penemuan, evaluasi dan respon terhadap perubahaan bisnis. M anfaat
utama
model
inilah
untuk
konfirmasi
intepretasi
pengembang software terhadap informasi perusahaan sesuai dengan
40
pandangan
pihak
perusahaan,
sehingga
model
ini
dapat
diimplementasikan lebih lanjut menjadi sistem model contohnya seperti, operational system model, data warehouse model dan data mart model. BDM digambarkan dengan model relasional dalam bentuk 3NF sehingga komponen yang terdapat dalam BDM terbatas pada entitas yang terdapat pada subject area(s) yang telah ditentukan pada suatu iterasi pengembangan. c) System Model Sebuah model sistem merupakan kumpulan dari entitas untuk merepresentasi
kebutuhan informasi suatu sistem atau
fungsional seperti, sistem reservasi hotel dan data warehouse tanpa memikirkan implementasi fisik terhadap suatu teknologi atau DBM S. d) Technology Model M odel ini ialah sistem model dengan disertai pertimbangan implementasi pada teknologi atau DBM S tertentu. Dua teknologi yang biasanya mempengaruhi dalam perancangan model ini ialah spesifikasi hardware dan DBM S yang digunakan.
41
2.1.14 Metode Perancangan Model Data Warehouse Sistem data warehouse dikembangkan dengan menerapkan 8 langkah proses tranformasi pada model data bisnis yang dikembangkan oleh Imhoff(2003, p98). Kedelapan langkah tersebut ialah sebagai berikut: 1. M emilih data yang dibutuhkan Proses pemilihan data yang dibutuhkan tersebut dimulai dengan proses analisis terhadap model data bisnis perusahaan dan inputan sekunder lainnya ialah struktur basis data sistem operasional, laporan
yang
dihasilkan
perusahaan,
kebutuhan
informasi
perusahaan dan prototype dari data mart yang akan dihasilkan. Setelah
proses
analisis,
maka
proses
selanjutnya
ialah
mengelompokkan atribut sumber data menjadi 3 yaitu data yang dibutuhkan (contohnya, kuantitas penjualan, nilai penjualan), data yang tidak dibutuhkan (contohnya, tanggal update terakhir) dan data yang mungkin dibutuhkan (contohnya, diskon). Pertanyaan yang perlu ditanya pada setiap atribut ialah 'apakah data tersebut dibutuhkan untuk analisis strategis?'. Untuk kelompok yang ketiga, jika atribut tersebut merupakan data transaksi maka direkomendasi untuk dipertahankan dan jika merupakan data referensi maka dibuang.
42
2. M enambahkan waktu pada kunci Perspektif historis dicapai pada data dibutuhkan dengan hanya menambahkan waktu ke setiap key pada entitas. Saat tahap ini sedang berjalan, akan terjadi perubahan pada model yang disebabkan oleh perubahan cardinality pada entitas yang disebut resultant manyto-many relationship. Terdapat 5 pendekatan pemecahan terhadap hubungan tersebut yang ditampilkan pada gambar 2.12. 1. M enghasilkan dual foreign key 2. M embuat suatu serial key pada entitas induk untuk setiap kejadian dan menyimpan identifier dan waktu bukan sebagai atribut kunci. 3. M enjamin integritas data dengan cara pemrograman. 4. Segregasi data ke dalam entitas yang berisi data historis dan data baru. 5. M empertahankan entitas utama dengan elemen data yang tidak pernah berubah dan menghasilkan entitas bagi atribut yang dapat berubah
Gambar 2.12 Pendekatan untuk merefleksi perspektif historis 43
44
3. M enambahkan data turunan Data turunan ialah data yang merupakan hasil dari kalkulasi dari 2 atau lebih elemen data. Data turunan dimasukkan ke dalam data warehouse atas 2 alasan yaitu untuk menjamin konsistensi data dan untuk mempercepat penyampaian data. Contoh dari data turunan misalnya laba bersih, agar konsisten untuk seluruh perusahaan dimasukkan kedalam data warehouse. Untuk mengetahui apakah suatu data turunan harus dimasukkan ke dalam data warehouse atau data mart ialah jika digunakan oleh banyak data mart maka supaya data menjadi konsisten diletakkan pada data warehouse. 4. M enentukan tingkat granularitas Langkah ini melakukan pengaturan terhadap tingkat kedetilan data / granularitas. Tahap ini sangatlah penting karena 2 alasan. Pertama,
menentukan
pertanyaan
yang dapat
dijawab
data
warehouse. Kedua, menjadi penentu dalam ukuran data warehouse yang akan berdampak pada biaya, performa dan bertambahnya pertimbangan teknis. Langkah ini bersamaan dengan langkah pertama.
45
5. M eringkas data Tujuan dari melakukan langkah ini ialah untuk melakukan pengurangan terhadap data detil (disimpan pada media alternatif) bukan online-storage, sebagai standarisasi bagi kegiatan analisis dan meningkatkan performa penyampaian data. 6. M engabungan Entitas Pengabungan entitas untuk meningkatkan proses menyampaian data dengan mengurangi jumlah join dan meningkatkan konsistensi. Terdapat
3
kriteria yang pertimbangan
sebelum melakukan
pengabungan, yaitu : dapat dilekatkan dengan suatu kunci, data sering digunakan bersama dan pola insert yang serupa. 7. M enghasilkan Arrays Langkah ini sangat jarang digunakan, tapi pada situasi tertentu meningkatkan performa penyampaian data mart yang memiliki arrays. Langkah ini dapat dilakukan hanya jika kriteria dibawah ini terpenuhi • Tingkat terjadinya kecil. M isalnya menciptakan array dari penjualan 50 cabang ialah tidak cocok.
46
• Data dalam array sering digunakan secara bersamaan. M isalnya saat analisis penjualan bulanan yang membandingkan penjualan mingguan. • Tingkat terjadinya dapat diprediksi. M isalnya terdapat 4 sampai 5 minggu dalam 1 bulan. • Pola insert dan penghapusan serupa. M isalnya sering di-update secara bersamaan. 8. M ensegregasi data Untuk dapat melakukan langkah ini perlu melakukan analisis terdapat stabilitas (apakah data tersebut sering berubah) dan pemakaian (bagaimana data disampaikan ke data mart). Sehingga pada langkah terakhir ini pemodel harus mempertimbangkan bagaimana pemasukkan dan penyampaian data. 2.1.15 Metode Perancangan Data Mart 1
M emilih proses bisnis yang akan dimodel M endengarkan requirement pengguna merupakan cara paling efektif untuk memilih proses bisnis. M erupakan hal yang penting untuk tidak menyamakan proses bisnis dengan proses departemen dan fungsional sehingga dapat menyampaikan informasi yang konsisten untuk seluruh perusahaan.
47
2
Deklarasi grain dari proses bisnis M endeklarasi
alur
berarti
menjelaskan
apa
yang
dilambangkan oleh setiap baris pada tabel fakta. M isalnya, setiap baris merupakan boarding pass untuk masuk ke pesawat atau snapshot bulanan terhadap suatu tabungan. 3
M emilih dimensi yang diperlukan tiap baris pada tabel fakta Jika alur telah jelas maka penentuan dimensi merupakan hal yang mudah yaitu dengan menambahkan dimensi yang menjelaskan tabel fakta. M isalnya jika fakta merupakan boarding pass maka dimensinya dapat berupa penerbangan yang digunakan.
4
Identifikasi fakta numerik yang akan diisi setiap baris pada tabel fakta Fakta ditentukan dengan menjawab pertanyaan 'apa yang sedang kita ukur?'. Untuk menentukan fakta tersebut maka perlu mempertimbangkan kebutuhan analisis pengguna dan sumber data. Fakta biasanya ialah merupakan nilai numerik, seperti kuantitas dan nilai uang.
48
2.2
Teori Khusus 2.1.1 Pengertian Penjualan Properti Dalam kamus besar bahasa Indonesia, penjualan berarti proses, cara, perbuatan menjual. M enjual sendiri berarti memberikan sesuatu kepada orang lain untuk memperoleh uang pembayaran atau menerima uang. Sedangkan properti berarti harta berupa tanah dan bangunan serta sarana dan prasarana yang merupakan bagian yang tidak terpisahkan dari tanah dan/atau bangunan yang dimaksudkan. Dengan kata lain, Penjualan properti ialah proses, cara tindakan memberikan harta berupa tanah bangunan serta sarana dan prasana kepada orang lain untuk memperoleh uang pembayaran. 2.2.2 Pengertian Persediaan Properti Dalam kamus besar bahasa Indonesia, persediaan ialah barang yang dimiliki untuk dijual atau untuk diproses selanjutnya dijual. Berdasarkan pengertian di atas, persediaan properti ialah barang berupa tanah bangunan yang siap untuk dijual atau diproses selanjutnya.
49
2.2.3 Pengertian Pembayaran Cicilan Dalam kamus besar bahasa Indonesia, pembayaran berarti proses,
cara,
perbuatan
membayar.
M embayar
sendiri berarti
memberikan uang (untuk pengganti harga barang yang diterima, melunasi utang, dsb). Sedangkan cicilan berarti uang untuk mencicil. M encicil sendiri berarti membayar sesuatu sedikit demi sedikit. Dengan kata lain, pembayaran cicilan ialah proses, cara dan tindakan memberikan uang sedikit demi sedikit untuk menggantikan barang atau jasa yang diterima.