BAB 2 LANDASAN TEORI 2.1. Teori Umum 2.1.1. Pengertian Data, Informasi dan Pengetahuan Data Menurut
Vercellis
(2009,
p7),
pada
umumnya
data
merepresentasikan kodifikasi terstruktur dari suatu entitas primer tunggal, serta transaksi yang melibatkan dua atau lebih entitas utama. Menurut Turban & Rainer (2009, p6), data adalah fakta mentah atau deskripsi dasar dari benda, peristiwa, aktivitas dan transaksi yang didapatkan, direkam, disimpan, diklasifikasi tetapi belum terorganisir untuk menyampaikan suatu arti spesifik. Sedangkan menurut Williams & Sawyer (2011, p25), data terdiri dari fakta-fakta, dan gambaran mentah yang akan diproses menjadi informasi. Data penting karena pengguna memerlukan data untuk membuat informasi yang berguna. Informasi Menurut Vercellis(2009,
p7), Informasi adalah suatu hasil
dari ekstraksi dan pemrosesan data menjadi sesuatu yang berarti bagi yang menerimanya dalam domain tertentu. Menurut Turban & Rainer (2009, p6), informasi adalah suatu koleksi fakta (data) yang telah terorganisir dengan beberapa cara sehingga memberikan suatu arti yang dipahami oleh penerima.Dan menurut Williams & Sawyer (2011, p25), informasi merupakan data yang telah di rangkum atau dimanipulasi dalam bentuk lain untuk tujuan pengambilan keputusan.
7
8 Pengetahuan Menurut Vercelis (2009, p7), Informasi diubah menjadi pengetahuan
bila
digunakan
untuk
membuat
keputusan
dan
mengembangkan tindakan yang sesuai. 2.1.2. Pengertian Sistem Menurut O’Brien & Marakas (2011, p26), sistem didefinisikan sebagai sekumpulan komponen yang saling terkait, dengan batas yang jelas, bekerja sama untuk mencapai suatu serangkaian tujuan umum dengan menerima input dan menghasilkan output dalam proses transformasi yang terorganisir. Menurut William & Sawyer (2011, p492), sistem adalah kumpulan dari komponen-komponen yang berhubungan yang saling berinteraksi
untuk
melakukan suatu tugas untuk mencapai suatu
tujuan.
2.1.3. Pengertian Database Menurut Connolly & Begg (2015, p63), database adalah sekumpulan dari data logika yang saling berhubungan dan gambaran dari data tersebut, dirancang untuk memenuhi kebutuhan informasi sebuah organisasi. Menurut Williams & Sawyer (2011, p164), database adalah setiap koleksi data yang disimpan secara elektronik dalam sistem komputer. 2.1.4. Pengertian Database Management System (DBMS) Menurut Management memungkinkan
Connolly
System
&
Begg
adalah
sistem
pengguna
untuk
(2015,
p64),
perangkat
lunak
mendefinisikan,
memelihara, dan mengontrol akses ke dalam database.
Database yang
membuat,
9 Komponen – kompenen DBMS Menurut Connolly & Begg (2015, 66) yakni sebagai berikut : •
Hardware
•
Software
•
Data
•
Procedures
•
People
Gambar 2.1 – DBMS Environment Sumber : Connolly & Begg (2015, p66) 2.1.5. Pengertian Data Warehouse Menurut Connolly & Begg (2015, p123), Data Warehouse adalah Sebuah data konsolidasi atau terintegrasi yang ada pada perusahaan yang diambil dari sumber data operasional yang berbeda dan berbagai alat untuk memudahkan akses pengguna sehingga mendukung pengambilan keputusan. Dikutip dari jurnal sepsugiarto (2011) Datawarehouse memilik Banyak keuntungan yang tidak terlihat, salah satu keuntungannya adalah para pembuat keputusan pada akhirnya dapat diperlengkapi dengan pemecahan masalah pada setiap proses bisnis. Banyak teknologi lain yang menjamin manajer untuk mengotomasikan proses bisnis, namun khasanah data mendukung kemampuan untuk memberi pengertian
mengenai
permasalahan
yang
mereka
alami
dan
menunjukkan beberapa kemungkinan perubahan. Data Warehouse
10 adalah alat bantu bagi para manajer dalam penyimpanan history data yang dibutuhkan. Keuntungan utama dari data warehouse adalah membantu dalam proses pengambilan keputusan. Keuntungan yang lain adalah meliputi: •
mengatur keseluruhan hubungan/peluang pelanggan
•
menciptakan nilai tambah bagi pelanggan
•
membangun suatu empati dari organisasi
•
secara cepat mengontrol berbagai perubahan dan
•
peluang mengatur perspektif baik makro maupun mikro
•
meningkatkan kemampuan manajerial. Dan menurut Turban, Sharda, Delen, & King (2011, p52), data
warehouse adalah kumpulan data yang dihasilkan untukmendukung pengambilan keputusan. danjuga merupakan tempat penyimpanan data saat ini dan data historikal dari kepentingan manager di seluruh organisasi. Sedangkan Menurut Vercellis(2009, p45) seperti namanya, data warehouse adalah repository utama untuk ketersediaan data, untuk mengembangkan arsitektur business intelligence dan untuk mendukung sistem pengambilan keputusan. Istilah Data Warehouse menunjukkan seluruh rangkaian kegiatan yang saling terkait yang terlibat dalam merancang, menerapkan dan menggunakan Data Warehouse. Hal ini memungkinkan untuk mengidentifikasi tiga kategori utama data feeding ke Data Warehouse yaitu; internal data, external data and personal data.
2.1.5.1.
Kategori Utama Data Feeding
2.1.5.1.1.
Internal Data Menurut Vercellis (2009, p46), data internal merupakan bagian terbesar dalam penyimpanan yang disimpan di dalam database , disebut juga sebagai system transaksional atau system operasional, yang merupakan tulang punggung dari sebuah sistem informasi perusahaan. Data internal diperoleh melalui
11 transaksi aplikasi yang secara rutin memimpin operasi perusahaan, seperti administrasi, akuntansi, produksi danlogistik.
Kumpulan
aplikasi
perangkat
lunak
transaksi ini disebut enterprise resource planning (ERP).Data yang disimpan dalam sistem operasional biasanya berurusan dengan entitas utama yang terlibat dalam proses perusahaan, yaitu pelanggan, produk, penjualan, karyawandan pemasok. Data ini biasanya datang dari komponen yang berbeda dari sistem informasi: • Sistem back-office, yang mengumpulkan catatan transaksi
dasar
seperti
pesanan,
faktur,
persediaan, produksi dan data logistik. • Sistem front-office, yang berisi data yang berasal dari kegiatan call-center, bantuan pelanggan, pelaksanaan pemasaran. • Sistem
berbasis web,
yang mengumpulkan
transaksi penjualan di situs web e-commerce, kunjungan ke situs web, data yang tersedia pada formulir yang diisi oleh pelanggan dan calon pelanggan.
2.1.5.1.2.
External Data Menurut Vercellis (2009, p46), ada beberapa sumber data eksternal yang dapat digunakan untuk memperpanjang kekayaan informasi yang tersimpan dalam
database
internal.
Sebuah
sumber
yang
signifikan lebih lanjut dari data eksternal disediakan oleh geographic information systems (GIS), yang merupakan satu set aplikasi untuk memperoleh, mengorganisir, menyimpan dan menyajikan data teritorial.
12
2.1.5.1.3.
Personal Data Menurut Vercellis (2009, p46), dalam kebanyakan kasus, pengambil keputusan dengan
menggunakan
analisis
business
intelligence juga mengandalkan informasi dan penilaian pribadi yang tersimpan di dalam lembar kerja atau database lokal yang terletak dikomputer mereka. Pengambilan informasi tersebut dan dengan integrasi data terstruktur dari internal dan eksternal sumber adalah
salah
satu
tujuan
dari
sistem
manajemen pengetahuan. 2.1.5.2.
Arsitektur Data Warehouse Menurut Connoly & Begg (2015, p123), komponen utama data warehouse, antara lain :
Gambar 2.2 – The typical architecture of data warehouse Sumber : Connoly & Begg (2015, p124)
13 •
Data Operasional Data operasional adalah data yang dapat di gunakan untuk mendukung proses bisnis.
•
Operasional Data Store (ODS) Operational
data
store
adalah
tempat
penyimpanan data operasional yang bersifat current dan terintegrasi yang di gunakan untuk analisis. Dengan kata lain, ODS mendukung proses transaksi operasional maupun proses analisis. Dengan adanya ODS maka pembangunan data warehouse menjadi lebih mudah karena ODS dapat menyediakan data yang telah di ekstrak dari sumber dan telah di bersihkan sehingga proses pengintegrasian dan restrukturisasi data untuk data warehouse menjadi lebih sederhana. •
Load Manager Disebut juga komponen front end menangani semua operasi yang berhubungan dengan fungsi extract data (mengambil data) dan fungsi loading data (menaruh data) ke dalam data warehouse.
•
Warehouse Manager Menangani semua operasi yang berhubungan dengan management data dalam data warehouse. Operasi-operasi yang di jalankan oleh warehouse manager mencakup : a. Analisis data untuk menjaga konsistensi data. b.Melakukan
transformasi
dan
penggabungan sumber data dari tempat penyimpanan
sementara
tabel-tabel data warehouse. c. Melakukan denormalisasi. d.Melakukan agregasi.
ke
dalam
14 e. Menyimpan (archive) dan back-up data. •
Query Manager (Di sebut juga komponen backend) menangani semuaoperasi yang berhubungan dengan management permintaan user (user queries). Operasi yang di jalankan oleh query manager meliputi kegiatan mengarahkan permintaan ke tabel-tabel data yang tepat dan
melakukan
penjadwalan
eksekusi
terhadap
permintaan. •
Detailed Data Dalam data warehouse, area ini adalah tempat penyimpanan semua detailed data dalam skema basis data. Detailed data dibagi menjadi 2, yaitu current detail data (tempat penyimpanan semua detailed data yang bersifat current) dan old detailed data (tempat penyimpanan semua detailed data yang bersifat old).
•
Lightly and Hightly Summerized Data Area ini adalah tempat penyimpanan sementara data predefinisi yang teringkas secara light dan high (predefined lightly and highly summarized) yang dihasilkan oleh warehouse manager. Tujuan dari ringkasan informasi ini adalah untuk mempercepat tanggapan terhadap permintaan user. Ringkasan data di update secara berkala seiring dengan bertambahnya data dalam data warehouse.
•
Archive / Backup Data Dalam data warehouse, area ini digunakan untuk menyimpan detailed data dan data yang telah diringkas. Tujuannya adalah untuk penyimpanan (archiving) dan backup.Data kemudian ditransfer ke media penyimpanan seperti magnetic tape atau optical disk.
15 •
Metadata Digunakan untuk menyimpan semua definisi metadata (keterangan tentang data) yang digunakan dalam seluruh proses warehouse. Metadata digunakan untuk berbagai tujuan, antara lain : a. Proses extracting dan loading b.Proses warehouse management c. Sebagian proses query management
•
End-User Access Toolss End-user access tools Adalah tools yang memanfaatkan kegunaan dari data warehouse. Kegunaan data warehouse tersebut, antara lain untuk pembuatan laporan, OLAP, data mining dan proses informasi eksekutif.
2.1.5.3.
Karakteristik Data Warehouse Menurut Connoly & Begg (2015, p123). Karateristik pada data warehouse yakni sebagai berikut : •
Subject Oriented Sebagai gudang yang terorganisasi di sekitar
subjek utama seperti pelanggan, produk, dan penjualan yang ada pada aplikasi area utama (faktur pelanggan, stok kontrol, dan penjualan produk).Hal ini tercermin dalam kebutuhan untuk menyimpan data pendukung keputusan dari data yang berorientasi. •
Integrated Karena sistem aplikasi yang luas bersamaan
datang dari sumber data dari organisasi yang berbeda.Sumber
data
sering
tidak
konsisten,
menggunakan, misalnya, berbeda tipe data dan / atau format.Sumber data yang terintegrasi harus dibuat konsisten untuk menyajikan pandangan terpadu dari data ke pengguna.
16 •
Time Variant Karena data yang ada pada warehouse tersebut
akurat dan hanya berlaku pada titik yang sama dalam waktu lebih dari beberapa interval waktu •
Non Volatile Karena data tidak di perbaharui secara real time
tetapi di refresh dari sistem operasional secara teratur. Data baru selalu ditambahkan sebagai pelengkap ke database, bukan pengganti. 2.1.5.4.
Implementasi Data Warehouse Menurut Vercellis (2009, p52), terdapat 3 cara dalam mengimplementasi data warehouse; 1.
Top-down Metodologi top-down didasarkan pada desain
keseluruhan dari data warehouse, dan lebih sistematis. akan tetapi, pengembangan akan berjalan lebih lama dan risiko tidak sesuai jadwal akan lebih besar, karena secara
keseluruhan
data
warehouse
sedang
dikembangkan. 2.
Bottom-up Metode
bottom-up
didasarkan
pada
penggunaan prototipe dan oleh karena itu, ekstensi sistem yang dibuat sesuai dengan langkah-demilangkah yang tersedia dalam skema. Pendekatan ini biasanya lebih cepat, memberikan hasil yang lebih nyata tetapi tidak memiliki visi keseluruhan dari seluruh sistem yang akan dikembangkan.
3.
Mixed
17 Metodologi mixed didasarkan pada desain keseluruhan dari data warehouse, akan tetapi hasilnya tetap menggunakan pendekatan prototyping, dan secara berurutan diimplementasikan di setiap bagian dari seluruh sistem. Pendekatan ini sangat praktis dan biasanya
lebih
menampilkan
disukai,
karena
bagian-bagian
kecil
memungkinkan tetapi
tetap
menampakan keseluruhan gambaran.
2.1.6. Extract, Transform, Loading Data (ETL) Menurut Vercellis (2009, p53), ETL mengacu pada perangkat lunak yang ditujukan untuk melakukan dengan cara otomatis tiga fungsi utama : extraction, transformation, and loading data ke dalam data warehouse. •
Extract Selama tahap pertama, data diproses dari
sumber internal dan external. Perbedaan logis dapat dibuat antara awal ekstraksi, dimana tersedia data yang relatif terhadap semua periode masa lalu dimasukkan kedalam data warehouse yang kosong, dan ekstraksi tambahan
berikutnya
yang
memperbarui
data
warehouse menggunakan data baru yang menjadi tersedia dari waktu ke waktu. Pemilihan data yang akan diimpor didasarkan pada desain data warehouse.Yang tergantung pada informasi yang dibutuhkan oleh analisis business intelligence dan sistem pendukung keputusan (DSS) yang beroperasi di domain aplikasi tertentu.
•
Transformation
18 Tujuan dari fase pembersihan dan transformasi adalah meningkatkan kualitas data yang diambil dari sumber yang berbeda, melalui koreksi inkonsistensi, ketidakak uratan dan nilai-nilai yang hilang. •
Loading Akhirnya, setelah diekstraksi dan diubah, data
dimuat ke dalam tabel data warehouse untuk membuat mereka tersedia bagi analis dan aplikasi pendukung pembuat keputusan. Sedangkan menurut Kimbaln (2013, p19-20) bahwa Ekstrak, transformasi, dan load (ETL) adalah suatu system dari Data Warehouse atau business inteligence yang terdiri dari area kerja, struktur data yang dipakai, dan satu set proses. Sistem ETL adalah segalanya antara hubungan operasional sistem dan area presentasi dari data warehouse atau business intelligence 2.1.7. Dimesionality Modeling Menurut Connolly & Begg (2015, p1261), dimensional modeling adalah teknik desain logis yang bertujuan untuk menyajikan data standar, dalam bentuk intuitif yang memungkinkan untuk mengakses kemampuan kinerja. 2.1.7.1.
Star Schema Menurut Connolly & Begg (2015, p1261), starschema adalah model data dimensi yang memiliki tabel fakta di tengah, dikelilingi oleh tabel dimensi denormalized. Skema bintang mengeksploitasi karakteristik data faktual sehingga facs dihasilkan oleh peristiwa yang terjadi di masa lalu, dan tidak mungkin untuk berubah, terlepas dari bagaimana hari dianalisis. Karena sebagian besar data dalam data warehouse
19 direpresentasikan sebagai fakta, tabel fakta bisa relatif sangat besar untuk tabel dimensi. Fakta yang paling berguna dalam tabel fakta numerik dan aditif, karena aplikasi data warehouse hampir tidak pernah mengakses catatan tunggal, mereka mengakses ratusan, ribuan, atau bahkan jutaan catatan pada waktu dan yang paling berguna untuk melakukan dengan begitu banyak catatan adalah untuk agregat mereka. Sedangkan menurut Vercellis (2009,p55), star schema memiliki dua tipe tabel yaitu tabel fakta (fact table) dan tabel dimensi (dimension table). fact table adalah tabel yang umumnya mengandung sesuatu yang dapat diukur dan bersifat historis, dan merupakan kumpulan foreign key dari primary key yang terdapat pada masing-masing dimension table. Tabel dimensi (dimension table) adalah table yang berisikan kategori-kategori dengan ringkasan detil yang dapat berupa laporan. Secara umum, dapat disebut dengan dimensi yang terkait dengan entitas sekitarnya dalam proses organisasi.
Gambar 2.3 – Contoh Star Schema Sumber : Vercellis (2009,p56) 2.1.7.2.
Perbandingan Star Schema, Snowflake dan Starflake
20 Sebuah skema bintang dapat memiliki sejumlah tabel dimensi.
Cabang-cabang
pada
akhir
dari
link
yang
menghubungkan tabel menunjukkan hubungan One-to-many antara tabel fakta dan tabel dimensi masing-masing.
Gambar 2.4 – Contoh Star Schema Sumber : Vercellis (2009,p56) Snowflake terdiri dari satu tabel fakta yang terhubung banyak ke tabel dimensi, yang dimana dimensi tersebut dapat dihubungkan ke tabel dimensi lain dengan relationship one-to-many. Tabel dalam snowflake schema biasanya dinormalisasi ke bentuk normal ketiga.
21
Gambar 2.5 – Contoh Snowflake Sumber : Vercellis (2009,p56)
Sebuah starflake schema adalah kombinasi daristar schema dan snowflake. Starflake schema adalah snowflake schema di mana hanya beberapa tabel dimensi telah denormalize. Starflake schema bertujuan untuk memanfaatkan keuntungan dari kedua star snowflake scheme. Hirarki dari star schemas denormalized, sedangkan hierarki snowflake schemas dinormalisasi. Starflake
schemas
menghilangkan menormalkan ditempatkan
redudansi skema,
dinormalisasi
untuk
dalam dimensi.
Untuk
hirarki
dimensi
bersama
di Outriggers. Sebuah outriggers adalah tabel
dimensi atau entitas yang bergabung ketabel dimensi lain dalam star schema
22
Gambar 2.6 – Contoh Starflake schema Sumber : Vercellis (2009,p57)
2.1.8. Pengertian Data Mart Menurut Connolly & Begg (2015, p347),Data Mart adalah subset dari Data Warehouse yang mendukung kebutuhan dari departemen tertentu atau fungsi bisnis. Isu-isu yang terkait dengan data mart termasuk fungsi, ukuran, kinerja beban, akses pengguna kedata
dalam
beberapa
data
mart,
Internet /intranet akses,
administrasi, daninstalasi. Menurut Vercellis(2009, p49),Data mart adalah sistem yang mengumpulkan semua data yang dibutuhkan oleh perusahaan pada departemen-departemen tertentu, seperti pemasaran atau logistik, untuk bertujuan melakukan analisis business intelligence dan untuk menjalankan aplikasi pendukung keputusan khusus untuk fungsi itu sendiri. Data mart juga dapat dianggap sebagai fungsional atau departemen Data Warehouse dalam ukuran yang lebih kecil dan jenis yang lebih spesifik dari pada keseluruhan Data Warehouse perusahaan. Oleh karena itu, sebuah data mart berisi subset dari data yang disimpan di data warehouse perusahaan, yang biasanya terintegrasi dengan data yang lain pada perusahaan. Misalnya, data
23 mart pemasaran akan berisi data yang diambil dari pusatdata warehouse, seperti informasi pelanggan dan transaksi penjualan, tetapi juga terdapat data tambahan yang berkaitan dengan fungsi pemasaran, seperti hasil pemasaran yang berjalan di masa lalu. 2.1.9. Meta Data Menurut Vercellis (2009, p54), dalam mendokumentasikan data yang terdapat dalam data warehouse, dianjurkan untuk membuat sebuah struktur informasi spesifik yang dikenal sebagai metadata. Metadata disebut juga deskripsi data. Metadata menunjukkan setiap atribut data warehouse sumber asli dari datanya, yang berarti data tersebut dan semua transformasi yang
telah dilakukan. Dokumentasi yang
disediakan oleh metadata harus terus menerus up-to-date, dalam rangka untuk mencerminkan perubahan dalamstruktur data warehouse. Dan dokumentasi harus langsung dapat diakses oleh pengguna data warehouse. Berdasarkan
teori
diatas
disimpulkan
bahwa
metadata
merupakan data mengenai data dimana metadata ini mengandung informasi mengenai isi suatu data yang dipakai untuk keperluan manajemen. Data itu nantinya dalam suatu basis data yang dapat berbentuk nama ruas (field), panjang field, dan tipe fieldnya: integer, character, date, dll.
2.1.10. Pengertian Data Mining Menurut Connolly (2015, p 1316) Data mining adalah proses penggalian informasi yang valid, yang sebelumnya tidak dikenal, dipahami,
dan
ditindaklanjuti
dari
database
besar
dan
menggunakannya untuk membuat keputusan bisnis penting. Ada empat kegiatan utama yang terkait dengan teknik data mining: pemodelan prediktif, segmentasi basis data, analisa link, dan deteksi deviasi.
24
1. Pemodelan prediktif Pemodelan
prediktif
dapat
digunakan
untuk
menganalisis database yang sudah ada untuk menentukan beberapa karakteristik penting (model) mengenai kumpulan data.
Model
ini
dikembangkan
dengan
menggunakan
pendekatan pembelajaran terawasi, yang memiliki dua fase: pelatihan dan pengujian. Aplikasi pemodelan prediktif meliputi manajemen pelanggan retensi, persetujuan kredit, cross selling dan direct marketing.ada dua teknik yang terkait: klasifikasi dan prediksi nilai. 2. Segmentasi basis data Segmentasi basis data partisi database ke nomor tak dikenal segmen atau cluster catatan serupa. Pendekatan ini menggunakan
pembelajaran
tanpa
pengawasan
untuk
menemukan sub-populasi homogen dalam database untuk meningkatkan akurasi dari profil. 3. Analisis link Bertujuan untuk membangun link, asosiasi disebut, antara catatan individu, atau set cattan, dalam database. Ada tiga spesialisasi analisis link: asosiasi penemuan, pola penemuan sekuensial, dan penemuan urutan waktu yang sama. Asosiasi penemuan menemukan item yang menyiratkan keberadaan barang-barang lainnya dalam acara yang sama. Pola penemuan berurutan menemukan pola antara peristiwa tersebut bahwa kehadiran satu set item diikuti oleh satu set item dalam database peristiwa selama periode waktu. Penemuan urutan waktu yang sama digunakan, misalnya, dalam penemuan hubungan antara dua set data yang bergantung waktu, dan didasarkan pada tingkat kesamaan antara pola yang kedua seri waktu menunjukkan.
25
4. Deviasi deteksi Deviasi deteksi sering menjadi sumber penemuan yang benar karena mengidentifikasi outlier, yang mengungkapkan penyimpangan
dari
beberapa
harapan
yang
diketahui
sebelumnya dan norma. operasi ini dapat dilakukan dengan menggunakan statistik dan teknik visualisasi atau sebagai produk membeli dari data mining. Menurut Vercellis (2009, p77) Kegiatan Data mining merupakan proses berulang-ulang yang ditujukan untuk menganalisis database atau data dalam jumlah yang besar, dengan tujuan penggalian informasi dan pengetahuan yang akurat agar dapat memberikan pengetahuan untuk para pekerja dan dapat berguna untuk terlibat dalam pengambilan keputusan dan pemecahan masalah. Kegiatan Data mining dapat dibagi lagi menjadi dua penyelidikan besar, sesuai dengan tujuan utama dari analisis yaitu: interpretation dan prediction. •
Interpretation : Tujuan interpretasi adalah
untuk mengidentifikasi pola-pola yang teratur pada data dan untuk mengekspresikan mereka melalui aturan dan kriteria yang dapat dengan mudah dipahami oleh para ahli dalam domain aplikasi. Aturan yang dihasilkan harus asli dan non-trivial dalam rangka untuk benar-benar meningkatkan tingkat pengetahuan dan pemahaman tentang suatu sistem yang penting. •
Prediction : Tujuan dari prediksi adalah untuk
mengantisipasi nilai variable yang acak di masa depan atau untuk memperkirakan kemungkinan kejadian yang akan terjadi di masa depan.
26
Berikut adalah pengertian data mining yang dikutip dari jurnal Eka Miranda (2008) Data mining adalah proses analisis
terhadap
data
dengan
penekanan
menemukan
informasi yang tersembunyi pada sejumlah besar data yang disimpan ketika menjalankan bisnis perusahaan. Teknik data mining
merupakan
implementasi
yang
khusus
dengan
algoritma, yang digunakan pada operasi data mining. Terdapat 6 teknik umum data mining, antara lain sebagai berikut. Pertama, association. Digunakan untuk mengenali kelakuan dari kejadian-kejadian khusus atau proses. Link
asosiasi
muncul
pada
setiap
kejadian.
Kedua,
sequence.Mirip dengan asosiasi, namun menghubungkan kejadian-
kejadian
sepanjang
waktu
dan
menentukan
keterhubungan antar item untuk sepanjang waktu.Ketiga, classification. Melihat pada kelakuan dan atribut dari kelompok yang telah didefinisikan.Tool data mining dapat memberikan klasifikasi pada data baru dengan memanipulasi data yang ada, yang telah diklasifikasi dan dengan menggunakan
hasilnya
untuk
memberikan
sejumlah
aturan.Aturan-aturan tersebut digunakan pada data-data baru untuk diklasifikasi. Teknik ini menggunakan supervised induction, yang memanfaatkan kumpulan pengujian dari record yang terklasifikasi untuk menentukan kelas-kelas tambahan.
Keempat,
cluster.Dapat
digunakan
untuk
menganalisis pengelompokan berbeda terhadap data.Mirip dengan
klasifikasi,
namun
pengelompokan
belum
didefinisikan sebelum dijalankannya tool data mining. Biasanya menggunakan metode neural network atau statistik. Clustering membagi item menjadi kelompokkelompok berdasarkan yang ditemukan tool data mining. Kelima, regression (forecasting). Menggunakan nilai dari data yang diketahui untuk memperkirakan nilai di masa depan atau
27 kejadian masa depan berdasarkan kecenderungan sejarah dan statistik. Keenam, time series (forecasting). Perbedaan dengan regresi adalah bahwa time series hanya memperkirakan data yang bergantung pada waktu. 2.1.11. Pengertian OLAP (Online Analitical Processing) Menurut Connolly & Begg (2015, p1286) Online analytical processing(OLAP) adalah sintesis dinamis, analisis, dan konsolidasi volume besar data multidimensi. Aplikasi OLAP ditemukan di daerah fungsional yang sangat beragam termasuk penganggaran, analisis kinerja keuangan, analisis penjualan dan peramalan, analisis riset pasar dan segmentasi pasar/pelanggan. Karakteristik utama dari aplikasi OLAP mencakup pandangan multidimensi data, dan dukungan untuk perhitungan yang rumit. Sedangkan menurut Scheps (2008, p68) OLAP memiliki arti sebagai sebuah konsep multidimensional data dengan melakukan konseptualisasi data transaksional perusahaan. Selain memberikan tampilan yang lebih ringkas, OLAP juga memberikan cara baru dalam melihat data pada sistem business intelligence Menurut (Turban, Sharda, Delen, & King, 2011, p77). Struktur operasional utama dalam OLAP didasarkan pada konsep yang disebut kubus (cube). Kubus (cube) didalam OLAP adalah struktur data multidimensi (aktual atau virtual) yang memungkinkan analisis data yang cepat. Juga dapat didefinisikan sebagai kemampuan dari memanipulasi dan
menganalisis data secara efisien dari berbagai
perspektif. Susunan data kedalam kubus bertujuan untuk mengatasi keterbatasan database relational. Database relational tidak cocok untuk analisis yang cepat dan dekat dari sejumlah besar data. Sebaliknya, mereka lebih cocok untuk memanipulasi (menambahkan,
menghapus,
mewakili serangkaian transaksi.
dan
memperbarui
data)
record yang
28
2.1.12. Structured Query Language (SQL) Menurut Connolly & Begg (2010, p184) SQL (Structured Query Language) adalah contoh dari transform-oriented-language atau bahasa yang didesain dengan menggunakan relasi untuk mengubah input menjadi output yang diinginkan. Sebuah database language dapat memungkinkan user untuk : •
Membuat hubungan struktur dan database.
•
Melakukan
operasi
penyisipan
(insert),
perubahaan
(modification) dan penghapusan (deletion). • 2.1.12.1.
Menampilkan query sederhana dan kompleks
Database Language
2.1.12.1.1.
Data Definition Language Menurut Connolly & Begg (2010, p92), mendefiniskan data definition language (DDL) sebagai bahasa yang memungkinkan database administratior untuk menambahkan dan menanamkan entitas, atribut dan hubungan yang dibutuhkan dalam aplikasi, terkait dengan itegritas dan kendala keamanan aplikasi.
2.1.12.1.2.
Data Manipulation Language Menurut
Connolly
&
Begg
(2010,
p92)
mendefiniskan bahwa Data Manipulation Language (DML) sebagai bahasa yang menyediakan suatu fungsi yang dapat memanipulasi data-data yang ada di dalam database.
29 2.1.13. Pengertian Business Intelligence Menurut Vercellis (2009, p3), Bussiness intelligence di definisikan sebagai suatu kumpulan dari model
matematika dan
metodologi analisis untuk mengeksploitasi ketersediaan data untuk mendapatkan informasi dan pengetahuan yang berguna untuk pembuatan keputusan yang kompleks. Dan berikut ini merupakan kutipan dari jurnal Siswono (2013) BI adalah teknologi baru untuk memahami masa lalu dan memprediksi masa depan. Teknologi yang dimaksudkan disini adalah teknologi yang mampu mengumpulkan, menyimpan, mengakses dan menganalisis data untuk membantu para pengambil keputusan menghasilkan keputusan yang lebih baik. Sebagai sebuah aplikasi, maka BI meliputi aktivitas decision support systems, query dan reporting, OLAP (OnLine Analytical Processing), analisis statistik, peramalan dan data mining. 2.1.13.1. Keuntungan Business Intelligence Menurut Vercelis (2009, p5), Tujuan utama dari business intelliegence adalah untuk menyediakan pengetahuan bagi pekerja dengan tools dan metodologi yang dapat membantu mereka dalam mengambil keputusan secara efektif dan tepat pada waktunya. Terdapat 2 keuntungan besar dalam menggunakan business intelligence menurut vercellis yaitu : •
Effective decision Business
intelligence
menerapkan
metode analisis yang ketat sehingga pengambil keputusan dapat mengandalkan informasi dan pengetahuan yang dapat diandalkan dalam mengambil
keputusan.Sebagai
hasilnya,
manajer mampu membuat keputusan yang lebih baik
dan
dapat
menyusun
strategi
yang
30 memungkinkan tujuan mereka dicapai dengan cara yang lebih efektif. •
Timely decision Perusahaan ekonomi
yang
beroperasi ditandai
di
lingkungan
dengan
tingkat
persaingan yang tinggi dan perkembangan yang dinamis.Akibatnya, kemampuan untuk secara cepat bereaksi terhadap tindakan pesaing dan pasar kondisi-kondisi baru merupakan faktor penting
dalam
keberhasilan
atau
bahkan
kelangsungan hidup perusahaan.
Gambar 2.7 Benefits of a business intelligence system Sumber : Vercellis (2009, p6) Berikut adalah beberapa manfaat yang di ambil dari jurnal Suparto Darudianto (2010) beberapa manfaat yang bisa didapatkan apabila perusahaan
31 mengimplementasikan business intelligence adalah sebagai berikut :
1. Pertama, meningkatkan nilai data dan informasi
organisasi.
pembangunan
BI,
Melalui
seluruh
data
dan
informasi dapat diintegrasikan sedemikian rupa sehingga menghasilkan pengambilan keputusan yang lengkap 2. Kedua, memudahkan pemantauan kinerja organisasi
dengan
menggunakan
Key
Performance Indicator (KPI). 3. Meningkatkan nilai investasi teknologi informasi yang sudah ada. 4. Menciptakan pegawai yang memiliki akses informasi
yang
baik
(well-informed
workers). 5. Kelima, meningkatkan efisiensi biaya. BI dapat
meningkatkan
mempermudah
efisiensi
karena
seseorang
dalam
melakukan pekerjaan, hemat waktu, dan mudah
pemanfaatannya.
dibutuhkan
untuk
Waktu
mencari
data
yang dan
mendapatkan informasi yang dibutuhkan semakin
singkat
dan
cara
untuk
mendapatkannya pun tidak memerlukan pengetahuan (training) yang rumit.
32 2.1.13.2.
Siklus Business Intelligence Menurut Vercellis (2009, p12), Setiap analisis business inteligence mengikuti jalannya sendiri sesuai dengan aplikasi domain, sikap pribadi para pengambil keputusan dan ketersediaan metodologi analitis. Namun, adalah mungkin untuk mengidentifikasi jalur siklus ideal yang mencirikan evolusi analisis business inteligence yang khas, seperti yang ditunjukkan pada Gambar 2.8.
Gambar 2.8 – Cycle of a business intelligence analysis •
Analysis Selama
tahap
analisis,perlu
mengenali dengan baik dan akurat
untuk dalam
menguraikan masalah yang dihadapi. Para pembuat keputusan kemudian harus membuat representasi
dari
suatu
kejadian
untuk
dianalisis, dengan mengidentifikasi faktor kritis yang dianggap sebagai yang paling relevan. Ketersediaan metodologi business intelligence dapat membantu dalam tahap ini, dengan mengijinkan para pengambil keputusan untuk secara cepat mengembangkan berbagai jalur analisis.
33 •
Insight Pada
tahapkedua
memungkinkan
pengambil keputusan untuklebih baik danlebih mendalam, dalam memahami masalah yang dihadapi. Informasi yang diperoleh melalui tahap
analisis
menjadi
suatu
adalah
kemudian
pengetahuan
berubah
selama
fase
wawasan. Disatu sisi, ekstraksi pengetahuan dapat terjadi karena intuisi dari pembuat keputusan dan oleh karena itu ini didasarkan pada
pengalaman
pembuat
keptusan
dan
mungkin informasi tidak terstruktur yang tersedia bagi mereka. •
Decision Selama fase ketiga, pengetahuan yang diperoleh sebagai hasil dari fase insght yang diubah menjadi keputusan dan kemudian menjadi tindakan. Ketersediaan metodologi business inteligence memungkin kanan alisis dan fase insight akan dieksekusi lebih cepat sehingga keputusan yang lebih efektif dan tepat waktu, dapat dibuat dan sesuai dengan prioritas strategi organisasi yang dibutuhkan.
•
Evaluation Akhirnya, fase keempat dari siklus business intelligence melibatkan pengukuran kinerja dan evaluasi. Maka metric yang luas harus
dibuat
yang
tidak
terbatas
ke
eksklusifannya pada aspek keuangan, tetapi juga memperhitungkan indicator kinerja utama
34 yang ditetapkan untuk departemen-departemen yang berbeda pada perusahaan. 2.2. Teori Khusus 2.2.1. Entity Relationship Diagram (ERD) Menurut Satzinger, Jackson dan Burd (2012, p90) entityrelationship diagram adalah sebuah diagram yang terdiri dari entitas (satu set hal) dan hubungan mereka
Gambar 2.9 Cardinality Symbol Of ERD Relationships Sumber : Satzinger, Jackson dan Burd (2012, p91), Introduction to Sytem Analysis and Design : An Agile Iterative Approach
35
Gambar 2.10 Entity Relationship Diagram Sumber : Satzinger, Jackson dan Burd (2012, p92), Introduction to Sytem Analysis and Design : An Agile Iterative Approach 2.2.2. Activity Diagram Menurut Satzinger, Jackson dan Burd (2012, p55), activity diagram adalah mendeskripsikan kegiatan user (atau sistem), orang yang melakukan setiap kegiatan, dan aliran kegiatan yang berurutan
Gambar 2.11 Notasi Activity diagram Sumber : Satzinger, Jackson dan Burd (2012, p56), Introduction to Sytem Analysis and Design : An Agile Iterative Approach.
36
Gambar 2.12 Activity diagram Sumber : Satzinger, Jackson dan Burd (2012, p57), Introduction to Sytem Analysis and Design : An Agile Iterative Approach 2.2.3. Use Case 2.2.3.1.
Pengertian Use Case Use case menurut Satzinger, Jackson and Burd (2012, p63) adalah suatu kegiatan yang dilakukan oleh sebuah sistem, biasanya dalam merespon permintaan user
2.2.3.2.
Use Case Diagram Use case diagram menurut Satzinger, Jackson and Burd (2012, p72) adalah UML model yang digunakan untuk
37 mengambarkan use case dan hubungannya dengan actor atau pengguna system.
Gambar 2.13Use Case Diagram Sumber : Satzinger, Jackson dan Burd (2012, p77), Introduction to Sytem Analysis and Design : An Agile Iterative Approach Menurut Satzinger, Jackson dan Burd (2012, p77) <
> relationship adalah suatu hubungan antara use cases dimana satu use case memiliki hubungan atau kesamaan termasuk dalam use case lainnya.
38
Gambar 2.14 Use Case Diagram<> Sumber : Satzinger, Jackson dan Burd (2012, p78), Introduction to Sytem Analysis and Design : An Agile Iterative Approach 2.2.3.3.
Use Case Specification Menurut
Arlow
&
Neustadt
(2005,p78),setelah
membuat use case diagram mulailah menjelaskan tiap use case dengan membuat use case specification. Tidak ada standarisasi UML, dalam penulisan use case specification. Gambar 2.15 merupakan contoh use case specification.
39
Gambar 2.15 - ContohUse Case Specification (Sumber: Arlow& Neustadt, 2005, p78) 2.2.4. Forecasting Heizer dan Render (2009:162), Peramalan (forecasting) adalah seni dan ilmu untuk memperkirakan kejadian dimasa depan. Hal ini dapat dikakukan dengan
melibatkan pengambilan data masa lalu
dan menempatkannya kemasa akan datang dengan suatu bentuk model matematis. Bila juga merupakan prediksi intuasi yang bersifat subjektif. Atau bisa juga dengan menggunakan kombinasi model matematis yang disesuaikan dengan pertimbangan yang baik dari seorang manajer. Menurut sellani, Robert J (2009) dalam Journal of the International Academy for Case Studies. The Sales forecast is the most important plan in an organization. For a manufacturing company, the Sales forecast must be in sufficient detail for Manufacturing to translate those requirements into physical products. Therefore it is not sufficient for the Sales forecast to be equal to last years' sales plus 10%.Manufacturing must know which products are going to be obsolete, which will be increasing and decreasing in sales, and which will require new manufacturing methods in production.
40 2.2.5. Key Performance Indicator Menurut Parmenter (2007 , p3), Key Performance Indicator adalah suatu kegiatan yang berfokus pada aspek-aspek kinerja organisasi yang paling penting untuk keberhasilan organisasi pada masa ini dan masa depan key performance indicator (KPI) adalah jenis pengukuran kinerja dari suatu organisasi atau perusahaan, KPI dapat menilai atau menjadi suatu ukuran keberhasilan dari suatu organisasi. kadangkadang keberhasilan didefinisikan pada saat suatu proses atau kegiatan sedang berjalan untuk mencapai tujuan organisasi. Oleh karena itu, memili KPI yang tepat bergantung pada pemahaman yang baik tentang apa yang penting bagi organisasi, KPI sering tergantung pada departemen pengukuran kinerja. misalnya KPI berguna untuk keuangan akan berbeda dari KPI ditugaskan untuk penjualan. Karena ada kebutuhan untuk memahami dengan baik apa yang penting untuk organisasi, berbagai teknik untuk menilai kondisi bisnis pada saat ini, dan kegiatan utama yang terkait dengan pemilihan indikator kinerja. Penilaian ini sering mengarah pada identifikasi potensi perbaikan, sehingga indikator kinerja secara rutin terkait dengan inisiatif peningkatan kinerja. Sebuah cara yang sangat umum untuk memilih KPI adalah dengan menerapkan kerangka manajemen seperti balanced scorecard. 2.2.6. Product Positioning Menurut Kotler dan Amstrong (2011, p49), Positioning adalah tindakan mengatur produk untuk menempati tempat yang tepat, khas, dan diinginkan. terhadap produk-produk pesaing dalam benak target konsumen.
Pemasar produk
merencanakan posisi yang bisa
membedakan produk mereka dari merek pesaing dan memberi produk keuntungan dalam target pasar perusahaan. Adapun menurut Kotler (2012, p276), Positioning adalah strategi perusahaan untuk merancang produk dan nilai pemasaran
41 yang tepat sehingga dapat tercipta sesuatu yang diingat oleh pangsa pasar. 2.2.7. Penjualan Menurut Kotler (2010, p528), Penjualan merupakan sebuah proses dimana kebutuhan pembeli dan kebutuhan penjual terpenuhi, melalui antar pertukaran informasi dan kepentingan. Konsep penjualan juga dapat diartikan sebagai cara untuk mempengaruhi konsumen untuk membeli produk yang ditawarkan. Sedangkan
menurut Mulyadi
(2008,
p160),
Penjualan
memiliki peranan penting dalam perusahaan karena penjualan merupakan sumber kelangsungan hidup suatu pembayaran.Semakin besar jumlah penjualan semakin besar pula laba yang diperoleh. Penjualan terjadi apabila pihak yang satu (penjual) menyerahkan hak milik suatu barang, sedangkan pihak lain (pembeli) membayar barang baik secara tunai maupun kredit sebagai imbalan dari perolehan hak milik tersebut.
2.2.8. Pembelian Menurut Mulyadi (2008, p316), Pembelian adalah suatu usaha yang digunakan dalam perusahaan untuk pengadaan barang yang diperlukan oleh perusahaan 2.2.9. Distribusi Menurut Chopra (2010, p86) Distribusi adalah sebuah kegiatan untuk memindahkan produk dari pihak supplier ke pihak customer dalam suatu supply chain. Distribusi adalah sebuah kunci dari keuntungan yang akan diperoleh perusahaan karena distribusi sangat mempengaruhi biaya dari supply chain dan kebutuhan customer, jaringan distribusi yang tepat dapat digunakan untuk mencapai berbagai tujuan dari supply chain, dimulai dari biaya yang rendah sampai yang tertinggi terhadap permintaan customer.
42 2.2.10. Dashboard Menurut
Rainer
dan
Cegielski
(2011,p366),
Digital
Dashboard biasanya disebut executive dashboard atau management cockpit menyediakan akses informasi yang cepat dan tepat waktu, dan akses langsung ke laporan manajemen.Digital Dashboard sangat user-friendly
dan
didukung dengan
grafik.Digital Dashboard
memperbolehkan manager untuk memeriksa laporan tertentu dan laporan yang rinci. Menurut Laudon dan Laudon (2010,p81), Digital Dashboard merupakan dashboard yang menampilkan, pada satu layar, semua hasil pengukuran yang penting untuk mengarahkan perusahaan, mirip dengan kokpit pesawat atau dashboard mobil. Dashboard tersebut menampilkan indikator-indikator kinerja kunci sebagai grafik dan diagram dalam format browser web. Memberikan gambaran satu halaman dari semua pengukuran penting yang diperlukan untuk mengambil keputusan di tingkat eksekutif. Menurut Person (2009,p108), Eksekutif, Manager, dan Supervisor menggunakan dashboard untuk melacak strategi, operasi dan taktik.Sebuah dashboard yang dirancang dengan baik dapat membantu pengambilan keputusan yang baik dan cepat. Pada kenyataannya survei menunjukan dua keuntungan utama dari penerapan dashboard yaitu pengambilan keputusan dan pengurangan pekerjaan administrasi untuk analisis dan penelitian. Menurut Kusnami (2009,p88-p89), Dashboard adalah satu kategori dari aplikasi business intelligence yang secara real time akan memonitoring berbagai informasi yang dibutuhkan oleh suatu organisasi atau perusahaan dengan berbagai macam format seperti graphical gadgets, typically, gauges, charts, indicators, dan colorcoded maps yang memungkinkan mereka membuat keputusan pintar secara cepat.
43 Menurut Oana dan Ogan (2012,p1), Dashboard adalah alat diagnostik yang dirancang untuk mendukung manager yang sibuk dengan sebuah gambaran singkatdari kinerja perusahaan. 2.2.11. Tableau Desktop Tableau
Desktop
adalah
sebuah
software
business
intelligenceyang dapat membantu menganalisi data statistik dengan mudah agar dapat memberikan solusi yang lebih baik, lebih cepat dan tepat dalam memberikan solusi-solusi dalam pemecahan masalah bisnis perusahaan.Hal ini terbukti dari banyaknya pelangganpelanggan yang menggunakan jasa Tableau.Dan juga tableu bekerja sama dengan banyak perusahaan besar yang bergerak dalam 4 bidang yaitu: 1. Alliance partners 2. OEM partners 3. Reseller partners 4. Technology partners
44