BAB 2 LANDASAN TEORI
2.1 Teori Umum 2.1.1
Pengertian Data dan Informasi Menurut McLeod (Management Information Systems 9th, 2004, p18) data terdiri
dari fakta-fakta dan angka yang secara relatif tidak berarti bagi pemakai. Sedangkan informasi adalah data yang telah diproses atau data yang memiliki arti.
2.1.2
Pengertian Database Menurut Date (2000, p10), database adalah kumpulan dari data yang bersifat
persistent, yaitu data yang berbeda satu dengan yang lainnya, data tersebut bersifat sementara dan digunakan oleh sistem aplikasi perusahaan. Menurut Fathansyah (Sistem Basis Bata, 2004, p2), database adalah kumpulan data yang saling berhubungan yang disimpan secara bersama sedemikian rupa dan tanpa pengulangan (redudansi) yang tidak perlu, untuk memenuhi berbagai kebutuhan. Database operasional terdiri dari 3 operasi, yaitu : Insert, Update, Delete. Menurut Connoly-Begg (Database Systems, A Practical Approach to Design, Implementation, and Management, 4th edition, 2005, p15), database adalah sebuah kumpulan data logical yang berhubungan dan penjelasan akan data tersebut, didesain agar menemukan kebutuhan informasi dari sebuah organisasi (perusahaan).
6
7 2.1.3 Pengertian Data Warehouse Menurut Poe (Building a Data Warehouse for Decision Support, 1998, p18), data warehouse adalah database bersifat analisis yang digunakan sebagai landasan dalam sistem pendukung keputusan. Data warehouse dirancang untuk data yang hanya dapat dibaca (read-only data), yang memungkinkan akses secara intuitif ke informasi yang akan digunakan dalam pengambilan keputusan. Menurut Kimball (The Data Warehouse lifecycle toolkit, 1998, p19), data warehouse adalah sumber data yang mendukung fungsi query dalam perusahaan dan merupakan gabungan dari seluruh data mart. Menurut W.H. Inmon (Building the Data Warehouse, 2002, p31), data warehouse adalah kumpulan dari database yang terintegrasi dan bersifat subjectoriented yang digunakan untuk mendukung pengambilan keputusan, di mana setiap unit data relevan dengan suatu waktu tertentu. Data warehouse mengandung data yang atomik dan berupa lightly summarized data. Data warehouse memiliki beberapa karakteristik utama, antara lain: subject-oriented, integrated, nonvolatile, dan time variant. Menurut McLeod (Management Information Systems 9th, 2004, p191), data warehouse adalah perkembangan dari konsep database yang menyediakan sumber daya data yang lebih baik bagi para pemakai, memungkinkan pemakai untuk memanipulasi dan menggunakan data tersebut secara intuitif. Jadi data warehouse adalah sebuah tempat penyimpanan data secara lengkap dan konsisten, yang memudahkan proses pengolahan data menjadi informasi, dimana informasi tersebut digunakan untuk mendukung pengambilan keputusan oleh pihak eksekutif.
8 2.1.4
Karakteristik Data Warehouse Inmon (Building The Data Warehouse, 2002, p31) mengemukakan bahwa data
warehouse sebagai kumpulan data yang mendukung pengambilan keputusan manajemen yang berkarakteristik subject oriented, integrated, nonvolatile, dan time-variant.
2.1.4.1 Subject Oriented (Berorientasi Subyek) Karakteristik pertama dari data warehouse yaitu berorientasi pada subyeksubyek utama dari perusahaan. Sebaliknya, OLTP berorientasi pada proses/fungsi. Contohnya, dalam dunia perbankan, data warehouse akan berorientasi pada subyek utama antara lain customer, vendor, dan product. Sedangkan OLTP berorientasi pada proses atau fungsinya, antara lain tabungan, peminjaman, dan kartu kredit. Perbedaan orientasi ini kemudian berpengaruh pada rancangan dan implementasi data dari data warehouse. OLTP berhubungan dengan database design dan process design. Sedangkan data warehouse secara khusus berpusat pada data modelling dan database design. Process design bukanlah bagian dari lingkungan data warehouse. Perbedaan yang lain terlihat pada kandungan data pada level terinci. Data warehouse tidak menyimpan data yang tidak digunakan untuk proses pengambilan keputusan,
sedangkan
OLTP
mengandung
data
yang
memenuhi
kebutuhan
fungsional/proses, yang mungkin dibutuhkan ataupun tidak oleh analis dalam kegiatan pengambilan keputusan. Berikut ini perbandingan antara Data Primitif / Data Operasional dan Derived Data / Data DSS secara umum :
9 Data Primitif / Data Operasional • Berorientasi aplikasi • Detail • Akurat, ketika diakses • Melayani komunitas pegawai • Dapat diupdate • Berjalan repetitively • Kebutuhan untuk proses dimengerti sebagai yang utama • Kompatibel dengan SDLC • Performance sensitive • Mengakses suatu unit pada suatu waktu • Transaction driven • Kendali update menjadi perhatian utama dalam persyaratan kepemilikan. • High availability • Diolah secara keseluruhan • Tidak berulang • Strukturnya static; content variable • Sejumlah data kecil yang digunakan dalam proses • Mendukung operasi harian • Besar kemungkinannya untuk diakses
Derived Data / Data DSS • Berorientasi subjek • Sudah diringkas atau disaring • Merepresentasikan nilai dalam beberapa waktu, snapshot • Melayani komunitas manajerial • Tidak boleh diupdate • Berjalan heuristically • Kebutuhan untuk proses tidak dimengerti sebagai yang utama • Sama sekali berbeda dengan SDLC • Performance relaxed • Mengakses suatu set pada suatu waktu • Analisis driven • Kendali update tidak menjadi soal • Relaxed availability • Diolah dengan subset-subset • Perulangan adalah satu kenyataan dalam hidup • Strukturnya flexible • Sejumlah besar data digunakan dalam proses • Mendukung kebutuhan manajerial • Kemungkinannya rendah untuk diakses Tabel 2.1 Perbandingan data operasional dengan data warehouse (Sumber : Inmon, Building The Data Warehouse, 2002, p15)
Di bawah ini adalah beberapa perbedaan antara data primitif dengan derived data atau data turunan : •
Data primitif adalah data detail yang digunakan untuk melaksanakan operasi perusahaan sehari-hari. Derived data telah diringkas atau dikalkulasi untuk mengetahui keperluan akan manajemen dari sebuah perusahaan.
•
Data primitif dapat di-update. Derived data dapat dikalkulasi ulang tetapi tidak dapat secara langsung di-update.
•
Data primitif adalah nilai data sekarang. Derived data biasanya data historical.
10 •
Data primitif dioperasikan dengan prosedur yang berulang. Derived data dioperasikan dengan proses heuristic, program dan prosedur yang tidak berulang.
•
Data operasional adalah data primitif, data DSS adalah derived data.
•
Data primitif mendukung fungsi clerical. Derived data mendukung fungsi manajerial.
2.1.4.2 Integrated (Terintegrasi) Untuk menciptakan subyek area yang berguna, sumber data yang berasal dari beberapa sistem yang berbeda terlebih dahulu harus terintegrasi sebelum digabungkan ke dalam sebuah data warehouse. Sebagai contoh, terdapat empat aplikasi yang menyimpan kode jenis kelamin dalam database secara berbeda. Aplikasi A menyimpan kode jenis kelamin dalam bentuk ‘m’ untuk laki-laki dan ‘f’ untuk perempuan, sedangkan aplikasi B dalam bentuk ‘1’ dan ‘0’, aplikasi C dalam bentuk ‘x’ dan ‘y’, aplikasi D dalam bentuk ‘male’ dan ‘female’. Melalui proses integrasi dihasilkan kode jenis kelamin yang seragam untuk data warehouse yaitu ‘m’ dan ‘f’. Untuk lebih jelasnya dapat dilihat pada gambar berikut ini: Appl A m,f
m,f
Appl B 1,0 Appl C x,y Appl D male, female
Gambar 2.1 Aspek Terintegrasi dari data warehouse (Sumber : Inmon, Building the Data Warehouse, 2002, p33)
11 2.1.4.3 Nonvolatile (Tidak Berubah) Proses update, insert dan delete biasanya dilakukan pada OLTP dengan basis record. Tetapi manipulasi data pada data warehouse lebih sederhana. Hanya ada 2 macam operasi dalam data warehouse yaitu loading data dan akses data. Dalam data warehouse tidak ada proses update terhadap data.
Data Warehouse
Operational isrt
chng access dlet
dlet isrt
chng
load
record-by-record manipulation of data
acces
mass load/ access of data
Gambar 2.2 Aspek Nonvolatile data warehouse (Sumber : Inmon, Building the Data Warehouse, 2002, p34)
2.1.4.4 Time-variant (Bervariasi Menurut Waktu) Data yang tersimpan dalam data warehouse bersifat time variant atau bersifat akurat pada periode tertentu. Karakteristik dasar data dalam data warehouse sangat berbeda dengan data pada OLTP, dimana data hanya akurat untuk waktu sesaat setelah data diakses, sedangkan data pada data warehouse akurat selama periode waktu tertentu, maka dikatakan memiliki perbedaan waktu / rentang waktu (time variance). Aspek yang menunjukkan karakteristik time variant dalam data warehouse adalah sebagai berikut :
12 •
Data warehouse mempresentasikan data untuk kurun waktu 5-10 tahun. Sedangkan pada OLTP memrepresentasikan data untuk jangka waktu yang lebih singkat mulai dari 60-90 hari. Karena pada OLTP, aplikasi yang digunakan harus memiliki response time yang singkat maka data yang diproses harus optimal.
•
Secara implisit maupun eksplisit, setiap struktur data pada data warehouse mengandung elemen waktu seperti hari, minggu, bulan, dan sebagainya. Elemen waktu ini hampir selalu menjadi dasar yang mengintegrasi data dalam data warehouse.
•
Data pada data warehouse merupakan serangkaian snapshot. Yaitu potongan data yang dikelompokkan sesuai dengan urutan waktu.
Gambar 2.3 Aspek Time Variant data warehouse (Sumber : Inmon, Building the Data Warehouse, 2002, p35) Terlihat bahwa keempat karakteristik ini saling terkait, semuanya harus diimplementasikan agar suatu data warehouse dapat berjalan efektif untuk mendukung pengambilan keputusan. Dan, implementasi keempat karakteristik ini membutuhkan struktur data dari data warehouse yang berbeda dengan database sistem operasional.
13
2.1.5
Struktur Data Warehouse Data warehouse memiliki struktur yang berbeda dimana terdapat beberapa
tingkat summary dan umur data.
Gambar 2.4 Struktur data warehouse (Sumber : Inmon, Building the Data Warehouse, 2002, p36) Komponen-komponen struktur data warehouse adalah : •
Current Detail Data (Data Detil Saat Ini) Data ini adalah data yang aktif saat ini, merupakan level terendah dari data warehouse, dan biasanya memerlukan tempat penyimpanan (storage) yang besar. Beberapa alasan mengapa current detail data menjadi perhatian utama : a. Menggambarkan kejadian yang baru terjadi dan selalu menjadi perhatian utama,
14 b. Sangat besar jumlahnya dan disimpan pada tingkatan penyimpanan terendah, c. Hampir selalu disimpan di media penyimpanan karena cepat diakses tetapi mahal dan kompleks diatur, d. Biasa digunakan dalam membuat rekapitulasi data sehingga current detail data harus akurat. •
Older Detail Data (Data Detil Yang Lalu) Data ini merupakan data historis yang disimpan pada media penyimpanan yang terpisah dengan current detail data. Penamaan media penyimpanan sebaiknya mencerminkan umur dari data untuk memudahkan pengaksesan kembali. Contoh : Perincian penjualan pada tahun 1995-2000.
•
Lightly Summarized Data Data ini merupakan ringkasan atau rangkuman dari current detail data, namun belum bersifat total summary. Data dirangkum berdasarkan periode waktu atau dimensi lainnya sesuai dengan kebutuhan, memiliki tingkatan detil yang lebih tinggi dan mendukung kebutuhan data warehouse pada tingkatan departemental. Akses terhadap data jenis ini banyak digunakan untuk view dari suatu kondisi yang sedang dan sudah berjalan. Contoh : Penjualan produk per periode pada suatu wilayah tahun 2002-2004
•
Highly Summarized Data Data ini merupakan ringkasan atau rangkuman yang dihasilkan dari lightly summarized data yang bersifat total dan mudah diakses terutama untuk
15 melakukan analisis perbandingan data berdasarkan urutan waktu dan analisis yang menggunakan data multi-dimensi. Database multi-dimensi adalah suatu teknologi software komputer yang dirancang untuk meningkatkan efisiensi dalam pencarian (query) data sehingga menjadi media penyimpanan yang lebih baik serta memudahkan pengambilan data dengan volume yang besar. Contoh : Penjualan produk nasional tahun 19992003. •
Metadata Metadata merupakan data yang menjelaskan tentang data dan merupakan suatu bentuk jaringan yang sangat penting bagi penggunaan data warehouse. Metadata dibuat untuk menjawab kebutuhan dari suatu fungsi tertentu karena setiap departemen biasanya menggunakan struktur data yang spesifik meskipun asal datanya sama. Peranan metadata yaitu: o Sebagai
directory
untuk
menempatkan isi data
membantu
pengguna
data
warehouse
dan mengetahui lokasi data dalam data
warehouse, o Sebagai panduan untuk menempatkan (mapping) data pada saat data ditransformasikan dari OLTP ke dalam lingkungan data warehouse, o Sebagai panduan untuk menghasilkan rangkuman dari current detailed data menjadi lightly summarized data dan dari lightly summarized data menjadi highly summarized data.
16 2.1.6 Anatomi Data Warehouse Arsitektur data warehouse dibuat berdasarkan konsep bahwa data warehouse mengambil data dari berbagai sumber dan memindahkannya ke dalam sebuah pusat pengumpulan data yang besar. Konsep ini sebetulnya lebih cenderung pada sebuah lingkungan
main
frame
yang
terpusat.
Keunggulan
teknologi
client-server
memungkinkan data warehouse diterapkan dalam berbagai macam cara untuk menampung kebutuhan pemakai sistem secara lebih proposional. Misalnya pemakai tertentu perlu menggabungkan data dari sebuah sistem pengumpulan data yang statis, dengan data dari sistem operasional yang dinamis hanya dalam sebuah query saja. Di dalam memutuskan bentuk mana yang akan kita gunakan dalam suatu perusahaan, terlebih dahulu kita harus mengetahui kebutuhan yang kita perlukan dalam menjalankan aplikasi yang ingin kita rancang. Berikut ini adalah tiga jenis dasar sistem data warehouse: •
Data Warehouse Fungsional (Functional Data Warehouse) Data warehouse Fungsional mempergunakan pendekatan kebutuhan dari tiap bagian fungsi bisnis untuk departemen, divisi, dan lain sebagainya, untuk mendefinisikan jenis data yang akan ditampung di dalam sistem. Setiap unit fungsi dapat mempunyai gambaran datanya masing-masing. Penerapan jenis sistem pengumpulan data seperti ini beresiko kehilangan konsistensi data di luar lingkungan bisnis bersangkutan. Apabila pendekatan ini lingkupnya diperbesar dari lingkungan fungsional menjadi lingkup perusahaan, konsistensi data perusahaan tidak lagi dapat dijamin. Sebab utama dipergunakan pendekatan seperti ini adalah bahwa sistem ini dapat memberi solusi yang mudah untuk dibangun
17 dengan biaya investasi yang relatif rendah dan dapat memberikan kelompok pemakai sebuah kemampuan sistem pengumpulan data yang terbatas •
Data Warehouse Terpusat (Centralized Data Warehouse) Data warehouse Terpusat adalah pendekatan yang paling banyak digunakan, sebagian besar karena keterbiasaan pemakai dengan lingkungan main frame yang terpusat. Data diambil dari seluruh sistem operasional dan disimpan di dalam pusat penyimpanan data. Pemakai kemudian bekerja dengan mempergunakan data yang telah terkumpul tersebut untuk membangun data warehouse Fungsional masingmasing. Keuntungan sistem ini dibandingkan dengan data warehouse Fungsional adalah bahwa data benar-benar terpadu. Sistem ini mengharuskan pemasok data harus mengirimkan data tepat pada waktunya agar supaya tetap konsisten dengan pemasok lainnya. Di samping itu, pemakai hanya dapat mengambil data dari bagian pengumpulan saja, dan tidak dapat secara langsung berhubungan dengan pemasok datanya sendiri.
Gambar 2.5 Data Warehouse Terpusat (Sumber : http://www.dmreview.com/editorial/dmdirect/080198_bhend_2.gif)
18 •
Data Warehouse Terdistribusi (Distributed Data Warehouse). Data warehouse Terdistribusi dikembangkan berdasarkan konsep data warehouse “gateway” yang memungkinkan pemakai untuk langsung berhubungan dengan sumber data maupun dengan pusat pengumpul data lainnya. Gambaran pemakai atas data adalah berupa gambaran logik karena data mungkin diambil dari berbagai sumber yang berbeda. Pendekatan ini mengandalkan keunggulan teknologi client-server untuk mengambil data dari berbagai sumber. Pendekatan ini memungkinkan tiap departemen atau divisi untuk membangun pengumpul data fungsionalnya masing-masing atau bahkan sistem operasionalnya dan memadukan bagian-bagian tersebut dengan teknologi client-server. Pendekatan ini memerlukan biaya yang sangat besar karena setiap sistem pengumpulan data fungsional dan sistem operasinya dikelolah secara terpisah. Di samping itu, supaya berguna bagi perusahaan, data harus disinkronisasikan untuk memelihara keterpaduannya. Metode ini akan efektif apabila data telah tersedia dalam bentuk yang konsisten dan pemakai ingin dapat menambah data tersebut dengan informasi baru apabila ingin membantu gambaran baru atas informasi.
Gambar 2.6 Data Warehouse Terdistribusi (Sumber : http://tdwi.org/Publications/WhatWorks/display.aspx?id=7316 )
19 2.1.7
Kegunaan Data Warehouse Menurut Williams(1998, p533), data warehouse biasanya digunakan untuk
melakukan empat tugas yang berbeda, antara lain : •
Pembuatan Laporan Pembuatan laporan merupakan salah satu kegunaan data warehouse yang paling umum. Dengan menggunakan query sederhana dalam data warehouse, dapat dihasilkan informasi per tahun, per bulan, dan bahkan per hari.
•
On-Line Analyical Processing (OLAP) Dengan OLAP, data warehouse dapat digunakan dalam melakukan analisis bisnis untuk mengetahui kecenderungan pasar dan faktor-faktor penyebabnya, hal ini disebabkan karena dengan adanya data warehouse, semua informasi baik rinci maupun ringkasan yang dibutuhkan untuk proses analisa mudah didapat. OLAP menggunakan konsep data multidimensi dan memungkinkan pemakai untuk menganalisa data sampai mendetil, tanpa perlu mengetikkan suatu perintah pemrograman. Hal ini dimungkinkan karena pada konsep data multidimensi, maka data berupa fakta yang sama bisa dilihat dengan menggunakan dimensi yang berbeda.
•
Data Mining Data mining dimaksudkan untuk menggali data-data yang ada pada data warehouse untuk mencari informasi dan pengetahuan baru, dengan memakai berbagai macam alat bantu diantaranya statistik, kecerdasan buatan dan lain-lain. Data Mining diharapkan dapat membantu menjembatani komunikasi antara data dan pemakainya.
20 •
Proses Informasi Eksekutif Tujuan lain pokok data warehouse digunakan untuk mencapai ringkasan informasi yang penting dengan tujuan membuat keputusan bisnis, tanpa harus melihat keseluruhan data. Informasi dan data pada laporan data warehouse menjadi targer informatif bagi pemakai dalam hal ini adalah pihak eksekutif. Menurut Connolly (Database Systems, A Practical Approach to Design, Implementation, and Management, 4th edition, 2002, p1048), data warehouse yang telah diimplementasikan dengan baik dapat memberikan keuntungan yang besar bagi organisasi, yaitu : •
Potensi nilai balik yang besar pada investasi Sebuah organisasi harus mengeluarkan uang dan sumber daya dalam jumlah yang cukup besar untuk memastikan kalau data warehouse telah diimplementasikan dengan baik dan biaya yang dikeluarkan dapat berkisar antara 50.000 pound sampai 10.000.000 pound, tergantung dari solusi teknikal yang diinginkan.
•
Keuntungan kompetitif Keuntungan kompetitif didapatkan apabila pengambil keputusan mengakses data yang dapat mengungkapkan informasi yang sebelumnya tidak diketahui, tidak tersedia, misalnya informasi mengenai konsumen, tren, dan permintaan.
•
Meningkatkan produktivitas para pengambil keputusan perusahaan Data warehouse meningkatkan produktivitas para pengambil keputusan perusahaan dengan menciptakan sebuah database yang terintegrasi
21 secara konsisten, berorientasi pada subjek, dan data historis. Data warehouse mengintegrasikan data dari beberapa sistem yang tidak kompatibel ke dalam bentuk yang menyediakan satu pandangan yang konsisten dari organisasi. Dengan mengubah data menjadi informasi yang berguna, maka seorang manajer bisnis dapat membuat analisa yang lebih akurat dan konsisten.
2.1.8
Perencanaan dan Perancangan Data Warehouse
2.1.8.1 Perencanaan Data Warehouse Dalam perencanaan data warehouse faktor-faktor di bawah ini harus diperhatikan. 1. Tujuan. Tujuan pembangunan data warehouse harus memenuhi kriteria di bawah ini: •
Meningkatkan kemampuan akses informasi
•
Meningkatkan kualitas keputusan yang diambil
•
Memberikan integrasi dan interfungsi dalam organisasi perusahaan
•
Meningkatkan apresiasi pemakai dalam menangkap/menyentuh data
2. Terkait dengan perencanaan strategi organisasi dalam menjalankan aktivitasnya. 3. Merujuk pada kebutuhan masa depan dan pada kemungkinan pemakai (user) baru dalam organisasi. 4. Kriteria fasilitas yang dapat diberikan oleh data warehouse: •
Akuisisi data yang mendukung integrasi data
•
Navigasi yang memudahkan pemakai (user) untuk mencari dan load data
•
Akses yang mudah dan cepat
22 2.1.8.2 Perancangan Data Warehouse Menurut Kimball dalam buku yang ditulis oleh Connoly-Begg (Database Systems, A Practical Approach to Design, Implementation, and Management, 4th edition, 2005,p1187), tahap-tahap perancangan data warehouse adalah sebagai berikut: 1. Choosing the process (Memilih Proses) Menentukan proses berarti menentukan subyek utama. Subyek utama merujuk pada suatu kegiatan bisnis perusahaan yang terpenting. 2. Choosing the grain Menentukan grain maksudnya menentukan apa yang direpresentasikan oleh suatu tabel fakta. Setelah menentukan grain dari tabel fakta maka untuk selanjutnya dapat ditentukan tabel-tabel dimensi yang berhubungan dengan tabel fakta tersebut. Penentuan grain dari suatu tabel fakta berarti juga menentukan grain dari setiap tabel dimensi. 3. Identifying
and
conforming
the
dimensions
(Mengidentifikasi
dan
Menkonfirmasi dimensi - dimensi) Tahap selanjutnya adalah mengidentifikasi dan menghubungkan dimensi tersebut dengan tabel fakta. Dimensi merupakan kumpulan sudut pandang mengenai suatu fakta yang terdapat pada tabel fakta. 4. Choosing the facts (Memilih Fakta) Grain dari suatu tabel fakta menentukan fakta-fakta yang bisa ditampilkan. Pada tahap ini, hal yang dilakukan adalah menentukan measure (ukuran) yang dibutuhkan pada tabel fakta.
23 5. Storing pre-calculations in the fact table (Menyimpan Pra-kalkulasi Di Dalam Tabel Fakta) Umumnya hasil perhitungan dari atribut di database tidak disimpan pada suatu atribut khusus pada database tersebut, namun pada tahap ini, perlu dipertimbangkan kembali penyimpanan hasil perhitungan pada suatu atribut tersendiri di database dengan alasan mengurangi resiko kesalahan pada program setiap kali melakukan perhitungan pada atribut-atribut tersebut. 6. Rounding out the dimension tables (Melengkapi Tabel-Tabel Dimensi) Dari dimensi-dimensi yang telah diidentifikasi, pada tahap ini dibuat deskripsi dari tabel-tabel dimensi yang memuat informasi terstruktur mengenai atributatribut pada tabel dimensi. 7. Choosing the duration of the database (Memilih Durasi Dari Database) Pada tahap ini ditentukan durasi atau periode waktu dari data-data yang akan dimasukkan ke data warehouse. 8. Tracking slowly changing dimensions (Mencari Perubahan-Perubahan Pada Dimensi Secara Teliti) Dimensi dapat berubah, untuk mengantisipasinya ada 3 cara untuk mengubah data di dimensi, yaitu : 1. Menulis ulang atribut yang berubah 2. Membuat record baru pada dimensi 3. Membuat suatu atribut alternatif untuk menampung nilai yang baru, sehingga nilai lama dan nilai baru dari atribut tersebut bisa diakses secara bersamaan.
24 9. Deciding the query priorities and the query models (Menentukan Prioritas Query dan Model Query) Pada tahap terakhir ini, pertimbangan yang dilakukan lebih berupa perancangan fisik dari data warehouse.
2.1.8.3 Metode Analisis Perancangan Data Warehouse Dalam pengembangan data warehouse, ada yang disebut Dimensional Lifecycle. Dimensional Lifecycle merupakan siklus pembuatan datawarehouse. Tahap – tahap dalam Dimensional Lifecycle adalah sebagai berikut : a. Project Planning b. Project Management c. Business Requirement Definition d. Technical Architecture Design e. Product selection and installation f. Dimensional Modelling g. Physical design h. Data Staging design and development i. Analitic Application Specification j. Analitic Application Development k. Deployment l. Maintenance and Growth
25
Gambar 2.7 Dimensional Lifecycle Diagram (Sumber: Kimball,The Data Warehouse Toolkit, 2002, p332)
Terdapat beberapa metode yang dapat digunakan untuk menganalisis dan merancang sebuah data warehouse, yaitu : 1. Top-Down Metode ini dimulai dengan mengidentifikasikan apa yang dibutuhkan oleh suatu organisasi atau instansi yang dapat dipenuhi aplikasi data warehouse yang akan dibangun. Dengan metode ini dapat dikembangkan data warehouse secara terencana dan dapat memenuhi kebutuhan yang ada. 2. Bottom-Up Metode ini dimulai dengan percobaan dan pembuatan prototype. Keuntungan metode ini adalah waktu pengembangan yang dibutuhkan relatif singkat. 3. Gabungan Top-Down dan Bottom-Up Metode ini merupakan gabungan dari metode Top-Down dan Bottom-Up yang digunakan untuk memperoleh keuntungan dari kedua metode tersebut.
26 2.1.9
Perancangan Data Warehouse dengan Skema Bintang Menurut Poe (Building a Data Warehouse for Decision Support, 1998, p26)
metode yang digunakan untuk merancang data warehouse adalah dengan menggunakan skema bintang, yaitu metode perancangan yang dilakukan dengan struktur yang sederhana dengan menggunakan beberapa tabel dan jalur yang terhubung dengan baik dan jelas. 2.1.9.1 Keuntungan menggunakan Skema Bintang Dengan menggunakan skema bintang, dapat diperoleh keuntungan yang tidak dapat diperoleh melalui struktur relasional biasa. Keuntungan yang dapat diperoleh (Poe, Building a Data Warehouse for Decision Support,1998, p192) antara lain: •
Menciptakan rancangan database yang menyediakan respon time yang cepat.
•
Menyediakan rancangan yang dapat dimodifikasi atau ditambah secara berulangulang dengan mudah sesuai dengan perkembangan data warehouse.
•
Perancangan database memungkinkan pengguna akhir menyesuaikan cara berpikir dengan kegunaan data secara paralel.
•
Menyederhanakan pemahaman dan pengarahan dari metadata bagi pengembang dan pengguna akhir.
•
Memberikan banyak pilihan terhadap alat untuk mengakses front end data.
2.1.9.2 Tabel Fakta dan Tabel Dimensi Terdapat dua tipe tabel dalam skema bintang yaitu tabel fakta dan tabel dimensi. Tabel fakta seringkali disebut sebagai tabel mayor, terdiri dari data kuantitatif atau data fakta mengenai bisnis, informasi yang di-query. Informasi ini sering diukur secara
27 numerik dan dapat mengandung banyak kolom dan jutaan baris. Tabel dimensi seringkali disebut sebagai tabel minor karena lebih kecil dan menunjang data deskriptif yang mencerminkan dimensi bisnis. Contoh tabel fakta dalam database penjualan berisi pendapatan penjualan produk untuk setiap konsumen, di setiap daerah pemasaran, dalam suatu periode waktu tertentu.
2.1.9.3 Ketentuan pembacaan Skema Bintang Adapun ketentuan dalam pembacaan skema bintang adalah sebagai berikut : •
bagian yang ada di bawah judul tabel adalah kolom-kolom dari tabel.
•
Primary key dan foreign key diberi kotak
•
Primary key diarsir, sedangkan foreign key yang bukan primary key tidak diarsir
•
Foreign key yang berhubungan ditunjukan dengan garis yang menghubungkan tabel.
•
Kolom yang bukan kunci disebut kolom data pada tabel fakta dan atribut tabel dimensi.
2.1.9.4 Jenis-jenis Skema Bintang Dalam penggunaannya terdapat dua buah jenis skema bintang yang tergantung dengan kebutuhan, yaitu Skema Bintang Sederhana dan Skema Bintang Majemuk yang akan dirinci lebih lanjut berikut ini. o
Skema Bintang Sederhana Dalam skema bintang sederhana, setiap tabel harus mempunyai primary key yang dapat terdiri dari sebuah kolom atau lebih. Primary key tersebut
28 membuat setiap baris menjadi unik. Dalam skema bintang sederhana, primary key pada tabel fakta terdiri dari satu atau lebih foreign key. Foreign key adalah sebuah kolom pada sebuah tabel yang nilainya didefinisikan oleh primary key di tabel yang lain. Ketika database dibuat, perintah-perintah SQL digunakan untuk membuat tabel yang akan merancang kolom-kolom, yang nantinya akan membentuk primary key dan foreign key. Tabel utama memiliki primay key yang terdiri dari tiga foreign key yaitu kunci 1, kunci 2, dan kunci 3, yang masing-masing merupakan primary key di tabel dimensi-masing-masing. Di sini terjadi hubungan many to one antara foreign key pada tabel fakta dengan primary key pada tabel dimensi. Tabel Dimensi 1 Kunci 1 Atribut Atribut Tabel Dimensi 2 … Kunci 2 Atribut Atribut Atribut … Atribut
Tabel Fakta Kunci 1 Kunci 2 Kunci 3 Kolom Data Kolom Data … Kolom Data
Tabel Dimensi 3 Kunci 3 Atribut Atribut … Atribut
Gambar 2.8 Hubungan antara tabel dimensi pada Skema Bintang Sederhana (Sumber : Poe, Building a Data Warehouse for Decision Support,1998, p192)
Alasan memilih skema bintang sederhana antara lain: 1. Struktur rancangannya yang sederhana mudah dimengerti end-user. 2. Menyediakan response times yang lebih baik.
29
Gambar 2.9 Skema Bintang dengan lebih dari Satu Tabel Fakta (Sumber : Poe, Building a Data Warehouse for Decision Support,1998, p194) Pada gambar 2.9 terlihat bahwa dua tabel fakta dan tiga tabel dimensi. Di sini hubungan many to one antara foreign key pada kedua fakta tersebut dengan primary key pada masing-masing tabel dimensi. Penggunaan lain dari tabel fakta adalah untuk mendefinisikan hubungan many to many antara berbagai tabel dimensi yang sudah jelas dalam bisnis. Jenis skema bintang ini sering disebut tabel asosiasi. Tabel ini dibuat untuk menyelaraskan hubungan many to many di antara dimensi yang berbeda. Dalam gambar 2.10 yang berfungsi sebagai penyelaras adalah tabel fakta 2.
30
Gambar 2.10 Skema Bintang sebagai Tabel Asosiasi (Sumber: Poe, Building a Data Warehouse for Decision Support, 1998, p 195)
Tabel dimensi mungkin mengandung foreign key yang merefensikan primary key di tabel dimensi lain. Tabel dimensi yang direferensikan ini disebut outboard table atau secondary dimension table. Pada gambar 2.11 akan terlihat Tabel Dimensi 3 mempunyai dua buah outboard table yaitu Tabel Dimensi 4 dan Tabel Dimensi 5.
Gambar 2.11 Skema Bintang dengan outboard table atau secondary dimension table (Sumber: Poe, Building a Data Warehouse for Decision Support, 1998, p197)
31 Salah satu variasi yang ada pada skema bintang adalah menyimpan seluruh informasi tabel dimensi dalam bentuk normal ke tiga. Sementara fakta tetap dalam keadaan semula. Hal ini biasanya disebut dengan Skema Snowflake yang ditunjukkan pada gambar 2.12. Ciri-ciri Snowflake adalah: o Tidak ada level di tabel dimensi. o Tabel dimensi dinormalisasi dengan dekomposisi pada level atribut. o Setiap dimensi mempunyai satu key untuk setiap level pada hirarki dimensi. o Kunci level terendah menghubungkan tabel dimensi dengan tabel fakta dan tabel atribut berlevel terendah.
Gambar 2.12 Skema Bintang Snowflake (Sumber: Poe, Building a Data Warehouse for Decision Support, 1998, p198)
o Skema Bintang Majemuk Pada sebuah skema bintang sederhana, primary key yang ada pada tabel fakta dibentuk dengan menggabungkan kolom-kolom foreign key. Dalam beberapa aplikasi, foreign key yang akan digabungkan tersebut kadang-kadang
32 tidak menyediakan suatu identifikasi yang unik terhadap setiap baris yang ada pada tabel fakta. Oleh karena itu diperlukan sebuah skema bintang majemuk. Di dalam skema bintang majemuk, tabel fakta memiliki dua kumpulan foreign key, yang satu mengandung suatu referensi dengan tabel dimensi, dan yang lain adalah primay key yang merupakan gabungan dari satu atau lebih kolom yang menghasilkan suatu identifikasi unik untuk setiap barisnya. Primay key dan foreign key saling tidak identik di dalam skema bintang majemuk, yang membedakannya dengan skema bintang sederhana. Skema bintang majemuk dapat dilihat pada gambar 2.13.
Gambar 2.13 Skema Bintang Majemuk (Sumber: Poe, Building a Data Warehouse for Decision Support,1998, p 199)
2.1.9.5 Granularitas Granularitas adalah level detail dalam data warehouse dan salah satu prinsip dalam mendesain data warehouse. Granularitas data yang tinggi menyediakan sejumlah besar informasi yang detail dan volume data yang besar pula. Granularitas data yang rendah menyediakan data yang kurang detail, lebih pada level ringkasan data dan
33 volume data yang lebih kecil (Poe, Building a Data Warehouse for Decision Support, 1998, p26).
2.1.9.6 Drill Down dan Rolling Up Melihat data dari sudut pandang yang berbeda dapat memberikan jawaban yang diperlukan. Konsep Drill Down dan Rolling Up membuat pengguna dapat menganalisa data melalui sudut pandang atau level yang ber beda. Drill Down adalah suatu cara untuk melihat data dari level yang tinggi melalui dimensi yang berbeda ke level yang lebih detail dari suatu data. Rolling Up adalah suatu cara untuk melihat data dari level yang detail ke level yang lebih tinggi atau ringkasan (Poe, Building a Data Warehouse for Decision Support, 1998, p203).
2.1.10 Agregasi Agregasi adalah proses perhitungan data fakta terhadap atribut-atribut yang telah didefinisikan. Sebagai contoh dapat dibuat ringkasan dari jumlah penjualan barang berdasarkan wilayah dan jenis produk dengan menghitung nilai penjualan dari data transaksi yang terjadi. Agregasi dapat dibuat selama proses transformasi dan pengambilan data dalam data warehouse. Faktor yang mendorong pembuatan Agregasi adalah (Poe, Building a Data Warehouse for Decision Support,1998, p204): 1. Peningkatan performance pencarian. 2. Pengurangan jumlah dari penggunaan CPU cycles. Suatu agregasi yang baik dapat dibuat untuk digunakan oleh tiga ratus pemakai dalam satu hari, karena akan lebih bermanfaat jika dibandingkan dengan membuat
34 agregasi yang membutuhkan waktu dua jam tetapi hanya digunakan sekali dalam setahun oleh satu pemakai saja. Salah satu teknik yang harus dicatat adalah saat permulaan data warehouse, kita tetap membutuhkan teknik database klasik seperti tabel secara fisik. Hal ini menjadi penting bilamana data warehouse mencapai ukuran besar.
2.1.11 Denormalisasi Denormalisasi adalah suatu proses yang merubah bentuk normalisasi dari database dengan cara penggabungan tabel dan merupakan sebuah proses yang secara sengaja dilakukan dengan melanggar peraturan bentuk normal dari normalisasi dengan tujuan untuk meningkatkan kinerja pengaksesan data yang ada. Alasan utama untuk melakukan hal ini (Poe, Building a Data Warehouse for Decision Support,1998, p207): 1. Untuk mengurangi jumlah hubungan yang terjadi antar tabel-tabel yang harus mengalami proses pada waktu dilakukan pencarian. Dengan inilah performance database dapat ditingkatkan. 2. Untuk membuat struktur fisik dari database yang semakin mendekati model dimensi dari pemakai. Membuat struktur tabel sesuai dengan yang ingin ditanyakan oleh pemakai, memungkinkan terjadinya akses langsung, yang sekali lagi akan meningkatkan performance.
Kelemahan dalam proses denormalisasi adalah : 1. Proses denormalisasi secara tidak langsung akan membuat redundansi data.
35 2. Proses denormalisasi memerlukan alokasi memory dan storage (tempat penyimpanan) yang besar.
2.1.12 CSF ( Critical Success Factor ) Menurut McLeod (Management Information Systems 9th,2004, p109) CSF merupakan salah satu bentuk dari aktifitas perusahaan yang mempunyai pengaruh kuat terhadap kemampuan perusahaan. Dalam mencapai tujuannya. Biasanya suatu perusahaan mempunyai beberapa CSF. CSF hampir sama dengan management by exception, yaitu hanya memperhatikan sebagian dari operasional perusahaan saja, bukan seluruhnya. Perbedaannya, CSF relatif lebih stabil, dalam arti faktor-faktornya dapat berubah namun dalam jangka waktu yang agak lama. Ada tiga hal yang harus diperhatikan dalam CSF, yaitu : •
Informasi yang bersifat kritis Adalah informasi yang berhubungan dengan CSF, informasi ini dapat diperoleh dari data internal
•
Asumsi kritis Merupakan asumsi yang digunakan untuk mengetahui sejauh mana tujuan dan CSF suatu perusahaan berkembang atau tercapai. Asumsi yang diberikan dapat berubah berdasarkan kondisi atau keadaan tertentu.
•
Keputusan kritis Adalah keputusan yang bersifat kritis didalam menjalankan suatu perusahaan. Kebanyakan dari keputusan kritis ini digunakan sebagai dasar untuk membangun suatu sistem pendukung keputusan.
36 2.1.13 Analisis SWOT Analisis SWOT (Strengths, Weaknesses, Opportunities and Threats) menurut http://www.stfrancis.edu/ba/ghkickul/stuwebs/btopics/works/swot.htm, “SWOT analysis is an important step in planning and its value is often underestimated despite the simplicity in creation”, dengan kata lain analisis SWOT merupakan langkah penting dalam
perencanaan
dan
nilainya
sering
kali
tidak
diperkirakan.
Menurut
http://www.mindtools.com/pages/article/newTMC_05.htm, “SWOT Analysis is an effective way of identifying your Strengths and Weaknesses, and of examining the Opportunities and Threats you face”, dengan kata lain analisis SWOT merupakan sebuah langkah efektif dalam mengidentifikasikan Kekuatan dan Kelemahan (Strengths and Weaknesses), dan mempelajari Peluang dan Ancaman (Opportunities and Threats). Analisis SWOT yang merupakan langkah penting dalam menjalankan strategi bisnis terdiri dari : •
Strengths Melakukan
analisis
kekuatan
yang
ada
pada
perusahaan
dengan
cara
mengidentifikasikan kekuatan-kekuatan atau kelebihan yang dimiliki perusahaan. •
Weaknesses Melakukan analisis terhadap kelemahan yang ada pada perusahaan dengan cara mengidentifikasi kelemahan yang dimiliki, apa yang harus diperbaiki, dan apa yang harus dihindari.
•
Opportunities Melakukan analisis terhadap peluang yang dapat dimanfaatkan dari situasi pasar.
•
Threats
37 Melakukan analisis terhadap ancaman yang mungkin dapat mempengaruhi kinerja perusahaan, seperti kompetitor, kemajuan teknologi, atau pun kelemahan yang dimiliki menjadi hambatan besar.
2.2 Teori Khusus 2.2.1
Pengertian Manajemen Pendidikan Menurut Kamus Besar Bahasa Indonesia (2002, p476) manajemen adalah
penggunaan sumber daya secara efektif untuk mencapai sasaran. Pendidikan adalah pengajaran keahlian khusus, dan juga sesuatu yang tidak dapat dilihat tetapi lebih mendalam yaitu pemberian pengetahuan, pertimbangan dan kebijaksanaan. Menurut Cut Zahri Harun dalam situs resmi Departemen Pendidikan Nasional Indonesia, manajemen pendidikan adalah suatu ilmu yang mempelajari bagaimana menata sumber daya, baik SDM maupun sumber daya lain untuk mencapai tujuan pendidikan.
2.2.2
Pengertian Perguruan Tinggi, Fakultas dan Jurusan Menurut Kamus Besar Bahasa Indonesia (2002), perguruan tinggi yang terdiri
atas sejumlah fakultas yang menyelenggarakan pendidikan ilmiah dan atau professional dalam sejumlah disiplin ilmu tertentu. Fakultas merupakan bagian perguruan tinggi tempat mempelajari suatu bidang ilmu yang terdiri atas beberapa jurusan. Jurusan merupakan bagian dari suatu fakultas atau sekolah tinggi yang bertanggung jawab untuk mengelola dan mengembangkan suatu bidang studi.
38 2.2.3
Pengertian Dosen Menurut Kamus Besar Bahasa Indonesia (2002), Dosen merupakan tenaga
pengajar yang ada pada perguruan tinggi.
2.2.4
Mahasiswa Menurut Kamus Besar Bahasa Indonesia (2002), Mahasiswa merupakan orang
yang belajar di perguruan tinggi. Jenjang ini merupakan lanjutan dari Sekolah Menengah Tingkat Atas.
2.2.5
Ilmu Komputer Menurut Kamus Besar Bahasa Indonesia (2002), Komputer adalah alat
elektronik otomatis yang dapat menghitung atau mengolah data secara cermat menurut yang diinstruksikan, dan memberikan hasil pengolahan, serta dapat menjalankan sistem multimedia (film, musik, televisi, faksimile, dsb.), biasanya terdiri atas unit pemasukan, unit pengeluaran, unit penyimpanan, serta unit pengontrolan. Sedangkan ilmu komputer adalah pengetahuan tentang bidang komputer yang disusun secara bersistem menurut metode tertentu.
2.2.6
Teknik Informatika Menurut Kamus Besar Bahasa Indonesia (2002), Teknik Informatika adalah ilmu
tentang klasifikasi, penyimpanan, pengeluaran dan penyebaran pengetahuan yang direkam yaitu hal-hal yang berkaitan dengan informasi