SEKILAS TENTANG DATABASE Oleh : Sri Setiyowati, S.Kom Abstraksi Suatu gerakan menarik yang sedang berlangsung dalam hal database adalah KDD. Knowledge Discovery in Database (KDD) adalah istilah besar yang menjelaskan semua kegiatan pada data yang tersimpan dalam
database yang besar dan rumit. KDD mencakup sejumlah istilah yang sekarang banyak mendapatkan perhatian dalam literature computer yaitu data warehousing, data mart, dan data mining.
Kata Kunci : KDD, Data Warehousing, Data Mart, Data Mining.
PENDAHULUAN Database merupakan komponen terpenting dalam pembangunan Sistem Informasi, karena menjadi tempat untuk menampung dan mengorganisasikan seluruh data yang ada dalam system, sehingga dapat dieksplorasi untuk menyusun informasi-informasi dalam berbagai bentuk. Database merupakan himpunan kelompok data yang saling berkaitan. Data tersebut diorganisasikan sedemikian rupa agar tidak terjadi duplikasi yang tidak perlu, sehingga dapat diolah atau dieksplorasi secara cepat dan mudah untuk menghasilkan informasi. System database tersebut dikembangkan oleh para ahli agar dapat diperoleh cara pengorganisasian data yang lebih efisien dan efektif. Hal ini diperlukan karena sekarang ini berbagai bidang usaha telah menjadikan database sebagai tumpuan manajemen informasi perusahaannya. Adapun penerapan system database ini antara lain untuk pembangunan Sistem Informasi Persediaan barang, kepegawaian, penggajian akuntansi, pemasaran, produksi, rumah sakit, perhotelan dan lain-lain.
DATA WAREHOUSING Kita semua tahu bahwa sebuah database terdiri dari data yang disimpan di media computer dengan cara yang memudahkan pengambilan kembali dan pengambilannya. Data Warehousing adalah perkembangan dari konsep database yang menyediakan sumber daya data yang lebih baik bagi para pemakai dan memungkinkan pemakai untuk memanipulasi dan menggunakan data tersebut secara intuitif. Sumber daya data tersebut dinamakan data warehousing, dan umumnya sangat besar, murni dan dapat diambil kembali (retrievable). Beberapa data warehousing berisi hingga 200 gigabyte (atau 200 milyar byte) data, tetapi ukuran yang besar tersebut tidak berarti kualitasnya rendah. Perbersihan data ekstensif dapat mengubah data itu ke kondisi kualitas yang lebih tinggi daripada yang umumnya terdapat pada database komersial. Kemampuan pengambilan kembali dicapai melalui sejumlah cara, sering dengan menggunakan kecerdasan buatan dan analisa statistic. Satu teknik statistic adalah clustering, yang mengatur data dalam berbagai cara yang ingin dilihat oleh pemakai. Ini sama dengan cara pasar swalayan mengatur barang dagangan dalam tokonya sehingga barang-barang sejenis dikelompokkan bersama. Data warehousing umumnya dilakukan di computer mainframe. Data disimpan dalam database relational, dan penjual DBMS seperti Oracle, Sybase, dan Informix sedang mempromosikan kegunaan produk mereka sebagai landasan data warehouse.
DATA MART Mencapai suatu data warehouse kelihatannya merupakan tantangan besar dan karena begitu besarnya sehingga pakar menyarankan pendekatan yang lebih sederhana dalam menerapkan sesuatu yang dinamakan Data Mart. Data Mart adalah database yang berisi data yang menjelaskan satu segmen operasi perusahaan. Misalnya, perusahaan mungkin memiliki data mart pemasaran, data mart sumber daya manusia dan sebagainya.
2
Data Mining Istilah yang sering digunakan bersama-sama dengan data warehousing dan data mart adalah data mining. Data mining adalah proses menemukan hubungan dalam data yang tidak diketahui oleh pemakai. Data mining membantu pemakai dengan mengungkapkan berbagai hubungan dan menyajikannnya dengan suatu cara yang dapat dimengerti sehingga dapat menjadi dasar pengambilan keputusan, data mining memungkinkan pemakai ‘menemukan pengetahuan” pada database yang dalam sepengetahuannya tidak ada. Contoh data mining: Misalkan sebuah Bank telah memutuskan untuk menawarkan reksadana kepada para pelanggannya. Manajemen bank ingin mengarahkan materi promosi pada segmen pelanggan yang memberikan potensi bisnis terbesar. 1. Data mining berdasarkan verifikasi, dalam pendekatan ini para manajer mengidentifikasi karakterisitik yang mereka yakin dimiliki oleh pasar sasaran. Misalkan para manajer itu ingin mengarah pada pasangan muda, berpenghasilan ganda dan kaya. Query dapat dimasukkan ke dalam DBMS, dan catatan yang tepat dapat dipanggil. Pendekatan seperti ini dimulai dengan hipotesis pemakai tentang bagaimana data tersebut terstruktur, disebut data mining berdasarkan verifikasi (verification-driven data mining). Kekurangan pendekatan ini adalah proses pemanggilan kembali diarahkan sepenuhnya oleh pemakai. Informasi yang dipilih tidak lebih baik daripada pandangan pemakai terhadap data tersebut. Ini merupakan cara tradisional untuk bertanya pada database. 2. Data mining berdasarkan penemuan. Pendekatan ini memungkinkan system data mining mengidenfikasi pelanggan terbaik untuk promosi tersebut. System ini menganalisis database, mencari kelompok-kelompok dengan karakterisitk umum. Dalam contoh bank, system data mining mungkin mengidenfikasi bukan hanya kelompok pasangan muda lulusan universitas tetapi juga pasangan yang sudah pensiun yang bergantung pada jaminan social dan pensiun. System data mining dapat melaksanakan analisis setengah lebih jauh, dengan merekomendasikan satu set promosi yang diarahkan pada kedua kelompok tersebut. 3
3. Kombinasi Data Mining Verifikasi dan Penemuan. Perkembangan data mining di masa depan akan mengkombinasikan pendekatan hipotesis dan penemuan. Pengembangan ini menggunakan penalaran yang sama yang mendasari konsep system pendukung keputusan (Decision support system-DSS). Konsep tersebut memungkinkan pemakai dan computer bekerja sama untuk bersama-sama memecahkan suatu masalah. Pemakai menerapkan keahliannya dalam hal masalah dan computer melakukan analisis data yang canggih untuk memilih data yang tepat dan menempatkannya dalam format yang tepat untuk pengambilan keputusan. PROSES KDD Penemuan pengetahuan dalam database terdiri dari beberapa jenis. Walaupun langkah-langkahnya dapat didaftarkan dalam urutan logis, proses tersebut bukan tempat di mana Anda mengambil satu langkah, mengambil langkah selanjutnya dan seterusnya. Banyak langkah mundur dan mengulang langkah-langkah sebelumnya hingga hasilnya diperhalus dengan mencapai suatu titik yang memuaskan pemakai. Langkah-langkah ini antara lain: 1. Mendifinisikan data dan tugas, Pada langkah ini, pemakai dapat bekerjasama dengan seorang pengelola database dan juga seorang analis system untuk mengidentifikasi data apa yang diperlukan untuk memberi dukungan kepada pemakai dalam suatu area masalah tertentu. 2. Mendapatkan data, Ini adalah langkah untuk mengumpulkan data baru dan memasukkannya kedalam database. 3. Membersihkan data, Pada langkah ini, semua data yang akan digunakan dalam pencarian diedit untuk memastikan bahwa data tersebut ada dalam format yang tepat. Misalnya, ketidakkonsistennan dalam hal nama dan kode sehingga harus disesuaiakan. 4. Mengembangkan Hipotesis dan model Pencarian. Pada langkah ini Pemakai dan spesialis informasi mendifinisikan karakteristik data yang akan dipanggil, dan spesialis menyediakan suatu model matematika untuk membantu pemanggilan kembali dan analisis.
4
5. Menggali Data. Digunakan untuk model menguji hipotesis dan mencari polapola baru dan pengetahuan baru. 6. Menguji dan Memastikan Menggunakan model prediktif yang digunakan untuk memastikan seberapa jauh data yang dipilih dapat digunakan untuk mencapai tujuan pemakai. 7. Menafsirkan dan menggunakan Pada langkah ini pemakai menggunakan pertimbangan dalam menafsirkan data dan membuat keputusan yang diperlukan untuk memecahkan masalah. PENUTUP KDD dan konsep Integral Data warehousing dan data mining-nya menggambarkan suatu cara yang inovatif dalam melihat sumber daya data. Mereka menggambarkan penggabungan teknik database dengan analisis data dengan menggunakan peralatan seperti analisis statistic dan kecerdasan buatan. Banyak perusahaan sedang mengembangkan system KDD, tetapi masih banyak yang harus dipelajari lagi. KDD merupakan ide inovatif yang memanfaatkan computer untuk menyediakan data yang secara normal tidak diidentifikasikan oleh pemakai sebagai solusi untuk masalah mereka.
DAFTAR PUSTAKA 1. Budi Utedjo Dharma Oetomo, S.Kom, MM, “Perencanaan dan Pembangunan Sistem Informasi”, Penerbit Andi Yogyakarta, 2002. 2. Raymond McLeod Jr, “Sistem Informasi Manajemen Jilid 1”, Edisi Ketujuh, Prentice Hall, 2001.
5