BAB 1 PENDAHULUAN
1.1. Pendahuluan Dewasa ini fungsi komputer semakin dimanfaatkan baik pada perusahaan menengah ke atas maupun pada perusahaan kecil. Adapun fungsi dari komputer itu sendiri adalah mengolah data-data yang ada menjadi suatu informasi yang berguna bagi perusahaan, di mana sistem pengolahan data menggunakan komputer ini disebut dengan Sistem Informasi (SI). SI biasanya digunakan untuk menghasilkan informasi-informasi yang bersifat manajerial dan terstruktur yang biasanya dimanfaatkan oleh sekelompok orang pada tingkatan tertentu dalam menjalankan perusahaan. Dengan berkembangnya kapasitas dan kompleksitas suatu perusahaan, maka memungkinkan terjadinya berbagai masalah yang sifatnya semi terstruktur. Sehubungan dengan masalah tersebut maka dari SI yang ada dikembangkanlah suatu konsep basis data baru yang disebut dengan Data WareHouse (gudang data), yang menyediakan data pendukung keputusan bagi end user untuk mengambil keputusan atas permasalahan yang dihadapi oleh perusahaan.1 Dewasa ini, sejalan dengan perkembangan teknologi informasi, maka semakin banyak perusahaan yang mempercayakan pengambilan keputusan dengan sistem yang berbasis komputer, yaitu Data Mining Modeling.2 Dengan mempercayakan keakuratan dari Data Mining Modeling untuk mengolah Data WareHouse, maka dapat membantu perusahaan menghindari resiko-resiko yang merugikan. Diharapkan dengan diterapkannya pengolahan data yang berukuran relatif besar (Data WareHouse) menggunakan model mining pada kasus-kasus tertentu, mampu menjadi standar yang tepat dalam menganalisis kelompok-
1
Poe Vidette, Klauer Patricia dan Brobst Stephen, Building A Data WareHouse for Decision Support Second Edition. New Jersey : Prentice Hall Publishers, 2000, Hal : 18 2 Mehmed Kantardzic, Data Mining : Concepts, Models, Methods, and Algorithms. New Jersey : John Wiley & Sons, 2003, Hal : 1
18
kelompok data yang berhubungan berdasarkan keadaan alami datanya, sehingga dapat menjadi representasi yang tepat secara metodologi di kemudian hari. 1.2. Latar Belakang Masalah Setiap analisis pada data yang berukuran besar secara manual, biasanya akan mengalami kesulitan dalam menganalisa datanya. Sebelum analisis dimulai, biasanya data dikelompokkan berdasarkan entity atau constraint tertentu. Proses ini jika dilakukan secara manual, tentu akan memakan waktu dan tenaga yang cukup banyak, tergantung dari besar-kecilnya data yang ingin dianalisis. Dalam suatu instansi pendidikan, salah satu analisis yang mungkin dilakukan adalah hubungan tes masuk / tes penerimaan mahasiswa baru terhadap nilai akademiknya. Hal tersebut di atas berkaitan erat dengan kualitas pendidikan yang dipergunakan oleh instansi tersebut, yang secara tidak langsung akan mempengaruhi sumber daya manusia yang dihasilkan olehnya. Sehingga juga akan mempengaruhi nilai akademik seorang mahasiswa. Universitas Kristen Duta Wacana, selaku salah satu instansi pendidikan di Yogyakarta, selama ini dalam mengadakan analisis masih menggunakan metode yang berlainan untuk tiap tahunnya. Hal ini akan mengakibatkan hasil analisis yang ada menjadi kurang tepat dalam memprediksi perkiraan yang ada. 1.3. Rumusan Masalah Berdasarkan permasalahan di atas, maka diperlukan suatu sistem pendukung (program bantu) untuk mempermudah dalam menganalisa, sehingga keputusan yang diambil menjadi lebih mudah. Dalam hal ini bermanfaat dalam mengelompokkan data berdasarkan entity tertentu. Dengan menggunakan data warehouse, yang menyediakan gudang data untuk mendukung dalam pengambilan keputusan, kemudian diolah menggunakan model mining untuk melihat adanya pola-pola tertentu yang diharapkan dapat membantu dalam analisis data yang dibutuhkan. Berdasarkan permasalahan tersebut di atas, maka penulis menganalisis kelompok data yang ada menggunakan suatu metode, yaitu K-Means Partitional Clustering. Dengan metode tersebut diharapkan pengelompokkan data dapat
19
dianalisis sehingga dapat menjadi suatu representasi yang tepat di kemudian hari. Metode data mining yang ada saat ini sudah banyak, tetapi masingmasing metode mempunyai kecocokan tersendiri pada kasus yang dihadapi. Dalam kasus ini digunakan K-Means Partitional Clustering, yang berfungsi untuk mengelompokkan data berdasarkan nilai tengah dari suatu kelompok data. Pada metode clustering, proses penganalisisan dilihat dari pengelompokkan data secara spontan yang terjadi berdasarkan keadaan masing-masing data, tanpa diberikan kelas-kelasnya terlebih dahulu. Proses clustering diawali dengan penetapan nilai sentral data (nilai mean). Hasil dari pengelompokkan data ditampilkan dalam bentuk visual, yang menggambarkan k banyak cluster. Sehingga pengamatan terhadap data yang mirip dapat dijadikan sebagai pertimbangan dalam mengambil keputusan. Secara garis besar, sistem ini memiliki rumusan masalah sebagai berikut : 1. Bagaimana penerapan metode k-means partitional clustering sebagai salah satu metode data mining. 2. Apakah algoritma k-means mampu menangani pengelompokkan data pada kasus korelasi / hubungan antara nilai IPA/IPS, nilai potensial tes penerimaan mahasiswa baru (nilai numerik, verbal, analog, dan spasial) dengan nilai akademik mahasiswa selama 4 semester pertama. 3. Apakah algoritma k-means mampu memperlihatkan pengelompokkan data yang terjadi berdasarkan keadaaan alami data tanpa pendefinisian kelas data terlebih dahulu. 1.4. Batasan Masalah Pada permasalahan ini, pembuatan sistem mempunyai batasan-batasan sebagai berikut : 1. Sistem menggunakan metode k-means partitional clustering untuk menangani data nilai tes penerimaan mahasiswa baru 1998 ke atas untuk 4 semester pertama dan dilihat korelasi / hubungannya terhadap hasil nilai akademik. 2. Sistem mampu menampilkan tampilan grafik (visual) dari hasil clustering tersebut sesuai dengan parameter inputan user. 20
3. Sistem mampu menampilkan visualisasi 2 angkatan Teknik Informatika UKDW yang berbeda dengan pengelompokkan data (clustering) sesuai dengan k-cluster yang diinputkan oleh user. 1.5. Tujuan Penulisan dan perancangan sistem ini bertujuan : 1. Membuat suatu sistem yang dapat mendukung pihak universitas dalam pengelompokkan data-data nilai IPA/IPS, nilai potensial tes penerimaan mahasiswa baru (nilai numerik, verbal, analog, dan spasial) dengan nilai akademik mahasiswa selama 4 semester pertama. 2. Mengimplementasikan pengetahuan-pengetahuan mengenai pemrograman yang telah diperoleh selama perkuliahan. 3. Sebagai tugas akhir untuk memenuhi sebagian persyaratan untuk menyelesaikan gelar S1 Teknik Informatika. 1.6. Metodologi Penelitian Di dalam penyelesaian tugas akhir ini tentunya diperlukan suatu metode, adapun metode yang digunakan adalah : 1. Studi pustaka, studi pustaka ini bertujuan untuk menunjang pegumpulan informasi mengenai pokok bahasan yang berkaitan langsung dalam penulisan tugas akhir ini. 2. Studi lapangan, melalui penelitian lapangan, yaitu dengan : a. Melakukan pengumpulan data melalui wawancara dengan pihak universitas
untuk
memperoleh
keterangan
dan
data
yang
dibutuhkan untuk mendukung penyelesaian Tugas Akhir. b. Pengamatan
dan
studi
tentang
kebutuhan-kebutuhan
yang
mendasar untuk pembangunan sistem. 3. Melakukan konsultasi dengan dosen pembimbing berhubungan dengan perancangan dan pelaporan tugas akhir. 4. Pembuatan Sistem Clustering K-Means yang meliputi perancangan, pengkodean, pengujian dan perbaikan kesalahan. 1.7. Spesifikasi dan Kemampuan Sistem
21
Untuk mendukung kelancaran penerapan Sistem Clustering K-Means ini, maka dibutuhkan hardware dan software yang mendukung. Program tersebut dibuat dengan spesifikasi sebagai berikut : 1.7.1. Spesifikasi Hardware : 1 unit komputer PC dengan spesifikasi : •
Processor AMD Barton 2500 1.84MHz
•
RAM / Memori DDR sebesar 256 MB
•
HardDisk dengan kapasitas 20 GB
•
VGA Geforce 4 MMX 64Mb
•
Motherboard MSI K7N2 Delta
•
Monitor GTC 15 inch (1024 x 768)
•
Floppy Drive, Mouse, Keyboard
•
1 buah Printer Canon XNU i320
1.7.2. Kebutuhan Software •
Sistem Operasi Microsoft® Windows® XP Professional Edition
•
Microsoft® Visual Basic® 6.0
•
Microsoft® SQL Server 2000 Enterprise Edition
1.7.3. Kebutuhan Brainware •
Kebutuhan User User yang dapat mengoperasikan sistem ini adalah user yang dapat mengoperasikan sistem operasi Microsoft® Windows® XP, dan mengetahui pengoperasian program bantu / sistem Clustering KMeans.
•
Pengembang Pengembang sistem ini diharapkan memiliki kemampuan minimal memahami Software Visual Basic atau program developer lainnya, mengerti konsep dan perancangan database, dan tahu cara kerja / metode K-Means Patitional Clustering.
1.7.4. Kemampuan Sistem Sistem yang akan dibuat ini mengenai perbandingan pengelompokkan 2 kelompok data yang berbeda. Pengelompokkan data tersebut menggunakan metode K-Means Patitional Clustering. Pada permasalahan ini, data yang dipakai adalah data nilai tes penerimaan mahasiswa baru (antara lain : nilai
22
verbal, spatial, numerik, dan analogi), nilai IPA/IPS dan data nilai Teknik Informatika UKDW. Hasil yang dikeluarkan oleh sistem berupa visualisasi dalam bentuk grafik (diagram Cartesian) yang akan menggambarkan keadaaan data tersebut melalui sumbu X dan sumbu Y. Pada proses selanjutnya data akan diproses dengan metode K-Means Patitional Clustering. Yang nantinya akan melalui beberapa tahap iterasi dan proses akan berhenti jika suatu kondisi telah terpenuhi. Pengelompokkan data pada diagram akan menggunakan warna untuk membedakan antara kelompok data (cluster) yang satu dengan yang lainnya berdasarkan kedekatan nilai data (titik pada diagram Cartesian) dengan nilai tengah dari suatu kelompok data. Laporan yang dapat dicetak adalah informasi mengenai kelompok data itu sendiri, seperti jumlah data, informasi mengenai setiap data itu sendiri (dalam hal ini adalah informasi nilai mengenai mahasiswa yang bersangkutan), dan lain-lain. Laporan dapat dicetak setelah proses berhenti. Sistem ini diimplementasikan hanya sebatas pada penggunaan yang bersifat single-user dan hanya standalone, tidak untuk penggunaan berbasis jaringan. Software yang digunakan dalam pembangunan sistem ini adalah Microsoft® Visual Basic® 6.0 dengan Microsoft® SQL Server 2000 sebagai databasenya. 1.8. Sistematika Penulisan Sistematika penulisan yang dipergunakan pada tugas akhir ini disesuaikan dengan ketentuan yang telah diatur pada tata cara penulisan tugas akhir program studi teknik informatika Universitas Kristen Duta Wacana. Dalam melakukan dokumentasi tugas akhir perancangan Sistem Clustering K-Means ini, perancang akan memulainya dengan bagian pertama yaitu : Bab 1, merupakan pendahuluan yang memberikan gambaran umum tentang sistem yang dibuat, yang meliputi pendahuluan, latar belakang masalah, rumusan masalah, batasan masalah, tujuan tugas akhir,metodologi penelitian, spesifikasi dan kemampuan sistem, sistematika penulisan, dan jadwal kegiatan tugas akhir. 23
Kemudian pada Bab 2, perancang akan memberikan landasan teori yang digunakan dalam perancangan dan teori yang menjadi dasar pengembangan sistem ini. Dan melalui Bab 3 inilah, perancang akan menjelaskan proses peracangan dengan lebih mendetail, rancangan sistem yang dibuat, desain basis data secara dimensional maupun kerangka tampilan program didalam pola sistem masukan dan keluaran berikut diagram alir dari sistem, beserta perancangan input dan output sistemnya yang diberi judul analisis dan desain sistem. Dan di dalam Bab 4, perancang akan menjelaskan bagian input dan output yang telah dibuat pada sistem ini, yang mana merupalan hasil capture dari tampilan dari sistem yang dibuat. Dan akhirnya pada Bab 5 akan dibuat kesimpulan dan saran atas hasil perancangan sistem pendukung pengambilan keputusan ini. 1.9. Jadwal Kegiatan Jadwal penyelesaian Tugas Akhir ini akan dipaparkan seperti tabel di bawah ini. Tugas Akhir dimulai pada minggu pertama bulan Februari sampai pertengahan bulan April. Minggu
Kegiatan 1
2
3
4
5
6
7
8
9
10
Proposal Penelitian dan Pengamatan Sistem Analisis dan Desain Pembuatan Program Implementasi Pembuatan Laporan Pengumpulan Laporan dan Presentasi
24