JURNAL TEKNOLOGI Fakultas Teknologi Industri, Volume 4, No. 2, Desember 2014
ISSN : 2301-4474
DATA MINING ROUGH SET DALAM MENENTUKAN PILIHAN ALAT KONTRASEPSI PADA WANITA ( STUDI KASUS DI BKKBN KOTA PADANG ) Purnama Sari,S.Kom, M.Kom, Fakultas Ilmu Komputer Universitas Putra Indonesia YPTK Padang e-mail :
[email protected] Abstrak – Alat kontrasepsi sangat berguna dalam program KB, akan tetapi tidak semua alat kontrasepsi cocok dengan kondisi setiap orang. Setiap pribadi harus bisa memilih alat kontrasepsi yang cocok untuk dirinya. Untuk memilih metoda atau alat kontrasepsi tidak mudah karena belum mengetahui tentang efek sebelum menggunakannya. Tidak semua metode atau alat kontrasepsi cocok untuk setiap tubuh, untuk itu dibutuhkan keterampilan yang tepat untuk memahami dan tepat dalam pemilihan metode atau kontrasepsi yang akan digunakan. Berdasarkan hasil pengujian terhadap Rosetta diperoleh kecocokan data 100% terhadap data pemakaian alat kontrasepsi di BKKBN kota Padang. Kata Kunci
1.
: Alat Kontrasepsi, KB, Rosetta.
PENDAHULUAN
Data mining adalah suatu konsep yang yang digunakan untuk menemukan pengetahuan yang tersembunyi di dalam database. Salah satu contohnya adalah, Nasereddin (2009), menjelaskan data mining merupakan bagian dari proses yang disebut penemuan KDD, pengetahuan dalam database. Proses ini pada dasarnya terdiri dari langkah – langkah yang dilakukan yaitu pemilihan data, pra pengolahan dan transformasi data teknik association rule. Tujuannya adalah untuk mendeteksi hubungan atau asosiasi antara nilai-nilai tertentu dari variabel kategori dalam set data yang besar, sebagian besar proyek data mining telah berurusan dengan memverifikasi konsep, data mining yang
sebenarnya dalam penelitian ini untuk berkonsentrasi pada pemecahan masalah menggunakan database dinamis data mining. Pawlak dan Skowron (2007), memperlihatkan bahwa teori Rough set telah menghasilkan banyak aplikasi yang menarik dan ekstensi, pendekatan set secara fundamental penting dalam kecerdasan dan kognitif ilmu buatan, terutama di daerah penelitian seperti pembelajaran mesin, sistem cerdas, penalaran induktif, pengenalan pola, mereologi, penemuan pengetahuan, keputusan sistem analisis, dan ahli. Berbagai metode yang digunakan untuk generasi aturan keputusan, reducts perhitungan dan variabel, metodologi berdasarkan discernibility dan
penalaran boolean untuk perhitungan efisien entitas yang berbeda termasuk reducts dan keputusan aturan, secara khusus, telah menunjukkan bahwa pendekatan rough set dapat digunakan untuk sintesis dan analisis pendekatan konsep dalam lingkungan terdistribusi. Alat kontrasepsi sangat berguna dalam program KB, akan tetapi tidak semua alat kontrasepsi cocok dengan kondisi setiap orang. Setiap pribadi harus bisa memilih alat kontrasepsi yang cocok untuk dirinya. Untuk memilih metoda atau alat kontrasepsi tidak mudah karena belum mengetahui tentang efek sebelum menggunakannya. Tidak semua metode atau alat kontrasepsi cocok untuk setiap tubuh, untuk itu dibutuhkan keterampilan yang tepat untuk memahami dan tepat dalam pemilihan metode atau kontrasepsi yang akan digunakan. Alat kontrasepsi adalah untuk mencegah terjadinya kehamilan yang sifatnya bisa sementara atau permanen. Berdasarkan latar belakang tersebut penulis berkeinginan melakukan penelitian dengan menuangkannya dalam sebuah tesis dengan judul :” DATA MINING ROUGH SET DALAM MENENTUKAN PILIHAN ALAT KONTRASEPSI PADA WANITA (STUDI KASUS : DI BKKBN KOTA PADANG) “. 1.1 PERUMUSAN MASALAH Berdasarkan latar belakang di atas, maka masalah yang akan dibahas oleh penulis adalah sebagai berikut:
Data Mining Rough Set Dalam Menentukan Pilihan Alat . . .
33
JURNAL TEKNOLOGI Fakultas Teknologi Industri, Volume 4, No. 2, Desember 2014
1.
Bagaimana menentukan kriteria pemilihan alat kontrasepsi yang tepat? 2. Bagaimana menerapkan Data Mining menggunakan metoda Rough Set dalam menentukan alat kontrasepsi yang tepat pada wanita? 3. Bagaimana menentukan pemilihan alat kontrasepsi pada Rosetta? 1.2 Batasan Masalah Agar masalah yang akan dibahas tidak meluas dan tujuan dari penelitian ini tidak menyimpang dari pemahaman serta pembahasan yang terlalu luas, maka penulis mencoba memberikan batasan masalah antara lain yaitu: 1. Metode Rough Set dipakai untuk menganalisis pemilihan alat kontrasepsi pada wanita dan mendapatkan hasil. 2. Data hasil pelayanan KB merupakan data rill yang meliputi umur, jumlah anak dan status peserta 3. Tools yang digunakan di dalam pengolahan data adalah Rosetta. 1.3
Tujuan Penelitian Tujuan penelitian ini adalah: 1. Untuk mengetahui tingkat pemilihan alat kontrasepsi di BKKBN kota Padang. 2. Menganalisa setiap karateristik data hasil pelayanan KB yang telah diperoleh dari BKKB kota padang. 3. Merancang sebuah rule atau aturan Data Mining sesuai dengan parameter – parameternya. 4. Menguji Decision System tersebut untuk mendapatkan pengetahuan baru dari proses ekstraksi menggunakan Tools yang ada.
1.4 Manfaat Penelitian Manfaat yang diharapkan dari penelitian ini adalah sebagai referensi untuk pengembangan ilmu dalam Data mining khususnya dalam menentukan pemilihan alat kontrasepsi yang tepat. 2. LANDASAN TEORI 2.1
Definisi Data Mining
Data mining merupakan salah satu langkah dari knowledge discovery yang digunakan untuk menemukan informasi atau pengetahuan yang tersembunyi dari faktafakta pada suatu basis data yang berskala besar. Data mining didefenisikan sebagai
ISSN : 2301-4474
proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar (Prasetyo, 2006). Pada jurnal internasional data mining didefenisikan pendekatan secara luas digunakan untuk tranformasi data dan berguna untuk pola, membantu pengetahuan komprehensif dari informasi domain beton. Namun demikian data tradisional teknik pertambangan mengalami kesulitan pada aplikasi mereka pada skenario saat ini, karena kompleksitas disebutkan sebelumnya (Robles, dkk. 2008). Istilah data mining dan knowledge discovery in database (KDD) sering kali digunakan secara bergantian untuk menjelaskan proses penggalian informasi tersembunyi dalam suatu basisdata yang besar. Sebenarnya kedua istilah tersebut memiliki konsep yang berbeda, tetapi berkaitan satu sama lainnya, dan salah tahapan dalam proses KDD adalah data mining. Proses KDD secara garis besarnya dapat dijelaskan sebagai berikut (Kusrini dan Luthfi, 2009): a. Data Selection, pemilihan data baru sekumpulan data operasional perlu dilakukan tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang digunakan untuk proses data Mining, disimpan dalam suatu berkas, terpisah dan berbasis data operasional. b. Pre-processing/Clearing, sebelum dilakukan proses data mining perlu dilaksanakan proses data cleaning yang mencakup antara lain membuang duplikasi data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipograph), juga dilakukan proses enrichment , yaitu proses mempekaya data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal. Permasalahan semi terstruktur berada antara masalah yang terstruktur dengan masalah yang tidak terstruktur yang terdiri dari beberapa elemen terstruktur dan elemen tidak terstruktur. c. Transformation coding, adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data. d. Data mining, adalah proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dan suatu kumpulan data dengan menggunakan metoda tertentu.
Data Mining Rough Set Dalam Menentukan Pilihan Alat . . .
34
JURNAL TEKNOLOGI Fakultas Teknologi Industri, Volume 4, No. 2, Desember 2014
e. Interpretation/Evaluation, pola informasi yang dihasilkan dan proses data mining, perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut dengan interpretation yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya. Adapun pengelompokan data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu (Susanto dan Suryadi, 2009) : 1. Deskripsi Terkadang peneliti dan analisis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecendrungan yang terdapat dalam data. 2. Estimasi Estimasi hampir sama dengan klasifikasi kecuali variabel target estimasi lebih kearah numerik dari pada ke arah kategori. 3. Prediksi Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang. 4. Klasifikasi Dalam klasifikasi terdapat target variabel kategori. Sebagai contoh penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu pendapatan tinggi, pendapatan sedang dan pendapatan rendah. 5. Pengklusteran Pengklusteran merupakan pengelompokan record, pengamatan atau memperhatikan dalam bentuk kelas objek – objek yang memiliki kemiripan. 6. Aosiasi Tugas asosiasi dalam data mining adalah menemukan atribute yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja. 2.2.
Metode Rough Set
Rough Set adalah salah satu metoda Data Mining yang akan digunakan untuk memecahkan masalah yang peneliti gunakan. Teori Rough Set yang pertama kali dipublikasikan tahun 1982 oleh Zdzislaw Pawlak, berada dalam keadaan konstan pembangunan. Kutipan dari sebuah jurnal proses reduksi parameter dalam teori rough set dapat memilih parameter mana yang dianggap penting sesuai dengan nilai quality of service sehingga dari sekian banyak parameter akan terpilih parameter yang akan dijadikan bobot dalam topologi, hal ini akan
ISSN : 2301-4474
mengurangi beban CO yang akan mengoptimalkan proses routing dalam jaringan (Saindra dan Pulungan, 2012). Kutipan dari sebuah jurnal internasional, mengatakan pendekatan teori rough set dapat digunakan untuk fundamental dalam kecerdasan dan kognitif ilmu buatan , terutama di daerah penelitian seperti pembelajaran mesin, sistem cerdas, penalaran induktif, pengenalan pola, mereologi, penemuan pengetahuan, keputusan, sistem analisis , dan ahli dan pendekatan konsep dalam lingkungan terdistribusi, teori fuzzy, teori bukti, metode penalaran Boolean, metode statistic (Andrzej Skowron, 2006). Dalam Rough Set kumpulan objek disebut sebagai information system (SI), dari SI tersebut objek-objekdiklasifikasikan ke dalam area-area tertentu yang disebut sebagai Lower approximation ,bouddary region, dan autslide region. Dari pegelompokkan area tersebut, dapat dilakukan dipendensi antar atribut, reduksi atribut, rule generation sehingga dapat diperoleh rule dari data set yang digunakan. Teknik Artificial Intelligent Rough Set merupakan suatu teknik yang cocok digunakan, dengan teknik Artificial Intelligent Rough Set ini akan ditemukan suatu Knowledge yang dapat digunakan dalam pengambilan suatu keputusan, dengan melakukan tahapan–tahapan KDD yang terdiri dari data selection, data cleaning, data transformation, data mining dan evaluation.
2.2.1 Langkah-langkah Teknik Rough Set Setelah data didapatkan langkahlangkah untuk menghasilkan knowledge dengan metode rough set dijelaskan pada sub bab berikut. 2.2.2.1 Information System Dalam rough set, sebuah set data direpresentasikan sebagai sebuah tabel, dimana baris dalam tabel merepresentasikan objek dan kolom-kolom merepresentasikan atribut dari objek-objek tersebut. Tabel tersebut disebut dengan information system yang dapat digambarkan sebagai berikut :
IS = {U,A} Di mana U adalah set terhingga yang tidak kosong dari objek yang disebut dengan universe dan A setter hingga tidak kosong dari atribut di mana:
Data Mining Rough Set Dalam Menentukan Pilihan Alat . . .
35
JURNAL TEKNOLOGI Fakultas Teknologi Industri, Volume 4, No. 2, Desember 2014
a: U
Va
untuk tiap 𝑎 ∈ 𝐴. Set 𝑉𝑎 disebut value set dari a. U={e1, e2,…, em} merupakan sekumpulan example dan A={a1, a2, …, an} yang merupakan attribute kondisi secara berurutan. Contoh Information Systems dapat 2.2.2.2 Decision System Dalam penggunaan information system, terdapat outcome dari klasifikasi yang telah diketahui yang disebut dengan atribut keputusan.Information system tersebut disebut dengan Decision system. Decision system dapat digambarkan sebagai:
IS=(U,{A,C})
Di mana : U = {x1, x2, . . . , xm} yang merupakan sekumpulan example. A ={a, a2, . . . , an} yang merupakan sekumpulan attribute kondisi secara berurutan atau attribute. C = Decision attributes (keputusan). 2.2.2.3 Equivalence Class Equivalence class adalah mengelompokan objek-objek yang sama untuk attribute A (U, A). kita dapat memperoleh equivalence class (EC1-EC5) . 2.2.2.4 Discernibility Matrix atau Discernibility Matrix Modulo D Definisi Discerniblity Matrix: Diberikan sebuah IS A=(U,A) and B A, discernibility matrix dari A adalah MB, dimana tiap-tiap entry MB(I,j) tediri dari sekumpulan attribute yang berbeda antara objek Xi dan Xj. Selain menerapkan discernibility matrix di atas juga dapat menggunakan Discernibility Matrix Modulo D. Didefinisikan seperti berikut dimana MB(I,j) adalah sekumpulan atribute yang berbeda antara objek Xi dan Xj dan juga berbeda attribute keputusan. Diberikan sebuah DS A=(U,A{d{) dan subset dari attribute B A, discernibility matrix modulo D dari A, MBd. 2.2.2.5 Reduct Calculation Reduct adalah penyeleksian atribut minimal (interesting attribute) dari sekumpulan attribut kondisi dengan menggunakan Prime Implicant fungsi Boolean. Kumpulan dari semua Prime Implicant mendeterminasikan sets of reduct.
ISSN : 2301-4474
2.2.2.6 Generating Rules Generating Rules adalah suatu metoda Rough Set untuk menghasilkan rules/knowledge berdasarkan equivalence class dan reduct. Generating rules dapat juga dikatakan sebagai suatu algoritma dari Data Mining, yang mana nantinya dari proses generating rules ini akan dihasilkan suatu rules / knowledge yang dapat digunakan dalam sebuah pengambilan keputusan. Generating rules yaitu metode rough set untuk menghasilkan rules/knowledge berdasarkan equivalence class dan reduct. 2.3.1 Kontrasepsi Kontrasepsi berasal dari kata kontra berarti mencegah atau melawan, sedangkan konsepsi adalah pertemuan antara sel telur (sel wanita) yang matang dan sel sperma (sel pria) yang mengakibatkan kehamilan. Maksud dari kontrasepsi adalah menghindar dan mencegah terjadinya kehamilan sebagai akibat pertemuan antara sel telur yang matang dengan sel sperma tersebut. Cara kerja kontrasepsi bermacam-macam tetapi pada umumnya mempunyai fungsi mengusahakan agar tidak terjadi ovulasi, melumpuhkan sperma, menghalangi pertemuan sel telur dengan sperma. Kontrasepsi yang ideal harus dapat bekerja dalam waktu yang tahan lama, mempunyai efektifitas yang tinggi, aman, mudah dalam menggunakan dan melepaskannya dan memiliki beberapa atau tidak sama sekali efek samping.
2.3.
Sekilas Tentang BKKBN BKKBN merupakan kepanjangan dari Badan Kependudukan dan Keluarga Berencana Nasional, dalam rangka peningkatan kualitas pelayanan, berbagai upaya telah dilakukan oleh BKKBN dalam meningkatkan pelayanan kontrasepsi, terutama sejak tahun 2001. Dalam ber – KB merupakan instrumen pokok kualitas pelayanan yang menjadi prioritas BKKBN. Paradigma baru program keluarga berencana nasional telah diubah visinya dari mewujudkan NKKBS menjadi visi mewujudkan “ Keluarga Berkualitas Tahun 2015 “. Keluarga yang berkualitas adalah keluarga yang sejahtera, sehat, maju, mandiri, memiliki jumlah anak yang ideal, berwawasan ke depan, bertanggung jawab, harmonis, dan bertaqwa kepada Tuhan Yang Maha Esa.
Data Mining Rough Set Dalam Menentukan Pilihan Alat . . .
36
JURNAL TEKNOLOGI Fakultas Teknologi Industri, Volume 4, No. 2, Desember 2014
3. HASIL DAN PEMBAHASAN Analisa Sistem Yang Sedang Berjalan Pada tahapan ini merupakan gambaran proses analisa suatu masalah dan gambaran dari penerapan metode untuk memecahkan masalah yang dihadapi. Untuk menunjang analisis data dalam pencarian knowledge, penulis mencoba untuk mentransformasi data manual yang terdapat pada BKKBN kota Padang tersebut ke dalam bentuk Microsoft Excel. Kemudian dalam melakukan uji analisis, sistem yang dipakai adalah Rosetta. Arsitektur Sistem Di dalam data mining terdapat beberapa teknik pengolahan data agar data yang diolah lebih bermanfaat atau mempunyai nilai pengetahuan, salah satunya adalah metoda Rough Set. teknik metode rough set terdapat beberapa langkah-langkah penyelesaian masalah sebagai berikut : 1. Decision System tersebut dilakukan teknik klasifikasi kreteria yang disebut “ Equivalence Class” 2. Kemudian dilakukan proses Discernibility Matrix atau Discernibility Matrix Modulo D 3. Proses “ Reduction “ 4. Untuk memperoleh hasil akhir dilakukan proses “General Rules”. Dengan ke empat teknik atau langkah-langkah di atas dapat diperoleh hasil analisa dari kemungkinan yang terjadi di setiap kriteria atau data mining. Pengumpulan Data Metode pengumpulan data dilakukan dengan cara melakukan pengamatan langsung ke BKKBN kota Padang. Selain pengamatan, juga dilakukan wawancara kepada pihakpihak yang terkait dengan penelitian ini. Juga melakukan pengambilan sampel database masyarakat untuk menunjang penelitian ini. Data Hasil Pelayanan KB
ISSN : 2301-4474
Pra – Proses Sebelum dilakukan pengolahan data berdasarkan variabel yang digunakan, data yang telah diperoleh harus dibuat dalam klasifikasi. Hal ini dilakukan karena seluruh data nilai yang akan digunakan dalam bentuk angka yang nilainya bervariasi antara satu dengan yang lain. Berikut adalah data nilai yang akan digunakan dalam proses pengolahan. Setelah data tersedia akan dilakukan pra-proses dengan mengklasifikasikan atribut umur dan jumlah anak ke dalam kelas-kelas. Pembagian atribut tersebut ke dalam kelas-kelas akan menggunakan Algoritma Maximal Dicernibility (MD) Heuristic dengan tahapan sebagai berikut: 1. Bentuk Set Of Cuts Terdapat 2 buah atribut data yang akan diolah yaitu proses umur (a(U)), proses jumlah anak (b(U)). a(U) = {20,25,26,27,28,30,32,36,37,40,41,42,44,46} b(U) = {1,2,3,4,5,9} VB(A) = {Pa1,Pa2,Pa3,Pa4,Pa5,Pa6, Pa7, Pa8, Pa9, Pa10,Pa11,Pa12,Pa13 Pb1, Pb2, Pb3,Pb4,Pb5} Dimana nilai variabel Set of Cuts tertera pada tabel
Variabel Set of Cuts 1.
Membentuk Discernibility Formula
Sebelum dilakukan proses Discernibility Formula, terlebih dahulu datatersebut harus dirubah menjadi suatu Decision System, di mana ditentukan terlebih dahulu atribut kondisi dan atribut keputusan, sebagaimana diperlihatkan pada tabel
Data Mining Rough Set Dalam Menentukan Pilihan Alat . . .
37
JURNAL TEKNOLOGI Fakultas Teknologi Industri, Volume 4, No. 2, Desember 2014
Sampel Decision System Dari Setiap Atribut
ISSN : 2301-4474
dengan memasukkan seluruh data yang mempunyai atribut hasil dengan nilai 1 dan sisanya merupakan data dengan atribut hasilnya adalah 0. 3. Membentuk Tabel Representasi dari Discernibility Formula. Dari hasil perhitungan Discernibility Formula pada tabel 4.5, selanjutnya membuat tabel representasi. Cara pembuatan tabel ini adalah dengan memberikan angka 1 pada variabel Set of Cut yang terbentuk pada setiap baris Discernibility Formula, sebagaimana yang akan ditunjukkan pada tabel 4.6.
Pada tabel 4.3, kolom a dan b adalah atribut kondisi, sedangkan kolom d adalah atribut keputusan. Atribut keputusan ini bernilai 1 dan 0, di mana acuan penilaian tersebut dari tabel 4.3 yaitu apabila hasil = Pil maka bernilai 1 sedangkan apabila hasil = suntik maka bernilai 0. Dalam proses pembentukan Discernibility Formula, akan diambil sampel data sesuai dengan data pada tabel 4.3. adapun data tersebut dapat dilihat pada tabel Sampel Decision System Untuk Discernibility Formula
Sampel Decision System Untuk Discernibility Formula (lanjutan)
4. Hapus Kolom Dengan Jumlah Angka 1 Paling Banyak Berdasarkan data pada tabel 4.6 jumlahkan nilai 1 pada setiap kolom lalu pilih kolom dengan jumlah nilai 1 yang paling banyak hapus kolom tersebut dan baris yang mempunyai nilai 1 pada kolom yang dihapus, ulangi proses hingga seluruh angka 1 pada tabel kosong. Selama proses penghapusan kolom, maka catat urutan penghapusan kolom tersebut. 5. Tulis Urutan Penghapusan Kolom Setelah proses pada tahapan 4 selesai dilakukan, maka diperoleh urutan penghapusan kolom variabel Set of Cuts. Adapun urutan penghapusan kolom yaitu : Pa12, Pb1, Pb2. Adapun nilai dari setiap variabel Set of Cuts tersebut adalah: Pa12 = (42 + 44) / 2 = 43 Pb1 = (1 + 2) / 2 = 1,5 dibulatkan menjadi 2 Pb2 = (2 + 3) / 2 = 2.5 dibulatkan menjadi 3 4.4.2 Klasifikasi Variabel Berdasarkan hasil perhitungan menggunakan algoritma MD Heuristic, maka diperoleh klasifikasi untuk masing-masing variabel. Adapun klasifikasi variabel adalah sebagai berikut
1.
Klasifikasi Umur
Hasil proses menggunakan algoritma MD Heuristic diperoleh bahwa klasifikasi variabel umur (a(U)) adalah Pa12 = 43,
Data tabel 4.4 menunjukkan sebagian data yang akan digunakan untuk proses pembentukan Discernibility Formula dimana
2. Klasifikasi Jumlah Anak Hasil proses menggunakan algoritma MD Heuristic diperoleh bahwa klasifikasi variabel Jumlah Umur (b(U)) adalah Pb1 = 2, Pb = 3,
Data Mining Rough Set Dalam Menentukan Pilihan Alat . . .
38
JURNAL TEKNOLOGI Fakultas Teknologi Industri, Volume 4, No. 2, Desember 2014
4.5
Penerapan Metode Rough Set Rough Set menawarkan dua bentuk presentasi data yaitu : Information System (IS) dan Decision System (DS). Decision System adalah sebuah pasangan Information System , di mana “U“ anggota bilangan “n” dan yang merupakan sekumpulan example dan atribute kondisi secara berurutan. Definisi di atas memperlihatkan bahwa sebuah Information System yang terdiri dari sekumpulan example, seperti { Anggota 01, Anggota 02, dan Anggota bilangan –m } dan atribut kondisi seperti kondisi awal. Berikut ini adalah contoh analisa penerapan metode Rough Set. Adapun studi kasus yang diangkat berdasarkan penelitian yaitu : “Data Mining Rough Set Dalam Menentukan Pilihan Alat Kontrasepsi Pada Wanita”. Algoritma penyelesaian masalah dari metode rough set yaitu sebagai berikut : 1. Informasi System merupakan data awal yang akan diproses yang akhirnya diperoleh sebuah engetahuan baru yang berasal dari proses reduction. 2. Decision System Decision System merupakan Information System yang telah memilki keputuasan atau hasil berdasarkan asumsi yang telah memenuhi syarat dan ketentuan berdasarkan atributnya. Berikut ini adalah tabel Decision System dari masyarakat pada data BKKBN kota Padang yang menjadi objek penelitian. 3. Equivalence Class Equivalence Class adalah mengelompokkan objek-objek yang yang memiliki atribute berbeda untuk setiap barisnya, sedangkan attribut yang memilik nilai yang sama untuk barisnya akan ditulis hanya sekali, adapun atribut yang dipilih adalah umur, jumlah anak dan status peserta. 4. Discernibility Matrix atau Discernibility Matrix Modulo D Setelah dilakukan pengelompokkan atau klasifikasi menggunakan Equivalance Class, langkah selanjutnya untuk menganalisa data tersebut adalah dengan salah satu proses antara Discernibility Matrix atau Discernibility Matrix Modulo D . 5. Reduction Untuk data yang jumlah variabel yang sangat besar sangat tidak mungkin mencari seluruh kombinasi variabel yang ada, karena jumlah Indiscernibility yang dicari = (2 n-1-1). Oleh karena itu dibuat satu teknik
ISSN : 2301-4474
pencarian kombinasi atribut yang dikenal dengan Quik reduction dengan cara: a. Nilai indiscernibility yang pertama dicari adalah Indiscernibility untuk kombinasi atribut yang terkecil yaitu 1 b. Kemudian lakukan proses pencarian dependency atributes. Jika nilai dependency atributes yang didapat = 1 maka indiscernibility untuk himpunan minimal variabel adalah variabel tertentu. c. Jika pada proses pencarian kombinasi atribut tidak ditemukan dependency atributes = 1, maka lakukan pencarian kombinasi yang lebih besar, dimana kombinasi variabel yang dicari adalah kombinasi dari variabel yang dicari adalah kombinasi dari variabel di tahap sebelumnya yang nilai dependency atributes paling besar, lakukan proses (3), sampai didapatkan nilai dependency atributes = 1 Berdasarkan hasil yang diperoleh dari proses Dicernibility Matrix berikut ini adalah proses Reduction-nya : EC1 = (BC) (B) (C) (AB) = BB + BC (C) (AB) = B (1+ C) AC + BC = B AC + BC ={B}, {A,C}, {B,C} EC2 = (BC) (C) (B) (AC) = BC + CC (B) (AC) = C (1+B) (B) (AC) = C AB + BC = {C}, {A,B}, {B,C} EC3 = (B) (C) (BC) (A) = (B) BC + CC (A) = (B) C (1+B) (A) = (B) C (A) = A, B, C = {A,B,C} EC4 = (C) (BC) (ABC) = BC + CC (ABC) = C (1+B) (ABC) = C (ABC) = AC + BC + CC = AC + C (1+B) = AC + C = C (1+A) =C EC5 = (C) (B) (BC) (ABC) = (C) BB + BC (ABC) = (C) B (1+C) (ABC) = C B (ABC) = C AB + BB + BC = C B (1+A) + BC = C B + BC
Data Mining Rough Set Dalam Menentukan Pilihan Alat . . .
39
JURNAL TEKNOLOGI Fakultas Teknologi Industri, Volume 4, No. 2, Desember 2014
EC6
EC7
= C B (1+C) =CB =BC = {B,C} = (AB) (AC) (A) (ABC) = (AB) AA + AC (ABC) = (AB) A (1+C) (ABC) = (AB) A (ABC) = AA + AB (ABC) = A (1+B) (ABC) = A (ABC) = AA + AB + AC = A (1+B) + AC = A + AC = A (1+C) =A = {A} = (BC) (B) (ABC) = BB + BC (ABC) = B (1+C) (ABC) = B (ABC) = AB + BB + BC = B (1+A) + BC = B + BC = B (1+C) =B
Teknik Pengujian Proses pengujian dilakukan untuk mendapatkan data mengenai pemilihan alat kontrasepsi yang tepat pada wanita yaitu “Suntik” atau “Pil” pada BKKBN kota Padang menggunakan alat bantu prangkat lunak Rosetta. Proses analisa terhadap wakil kepala sekolah yang diketegorikan “Suntik” atau “Pil” menggunakan metode Rough Set, dimana metode tersebut digunakan untuk menentukan pilihan terhadap alat kontrasepsi yang tepat yaitu suntik atau pil pada BKKBN kota Padang yang diambil sebagai sampel berdasarkan atribut dan karateristiknya. Knowledge Yang Dihasilkan Adapun knowledge atau pengetahuan yang baru di hasilkan dari penelitian ini yaitu sebagai berikut: If umur < 43 = 1 And jumlah anak 2 – 3 = 2 And status peserta = jamkesmas => hasil suntik or pil. If umur < 43 = 1 And jumlah anak > 3 = 3 And status peserta = jamkesmas => hasil suntik or pil. If umur < 43 = 1 And jumlah anak > 3 = 3 And status peserta = pribadi => hasil suntik or pil. If umur < 43 = 1 And jumlah anak 2 - 3 = 2 And status peserta = askes => hasil suntik.
ISSN : 2301-4474
If umur ≥ 43 = 2 And jumlah anak 2 - 3 = 2 And status peserta = jamkesmas => hasil suntik. If umur < 43 = 1 And jumlah anak 2 - 3 = 2 And status peserta = pribadi => hasil suntik or pil. If umur ≥ 43 = 2 And jumlah anak > 3 = 3 And status peserta = jamkesmas => hasil pil or suntik. If umur < 43 = 1 And jumlah anak > 2 = 1 And status peserta = pribadi => hasil pil or suntik. If umur < 43 = 1 And jumlah anak > 2 = 1 And status peserta = jamkesmas => suntik. If umur ≥ 43 = 2 And jumlah anak 2 - 3 = 2 And status peserta = pribadi => suntik. If umur < 43 = 1 And jumlah anak > 2 = 1 And status peserta = askes => pil. If jumlah anak 2 – 3 = 2 And status peserta = jamkesmas => suntik or pil. If jumlah anak > 3 = 3 And status peserta = jamkesmas => suntik or pil. If jumlah anak > 3 = 3 And status peserta = pribadi => suntik or pil. If jumlah anak 2 - 3 = 2 And status peserta = askes => suntik. If jumlah anak 2 - 3 = 2 And status peserta = pribadi => suntik or pil. If jumlah anak > 2 = 1 And status peserta = pribadi => pil or suntik. If jumlah anak > 2 = 1 And status peserta = jamkesmas => suntik. If jumlah anak > 2 = 1 And status peserta = askes => pil. Hasil Pengujian Knowledge di atas menunjukkan terdapat 19 (sembilan belas) rule atau pengetahuan baru yang dihasilkan. Berdasarkan analisa yang saya lakukan, ada 2(dua) atribut yang sangat menentukan pilihan alat kontrasepsi yang tepat yaitu umur dan jumlah anak. Umur sangat menentukan, karena apabila telah melewati komposisi yang telah di atur, maka peserta KB yang bersangkutan akan sulit menentukan alat kontrasepsi yang tepat. Evaluasi Sistem Pada awal penelitian ini, telah dijelaskan menjadi salah satu point penting yang menjadi permasalahan atau kendala yang timbul adalah menentukan pilihan terhadap alat kontrasepsi yang tepat. Sistem Yang Lama Di dalam sistem yang lama, pencarian informasi terhadap peserta KB yang suntik atau pil mengalami kesulitan. Terutama di dalam identifikasi awal pemilihan suntik dan
Data Mining Rough Set Dalam Menentukan Pilihan Alat . . .
40
JURNAL TEKNOLOGI Fakultas Teknologi Industri, Volume 4, No. 2, Desember 2014
pil, pihak BKKBN dengan memanfaatkan sistem belum menemukan formula atau komposisi yang tepat. Jadi berdasarkan permasalahan yang ada dan telah dijelaskan pada bab sebelumnya perlu adanya sebuah kajian dan solusi untuk memecahkan masalah tersebut di atas. Sistem Yang Baru Ada beberapa manfaat yang dirasakan sejak adanya sistem pengolahan data mining menggunakan Rough Set sebagai metode pemecahan masalah dan Rosetta sebagai software atau tools untuk menguji data dan menghasilkan parameter yang menentukan keputusan suntik atau pil serta knowledge baru yang dihasilkannya yaitu sebagai berikut: 1. Pencarian Informasi Pada sistem proses pencarian informasi menggunakan tools Rosetta lebih mudah karena kita di bantu pada proses klasifikasi data peserta KB sesuai dengan atribut yang dimiliki oleh setiap peserta KB. 2. Knowledge Yang Dihasilkan Dengan memanfaatkan tools Rosetta, knowledge yang di hasilkan dapat terlihat dengan jelas, baik parameter penentu yang disebut dengan Reduct dan juga kita dapat mengetahui General Rules-nya per objek penelitian lebih terperinci. 4.
KESIMPULAN Berdasarkan hasil penulisan dari bab-bab sebelumnya, maka dapat diambil kesimpulan yang nantinya berguna bagi para pembaca sehingga penulisan tesis ini dapat lebih bermanfaat. Adapun kesimpulan tersebut adalah sebagai berikut : 1. BKKBN kota Padang dapat terbantu dalam menganalisa peserta KB yang memilih suntik dan pil berdasarkan kriteria - kriteria yang ada. 2. BKKBN kota Padang dapat mengklasifikasikan peserta KB yang ada, serta membedakan antara peserta KB yang suntik dan peserta yang pil pada data yang ada. 3. Metode Rough Set ini dapat diimplementasikan ke dalam sistem untuk menentukan pilihan peserta KB yang suntik dan pil.
ISSN : 2301-4474
Herawati, Fajar Astuti. (2013). “Data Mining”. Yogyakarta. Andi. Kusrini dan Emha Taufiq Lutfi. (2009). “Algoritma Data Mining” Yogyakarta. Andi. Yiyu Yao and Yaohua Chen. (2006). “Rough Set Approximations in Formal Concept Analysis” Department of Computer Science, University of Regina Regina, Saskatchewan, Canada S4S 0A2 . Sarjon Defit. (2007). “Peranan Diskretisasi Data Dalam Menambang Rule Asosiasi Dari Databese” Prosiding Seminar Nasional Sistem & Teknologi Informasi (SNASTI). Susanto, Sani dan Dedy Suryadi. (2010). “Pengantar Data Mining: Menggali Pengetahuan Dari Bongkahan Data”. Yogyakarta. Andi. Zdzisław Pawlak, Andrzej Skowron (2007). “Rudiments of rough sets”. Institute of Mathematics, Warsaw University, Banacha 2, 02-097 Warsaw, Poland. Gede Saindra, Reza Pulungan (2012). “Reduksi Parameter Quality-Of-Service Menggunakan Rough-Set-Theory Dalam Simulasi Routing Algoritma Dijkstra. IJCCS, Vol.6, No.1, January 2012. Marıa S. Perez, Alberto S´anchez, Victor Robles, Pilar Herrero, Jose M. Pena (2008). “Design and implementation of a data mining grid-aware architecture”. Widodo, Prabowo Pudjo et.al. (2013). “Penerapan Data Mining Dengan Matlab”. Bandung. Rekayasa Sains. Sunjana. (2010). “APLIKASI MINING DATA MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE”. Seminar Nasional Aplikasi Teknologi Informasi 2010 (SNATI 2010).
DAFTAR REFERENSI Deshpande and Thakare. (2010). “Data Mining System And Applications: a review International Journal of Distributed and Parallel systems (IJDPS) Vol.1, No.1, September 2010. Data Mining Rough Set Dalam Menentukan Pilihan Alat . . .
41