DATA MINING NAIVE BAYES UNTUK ANALISIS PENGARUH EKONOMI TERHADAP KESEHATAN MATA Angga Prasetyo Program Studi Teknik Informatika Sekolah Tinggi Teknik Harapan Medan JL. HM.Jhoni.No.70 Medan, Indonesia
[email protected] Abstrak Di Indonesia orang dengan rabun jauh dan rabun dekat dari hari ke hari semakin banyak, hal ini karena pengaruh perkembangan teknologi yang saat ini semakin canggih dan pola hidup yang keliru. Gangguan mata rabun jauh dan rabun dekat dapat diderita oleh siapapun, orang kaya ataupun orang miskin memiliki peluang untuk menderita penyakit ini. Data Mining Naive Bayes memudahkan dalam pengklasifikasian data orang yang mengidap rabun jauh dan rabun dekat termasuk dalam golongan masyarakat dengan ekonomi menengah bawah atau menengah atas. Selanjutnya akan dilakukan perbandingan data untuk kemudian dapat diketahui perbandingan antara penyakit rabun jauh dan rabun dekat itu lebih banyak didap oleh masyarakat dengan ekonomi menengah bawah atau menengah atas. Hasil analisa ini bisa dimanfaatkan untuk menjadi sumber informasi baru bagi pihak-pihak yang bersangkutan. Kata Kunci : Data Mining, Naive Bayes, Klasifikasi Abstract In Indonesia people with myopia and presbyopia becomes so many, it is influenced by increasingly technology development and wrong lifestyle. Myopia and presbiopia could be suffered by anyone, both the rich and the poor. Data Mining with Naive Bayes algorithm to classify the data could help peoples with myopia and presbyopia to classified them belongs to the lower middle class or upper middle of the economic level. The datas can then be compared so that it can be seen that the ratio of the myopia and presbyopia was more suffered by people with lower middle economic level or upper middle. Results of this analysis can be used as a new sources of new information to the relevant parties. Keywords : Data Mining, Naive Bayes, Classification 1.
PENDAHULUAN Meskipun belum ada data statistik menunjukkan angka pengidap rabun jauh dan rabun dekat, bisa kita amati bahwa ternyata cukup banyak orang Indonesia yang mengalaminya. Ini dapat diketahui dari banyaknya masyarakat yang menggunakan alat bantu untuk melihat, misalnya seperti kacamata dan lensa kontak. Ini berarti cukup banyak masyarakat Indonesia yang kesehatan matanya terganggu. Di Indonesia cukup banyak pengidap myopia atau rabun jauh, hal ini disebabkan kebiasaan buruk yang seringkali dilakukan, namun ada pula karena faktor keturunan. Rabun jauh atau miopia adalah suatu kondisi yang mana sinar masuk ke mata tidak jatuh tepat di retina, tetapi jatuh di depan retina sehingga menyebabkan objek yang ditangkap mata menjadi kabur. Myopia sebenarnya baru dikenal pada abad ke 2, dimana terdiri dari dua kata, meyn yang artinya menutup, dan ops yang artinya mata. Ini menjelaskan salah satu ciri - ciri penderita miopia yang suka memicingkan matanya saat melihat obyek yang baginya nampak kurang jelas, karena dengan cara ini akan terbentuk debth of focus didalam bola mata membuat titik fokus yang sebelumnya terletak didepan retina, akan mengalami pergeseran ke belakang dan mendekati retina. Rabun dekat adalah gangguan mata yang membuat pengidapnya tidak mampu melihat obyek didekatnya secara jelas atau terlihat kabur,tetapi biasanya benda yang letaknya jauh malah terlihat terang. Rabun dekat atau lumrah disebut dengan hyperopia, sering dikaitkan dengan masalah pembiasan. Mata jadi lebih mudah merasa lelah jika mengalami rabun dekat [1]. Faktor-faktor tersebut diatas ialah faktor yang dilihat dari sudut pandang ilmu kedokteran maupun
kebiasaan sehari-hari. Tetapi mungkin tidak pernah terlintas dibenak kita, apakah faktor tersebut diatas ada atau tidak keterkaitannya dengan status ekonomi atau tingkat pendapatan seseorang. Sejatinya, tidak semua orang memiliki tingkat ekonomi yang setara. Ada yang tingkat pendapatannya rendah, menengah, dan tinggi. Tingkatan ekonomi tersebut sedikit banyak mempengaruhi kesejahteraan sebuah keluarga. Termasuk dalam hal menangani masalah kesehatan mata anggota keluarga. Baik itu dalam usaha pemenuhan kebutuhan gizi dan sebagainya. Untuk itu perlu dibuatkan sebuah analisa pengaruh tingkat ekonomi dengan gangguan kesehatan mata yang diderita seseorang. Diharapkan dengan adanya analisa ini, dapat membuka mata pemerintah supaya lebih gencar dalam menggalakkan program-program kerja yang dapat membantu masyarakat kurang mampu untuk mendapatkan penanganan atas gangguan kesehatan mata yang diderita oleh masyarakat secara gratis. Data mining adalah analisa otomatis pada data dalam jumlah besar dan kompleks bertujuan untuk menemukan pola atau kecenderungan penting yang biasanya tidak disadari keberadaannya. Naive Bayes adalah algoritma klasifikasi sederhana yang masing-masing atributnya berdiri sendiri dan memungkinkan berperan terhadap keputusan akhir. 2.
METODE PENELITIAN Pada tahap penelitian ini, yaitu Data Mining Naive Bayes Untuk Analisis Pengaruh Ekonomi Terhadap Kesehatan Mata, dilakukan hal-hal sebagai berikut : a.Metode Observasi Metode ini dilakukan dengan cara melakukan pengamatan terhadap obyek yang akan diteliti.
b. Studi Literatur Mempelajari buku referensi yang berkaitan dengan tema penelitian. c.Analisa dan Perancangan sistem Analisa data dengan menggunakan teknik data mining dan algoritma Naive Bayes. d. Menerapkan kedalam bentuk program komputer. Program yang akan dirancang menggunakan Visual Basic.Net.
perkiraan. Kemudian pada fase testing,model yang sudah terbentuk diuji dengan sebagian data [4]. 2.4
Perhitungan Data Mining Perhitungan data mining dilakukan secara manual menggunakan algoritma Naive Bayes dengan menggunakan dataset pasien yang ada ada tabel 1 jika data training dipilih secara acak : Tabel 1 Contoh data training Pasien
2.1
Data Mining Data mining adalah rangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini mungkin tersembunyi secara manual dari suatu basis data. Informasi yang dihasilkan didapat dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam basis data. Data mining terutama digunakan untuk mencari pengetahuan yang terdapat dalam basis data yang besar sehingga sering disebut Knowledge Discovery in Databases (KDD). Proses pencarian pengetahuan ini menggunakan berbagai teknik-teknik pembelajaran komputer (machinelearning) untuk menganalisis dan mengekstraksikannya. Proses pencarian bersifat iteratif dan interaktif untuk menemukan pola atau model yang sahih, baru, bermanfaat, dan dimengerti. Dalam penerapannya data mining memerlukan berbagai perangkat lunak analisis data untuk menemukan pola dan relasi data agar dapat digunakan untuk membuat prediksi dengan akurat [2]. Klasifikasi Klasifikasi merupakan suatu proses untuk menemukan model atau fungsi untuk menggambarkan class atau konsep dari suatu data. Proses yang digunakan untuk mendeskripsikan data yang penting serta dapat meramalkan kecenderungan data pada masa depan [3].
1. Menghitung jumlah kelas dari pendapatan berdasarkan klasifikasi yang terbentuk (prior probability) a. C1 (Class Pendapatan = “MENENGAH-BAWAH”) = jumlah “MENENGAH-BAWAH” pada kolom Pendapatan. = 0,6 b.
2.2
2.3
Naive Bayes Naive Bayes adalah pengklasifikasian statistik yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class. Naive Bayes didasarkan pada teorema Bayes yang memiliki kemampuan klasifikasi serupa dengan decision tree dan neural network. Naive Bayes terbukti memiliki akurasi dan kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar.Cara kerja dari metode Naïve Bayes menggunakan perhitungan probabilitas. Konsep dasar yang digunakan oleh Naïve bayes adalah Teorema Bayes, yaitu teorema yang digunakan dalam statistika untuk menghitung suatu peluang, Bayes Optimal Classifier menghitung peluang dari satu kelas dari masing-masing kelompok atribut yang ada, dan menentukan kelas mana yang paling optimal. Proses pengelompokan atau klasifikasi dibagi menjadi dua fase yaitu learning/training dan testing/classify. Pada fase learning, sebagian data yang telah diketahui kelas, datanya diumpankan untuk membentuk model
C2 (Class Pendapatan = “MENENGAH-ATAS”) = jumlah “MENENGAH-ATAS” pada kolom Pendapatan. = 0,4
2. Menghitung jumlah kasus yang sama pada setiap atribut dari kelas Pendapatan berdasarkan data testing. Mencari P (Jenis Kelamin | Class Pendapatan) a. P (Jenis Kelamin = “L” | Class Pendapatan = “MENENGAHBAWAH”) b.
P (Jenis Kelamin = “L” | Class Pendapatan” = “MENENGAH-ATAS”)
c.
P (Jenis Kelamin= “P” | Class Pendapatan = “MENENGAHBAWAH”)
d.
P (Jenis Kelamin = “P” | Class Pendapatan = “MENENGAH-ATAS”
Mencari P (Keluhan | Class Pendapatan)
a.
P (Keluhan= Pendapatan= BAWAH”)
“Rabun Jauh”|Class „MENENGAH-
b.
P (Keluhan = “Rabun Jauh” | Class Pendapatan = “MENENGAH-ATAS”)
c.
P (Keluhan = “Rabun Dekat” | Class Pendapatan = “MENENGAHBAWAH”)
d.
P (Keluhan = “Rabun Dekat” | Class Pendapatan = “MENENGAH-ATAS)
Mencari P (Status Pekerjaan | Class Pendapatan) a. P (Status Pekerjaan = “YA” | Class Pendapatan = “MENENGAHBAWAH‟) b.
P (Status Pekerjaan = “YA” | Class Pendapatan = “MENENGAH-ATAS”)
c.
P (Status Pekerjaan = “TIDAK” | Class Pendapatan = “MENENGAHBAWAH”)
d.
P (Status Pekerjaan = “TIDAK” | Class Pendapatan = “MENENGAH-ATAS”)
3. Kalikan semua hasil variabel a. Untuk semua atribut Class Pendapatan = “MENENGAH-BAWAH” P (X | Class Pendapatan = “MENENGAH-BAWAH”) = 0,4 X 0,2 X 0,4 X 0,2 X 0,4 X 0,2 = 0,00051 b. Untuk semua atribut Class Pendapatan = “MENENGAH-ATAS” P (X | Class Pendapatan = “MENENGAH-ATAS”) = 0,1 X 0,3 X 0,2 X 0,2 X 0,3 X 0,1 = 0,00004 c. Perkalian prior probability dengan semua atribut Class Pendapatan = “MENENGAH-BAWAH” P (Ci | Class Pendapatan = “MENENGAH-BAWAH”) * P (X | Class Pendapatan = “MENENGAHBAWAH”) = 0,6 * 0,00051 = 0,00031 d. Perkalian prior probability dengan semua atribut Class Pendapatan = “MENENGAH-ATAS”
P (Ci | Class Pendapatan = “MENENGAH-ATAS”) * P (X | Class Pendapatan = “MENENGAH-ATAS”) = 0,4 * 00004 = 0,00002 4. Bandingkan Hasil Kelas P (Ci | Class Pendapatan = “MENENGAH-BAWAH”) P (X | Class Pendapatan = “MENENGAH-BAWAH”) > P (Ci | Class Pendapatan = “MENENGAHATAS”) P (X | Class Pendapatan = “MENENGAH-ATAS”) 2.5
Microsoft Studio 2008 Microsoft Visual Studio. NET versi terbaru dengan. Net Framework 4.5 merupakan pengembangan kelanjutan dari Microsoft Visual Studio.Net Framework 4.0 sebelumnya, yaitu Visual Studio.Net 2010 yang diproduksi oleh Microsoft. Pada bulan Februari tahun 2002 Microsoft memproduksi teknologi.NET Framework versi 1.0, sehingga setiap produk baru yang terkait dengan teknologi .NET akan selalu berkembangan mengikuti perkembangan .NET Frameworknya dengan berbasis Graphical User Interface (GUI). Pada perkembangan nantinya, mungkin untuk membuat program dengan teknologi.NET, memungkinkan para pengembang perangkat akan dapat menggunakan lintas sistem operasi, yaitu dapat dikembangan di sistem operasi Windows juga dapat dijalankan pada sistem operasi lain, misalkan pada operasi Linux, seperti pada pemrograman Java. Dengan teknologi ADO.NET kelebihan-kelebihan yang ditawarkan, terutama memungkinkan pengembang perangkat lunak secara cepat mampu membuat program, serta berbasiskan integrasi ke Internet yang dikenal dengan XML Web Service [5]. 2.5
SQL PHPMyAdmin Phpmyadmin adalah perangkat lunak bebas yang ditulis dalam bahasa pemrograman php yang digunakan untuk menangani administrasi MYSQL melalui jejaringan jagat jembar ( World Wide Web). Phpmyadmin mendukung berbagai aplikasi mysql, diantaranya (mengelola basis data, table- table, bidang, relasi, indeks, pengguna, perizinan, dan lain-lain) [6].
3.
HASIL DAN PEMBAHASAN Hasil dan pembahasan merupakan tahap-tahap yang dilakukan untuk menjalankan sistem yang telah dibuat. Pada bab ini akan dipaparkan bagaimana menjalankan program tersebut. Perancangan perangkat lunak ini untuk membuat program aplikasi yang menggunakan Microsoft Visual Basic 2008. Dalam implementasi berikut akan ditampilkan hasil perancangan yang telah jadi. 3.1 Perangkat Keras yang dibutuhkan.
Perangkat keras yang dibutuhkan berdasarkan kebutuhan minimal yang harus dipenuhi adalah sebagai berikut : 1. Processor Pentium Core 2 Duo 2. Memory 1 GB 3. VGA 512 MB 4. Harddisk 250 GB 3.2
Perangkat Lunak yang digunakan Aplikasi pengolahaan data untuk membantu pasien dikembangkan dengan menggunakan perangkat lunak sebagai berikut : 1. Visual Basic.NET 2008, sebagai bahasa pemrograman untuk pengembangan aplikasi. 2. Microsoft Chart Control, sebagai media untuk mendesain grafik yang bisa terhubung ke Visual Basic.NET 2008. 3. SQL PhpMyAdmin sebagai apikasi untuk membuat database dan mengelolanya. 3.4
perlu dibuat form login untuk menghindari hal-hal yang tidak diinginkan. Pada halaman ini terdapat kolom username dan kolom password yang bisa diatur dan diubah sesuai keinginan penggguna. Selain itu terdapat juga button OK untuk masuk ke halaman berikutnya. Apabila username dan password yang dimasukkan salah, maka ada pesan peringatan dan tidak bisa masuk. Selain itu, ada juga button Hapus untuk membersihkan kolom dan kalau ingin kembali ke form halaman awal, tekan tombol Home. 3.6
Form Menu Utama
Tampilan Form Halaman Awal Gambar 3 Menu Utama
Gambar 1 Form Halaman Awal Form halaman awal adalah form yang mengawali aplikasi ini, ibarat buku form ini adalah covernya. Pada halaman awal ini terdapat tulisan Welcome yang artinya selamat datang bagi pengguna yang baru saja membuka aplikasi ini. Kemudian ada button Next untuk masuk ke halaman selanjutnya dan ada button Exit untuk keluar dari aplikasi. 3.5
Setelah login berhasil dilakukan, maka selanjutnya akan masuk ke halaman Menu Utama. Pada halaman Menu terdapat beberapa button pilihan yaitu : 1. Button Grafik , untuk melihat grafik hasil analisis data mining. 2. Button Aplikasi, untuk masuk ke aplikasi rekomendasi dokter. 3. Button Rekam Medis, untuk masuk ke aplikasi rekam medis. Jika ingin kembali ke form halaman utama, klik Home. 3.6 Form Tampilan Grafik
Tampilan Form Login
Gambar 2 Form Login Form login adalah halaman untuk masuk kedalam aplikasi. Karena aplikasi ini bersifat pribadi, hanya untuk digunakan oleh orang-orang tertentu saja, maka
Gambar 4 Tampilan Grafik Pada menu utama terdapat 3 pilihan aplikasi, salah satunya adalah menampilkan grafik. Grafik menampilkan hasil analisis data pasien Klinik Mata
Yose, Medan. Pada form Grafik terdapat 2 macam grafik, yaitu grafik data pasien, mencakup seluruh jumlah data riset pada masing-masing atribut, kemudian grafik yang lainnya menampilkan hasil analisis dari data yang sudah ada, sehingga diperoleh data baru yaitu perbandingan pasien dengan pendapatan menengah kebawah dan menengah keatas. Data tersebut dihitung berdasarkan teknik data mining dan algoritma Naive Bayes. Pada grafik data pasien terdapat 2 buah button yaitu Kembali dan Selanjutnya. Button Kembali digunakan untuk kembali ke form Menu Utama sedangkan button Selanjutnya untuk menampilkan grafik hasil analisis data mining. Jika ingin kembali ke halaman awal,klik tombol Home disebelah kanan atas. 3.7
Form Aplikasi Rekomendasi Dokter
Gambar 6 Aplikasi Rekam Medis
Gambar 5 Aplikasi Rekomendasi Dokter Aplikasi ini digunakan untuk membantu pasien mendapatkan solusi alternatif jika pasien tidak mampu membeli kacamata atau tidak mau ingin menggunakan kacamata. Cara penggunaan aplikassi ini adalah dengan meng-input-kan data pasien dengan mengisi kolom Nama, Jenis Kelamin, Usia, Status Pekerjaan, Keluhan dan Pendapatan. Setelah data diisi, maka langkah selanjutnya adalah tekan button Hasil. Maka hasil rekomendasi dokter akan tampil dikolom Hasil. Rekomendasi yang muncul dihubungkan kepada atribut Keluhan dan Pendapatan, jadi tidak semua pasien mendapatkan rekomendasi yang sama. Selain itu, aplikasi ini juga dapat digunakan untuk pasien yang menunggu dokter namun dokternya tak kunjung datang. Pegawai dapat mengambil alih tugas dokter dan memberikan rekomendasi untuk pasien. 3.8
Form Aplikasi Rekam Medis
Aplikasi rekam medis ini memudahkan pegawai klinik untuk mencatat data pasien yang datang ke klinik, dan data yang telah dicatat secara otomatis bisa ditambahkan kedalam database untuk keperluan klinik tersebut. Cara menggunakan aplikasi ini adalah dengan mengisi kolom data pasien, yaitu Nama, Jenis Kelamin, Usia, Status Pekerjaan, Keluhan, dan Pendapatan. Setelah data dimasukkan, klik tombol Input, maka secara otomatis data tersebut masuk kedalam database yang sudah disediakan. 4. 4.1
PENUTUP
Kesimpulan Berdasarkan hasil penelitian ini, dapat ditarik kesimpulan bahwa : 1. Gangguan mata rabun jauh dan rabun dekat lebih banyak diderita oleh masyarakat dengan tingkat ekonomi menengah kebawah. 2. Dengan menggunakan algoritma Naive Bayes dapat diketahui hasil perhitungan data pasien dengan cara mengklasifikasikan class pendapatan menjadi 2, yaitu MenengahBawah dan Menengah-Atas, kemudian dihitung peluang dan perkalian Prior Probabilty setiap atribut. Setelah semua variabel dikalikan dan dibandingkan, maka diperoleh kesimpulan bahwa jumlah data class Menengah-Bawah lebih besar dibandingkan class Menengah-Atas.
3. Telah dibangun sebuah grafik yang didesain menggunakan aplikasi Microsoft Chart Control dan Visual Basic.NET 2008. Kedua aplikasi ini mempunyai interface yang menarik dan tidak sulit untuk digunakan, sehingga orang awam pun tidak akan kesulitan untuk memahami sebuah grafik. 4. Telah dibangun sebuah aplikasi yang dirancang untuk memberikan solusi dari hasil analisis yang didapat. Ada 2 buah aplikasi yang dirancang, yaitu Aplikasi Rekomendasi Dokter yang dirancang menggunakan dan Visual Basic.NET 2008 dan Aplikasi Rekam Medis untuk menginput data pasien kedalam database yang dirancang menggunakan dan Visual Basic.NET 2008 dan SQL PHPMyAdmin sebagai database nya. 4.2
Saran Dari kesimpulan di atas, maka penulis memberikan saran-saran yang dianggap membantu dan berguna untuk kedepannya. Adapan saran-saran yang akan diusulkan sebagai berikut: 1. Pemerintah lebih menggencarkan program kerja untuk membantu masyarakat kurang mampu yang menderita gangguan mata rabun jauh dan rabun dekat, misalnya dengan program pemberian kacamata gratis atau program kacamata murah, sehingga semua orang di Indonesia bisa melihat dengan jelas dan bebas beraktivitas tanpa terganggu masalah penglihatan. 2. Bagi yang ingin melakukan penelitian serupa, cobalah untuk menggunakan teknik data mining dengan metode atau algoritma yang berbeda agar dapat dilihat perbandingannya 3. Rancangan grafik dan aplikasi untuk bisa didesain menggunakan bahasa pemrograman baru yang lebih update dan lebih canggih sehingga lebih menarik dan mudah digunakan. 5.
DAFTAR PUSTAKA
[1]
Rahmawati, Evelyn. 2014. Mengenal Penyakit Rabun Jauh dan Rabun Dekat, Jakarta, Penerbit : Peduli Mata
[2]
Latifah,Emi. 2013. Perancangan Dan Implementasi Sistem Klasifikasi Masa Studi Mahasiswa Menggunakan Data Mining Berbasis Algoritma ID3, Bandung : UNIKOM
[3]
Al-Qadri, Husni Said. 2013. Aplikasi Data Mining Dalam Menentukan Produk Terlaris Menggunakan Metode Apriori, Medan : Sekolah Tinggi Teknik Harapan
[4]
Nugroho, Yudha Septian. 2011. Data Mining Menggunakan Algoritma Naive Bayes Untuk
Klasifikasi Kelulusan Mahasiswa Universitas Dian Nuswantoro, Semarang : Universitas Dian Nuswantoro [5]
Sianipar, R.H. 2015. Kasus & Penyelesaian Visual Basic.NET, Bandung, Penerbit:Andi.
[6]
Sutarman, Yayan. 2013. Mengenal PHPMyAdmin, Bandung, Penerbit : Cakrawala