Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol. 2, No. 5, Mei 2018, hlm. 1912-1920
e-ISSN: 2548-964X http://j-ptiik.ub.ac.id
Klasifikasi Penyakit Kulit Pada Manusia Menggunakan Metode Binary Decision Tree Support Vector Machine (BDTSVM) (Studi Kasus: Puskesmas Dinoyo Kota Malang) Dyan Dyanmita Putri1, M.Tanzil Furqon2, Rizal Setya Perdana3 Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email:
[email protected],
[email protected],
[email protected] Abstrak Kulit merupakan organ tubuh pada manusia yang sangat penting karena terletak pada bagian luar tubuh yang berfungsi untuk menerima rangsangan seperti sentuhan, rasa sakit dan pengaruh lainnya dari luar. Penyakit kulit salah satu penyakit yang sering dijumpai pada negara beriklim tropis seperti Indonesia. Kurangnya pengetahuan tentang jenis penyakit kulit serta tidak mengetahui cara pencegahannya mengakibatkan sesorang dapat terkena penyakit kulit tingkat akut. Sehingga dengan adanya bantuan teknologi komputer diharapkan penyakit yang menyerang kulit tubuh manusia dapat diketahui secara dini dan hal tersebut dapat memperkecil terjadinya penyakit yang lebih berbahaya. Penelitian ini bertujuan untuk menentukan klasifikasi penyakit kulit pada manusia menggunakan metode Binary Decision Tree Support Vector Machine (BDTSVM). Berdasarkan hasil pengujian didapatkan nilai akurasi terbaik sebesar 97,14% dengan pengujian parameter SVM yaitu nilai Ξ» (lambda) = 0,5, C (complexity) = 1, konstanta πΎ (gamma) = 0,01, dan itermax = 10. Kata kunci: Penyakit Kulit, Klasifikasi, Binary Decision Tree, Support Vector Machine Abstract The skin is an organ in the human body is very important because it lies on the outside of the body that serves to receive stimuli such as touch, pain and other influences from the outside. Skin disease is one of the most common diseases in tropical countries such as Indonesia. The lack of knowledge about the type of skin disease and do not know how to prevent it cause a person can get acute skin disease. So with the help of computer technology is expected to attack the skin of the human body can be detected early and it can minimize the occurrence of more dangerous diseases. This research aims to determine the classification of skin diseases in humans using the method of Binary Decision Tree Support Vector Machine (BDTSVM) Based on the test results obtained the best accuracy of 97.14% with SVM parameter test that is the value of Ξ» (lambda) = 0,5, C (complexity) = 1, constant Ξ³ (gamma) = 0,01, and itermax = 10. Keywords: Skin Disease, Classification, Binary Decision Tree, Support Vector Machine sifatnya yang cenderung tidak berbahaya dan tidak menyebabkan kematian. Hal tersebut sangat salah karena jika penyakit kulit terus menerus dibiarkan dapat menyebabkan penyakit tersebut semakin menyebar dan sulit untuk mengobatinya.
1. PENDAHULUAN Kulit merupakan organ tubuh pada manusia yang sangat penting karena terletak pada bagian luar tubuh yang berfungsi untuk menerima rangsangan seperti sentuhan, rasa sakit dan pengaruh lainnya dari luar (Nuraeni, 2016). Kulit yang tidak terjaga kesehatannya dapat menimbulkan berbagai penyakit kulit sehingga perlu menjaga kesehatan kulit sejak dini agar terhindar dari penyakit. Kulit tubuh seseorang yang terkena penyakit sangat mengganggu penampilan dan aktifitas orang tersebut. Penyakit kulit sering dianggap remeh karena Fakultas Ilmu Komputer Universitas Brawijaya
Penyakit kulit dapat menyerang siapa saja dan dapat menyerang pada bagian tubuh mana pun. Penyakit kulit salah satu penyakit yang sering dijumpai pada negara beriklim tropis seperti Indonesia. Data Profil Kesehatan Indonesia 2010 menunjukkan bahwa penyakit kulit menjadi peringkat ketiga dari sepuluh penyakit terbanyak pada pasien rawat jalan
1912
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
dirumah sakit seIndonesia (Kemenkes, 2010). Kejadian penyakit kulit di Indonesia masih tergolong tinggi dan menjadi permasalahan yang cukup berarti. Hal tersebut karena kurangnya kesadaran dan ketidakpedulian masyarakat terhadap lingkungan sekitar yang menyebabkan penularan penyakit kulit sangat cepat. Berbagai penyakit kulit dapat disebabkan oleh beberapa faktor seperti lingkungan dan kebiasaan sehari-hari yang buruk, perubahan iklim, virus, bakteri, alergi, daya tahan tubuh dan lain-lain (Pardiansyah, 2015). Kurangnya pengetahuan tentang jenis penyakit kulit serta tidak mengetahui cara pencegahannya mengakibatkan sesorang dapat terkena penyakit kulit tingkat akut. Sehingga dengan adanya bantuan teknologi komputer diharapkan penyakit yang menyerang kulit tubuh manusia dapat diketahui secara dini dan hal tersebut dapat memperkecil terjadinya penyakit yang lebih berbahaya. Penggunaan teknologi komputer dapat membantu berbagai praktisi di segala bidang, karena dapat menyimpan data hingga mengolahnya menjadi suatu hasil yang diinginkan pembuatnya (Mahardika, 2013). Banyak manfaat yang didapat dengan adanya teknologi komputer dalam mendeteksi penyakit kulit diantaranya meningkatkan efisiensi pekerjaan, penghematan waktu dalam menyelesaikan masalah, serta pengetahuan pakar dapat didokumentasikan tanpa ada batas waktu. Metode SVM adalah salah satu metode klasifikasi yang prinsip nya mencari hyperplane pemisah antara kelas positif dan kelas negatif. Kelebihan dari SVM adalah mampu menangani masalah dengan input space yang berdimensi tinggi. SVM juga memiliki kelemahan yaitu masalah komputasi yang lama untuk proses klasifikasi. Kemudian muncul pengembangan dari metode SVM untuk masalah klasifikasi multi class yaitu One-Against-All (OAA), OneAgainst-One (OAO), dan Directed Acyclic Graph SVM (DAGSVM). Metode OAA memiliki kelemahan pada tahap pelatihan dan pengujian yang sangat lambat. Sedangkan OAO memiliki kelemahan pengujian yang lambat karena melakukan klasifikasi untuk setiap pasangan kelas harus satu per satu. Sehingga muncul metode DAGSVM yang dapat melakukan pengujian lebih cepat daripada OAO (Meshram et al., 2014). Namun pada tahun 2009 metode BDTSVM dikenalkan oleh Madzarov untuk dapat menyelesaikan masalah Fakultas Ilmu Komputer, Universitas Brawijaya
1913
klasifikasi multi class. Hasil yang diperoleh bahwa metode BDTSVM memiliki nilai error rate dan training time yang lebih baik dibandingkan DAGSVM. Kelebihan dari metode BDTSVM adalah mendapatkan penentuan kelas yang lebih dinamis dengan didasarkan pada jarak Euclidean dan dalam hal efektifitas komputasi serta tingkat akurasi yang tinggi. Berdasarkan permasalahan tersebut maka dirancang sebuah sistem untuk klasifikasi penyakit kulit pada manusia menggunakan metode Binary Decision Tree Support Vector Machine (BDTSVM). Sistem ini bekerja dengan cara menerima masukan gejala dari pengguna dan akan dilakukan proses perhitungan menggunakan algoritme Binary Decision Tree Support Vector Machine (BDTSVM). Hasil dari proses tersebut berupa klasifikasi penyakit kulit pada manusia dengan harapan dapat memberikan informasi kepada pengguna sehingga memperkecil terjadinya penyakit kulit yang lebih berbahaya. 2. DASAR TEORI 2.1. Penyakit Kulit Pada Manusia Penyakit kulit adalah kelainan kulit akibat adanya jamur, kuman, parasit, virus maupun infeksi yang dapat menyerang siapa saja dari segala umur. Penyakit kulit dapat menyerang seluruh maupun sebagian tubuh tertentu dan dapat memperburuk kondisi kesehatan penderita jika tidak ditangani secara serius. Gangguan pada kulit sering terjadi karena adanya faktor-faktor penyebabnya seperti iklim, lingkungan, tempat tinggal, kebiasaan hidap yang kurang sehat, alergi dan lain-lain. 2.1.1
Dermatitis
Dermatitis adalah peradangan kulit pada epidermis dan dermis yang disebabkan oleh faktor eksogen ataupun endogen dengan ditandai gejala obyektif lesi bersifat polimorf dan gejala subyektif gatal (Maryunani, 2010). Gejala utama yang dirasakan pada penderita penyakit dermatitis adalah gatal, alergi, kulit melepuh, kulit meradang, perih, keluar nanah, muncul kemerahan pada wajah, lutut, tangan dan kaki, tetapi tidak menutup kemungkinan kemerahan muncul di daerah lain, daerah yang terkena akan terasa sangat kering dan panas pada area tersebut.
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
2.1.2
Abses
Abses merupakan sebuah penimbunan nanah yang terakumulasi di sebuah kabitas jaringan karena akibat infeksi bakteri atau karena adanya benda asing seperti serpihan, luka peluru, atau jarum suntik. Gejala yang dirasakan biasanya gatal pada bagian kulit tertentu, timbul benjolan kecil dengan warna kemerahan, keluar nanah, nyeri tekan, nyeri kepala, kulit meradang, bengkak dan demam. Penyebab penyakit abses antara lain infeksi bakteri melalui cara bakteri masuk ke bawah kulit akibat luka yang berasal dari tusukan jarum yang tidak steril. 2.1.3
Scabies
Scabies merupakan penyakit infeksi kulit menular dengan adanya rasa gatal pada lesi ketika malah hari yang disebabkan oleh tungau sarcoptes scabiei var hominis (Prativi et al., 2013). Gejala yang sering dirasakan adalah gatal terutama malam hari, bentol/bintik merah seperti jerawat, kulit meradang, panas pada area tersebut, perih, dan keluar nanah. Faktor berkembangnya penyakit scabies antara lain penyakit tersebut banyak diderita oleh masyarakat dengan higiene buruk, sosial ekonomi yang rendah, hubungan seksual dengan bergonta-ganti pasangan, kesalahan dalam mendiagnosis dan perkembangan demografi serta ekologi. 2.1.4
Herpes
Herpes merupakan penyakit radang kulit yang disebabkan oleh virus dengan ditandai munculnya bintik yang berisi cairan pada bagian kulit tertentu. World Health Organization (WHO) melaporkan prevalensi herpes di Negara berkembang seperti Indonesia lebih tinggi dibandingan dengan di negara maju. Gejala yang dirasakan pada penderita herpes biasanya gatal, demam, nyeri kepala, nyeri tekan, kulit meradang, kulit melepuh, perih dan muncul gelembung air. 2.1.5
Urtikaria
Urtikaria merupakan penyakit yang ditandai dengan adanya edema kulit superfisial setempat dengan ukuran yang bervariasi dikelilingi oleh halo eritem disertai rasa gatal atau panas dan terkadang perut terasa mulas serta demam. Pada bagian tengah bintul tampak kepucatan yang biasanya kelainan ini bersifat sementara, gatal, dan dapat terjadi dimanapun di seluruh permukaan kulit. Ruam urtikaria Fakultas Ilmu Komputer, Universitas Brawijaya
1914
cepat timbul dan hilang perlahan-lahan sekitar dalam waktu 1-24 jam (Fitria, 2013). Gejala yang dirasakan pada penderita urtikaria biasanya gatal, demam, muncul ruam merah, alergi, bengkak, dan panas pada area tersebut. 2.1.6
Pioderma
Pioderma merupakan penyakit infeksi bakterial kulit. Penyebab utama pioderma adalah bakteri staphylococcus aureus maupun streptococcus sp. Pioderma merupakan infeksi bakteri pada kulit yang sering dijumpai. Penyakit ini dapat menyerang laki-laki maupun perempuan pada semua kalangan usia. Gejala pada penyakit pioderma biasanya gatal, terdapat benjolan merah pada kulit, membesar dan kemudian menjadi nanah, kulit meradang, serta demam. Terjadinya pioderma dipengaruhi oleh gizi, kondisi imunologis, integritas kuit, serta faktor lingkungan seperti panas, lembab, kurangnya sanitasi dan higieni. 2.2 Support Vector Machine Support Vector Machine (SVM) merupakan salah satu teknik baru yang memiliki performansi yang lebih baik di berbagai bidang aplikasi seperti pengenalan tulisan tangan, bioinformatika, klasifikasi teks, klasifikasi diagnosis penyakit dan sebagainya (Feng-Chia, 2009). Tujuan dari SVM yaitu menemukan fungsi pemisah (classifier hyperplane) terbaik untuk memisahkan dua buah kelas pada input space. Untuk dapat menemukan hyperplane terbaik antara dua kelas dengan mengukur margin hyperplane yang diperoleh dari mengukur margin yang maksimal antara ruang input non-linear dengan ruang ciri menggunakan kaidah kernel (Putri et al., 2015). Prinsip nya SVM bekerja secara linear, tetapi dapat berkerja juga pada masalah nonlinear dengan memasukkan metode kernel trick. Fungsi klasifikasi Support Vector Machine Linear digunakan untuk memisahkan data pelatihan terbagi menjadi dua kelas dengan memisahkan hyperplane. Misal diketahui π₯π = {π₯1 , β¦ , π₯π } adalah titik pada dataset, dan π¦π = π¦ π {+1, β1} adalah class pada data π₯π . Bidang pemisah terbaik yaitu yang dapat memisahkan semua data set sesuai dengan class dan memiliki margin paling besar. Alternatif bidang pemisah dapat dilihat pada Gambar 1.
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
1915
Variabel π adalah jumlah support vector atau suatu titik data yang memiliki πΌπ > 0, dan notasi π₯ adalah data yang akan diklasifikasikan.
Gambar 1. Alternatif bidang pemisah (kiri) dan bidang pemisah terbaik dengan margin (m) terbesar (kanan) Sumber: Sembiring (2007)
Data yang berada pada bidang pembatas disebut support vector. Pada Gambar 1, dua kelas dapat dipisahkan oleh sepasang bidang pembatas yang sejajar. Class pertama dibatasi bidang pemisah pertama sedangkan class kedua dibatasi bidang pemisah kedua. Bidang pemisah untuk setiap kelas ditunjukkan pada Persamaan 1 dan Persamaan 2. (π. π₯π + π) β₯ +1, (π. π₯π + π) β€ β1,
untuk π¦π = +1 untuk π¦π = -1
(1) (2)
Keterangan: π₯π = data ke-i π€ = bidang normal antara bidang pemisah terhadap pusat koordinat π = posisi bidang relatif terhadap pusat koordinat π¦π = kelas data ke-i SVM dapat digunakan untuk mengatasi masalah linear dan non-linear. Masalah linear dapat diatasi dengan cara mendapatkan hyperplane dengan fungsi sebagai berikut: π(π₯ ) = (π€. π₯ + π)
(3) (4)
π€ = βππ=1 πΌπ , π¦π , π₯π dan 1
+
β
π = β 2 (π€. π₯ + π€. π₯ )
Metode yang digunakan untuk mengklasifikasikan data yang tidak dapat diklasifikasikan secara linear adalah dengan mentransformasikan data ke dalam ruang fitur yang berdimensi tinggi sehingga dapat dipisah secara linear pada fitur space. Pada proses feature space biasanya memiliki dimensi yang lebih tinggi dari vektor input (input space) yang mengakibatkan komputasi pada feature space menjadi sangat besar, karena kemungkinan feature space memiliki jumlah feature yang tidak terhingga. Untuk mengetahui fungsi transformasi yang tepat sangat lah sulit. Sehingga pada SVM menggunakan kernel trick. Data yang tidak dapat dipisah secara linear ditunjukkan pada Gambar 2.
(5)
Nilai π₯ + adalah nilai dari salah satu support vector dari class positive dan π₯ β adalah nilai dari salah satu support vector dari class negative. Untuk mendapatkan klasifikasi yang optimal data testing π₯ digunakan Persamaan 6 dan untuk hasil klasifikasi dapat dilihat pada Persamaan 7. π(π₯ ) = βπ π=1 πΌπ π¦π πΎ(π₯π , π₯) + π
(6)
Fungsi klasifikasi = π πππ (π(π₯ ))
(7)
Fakultas Ilmu Komputer, Universitas Brawijaya
Gambar 2. Data non-linear Sumber: Muis (2015)
Metode kernel trick digunakan untuk mencari hyperplane dengan cara mentransformasi dataset ke ruang vektor yang berdimensi lebih tinggi (feature space), kemudian proses klasifikasi dilakukan pada feature space. Pada permasalahan ini menggunakan kernel Gaussian RBF yang didefiniskan dengan Persamaan 8. 2
K(π₯π , π₯π ) = exp (βπΎβπ₯π β π₯π β )
(8)
Penentuan fungsi kernel yang digunakan sangat berpengaruh terhadapa hasil prediksi (Muis, 2015). 2.3 Sequential Training SVM Metode sequential training SVM adalah metode alternatif sederhana untuk menemukan bidang hyperplane yang optimal. Metode ini lebih baik dibandingkan dengan metode Quadric Programming (QP) yang penyelesaiannya cukup kompleks, membuang-buang waktu serta rentan terhadap ketidakstabilan numerik. Berikut langkah-langkah algoritmenya (Cholissodin et al., 2014).
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
1. Inisialisasi nilai parameter, Ξ» = 2, πΎ (learning rate) = 5, πΆ = 1, Iterasi Max = 10, dan π = 0.0001. 2. Set nilai ππ = 0, kemudian menghitung matriks Hessian dengan menggunakan Persamaan 9. π·ππ = π¦π π¦π (πΎ(π₯π , π₯π ) + π2 ) untuk π, π = 1,.,N (9) Keterangan: π₯π = data ke-i π₯π = data ke-j π¦π = kelas data ke-i π¦π = kelas data ke-j N = jumlah data πΎ(π₯π , π₯π ) = fungsi kernel yang digunakan 3. Melakukan proses iterasi dari data ke-i sampai data ke-j dengan i=1 sampai N menggunakan Persamaan 10, 11 dan 12. πΈπ = βπ (10) π=1 πΌπ π·ππ [ ( ) ] πΏπΌπ = min{max πΎ 1 β πΈπ , βπΌπ , πΆ β πΌπ } (11) πΌπ = πΌπ + πΏπΌπ (12) Keterangan: πΎ = ππππππππ πππ‘π 4. Kembali pada langkah ke 3 hingga kondisi iterasi max telah tercapai atau max(|πΏπΌπ |) < π. 5. Kemudian didapatkan nilai Support Vector (SV) = πΌπ > π‘βπππ βπππ. Nilai thresholdSV ditentukan dari beberapa percobaan yang biasa digunakan π‘βπππ βπππ β₯ 0. 2.4 Binary Decision Tree Support Vector
Machine Metode Binary Decision Tree Support Vector Machine (BDTSVM) digunakan untuk memecahkan permasalahan klasifikasi multi kelas menggunakan pohon biner. Metode ini dapat diterapakan untuk menangani masalah komputasi yang lama untuk proses klasifikasi yang merupakan kelemahan dari SVM. Sehingga metode ini memiliki kelebihan dalam hal efektifitas komputasi dan nilai akurasi yang tinggi. Prinsip dari metode ini dengan membagi N kelas yang ada menjadi dua kelompok besar dan memisahkannya dengan menempatkan ke anak kanan dan anak kiri dari pohon biner. Pembagian kelas dalam metode ini dilakukan secara rekursif hingga didapatkan pada setiap node hanya terdapat satu kelas yang mempresentasikan kategori tersebut. Pada proses training SVM dilakukan untuk menentukan kemana data dikelompokkan menurut kelasnya. Dalam membagi N kelas ke dalam dua buah kelompok terdapat banyak cara. Pemilihan cara yang tepat dapat Fakultas Ilmu Komputer, Universitas Brawijaya
1916
mempengaruhi kualitas dari pohon biner. Berikut ini ilustrasi Binary Decision Tree Support Vector Machine (BDTSVM) dalam mengklasifikasikan N-kelas yang ditunjukkan pada Gambar 3. 1,2,3,4,5,6,7 SVM
1,5,6
2,3,4,7
SVM
SVM
2,3
4,7 SVM
2
1,5
SVM
3
4
SVM
7
1
6
5
Gambar 3. Ilustrasi BDTSVM Sumber: Sembiring (2007)
Berikut adalah langkah-langkah mendapatkan struktur dari tree:
untuk
1. Menghitung nilai gravity center dari setiap kelas. 2. Menghitung jarak Euclidean distance dari masing-masing kelas. 3. Mencari jarak terjauh dari matriks hasil perhitungan jarak Euclidean distance, kemudian memisahkan kedua kelas yang memiliki jarak terjauh masing-masing ke anak kanan dan anak kiri. 4. Kelas yang tersisa dicari jarak terdekatnya dengan kelas yang telah dipisahkan. Kelas dengan jarak terdekat terhadap kelas yang dipisahkan akan digabungkan dengan kelas tersebut. 5. Selanjutnya ulangi langkah 4 hingga seluruh kelas yang tersisa telah dikelompokkan. Pada langkah ini telah menyelesaikan struktur tree pada level 1. 6. Kemudian ulangi langkah 3 dan 4 hingga masing-masing node hanya terdiri dari 1 kelas. 2.4.1
Gravity Center
Gravity Center adalah titik pusat dari setiap kelas. Untuk mendapatkan titik pusat dari setiap kelas, dapat dihitung dengan mencari rata-rata setiap parameter dari masing-masing kelas.
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Nilai rata-rata dari masing-masing kelas dapat dilihat pada Persamaan 13. πΊπΆπΆπ πΉπ =
βπ π=1 π₯π π
(13)
Keterangan: πΊπΆπΆπ πΉπ = Gravity Center kelas ke-I parameter ke-j, dimana i=1,β¦,jumlah kelas π₯π
= Nilai data ke-m pada kelas ke-I parameter ke-j
π
= jumlah data pada setiap kelas
2.4.2
Euclidean Distance
ββππ=1(πππ β πππ )2
gejala-gejala pada penyakit kulit pada manusia beserta diagnosanya sebanyak 150 data. Data gejala yang digunakan ada 14 gejala dengan 6 jenis penyakit yang sering ditangani yaitu dermatitis, abses, scabies, herpes, urtikaria, serta pioderma. Studi Literatur
Analisa Kebutuhan Sistem
Pengumpulan Data
Euclidean Distance adalah nilai jarak yang memisahkan antara dua buah kelas. Ukuran jarak ini yang paling umum digunakan. Untuk menentukan nilai jarak dapat digunakan Persamaan 14. πππ =
1917
(14)
Perancangan Sistem
Implementasi Sistem
Keterangan: πππ
= Jarak antara kelas I dan kelas j
πππ
= Rata-rata fitur ke-m pada kelas ke-i, dimana i = 1,β¦,jumlah kelas
πππ
= Rata-rata fitur ke-m pada kelas ke-j, dimana j = 1,β¦,jumlah kelas
π
= Jumlah fitur
3. METODOLOGI PENELITIAN Metodologi penelitian untuk klasifikasi penyakit kulit pada manusia menggunakan metode Binary Decision Tree Support Vector Machine (BDTSVM) ditunjukkan pada Gambar 4. Studi literatur difokuskan pada pencarian referensi relevan yang berkaitan dengan permasalahan yang sedang di teliti oleh penulis. Hal ini dilakukan agar peneliti mampu meningkatkan pemahaman dan pengetahuan teori tentang permasalahan yang sedang diteliti. Referensi berupa teori yang didapatkan berkaitan dengan Klasifikasi Penyakit Kulit Pada Manusia Menggunakan Metode Binary Decision Tree Support Vector Machine (BDTSVM). Lokasi penelitian di Puskesmas Dinoyo Kota Malang. Analisis kasus dilakukan dengan cara mengumpulkan data melalui observasi dan wawancara secara langsung dengan tujuan mendapatkan informasi lebih dari pihak yang bersangkutan. Data yang diperoleh berupa data Fakultas Ilmu Komputer, Universitas Brawijaya
Pengujian Sistem
Penarikan Kesimpulan Gambar 4. Diagram Alir Metodologi Penelitian
4. PERANCANGAN SISTEM Pada bagian perancangan menjelaskan mengenai langkah penyelesaian masalah klasifikasi penyakit kulit pada manusia menggunakan metode Binary Decision Tree Support Vector Machine (BDTSVM). Gambar 5 merupakan diagram alir proses klasifikasi menggunakan metode Binary Decision Tree Support Vector Machine. Proses klasifikasi penyakit kulit diawali dengan memberikan masukan berupa data gejala penyakit kulit pada manusia yang diperoleh dari Puskesmas Dinoyo Kota Malang. Proses pembentukan kelas positif dan negatif menggunakan metode Binary Decision Tree yang diawali dengan menghitung gravity center kemudian menghitung jarak Euclidean distance setelah terbentuk matriks Euclidean Distance selanjutnya membuat pohon biner yaitu dengan mencari jarak terjauh dari hasil matriks Euclidean. Kemudian memisahkan kedua kelas yang memiliki jarak terjauh dimana kelas yang kecil akan mengarah ke kiri yang bernilai
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
pada nilai iterasi maksimal digunakan beberapa nilai yaitu 2, 10, 50, 100 dan 150. Pada pengujian nilai parameter sequential training SVM yang digunakan adalah Ξ» (lambda) = 0,5, C (complexity) = 1, konstanta πΎ (gamma) = 0,01, dan itermax = 10. Pengujian Akurasi Iterasi Maksimal Akurasi (%)
positif dan kelas yang lebih besar mengarah ke kanan yang bernilai negatif. Kemudian kelas yang tersisa akan dicari jarak terdekatnya antara kedua kelas yang memiliki jarak terjauh. Proses tersebut akan terus diulang sampai level terakhir dan masing-masing node hanya terdiri dari 1 kelas. Kemudian untuk proses klasifikasi menggunakan metode Support Vector Machine dari proses training hingga testing dengan menggunakan metode sequential training SVM. Keluaran yang dihasilkan berupa klasifikasi penyakit kulit pada manusia terdiri dari 6 jenis yaitu dermatitis, abses, scabies, herpes, urtikaria dan pioderma.
1918
100 95 90 85
97,14 97,14 97,14 97,14 91,43
2
10
50
100
150
Nilai Iterasi Maksimal Mulai Gambar 6. Grafik Tingkat Akurasi Hasil Pengujian Iterasi Maksimal Data Penyakit Kulit
Binary Decision Tree
Support Vector Machine
Hasil Klasifikasi
Selesai Gambar 5. Diagram Alir Proses Klasifikasi Menggunakan Metode BDTSVM
5. PENGUJIAN DAN ANALISIS Pengujian yang dilakukan pada sistem klasifikasi penyakit kulit pada manusia menggunakan metode Binary Decision Tree Support Vector Machine (BDTSVM) menggunakan data training. Pengujian yang dilakukan terdiri dari pengujian terhadap jumlah iterasi, pengujian parameter Ξ» (lambda), pengujian parameter πΆ (Complexity), dan pengujian parameter πΎ (gamma). 5.1 Hasil dan Analisis Pengujian Nilai Iterasi Maksimal Pengujian nilai iterasi maksimal untuk mengetahui pengaruh tingkat akurasi pada sequential training SVM. Untuk pengujian Fakultas Ilmu Komputer, Universitas Brawijaya
Berdasarkan hasil grafik pada Gambar 6 bahwa rerata dengan akurasi tertinggi sebesar 97,14% pada nilai iterasi maksimal yaitu 10. Sehingga untuk pengujian selanjutnya digunakan nilai iterasi maksimal yaitu 10. Hasil pengujian nilai iterasi maksimal dengan rerata akurasi tertinggi sebesar 97,14% menunjukkan bahwa nilai iterasi maksimal yang semakin besar maka akurasi semakin baik. Pengujian iterasi maksimal berpengaruh pada perubahan nilai alpha dan bias. Pada hasil pengujian untuk jumlah iterasi maksimal 10, 50, 100 dan 150 akurasi cenderung stabil. Namun pada iterasi 4 akurasi sudah tinggi sehingga tidak membutuhkan waktu yang lama untuk mencapai akurasi yang tinggi. 5.2 Hasil dan Analisis Pengujian Parameter Ξ» (Lambda) Pengujian nilai parameter Ξ» (lambda) untuk mengetahui pengaruh tingkat akurasi pada sequential training SVM. Untuk pengujian pada nilai parameter lambda digunakan beberapa nilai yaitu 0,5, 100, 1000, 10000, dan 100000. Pada pengujian nilai parameter sequential training SVM yang digunakan adalah Ξ» (lambda) = 0,5, C (complexity) = 1, konstanta πΎ (gamma) = 0,01, dan itermax = 10.
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
100 90 80 70
97,14
90
81,44
88,58 85,72
Nilai Ξ» Gambar 7. Grafik Tingkat Akurasi Hasil Pengujian Nilai Ξ» (lambda)
Berdasarkan hasil grafik pada Gambar 7 bahwa rerata dengan akurasi tertinggi sebesar 97,14% pada nilai Ξ» (lambda) yaitu 0,5. Sehingga untuk pengujian selanjutnya digunakan nilai Ξ» (lambda) yaitu 0,5. Hasil pengujian parameter Ξ» (lambda) dengan rerata akurasi tertinggi sebesar 97,14% menunjukkan bahwa semakin besar nilai Ξ» (lambda) maka akurasi cenderung menurun. Sebaliknya semakin kecil nilai Ξ» (lambda) maka akurasi semakin besar, hal tersebut dikarenakan saat nilai Ξ» (lambda) kecil maka membuat lebar margin mengecil dan titik bergerak dari dalam margin menuju luar margin dan akan mendapatkan hyperplane yang baik. 5.3 Hasil dan Analisis Pengujian Parameter πͺ (Complexity) Pengujian nilai parameter C (Complexity) untuk mengetahui pengaruh tingkat akurasi pada sequential training SVM. Untuk pengujian pada nilai parameter C (Complexity) digunakan beberapa nilai yaitu 0,0001, 0,001, 0,01, 0,1 dan 1. Pada pengujian nilai parameter sequential training SVM yang digunakan adalah Ξ» (lambda) = 0,5, C (complexity) = 1, konstanta πΎ (gamma) = 0,01, dan itermax = 10.
Akurasi (%)
Pengujian Akurasi Nilai πͺ (Complexity) 100
90
90
90
90
97,14
85,72
80 0,0001 0,001 0,01
0,1
1
Nilai C Gambar 8. Grafik Tingkat Akurasi Hasil Pengujian Nilai C (Complexity)
Berdasarkan hasil grafik pada Gambar 8 bahwa rerata dengan akurasi tertinggi sebesar Fakultas Ilmu Komputer, Universitas Brawijaya
97,14% pada nilai C (Complexity) yaitu 1. Sehingga untuk pengujian selanjutnya digunakan nilai C (Complexity) yaitu 1. Hasil pengujian parameter C (Complexity) dengan rerata akurasi tertinggi sebesar 97,14% menunjukkan bahwa nilai parameter C (Complexity) yang mendekati nilai 0 maka akurasi cenderung menurun. Nilai parameter C semakin besar membuat waktu komputasi semakin lama untuk proses training data tetapi nilai akurasi semakin baik. Nilai parameter C memberikan penalti yang besar pada titik data yang melewati bidang pemisah, sehingga dapat menghindari kesalahan klasifikasi. 5.4 Hasil dan Analisis Pengujian Parameter πΈ (Gamma) Pengujian nilai parameter πΎ (Gamma) untuk mengetahui pengaruh tingkat akurasi pada sequential training SVM. Untuk pengujian pada nilai parameter πΎ (Gamma) digunakan beberapa nilai yaitu 0,001, 0,01, 0,1, 1 dan 10. Pada pengujian nilai parameter sequential training SVM yang digunakan adalah Ξ» (lambda) = 0,5, C (complexity) = 1, konstanta πΎ (gamma) = 0,01, dan itermax = 10. Pengujian Akurasi Nilai πΈ (Gamma) Akurasi (%)
Akurasi (%)
Pengujian Akurasi Nilai Ξ» (lambda)
1919
150 100 50 0
92,86 97,14 80,01
0,001
0,01
0,1
60
54,29
1
10
Nilai πΈ Gambar 9. Grafik Tingkat Akurasi Hasil Pengujian Nilai πΈ (Gamma)
Berdasarkan hasil grafik pada Gambar 9 bahwa rerata dengan akurasi tertinggi sebesar 97,14% pada nilai πΎ (Gamma) yaitu 0,01. Sehingga untuk pengujian selanjutnya digunakan nilai πΎ (Gamma) yaitu 0,01. Hasil pengujian parameter πΎ (Gamma) dengan rerata akurasi tertinggi sebesar 97,14% menunjukkan bahwa nilai konstanta πΎ (Gamma) yang semakin besar maka nilai learning rate semakin besar dimana learning rate merupakan laju pembelajaran sehingga jika proses pembelajaran semakin cepat maka ketelitian sistem semakin berkurang dan akurasi cenderung menurun. Sebaliknya jika nilai learning rate semakin kecil maka ketelitian sistem semakin besar dan akurasi semakin baik.
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
6. KESIMPULAN Berdasarkan pada hasil perancangan, implementasi, pengujian dan analisis yang telah dilakukan pada sistem Klasifikasi Penyakit Kulit Pada Manusia Menggunakan Metode Binary Decision Tree Support Vector Machine (BDTSVM). Sehingga dapat disimpulkan sebagai berikut ini: 1. Metode Binary Decision Tree Support Vector Machine dapat diimplementasikan dengan baik untuk menyelesaikan masalah klasifikasi penyakit kulit pada manusia. Banyaknya jumlah data dapat mempengaruhi hasil akurasi pada proses klasifikasi. 2. Pada permasalahan klasifikasi penyakit kulit pada manusia menggunakan metode BDTSVM digunakan data sebanyak 150 data. Perubahan nilai πΌπ , nilai bias dan akurasi dipengaruhi pada pemilihan parameter Ξ» (lambda), C (complexity), konstanta πΎ (gamma), π (epsilon) pada metode sequential training SVM. Berdasarkan hasil pengujian didapatkan nilai akurasi terbaik sebesar 97,14% dengan pengujian parameter SVM yaitu nilai Ξ» (lambda) = 0,5, C (complexity) = 1, konstanta πΎ (gamma) = 0,01, dan itermax = 10. 7. DAFTAR PUSTAKA Cholissodin, I., Maya Kurniawati., Indriati., dan Issa Arwani., 2014. Classification of campus e-complaint documents using Directed Acyclic Graph Multi-class SVM based on analytic hierarchy process. Universitas Brawijaya, Malang. Feng-Chia, L., 2009. Comparison Of The Primitive Classifiers Without Features Selection in Credit Scoring. Management and Service Science. Fitria., 2013. Aspek Etiologi dan Klinis Pada Urtikaria dan Angioedema. Fakultas Kedokteran Universitas Syiah Kuala. Kementerian Kesehatan Indonesia, 2010. Profil Kesehatan Indonesia Tahun 2009. Jakarta: Kementerian Kesehatan RI. Mahardika, A.P., 2013. Sistem Pakar Mendeteksi Penyakit Dalam Dengan Metode Backward Chaining Fakultas Ilmu Komputer, Universitas Brawijaya
1920 Menggunakan Visual Basic 2010. Teknik Informatika Universitas Semarang.
Maryunani, A., 2010. Kamus Perawat: Definisi Istilah dan Singkatan Kata-Kata dalam Keperawatan. Jakarta: CV.Trans Info Media. Meshram, A., Roopam, G dan Sanjeev, S., 2014. Advance Probabilistic Binary Decision Tree using SVM. School of Information Technology UTD, RGPV, Bhopal, M.P., India. Muis, I.A., 2015. Penerapan Metode Support Vector Machine (SVM) Menggunakan Kernel Radial Basis Function (RBF) Pada Klasifikasi Tweet. Jurusan teknik Informatika, Fakultas Sains dan Teknologi, UIN Sultan Syarif Kasim Riau. Nuraeni, F., 2016. Aplikasi Pakar Untuk Diagnosa Penyakit Kulit Menggunakan Metode Forward Chaining Di Al Arif Skin Care Kabupaten Ciamis. Teknik Informatika STMIK Tasikmalaya. Pardiansyah, R., 2015. Association Between Personal Protective Equipment With the Irritant Contact Dermatitis in Scavengers. Faculty of Medicine, Lampung University. Prativi, G.S., M. Yunita, I dan Linda, S.B., 2013. Hubungan Pengetahuan Dengan Sikap Keluarga Dalam Mencegah Kejadian Skabies Di Desa Laksana Mekar. Putri, E., Diyah, P dan Andre, M., 2015. Identifikasi Tanda Tangan Dengan Pendekatan Support Vector Machine. Program Studi Teknik Informatika, Fakultas Teknik, Universitas Bengkulu. Sembiring, K., 2007. Penerapan Teknik Support Vector Machine Untuk Pendeteksian Intrusi Pada Jaringan. S1 Teknik Informatika, Sekolah Teknik Elektro dan Informatika, ITB.