Presentasi TA DETEKSI PENYAKIT PARU-PARU OBSTRUKTIF KRONIS MENGGUNAKAN METODE FUZZY : STUDI KASUS DI RUMAH SAKIT XYZ
Muhammad Reza Budiman 5209100075 Jurusan Sistem Informasi Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember
Latar Belakang
Jumlah perokok di Indonesia dari tahun ke tahun selalu meningkat data terbaru menurut Organisasi Kesehatan Dunia (World Health Organization/WHO) menyebutkan bahwa jumlah perokok Indonesia terbanyak ketiga di seluruh dunia (AntaraNews, 2012). Fakta tersebut membuat meningkatnya tingkat risiko seseorang terjangkit penyakit yang diakibatkan rokok, yaitu penyakit paru kronis
Latar Belakang ( cont’d )
penyakit paru kronis ini adalah masalah kesehatan utama yang menjadi penyebab kematian nomor empat di Indonesia pada tahun 2010 menurut WHO
Perumusan Masalah Bagaimana membangun aturan-aturan untuk mengklasifikasi jenis deteksi tingkat risiko ( rendah, sedang, tinggi ) berdasarkan dokter
Bagaimana merumuskan fungsi keanggotaan metode fuzzy yang akan digunakan untuk mendeteksi tingkat risiko terjangkit penyakit paru-paru obstruktif kronis sehingga dapat diperoleh hasil yang baik?
Batasan Tugas Akhir
a b
• Data yang digunakan untuk evaluasi adalah data dari gejala atau variable yang dapat melihat tingkat risiko seseorang terjangkit penyakit paru-paru kronis pada Rumah Sakit XYZ.
• Tingkat risiko yang akan dipakai berupa tingkat rendah, sedang, dan tinggi
Tujuan dan Manfaat Tugas Akhir
Tujuan membantu pihak Rumah Sakit XYZ dengan memberikan informasi awal dengan pembuatan sistem yang memungkinkan dalam skala lab sehingga dapat dilakukan tindakan pencegahan dari penyakit paru-paru obstruktif kronis
Manfaat pemahaman tentang penggunaan atau pengimplementasian metode fuzzy dalam kasus diagnosis awal suatu penyakit membantu pihak rumah sakit XYZ membentuk suatu aplikasi untuk pendeteksian dini berbagai penyakit terutama paruparu obstruktif kronis
Paru-Paru Kronis penyakit paru kronik ditandai dengan hambatan aliran udara di saluran napas yang tidak sepenuhnya reversibel Penderita PPOK biasanya adalah perokok atau memiliki riwayat perokok berat
Paru- Paru Kronis
Untuk mendeteksi tingkat risiko seseorang terjangkit penyakit ini, ada beberapa variabel faktor risiko yang digunakan antara lain : genetik, jenis kelamin, usia, status sosioekonomik, status rokok, paparan okupasional, dan penyakit paru penyerta lainnya
Tabel Variabel dan Tingkat Risiko Variabel Faktor Risiko
Keterangan
Genetik
Jenis Kelamin
Ada riwayat PPOK Tidak ada riwayat PPOK a.
Laki-laki
a.
Perempuan
Status Rokok
Paparan Okupasional
Penyakit paru penyerta lain
Risiko tinggi Risiko rendah a. b.
<40 tahun 40-60 Tahun >60 tahun
Usia Status Sosioekonomik
Tingkat Risiko
Risiko sedang atau tinggi Risiko rendah atau sedang
Risiko rendah Risiko sedang Risiko tinggi
a. b.
Rendah Baik
a. b.
Risiko tinggi Risiko rendah
a. b. c.
0-200 IB 200-600 IB >600 IB
a. b. c.
Risiko Rendah Risiko sedang Risiko tinggi
a. b. c.
Tidak Pernah Terpapar Terpapar jarang (<4 jam perhari) Terpapar sering (>4 jam perhari)
a. b.
Risiko rendah Risiko sedang
a.
Risiko tinggi
a.
Ada
a.
Tidak ada
a. b.
Risiko sedang atau tinggi Risiko rendah atau tinggi
Metode Fuzzy Sistem Fuzzy merupakan soft computing sistem fuzzy sangat cocok untuk penalaran pendekatan terutama untuk sistem yang menangani masalah-masalah yang sulit didefinisikan dengan menggunakan model matematis
Metode Fuzzy ( Cont’d )
Hal yang perlu diketahui pada sistem fuzzy
- Variabel fuzzy - Himpunan Fuzzy - Semesta Pembicaraan - Domain
Metode Fuzzy
Variabel fuzzy merupakan variabel yang hendak dibahas dalam suatu sistem fuzzy. Contoh variable yang dibahas dalam sistem fuzzy yaitu umur, temperatur, permintaan Himpunan fuzzy merupakan suatu grup yang mewakili suatu kondisi atau keadaan tertentu dalam suatu variabel fuzzy. Contoh : yaitu variable temperatur terbagi menjadi lima himpunan fuzzy antara lain “dingin”, “sejuk”, “normal”, “hangat”, dan “panas”
Metode Fuzzy
Gambaran Himpunan Fuzzy
Metode Fuzzy
Semesta pembicaraan adalah keseluruhan nilai yang diperbolehkan untuk dioperasikan dalam suatu variabel fuzzy. Contoh : Semesta pembicaraan untuk variabel umur yaitu [0 +∞] Domain himpunan fuzzy keseluruhan nilai yang diijinkan dalam semesta pembicaraan dan boleh dioperasikan dalam suatu himpunan fuzzy. Misal kita contohkan bahwa seseorang dikatakan “muda” apabila berada diantara umur 0 tahun hingga 45 tahun. Maka domain himpunan “muda” itu adalah “muda” = [0..45]
Logika Fuzzy
Konsep ini diperkenalkan dan dipublikasikan pertama kali oleh Lotfi A. Zadeh, seorang profesor dari University of California di Berkeley pada tahun 1965 Logika fuzzy menggunakan ungkapan bahasa untuk menggambarkan nilai variabel Logika fuzzy bekerja dengan menggunakan derajat keanggotaan dari sebuah nilai yang kemudian digunakan untuk menentukan hasil yang ingin dihasilkan berdasarkan atas spesifikasi yang telah ditentukan Dengan Logika Fuzzy dapat dibangun dan diaplikasikan pengalaman pakar secara langsung tanpa proses pelatihan
Himpunan Fuzzy
Gambar Himpunan Tegas ( crisp )
Pada gambar di atas, dapat dilihat bahwa apabila seseorang berusia 34 tahun, maka ia dikatakan “muda”
Apabila seseorang berusia 35 tahun, maka ia dikatakan tidak “muda”
Apabila seseorang berusia 35 tahun, maka ia dikatakan “parobaya”
Apabila seseorang berusia 35 tahun kurang satu hari, maka ia dikatakan tidak “parobaya”
Himpunan Fuzzy
Gambar Himpunan Fuzzy
Pada gambar di atas dapat dilihat bahwa seseorang yang berumur 40 tahun, termasuk dalam himpunan “muda” dengan µ”muda”[40]=0,25
Namun, seseorang tadi juga termasuk dalam himpunan “parobaya” dengan µ”parobaya”[40]=0,5
seseorang yang berumur 50 tahun, selain dapat dimasukkan dalam himpunan “muda” dengan µ”tua”[50]=0,25, juga dapat dimasukkan dalam himpunan “parobaya” dengan µ”parobaya” [50]=0,5.
Himpunan Fuzzy
Dari gambar sebelumnya bisa dikatakan bahwa pemakaian himpunan crisp ( tegas ) untuk menyatakan umur sangat tidak adil. Adanya perubahan kecil saja pada suatu nilai mengakibatkan perbedaan kategori yang cukup signifikan Himpunan fuzzy digunakan untuk mengantisipasi perbedaan kategori yang signifikan
Sistem Inferensi Fuzzy Mamdani
Metode Mamdani sering juga dikenal dengan nama metode Max-Min Metode ini diperkenalkan oleh Ebrahim Mamdani (1975) Metode Mamdani merupakan metode yang paling banyak di gunakan dalam metodologi fuzzy karena merupakan metode yang pertama dalam merancang sistem Metode Mamdani bersifat lebih intuitif, dapat diterima lebih luas dan cocok untuk masukan yang berasal dari manusia
Sistem Inferensi Fuzzy Mamdani
Untuk mendapat keluaran, diperlukan 4 tahapan pada sistem inferensi mamdani ini : - fuzzifikasi - Aplikasi fungsi implikasi - Komposisi Aturan - Defuzzifikasi
Sistem Inferensi Fuzzy Mamdani
Fuzzifikasi adalah suatu proses untuk mengubah suatu masukan dari bentuk tegas (crisp) menjadi fuzzy (variabel linguistik) yang biasanya disajikan dalam bentuk himpunan-himpunan fuzzy dengan suatu fungsi kenggotaannya masing-masing
Sistem Inferensi Fuzzy Mamdani Secara umum ada 2 fungsi implikasi yang bisa digunakan pada metode fuzzy : - Fungsi Min memotong keluaran himpunan fuzzy - Dot (product) Fungsi ini akan menskala output himpunan fuzzy
Pada Metode Mamdani, fungsi implikasi yang digunakan adalah Min
Sistem Inferensi Fuzzy Mamdani metode yang digunakan dalam melakukan inferensi sistem fuzzy Mamdani adalah metode max. Karena itu inferensi mamdani sering disebut Metode Max-Min karena metode dan aplikasi fungsi komposisi yang digunakan adalah Metode Max dan Min
Metode Max Mamdani
Pada metode ini, solusi himpunan fuzzy diperoleh dengan cara mengambil nilai maksimum aturan, kemudian menggunakannya untuk memodifikasi daerah fuzzy, dan mengaplikasikannya ke keluaran dengan menggunakan operator OR (union). Rumus metode Max : µsf[xi] max(µsf[xi], µkf [xi])
dimana µsf [xi] merupakan nilai keanggotaan solusi fuzzy sampai aturan ke-i dan µkf [xi] merupakan nilai keanggotaan konsekuen fuzzy aturan ke-i.
Metode Max Mamdani
Deffuzifikasi Mamdani Masukan dari proses defuzzifikasi adalah suatu himpunan fuzzy yang diperoleh dari komposisi aturan-aturan fuzzy keluaran yang dihasilkan merupakan suatu bilangan pada domain himpunan fuzzy tersebut Metode yang digunakan adalah metode centroid
Deffuzifikasi Mamdani
Metode Penelitian Tugas Akhir
Metode Penelitian Tugas Akhir
Studi Literatur Dilakukan penggalian teori-teori maupun informasi lain yang menunjang pengerjaan tugas akhir sesuai dengan permasalahan yang telah dirumuskan dilakukan melalui banyak sumber seperti internet, artikel ilmiah, paper, buku, dan jurnal
Pengumpulan Data mengumpulkan berbagai informasi mengenai studi kasus pada Rumah Sakit XYZ dengan cara dokumentasi memperoleh data pasien yang berisiko terjangkit penyakit paru-paru obstruktif kronis beserta variabel faktor yang mempengaruhi tingkat risiko penyakitnya
Desain dan Implementasi pendeteksi dini Pendefinisian dan Perumusan fungsi keanggotaan dengan pendekatan fungsi
Perumusan dan pendefinisian rule base
Implementasi menggunakan Java dengan library Jfuzzylogic
Uji Coba dan Analisis Akhir
Ada dua uji coba yang dilakukan
Uji Perumusan Validasi Model
Uji Verifikasi melihat bagaimana akurasi Tugas Akhir dengan bantuan matlab
Uji Kinerja melihat bagaimana akurasi Tugas Akhir
Dengan Presisi dan Recall
Penyusunan Buku Tugas Akhir merupakan bagian terakhir dari proses pengerjaan tugas akhir ini semua hasil yang telah diperoleh dari tahapan-tahapan sebelumnya didokumentasikan secara sistematik sesuai dengan standar yang berlaku di Jurusan Sistem Informasi ITS
Desain Fuzzy (Variabel Masukan) Derajat Berat Merokok
Usia
Sosioekonomik
Paparan Okupasional
Penyakit Paru lain
Jenis Kelamin
Genetik
Desain Fuzzy (Variabel Derajat Berat Merokok)
Merokok merupakan salah satu faktor yang sangat berpengaruh terhadap penyakit ppok. Hal ini dikarenakan kandungan rokok yang dapat merusak paru-paru. Tingkat intensitas merokok seseorang dinamakan derajat berat merokok.
Desain Fuzzy (Variabel Genetik) Gejala
Genetik
Nilai
Risiko
1 ( tidak ada riwayat bawaan keluarga)
Rendah
2 ( ada riwayat bawaan keluarga )
Baik
Desain Fuzzy (Variabel Sosioekonomik) Gejala Sosioekonomik
Nilai
Risiko
1 ( tingkat baik)
Rendah
2 ( tingkat rendah )
Tinggi
Desain Fuzzy (Variabel Paparan Okupasional)
Paparan okupasional merupakan pengertian seberapa sering seseorang terpapar oleh zat yang dapat merusak paru-paru seperti asap dan lain-lain. Gejala Paparan Okupasional
Nilai 1 ( tidak terpapar) 2 ( terpapar )
Risiko Rendah Tinggi
Desain Fuzzy (Variabel Usia)
Usia mempunyai pengaruh terhadap penyakit ppok. Semakin tua seseorang, maka semakin besar tingkat risiko terkena penyakit ini
Desain Fuzzy (Variabel Penyakit Paru lain)
Penyakit ppok hanyalah satu dari banyak penyakit paru-paru lainnya. Apabila seseorang memiliki penyakit paru selain ppok, maka semakin berisiko terkena penyakit ppok Gejala Penyakit Paru Penyerta lain
Nilai
Risiko
1 ( tidak ada)
Rendah
2 ( ada )
Tinggi
Desain Fuzzy (Variabel Jenis Kelamin) Gejala
Nilai
Risiko
1 ( perempuan)
Rendah atau sedang
2 ( laki-laki )
Sedang atau tinggi
Jenis Kelamin
Desain Fuzzy (Variabel Keluaran)
Aturan Fuzzy
Desain Aplikasi (Use Case)
Desain Aplikasi (Activity Diagram)
Desain Aplikasi (Sequence Diagram)
Implementasi Aplikasi (FCL)
Fuzzy Control Language atau biasa disingkat FCL merupakan bahasa yang sederhana untuk menentukan sistem inferensi fuzzy FCL juga merupakan bahasa yang digunakan untuk mengimplementasikan algoritma fuzzy logic Tahap dari implementasi FCL untuk tugas akhir ini yaitu definisi fungsi dan variabel, definisi fungsi keanggotaan variable masukan, definisi fungsi keanggotaan variable keluaran dan defuzzifikasi, dan definisi aturan fuzzy.
Implementasi Aplikasi (Definisi fungsi dan variabel)
Implementasi Aplikasi (Definisi fungsi keanggotaan input variabel)
Implementasi Aplikasi (Definisi variabel keluaran dan defuzzifikasi)
Implementasi Aplikasi (Definisi metode dan aturan fuzzy)
Implementasi Antar-muka
Implementasi Proses
Uji Coba uji coba sistem, yaitu melakukan pengujian terhadap aplikasi yang telah dikembangkan Tahap uji coba ini terdiri dari tiga sub bab yaitu lingkungan uji coba, data uji coba, skenario uji coba, dan pelaksanaan dan hasil uji coba
Lingkungan Uji Coba Lingkungan yang digunakan untuk melakukan uji coba program adalah sistem operasi Windows 7 Perangkat lunak yang digunakan untuk melakukan komputasi adalah Netbeans IDE 6.8 menggunakan library Jfuzzylogic dan aplikasi komputasi numerikal yaitu Matlab R2009 perangkat keras yang dimanfaatkan yaitu laptop Intel Core i7 M 620 2.6 GHz dengan memory 4 GB.
Data Uji Coba Data yang digunakan pada tugas akhir ini adalah data pasien penyakit PPOK pada rumah sakit XYZ Jumlah data 122 buah Tingkat risiko rendah terdiri dari 32 data, lalu sedang 45 data dan tingkat risiko tinggi 45 data
Skenario Uji Coba Uji Coba Perumusan Fungsi Keanggotaan
• Melakukan validasi terhadap fungsi keanggotaan
Uji Coba Verifikasi
• membuktikan bahwa aplikasi yang bersangkutan mampu melakukan pengujian dengan metode fuzzy yang telah dibuat dengan hasil yang benar
Uji Coba Kinerja
• penilaian kinerja yang berguna untuk mengetahui apakah sistem telah berfungsi sesuai dengan aturan fuzzy yang telah dibuat
Uji Coba Perumusan Fungsi Keanggotaan Tabel Hasil Presisi dan Recall sebelum modifikasi fungsi keanggotaan
Jenis penilaian / Status risiko ppok
precision recall
Tinggi
Sedang
Rendah
96%
75%
75%
88,88%
77,77%
78,94%
Tabel Presisi dan Recall hasil modifikasi fungsi keanggotaan
Jenis penilaian / Status risiko ppok
precision recall
Tinggi
Sedang
Rendah
96%
78,12%
93,75%
88,88%
92,59%
78,94%
Uji Coba Verifikasi
membuktikan bahwa aplikasi yang bersangkutan mampu melakukan pengujian dengan metode fuzzy yang telah dibuat dengan hasil yang benar Uji Coba
Hasil Aplikasi Java
Hasil Matlab
Uji Gejala 1
0.40
0.395
Uji Gejala 2
1.0
1.0
Uji Gejala 3
1.5
1.5
Uji Coba Kinerja
Jumlah data yang diklasifikasi dengan benar adalah 42 didapat dari penjumlahan 17, 15, dan 10.
Dari 49 data yang ada, dapat disimpulkan bahwa 85,71 % data diklasifikasi dengan benar dan 14,19 % data diklasifikasi salah.
Jumlah
Nilai Prediksi Tinggi
Sedang
Rendah
Nilai
Tinggi
17
1
0
Aktual
Sedang
1
15
2
Rendah
0
3
10
Analisis Hasil Uji Verifikasi Fungsi Aplikasi
Komentar
Pemasukan data gejala
Apabila data gejala usia dan derajat berat merokok diisi bukan dengan angka, maka akan gagal mendapatkan hasil
Fungsi “Show Result”
Fungsi “Show Result” mampu memperlihatkan hasil diagnosis tingkat risiko penyakit
Keluaran Hasil
Keluaran hasil mampu memperlihatkan hasil diagnosis tingkat risiko penyakit
Analisis Hasil Uji Kinerja Tabel 5.6 Matriks Lancaster – data risiko tinggi
Tabel 5.7 Matriks Lancaster – data risiko sedang
PREDICTED CLASS
PREDICTED CLASS Tinggi ACTUAL CLASS
NonTinggi
Tinggi
a = 17
b=1
NonTinggi
c=1
d = 30
ACTUAL CLASS
Tabel 5.8 Matriks Lancaster – data risiko rendah
PREDICTED CLASS
ACTUAL CLASS
Rendah
NonRendah
Rendah
a = 10
b=3
NonRendah
c=2
d = 34
Sedang
NonSedang
Sedang
a = 15
b=3
NonSedang
c=4
d = 27
Analisis Hasil Uji Kinerja
Tabel 5.6 menggambarkan matriks data pelatihan tingkat risiko tinggi. Hasil uji coba menunjukkan bahwa nilai presisi data pelatihan tinggi ini mempunyai nilai 94,44%. Sedang hasil recall didapat dengan nilai 94,44%. Kemudian akurasi risiko tinggi yaitu 95,9%.
Tabel 5.7 menggambarkan matriks data pelatihan tingkat risiko sedang. Hasil uji coba menunjukkan bahwa nilai presisi data pelatihan sedang ini mempunyai nilai 78,94%. Sedang hasil recall didapat dengan nilai 83,33%. Kemudian akurasi risiko sedang yaitu 85,71%.
Tabel 5.8 menggambarkan matriks data tingkat risiko rendah. Hasil uji coba menunjukkan bahwa nilai presisi data tingkat risiko rendah ini mempunyai nilai 83,33%. Sedang hasil recall didapat dengan nilai 76,92%. Kemudian akurasi risiko rendah yaitu 89,79%.
Analisis Hasil Uji Kinerja Jenis penilaian / Status risiko ppok
Tinggi
Sedang
Rendah
precision
94,44%
78,94%
83,33%
recall
94,44%
83,33%
76,92%
Akurasi
95,9%
85,71%
89,79%
Analisis Hasil dengan Melihat Nilai Presisi Data Pengujian Terendah
Hasil uji coba menunjukkan bahwa nilai presisi data pengujian yang terburuk terdapat pada tingkat risiko sedang dengan nilai 78.94%.
Nilai tersebut didapat dengan perhitungan bahwa ada 15 data yang ditebak dengan benar, dan ada 4 data yang tidak sesuai dengan nilai data aktual atau ditebak salah
Kemudian dari empat data yang ditebak salah, ternyata sebanyak tiga data atau 75% berlabel risiko rendah dan 25% berlabel risiko tinggi.
kesalahan terbesar terjadi pada risiko rendah yang diprediksi salah
Analisis Hasil dengan Melihat Nilai Presisi Data Pengujian Tertinggi
Hasil uji coba menunjukkan bahwa nilai presisi yang terburuk terdapat pada tingkat risiko tinggi dengan nilai 94.44%.
Nilai tersebut didapat dengan perhitungan bahwa ada 13 data yang ditebak dengan benar, dan ada 1 data yang tidak sesuai dengan nilai data aktual atau ditebak salah
Kemudian dari satu data yang ditebak salah, ternyata data tersebut berlabel risiko sedang namun dilabeli dengan risiko tinggi
Kesimpulan yang bisa diambil adalah masih ada kesalahan atau misdisguise pada aplikasi yang dibangun ini sebanyak 5,66%
Analisis Hasil dengan Melihat Nilai Recall Data Pengujian Terendah
Hasil uji coba menunjukkan bahwa nilai recall yang terendah terdapat pada tingkat risiko rendah dengan nilai 76,92%.
Nilai tersebut didapat dengan perhitungan bahwa ada 10 data aktual yang terpredikisi dengan benar, dan ada tiga data aktual yang terprediksi salah
Kemudian dari tiga data aktual yang terprediksi salah, ternyata sebanyak 3 data terprediksi sebagai risiko sedang
Analisis Hasil dengan Melihat Nilai Recall Data Pengujian Tertinggi
Hasil uji coba menunjukkan bahwa nilai recall yang terbaik terdapat pada tingkat risiko tinggi dengan nilai 94.44%.
Nilai tersebut didapat dengan perhitungan bahwa ada 13 data aktual yang terpredikisi dengan benar, dan hanya ada 1 data aktual yang terprediksi salah.
Kemudian dari 1 data aktual yang terprediksi salah, ternyata data tersebut terprediksi sebagai risiko sedang
Kesimpulan
Tingkat kebenaran pengklasifikasian dari aplikasi yaitu mencapai 85,71%. Akurasi tingkat risiko tinggi yaitu 95,08. Sedangkan akurasi tingkat risiko sedang didapat 85,24. Kemudian akurasi tingkat risiko rendah yaitu 90,16. Akurasi tertinggi terdapat pada tingkat risiko tinggi dan terendah pada risiko sedang. Pada data pengujian Presisi tingkat risiko tinggi yaitu 94,44%. Sedangkan presisi tingkat risiko sedang didapat 78,94%. Kemudian presisi tingkat risiko rendah yaitu 83,33%. Jadi Presisi tertinggi terdapat pada tingkat risiko tinggi dan terendah pada risiko sedang. Pada data pengujian didapatkan recall tingkat risiko tinggi yaitu 94,44%. Sedangkan recall tingkat risiko sedang didapat 83,33%. Kemudian recall tingkat risiko rendah didapat 76,92%. Jadi recall tertinggi terdapat pada risiko tinggi dan terendah pada risiko rendah. Hasil analisis hasil uji kinerja memperlihatkan bahwa hasil kesalahan prediksi atau tingkat misdisguisenya terbanyak mengarah pada tingkat risiko sedang
Saran
Untuk mendapatkan kinerja yang lebih baik dan maksimal, akan lebih baik jika ditunjang dengan informasi karakteristik data gejala lain yang sekiranya juga memiliki dampak terhadap risiko terkena penyakit paru-paru obstruktif kronis.