BAB I PENDAHULUAN A. Latar Belakang Masalah Diabetes mellitus merupakan suatu penyakit yang ditandai oleh kadar glukosa darah melebihi normal dan gangguan metabolisme karbohidrat, lemak dan protein yang disebabkan kekurangan hormon insulin secara relatif maupun absolut. Bila hal ini dibiarkan tak terkendali dapat terjadi komplikasi metabolik akut maupun komplikasi vaskuler jangka panjang, baik mikroangiopati maupun makroangiopati (Darmono dalam Hasdianah, 2007 : 1). Diabetes mellitus perlu diwaspadai karena sifat penyakit yang kronik progresif, jumlah penderita semakin meningkat dan banyak dampak negatif yang ditimbulkan. Prevalensi merupakan banyaknya kasus penyakit yang terjadi pada suatu waktu tertentu di wilayah tertentu. Meningkatnya prevalensi diabetes mellitus di beberapa negara berkembang akibat peningkatan kemakmuran di negara bersangkutan, akhir-akhir ini banyak disoroti. Jumlah penderita diabetes mellitus di dunia dari tahun ke tahun mengalami peningkatan, hal ini berkaitan dengan jumlah penduduk yang meningkat, urbanisasi yang mengubah pola hidup tradisional ke pola hidup modern, prevalensi obesitas meningkat dan kegiatan fisik kurang. Diabetes mellitus diklasifikasikan menjadi diabetes mellitus tipe I atau Insulin Dependent Diabetes Mellitus (IDDM) dan tipe II atau Non Insulin Dependent Diabetes Mellitus (NIDDM) (Hidayah dalam Hasdianah, 2010 : 3). Diabetes mellitus tipe I umumnya disebabkan oleh faktor genetika (keturunan),
1
2
faktor imunologik dan faktor lingkungan. Diabetes mellitus tipe II umumnya disebabkan oleh obesitas dan kekurangan olahraga. Faktor yang mempengaruhi timbulnya diabetes mellitus secara umum yaitu usia lebih dari 40 tahun, obesitas, dan riwayat keluarga. Di Indonesia penyandang diabetes melitus (DM) tipe I sangat jarang. Demikian pula di negara tropis lain. Hal ini rupanya ada hubungannya dengan letak geografis Indonesia yang terletak di daerah khatulistiwa. Dari angka prevalensi berbagai negara tampak bahwa makin jauh letaknya suatu negara dari khatulistiwa makin tinggi prevalensi DM tipe I-nya. Ini menunjukkan bahwa pada DM tipe I faktor lingkungan juga berperan selain yang sudah diketahui yaitu faktor genetik (Soegondo dkk, 2013 : 3-4). Lain halnya pada DM tipe II yang meliputi 90% dari semua populasi diabetes, faktor lingkungan sangat berperan, terutama peningkatan kemakmuran suatu bangsa akan meningkatkan prevalensi diabetes. Pada DM tipe II, intoleransi (tubuh seseorang tidak dapat menghasilkan) glukosa pada lansia berkaitan dengan obesitas, aktivitas fisik yang berkurang, kurangnya massa otot, penyakit lain yang dimiliki, penggunaan obat-obatan, disamping karena pada lansia terjadi penurunan sekresi insulin dan insulin resistan (ketidakmampuan tubuh untuk memanfaatkan insulin). Individu yang tidak menerapkan gaya hidup sehat berisiko menderita penyakit diabetes mellitus. Untuk itu hidup sehat harus selalu diterapkan dengan mengkonsumsi makanan sehat juga rutin berolahraga supaya gula darah tetap
3
stabil berada dalam batas normal sehingga terhindar dari penyakit diabetes mellitus. Diabetes mellitus seringkali tidak terdeteksi sebelum diagnosis dilakukan, sehingga morbiditas (terjadinya penyakit atau kondisi yang mengubah kesehatan dan kualitas hidup) dan mortalitas (kematian) dini terjadi pada kasus yang tidak terdeteksi ini. Uji diagnostik DM dilakukan pada mereka yang menunjukkan gejala/tanda dengan salah satu risiko DM yaitu usia ≥ 45 tahun dan usia lebih muda yang disertai dengan faktor risiko seperti kebiasaan tidak aktif (tidak banyak bergerak), turunan pertama dari orang tua dengan DM, riwayat melahirkan bayi dengan BB lahir bayi > 4000 gram, atau riwayat DM-gestasional, hipertensi, kolesterol HDL ≤ 35 mg/dL dan atau trigliserida ≥ 250 mg/dL, menderita keadaan klinis lain yang terkait dengan resistensi insulin, adanya riwayat toleransi glukosa yang terganggu atau glukosa darah puasa terganggu sebelumnya, dan memiliki riwayat penyakit kardiovaskular (Soegondo dkk, 2013 : 20-21). Diabetes mellitus merupakan suatu keadaan hiperglikemik kronis dan perlahan namun pasti akan merusak jaringan dalam tubuh jika tidak ditangani secara tepat dan serius (Agus dkk, 2011 : 1). Dengan ditemukannya beberapa faktor penyebab terjadinya diabetes mellitus diantaranya faktor genetik, faktor lingkungan, faktor kegemukan, faktor demografi, dan lainnya, maka faktor-faktor tersebut mempengaruhi seseorang akan mengalami DM tipe I atau DM tipe II. Penelitian yang menjadi acuan dalam tugas akhir ini adalah klasifikasi penyakit diabetes mellitus yang dilakukan oleh Dita Dwi Arini (2014) dengan
4
menggunakan model jaringan syaraf tiruan Backpropagation yang menghasilkan nilai ketepatan klasifikasi sebesar 92,19% untuk data training dan 93,75% untuk data testing. Faktor risiko yang digunakan adalah usia, berat badan, tinggi badan, tekanan darah, riwayat keluarga, usia timbul penyakit DM, timbulnya penyakit secara perlahan atau tiba-tiba, pola makan, dan suka makanan manis atau tidak. Penelitian lain yang telah dilakukan berkaitan dengan klasifikasi penyakit diabetes mellitus adalah klasifikasi penyakit diabetes mellitus menggunakan jaringan syaraf tiruan Backpropagation dan Learning Vector Quantization oleh Agus Nurkhozin (2011) yang menghasilkan nilai keakurasian untuk data training sebesar 98,1% pada metode LVQ dan 99,3% pada metode Backpropagation. Faktor risiko yang digunakan pada penelitian ini adalah usia, berat badan, tinggi badan, riwayat keluarga, terdapat gangguan destruksi sel beta atau tidak, dan pengaruh pola makan. Metode statistika banyak diterapkan dalam berbagai bidang keilmuan sebagai alat untuk menganalisis data untuk tujuan-tujuan tertentu, baik dalam bidang komputasi, sosial, kesehatan, keuangan, ekonomi, dan lain-lain. Sebagai contoh metode statistika dapat digunakan untuk tujuan klasifikasi. Dalam ilmu statistika ada beberapa metode klasifikasi yang digunakan untuk melakukan klasifikasi data diantaranya regresi logistik, analisis diskriminan, pohon klasifikasi dan jaringan syaraf tiruan (Artificial Neural Network). Banyaknya alternatif metode statistika yang digunakan untuk membangun model pengklasifikasian,
5
maka penulis akan membuat dua kajian untuk membandingkan kemampuan klasifikasi antar model. Regresi logistik dan analisis diskriminan bersifat parametrik karena membutuhkan beberapa asumsi, seperti harus mengikuti suatu distribusi tertentu baik untuk variabel respon maupun variabel prediktor, kenormalan data dan matriks kovarian yang homogen. Pohon klasifikasi dan jaringan saraf tiruan bersifat nonparametrik sehingga tidak memerlukan asumsi-asumsi yang mengikat seperti asumsi distribusi normal bagi variabel prediktor. Regresi logistik adalah suatu model logistik yang digunakan untuk menjelaskan hubungan antara prediktor dan respon (yang bersifat dikotomus atau ada dua kategori/kelompok), serta untuk mengelompokkan obyek ke dalam salah satu dari dua kategori respon. Dalam perkembangannya, regresi logistik dapat juga digunakan untuk respon kategori lebih dari dua kelompok, yang dikenal dengan regresi logistik polikotomus (Yuniarti, 2010 : 119). Regresi logistik merupakan metode statistika yang paling umum digunakan untuk mengklasifikasi. Metode statistika lainnya yang dapat digunakan untuk pengklasifikasian objek dengan melibatkan variabel respon kategori dengan sejumlah variabel prediktor kontinu adalah analisis diskriminan. Analisis diskriminan adalah metode statistika yang digunakan untuk mengelompokkan atau mengklasifikasikan sejumlah obyek ke dalam beberapa kelompok, berdasarkan beberapa variabel independen, sedemikian sehingga setiap obyek menjadi anggota dari salah satu kelompok dan tidak ada obyek yang menjadi lebih dari satu kelompok (Johnson &
6
Wichern, 2007 : 575). Analisis diskriminan mengasumsikan data berdistribusi normal multivariat dan matriks kovariannya sama. Pelanggaran asumsi multivariat normal pada analisis diskriminan biasanya menghasilkan tingkat ketepatan klasifikasi yang rendah (Pujiati, 2008 : 4). Pada kenyataannya, tidak selalu asumsi-asumsi pada metode statistika yang bersifat parametrik tersebut terpenuhi. Untuk itu, diperlukan solusi lain dalam mengklasifikasi agar didapatkan hasil yang optimal, seperti menggunakan metode klasifikasi yang bersifat nonparametrik. Neural network diketahui memiliki kemampuan yang sangat baik untuk melakukan berbagai proses klasifikasi. Neural network merupakan suatu sistem pemrosesan informasi yang memiliki karakteristik kinerja tertentu yang mirip dengan jaringan saraf biologis. Neural network telah dikembangkan sebagai model matematika secara umum dari pemahaman manusia atau saraf biologi yang didasarkan pada asumsi bahwa pemrosesan informasi terjadi pada elemen sederhana yang disebut neuron, sinyal mengalir di antara sel saraf/neuron melalui suatu sambungan penghubung, setiap sambungan penghubung memiliki bobot yang bersesuaian, bobot ini akan digunakan untuk menggandakan/mengalikan sinyal yang dikirim melaluinya, serta setiap neuron akan menerapkan fungsi aktivasi terhadap sinyal hasil penjumlahan berbobot yang masuk kepadanya untuk menentukan sinyal keluarannya (Fausett, 1994 : 3). Adapun metode neural network yang digunakan pada klasifikasi penyakit diabetes mellitus ini adalah Learning Vector Quantization (LVQ). LVQ adalah
7
suatu metode klasifikasi pola dimana masing-masing unit output mewakili kelas atau kategori tertentu. Vektor bobot untuk unit output sering dinyatakan sebagai sebuah vektor referensi yang mewakili kelas. Selama proses pembelajaran, unit output diatur dengan menyesuaikan bobot melalui pembelajaran terawasi. Serangkaian pola pembelajaran dengan klasifikasi yang diketahui ditentukan bersama dengan vektor referensi awal. Setelah proses pembelajaran, jaringan LVQ mengklasifikasikan vektor input dengan menugaskan ke kelas yang sama sebagai output yang memiliki vektor bobot yang paling dekat dengan vektor input (Fausett, 1994 : 187). Mengingat penyakit diabetes mellitus ini merupakan permasalahan yang komplek dan memerlukan penanganan yang tepat, penulis akan melakukan klasifikasi menggunakan dua metode diantaranya dengan analisis diskriminan dan model neural network Learning Vector Quantization agar mendapatkan hasil yang optimal. Berpijak dari hal tersebut, maka penulis menyusun tugas akhir ini dengan judul “Klasifikasi Diabetes Mellitus dengan Analisis Diskriminan dan Model Neural Network Learning Vector Quantization”. B. Perumusan Masalah Berdasarkan latar belakang di atas, permasalahan yang dirumuskan dalam penulisan skripsi ini adalah sebagai berikut : 1.
Bagaimana klasifikasi diabetes mellitus dengan analisis diskriminan?
2.
Bagaimana klasifikasi diabetes mellitus dengan model neural network Learning Vector Quantization?
8
3.
Bagaimana hasil klasifikasi diabetes mellitus menggunakan analisis diskriminan dan model neural network Learning Vector Quantization?
C. Tujuan Penelitian Dari rumusan masalah di atas, tujuan dari penulisan skripsi ini adalah : 1.
Mendeskripsikan bagaimana klasifikasi diabetes mellitus dengan analisis diskriminan.
2.
Mendeskripsikan bagaimana klasifikasi diabetes mellitus dengan model neural network Learning Vector Quantization.
3.
Mendeskripsikan hasil klasifikasi diabetes mellitus menggunakan analisis diskriminan dan model neural network Learning Vector Quantization.
D. Manfaat Penelitian Manfaat yang diperoleh dari penulisan skripsi ini adalah : 1.
Bagi penulis sendiri, dapat menambah wawasan mengenai penggunaan metode klasifikasi analisis diskriminan dan model neural network Learning Vector Quantization pada penyakit diabetes mellitus.
2.
Bagi pembaca dapat menambah wawasan tentang penerapan
analisis
diskriminan dan model neural network Learning Vector Quantization pada kasus dalam kehidupan sehari-hari. 3.
Membantu memudahkan dalam mengenali tipe penyakit DM berdasarkan faktor risikonya dengan menggunakan metode klasifikasi analisis diskriminan dan model neural network Learning Vector Quatization sehingga penderita penyakit diabetes mellitus mendapatkan penanganan yang tepat.