CLUSTERING INTERAKSI PROTEIN DAN PENYAKIT YANG TERKAIT DENGAN DIABETES MELLITUS TIPE 2 MENGGUNAKAN FUZZY K-PARTITE
IRWAN HARIANTO LUMBANRAJA
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2017
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Clustering Interaksi Protein dan Penyakit yang Terkait dengan Diabetes Mellitus Tipe 2 Menggunakan Fuzzy K-Partite adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Mei 2017 Irwan Harianto Lumbanraja NIM G64144027
ABSTRAK IRWAN HARIANTO LUMBANRAJA. Clustering Interaksi Protein dan Penyakit yang Terkait dengan Diabetes Mellitus Tipe 2 Menggunakan Fuzzy K-Partite. Dibimbing oleh WISNU ANANTA KUSUMA dan LAILAN S. HASIBUAN. Diabetes Mellitus (DM) Tipe 2 adalah salah satu penyakit yang disebabkan oleh gangguan fungsional protein. Interaksi protein di dalam tubuh membentuk jejaring yang dapat mengungkap fungsional protein, gen penyakit, dan hubungan antar penyakit. Penelitian ini melakukan clustering interaksi protein dan penyakit yang direpresentasikan dalam bentuk graf. Algoritme fuzzy k-partite clustering digunakan untuk mengelompokkan data protein dan data penyakit masing-masing ke dalam beberapa kelompok. Data interaksi protein direduksi menggunakan algoritme MCL untuk mendapatkan kelompok protein dengan tingkat keterhubungan paling besar. Implementasi clustering dengan algoritme fuzzy kpartite clustering menghasilkan 19 cluster protein dan 43 cluster penyakit. Anggota cluster protein dan cluster penyakit dengan nilai keterhubungan yang tinggi tidak menunjukkan adanya hubungan dengan DM Tipe 2. Adapun anggota cluster protein 3, 5, 6, 7, 10, dan 12 dengan nilai keterhubungan yang rendah menunjukkan adanya hubungan dengan DM Tipe 2. Pada penelitian ini ditemukan adanya anggota cluster penyakit yang memiliki hubungan dengan DM Tipe 2 seperti obesitas, hipoglikemia, hiperglikemia, jantung koroner, pembuluh darah perifer, dan arteri koroner. Kata kunci: diabetes mellitus; fuzzy k-partite clustering; interaksi protein
ABSTRACT IRWAN HARIANTO LUMBANRAJA. Clustering of Protein Interaction and Disease for Type 2 Diabetes Mellitus using Fuzzy K-Partite. Supervised by WISNU ANANTA KUSUMA and LAILAN S. HASIBUAN. Type 2 diabetes mellitus (T2DM) is one of diseases which is caused by functional disorders of protein. Protein interactions in body form a network that can reveal a functional of protein, gene diseases, and association of diseases. This study conducted clustering of protein interactions and diseases that are represented in a graph. Fuzzy k-partite clustering algorithm was used to cluster protein and disease into several groups. Protein interaction was reduced using MCL algorithm to yield cluster of protein which has the greatest level of connections. The Implementation of fuzzy k-partite clustering algorithm produced 19 protein clusters and 43 disease clusters. Members of protein cluster and disease clusters which had high connectivity values did not show the association with T2DM. On the other hand, members of protein cluster 3, 5, 6, 7, 10, and 12 which had low connectivity value showed the association with T2DM since it found links among the members of diseases cluster and T2DM. It showed that some diseases such as obesity, hypoglycemia, hyperglycemia, coronary heart, peripheral vascular, and coronary artery typically appear along with T2DM. Keywords: diabetes mellitus; fuzzy k-partite clustering; protein interaction
CLUSTERING INTERAKSI PROTEIN DAN PENYAKIT YANG TERKAIT DENGAN DIABETES MELLITUS TIPE 2 MENGGUNAKAN FUZZY K-PARTITE
IRWAN HARIANTO LUMBANRAJA
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2017
Penguji: Husnul Khotimah, SKomp MKom
PRAKATA Puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa atas segala rahmat dan anugerah-Nya sehingga penulis berhasil menyelesaikan karya ilmiah dengan judul Clustering Interaksi Protein dan Penyakit yang Terkait Diabetes Mellitus Tipe 2 menggunakan Fuzzy K-Partite. Penulis menyadari bahwa dalam proses penulisan skripsi ini banyak mengalami kendala dan masalah, namun berkat bantuan, bimbingan, kerjasama dari berbagai pihak dan berkah dari Tuhan Yang Maha Esa sehingga kendala-kendala yang dihadapi tersebut dapat diatasi. Untuk itu penulis menyampaikan ungkapan terima kasih kepada Ibu tercinta Risma Sitohang, adik-adik tercinta Lilis Heryati Lumbanraja, Juni Dameria Lumbanraja dan Merry Christina Lumbanraja yang senantiasa memberikan semangat motivasi, doa dan kasih sayangnya serta seluruh keluarga yang selalu memberikan semangat dan motivati. Serta ucapan terima kasih dan penghargaan kepada Bapak Dr Eng Wisnu Ananta Kusuma, ST MT dan Ibu Lailan Sahrina Hasibuan, SKom MKom selaku Pembimbing yang telah dengan sabar, tekun, tulus dan ikhlas meluangkan waktu, tenaga, dan pikiran memberikan bimbingan, motivasi, arahan, dan saran-saran yang sangat berharga kepada penulis selama menyusun skripsi. Penulis juga menyampaikan terima kasih kepada: 1 Ibu Husnul Khotimah, SKomp MKom selaku penguji. 2 Bapak Dr Ir Agus Buono, MSi MKom selaku Ketua Departemen Ilmu Komputer IPB. 3 Seluruh dosen, staff tata usaha, dan staf pegawai Departemen Ilmu Komputer IPB. 4 Seluruh teman-teman sebimbingan yaitu Dio, Ghifari, Bastian, dan Tedy. 5 Teman-teman yang selalu mendukung yaitu Fasalir, Aizul, Aang, Ihsan Arif, Ivan, Akbar, Putu, dan Kevin. 6 Seluruh teman-teman Program S1 Alih Jenis Ilmu Komputer IPB Angkatan 9. Semoga segala bantuan, bimbingan, motivasi, dan dukungan yang telah diberikan kepada penulis senantiasa dibalas oleh Tuhan Yang Maha Esa. Semoga karya ilmiah ini bermanfaat bagi semua pihak yang membutuhkan.
Bogor, Mei 2017 Irwan Harianto Lumbanraja
DAFTAR ISI DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN
1
Latar Belakang
1
Perumusan Masalah
2
Tujuan Penelitian
2
Manfaat Penelitian
2
Ruang Lingkup Penelitian
2
METODE
2
Tahapan Penelitian
2
Pengumpulan Data
3
Praproses Data
4
Fuzzy K-Partite Clustering
6
Analisis Cluster
8
Lingkungan Pengembangan
9
HASIL DAN PEMBAHASAN
9
Pengumpulan Data
9
Praproses Data
10
Fuzzy K-Partite Clustering
12
Analisis Cluster
15
SIMPULAN DAN SARAN
20
Simpulan
20
Saran
20
DAFTAR PUSTAKA
21
RIWAYAT HIDUP
40
DAFTAR TABEL 1 2 3 4
Jumlah protein pada masing-masing cluster protein 13 Jumlah penyakit pada masing-masing cluster penyakit 14 Anggota cluster protein 4 dan cluster penyakit 29 16 Protein hasil penelitian Yahya (2016) yang masuk ke dalam cluster protein yang dihasilkan 18
DAFTAR GAMBAR 1 2 3 4 5 6 7 8 9 10 11 12 13
Tahapan Penelitian 2 Pengumpulan data interaksi protein pada basis data STRING 3 Pengumpulan data penyakit pada basis data CTD 4 Algoritme Markov Clustering 5 Algoritme fuzzy k-partite clustering (Hartsperger et al. 2010) 7 Ilustrasi algoritme fuzzy k-partite clustreing (Hartsperger et al. 2010) 8 Jejaring interaksi protein 10 Hasil clustering jejaring interaksi protein dengan MCL 11 Jejaring cluster 1 dengan nilai modularity tertinggi 11 Graf Protein dan Penyakit 12 Rata-rata nila cost function untuk setiap jumlah cluster penyakit 13 Nilai keterhubungan antara cluster protein dan cluster penyakit 14 Graf cluster protein dan cluster penyakit dengan masing-masing anggotanya serta keterhubungan antar cluster 15 14 Grafik nilai keterhubungan antar cluster 16
DAFTAR LAMPIRAN 1 2 3 4 5 6 7 8 9 10 11 12
Daftar protein yang berasosiasi langsung dengan DM Tipe 2 Hasil clustering menggunakan algoritme MCL Nilai derajat keanggotaan dari setiap protein pada cluster protein Cluster penyakit 27 beserta nilai keanggotaan masing-masing penyakit. Cluster penyakit 28 beserta nilai keanggotaan masing-masing penyakit. Cluster penyakit 4 beserta nilai keanggotaan masing-masing penyakit. Cluster penyakit 11 beserta nilai keanggotaan masing-masing penyakit. Cluster penyakit 8 beserta nilai keanggotaan masing-masing penyakit. Cluster penyakit 38 beserta nilai keanggotaan masing-masing penyakit. Cluster penyakit 5 beserta nilai keanggotaan masing-masing penyakit. Cluster penyakit 16 beserta nilai keanggotaan masing-masing penyakit. Cluster penyakit 39 beserta nilai keanggotaan masing-masing penyakit.
23 25 27 31 32 33 34 35 36 37 38 39
PENDAHULUAN Latar Belakang Salah satu faktor penyebab penyakit adalah terjadinya gangguan fungsional protein yang terdapat di dalam tubuh manusia. Diabetes Mellitus (DM) merupakan salah satu contoh penyakit yang diakibatkan oleh gangguan fungsional protein. Menurut American Association Diabetes (2004), DM merupakan penyakit yang disebabkan oleh gangguan pada sekresi insulin yang ditandai dengan terjadinya hiperglikemia serta gangguan metabolisme karbohidrat, lemak, dan protein. Berdasarkan etiologinya DM memiliki berbagai jenis penyakit, salah satunya adalah penyakit DM Tipe 2 (FARMALKES 2005). Penyakit ini ditandai dengan hormon insulin yang disekresi oleh pankreas untuk mengontrol level gula darah dalam tubuh tidak bekerja dengan semestinya (resistensi insulin), sel-sel gagal merespon hormon insulin dengan normal serta naiknya kadar gula dalam darah (hiperglikemia) (Bordonaro 2009). Protein-protein yang terdapat di dalam tubuh manusia saling berinteraksi untuk menjalankan proses biologis dan fungsinya. Interaksi yang terjadi pada protein-protein tersebut membentuk sebuah jejaring yang dapat digunakan sebagai alat yang ampuh untuk mengungkap fungsi dari protein, gen penyakit, dan hubungan antar penyakit. Jejaring interaksi ini dikenal dengan jejaring interaksi protein (Liu et al. 2015; Yang et al. 2014; Sun et al. 2014). Pada jejaring interaksi protein terdapat protein-protein yang merupakan protein signifikan. Protein signifikan merupakan protein yang paling berpengaruh pada jejaring interaksi protein. Protein-protein signifikan juga berinteraksi dengan protein-protein lain yang tidak termasuk sebagai protein signifikan. Clustering interaksi protein merupakan suatu metode yang dapat digunakan untuk mengidentifikasi protein yang paling berpengaruh dalam jejaring interaksi protein. Metode clustering interaksi protein diharapkan dapat mengidentifikasi protein-protein yang paling berpengaruh pada penyakit DM Tipe 2. Penelitian pada penyakit DM Tipe 2 yang dilakukan oleh Usman (2016) menemukan 21 protein signifikan yang berasosiasi dengan penyakit DM Tipe 2. Penelitian ini menganalisis topologi jejaring interaksi protein yang berasosiasi dengan penyakit DM Tipe 2. Penelitian ini belum melibatkan informasi penyakitpenyakit yang memiliki hubungan dengan DM Tipe 2 melalui jejaring interaksi protein tersebut. Dengan adanya informasi tersebut diharapkan dapat menemukan penyakit yang memiliki keterkaitan dengan penyakit DM Tipe 2. Dengan menggabungkan informasi protein-protein yang berasosiasi dengan DM Tipe 2 dan informasi penyakit-penyakit yang berasosiasi dengan protein-protein tersebut dibutuhkan suatu metode yang dapat menemukan penyakit-penyakit lain yang memiliki keterkaitan dengan penyakit DM Tipe 2. Metode yang diusulkan dalam penelitian ini adalah melakukan clustering interaksi protein yang berasosiasi dengan DM Tipe 2 berdasarkan penyakit menggunakan metode fuzzy k-partite clustering. Metode ini dipilih karena dapat mengelompokkan interaksi protein dan penyakit secara terpisah dan dapat mendeteksi overlap pada setiap cluster yang disebabkan oleh protein yang
2 memiliki lebih dari satu fungsi sehingga memungkinkan protein tersebut dapat masuk ke dalam banyak cluster. (Hartsperger et al. 2010). Perumusan Masalah Rumusan masalah pada penelitian ini adalah bagaimana melakukan clustering interaksi protein dan penyakit yang terkait dengan DM Tipe 2 untuk menemukan hubungan antara protein dan penyakit. Tujuan Penelitian 1
2
Tujuan yang ingin dicapai pada penelitian ini adalah: Melakukan pengelompokkan pada data interaksi protein dan data penyakit yang terkait dengan Diabetes Mellitus Tipe 2 dengan menggunakan algoritme Fuzzy K-Partite. Menganalisis hasil cluster protein, hasil cluster penyakit, dan keterhubungan antara cluster protein dan cluster penyakit yang dihasilkan untuk menemukan penyakit yang memiliki hubungan dengan DM Tipe 2. Manfaat Penelitian
Manfaat penelitian ini diharapkan dapat berkontribusi untuk mengoptimalkan penemuan formulasi obat yang tepat untuk penyakit DM Tipe 2 setelah ditemukannya kelompok protein yang berpengaruh pada DM Tipe 2 berdasarkan penyakit yang berasosiasi dengan kelompok protein tersebut. Ruang Lingkup Penelitian 1 2 3
Ruang lingkup penelitian ini adalah: Data protein yang berasosiasi langsung dengan DM Tipe 2 diperoleh dari penelitian Usman (2016). Data interaksi protein diperoleh dari basis data STRING. Data penyakit diperoleh dari basis data Comparative Toxicogenomics Database (CTD).
METODE Tahapan Penelitian Penelitian ini terdiri atas 4 tahapan utama yaitu pengumpulan data, praposes data, fuzzy k-partite clustering, dan analisis cluster. Keseluruhan tahapan pada penelitian ini dapat dilihat pada Gambar 1 berikut.
Gambar 1 Tahapan Penelitian
3 Pengumpulan Data Data yang digunakan pada penelitian ini adalah (1) data protein yang berasosiasi langsung dengan DM Tipe 2 diperoleh dari penelitian Usman (2016), (2) data interaksi protein pada penyakit DM Tipe 2 diperoleh dari basis data STRING (http://string-db.org/). Pada pengumpulan data ini, semua data protein yang berasosiasi langsung dengan DM Tipe 2 yang diperoleh dari penelitian Usman (2016) digunakan sebagai keyword untuk pencarian pada basis data STRING untuk mendapatkan data interaksi protein. Tipe query yang digunakan untuk pencarian ini adalah tipe “protein by name” dengan query key yang digunakan adalah nama protein dan organisme homo sapiens. Basis data STRING mengembalikan data interaksi protein untuk setiap protein. Protein-protein yang diperoleh pada basis data STRING yang tidak termasuk sebagai protein yang berasosiasi langsung dengan DM Tipe 2, pada penelitian ini disebut sebagai protein yang tidak berasosiasi langsung dengan DM Tipe 2. Pengumpulan data pada basis data STRING dapat dilihat pada Gambar 2.
Gambar 2 Pengumpulan data interaksi protein pada basis data STRING (3) Data penyakit dari basis data Comparative Toxicogenomics Database (CTD) (http://ctdbase.org/). Setelah data interaksi protein diperoleh dan direduksi, data protein yang berada pada cluster yang memiliki nilai modularity tertinggi digunakan sebagai masukan pada basis data CTD untuk mendapatkan data penyakit. Pada penggumpulan data ini, terdapat tiga tipe query yang digunakan. Query pertama adalah “Select your input type” yang merupakan query yang mendefinisikan jenis data masukan yang digunakan dan karena data masukan yang digunakan adalah protein maka option yang dipilih adalah Genes. Query kedua adalah “Provide query terms” yang merupakan field yang digunakan untuk memasukkan semua data protein dan cara memasukkan data protein pada field ini menggunakan delimiter “|” yang digunakan sebagai pemisah protein satu dengan protein lainnya. Query ketiga adalah “Choose data to download” yang digunakan untuk mengunduh jenis data yang diperlukan, karena yang akan diambil adalah data penyakit, maka field yang digunakan adalah “Disease associations” dengan option yang dipilih adalah “curated” serta format file yang diunduh adalah format JSON.
4 Basis data CTD mengembalikan data penyakit untuk setiap protein yang memiliki hubungan dengan penyakit-penyakit tersebut.
Gambar 3 Pengumpulan data penyakit pada basis data CTD Praproses Data Data interaksi protein yang diperoleh dari basis data STRING direduksi dengan mengelompokkan data protein ke dalam beberapa kelompok dan kemudian memilih kelompok protein yang memiliki modularity score yang paling tinggi untuk digunakan sebagai masukan pada basis data CTD untuk menemukan data penyakit. Reduksi data interaksi protein ini diharapkan dapat meningkatkan kecepatan dan waktu komputasi pada tahap berikutnya. Reduksi data interaksi protein pada penelitian ini dilakukan dengan menggunakan algoritme Markov Clustering (MCL).
Clustering Data Interaksi Protein dengan menggunakan algoritme Markov Clustering (MCL) Setelah data interaksi protein diperoleh, tahap selanjutnya adalah mereduksi data interaksi protein dengan menggunakan algoritme Markov Clustering. Algoritme Markov Clustering (MCL) adalah algoritme clustering yang dapat membagi graf berdasarkan keterhubungan node dalam graf. Pada algoritme MCL, tahap pertama yang dilakukan adalah membuat matriks keterhubungan dari suatu graf. Setelah matriks dibuat, setiap kolom pada matriks dijadikan menjadi kolom stokastik matriks yang merepresentasikan kemungkinan atau peluang dari suatu random walk atau markov chain yang terdefinisikan pada suatu graf. Kolom stokastik matriks merupakan matriks yang memiliki jumlah dari setiap elemen pada setiap kolom adalah satu. Kolom matriks M yang memiliki kolom sebanyak verteks dari suatu graf G dapat direpresentasikan sebagai matriks yang memiliki peluang
5 transisi dari suatu random walk atau markov chain yang terdefinisi pada graf G. Elemen M(i,j) menandakan peluang transisi dari verteks vi ke verteks vj atau elemen M(i,j) dapat juga dianggap sebagai stokastik flow dari verteks vi ke verteks vj (Dongen 2008). Operasi utama pada algoritme MCL adalah operasi ekspansi (M) dan operasi inflasi (M, r). Pada operasi ekspansi dilakukan perkalian matriks (M*M). Operasi ekspansi bertujuan untuk meningkatkan flow antar verteks yang telah ada dan membuka flow-flow potensial baru. Pada operasi inflasi (M, r) elemen-elemen pada matriks M dipangkatkan dengan nilai parameter inflasi r. Operasi inflasi bertujuan untuk memperkuat flow-flow yang kuat dan memperlemah flow-flow yang lemah. Nilai parameter inflasi r biasanya harus lebih besar dari satu dan nilai inflasi r yang umum digunakan adalah dua. Pada algoritme MCL, terdapat juga dua operasi tambahan yaitu normalize (M) dan prune (M). Pada normalize (M), matriks yang diolah ditransformasi menjadi kolom stokastik matriks. Operasi normalize (M) langsung dijalankan setelah operasi inflasi (M, r) selesai sehingga sering kali operasi ini dianggap jadi satu dengan operasi inflasi (M, r). Operasi prune (M) dilakukan untuk mempercepat konvergensi matriks M, elemen-elemen yang sudah mendekati nol langsung diubah menjadi nol (Dongen 2008). Algoritme Markov Clustering dapat dilihat pada Gambar 4.
Gambar 4 Algoritme Markov Clustering Pada penelitian ini clustering data interaksi protein dengan algoritme MCL ini dilakukan dengan menggunakan aplikasi Cytoscape yang telah menyediakan package untuk melakukan clustering dengan algoritme MCL. Terdapat beberapa parameter yang digunakan pada Cytoscape untuk melakukan clustering data interaksi protein dengan algoritme MCL, parameter-parameter tersebut adalah granularity parameter, weak edge pruning threshold, wumber of iterations dan maximum residual value. Berikut penjelasan setiap parameter yang digunakan pada proses clustering. 1. Granularity parameter (Inflation value) merupakan nilai yang digunakan untuk membangkitkan nilai matriks. Rentang nilai yang baik untuk nilai inflasi ini berkisar dari 1.8 sampai sekitar 2.5. Biasanya nilai yang sering digunakan untuk parameter infation value adalah 2. 2. Weak edge pruning threshold merupakan parameter yang digunakan untuk pemangkasan edge.
6 3. Number of iterations merupakan jumlah maksimum iterasi untuk mengeksekusi algoritme. 4. Maximum residual value merupakan parameter yang memastikan bahwa iterasi yang dilakukan cukup. Modularity Setelah data interaksi protein direduksi menggunakan algoritme MCL, tahap selanjutnya adalah mendapatkan kelompok protein yang memiliki nilai modularity tertinggi. Modularity merupakan salah satu ukuran tingkat konektivitas dalam pengelompokkan graf. Graf dengan nilai modularity yang tinggi memiliki konektivitas yang padat antara node dalam cluster, tetapi memiliki konektivitas yang jarang antara node dalam cluster yang berbeda. Modularity sering digunakan dalam metode optimasi untuk mendeteksi struktur komunitas dalam graf. Persamaan 1 merupakan persamaan yang digunakan untuk mendapatkan nilai modularity pada suatu graf. 𝐶𝑚𝑜𝑑 =
𝐸𝑖𝑛 𝐸𝑜𝑢𝑡
(1)
Keterangan: Cmod: nilai modularity. Ein: jumlah edge diantara node yang menjadi anggota dalam sebuah cluster. Eout: jumlah edge diantara node yang bukan anggota dalam sebuah cluster. Pembentukan Graf Bipartite Data protein yang direduksi dengan MCL yang memiliki nilai modularity paling tinggi dihubungkan dengan data penyakit yang diperoleh dari basis data CTD. Data protein dan penyakit tersebut dikonversi kedalam bentuk graf dengan menggunakan aplikasi Cytoscape. Jenis graf yang terbentuk dari hasil penggabungan data protein dan data penyakit adalah jenis graf bipartite. Graf bipartite yang terbentuk dikonversi kedalam adjacency matriks. Adjacency matriks bernilai 1 jika protein dan penyakit memiliki hubungan, dan bernilai 0 jika protein dan penyakit tidak memiliki hubungan. Fuzzy K-Partite Clustering Menentukan Jumlah Cluster Optimum Dalam menentukan jumlah cluster maksimum pada penelitian ini merujuk pada penelitian yang dilakukan oleh Hartsperger et al. (2010). Persamaan 2 merupakan persamaan yang digunakan untuk menentukan jumlah cluster maksimum pada data penyakit. 𝑀𝑑𝑖𝑠𝑒𝑎𝑠𝑒 =
𝑉𝑑𝑖𝑠𝑒𝑎𝑠𝑒 10
Keterangan: Mdisease: jumlah maksimum cluster penyakit.
(2)
7 Vdisease: jumlah node pada data penyakit. Persamaan 3 merupakan persamaan yang digunakan untuk menentukan jumlah cluster maksimum pada data protein.
𝑚𝑔𝑒𝑛𝑒 = 𝑚𝑑𝑖𝑠𝑒𝑎𝑠𝑒 √
𝑉𝑔𝑒𝑛𝑒 𝑉𝑑𝑖𝑠𝑒𝑎𝑠𝑒
(3)
Keterangan: Mgene: jumlah maksimum cluster protein. Vgene: jumlah node pada data protein. Pada penelitian ini, untuk menentukan jumlah cluster optimum dilakukan dengan mengamati nilai rata-rata cost function minimum yang dihasilkan setelah dilakukan pengulangan sebanyak 10 kali pada kode program terhadap setiap jumlah cluster penyakit. Jumlah cluster optimum yang digunakan pada penelitian ini adalah jumlah cluster yang memiliki rata-rata nilai cost function terendah. Clustering Interaksi Protein dan Penyakit dengan Algoritme Fuzzy K-Partite Pendekatan yang diterapkan pada algoritme fuzzy k-partite clustering untuk melakukan clustering terhadap graf k-partite G adalah membuat backbone graf kpartite H dari graf k-partite G dengan ukuran graf yang lebih kecil. Algoritme fuzzy k-partite clustering dapat dilihat pada Gambar 5.
Gambar 5 Algoritme fuzzy k-partite clustering (Hartsperger et al. 2010)
8 Graf G dikonversi ke dalam sebuah matriks yang disebut matriks kedekatan Aij. Matriks kedekatan Aij berisi nilai ketetanggaan atau hubungan antar elemen partisi ke-i dan ke-j, elemen matriks bernilai 1 jika partisi ke-i dan partisi ke-j memiliki hubungan dan bernilai 0 jika partisi ke-i dan partisi ke-j tidak memiliki hubungan. Algoritme fuzzy k-partite memiliki dua kali iterasi, iterasi pertama merupakan iterasi yang dilakukan untuk memperoleh nilai matriks Bij yang berisi nilai keterhubungan antara node fuzzy cluster dari masing-masing partisi. Node fuzzy cluster disimpan ke dalam matriks Ci yang diperoleh pada iterasi kedua. Matriks Ci berisi nilai derajat keanggotaan setiap node dari masing-masing partisi. Iterasi dilakukan sampai diperoleh nilai cost function yang konvergen. Pada penelitian ini, source code diperoleh dari penelitian Hartsperger et al. (2010) dan dijalankan pada aplikasi Octave. Ilustrasi algoritme fuzzy k-partite clustering dapat dilihat pada Gambar 6.
Gambar 6 Ilustrasi algoritme fuzzy k-partite clustreing (Hartsperger et al. 2010) Analisis Cluster Analisis cluster yang dilakukan pada penelitian ini terdiri atas dua tahap, tahap pertama adalah melakukan analisis berdasarkan nilai keterhubungan cluster protein dan cluster penyakit. Anggota cluster protein dan cluster penyakit dengan nilai keterhubungan tinggi dievaluasi apakah memiliki hubungan dengan DM Tipe 2 atau tidak. Tahap kedua adalah melakukan analisis berdasarkan hasil penelitian yang dilakukan oleh Yahya (2016) yang melakukan identifikasi protein-protein signifikan dengan menganalisis topologi interaksi protein-protein pada penyakit DM. Yahya menemukan 9 protein signifikan pada DM, protein-protein tersebut adalah AKT1, INSR, KCNJ11, PPARG, TCF7L2, FOXO1, SOCS3, IRS1 dan INS. Protein-protein signifikan yang diperoleh pada penelitian Yahya akan dilihat keanggotaannya dalam cluster protein yang dihasilkan serta keterhubungannya dengan cluster penyakit. Setelah itu cluster terpilih dievaluasi untuk dilihat penyakit-penyakit apa saja yang memiliki hubungan dengan penyakit DM Tipe 2.
9 Lingkungan Pengembangan Spesifikasi perangkat keras dan perangkat lunak yang digunakan untuk penelitian ini adalah sebagai berikut: 1 Perangkat keras, berupa personal komputer dengan spesifikasi: a Intel® Core™ i3 b RAM 6 GB c Harddisk Internal 250 GB 2 Perangkat lunak yang digunakan: a Sistem Operasi Windows 10 64-bit b Cytoscape v.3.4.0 c Octave
HASIL DAN PEMBAHASAN Pengumpulan Data Data protein yang diperoleh dari penelitian Usman (2016) adalah sebanyak 84 protein yang berasosiasi dengan DM Tipe 2 (Lampiran 1). Selanjutnya data protein tersebut digunakan sebagai masukan pada basis data STRING untuk mendapatkan data interaksi protein. Hasilnya dari 84 protein tersebut, terdapat 64 protein yang memiliki data interaksi dan 20 protein tidak memiliki data interaksi. Data interaksi protein yang diperoleh dari ke 64 protein tersebut adalah sebanyak 2082 data interaksi yang melibatkan 489 protein yang berinteraksi. Protein yang tidak memiliki data interaksi tidak diikutsertakan dalam proses selanjutnya. Data interaksi protein yang diperoleh dari basis data STRING dikonversi kedalam bentuk jejaring yang disebut jejaring interaksi protein. Jejaring interaksi protein yang terbentuk terdiri atas satu jejaring besar dan lima jejaring kecil. Jejaring besar tersusun atas 59 protein yang berasosiasi langsung dengan penyakit DM Tipe 2 dan jejaring kecil masing-masing tersusun atas satu protein yang berasosiasi langsung dengan penyakit DM Tipe 2. Jejaring interaksi protein yang terbentuk dapat dilihat pada Gambar 7.
10
Gambar 7 Jejaring interaksi protein Praproses Data Clustering Data Interaksi Protein dengan menggunakan algoritme Markov Clustering (MCL) Jejaring interaksi protein yang terbentuk dari tahapan sebelumnya akan dikelompokkan dengan menggunakan algoritme Markov Cluster (MCL). Clustering jejaring interaksi protein ini bertujuan untuk mereduksi jejaring interaksi protein sehingga diperoleh node protein-protein yang memiliki tingkat keterhubungan yang paling tinggi. Tingkat keterhubungan ini diukur berdasarkan nilai modularity yang dihasilkan pada tiap cluster. Cluster yang memiliki nilai modularity tertinggi akan digunakan pada tahap selanjutnya. Dengan melakukan reduksi pada jejaring interaksi protein diharapkan dapat meningkatkan waktu komputasi pada tahap selanjutnya. Clustering jejaring interaksi protein dengan algoritme MCL ini dilakukan dengan menggunakan aplikasi Cytoscape yang telah menyediakan package untuk melakukan clustering dengan mengggunakan algoritme MCL. Sebelum melakukan clustering jejaring interaksi protein dengan aplikasi Cytoscape, terdapat beberapa parameter yang nilainya harus ditentukan terlebih dahulu. Pada penelitian ini, nilai parameter-parameter yang digunakan adalah sebagai berikut: 1 Granularity parameter (inflation value) = 2, 2 Weak edge pruning threshold = 1 x 10-10, 3 Number of iterations = 15, dan 4 Maximum residual value = 1 x 10-3.
11
Gambar 8 Hasil clustering jejaring interaksi protein dengan MCL Clustering jejaring interaksi protein dengan menggunakan algoritme MCL ini menghasilkan 33 cluster protein (Gambar 8) dan Lampiran 2 menunjukkan rincian dari hasil clustering menggunakan algoritme MCL. Lampiran 2 menunjukkan bahwa jejaring pada cluster 1 merupakan jejaring interaksi protein yang memiliki modularity score tertinggi (Gambar 9). Jejaring tersebut tersusun atas 89 protein yang terdiri dari 18 protein yang berasosiasi langsung dengan penyakit DM Tipe 2 dan 71 protein yang tidak berasosiasi langsung dengan penyakit DM Tipe 2. Protein-protein yang berasosiasi dengan penyakit DM Tipe 2 tersebut adalah IRS2, RETN, INSR, INS, SLC2A2, PON1, EPO, GCK, NEUROD1, PAX4, HNF4A, HNF1A, PDX1, UCP3, PPARG, IAPP, GCGR, dan IRS1.
Gambar 9 Jejaring cluster 1 dengan nilai modularity tertinggi
12
Graf Bipartite Selanjutnya, ke 89 protein yang diperoleh dari proses reduksi digunakan sebagai masukan pada basis data CTD untuk mendapatkan data penyakit yang memiliki keterkaitan dengan data protein tersebut. Hasilnya dari ke 89 protein tersebut, 77 protein menghasilkan sebanyak 515 jenis penyakit sedangkan 12 protein lainnya tidak memiliki data penyakit, protein-protein yang tidak memiliki data penyakit tersebut adalah FOXO4, MAFA, JAK1, FKBP11, NKX2-2, NXNL1, GRB2, MCHR1, SP3, GIP, CALCB, dan GRB10. Protein-protein yang tidak memiliki data penyakit ini tidak diikutsertakan dalam proses selanjutnya. Selanjutnya data protein dan penyakit ini dibentuk menjadi sebuah graf menggunakan aplikasi Cytoscape. Graf bipartite yang terbentuk antara data protein dan data penyakit dapat dilihat pada Gambar 10.
Gambar 10 Graf Protein dan Penyakit Fuzzy K-Partite Clustering Penentuan jumlah cluster maksimum untuk data protein dan data penyakit yang diperoleh adalah sebanyak 19 cluster untuk data protein dan sebanyak 51 cluster untuk data penyakit. Jumlah cluster penyakit digunakan untuk menentukan jumlah cluster optimum yang akan digunakan pada tahap clustering dengan menggunakan algoritme fuzzy k-partite clustering. Jumlah cluster dengan nilai ratarata cost function terendah menunjukkan jumlah cluster optimum. Grafik cost function yang dihasilkan dari setiap jumlah cluster penyakit dapat dilihat pada Gambar 11.
13
Gambar 11 Rata-rata nila cost function untuk setiap jumlah cluster penyakit Berdasarkan Gambar 11, nilai rata-rata cost function terendah berada pada jumlah cluster 43 dengan nilai sebesar 646.01887. Jumlah cluster ini ditetapkan sebagai jumlah cluster optimum dan akan digunakan pada tahap selanjutnya. Dengan demikian jumlah cluster penyakit dan protein yang akan digunakan pada tahap selanjutnya adalah sebesar 43 dan 19. Pada penelitian yang dilakukan oleh Hartsperger et al. (2010) nilai threshold yang direkomendasikan adalah sebesar 0.2. Data protein yang berjumlah 77 dikelompokkan ke dalam 19 cluster. Nilai derajat keanggotaan dari setiap protein pada setiap cluster dapat dilihat pada Lampiran 3. Setelah dilakukan filterisasi terhadap nilai derajat keanggotaan masing-masing protein dengan menggunakan nilai threshold yang telah ditentukan, diperoleh bahwa cluster protein 1, 3, 4, 9, 14, dan 18 merupakan cluster protein terkecil dengan masing-masing jumlah anggotanya adalah 1 protein dan cluster protein 7 merupakan cluster protein terbesar dengan jumlah anggotanya sebanyak 19 protein (Tabel 1). Tabel 1 Jumlah protein pada masing-masing cluster protein Cluster 1 2 3 4 5 6 Jumlah Protein
7
8 9 10 11 12 13 14 15 16 17 18 19
1 5 1 1 8 4 19 3 1
8
7
7
2
1
4
4
9
1
Pada penelitian ini, data penyakit yang diperoleh adalah berjumlah 515 jenis penyakit. Penyakit-penyakit tersebut dikelompokkan ke dalam 43 cluster penyakit. Setelah dilakukan proses filterisasi terhadap nilai derajat keanggotaan pada setiap cluster penyakit dengan menggunakan nilai threshold yang telah ditentukan, maka terdapat 9 cluster penyakit yang masing-masing nilai derajat keanggotaannya tidak melewati nilai threshold yang telah ditentukan sehingga menyebabkan ke 9 cluster penyakit tersebut tidak memiliki anggota penyakit. Cluster penyakit yang tidak
9
14 memiliki anggota penyakit tersebut adalah cluster penyakit 2, 7, 10, 15, 25, 31, 35, 36, dan 43. Cluster penyakit yang tidak memiliki anggota penyakit tidak diikutsertakan pada proses selanjutnya. Pada cluster penyakit yang diperoleh, ditemukan bahwa cluster penyakit 4 merupakan cluster penyakit yang memiliki jumlah anggota paling besar yaitu sebanyak 43 jenis penyakit sedangkan cluster penyakit 3 dan 32 merupakan cluster penyakit yang memiliki jumlah anggota paling kecil yaitu sebanyak 2 jenis penyakit. Jumlah penyakit pada masing-masing cluster penyakit dapat dilihat pada Tabel 2. Tabel 2 Jumlah penyakit pada masing-masing cluster penyakit 1
3
4
5
6
8
9
11
Jumlah 20 penyakit
2
43
23
9
28
14
17
Cluster 12 13 38
14
16
17
18
19
20
21
11
31
34
10
11
10
29
30
34
37
38
39
40
41
42
41
16
39
21
19
16
39
22 23
24
26
27
28
29
Cluster 30 32 33
Jumlah 34 32 penyakit
4
26
50
22
10
12
2
25
Gambar 12 Nilai keterhubungan antara cluster protein dan cluster penyakit
15 Pada penelitian ini, hubungan antara cluster protein dan cluster penyakit sebagian besar bernilai nol yang artinya bahwa antar cluster tersebut tidak memiliki hubungan. Nilai keterhubungan antara cluster protein dan cluster penyakit dapat dilihat pada Gambar 12 dan graf yang terbentuk antara hubungan cluster protein dan cluster penyakit dengan masing-masing anggotanya serta hubungan antar cluster dapat dilihat pada Gambar 13.
Gambar 13 Graf cluster protein dan cluster penyakit dengan masing-masing anggotanya serta keterhubungan antar cluster Analisis Cluster Analisis Berdasarkan Nilai Keterhubungan Antar Cluster Analisis yang dilakukan adalah berdasarkan nilai yang menyebabkan terjadinya selisih yang terbesar pada nilai keterhubungan antara cluster protein dan cluster penyakit. Nilai keterhubungan yang lebih dari nilai yang menyebabkan selisih terbesar dianalisis lebih lanjut. Berdasarkan Gambar 14, selisih terbesar pada nilai keterhubungan antar cluster terdapat pada nilai 1.790 dan 2.295. Nilai keterhubungan antar cluster yang lebih dari 1.790 hanya terdapat satu nilai keterhubungan yaitu 2.295. Nilai keterhubungan ini merupakan nilai keterhubungan antara cluster protein 4 dan cluster penyakit 29 sehingga anggota pada cluster protein 4 dan cluster penyakit 29 akan dianalisis apakah memiliki hubungan dengan penyakit DM Tipe 2. Anggota pada cluster protein 4 dan cluster penyakit 29 dapat dilihat pada Tabel 3.
16
Gambar 14 Grafik nilai keterhubungan antar cluster Tabel 3 Anggota cluster protein 4 dan cluster penyakit 29 Anggota Cluster Protein 4 Anggota Cluster Penyakit 29 APOE Colonic Neoplasms Reperfusion Injury Pancreatic Neoplasms Osteoarthritis Lipidoses Barrett Esophagus Carotid Intimal Medial Thickness 1 Ischemia Leukostasis Lymphoma, T-Cell Menurut FARMALKES (2005) penyebab terjadinya DM Tipe 2 salah satunya adalah obesitas. Obesitas atau kegemukan merupakan salah satu faktor pradisposisi utama pada DM Tipe 2. Berdasarkan laporan yang diterbitkan oleh FARMALKES, gen-gen yang bertanggung jawab terhadap obesitas memiliki hubungan dengan gen-gen yang merupakan faktor pradisposisi untuk DM Tipe 2. Diabetes yang tidak terkontrol dengan baik dapat mengakibatkan komplikasi akut dan kronis. Komplikasi tersebut adalah sebagai berikut: 1 Hipoglikemia, ditandai dengan penderita merasa pusing, lemas, gemetar, pandangan berkunang-kunang, pitam (pandangan menjadi gelap),keringat dingin, detak jantung meningkat, sampai hilang kesadaran. 2 Hiperglikemia, keadaan dimana kadar gula darah melonjak secara tiba-tiba. 3 Komplikasi Makrovaskular, terdapat 3 jenis komplikasi ini, antara lain penyakit jantung koroner (coronary heart disease), penyakit pembuluh darah otak, dan penyakit pembuluh darah perifer (peripheral vascular disease). 4 Komplikasi Mikrovaskular, antara lain retinopati, nefropati, dan neuropati.
17 DM Tipe 2 juga memiliki hubungan dengan penyakit arteri koroner (coronary artery disease), hal ini dikarenakan penderita DM Tipe 2 beresiko tinggi terkena penyakit arteri koroner (coronary artery disease) (Naito dan Kasai 2015). DM Tipe 2 juga memiliki hubungan dengan penyakit stroke dan fatty liver (National Stroke Association 2013). Berdasarkan pernyataan-pernyataan tersebut dapat disimpulkan bahwa obesitas, hipoglikemia, hiperglikemia, penyakit jantung koroner, penyakit pembuluh darah otak, penyakit arteri koroner, penyakit pembuluh darah perifer, stroke, retinopati, nefropati, dan neuropati merupakan kata kunci penyakit atau gangguan yang memiliki hubungan dengan DM Tipe 2. Tabel 3 menunjukkan bahwa terdapat 1 protein yang menjadi anggota pada cluster protein 4 dan 10 jenis penyakit yang menjadi anggota pada cluster penyakit 29. Protein yang menjadi anggota pada cluster protein 4 yaitu protein APOE merupakan protein yang tidak termasuk ke dalam protein signifikan pada penyakit Diabetes Mellitus berdasarkan penelitian Yahya (2016). Hal ini juga berbanding lurus dengan anggota cluster penyakit 29 yang memiliki anggota penyakit sebanyak 10 jenis penyakit juga tidak memiliki hubungan dengan penyakit Diabetes Mellitus. Berdasarkan analisis tersebut dapat dinyatakan bahwa protein dan penyakit yang berada pada masing-masing cluster yang memiliki nilai keterhubungan antar cluster yang tinggi tidak memiliki keterkaitan dengan penyakit DM Tipe 2. Berdasarkan hal tersebut dapat dinyatakan bahwa semakin tinggi nilai keterhubungan antara cluster protein dan cluster penyakit, maka anggota yang menempati masing-masing cluster tersebut diidentifikasi tidak memiliki hubungan yang signifikan dengan penyakit DM Tipe 2. Analisis Berdasarkan Penelitian Sebelumnya (Yahya 2016) Penelitian yang dilakukan Yahya (2016) menemukan protein-protein signifikan dengan menganalisis topologi jejaring interaksi protein yang terkait dengan penyakit DM. Protein-protein signifikan tersebut ditentukan dengan menghitung nilai overall centrality protein pada jejaring interaksi. Yahya (2016) menemukan bahwa protein INS merupakan protein yang memiliki nilai overall centrality tertinggi. Selain INS terdapat 8 protein juga yang memiliki nilai overall centrality dan memiliki hubungan yang dekat dengan INS yaitu AKT1, INSR, KCNJ11, PPARG, TCF7L2, FOXO1, SOCS3, dan IRS1. Pada penelitian ini terdapat 5 protein dari 9 protein yang diperoleh pada penelitian Yahya (2016) yang masuk ke dalam cluster protein yang dihasilkan pada penelitian ini. Kelima protein yang diperoleh pada penelitian ini adalah FOXO1, PPARG, IRS1, INS, dan INSR sedangkan 4 protein lain yaitu AKT1, KCNJ11, SOCS3, dan TCF7L2 tereduksi pada saat proses reduksi. Kelima protein yang diperoleh pada penelitian ini dapat dilihat nilai derajat keanggotaannya pada masing-masing cluster protein yang terdapat pada Tabel 4. Berdasarkan Tabel 4, protein FOXO1 memiliki nilai derajat keanggotaan paling tinggi dari pada protein-protein lainnya yaitu sebesar 0.938. Protein FOXO1 berada pada cluster protein 10 yang terhubung dengan cluster penyakit 27 yang memiliki nilai keterhubungan sebesar 0.257. Berdasarkan laporan yang diterbitkan oleh FARMALKES (2005), terdapat dua jenis penyakit yang memiliki hubungan
18 dengan DM Tipe 2 pada cluster penyakit 27. Kedua jenis penyakit tersebut adalah Coronary Artery Disease dan Stroke (Lampiran 4). Tabel 4 Protein hasil penelitian Yahya (2016) yang masuk ke dalam cluster protein yang dihasilkan Protein Nilai Derajat Keanggotaan Cluster Protein FOXO1 0.938 10 PPARG 0.612 3 IRS1 0.611 7 INS 0.452 5 INSR 0.408 12 INSR 0.276 6 INSR 0.237 7 INS 0.218 17 Berdasarkan Tabel 4, protein PPARG memiliki nilai derajat keanggotaan sebesar 0.612. Protein PPARG berada pada cluster protein 3 yang terhubung dengan cluster penyakit 28 yang memiliki nilai keterhubungan sebesar 1.790. Penyakit yang memiliki hubungan dengan DM Tipe 2 pada cluster penyakit 28 adalah penyakit Diabetes Mellitus (Lampiran 5). DM Tipe 2 merupakan salah satu jenis penyakit Diabetes Mellitus (FARMALKES 2005). Protein IRS1 memiliki nilai derajat keanggotaan sebesar 0.611 yang berada pada cluster protein 7 dan memiliki hubungan dengan cluster penyakit 4 dengan nilai keterhubungan sebesar 1.111. Penyakit atau gangguan yang memiliki hubungan dengan DM Tipe 2 pada cluster penyakit 4 adalah penyakit Fatty Liver (National Stroke Association 2013) dan dapat dilihat pada Lampiran 6. Protein INS berada pada cluster protein 5 dan 17. Protein INS memiliki nilai derajat keanggotaan paling besar pada cluster protein 5 yaitu sebesar 0.452 sedangkan pada cluster protein 17, protein INS memiliki nilai derajat keanggotaan sebesar 0.218. Cluster protein 5 memiliki hubungan dengan cluster penyakit 11 dengan nilai keterhubungan sebesar 0.372 sedangkan cluster protein 17 terhubung dengan cluster penyakit 8 dengan nilai keterhubungan sebesar 0.214 dan cluster penyakit 38 dengan nilai keterhubungan sebesar 0.228. Pada cluster penyakit 8 dan 38 tidak ditemukan penyakit atau gangguan yang memiliki hubungan dengan DM Tipe 2 (Lampiran 8; Lampiran 9) sedangkan pada cluster penyakit 11 ditemukan penyakit atau gangguan yang memiliki hubungan dengan DM Tipe 2 seperti Hyperglycemia, Diabetes Mellitus Permanent Neonatal, Maturity-Onset Diabetes of the Young Type 1, Hyperinsulinemic hypoglycemia familial 3, dan MaturityOnset Diabetes of the Young, Type 2 (Lampiran 7). Protein INSR berada pada cluster protein 6, 7, dan 12. Protein INSR memiliki nilai derajat keanggotaan paling besar pada cluster protein 12 yaitu sebesar 0.408 sedangkan pada cluster protein 6, protein INSR memiliki nilai derajat keanggotaan sebesar 0.276 dan pada cluster protein 7 protein INSR memiliki nilai derajat keanggotaan sebesar 0.237. Cluster protein 6 terhubung dengan cluster penyakit 5 dengan nilai keterhubungan sebesar 0.554 sedangkan cluster protein 7 terhubung dengan cluster penyakit 4 dengan nilai keterhubungan sebesar 1.111 dan
19 cluster protein 12 terhubung dengan cluster penyakit 16 dengan nilai keterhubungan sebesar 0.305 dan cluster penyakit 39 dengan nilai keterhubungan sebesar 0.258. Penyakit atau gangguan yang ditemukan pada cluster penyakit 5 yang memiliki hubungan dengan DM Tipe 2 adalah Diabetes Mellitus InsulinResistant with Acanthosis Nigricans, Diabetic Neuropathies, Hyperinsulinemic Hypoglycemia, Familial 5, dan Glucose Intolerance (FARMALKES 2005) dan dapat dilihat pada Lampiran 10. Pada cluster penyakit 4, penyakit atau gangguan yang ditemukan dan memiliki hubungan dengan DM Tipe 2 adalah Fatty Liver (National Stroke Association 2013) dapat dilihat pada Lampiran 6. Pada cluster penyakit 16, penyakit atau gangguan yang ditemukan dan memiliki hubungan dengan DM Tipe 2 adalah Diabetes Mellitus, Insulin-Dependent 20, Diabetic Neuropathies, Diabetes Mellitus, Type 1, Diabetes Mellitus, Insulin-Resistant with Acanthosis Nigricans, Hyperinsulinemic Hypoglycemia Familial 5, Hypoglycemia, Hyperinsulinism, Heart Failure, Glucose Intolerance, Obesity, Heart Diseases, dan Diabetes Mellitus, Type 2 (FARMALKES 2005), dapat dilihat pada Lampiran 11. Penyakit atau gangguan yang ditemukan pada cluster penyakit 39 yang memiliki hubungan dengan DM Tipe 2 adalah Vascular Diseases (FARMALKES 2005), dapat dilihat pada Lampiran 12. Berdasarkan hasil yang diperoleh, semakin tinggi nilai keanggotaan suatu protein pada suatu cluster, semakin kecil peluang protein tersebut menjadi anggota pada cluster lain. Protein-protein yang berperan penting pada penyakit DM Tipe 2 cenderung hanya menjadi anggota pada satu cluster saja dengan nilai keanggotaan yang tinggi. Hal ini dapat dilihat pada protein FOXO1, PPARG, dan IRS1 yang hanya menjadi anggota pada satu cluster protein saja, seperti tersaji pada Tabel 4. Pada penelitian ini ditemukan protein APOE yang memiliki nilai keanggotaan yang tinggi terhadap cluster protein yaitu 0.7 namun, protein ini belum pernah dilaporkan memiliki hubungan dengan penyakit DM Tipe 2. Pada cluster-cluster penyakit, semakin tinggi nilai keanggotaan suatu penyakit pada suatu cluster, semakin kecil peluang penyakit tersebut menjadi anggota pada cluster lain. Penyakit-penyakit yang ditemukan memiliki hubungan dengan penyakit DM Tipe 2 cenderung hanya menjadi anggota pada satu cluster saja dengan nilai keanggotaan yang tinggi. Sementara itu, nilai keterhubungan antara cluster protein dan cluster penyakit menunjukkan bahwa semakin rendah nilai keterhubungannya semakin kuat hubungan antara anggota cluster tersebut dengan DM Tipe 2, baik cluster protein maupun cluster penyakit. Hal ini juga berlaku untuk penyakit-penyakit yang memiliki nilai keanggotaan yang rendah pada clusternya seperti penyakit Fatty Liver, Heart Failure, Vascular Diseases Obesity, Heart Diseases, Coronary Artery Disease, dan Stroke yang memiliki nilai keanggotaan yang kecil pada cluster penyakit. Sementara itu, semakin tinggi nilai keterhubungannya semakin rendah hubungan antara anggota cluster dengan DM Tipe 2, baik cluster protein maupun cluster penyakit. Protein yang memiliki nilai keanggotaan terkecil pada Tabel 4 tidak ditemukan adanya penyakit yang memiliki hubungan dengan DM Tipe 2. Hal ini dapat dilihat pada protein INS yang merupakan protein yang terdapat pada lebih dari satu cluster protein (overlap) tidak ditemukan adanya penyakit yang memiliki hubungan dengan DM Tipe 2 ketika berada pada cluster protein 17 yang merupakan cluster protein dengan nilai keanggotaan protein terkecil yaitu sebesar 0.218, sedangkan ketika berada pada cluster protein 5 yang memiliki nilai keanggotaan
20 protein INS sebesar 0.452, ditemukan penyakit yang memiliki hubungan dengan DM Tipe 2 karena cluster penyakit 11 yang terhubung dengan cluster protein 5 memiliki beberapa anggota penyakit yang memiliki hubungan dengan DM Tipe 2. Berdasarkan hal tersebut, dapat disimpulkan bahwa protein yang termasuk ke dalam cluster protein 3, 5, 6, 7, 10, dan 12 memiliki hubungan dengan DM Tipe 2 jika dilihat dari penyakit yang ditemukan pada masing-masing cluster penyakit yang terhubung dengan cluster protein 3, 5, 6, 7, 10, dan 12 memiliki hubungan dengan DM Tipe 2.
SIMPULAN DAN SARAN Simpulan 1 2
3
4
5
Pada penelitian ini dapat disimpulkan bahwa: Algoritme fuzzy k-partite dapat diterapkan pada clustering data interaksi protein dan penyakit. Cluster Penyakit yang dihasilkan pada penelitian ini memiliki hubungan dengan DM Tipe 2 berdasarkan protein yang dihasilkan dari penelitian sebelumnya (Yahya 2016). Semakin tinggi nilai keanggotaan protein pada suatu cluster protein menyebabkan protein tersebut memiliki peluang yang besar untuk menjadi anggota pada cluster protein tersebut dan memiliki peluang yang kecil untuk menjadi anggota pada cluster protein lain. Pada penyakit-penyakit yang memiliki hubungan dengan DM Tipe 2, semakin tinggi nilai keanggotaannya pada cluster penyakit maka penyakit tersebut merupakan penyakit yang serumpun dengan Diabetes Mellitus tetapi semakin kecil nilai keanggotaannya pada cluster penyakit, maka penyakit tersebut tidak serumpun dengan Diabetes Mellitus tetapi memiliki hubungan dengan DM Tipe 2 karena dapat terjadi dikarenakan komplikasi dari DM Tipe 2 (FARMALKES 2005). Nilai keterhubungan antar cluster yang rendah menunjukkan adanya hubungan yang kuat antara anggota cluster tersebut dengan DM Tipe 2 sedangkan nilai keterhubungan antar cluster yang tinggi tidak menunjukkan adanya hubungan antara anggota cluster tersebut dengan DM Tipe 2. Saran
Saran untuk penelitian selanjutnya adalah melakukan validasi pada data penyakit yang merupakan anggota pada cluster penyakit yang memiliki hubungan dengan DM Tipe 2 menggunakan Disease Ontology analisis, sehingga dapat menemukan penyakit yang relevan dengan DM Tipe 2 pada setiap cluster penyakit tersebut berdasarkan analisis statistik dari basis data Disease Ontology (DO).
21
DAFTAR PUSTAKA Associacion American Diabetes. 2004. Diagnosis and Classification of Diabetes Mellitus [Internet]. [diunduh 2016 September 22]; Tersedia pada: http://care.diabesjournals.org/content/diacare/27/suppl_1/s5.full.pdf. Bahtt Harikrashna B, Smithcorresponding. Robert J. 2015. Fatty liver disease in diabetes mellitus. Hepatobiliary Surgery And Nutrition [Internet]. [diunduh 2017 Februari 2]; 4(2):101-108. Tersedia pada: https://www.ncbi.nlm.nih.gov/pms/article/PMC4405411/. Bordonaro M. 2009. Role of wnt signaling in the development of type 2 diabetes. Cell & Bioscience [Internet]. [diunduh 2017 Januari 10]; 80:563-581. Tersedia pada: https://www.ncbi. nlm.nih.gov. Dongen, Stijn Van. 2008. Graph Clustering via a Discrete Uncoupling Process. Society for Industrial and Applied Mathematics [Internet]. [diunduh 2016 September 30]; 30 (1):121–141.Tersedia pada: http://epubs.siam.org/doi/abs/10.1137/040608635. [FARMALKES] Kefarmasian dan Alat Kesehatan. 2005. Pharmaceutical Care untuk Penyakit Diabetes Mellitus [Internet]. [diunduh 2016 Desember 22]; Tersedia pada: http://binfar.kemkes.go.id/?wpdmact=process&did=MTc2LmhvdGxpbms=. Han JJ, Bertin N, Hao T, Goldberg DS, Berriz GF, Zhang LV, Dupuy D, Walhout AJM, Cusick ME, Roth FP et al. 2004. Evidence for dynamically organized modularity in the yeast protein-protein interaction network. Nature [Internet]. [diunduh 2016 Desember 20]; 430:88-93. Tersedia pada: http://www. nature.com/nature/journal/v430/n6995/full/nature02555.html. Hartsperger ML, Florian F, St¨umpflen V, Theis FJ. 2010. Structuring heterogeneous biological information using fuzzy clustering of k-partite graphs. BMC Bioinformatics. 11(522):2-13. DOI:10.1186/1471-2105-11-522. Liu W, Wu A, Pellegrini M, WangX. 2 5. “Integrative analysis of human protein, function and disease networks. Scientific Report. 5(14344):1. DOI:10.1038/ srep 14344. Naito, Ryo, Kasai, Takatoshi. 2015. Coronary artery disease in type 2 diabetes mellitus: Recent treatment strategies and future perspectives. World Journal of Cardiology [Internet]. 7(3):119–124. [diunduh 2017 Desember 02]; Tersedia pada: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4365308/. National Stroke Association. 2013. Diabetes and Stroke [Internet]. [diunduh 2016 Dember 19]; Tersedia pada: http://www.stroke.org/sites/default/files/resources/DiabetesBrochure.pdf Sun, Kai, Goncalves, Joana P, Larminie, Chris, Przulj, Natasa. 2014. Predicting Disease Associations via Biological Network Analysis. BioMed Central [Internet]. 10(7):677–688. [diunduh 2016 September 06 ]; Tersedia pada: http://www.ijbs.com/v10p0677.pdf Usman MS. 2016. Identifikasi Protein-Protein Signifikan yang Berasosiasi Dengan Diabetes Mellitus (DM) Tipe 2 Menggunakan Analisis Topologi Jejaring Protein-Protein Interaction [thesis]. Bogor(ID): Institut Pertanian Bogor. Yang, Lei, Zhao, Xudong, Tang, Xianglong. 2014. Predicting Disease-Related Proteins Based on Clique Backbone in Protein-Protein Interaction Network
22 International Journal of Biological Sciences [Internet]. 10(7):677–688. [diunduh 2016 Desember 10]; Tersedia pada: http://www.ijbs.com/v10p0677.pdf Yahya MN. 2016. Analisis Topologi Interaksi Protein-Protein untuk Mengiden tifikasi Protein Signifikan yang Terkait dengan Diabetes Mellitus [skripsi]. Bogor(ID): Institut Pertanian Bogor. [WHO] World Health Organization. 2010. Global Status Report on Noncommunicable Diseases [Internet]. Laporan
23 Lampiran 1 Daftar protein yang berasosiasi langsung dengan DM Tipe 2 Protein ABCC8 ACE AKT2 APPL1 AQP2 AVP AVPR2 BLK CAPN10 CCR5 CDKAL1 CEL CTLA4 DNAJC3 ENPP1 EPO FOXC2 FOXP3 GCGR GCK GLIS3 GPD2 HFE HMGA1 HNF1A HNF1B HNF4A IAPP IDDM1* IDDM11* IDDM13* IDDM15* IDDM17* IDDM18* IDDM19* IDDM21* IDDM23* IDDM24* IDDM3* IDDM4* IDDM6* IDDM7* IDDM8*
Gene Locus Name ATP-binding cassette, subfamily C, member 8 (sulfonylurea receptor) Angiotensin I converting enzyme (dipeptidyl carboxypeptidase-1) Murine thymoma viral (v-akt) homolog-2 Adaptor protein containing PH domain, PTB domain, and leucine zipper motif Aquaporin-2 (collecting duct) Arginine vasopressin (neurophysin II, antidiuretic hormone) Arginine vasopressin receptor-2 BLK nonreceptor tyrosine kinase Calpain-10 Chemokine (C-C) receptor 5 CDK5 regulatory subunit-associated protein 1-like 1 Carboxyl-ester lipase (bile-salt stimulated lipase) Cytotoxic T-lymphocyte- associated serine esterase-4 DnaJ, E. coli, homolog of, subfamily C Ectonucleotide pyrophosphatase/phosphodiesterase 1 Erythropoietin Forkhead box C2 Forkhead box P3 (scurfin) Glucagon receptor Glucokinase (hexokinase-4) GLIS family zinc finger protein 3 Glycerol-3- phosphate dehydrogenase 2 (mitochondrial) Hemochromatosis gene High-mobility group AT-hook 1 HNF1 homeobox B HNF1 homeobox B (transcription factor 2) Hepatocyte nuclear factor 4, alpha (transcription factor-14) Islet amyloid polypeptide (diabetes-associated peptide; amylin) Insulin-dependent diabetes mellitus-1 Insulin-dependent diabetes mellitus-11 Insulin-dependent diabetes mellitus-13 Insulin-dependent diabetes mellitus-15 Insulin-dependent diabetes mellitus-17 Insulin-dependent diabetes mellitus-18 Diabetes mellitus, insulin-dependent, 19 Diabetes mellitus, insulin-dependent, 21 Diabetes mellitus, insulin-dependent, 23 Diabetes mellitus, insulin-dependent, 24 Insulin-dependent diabetes mellitus-3 Insulin-dependent diabetes mellitus-4 Insulin-dependent diabetes mellitus-6 Insulin-dependent diabetes mellitus-7 Insulin-dependent diabetes mellitus-8
24 Lampiran 1 Lanjutan Protein Gene Locus Name IDDMX* Diabetes mellitus, insulin-dependent, X-linked, susceptibility to IER3IP1 Immediate-early response 3-interacting protein 1 IGF2BP2 Insulin-like growth factor 2 mRNA-binding protein 2 IL1RN Interleukin-1 receptor antagonist IL2RA Interleukin-2 receptor, alpha IL6 Interleukin-6 (interferon, beta-2) INS Insulin INSR Insulin receptor IRS1 Insulin receptor substrate-1 IRS2 Insulin receptor substrate 2 ITPR3 Inositol 1,4,5-triphosphate receptor, type 3 KCNJ11 Potassium inwardly-rectifying channel, subfamily J, member 11 KLF11 Kruppel-like factor 11 LIPC Lipase, hepatic MAPK8IP1 Mitogen-activated protein kinase 8-interacting protein 1 MTNR1B Melatonin receptor 1B NEUROD1 Neurogenic differentiation 1 NIDDM2* Diabetes mellitus, noninsulin-dependent, 2 NIDDM3* Noninsulin-dependent diabetes mellitus 3 NIDDM4* Diabetes mellitus, noninsulin-dependent, 4 OAS1 2,5-oligoadenylate synthetase-1 PAX4 Paired box homeotic gene-4 PBCA* Pancreatic beta cell, agenesis of PDX1 Pancreas/duodenum homeobox protein 1 PLAGL1 Pleomorphic adenoma gene-like 1 (ZAC tumor suppressor) PON1 Paraoxonase-1 PPARG Peroxisome proliferator activated receptor, gamma PTPN22 Protein tyrosine phosphatase, nonreceptor-type 22 RETN Resistin RRAD Ras-related associated with diabetes SLC2A2 Solute carrier family 2 (facilitated glucose transporter), member 2 SLC30A8 Solute carrier family 30 (zinc transporter), member 8 SOD2 Superoxide dismutase-2, mitochondrial SPINK1 Serine protease inhibitor, Kazal type I (pancreatic secretory trypsin inhibitor) SUMO4 Small ubiquitin-like modifier 4 TBC1D4 TPC1 domain family, member 4 TCF7L2 Transcription factor 7-like 2 UCP3 Uncoupling protein-3 VEGFA Vascular endothelial growth factor WFS1 Wolframin ZFP57 Zinc finger protein 57, mouse, homolog of *Protein yang tidak memiliki data interaksi antar protein pada basis data STRING
25 Lampiran 2 Hasil clustering menggunakan algoritme MCL No
Hasil cluster
Modularity score
1
0.214
2
0.059
3
0.047
4
0.045
5
0.032
6
0.025
7
0.026
8
0.028
9
0.013
10
0.023
11
0.015
12
0.018
13
0.015
14
0.024
15
0.025
16
0.009
26 Lampiran 2 Lanjutan No
Hasil clustering
Modularity score
17
0.022
18
0.02
19
0.02
20
0.009
21
0.008
22
0.008
23
0.012
24
0.009
25
0.006
26
0.007
27
0.01
28
0.006
29
0.004
30
0.007
31
0.01
32
0.003
33
0.001
27
Lampiran 3 Nilai derajat keanggotaan dari setiap protein pada cluster protein Protein ADM ALB APOA1 APOA2 APOE ATIC BTC C10ORF10 CALCA CALCR CCK CCND1 CLU EPO EPOR FOXA2 FOXO1 FOXO3 GCG GCGR GCK GCKR GHRH
1 0.000 0.000 0.027 0.000 0.012 0.000 0.000 0.000 0.002 0.000 0.015 0.000 0.000 0.001 0.000 0.000 0.000 0.003 0.012 0.000 0.000 0.000 0.000
2 0.154 0.041 0.014 0.000 0.046 0.000 0.000 0.000 0.004 0.000 0.000 0.000 0.000 0.040 0.088 0.700 0.000 0.008 0.000 0.000 0.029 0.000 0.000
3 0.006 0.001 0.033 0.000 0.004 0.000 0.000 0.034 0.001 0.000 0.000 0.004 0.005 0.000 0.022 0.000 0.000 0.002 0.001 0.000 0.000 0.000 0.000
4 0.000 0.000 0.010 0.054 0.706 0.000 0.000 0.000 0.000 0.000 0.001 0.000 0.005 0.008 0.003 0.000 0.000 0.001 0.007 0.000 0.000 0.000 0.000
5 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.340 0.000 0.000 0.000 0.021 0.000 0.004 0.200 0.057 0.000 0.052 0.040 0.021 0.828 0.264 0.000
6 0.561 0.120 0.000 0.000 0.000 0.000 0.000 0.075 0.000 0.000 0.000 0.000 0.000 0.029 0.000 0.075 0.000 0.000 0.000 0.000 0.001 0.000 0.000
7 0.098 0.000 0.005 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.652 0.000 0.000 0.006 0.000 0.000 0.000 0.790 0.036 0.970 0.138 0.705 0.000
8 0.002 0.057 0.013 0.000 0.045 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.011 0.001 0.003 0.000 0.062 0.000 0.000 0.000 0.000 0.000 1.000
Cluster Protein 9 10 11 0.003 0.003 0.000 0.026 0.002 0.197 0.000 0.192 0.112 0.000 0.000 0.000 0.012 0.086 0.024 0.000 0.000 0.000 0.000 1.000 0.000 0.000 0.019 0.000 0.000 0.015 0.002 0.000 0.000 0.000 0.010 0.000 0.000 0.002 0.091 0.015 0.003 0.000 0.000 0.727 0.117 0.001 0.054 0.477 0.000 0.000 0.018 0.000 0.000 0.938 0.000 0.000 0.084 0.028 0.016 0.000 0.003 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
12 0.000 0.004 0.002 0.000 0.019 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.004 0.002 0.000 0.151 0.000 0.004 0.789 0.008 0.001 0.023 0.000
13 0.002 0.250 0.012 0.016 0.023 0.009 0.000 0.000 0.000 0.000 0.001 0.000 0.004 0.008 0.000 0.000 0.000 0.000 0.010 0.000 0.000 0.000 0.000
14 0.000 0.000 0.015 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.861 0.000 0.000 0.019 0.000 0.000 0.015 0.004 0.000 0.000 0.000 0.000
15 0.000 0.049 0.410 0.000 0.004 0.034 0.000 0.000 0.026 0.314 0.000 0.000 0.014 0.030 0.000 0.000 0.000 0.001 0.000 0.000 0.000 0.000 0.000
16 0.000 0.000 0.035 0.000 0.017 0.000 0.000 0.000 0.001 0.000 0.034 0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
17 0.169 0.231 0.114 0.930 0.001 0.000 0.000 0.000 0.930 0.152 0.287 0.000 0.034 0.016 0.000 0.000 0.000 0.000 0.082 0.000 0.000 0.003 0.000
18 0.002 0.001 0.006 0.000 0.000 0.000 0.000 0.000 0.005 0.000 0.000 0.004 0.009 0.009 0.081 0.000 0.000 0.013 0.000 0.000 0.003 0.004 0.000
19 0.000 0.023 0.000 0.000 0.001 0.957 0.000 0.533 0.014 0.534 0.001 0.000 0.911 0.000 0.052 0.000 0.000 0.000 0.001 0.000 0.000 0.000 0.000
28
Lampiran 3 Lanjutan Protein GLP1R GNAS GPI GRB14 HCRT HNF1A HNF4A HSPG2 IAPP IGF1 IGF1R IGFBP1 IL4 INS INSR IRS1 IRS2 ISL1 JAK2 LEP LPA MAP3K1 MTOR
1 0.031 0.919 0.000 0.000 0.024 0.000 0.000 0.000 0.000 0.007 0.000 0.000 0.000 0.005 0.000 0.008 0.003 0.000 0.000 0.014 0.000 0.000 0.005
2 0.000 0.006 0.000 0.003 0.000 0.033 0.000 0.000 0.001 0.661 0.019 0.000 0.003 0.022 0.024 0.000 0.000 1.000 0.052 0.036 0.000 0.000 0.000
3 0.000 0.004 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.003 0.000 0.000 0.000 0.003 0.002 0.013 0.007 0.000 0.000 0.001 0.001 0.000 0.004
4 0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.002 0.000 0.000 0.000 0.003 0.000 0.006 0.000 0.000 0.000 0.018 0.042 0.000 0.014
5 0.000 0.000 0.954 0.052 0.000 0.000 0.830 0.000 0.138 0.038 0.001 0.002 0.000 0.452 0.040 0.072 0.196 0.000 0.018 0.004 0.000 0.736 0.000
6 0.001 0.037 0.000 0.000 0.961 0.000 0.000 0.000 0.010 0.001 0.002 0.000 0.000 0.114 0.276 0.010 0.006 0.000 0.010 0.012 0.000 0.000 0.044
7 0.000 0.009 0.000 0.758 0.000 0.153 0.082 0.000 0.822 0.000 0.000 0.000 0.001 0.034 0.237 0.611 0.655 0.000 0.000 0.711 0.000 0.000 0.040
8 0.000 0.000 0.000 0.000 0.000 0.031 0.000 0.000 0.000 0.005 0.000 0.000 0.000 0.033 0.000 0.004 0.005 0.000 0.000 0.022 0.000 0.000 0.041
Cluster Protein 9 10 11 0.007 0.220 0.639 0.000 0.000 0.006 0.030 0.000 0.000 0.000 0.171 0.000 0.014 0.000 0.000 0.000 0.000 0.000 0.000 0.087 0.000 0.000 0.000 0.000 0.003 0.000 0.002 0.003 0.027 0.050 0.000 0.024 0.000 0.000 0.025 0.000 0.000 0.000 0.000 0.003 0.000 0.006 0.000 0.000 0.002 0.000 0.016 0.040 0.000 0.000 0.045 0.000 0.000 0.000 0.007 0.874 0.000 0.002 0.052 0.001 0.014 0.869 0.000 0.000 0.125 0.000 0.001 0.000 0.000
12 0.000 0.018 0.000 0.014 0.000 0.751 0.001 0.000 0.000 0.010 0.899 0.000 0.000 0.102 0.408 0.113 0.030 0.000 0.000 0.032 0.000 0.039 0.037
13 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.000 0.004 0.000 0.002 0.000 0.000 0.000 0.001 0.068 0.000 0.003
14 0.098 0.000 0.009 0.000 0.000 0.000 0.000 0.000 0.000 0.003 0.006 0.001 0.000 0.000 0.000 0.026 0.000 0.000 0.000 0.005 0.000 0.040 0.041
15 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.007 0.000 0.000 0.995 0.000 0.000 0.000 0.000 0.000 0.000 0.031 0.006 0.000 0.010
16 0.004 0.000 0.000 0.000 0.000 0.033 0.000 0.000 0.000 0.000 0.007 0.000 0.000 0.000 0.000 0.012 0.022 0.000 0.000 0.000 0.000 0.000 0.758
17 0.000 0.001 0.000 0.000 0.000 0.000 0.000 0.917 0.000 0.019 0.000 0.000 0.000 0.218 0.000 0.001 0.000 0.000 0.016 0.001 0.000 0.000 0.002
18 0.000 0.000 0.000 0.002 0.000 0.000 0.000 0.083 0.023 0.010 0.000 0.000 0.001 0.000 0.012 0.012 0.031 0.000 0.000 0.000 0.000 0.000 0.000
19 0.000 0.000 0.007 0.000 0.000 0.000 0.000 0.000 0.000 0.154 0.043 0.971 0.000 0.003 0.000 0.054 0.000 0.000 0.024 0.058 0.000 0.060 0.000
29
Lampiran 3 Lanjutan Protein
1 NEUROD1 0.000 NEUROG3 0.000 NR3C1 0.000 PAX4 0.000 PAX6 0.005 PDX1 0.000 PGM1 0.000 PIK3CA 0.000 PIK3R1 0.026 PON1 0.000 PPARA 0.006 PPARG 0.003 PTH 0.000 PTPN1 0.013 PTPN11 0.001 RETN 0.009 RPS6KB1 0.007 SERPINE1 0.007 SHC1 0.000 SLC2A2 0.000 SLC2A5 0.000 SLC5A1 0.000 SMARCA4 0.000
2 0.000 0.000 0.000 0.079 0.000 0.000 0.466 0.000 0.011 0.000 0.020 0.000 0.000 0.622 0.000 0.017 0.000 0.001 0.059 0.000 0.000 0.000 0.000
3 0.000 0.000 0.000 0.000 0.000 0.011 0.000 0.002 0.000 0.000 0.007 0.612 0.001 0.001 0.000 0.000 0.000 0.001 0.000 0.002 0.000 0.000 0.000
4 0.000 0.000 0.008 0.000 0.000 0.000 0.000 0.002 0.000 0.042 0.013 0.029 0.000 0.000 0.000 0.000 0.006 0.000 0.000 0.000 0.000 0.000 0.000
5 0.078 0.000 0.000 0.000 0.013 0.100 0.000 0.009 0.000 0.000 0.086 0.008 0.000 0.080 0.000 0.000 0.000 0.000 0.000 0.196 0.737 0.000 0.000
6 0.000 0.000 0.887 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.010 0.000 0.002 0.000 0.001 0.025 0.002 0.000 0.000 0.000 0.000 0.000
7 0.847 0.000 0.000 0.614 0.007 0.838 0.000 0.032 0.001 0.000 0.132 0.054 0.000 0.280 0.000 0.799 0.000 0.004 0.000 0.738 0.000 0.000 0.000
8 0.000 0.000 0.000 0.000 0.002 0.034 0.000 0.051 0.000 0.001 0.000 0.018 0.000 0.000 0.000 0.001 0.000 0.006 0.000 0.008 0.000 0.000 0.000
Cluster Protein 9 10 11 0.000 0.000 0.056 0.000 0.000 0.000 0.000 0.002 0.000 0.010 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.425 0.000 0.000 0.741 0.006 0.000 0.000 0.484 0.000 0.149 0.000 0.006 0.000 0.572 0.002 0.039 0.020 0.022 0.000 0.000 0.000 0.000 0.002 0.000 0.038 0.000 0.004 0.000 0.063 0.000 0.000 0.000 0.003 0.026 0.873 0.000 0.000 0.071 0.000 0.000 0.011 0.000 0.125 0.000 0.000 0.000 0.000 0.000 0.000 0.000
12 0.000 0.000 0.000 0.266 0.001 0.000 0.000 0.033 0.000 0.001 0.010 0.011 0.017 0.000 0.000 0.068 0.000 0.031 0.000 0.009 0.037 1.000 0.000
13 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.791 0.000 0.002 0.000 0.000 0.000 0.037 0.000 0.000 0.032 0.000 0.000 0.000 0.000
14 0.000 0.000 0.000 0.000 0.000 0.000 0.108 0.048 0.158 0.002 0.011 0.021 0.000 0.000 0.016 0.000 0.015 0.000 0.000 0.001 0.040 0.000 0.000
15 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.005 0.000 0.000 0.000 0.000 0.953 0.000 0.000 0.000 0.005 0.002 0.000 0.000 0.000 0.000 0.000
16 0.000 0.000 0.024 0.000 0.000 0.000 0.000 0.068 0.319 0.016 0.000 0.031 0.001 0.000 0.001 0.000 0.160 0.000 0.000 0.020 0.000 0.000 1.000
17 0.000 1.000 0.000 0.000 0.062 0.000 0.000 0.000 0.000 0.000 0.001 0.005 0.000 0.000 0.945 0.000 0.000 0.026 0.000 0.000 0.000 0.000 0.000
18 0.019 0.000 0.000 0.030 0.909 0.017 0.000 0.002 0.000 0.000 0.001 0.033 0.000 0.000 0.000 0.000 0.000 0.019 0.000 0.016 0.000 0.000 0.000
19 0.000 0.000 0.078 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.133 0.101 0.006 0.000 0.000 0.000 0.782 0.000 0.838 0.000 0.061 0.000 0.000
30
Lampiran 3 Lanjutan Protein SOCS1 SREBF2 TSC1 TSC2 UCP1 UCP2 UCP3 VIP
1 0.000 0.023 0.000 0.000 0.032 0.007 0.046 0.005
2 0.116 0.000 0.000 0.000 0.000 0.033 0.050 0.002
3 0.034 0.014 0.000 0.001 0.030 0.000 0.004 0.000
4 0.000 0.000 0.000 0.000 0.009 0.000 0.025 0.002
5 0.006 0.000 0.000 0.000 0.000 0.032 0.000 0.000
6 0.010 0.001 0.000 0.000 0.000 0.000 0.032 0.066
7 0.738 0.225 0.000 0.000 0.000 0.626 0.041 0.000
8 0.000 0.078 0.965 0.936 0.000 0.000 0.000 0.005
Cluster Protein 9 10 11 0.000 0.001 0.000 0.008 0.000 0.500 0.000 0.000 0.000 0.000 0.050 0.000 0.000 0.000 0.154 0.005 0.010 0.242 0.000 0.177 0.207 0.006 0.022 0.000
12 0.000 0.003 0.000 0.000 0.747 0.006 0.179 0.000
13 0.000 0.000 0.000 0.000 0.026 0.001 0.000 0.000
14 0.000 0.007 0.000 0.012 0.000 0.026 0.012 0.000
15 0.081 0.000 0.000 0.000 0.001 0.000 0.000 0.013
16 0.000 0.091 0.034 0.000 0.000 0.001 0.000 0.000
17 0.000 0.000 0.000 0.000 0.000 0.000 0.153 0.868
18 0.000 0.050 0.000 0.001 0.000 0.011 0.000 0.010
19 0.014 0.000 0.000 0.000 0.000 0.000 0.075 0.000
31
Lampiran 4 Cluster penyakit 27 beserta nilai keanggotaan masing-masing penyakit. No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
Penyakit Budd-Chiari Syndrome Heart Valve Diseases Mesenteric Vascular Occlusion Myeloproliferative Disorders Polycythemia Vera Pregnancy Complications Primary Myelofibrosis Thrombocythemia, Essential Thrombocytosis Protoporphyria, Erythropoietic Rhabdomyosarcoma, Alveolar Keratoconus Thromboembolism Polycythemia Megalanecephaly Polymicrogyria-Polydactyly Hydrocephalus Syndrome Adenocarcinoma Of Esophagus Breast-Ovarian Cancer, Familial, Susceptibility To, 1 Carcinoma, Basal Cell Keratosis, Seborrheic Penile Neoplasms Epidermal Nevus Carcinoma, squamous cell of head and neck Hypolipoproteinemias Leukemia, Myeloid, Acute Venous Thrombosis Lymphoma, Large B-Cell, Diffuse
27 Polycythemia, primary familial and congenital 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46
Colitis, Ulcerative Weight Gain Stroke* Adenocarcinoma of lung Malformations of Cortical Development Carcinoma, Adenoid Cystic Calcinosis Sarcoma Growth Disorders Nasopharyngeal carcinoma Hyperplasia Mouth Neoplasms Myocardial Ischemia Prostatic Neoplasms Leukemia Coronary Artery Disease* Inflammation Abortion, Spontaneous Hypercholesterolemia
Nilai Keanggotaan 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.999 0.942 0.933 0.930 0.929 0.928 0.926 0.925 0.924 0.922 0.918 0.736 0.707 0.692 0.598 0.590 0.583 0.553 0.521 0.475 0.470 0.416 0.408 0.408 0.399 0.378 0.365 0.350 0.302 0.288 0.287 0.276 0.274 0.268
32 Lampiran 4 lanjutan No Penyakit 47 Coronary Disease* 48 Colorectal Neoplasms 49 Carcinoma, Renal Cell 50 Lung Neoplasms *Penyakit yang memiliki hubungan dengan DM Tipe 2
Nilai Keanggotaan 0.241 0.233 0.213 0.209
Lampiran 5 Cluster penyakit 28 beserta nilai keanggotaan masing-masing penyakit. No Penyakit 1 Pituitary ACTH Hypersecretion 2 Chronobiology Disorders 3 Lipodystrophy, Familial Partial 4 Thyroid cancer, follicular 5 Glioma 6 Polycystic Kidney, Autosomal Dominant 7 Leukostasis 8 Lymphoma, T-Cell 9 Ischemia 10 Carotid Intimal Medial Thickness 1 11 Metabolic Diseases 12 Reperfusion Injury 13 Lipidoses 14 Colorectal Neoplasms 15 Liver Neoplasms 16 Diabetes Mellitus* 17 Glomerulonephritis 18 Thyroid Neoplasms 19 Acute Lung Injury 20 Pancreatic Neoplasms 21 Dyslipidemias 22 Crohn Disease *Penyakit yang memiliki hubungan dengan DM Tipe 2
Nilai Keanggotaan 0.990 0.967 0.860 0.825 0.814 0.802 0.789 0.770 0.754 0.749 0.591 0.418 0.396 0.372 0.366 0.362 0.350 0.349 0.290 0.280 0.267 0.258
33 Lampiran 6 Cluster penyakit 4 beserta nilai keanggotaan masing-masing penyakit. No Penyakit 1 Fanconi Syndrome 2 Acth-Independent Macronodular Adrenal Hyperplasia 3 Heroin Dependence 4 Mody, Type 6 5 Renal Insufficiency, Chronic 6 Pancreatic Agenesis, Congenital 7 Maturity-Onset Diabetes of the Young, Type 4* 8 Hypogonadism 9 Diabetes, Gestational* 10 Polyuria 11 Hyperphagia 12 Infertility, Female 13 Carcinoma, Non-Small-Cell Lung 14 Oral Ulcer 15 Obesity, Morbid 16 Polydipsia 17 Liver Neoplasms, Experimental 18 Liver Diseases 19 Medulloblastoma 20 Unconsciousness 21 Gastrointestinal Diseases 22 Anorexia 23 Dyskinesia, Drug-Induced 24 Body Mass Index Quantitative Trait Locus 4 25 Stomach Ulcer 26 Diabetes Mellitus, Type 2* 27 Fatty Liver* 28 Precancerous Conditions 29 Hepatitis, Autoimmune 30 Weight Gain 31 Hyperinsulinism 32 Dermatitis, Allergic Contact 33 Diabetes Mellitus, Experimental* 34 Gallstones 35 Nervous System Diseases 36 Hypertriglyceridemia 37 Seizures 38 Non-alcoholic Fatty Liver Disease 39 Pancreatitis 40 Polycystic Ovary Syndrome 41 Reperfusion Injury 42 Hyperkinesis 43 Catalepsy *Penyakit yang memiliki hubungan dengan DM Tipe 2
Nilai Keanggotaan 1.000 1.000 0.994 0.989 0.985 0.980 0.978 0.972 0.970 0.962 0.962 0.961 0.957 0.954 0.954 0.954 0.934 0.877 0.839 0.787 0.777 0.775 0.772 0.668 0.628 0.530 0.414 0.412 0.397 0.395 0.393 0.389 0.380 0.376 0.373 0.335 0.328 0.327 0.319 0.300 0.267 0.237 0.228
34 Lampiran 7 Cluster penyakit 11 beserta nilai keanggotaan masing-masing penyakit. No
Penyakit 1 Hyperinsulinemic hypoglycemia, familial, 3* 2 Maturity-Onset Diabetes of the Young, Type 2* 3 Congenital Hyperinsulinism 4 Mason-Type Diabetes* Hemolytic Anemia, Nonspherocytic, Due To Glucose 5 Phosphate Isomerase Deficiency 6 Maturity-Onset Diabetes of the Young, Type 1* 7 Diabetes Mellitus, Permanent Neonatal* 8 Anemia, Hemolytic 9 Neural Tube Defects 10 Breast Neoplasms 11 Colitis, Ulcerative 12 Neurocognitive Disorders 13 Muscular Diseases 14 Hyperglycemia* 15 Paralysis 16 Hypertriglyceridemia 17 Ventricular Dysfunction, Left *Penyakit yang memiliki hubungan dengan DM Tipe 2
Nilai Keanggotaan 1.000 1.000 1.000 0.999 0.981 0.695 0.690 0.517 0.471 0.456 0.409 0.395 0.371 0.342 0.279 0.231 0.201
35 Lampiran 8 Cluster penyakit 8 beserta nilai keanggotaan masing-masing penyakit. No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
Penyakit Cardiofaciocutaneous syndrome Leopard Syndrome Metachondromatosis Leukemia, Myelomonocytic, Juvenile Enchondromatosis Exostoses, Multiple Hereditary Costello Syndrome Osteochondroma Astrocytoma Diarrhea 4, Malabsorptive, Congenital Erectile Dysfunction Down Syndrome Hypertension, Pulmonary Wounds and Injuries Trigeminal Neuralgia Edema Leukemia Bronchial Hyperreactivity Flushing Acute Lung Injury Neoplasm Metastasis Pulmonary Fibrosis Ventricular Dysfunction, Left Rhinitis Hyperalgesia Migraine without Aura Carcinoma, Squamous Cell Inflammation
Nilai Keanggotaan 0.921 0.892 0.884 0.761 0.720 0.714 0.706 0.701 0.696 0.685 0.647 0.579 0.482 0.434 0.401 0.385 0.347 0.340 0.339 0.320 0.298 0.282 0.262 0.254 0.251 0.250 0.229 0.224
36 Lampiran 9 Cluster penyakit 38 beserta nilai keanggotaan masing-masing penyakit. No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
Penyakit Osteochondrodysplasias Hypercholesterolemia, Familial Dyssegmental dysplasia Sciatic Neuropathy Migraine Disorders Noonan Syndrome Neurogenic Inflammation Migraine without Aura Bronchial Hyperreactivity Flushing Trigeminal Neuralgia Wounds and Injuries Hypertension, Pulmonary Urinary Bladder Diseases Disease Models, Animal Neuroblastoma Down Syndrome Intellectual Disability Catalepsy Erectile Dysfunction Osteoarthritis Neural Tube Defects Hyperkinesis Craniofacial Abnormalities Edema Diarrhea 4, Malabsorptive, Congenital Astrocytoma Osteochondroma Arthritis, Experimental Costello Syndrome Exostoses, Multiple Hereditary Enchondromatosis Hyperalgesia Leukemia, Myelomonocytic, Juvenile Tachycardia Hypotension Paralysis Hypercalcemia Albuminuria
Nilai Keanggotaan 0.987 0.929 0.892 0.855 0.836 0.835 0.821 0.744 0.655 0.655 0.595 0.563 0.515 0.487 0.484 0.446 0.420 0.364 0.354 0.346 0.333 0.330 0.326 0.325 0.323 0.314 0.301 0.297 0.295 0.292 0.284 0.279 0.249 0.236 0.229 0.228 0.221 0.208 0.202
37 Lampiran 10 Cluster penyakit 5 beserta nilai keanggotaan masing-masing penyakit. No 1 2 3 4 5 6 7 8 9 10 11 12
Penyakit Narcolepsy 1 Cocaine-Related Disorders Psychotic Disorders 46, XX Disorders of Sex Development Lung Diseases, Obstructive Ocular Hypertension Sepsis Bipolar Disorder Hypokalemia Pain Neurodegenerative Diseases Substance Withdrawal Syndrome Diabetes Mellitus, Insulin-Resistant, with 13 Acanthosis Nigricans* 14 Diabetic Neuropathies* 15 Donohue Syndrome 16 Hyperinsulinemic Hypoglycemia, Familial 5* 17 Substance-Related Disorders 18 Endometriosis 19 Schizophrenia 20 Glucose Intolerance* 21 Glomerulonephritis 22 Depressive Disorder 23 Hyperalgesia *Penyakit yang memiliki hubungan dengan DM Tipe 2
Nilai Keanggotaan 0.999 0.988 0.967 0.967 0.967 0.967 0.795 0.726 0.658 0.650 0.546 0.474 0.472 0.472 0.472 0.470 0.469 0.336 0.333 0.318 0.309 0.242 0.217
38 Lampiran 11 Cluster penyakit 16 beserta nilai keanggotaan masing-masing penyakit. No 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Penyakit Glucose-Galactose Malabsorption Hepatic Adenomas, Familial Cardiomyopathy, Dilated Diabetes Mellitus, Insulin-Dependent, 20* Maturity-Onset Diabetes of the Young, Type 3* Respiratory Insufficiency Insulin-Like Growth Factor I, Resistance To Adrenocortical Carcinoma Fetal Growth Retardation Hernias, Diaphragmatic, Congenital Skin Neoplasms Maturity-Onset Diabetes Of The Young, Type 9* Lewy Body Disease Lung Diseases Diabetes Mellitus, Insulin-Resistant, with Acanthosis 15 Nigricans* 16 Donohue Syndrome 17 Diabetic Neuropathies* 18 Diabetes Mellitus, Type 1* 19 Hyperinsulinemic Hypoglycemia, Familial 5* 20 Substance-Related Disorders 21 Parkinson Disease 22 Hypoglycemia* 23 Endometrial Neoplasms 24 Cell Transformation, Neoplastic 25 Hyperinsulinism* 26 Heart Failure* 27 Colonic Neoplasms 28 Glucose Intolerance* 29 Alzheimer Disease 30 Obesity* 31 Heart Diseases* 32 Peripheral Nervous System Diseases 33 Diabetes Mellitus, Type 2* 34 Vascular Diseases* 35 Colitis *Penyakit yang memiliki hubungan dengan DM Tipe 2
Nilai Keanggotaan 0.998 0.994 0.993 0.989 0.961 0.937 0.830 0.822 0.751 0.725 0.719 0.678 0.604 0.558 0.516 0.505 0.504 0.481 0.478 0.469 0.427 0.392 0.383 0.328 0.314 0.295 0.287 0.268 0.247 0.247 0.244 0.219 0.212 0.208 0.206
39 Lampiran 12 Cluster penyakit 39 beserta nilai keanggotaan masing-masing penyakit. No Penyakit 1 Aberrant Crypt Foci 2 Tachycardia, Sinus 3 Coma 4 Hypothermia 5 Spasm 6 Bradycardia 7 Stomach Diseases 8 Endometrial Neoplasms 9 Arthritis, Juvenile 10 Growth Disorders 11 Hyperlipidemias 12 Peripheral Nervous System Diseases 13 Skin Neoplasms 14 Constipation 15 Hypotension 16 Parkinson Disease 17 Fetal Growth Retardation 18 Cell Transformation, Neoplastic 19 Hyperkinesis 20 Poisoning 21 Vascular Diseases* *Penyakit yang memiliki hubungan dengan DM Tipe 2
Nilai Keanggotaan 0.974 0.948 0.873 0.871 0.841 0.807 0.803 0.616 0.481 0.393 0.369 0.342 0.280 0.275 0.269 0.268 0.247 0.221 0.217 0.208 0.204
40
RIWAYAT HIDUP Penulis dilahirkan di Desa Pematang Panjang, Kec. Air Putih, Kab. Batu Bara, Provinsi Sumatra Utara pada tanggal 22 September 1992. Penulis adalah anak pertama dari empat bersaudara, anak dari pasangan Bapak Batara Lumbanraja dan Ibu Risma Sitohang. Penulis menempuh pendidikan Sekolah Dasar di SDN 010221 Air Putih pada tahun 1998 hingga 2004. Kemudian penulis melanjutkan pendidikan Sekolah Menengah Pertama di SMPN 2 Air Putih pada tahun 2004 hingga 2007. Kemudian penulis melanjutkan pendidikan Sekolah Menengah Atas di SMAN 1 Air Putih pada tahun 2007 hingga 2010. Kemudian penulis melanjutkan pendidikan Program Diploma 3 (D3) di Universitas Telkom Fakultas Ilmu Terapan Jurusan Manajemen Informatika pada tahun 2010 hingga 2014. Kemudian penulis melanjutkan pendidikan Program Sarjana Alih Jenis (S1) di Institut Pertanian Bogor Fakultas Matematika dan Ilmu Pengetahuan Alam Departemen Ilmu Komputer.