UNIVERSITAS INDONESIA
KLASIFIKASI TEKANAN DALAM RONGGA KEPALA MENGGUNAKAN SUPPORT VECTOR MACHINES SEQUENTIAL
SKRIPSI
PUTU WIRA ANGRIYASA 0706261846
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM PROGRAM STUDI SARJANA MATEMATIKA DEPOK JULI 2011
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
UNIVERSITAS INDONESIA
KLASIFIKASI TEKANAN DALAM RONGGA KEPALA MENGGUNAKAN SUPPORT VECTOR MACHINES SEQUENTIAL
SKRIPSI Diajukan sebagai salah satu syarat untuk memperoleh gelar sarjana sains
PUTU WIRA ANGRIYASA 0706261846
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM PROGRAM STUDI SARJANA MATEMATIKA DEPOK JULI 2011
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
HALAMAN PERNYATAAN ORISINALITAS
Skripsi ini adalah hasil karya sendiri, dan semua sumber baik yang dikutip maupun dirujuk telah saya nyatakan dengan benar.
Nama
: Putu Wira Angriyasa
NPM
: 0706261846
Tanda Tangan
:
Tanggal
: 5 Juli 2011
iii
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
HALAMAN PENGESAHAN
Skripsi ini diajukan oleh Nama NPM Program Studi Judul Skripsi
: : : :
Putu Wira Angriyasa 0706261846 Sarjana Matematika Klasifikasi Tekanan dalam Rongga Kepala Menggunakan Support Vector Machines Sequential
Telah berhasil dipertahankan di hadapan Dewan Penguji dan diterima sebagai bagian persyaratan yang diperlukan untuk memperoleh gelar Sarjana Sains pada Program Studi S1 Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia
DEWAN PENGUJI
Pembimbing I
: Dr. Zuherman Rustam, DEA.
(
)
Pembimbing II
: dr. Wismaji Sadewo, Sp. BS. K.
(
)
Penguji I
: Dr. Kiki A. Sugeng
(
)
Penguji II
: Bevina D. Handari, Ph.D
(
)
Penguji III
: Dr. rer. nat. Hendri Murfi, M.kom.
(
)
Ditetapkan di Tanggal
: Depok : 6 Juni 2011
iv
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
KATA PENGANTAR
Puji syukur kepada Tuhan atas semua rahmat dan karunia yang telah Beliau berikan sehingga penulis dapat menyelesaikan tugas akhir ini. Bantuan dan dukungan dari berbagai pihak merupakan hal yang tidak terlepaskan dalam penyelesaian tugas akhir ini. Oleh karena itu, pada kesempatan ini penulis ingin mengucapkan terima kasih kepada pihak-pihak yang telah berjasa dalam penulisan tugas akhir ini maupun selama masa perkuliahan. Penulis mengucapkan terima kasih kepada: 1. Dr. Zuherman Rustam, DEA. selaku pembimbing I dan dr. Wismaji Sadewo, Sp. BS. K. selaku pembimbing II yang telah meluangkan waktu, pikiran, dan memberikan motivasi untuk penulis dalam menyelesaikan tugas akhir ini; 2. Yudi Satria, MT. selaku ketua departemen, Rahmi Rusin, S.Si, M.Sc.Tech selaku sekretaris departemen, dan Dr. Dian Lestari selaku koordinator pendidikan yang telah membantu proses penyelesaian tugas akhir ini; 3. Dra. Ida Fithriani, M.Si selaku pembimbing akademis; 4. Seluruh staf pengajar di Matematika UI atas ilmu pengetahuan serta nilai-nilai kemanusiaan yang telah diajarkan; 5. Seluruh karyawan di departemen Matematika UI atas bantuan dan motivasi yang telah diberikan; 6. Kedua orang tua dan adik-adikku yang senantiasa memberikan doa dan nasihat; 7. Eka Kusuma Artha, Fredy Lay, Mitha, Rani, dan Ade yang telah memberikan pelajaran tentang arti sahabat. Kepada seluruh pihak yang tidak dapat disebutkan secara keseluruhan, penulis ucapkan terima kasih. Penulis mohon maaf jika terdapat kesalahan atau kekurangan dalam penyelesaian skripsi ini, semoga bermanfaat bagi banyak pihak.
Penulis 2011 v
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI TUGAS AKHIR UNTUK KEPENTINGAN AKADEMIS
Sebagai sivitas akademik Universitas Indonesia, saya yang bertanda tangan di bawah ini: Nama NPM Program Studi Departemen Fakultas Jenis karya
: : : : : :
Putu Wira Angriyasa 0706261846 Sarjana Matematika Matematika Matematika dan Ilmu Pengetahuan Alam Skripsi
demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Indonesia Hak Bebas Royalti Noneksklusif (Non-exclusive Royalty Free Right) atas karya ilmiah saya yang berjudul : Klasifikasi Tekanan dalam Rongga Kepala Menggunakan Support Vector Machines Sequential beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Noneksklusif ini Universitas Indonesia berhak menyimpan, mengalihmedia/format-kan, mengelola dalam bentuk pangkalan data (database), merawat, dan memublikasikan tugas akhir saya selama tetap mencantumkan nama saya sebagai penulis/pencipta dan sebagai pemilik Hak Cipta. Demikian pernyataan ini saya buat dengan sebenarnya.
Dibuat di : Depok Pada tanggal : 5 Juli 2011 Yang menyatakan
(Putu Wira Angriyasa)
vi
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
ABSTRAK
Nama : Putu Wira Angriyasa Program Studi : Matematika Judul : Klasifikasi Tekanan dalam Rongga Kepala Menggunakan Support Vector Machines Sequential Metode standar dalam mendapatkan informasi mengenai kondisi tekanan dalam rongga kepala atau tekanan intrakranial (TIK) seseorang adalah dengan melakukan pengukuran secara langsung menggunakan alat ICP monitoring. Untuk menggunakan alat tersebut, perlu dilakukan pembedahan pada kepala pasien. Selain membutuhkan biaya yang relatif mahal, dalam beberapa kasus, pembedahan pada kepala memiliki tingkat risiko yang tinggi. Untuk mengatasi hal tersebut, dalam skripsi ini dijelaskan metode alternatif untuk mendapatkan kondisi TIK secara tidak langsung dengan memanfaatkan konsentrasi Superoksida Dismutase (SOD), Katalase, Nikotinamida Adenin Dinukleotida Fosfat (NADPH), dan Malondialdehid (MDA) sebagai penanda stress oksidatif. Dengan menggunakan data-data tersebut, TIK akan diklasifikasikan dalam kondisi normal, rendah, atau tinggi. Untuk tujuan klasifikasi, digunakan metode Support Vector Machines Sequential dan keakuratannya dibandingkan dengan metode Fuzzy C Means. Kata Kunci xi + 63 halaman Daftar Pustaka
: Tekanan Intrakranial, Support Vector Machines, stress oksidatif ; 24 gambar; 20 tabel : 22(1993-2010)
vii
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
ABSTRACT
Name : Putu Wira Angriyasa Study Program : Mathematics Title : Intracranial Pressure Classification Using Support Vector Machines Sequential The standard method for getting information about Intracranial Pressure (ICP) is invasive measurement using ICP monitoring. For using that tool, perforation of cranial scalp of patient was needed. In addition to the expensive cost, in some case, this perforation has high risk. For handling this problem, the alternative method for getting ICP condition was explained in this skripsi, using the level of Superoxide Dismutase (SOD), Catalase (CAT), Nicotinamide Adenine Dinucleotide Phosphate (NADPH), and Malondialdehyde (MDA) such as oxidative stress indicators. Using these indicators, ICP would be classified in normal, low, and high condition. For classification purpose, Support Vector Machines Sequential was used as a classification method and the accuracy was compared with Fuzzy C-Means method. Keywords : intracranial pressure, support vector machines, oxidative stress xi+ 63 pages ; 24 pictures; 20 tables Bibliography : 22 (1993-2010)
viii
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
DAFTAR ISI
HALAMAN JUDUL .............................................................................................. ii HALAMAN PERNYATAAN ORISINALITAS .................................................. iii HALAMAN PENGESAHAN ............................................................................... iv KATA PENGANTAR ............................................................................................ v HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI ............................. vi ABSTRAK ............................................................................................................ vii DAFTAR ISI .......................................................................................................... ix DAFTAR GAMBAR .............................................................................................. x DAFTAR TABEL .................................................................................................. xi BAB 1 PENDAHULUAN ..................................................................................... 1 1. 1 Latar Belakang ............................................................................................ 1 1. 2 Perumusan Masalah dan Ruang Lingkup .................................................... 4 1. 3 Jenis Penelitian dan Metode yang Digunakan ............................................. 4 1. 4 Tujuan Penelitian......................................................................................... 5 BAB 2 LANDASAN TEORI ................................................................................ 6 2. 1 Tekanan Intrakranial ................................................................................... 6 2. 2 Hipoksia ...................................................................................................... 9 2. 3 Senyawa Penanda Stres Oksidatif ............................................................. 10 2. 4 Fuzzy C-Means .......................................................................................... 12 2. 5 Definisi dan Teorema untuk SVM Sequential .......................................... 17 BAB 3 SUPPORT VECTOR MACHINES....................................................... 19 3. 1 Klasifikasi Dua Kelas ................................................................................ 19 3. 2 Kernel ........................................................................................................ 27 3. 3 Klasifikasi Multikelas ............................................................................... 32 BAB 4 PEMBAHASAN ...................................................................................... 33 4. 1 Langkah Percobaan ................................................................................... 34 4. 2 Persiapan Pengolahan Data, Training, dan Testing ................................... 35 4. 3 Pemilihan Pengali Lagrange Awal ( .................................................... 38 4. 4 Penggunaan Kernel Gaussian .................................................................... 42 4. 5 Penggunaan Kernel Polinomial ................................................................. 43 4. 6 Penggunaan Kernel Sigmoid ..................................................................... 46 4. 7 Klasifikasi Multikelas dengan Multikernel ............................................... 49 4. 8 Percobaan Menggunakan Salah Satu Sumber Data Atribut ...................... 54 4. 8. 1 Percobaan Menggunakan Data Atribut dari Cairan Otak .................. 54 4. 8. 2 Percobaan Menggunakan Data Atribut dari Darah ........................... 55 4. 9 Perbandingan Keakuratan SVM dan Fuzzy C-Means untuk Data TIK ..... 57 BAB 5 KESIMPULAN ....................................................................................... 60 DAFTAR PUSTAKA .......................................................................................... 62 LAMPIRAN ......................................................................................................... 64 ix Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
DAFTAR GAMBAR
Gambar 2. 1 Gambar 2. 2 Gambar 2. 3 Gambar 2. 4 Gambar 3. 1 Gambar 3. 2 Gambar 4. 1 Gambar 4. 2 Gambar 4. 3 Gambar 4. 4 Gambar 4. 5 Gambar 4. 6 Gambar 4. 7 Gambar 4. 8 Gambar 4. 9 Gambar 4. 10 Gambar 4. 11 Gambar 4. 12 Gambar 4. 13 Gambar 4. 14 Gambar 4. 15 Gambar 4. 16 Gambar 4. 17 Gambar 4. 18
Kepala dan ruang intrakranial ........................................................ 6 Macam-macam tipe pemasangan alat pengukur TIK .................... 8 Flowchart Fuzzy C Means model Jung ........................................ 15 Flowchart Fuzzy C Means Modifikasi ......................................... 16 Kemungkinan bidang pemisah pada data di ruang dimensi 2...... 19 Ilustrasi bidang pemisah dan margin di ruang dimensi dua ......... 22 Bagan hubungan TIK terhadap senyawa-senyawa penanda stress oksidatif ............................................................... 33 Grafik keakuratan hasil training untuk data Iris........................... 38 Grafik keakuratan hasil testing untuk data Iris ............................ 39 Grafik keakuratan hasil training untuk data BCWD .................... 39 Grafik keakuratan hasil testing untuk base BCWD ..................... 39 Grafik keakuratan hasil training untuk data Segmentation .......... 40 Grafik keakuratan hasil testing untuk data Segmentation ............ 40 Grafik keakuratan hasil training untuk data Wine ....................... 40 Grafik keakuratan hasil testing untuk data Wine ......................... 41 Grafik keakuratan hasil training untuk data BCWD menggunakan kernel Polinomial.................................................. 43 Grafik keakuratan hasil testing untuk data BCWD menggunakan kernel Polinomial.................................................. 44 Grafik keakuratan hasil training untuk data Wine menggunakan kernel Polinomial.................................................. 44 Grafik keakuratan hasil testing untuk data Wine menggunakan kernel Polinomial.................................................. 44 Grafik keakuratan hasil training untuk data TIK menggunakan kernel Polinomial.................................................. 45 Grafik keakuratan hasil testing untuk data TIK menggunakan kernel Polinomial ......................................................................... 45 Gambar fungsi yang digunakan pada kernel Sigmoid ................. 47 Grafik keakuratan hasil training untuk data TIK menggunakan kernel sigmoid ...................................................... 48 Grafik keakuratan hasil testing untuk data TIK menggunakan kernel sigmoid .............................................................................. 48
x
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
DAFTAR TABEL
Tabel 4. 1 Tabel 4. 2 Tabel 4. 3 Tabel 4. 4 Tabel 4. 5 Tabel 4. 6 Tabel 4. 7 Tabel 4. 8 Tabel 4. 9 Tabel 4. 10 Tabel 4. 11 Tabel 4. 12 Tabel 4. 13 Tabel 4. 14 Tabel 4. 15 Tabel 4. 16 Tabel 4. 17 Tabel 4. 19 Tabel 4. 20
Data-data dari UCI Machine Learning Repository .......................... 37 Hasil percobaan dengan tiga buah nilai parameter kernel Gaussian 42 Perbandingan keakuratan klasifikasi antara data Iris, BCWD, Segmentation, Wine, dan TIK menggunakan kernel Gaussian ...... 43 Perbandingan keakuratan klasifikasi antara data Iris, BCWD, Segmentation, Wine, dan TIK menggunakan kernel Polinomial ... 46 Hasil percobaan untuk data Wine, Iris dan BCWD menggunakan kernel sigmoid ................................................................................. 46 Hasil percobaan tiga nilai parameter kernel Sigmoid ...................... 47 Perbandingan keakuratan klasifikasi antara data Iris, BCWD, Segmentation, Wine, dan TIK menggunakan kernel Sigmoid ....... 49 Hasil percobaan menggunakan data dari darah dan cairan otak ...... 51 Perbandingan hasil pelabelan 14 sampel training pada kelompok A dan B menggunakan data dari cairan otak dan darah ...................... 52 Perbandingan hasil pelabelan 11 sampel testing pada kelompok A dan B menggunakan data dari dairan otak dan darah ...................... 52 Perbandingan hasil pelabelan 14 sampel training menggunakan data dari dairan otak dan darah................................................................ 53 Perbandingan hasil pelabelan 11 sampel testing menggunakan data dari dairan otak dan darah................................................................ 53 Perbandingan hasil pelabelan 14 sampel training menggunakan data dari cairan otak ................................................................................ 54 Perbandingan hasil pelabelan 11 sampel testing menggunakan data dari cairan otak ................................................................................ 55 Hasil percobaan menggunakan data atribut dari darah .................... 55 Perbandingan hasil pelabelan 14 sampel training menggunakan data dari darah ......................................................................................... 56 Perbandingan hasil pelabelan 11 sampel testing menggunakan data dari darah ......................................................................................... 57 Hasil keakuratan klasifikasi data TIK dengan Fuzzy C-Means ....... 58 Perbandingan keakuratan Metode SVM dengan Fuzzy C-Means .. 58
xi
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
BAB 1 PENDAHULUAN
1. 1 Latar Belakang Dalam tubuh manusia, otak merupakan organ yang memiliki tingkat kebutuhan terhadap oksigen paling tinggi. Kebutuhan oksigen pada otak mencapai 20% dari keseluruhan kebutuhan oksigen tubuh (Dingyu dkk., 2009). Oleh karena itu, darah yang menjadi distributor oksigen dalam tubuh, harus dapat mengalir ke otak dengan lancar guna memenuhi kebutuhan ini. Salah satu faktor internal di kepala yang mempengaruhi lancar atau tidaknya aliran darah ke otak adalah tekanan dalam rongga kepala atau yang selanjutnya disebut Tekanan Intrakranial (TIK). TIK adalah suatu tekanan di dalam rongga tengkorak (kranium/kranial). TIK seseorang pada kondisi normal berbeda-beda tergantung pada usia. Jika TIK seseorang berada di atas kisaran normalnya, maka ia harus segera mendapatkan penanganan medis. Peningkatan TIK mengakibatkan aliran darah ke otak menjadi terhambat, sehingga kebutuhan otak yang sangat tinggi terhadap oksigen tidak dapat terpenuhi. Di sisi lain, sel-sel otak sangat sensitif terhadap kondisi kekurangan oksigen. Sel-sel tersebut dapat mati dalam waktu kurang dari 5 menit jika tidak mendapat asupan oksigen. Jika terhambatnya aliran darah ini terjadi dalam jangka waktu panjang, kondisi ini dapat berakhir pada kematian. Penanganan medis pada peningkatan TIK serupa dengan penanganan medis pada penderita tekanan darah tinggi (hipertensi), yaitu pasien terlebih dahulu diketahui tekanannya melalui pengukuran. Perbedaannya, pengukuran pada hipertensi relatif jauh lebih mudah dari pada pegukuran TIK. Untuk mengukur TIK, seorang pasien harus menjalani operasi kepala. Melalui operasi, dibuat lubang kecil pada kepala pasien sebagai tempat pemasangan alat pengukur TIK. Pengukuran TIK umumnya dilakukan secara kontinu menggunakan suatu alat khusus, sehingga pasien yang menjalaninya harus dirawat di Intensive Care Unit (ICU) guna menjaga kesterilan daerah 1
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
2
lubang tempat pengukuran. Ketika pengukuran memperlihatkan hasil yang tinggi, akan dilakukan penanganan seperti pengeluaran cairan serebrospinal. Jika pengukuran memperlihatkan hasil yang rendah (tetap di atas normal), maka pasien hanya diberikan obat. Gambaran keadaan TIK menentukan jenis penanganan yang harus dilakukan. Namun, dengan prosedur yang dijelaskan sebelumnya, diperlukan biaya yang relatif sangat mahal untuk menentukan keadaan TIK. Karena alasan tersebut, banyak kasus yang berkaitan dengan tingginya tekanan intrakranial ditangani tanpa dilakukan pengukuran terlebih dahulu (Sadewo, 2011). Sehingga penanganan seperti pemberian dosis obat kemungkinan besar tidak sesuai dengan yang kebutuhan pasien. Untuk mengatasi sulitnya pengukuran ini dari segi biaya dan fasilitas, dirancang alternatif lain dalam pengukuran TIK yaitu dengan melakukan pengukuran sesaat terhadap TIK menggunakan manometer pada pasien yang menjalani operasi kepala. Selain itu, dari tubuh pasien diambil sampel darah, sampel otak dan sampel cairan otak. Dari masing-masing sampel diukur kadar Superoksida Dismutase (SOD), Katalase, Nikotinamida Adenin Dinukleotida Fosfat (NADPH), dan Malondialdehid (MDA) (Sadewo, 2011). Senyawasenyawa ini dipertimbangkan karena keterkaitannya dengan peningkatan TIK. Dengan asumsi bahwa senyawa-senyawa yang dikeluarkan di kepala akan diedarkan ke seluruh tubuh melalui darah, maka pengambilan senyawa-senyawa nantinya cukup dilakukan pada sampel darah atau ditambah dari sampel cairan otak. Kadar senyawa-senyawa yang didapat dari darah atau cairan otak akan digunakan untuk memberikan gambaran keadaan TIK pasien. Biaya untuk mengukur kadar senyawa-senyawa tersebut jauh relatif lebih murah dan untuk pengambilan sampelnya tidak memerlukan operasi. Dari hasil pengolahan data SOD, Katalase, NADPH dan MDA dalam darah atau cairan otak, diharapkan dapat memberikan suatu gambaran TIK yang normal, rendah, atau tinggi tanpa harus menjalani operasi kepala. Dengan kata lain, biaya yang dikeluarkan dapat jauh relatif lebih murah, dan pasien tetap bisa mendapatkan penanganan yang sesuai dengan kondisi TIK-nya. Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
3
Masalah mendapatkan gambaran kategori TIK yang normal, rendah, atau tinggi merupakan suatu masalah klasifikasi. Untuk menyelesaikan masalah ini, digunakan bantuan komputer dengan menggunakan algoritma klasifikasi. Algoritma klasifikasi yang akan digunakan termasuk ke dalam ruang lingkup mesin pembelajaran (Machine Learning). Mesin pembelajaran sendiri merupakan salah satu cabang dari Komputasi Intelejensi. Mesin pembelajaran adalah suatu pemrograman komputer yang mengoptimalkan penggunaan data-data pengalaman untuk mengolah data-data yang akan datang. Ada berbagai metode dalam mesin pembelajaran antara lain Naïve Bayes, Decision Tree, dan Support Vector Machines (SVM). Di antara metode-metode tersebut, SVM merupakan suatu algoritma yang paling baru dalam mesin pembelajaran (Tejada & Juan, 2007). SVM melakukan klasifikasi pada data yang telah ditransformasikan ke ruang dengan dimensi lebih tinggi. Di ruang tersebut, SVM mencari bidang yang dapat memisahkan data secara optimal. Masalah mencari bidang pemisah (separating hyperplane) dalam SVM merupakan masalah pemrograman kuadratik. SVM pun dimodifikasi untuk digunakan dalam masalah klasifikasi multikelas. Beberapa teknik yang dikenal untuk membuat SVM dapat diaplikasikan pada data multikelas antara lain One-Against-One, One-Against-All, dan Directed Acyclic Graph SVM (Liu, dkk, 2007). Penelitian yang terkait SVM sekaligus terkait TIK telah dilakukan Chacón dkk (2010). Dalam penelitian tersebut, SVM digunakan untuk memprediksi nilai TIK dengan memanfaatkan data Arterial Blood Pressure (ABP) dan data Cerebral Blood Flow Velocity (CBFV). Dengan kata lain, TIK diukur secara tidak langsung menggunakan kedua data itu. Akan tetapi, alat yang digunakan untuk mengukur ABP dan CBFV sendiri tidaklah sederhana, sehingga tetap membutuhkan biaya yang besar. Prediksi dengan cara tersebut hanya ditujukan pada beberapa kasus penyakit dimana pengukuran langsung TIK memiliki risiko yang tinggi. Berbeda dengan penelitian yang dilakukan Chacón dkk, dalam penelitian ini, SVM akan digunakan untuk mengklasifikasikan TIK dengan memanfaatkan data kadar senyawa SOD, Katalase, NADPH, dan MDA yang berasal dari darah atau cairan otak. Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
4
Penelitian medis yang menggunakan metode klasifikasi selain SVM telah dilakukan Fikri dkk (2010) yaitu dengan menggunakan Fuzzy C-Means. Fuzzy CMeans merupakan salah metode klasifikasi multikelas. Dasar dari metode ini adalah mencari pusat-pusat data (centroid), dimana data-data nantinya diklasifikasikan berdasarkan jarak terdekat terhadap centroid-centroid tersebut. Pada tahap akhir dari penelitian ini, akan dibandingkan keakuratan SVM dengan keakuratan Fuzzy C-Means dalam mengklasifikasikan TIK.
1. 2 Perumusan Masalah dan Ruang Lingkup SVM memiliki beberapa parameter yang dapat diubah untuk mendapatkan keakuratan klasifikasi. Terkait dengan data yang digunakan dalam penelitian ini, terdapat dua sumber data kadar senyawa SOD, Katalase, NADPH, dan MDA, yaitu dari cairan otak dan darah, yang belum diketahui penggunaan salah satu sumber atau keduanya mampu mempengaruhi proses klasifikasi. Oleh karena itu, masalah dalam penelitian ini adalah: a)
Sumber data dari manakah yang memberikan hasil klasifikasi terbaik, apakah dari darah saja, dari cairan otak saja atau gabungan dari keduanya?
b)
Bagaimana tingkat keberhasilan SVM dalam mengkalsifikasikan TIK? Data diambil dari pasien-pasien yang menjalani operasi kepala. Kondisi
pasien telah disiapkan sedemikian sehingga tidak terpapar pada kondisi lain selain peningkatan TIK yang mampu mempengaruhi kadar SOD, Katalase, NADPH, dan MDA. Sedangkan metode yang akan dijadikan pembanding keakuratan SVM dalam mengklasifikasikan data TIK adalah metode klasifikasi menggunakan metode Fuzzy C-Means.
1. 3 Jenis Penelitian dan Metode yang Digunakan Metode yang digunakan dalam penelitian ini adalah eksperimental.
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
5
1. 4 Tujuan Penelitian
Tujuan dalam penelitian ini adalah mencari parameter SVM yang sesuai guna melakukan klasifikasi TIK ke dalam kondisi normal, rendah, atau tinggi. Penelitian ini juga akan membandingkan hasil klasifikasi menggunakan data kadar senyawa SOD, Katalase, NADPH, dan MDA yang berasal dari darah, dari cairan otak, dan gabungan keduanya. Selain itu, penelitian ini bertujuan melihat tingkat keberhasilan SVM dalam mengkalsifikasikan TIK dengan cara membandingkan keakuratan klasifikasinya dengan keakuratan klasifikasi menggunakan metode klasifikasi Fuzzy C-Means.
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
BAB 2 LANDASAN TEORI
Pada bab ini akan dijelaskan teori-teori mengenai tekanan intrakranial, hipoksia, stres oksidatif, dan senyawa-senyawa yang berkaitan dengan stres oksidatif. Selain itu, akan dijelaskan juga metode Fuzzy C-Means yang akan dijadikan metode pembanding terhadap metode SVM Sequential. Dalam bab ini juga diberikan definisi serta teorema yang akan digunakan pada SVM Sequential.
2. 1 Tekanan Intrakranial
Ruang di dalam tengkorak manusia tidak hanya diisi oleh otak, tetapi juga diisi oleh cairan otak (cairan serebrospinal) dan darah. Dengan memandang ruang ini sebagai suatu ruang tertutup, maka total dari volume dari jaringan otak, cairan serebrospinal, dan darah merupakan volume (V) dari rongga tengkorak (kranium/kranial). Doktrin Monro Kellie mengatakan bahwa: Vtotal intrakranial =Vcairan otak + Vdarah+ Vjaringan otak Ruang Intrakranial
Gambar 2. 1 Kepala dan ruang intrakranial
Dalam sistem tertutup ini, masing-masing materi memberikan sumbangan tekanan, yang kemudian disebut tekanan dalam rongga kepala atau dikenal 6
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
7
dengan Tekanan Intrakranial/TIK (intracranial presure /ICP). Tekanan ini umumnya meningkat sebagai dampak dari trauma otak (Traumatic Brain Injury/TBI). Hal-hal lain yang dapat mengakibatkan peningkatan TIK antara lain: tumor, struk, dan hidrosepalus (Little, 2008). Tumor mengakibatkan pertambahan materi yang tidak normal pada salah dari tiga bagian yang mengisi ruang intrakranial. Perubahan ini pada akhirnya mendesak bagian yang lain dalam ruang sehingga menimbulkan peningkatan tekanan. Kecelakaan atau benturan di bagian kepala yang membuat tengkorak mengalami perubahan bentuk juga dapat mengakibatkan peningkatan TIK. Usia seseorang juga menentukan kisaran normal TIK. Batas normal TIK pada bayi adalah sekitar 15 mm Hg, pada anak-anak dibawah 8 tahun adalah 18 mm Hg, dan pada anak-anak di atas 8 tahun serta orang dewasa adalah 20 mm Hg (Steiner & Andrews, 2006). Pada bayi di bawah usia 6 bulan, ubun-ubun belum tertutup rapat, dan tengkorak belum cukup keras. Terjadinya peningkatan intrakranial pada usia ini dapat dikompensasi dengan perubahan struktur kepala. Pada individu di atas usia 6 bulan, ubun-ubun telah tertutup dan tengkorang sudah mengeras. Karena rongga tengkorak bersifat kaku, dan massa otak tidak dapat berubah secara spontan, maka ketika terjadi peningkatan tekanan di dalam sistem di kepala, bagian yang paling mungkin untuk segera beradaptasi adalah pembuluh darah. Pembuluh darah di daerah otak akan menyempit sehingga volume darah yang mengalir berkurang, dan pada akhirnya terdapat ruang yang akan mengkompensasi terjadinya peningkatan TIK. Dengan adanya sistem autoregulasi dalam tubuh ini, diharapkan TIK dapat terjaga dalam kondisi normal. Little (2008) menjelaskan terdapat dua tingkatan dalam penanganan TIK. Penanganan tingkat pertama berupa penempatan posisi kepala pada ketinggian tertentu, pemberian obat penenang (sedation) dan obat penahan rasa sakit (analgecia), terapi hyperosmolar menggunakan mannitol atau hypertonic saline, dan pengaturan asam arang atau dikenal dengan PaCO2 dalam kisaran 30-35 mm Hg (mild hyperventilation) untuk meningkatkan pasokan darah ke otak. Jika penanganan tingkat pertama tidak memberikan perubahan atau tidak memberikan pengaruh terhadap TIK, maka dilakukan penanganan tingkat kedua. Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
8
Penanganan tingkat kedua ini berupa pengeluaran cairan otak (cerebrospinal fluid/CSF) melalui operasi kepala. Penangnan tingkat kedua lainnya adalah berupa pemberian obat tidur dosis tinggi (high-dose barbiturates), penghilangan sebagian kecil tulang kepala untuk memberikan ruang kepada jaringan otak (decompressive craniectomy), dan penanganan dengan menghibernasi sementara sel-sel otak (hypotermia). Selama penanganan medis terhadap peningkatan TIK atau pasca operasi kepala, diperlukan informasi tentang keadaan TIK. Oleh karena itu, salah satu cara yang umum dilakukan untuk mengetahui keadaan TIK adalah dengan melakukan pengukuran langsung menggunakan alat ICP monitoring. Jenis dan pemasangan alat (catheter) yang hubungkan ke kepala berbeda-beda berdasarkan tingkat trandusernya, antara lain ventriculostomy, Intra parenchimal Catheter, Subdural Catheter, dan Subdural Bolt (Ross dan Eynon, 2005). Intra parenchimal Catheter
Subdural Catheter Ventriculostom y
Subdural Bolt
Gambar 2. 2 Macam-macam tipe pemasangan alat pengukur TIK Peningkatan TIK mengakibatkan terganggunya sistem metabolisme yang berlangsung di dalam ruang intrakranial. Salah satu dampak yang timbul akibat peningkatan tekanan ini adalah pasien mengalami hipoksia.
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
9
2. 2 Hipoksia
Hipoksia adalah suatu kondisi kurangnya oksigen yang diterima jaringan tubuh. Hipoksia dapat terjadi di suatu bagian atau seluruh tubuh. Luasnya daerah yang mengalami hipoksia tergantung pada penyebab hipoksia itu sendiri. Banyak hal yang dapat menyebabkan terjadinya hipoksia, bahkan orang dalam kondisi tubuh yang normal pun dapat mengalami hipoksia. Penyebab terjadinya hipoksia dapat berasal dari lingkungan di luar tubuh, dari mekanisme dalam tubuh, ataupun dari darah sebagai pembawa oksigen. Penyebab yang berasal dari lingkungan di luar misalnya ketika tubuh berada di daerah yang sangat tinggi, seperti pada para pendaki gunung atau pada saat seseorang melakukan penerbangan pesawat tempur. Pada keadaan tersebut, lapisan udara cukup tipis sehingga kadar oksigen di udara pun sedikit. Keadaan ini secara langsung berpengaruh terhadap jumlah oksigen yang akan didapatkan oleh tubuh. Apabila kondisi hipoksia masih dapat diterima oleh tubuh, tubuh manusia dapat terlatih melalui perubahan-perubahan tingkat molekular sebagai respon adaptasi untuk bertahan dalam keadaan kandungan oksigen di udara relatif sedikit. Penyebab lain hipoksia yang berasal dari kondisi luar terjadi pada penyelam-penyelam yang menggunakan menggunakan tabung oksigen. Kekurangan oksigen dapat terjadi karena jumlah oksigen dalam tabung yang terus berkurang dan sistem tabung tersebut adalah sistem tertutup. Penyelam terus menerus membutuhkan oksigen, sampai pada akhirnya kandungan oksigen yang tersisa tidak cukup memenuhi kebutuhan. Faktor yang berasal dari luar tubuh berupa gas karbon monoksida (CO) juga dapat memicu hipoksia. Gas ini berasal dari asap kendaraan akibat pembakaran yang tidak sempurna. Gas karbon monoksida sangat berbahaya bagi tubuh. Hal ini dikarenakan hemoglobin (Hb) sebagai zat dalam darah yang mengikat oksigen lebih mudah mengikat karbon monoksida dibandingkan dengan mengikat oksigen. Karena jumlah hemoglobin dalam darah juga terbatas, maka hemoglobin yang mengakut oksigen akan berkurang. Akibatnya, meskipun darah mengalir dengan lancar ke seluruh tubuh, darah ini tidak lagi membawa oksigen yang cukup bagi jaringan-jaringan yang dilewatinya. Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
10
Jaringan-jaringan pada tubuh hanya dapat memperoleh oksigen dari darah. Terjadinya ketidaklancaran suplai darah ke suatu bagian tubuh juga dapat mengakibatkan terjadinya hipoksia pada bagian tubuh tersebut. Kondisi peningkatan TIK yang dikompensasi dengan penyempitan pembuluh darah mengakibatkan terjadinya hipoksia pada jaringan otak. Adapun gejala-gejala fisik luar yang teramati pada orang yang mengalami hipoksia antara lain pusing-pusing atau bahkan pingsan. Jika hipoksia terjadi diluar batas kemampuan tubuh untuk bertahan, hipoksia dapat mengakibatkan kematian. Sedangkan hipoksia yang masih dapat ditoleransi oleh tubuh dan berlangsung dalam kurun waktu yang lama dapat membuat perubahan di tingkat gen sehingga tubuh akhirnya terbiasa dengan kondisi oksigen yang rendah dan tidak mengalami hipoksia. Terjadinya hipoksia mempengaruhi keseimbangan senyawa-senyawa yang terdapat di dalam tubuh. Beberapa senyawa khusus terlibat dalam keadaan ini, terutama senyawa yang berfungsi untuk menghilangkan senyawa yang berbahaya bagi tubuh.
2. 3 Senyawa Penanda Stres Oksidatif
Tubuh dapat melakukan segala aktifitasnya karena adanya energi. Energi pada tubuh manusia sebagian besar diperoleh dari proses respirasi seluler yang melibatkan proses reduksi O2 menjadi H2O. Selain menghasilkan energi, proses ini menghasilkan produk pertengahan yang berbahaya bagi tubuh. Produk pertengahan dari respirasi seluler ini berupa oksidan kuat. Oksidan-oksidan, yang dikenal dengan nama spesies oksigen reaktif (ROS), mencakup senyawa-senyawa antara lain: Superoksida (O2-), Hidrogen Peroksida (H2O2), Radikal Peroksil (ROO.), dan Radikal Hidroksil (OH.) (Robert K. Murray, 2006). O2-, ROO. , dan OH. juga merupakan senyawa-senyawa yang tergolong radikal bebas karena memiliki elektron yang tidak berpasangan. Senyawa yang memiliki elektron tak-berpasangan cenderung tidak stabil. Untuk membuat dirinya stabil, senyawa-senyawa itu bereaksi dengan senyawa-senyawa yang diperlukan tubuh seperti protein, asam nukleat, dan lipid. Akibatnya, susunan Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
11
molekul senyawa yang diperlukan tubuh tersebut mengalami perubahan struktur sehingga tidak bisa dimanfaatkan lagi. Untuk mengatasi adanya oksidan-oksidan tersebut, tubuh memiliki mekanisme pertahanan sendiri. Bentuk dari mekanisme pertahanan ini adalah diproduksinya senyawa-senyawa yang dapat menetralisasi ROS. Senyawasenyawa itu antara lain: Superoksida Dismutase (SOD), Katalase, dan NADPH. Tubuh menghasilkan SOD untuk melindungi sel-sel tubuh dari efek superoksida (O2-). Secara sederhana, reaksi ini dapat ditulis sebagai berikut: O2- + O2- + 2H+
→
H2O2 + O2
Dari reaksi itu, terlihat adanya produk hidrogen peroksida (H2O2). Senyawa ini merupakan senyawa yang beracun. Untuk itu, oleh tubuh H2O2 kemudian diuraikan menjadi air dan oksigen yang dibantu dengan Katalase (CAT). Reaksi tersebut dapat ditulis sebagai berikut: H2O2
→
2H2O + O2
Selain Katalase, enzim yang berperan membersihkan H2O2 adalah Glutation Peroksidase (GPx). 2GSH + H2O2
→
GSSG
+
2H2O
Tapi untuk melakukan reaksi itu diperlukan GSH. Produksi senyawa ini bergantung pada ketersediaan NADPH. Reaksi pembentukan GSH dibantu enzim glutation reduktase (GR). Ilustrasi dari reaksi itu adalah sebagai berikut: GSSG + NADPH + H+ →
2GSH
+
NADP+
GSH sendiri sebenarnya dihasilkan dari GSSG. Shen (2007) dan Banjeglav (2009) menggunakan SOD, CAT, dan GPx sebagai penanda keadaan ROS. Banjeglav juga menambahkan GR sebagai penanda. Dari reaksi itu, NADPH juga dapat dijadikan penanda, karena senyawa itu terlibat dalam reaksi. Ketika terjadi gangguan pada tubuh, seperti hipoksia, metabolisme dalam tubuh menjadi tidak sempurna. Metabolisme tubuh yang tidak sempurna ini, mengakibatkan peningkatkan produsi produk-produk pertengahan. Hipoksia yang dialami pasien di daerah kepala mengakibatkan terjadinya peroksidasi lipid (Dingyu dkk, 2009). Reaksi ini merupakan reaksi berantai yang menghasilkan radikal bebas secara terus menerus (Robert K. Murray, 2006). Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
12
Peningkatkan produsi produk pertengahan berupa ROS ataupun radikal bebas, membuat ketidakseimbangan antara senyawa-senyawa tersebut dengan senyawa pengeliminasinya. Kondisi ketidakseimbangan ini dikenal dengan kondisi stres oksidatif. Produk hasil stres oksidatif lainnya adalah Malondialdehid (MDA). Senyawa yang mempunyai rumus kimia CH2(CHO)2 merupakan hasil utama peroksidasi lipid. Senyawa ini mampu bereaksi dengan senyawa yang ada di DNA sehingga struktur dari DNA itu mengalami perubahan. Dingyu (2009) dan Qiang (2010) menggunakan SOD dan MDA sebagai penanda stres oksidatif. Dalam penelitian ini, senyawa yang akan digunakan sebagai penanda stres oksidatif adalah SOD, Katalase, NADPH, dan MDA. Konsentrasi dari keempat jenis senyawa itu akan digunakan sebagai data atribut (feature) pada klasifikasi menggunakan Support Vector Machines Sequential (SVM Sequential). Untuk melihat tingkat keberhasilan SVM Sequential mengolah data TIK, maka keakuratan klasifikasi dengan metode ini akan dibandingkan dengan tingkat keakuratan klasifikasi dengan metode Fuzzy CMeans.
2. 4 Fuzzy C-Means
Fuzzy C-Means (FCM) adalah suatu algoritma untuk pengelompokan yang pertama kali diperkenalkan oleh Dunn tahun 1973 dan dikembangkan oleh Bezdek tahun 1981. Misalkan diberikan himpunan data data
, dengan masing-masing
dapat direpresentasikan sebagai vektor baris di ruang dimensi m atau dapat [
ditulis
]. Nilai
adalah banyak data, dan nilai m
bergantung banyaknya data atribut (feature) dari data yang dimiliki. Data-data itu akan dikelompokan menjadi kelompok. Pengelompokan tersebut didasarkan pada jarak antara data terhadap pusat data dari suatu kelompok. Suatu data akan dimasukkan ke dalam kelompok yang jarak pusat datanya paling dekat dengan data
. Pusat data dari masing-masing kelompok tersebut akan dicari
dalam algoritma FCM. Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
13
Untuk mencari pusat-pusat data tersebut (
), algoritma FCM
bekerja dengan meminimalkan fungsi berukut: ∑∑ dengan kendala ∑ Keterangan: : tingkat keanggotaan data ke- pada kelompok ke: jarak Euclidean antara pusat ‖
terhadap data
atau dapat ditulis
‖
: derajat ke fuzzy-an Untuk mencari pusat data-data itu dengan meminimumkan fungsi tujuan, Jang dkk (1997) memberikan algoritma FCM. Algoritma yang diberikan Jang telah dimplementasikan pada Matlab R2009a dengan nama fungsinya adalah “fcm”. Algoritma tersebut bekerja dengan langkah-langkah berikut: Langkah 1:
Menentukan matriks membership elemennya
secara random, dengan
memiliki nilai dengan interval 0 sampai dengan 1
sedemikian sehingga memenuhi persamaan ∑
Langkah 2: Menghitung buah pusat data (fuzzy cluster center)
,
,
dengan menggunakan persamaan: ∑ ∑ Langkah 3: Menghitung fungsi tujuan: ∑∑
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
14
Langkah 4: Mengitung nilai perubahan
dengan nilai pada iterasi
sebelumnya. Jika nilainya lebih kecil dari nilai toleransi ( ) maka iterasi berhenti. Jika tidak, jarak Euclidean antara pusat data
(
‖
) diperbaharui persamaan
matriks membership
‖. Kemudian
diperbaharui dengan persamaan: ⁄
∑
(
)
Sebagai catatan, perhitungan nilai perubahan iterasi kedua (
terhadap
mulai dilakukan pada
).
Modifikasi dari algoritma ini adalah menghilangkan perhitungan fungsi tujuan sehingga langkah-langkahnya menjadi: Langkah 1: Menentukan
buah pusat data awal (fuzzy cluster center) dengan cara
mencari rata-rata data pada masing-masing kelompok. ̅ , Langkah 2: Menghitung jarak Euclidean antara pusat ‖
terhadap data ‖
Langkah 3: Menghitung element-element matriks
yang dengan rumus ⁄
∑(
)
Langkah 4: Memperbahuri pusat data. ∑ ∑ Langkah 5: Membandingkan perubahan pusat data. Jika perubahan lebih kecil dari toleransi ( ), maka iterasi berhenti. Jika tidak, maka kembali ke langkah 2.
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
15
Menentukan matriks membership 𝑈 secara random
𝑡
Menentukan derajat keFuzzy-an 𝑤
Memasukkan Data 𝒙 𝒙 𝒙𝑁
𝑡
Menghitung pusat data 𝒄 𝑤 ∑𝑁 𝑢𝑖𝑗 𝒙𝑗 𝑗 𝑤 ∑𝑁 𝑢𝑖𝑗 𝑗
𝑐𝑖
𝑡+
Mengperbaharui matriks 𝑈 𝑐
𝑑𝑖𝑗 ∑( ) 𝑑𝑘𝑗
𝑢𝑖𝑗
⁄𝑤
𝑘
Menghitung fungsi tujuan 𝑐
𝐽𝑡
𝑁
𝑤 ∑ ∑ 𝑢𝑖𝑗 𝑑𝑖𝑗 𝑖
𝑗
𝐽
|𝐽𝑡
Memperbaharui nilai-nilai 𝑑𝑖𝑗
𝑑𝑖𝑗
𝐽𝑡 |
‖𝒄𝑖
𝒙𝑗 ‖
𝐽>𝜀
𝐽≤𝜀
STOP Gambar 2. 3 Flowchart Fuzzy C Means model Jung Keterangan: : Nilai fungsi tujuan pada iterasi keIterasi dilakukan minimal sebanyak 2 kali untuk mendapatkan
|
|
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
16
Menentukan pusat data awal (𝒄𝒊 ) untuk setiap 𝑖
𝑡
Menentukan derajat keFuzzy-an 𝑤
Menginput data 𝒙 𝒙 𝒙𝑁
Menghitung matriks membership 𝑈 𝑐
𝑢𝑖𝑗
𝑑𝑖𝑗 ∑( ) 𝑑𝑘𝑗
⁄𝑤
𝑡
𝑡+
𝑘
Memperbaharui pusat data 𝒄𝒊 untuk setiap 𝑖
Memperbaharui nilai-nilai 𝑑𝑖𝑗
𝑑𝑖𝑗
𝑤 ∑𝑁 𝑢𝑖𝑗 𝒙𝑗 𝑗 𝑤 𝑁 ∑𝑗 𝑢𝑖𝑗
𝒄𝒊 𝑡
‖𝒄𝑖
𝒙𝑗 ‖
𝑐𝒊 > 𝜀 untuk setiap 𝑖 𝑐𝒊
𝒄𝑖 𝑡
𝒄𝑖 𝑡
𝑐𝑖 ≤ 𝜀 untuk setiap 𝑖 STOP Gambar 2. 4 Flowchart Fuzzy C Means Modifikasi Keterangan: 𝒄𝒊 𝑡 : nilai vektor 𝒄𝒊 pada iterasi ke 𝑡
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
17
2. 5 Definisi dan Teorema untuk SVM Sequential
Berikut adalah definisi dan teorema yang akan digunakan dalam Support Vector Machines Sequential. Teorema 2. 5. 1 (Purcell, dkk, 2003): Suatu fungsi ,dengan
adalah suatu fungsi kontinu pada selang I, >
dikatakan monoton naik pada I jika turunan pertamanya
untuk semua
nilai x dalam I, dan monoton turun pada I jika turunan pertamanya
.
Definisi 2. 5. 1 (Purcell, dkk, 2003): Misalkan
suatu fungsi yang memetakan suatu titik dari himpunan .
adalah nilai maksimum lokal
jika terdapat selang
adalah nilai maksimum
sedemikian sehingga
adalah nilai minimum lokal sedemikian sehingga
yang memuat
pada
. Sebaliknya,
jika terdapat selang
adalah nilai minimum
yang memuat
pada
.
Definisi 2. 5. 2 (Purcell, dkk, 2003): Misalkan
suatu fungsi yang memetakan suatu titik dari himpunan .
adalah nilai maksimum global . Sebaliknya, ≤
berlaku
jika untuk setiap
adalah nilai minimum global
, berlaku jika untuk setiap
,
.
Definisi 2. 5. 3 (Bazara, dkk, 1993, hal 34): di ruang Rn dikatakan konveks jika
Suatu himpunan +
maka
juga ada di
dan
ada di ,
.
Definisi 2. 5. 4 (Bazara, dkk, 1993, hal. 79): Misalkan , dengan
adalah suatu fungsi yang memetakan titik-titik dari himpunan
adalah himpunan konveks, maka
dikatakan fungsi konveks jika
memenuhi +
≤
+
dan dikatakan fungsi konkaf jika memenuhi + untuk setiap
dan untuk setiap
+ . Jika
konveks maka
konkaf. Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
18
Definisi 2. 5. 5 (Bazara, dkk, 1993, hal. 91): Suatu matriks simetri D ukuran n x n, dikatakan semidefinit positif jika untuk suatu vektor baris n x 1 , D D
, dan semidefinit negatif jika
≤ .
Definisi 2. 5. 6 (Bazara, dkk, 1993, hal 168): Misalkan diberikan permasalahan meminimumkan fungsi kendala
≤ , untuk
dan
, untuk
dengan , maka
bentuk dari fungsi pengali Lagrange dari masalah itu adalah: +∑
+∑
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
BAB 3 SUPPORT VECTOR MACHINES
Support Vector Machines (SVM) merupakan suatu algoritma yang tergolong dalam mesin pembelajaran (machine learning). Dasar dari algoritma ini dikembangkan oleh Vladimir Vapnik (Vapnik, V., 1995). Bagian terpenting dari algoritma ini adalah mencari suatu bidang yang dapat memisahkan data dengan jarak pemisah optimal. Dengan adanya satu bidang ini, tergambarkan bahwa SVM merupakan algoritma klasifikasi dua kelas. Akan tetapi, permasalahan dalam dunia nyata seringkali melibatkan masalah-masalah yang multikelas. Untuk itu, SVM pun dimodifikasi sedemikian sehingga mampu digunakan dalam masalahmasalah klasifikasi multikelas. 3. 1 Klasifikasi Dua Kelas
Misalkan diberikan himpunan data dengan
[
,
] adalah vektor baris di ruang dimensi m, dan
adalah nilai target dari kelas. Nilai
adalah banyak data, dan nilai m
bergantung banyaknya data atribut (feature) dari data yang dimiliki. Dengan asumsi data dapat dipisahkan secara linear (linearly separable case), SVM akan memisahkan data-data dengan sebuah bidang pemisah (separating hyperplane) + dengan
,
(3.1)
adalah suatu vektor bobot berupa vektor kolom dan
suatu skalar.
Akan tetapi akan ada banyak kemungkinan bidang pemisah, bergantung nilai
dan , seperti yang terlihat dari ilusrasi berikut untuk m = 2 : 𝑥
𝑥 Gambar 3. 1 Kemungkinan bidang pemisah pada data di ruang dimensi 2 19
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
20
Bidang pemisah atau separating hyperplane tersebut akan memisahkan data menjadi dua kelas yaitu kelas positif dan kelas negatif dengan ketentuan: + +
untuk ≤
,
untuk
(3.2) ,
(3.3)
yang dapat diformulasikan menjadi + Misalkan bidang H1 :
+
, untuk
.
(3.4)
adalah bidang yang melalui titik
terdekat ke bidang pemisah serta memenuhi kendala (3.2) dan bidang H2 : +
adalah bidang yang melalui titik terdekat ke bidang pemisah
yang memenuhi kendala (3.3). Bidang H1 dan H2 (supporting hyperplanes) sejajar terhadap bidang pemisah. Misalkan d+ (d-) adalah jarak terdekat data positif (negatif) dengan pusat (0) dan didefinisikan margin sebagai jarak antara H1 dan H2. Jarak terdekat suatu titik di bidang H1 terhadap pusat dapat dihitung dengan meminimalkan
+
dengan memperhatikan kendala
.
Dengan menggunakan bentuk fungsi Lagrange dan turunan parsialnya diperoleh: +
Dengan mensubstitusi
+
ke dalam bidang H1 :
+
diperoleh:
+
Sehingga dengan mensubstitusikan kembali λ pada
diperoleh:
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
21
Maka jarak H1 ke pusat adalah:
√
√
‖ ‖
‖ ‖
Untuk mencari jarak terdekat suatu titik di bidang H2 terhadap titik pusat dapat dihitung dengan meminimalkan +
≤
dengan memperhatikan kendala
. +
+
+
+
Dengan mensubstitusi
+
ke dalam bidang H2 :
diperoleh:
+ +
Sehingga dengan mensubstitusikan kembali λ pada
diperoleh:
Maka jarak H2 ke pusat adalah
√
√
‖ ‖
‖ ‖
Margin maksimum didapatkan dengan memaksimumkan jarak antara H1 dan H2: |
|
|
‖ ‖
‖ ‖
|
‖ ‖
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
22
Dengan kata lain, agar didapat margin yang maksimal akan dicari bidang pemisah yang meminimumkan ‖ ‖ dengan kendala berupa pertidaksamaan (3.4).
Gambar 3. 2 Ilustrasi bidang pemisah dan margin di ruang dimensi dua Penyelesaian masalah meminimumkan ‖ ‖ akan menggunakan turunan pertama dari fungsi yang memuat ‖ ‖ terhadap variabel ‖ ‖. Agar nilai
tetap
memberikan pengaruh pada turunan pertama, maka tanpa mengurangi keumuman, masalah meminimumkan‖ ‖ diganti dengan meminimumkan ‖ ‖ . Untuk menyederhanakan penyelesaian ditambahkan faktor ½ guna menanggulangi pangkat 2 pada turunan pertama. Dengan demikian, model permasalahan menjadi: min ‖ ‖ +
, untuk
.
Semua kendala berupa pertidaksamaan dan fungsi tujuan tersebut dapat dibentuk menjadi masalah tanpa kendala dengan menggunakan pengali Lagrange dengan
. Sehingga model masalah sebelumnya dapat ditulis ‖ ‖ +∑
‖ ‖
∑
(
+
+
)
+∑
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
23
Agar masalah tersebut lebih mudah diselesaikan, akan dibentuk masalah dualnya. Mengubah masalah primal menjadi masalah dual dalam kasus ini serupa dengan mengubah masalah mencari titik pelana menjadi masalah sederhana memaksimumkan yaitu hanya terdapat satu variabel yang tidak diketahui. Untuk meminimumkan
digunakan
dan
. Maka
∑
∑
∑
Dengan memanfaatkan hasil turunan parsial Lp terhadap variabelvariabelnya, masalah meminimumkan Lp dengan dua variabel dapat diubah ke masalah dual (Cristianini dan Taylor, 2000), sehingga menjadi masalah memaksimumkan
yang hanya terdiri satu dari varibel yang tidak diketahui
yaitu pengali-pengali langrange (∑
. )
) (∑
∑
(
)+ )
(∑
+∑
∑∑
(
)
∑∑
(
)
∑
+∑
∑
∑∑
(
)
dengan kendala
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
24
∑ ≤ Akan tetapi, untuk data-data yang tidak dapat dipisahkan secara linear (linearly non separable case) ditambahkan slack variabel
ke
pertidaksamaan (4) sehingga kendala dari fungsi tujuan menjadi +
+
, untuk
.
Didefinisikan sebuah parameter baru C sebagai batasan antara memaksimalkan margin dan mengurangi jumlah data yang salah ketika diklasifikasikan (Vijayakumar dan Wu, 1999). Model masalah menjadi: ‖ ‖ + +
dengan
+
,
∑
, untuk
.
Dengan menggunakan pengali Lagrange, permasalahan meminimumkan tanpa kendalanya menjadi: ‖ ‖ +
‖ ‖ +
∑
∑
+∑
+
∑
Untuk meminimumkan
+
digunakan
+∑
,
+∑
∑
∑
, dan
untuk
. Maka ∑
∑
∑
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
25
akibatnya
∑
∑
∑
.
Dengan memanfaatkan turunan parsial
terhadap
, , dan
, masalah
∑
∑
dualnya menjadi: (∑
∑
) (∑
)+
∑
((∑
)
+ )+∑
∑∑
(
)
+
+∑
∑
∑∑
(
)
∑
∑
∑
∑
∑∑
(
)
dengan kendala ∑ Karena
dan semua nilai
tidak diperhitungkan pada fungsi tujuan, maka terdapat kendala
tambahan ≤
≤
untuk
.
Bias yang sebelumnya telah didefinisikan sebagai , yang menyebabkan adanya kendala ∑
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
26
dapat didefinisikan secara implisit sebagai atribut tambahan. Sehingga data input [
] menjadi
[
[
menjadi
] dan vektor bobot
] dengan
adalah suatu konstanta.
Bentuk permasalahan menjadi meminimumkan ‖
‖ +
∑
+∑
Untuk meminimumkan
+∑
digunakan,
, dan
untuk
. Maka ∑
∑
Bentuk dual dari masalah itu adalah: ∑
+∑
∑
∑
+
(
∑
(∑
∑
+
)
+∑
∑
∑
∑
∑
∑
∑∑
(
)+∑
(∑
)) + ∑
∑
∑
(
)
dengan kendala ≤
≤
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
27
3. 2 Kernel
Tidak semua data dapat dipisahkan secara linear oleh sebuah separating hyperplane meskipun telah ditambahkan slack variabel. Oleh karena itu, diperkenalkan metode kernel yang memungkinkan SVM dapat diterapkan pada data-data yang terpisah secara nonlinear. Dasar dari metode kernel ini adalah dengan memetakan data-data ke ruang dengan dimensi yang lebih tinggi menggunakan fungsi pemetaan
. Fungsi ini tidak dinyatakan secara eksplisit
tetapi dinyatakan dalam bentuk perkalian fungsinya ( Kernel
)
merupakan fungsi yang memenuhi kondisi Mercer
(Tejada dan Echevarría, 2007) : ∬
( )
Berikut kernel-kernel dasar yang digunakan dalam SVM: -
Kernel Polinomial :
-
Kernel Gaussian :
-
Kernel Sigmoid :
+ (
‖
‖
)
Masing-masing kernel tersebut akan digunakan dalam percobaan untuk menentukan kernel dan parameter kernel yang dapat memberikan keakuratan terbaik dalam klasifikasi TIK. Dengan menggunakan fungsi pemetaan akan dihitung menggunakan
, setiap bentuk perkalian
. Setelah
dipetakan ke ruang
dengan dimensi yang lebih tinggi, model masalah berikut: ∑
∑∑
(
)
menjadi ∑
∑∑ Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
28
Bias yang sebelumnya dibuat sebagai atribut tambahan dari data tidak dipetakan, sehingga
=[
]. Oleh karena itu, diperoleh persamaan
berikut: [
][
] +
+ Bentuk masalah menjadi ∑
∑∑
+
dengan kendala ≤
≤
Permasalahan ini juga dapat ditulis: ∑
(
)
dengan kendala ≤
dan komponen
≤ +
adalah
Vijayakumar dan Wu (1999) memberikan algoritma sequential untuk mencari . Sehingga untuk selanjutnya SVM yang digunakan disebut SVM Sequential. Berikut langkah-langkah dalam algoritma tersebut: 1. Diambil
.
2. Komponen matriks dihitung dengan persamaan [ ] 3. Dilakukan langkah 1 dan 2 untuk
( (
)+
)
=1,…N
4 Untuk setiap =1,,…,N, dihitung 4.1
∑ [
4.2 4.3
+
]
(memperbarui nilai
4.4. Jika training telah konvergen (|
) |
), maka iterasi dihentikan.
Jika belum didapatkan kekonvergenan, kembali dilakukan langkah 4.1 dan seterusnya. Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
29
Berikut adalah pembuktian yang diberikan Vijayakumar dan Wu (1999) ≤
bahwa algoritma memenuhi kendala
≤ :
Pada langkah 4.2, jika nilai minimum yang terpilih adalah +
, maka
+ [
Jika nilai minimum yang terpilih adalah
], maka
+ [
Karena
]≤
, maka
≤
+
Selain itu, Vijayakumar dan Wu (1999) juga telah memberikan bukti bahwa dalam algoritma, nilai
akan meningkat secara monoton dan akan berhenti
ketika kondisi maksimum lokal tercapai, serta akan diberikan bukti juga bahwa nilai maksimum lokal merupakan maksimum global. Berikut pembuktiannya: Didefinisikan
, akan dibuktikan bahwa untuk
, nilai
akan meningkat secara monoton selama proses pembelajaran. (
+
∑
∑
dan ∑
Karena
) (
, didapat )
( Kasus 1 :
(
)
) ( (
) (
)
) (
)
Kasus 2 : (
Kondisi ini menyatakan bahwa
). Karena
, maka
. ( (
) +
) Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
30
+
≤
≤(
+
(
)(
)≤
≤ (
) Karena
)
Sehingga Kasus 3 : Hal ini menyatakan bahwa
≤ maka
≤
Sehingga (
)
(
)
)(
(( Terbukti bahwa
))
(
(
))
akan meningkat secara monoton dan berhenti ketika nilai
maksumum dicapai. Berikut bukti bahwa maksimum lokal yang dicapai adalah maksimum global: Misalkan ̀ adalah maksimum lokal dan ̀
. Dari ̀ ke
≤
adalah maksimum global. Maka dapat dibuat suatu garis yang ̀+
menghubungkan keduanya dengan menggunakan ≤ . Dapat dibuktikan bahwa
adalah fungsi konkaf. Karena ̀
konkaf, maka
≤
, untuk
+
̀
. Karena
≤
̀ . Hal ini kontradiksi dengan pernyataan ̀
>
adalah maksimum lokal. Maka ̀ haruslah juga maksimum global. Berikut pembuktian bahwa
adalah fungsi konkaf:
Sebuah teorema yang berkaitan dengan fungsi konveks menyatakan: misalkan adalah suatu himpunan konveks yang terbuka dan tak kosong di memiliki turunan kedua di . Maka, hanya jika matriks Hessian dari
, dan :
->
dikatakan fungsi konveks jika dan
semidefinit positif di setiap elemen
(Bazzara,
dkk., 1993, hal. 91). Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
31
fungsi konkaf sama dengan pembuktian
Pembuktian
(
)
∑
adalah fungsi konveks. (
)
∑
][
[
+ +
][
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
Matriks Hessian dari (
+ +
+
]
+ +
+
+
+
+
) adalah: (
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
[
] [
Akan dibuktikan
]
adalah matriks semidefinit positif. Untuk itu, akan
dibuktikan untuk suatu vektor baris , ∑∑
(∑
) (∑
) Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
32
Terbukti (
adalah matriks semidefinit positif. Karena matriks Hessian dari ) semidefinit positif, berdasarkan teorema, (
konveks atau
) adalah fungsi
fungsi konkaf.
3. 3 Klasifikasi Multikelas
Ada beberapa metode yang telah dikembangkan untuk membuat klasifikasi dua kelas SVM dapat digunakan untuk permasalahan klasifikasi multikelas antara lain: 1. One-Againts-One; 2. One-Againts-All. Pada metode One-Againts-One, suatu sampel data akan diuji pada setiap pasangan kelas. Setiap pasangan kelas memiliki bidang pemisahnya masingmasing. Oleh karena itu, akan terdapat dengan
atau
bidang pemisah,
banyaknya kelas.. Diantara pasangan-pasangan itu, kelas yang paling
banyak terpilih oleh sampel data tersebut merupakan kelas sampel data yang bersangkutan. Jika tidak ada kelas yang terbanyak, maka dilakukan analisis terhadap nilai fungsi tujuan sehingga diperoleh pola pengklasifikian. Pada metode One-Againts-All, terdapat n kali klasifikasi SVM, dengan adalah banyak kelas. SVM melakukan klasifikasi dua kelas antara satu kelas dengan kelas-kelas lain yang dipandang sebagai satu kelas. Kelas untuk suatu sampel data dapat langsung ditentukan dengan metode ini. Ketika sampel data tidak dimasukkan ke dalam kelompok yang berisi sekumpulan kelas, tetapi ke dalam suatu kelas yang spesifik, maka kelas tersebut adalah kelas dari sampel data yang bersangkutan.
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
BAB 4 PEMBAHASAN
Data TIK yang digunakan dalam penelitian ini terdiri dari 25 sampel dan berasal dari pasien-pasien yang dipersiapkan untuk menjalani operasi kepala. Persiapan ini secara tidak langsung menghindari bias terhadap data sampel. Bias data ini dapat berupa hipoksia yang terjadi pada pasien disebabkan gangguan konsentrasi oksigen udara, udara tercemar monoksida, atau faktor ketinggian daerah. Dengan persiapan itu, dapat diasumsikan bahwa hipoksia yang terjadi hanya disebabkan karena terjadinya penyesuaian pembuluh darah. Alur dari peningkatan TIK yang mempengaruhi produksi senyawa-senyawa yang akan digunakan dalam pengklasifikasian, terlihat pada gambar di bawah: TIK meningkat
Hipoksia SOD Stres Oksidatif
Katalase
Mempengaruhi produksi
NADPH MDA
Gambar 4. 1 Bagan hubungan TIK terhadap senyawa-senyawa penanda stress oksidatif Masing-masing sampel memuat data-data berikut: 1. Nilai TIK 2. Konsentrasi SOD di cairan otak 3. Konsentrasi Katalase di cairan otak 4. Konsentrasi MDA di cairan otak 5. Konsentrasi NADPH di cairan otak 6. Konsentrasi SOD di darah 7. Konsentrasi Katalase di darah 33
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
34
8. Konsentrasi MDA di darah 9. Konsentrasi NADPH di darah
4. 1 Langkah Percobaan Pada tahap awal, data-data percobaan dalam ruang lingkup mesin pembelajaran , yang diambil dari UCI Machine Learning Repository, akan diolah menggunakan algoritma SVM. Pengolahan ini bertujuan untuk melihat keakuratan program SVM Sequential yang dibuat dalam mengklasifikasikan data-data dari UCI Machine Learning Repository. Sampel data dari suatu data yang dimiliki, dibagi untuk digunakan pada tahap training dan testing. Tahap training adalah tahap SVM untuk membentuk model. Sedangkan tahap testing adalah tahap pengujian keakuratan model. Data TIK yang dimiliki (dalam satuan cm H2O ) secara keseluruhan merupakan data hasil pengukuran sesaat yang didapat secara langsung melalui operasi kepala. Interval yang digunakan untuk mengklasifikasikan kondisi TIK pasien (Sadewo, 2011) adalah sebagai berikut: -
TIK < 10 cm H2O
: Normal
-
10 cm H2O ≤ TIK < 15 cm H2O
: Rendah
-
15 cm H2O ≤ TIK < 20 cm H2O
: Sedang
-
20 cm H2O ≤ TIK
: Tinggi
Dengan menggunakan atribut data yang berasal dari kedua daerah, darah dan cairan otak serta hasil pengukuran TIK, akan dicari suatu parameter SVM terbaik untuk mengklasifikasikan TIK. Dengan menggunakan parameter yang diperoleh nantinya, akan dilakukan pengujian kembali dengan menggunakan data atribut yang hanya berasal dari salah satu sumber, darah saja atau cairan otak saja. Oleh karena itu, akan ada tiga pengujian yang dilakukan, yaitu: pengujian pertama menggunakan data atribut dari kedua sumber, pengujian kedua menggunakan data atribut dari sumber cairan otak saja, dan yang ketiga menggunakan data atribut dari sumber darah saja. Dari ketiga jenis pengujian, akan dicari jenis pengujian yang memberikan hasil terbaik. Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
35
Jenis pengujian yang memberikan hasil terbaik kemudian akan digunakan untuk melihat tingkat keberhasilan SVM dalam mengklasifikasikan TIK. Untuk tujuan ini, digunakan suatu metode pembanding, Fuzzy C-Means, yang juga merupakan suatu algoritma klasifikasi. 4. 2 Persiapan Pengolahan Data, Training, dan Testing
Pada subbab ini akan dijelaskan tahapan-tahapan yang dilakukan sebelum data sampel diolah menggunakan SVM Sequential. Selain itu, akan dijelaskan juga langkah-langkah yang dilakukan pada saat training dan testing. Dari 25 sampel yang dimiliki dilakukan langkah-langkah berikut: 1.
Sampel dilabelkan berdasarkan data nilai TIKnya; a. TIK < 10 cm H2O
: Normal (kelas 1)
b. 10 cm H2O ≤ TIK < 15 cm H2O
: Rendah (kelas 2)
c. 15 cm H2O ≤ TIK < 20 cm H2O
: Sedang (kelas 3)
d. 20 cm H2O ≤ TIK
: Tinggi (kelas 3)
TIK yang tergolong rendah akan diberikan penanganan berupa terapi obatobatan. TIK yang tergolong sedang dan tinggi dikelompokkan menjadi satu kelas karena penanganan medis yang akan diberikan pada kedua kelas tersebut sama yaitu berupa operasi kepala (Sadewo, 2011); 2.
Sampel di setiap kelas kemudian diacak;
3.
Data masing-masing sampel dinormalisasi dengan mengurangkan setiap datanya dengan rata-rata data pada sampel yang bersangkutan, kemudian membaginya dengan standar deviasi dari data-data pada sampel tersebut;
4.
Diambil sejumlah k% sampel dari masing-masing kelas untuk digunakan untuk tahap training, sedangkan sampel yang tersisa akan digunakan untuk tahap testing. Tahap selanjutnya adalah tahap training dan tahap testing menggunakan
algoritma SVM Sequential. Penulis mengimplementasikan algoritma ini pada software MATLAB R2009a 32 bit menggunakan komputer dengan spesifikasi mesin: Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
36
Prosesor
: Intel Atom
Memori
: 1 GB
Operating System
: Windows 7 (x32)
Berikut adalah langkah-langkah yang dilakukan pada tahap training: 1.
Metode yang digunakan dalam penelitian ini guna mengaplikasikan SVM pada masalah multikelas adalah one-againts-one. Untuk itu, dicari semua kemungkinan pasangan kelas. Banyaknya pasangan akan menentukan banyaknya klasifikasi dua kelas menggunakan SVM;
2.
Sampel yang diolah pada masing-masing klasifikasi dua kelas adalah sampel-sampel yang termasuk pada salah satu kelas dalam pasangan kelas yang sedang diolah. Misalkan pasangan kelas yang diolah adalah kelas 2 dan kelas 3, maka sampel yang digunakan adalah sampel yang nilai TIKnya tergolong kelas 2 atau kelas 3;
3.
Digunakan SVM Sequential untuk mencari pengali Lagrange yang akan meminimumkan fungsi tujuan, dan vektor-vektor yang mendukung klasifikasi (support vector). Vektor-vektor yang termasuk support vector adalah vektor dengan pengali Lagrange yang bersesuaian tidak nol;
4.
Dalam setiap klasifikasi dua kelas akan diperoleh pengali Lagrange dan support vector-nya masing-masing;
5.
Digunakan rumus berikut untuk menentukan label sampel data
pada setiap
klasifikasi dua kelas: (∑ Label untuk sampel data
+
)
adalah label terbanyak yang didapatkan dari
keseluruhan klasifikasi dua kelas. 6.
Keakuratan dari proses klasifikasi pada tahap training dihitung dengan menggunakan rumus:
Setelah semua klasifikasi dua kelas pada tahap training dilakukan, tahap selanjutnya adalah testing. Sampel yang digunakan pada tahap testing adalah Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
37
sampel yang tidak digunakan pada tahap training, sedangkan langkah-langkah yang digunakan untuk melabelkan sampel pada tahap testing serupa dengan tahap training. Berikut langkah-langkah yang dilakukan pada tahap testing: 1.
Label TIK pada setiap sampel diabaikan terlebih dahulu;
2.
Digunakan rumus berikut untuk menentukan label sampel data
pada setiap
klasifikasi dua kelas: (∑ Label untuk sampel data
+
)
adalah label terbanyak yang didapatkan dari
keseluruhan klasifikasi dua kelas; 3.
Keakuratan dari proses klasifikasi pada tahap testing dihitung dengan menggunakan rumus:
Untuk keperluan pengujian program yang dibuat, dalam penelitian ini digunakan data-data yang diambil dari UCI Machine Learning Repository. Banyak sampel, banyak kelas dan banyak atribut dari masing-masing data dapat dilihat pada tabel berikut: Tabel 4. 1 Data-data dari UCI Machine Learning Repository Nama Data
Banyak Atribut
Banyak Kelas
Banyak sampel
4
3
150
30
2
569
Segmentation
19
7
210
Wine
10
3
178
Iris Breast Cancer Wisconsin (Diagnostic) (BCWD)
Dari algoritma SVM Sequential yang diberikan Vijayakumar dan Wu (1999), parameter-parameter yang akan dicari melalui percobaan adalah pengali
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
38
Lagrange awal, jenis kernel, dan parameter kernel yang dapat memberikan keakuratan training dan testing terbaik. 4. 3 Pemilihan Pengali Lagrange Awal ( Nilai setiap pengali Lagrange pada langkah awal dari algoritma SVM Sequential yang diberikan Vijayakumar dan Wu (1999) adalah nol (
).
Dalam penelitian ini, akan dibandingkan tingkat keakuratan SVM Sequential menggunakan nilai pengali Lagrange awal yang lain, yaitu:
yang dipilih secara
acak sebanyak dua kali pemilihan (“random 1” dan “random 2”), , dengan
, dan
adalah konstanta dari jumlah slack variabel pada model
masalah optimalisasi margin pemisah SVM. Vapnik (1995) menjelaskan nilai yang optimal adalah
.
Dengan menggunakan pengali Lagrange awal yang berbeda-beda, pada klasifikasi data Iris, BCWD, Segmentation, dan Wine, didapatkan grafik tingkat keakuratan klasifikasi terhadap banyaknya data training yang digunakan. Berikut grafik-grafik hasil training dan testing dari keempat data tersebut dengan menggunakan kernel Gaussian dengan σ=0,1, kecuali untuk data Segmentation digunakan σ=0,3 karena nilai ini lebih memberikan keakuratan training dan
Keakuratan (%)
testing yang dapat dibandingkan.
100 1/2 C
95
C
90
0 85 10 20 30 40 50 60 70 80 90 100 Persentase penggunaan data untuk training
random 1 random 2
Gambar 4. 2 Grafik keakuratan hasil training untuk data Iris
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
Keakuratan (%)
39
99 97 95 93 91 89 87
1/2 C C 0 random 1 random 2 10
20
30
40
50
60
70
80
90
Persentase penggunaan data untuk training
Gambar 4. 3 Grafik keakuratan hasil testing untuk data Iris
Gambar 4. 4 Grafik keakuratan hasil training untuk data BCWD
Gambar 4. 5 Grafik keakuratan hasil testing untuk data BCWD Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
40
Keakuratan (%)
Gambar 4. 6 Grafik keakuratan hasil training untuk data Segmentation 100 90 80 70 60 50 40
1/2 C C 0 random 1 10 20 30 40 50 60 70 80 90 Persentase penggunaan data untuk training
random 2
Gambar 4. 7 Grafik keakuratan hasil testing untuk data Segmentation
Keakuratan (%)
100 90 1/2 C
80
C 70
0
60
random 1
50
random 2 10 20 30 40 50 60 70 80 90 100 Persentase penggunaan data untuk training
Gambar 4. 8 Grafik keakuratan hasil training untuk data Wine Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
41
Gambar 4. 9 Grafik keakuratan hasil testing untuk data Wine Dari nilai numerik yang terlampir (lampiran 1-4) dan grafik-grafik hasil training dan testing untuk data Iris, BCWD, Segmentation, dan Wine terlihat gambaran tingkat keakuratan klasifikasi menggunakan pengali Lagrange awal yang berbeda-beda. Keakuratan menggunakan pengali Lagrange awal
dan
cenderung berada dibawah keakuratan menggunakan pengali Lagrange awal
dan
yang dipilih random, meskipun untuk data Segmentation
perbedaan pengambilan pengali Lagrange awal tidak terlalu berpengaruh karena nilai keakuratan untuk setiap percobaan berkisar pada suatu nilai. Dengan menggunakan pengali Lagrange awal yang dipilih secara acak didapat hasil yang lebih baik atau lebih buruk dari pada menggunakan pengali Lagrange awal
. Untuk data BCWD, hal ini tidak terlalu berpengaruh,
tetapi untuk data Iris, hal ini dapat terlihat jelas berpengaruh. Untuk data Iris, dengan pengali Lagrange awal
, didapat keakuratan yang umumnya lebih
baik dari pada yang acak (random 2). Hanya terdapat satu dari sepuluh percobaan pada tahap traning menggunakan
yang memberikan keakuratan yang
lebih buruk. Sedangkan pada tahap testing, keakuratan yang didapat selalu sama atau lebih baik. Akan tetapi, ketika digunakan pengali Lagrange awal lain yang juga diambil secara acak (random 1), masih ada tiga percobaan yang memberikan Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
42
keakuratan yang lebih baik dari pada Lagrange awal
. Karena kestabilan dari pengali
dibandingkan dengan nilai yang dipilih secara acak dan
keakuratan yang diberikan lebih baik dari pada pengali Lagrange awal , maka dalam penelitian ini,
dan
dipilih sebagai pengali Lagrange
awal dalam percobaan klasifikasi TIK. Selanjutnya dengan memanfaatkan semua data atribut (kadar senyawa SOD, Katalase, NADPH, dan MDA dari sampel cairan otak dan darah) akan dilihat perbedaan keakuratan terhadap penggunaan kernel Gaussian, Polinomial, dan Sigmoid dalam mengklasifikasikan TIK.
4. 4 Penggunaan Kernel Gaussian
Pada percobaan sebelumnya untuk data Iris, BCWD, Segmentation, dan Wine, digunakan kernel Gaussian dengan parameter σ=0,1 kecuali data segmentation yang menggunakan parameter σ=0,3. Untuk data TIK, dilakukan percobaan menggunakan parameter kernel Gaussian dengan nilai σ berkisar di 0,1 dan 0,3. Hasil dari percobaan yang dilakukan terlihat pada tabel berikut: Tabel 4. 2 Hasil percobaan dengan tiga buah nilai parameter kernel Gaussian
Banyak data training(%) 10 20 30 40 50 60 70 80 90 100
Kernel Gaussian σ=0,1 σ=0,2 σ=0,3 Training Testing Training Testing Training Testing 100,00 43,48 100,00 30,43 100,00 30,43 100,00 38,10 100,00 38,10 100,00 38,10 100,00 50,00 100,00 55,56 100,00 61,11 100,00 43,75 100,00 50,00 88,89 50,00 91,67 46,15 91,67 53,85 83,33 61,54 100,00 27,27 85,71 63,64 78,57 63,64 93,75 33,33 87,50 44,44 81,25 55,56 100,00 16,67 84,21 50,00 78,95 50,00 100,00 25,00 85,71 25,00 76,19 25,00 100,00 88,00 68,00 -
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
43
Dari hasil percobaan menggunakan kernel Gaussian yang ditunjukkan pada table di atas , terlihat hasil testing terbaik didapat dengan menggunakan σ=0,2 yaitu 63,6%. Meskipun untuk σ=0,3 didapatkan hasil yang sama, keakuratan pada tahap training menggunakan σ=0,3 yaitu sebesar 78,6% lebih buruk dari pada keakuratan yang menggunakan σ=0,2 yaitu sebesar 85,7%. Tabel berikut menunjukkan hasil-hasil terbaik yang diperoleh dalam klasifikasi data dari UCI Machine Learning Repository dan data TIK menggunakan kernel Gaussian. Tabel 4. 3 Perbandingan keakuratan klasifikasi antara data Iris, BCWD, Segmentation, Wine, dan TIK menggunakan kernel Gaussian Banyak Sampel Iris 150 BCWD 569 Segmentation 210 Wine 178 TIK 25 Nama Data
Kernel Gaussian Training Testing 93,33 98,89 94,69 91,25 96,43 78,57 88,24 82,64 85,71 63,64
Banyak Data Training 60 228 168 36 14
4. 5 Penggunaan Kernel Polinomial
Sebelum dilakukan percobaan menggunakan kernel Polinomial untuk data TIK, akan diperlihatkan hasil training dan testing untuk data BCWD dan Wine menggunakan kernel ini. Berikut adalah grafik-grafik yang menampilkan keakuratan training dan testing menggunakan kernel Polinomial dengan parameter , Keakuratan (%)
kernel
,
, dan
:
105 85
p=1
65
p=10
45
p=11 10 20 30 40 50 60 70 80 90 100 Persentase penggunaan data untuk training
p=12
Gambar 4. 10 Grafik keakuratan hasil training untuk data BCWD menggunakan kernel Polinomial Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
44
Keakuratan (%)
95 85 75
p=1
65
p=10
55
p=11
45
p=12 10 20 30 40 50 60 70 80 90 Persentase penggunaan data untuk training
Gambar 4. 11 Grafik keakuratan hasil testing untuk data BCWD menggunakan
Keakuratan (%)
kernel Polinomial 100 80
p=1
60
p=10
40
p=11
20 10 20 30 40 50 60 70 80 90 100 Persentase penggunaan data untuk training
p=12
Gambar 4. 12 Grafik keakuratan hasil training untuk data Wine menggunakan kernel Polinomial Keakuratan (%)
100 80
p=1
60
p=10
40
p=11
20
p=12 10 20 30 40 50 60 70 80 90 Persentase penggunaan data untuk training
Gambar 4. 13 Grafik keakuratan hasil testing untuk data Wine menggunakan kernel Polinomial Dari keempat grafik itu terlihat keakuratan yang didapat menggunakan parameter kernel
,
, dan
, tidak menunjukkan perbedaan
yang berarti dibandingkan dengan hasil menggunakan parameter
. Oleh
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
45
karena itu, untuk data TIK akan dilakukan training dan testing menggunakan parameter
. Berikut grafik-grafik yang menggambarkan tingkat
keakuratannya dalam percobaan:
Gambar 4. 14 Grafik keakuratan hasil training untuk data TIK menggunakan kernel Polinomial
Gambar 4. 15 Grafik keakuratan hasil testing untuk data TIK menggunakan kernel Polinomial Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
46
Hasil training dan testing menggunakan 11 parameter kernel Polinomial yang berbeda menunjukkan bahwa training parameter
, memberikan hasil terbaik. Pada tahap
lebih sering memberikan keakuratan yang lebih baik
dari pada parameter lain. Pada tahap testing parameter ini memberikan keakuratan terbaik yaitu sebesar 72 % yang diperoleh dengan menggunakan 60% data sampel sebagai data training. Tabel berikut menunjukkan hasil-hasil terbaik yang diperoleh dalam klasifikasi data dari UCI Machine Learning Repository dan data TIK menggunakan kernel Polinomial. Tabel 4. 4 Perbandingan keakuratan klasifikasi antara data Iris, BCWD, Segmentation, Wine, dan TIK menggunakan kernel Polinomial Nama Data BCWD Wine TIK
Banyak Sampel 569 178 25
Banyak Data Training 228 36 14
Kernel Polinomial Training Testing 72,57 72,01 79,41 74,31 28,57 45,45
4. 6 Penggunaan Kernel Sigmoid
Berikut akan ditampilkan keakuratan terbaik yang didapat pada percobaan untuk data Wine, Iris dan BCWD menggunakan kernel Sigmoid:
Tabel 4. 5 Hasil percobaan untuk data Wine, Iris dan BCWD menggunakan kernel sigmoid Banyak data training (%) 10 20 30 40 50 60 70 80 90 100
Wine (k=1, σ=8,98) Iris (k=1, σ=2,9) BCWD(k=1, σ=30) Training Testing Training Testing Training Testing 81,25 66,67 86,67 91,85 80,36 82,65 91,18 75,69 96,67 95,00 79,65 83,55 88,46 76,98 91,11 97,14 79,41 76,44 78,57 77,78 93,33 100,00 74,78 74,05 78,41 78,89 92,00 100,00 76,06 71,23 71,43 78,08 88,89 95,00 65,69 59,65 78,05 76,36 90,48 100,00 71,54 67,44 73,76 81,08 85,00 90,00 77,31 77,39 73,58 89,47 85,93 100,00 72,21 65,52 76,97 86,00 78,03 Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
47
Meskipun nilai parameter Sigmoid
telah dibuat tetap
, akan tetapi
setiap data membutuhkan parameter σ yang bervariasi. Hasil percobaan berikut menunjukkan bahwa suatu nilai untuk parameter σ pada kernel Sigmoid dapat memberikan keakuratan yang baik pada suatu data tetapi tidak pada data yang lain. Percobaan dilakukan dengan menggunakan 30 % data sampel sebagai data training. Tabel 4. 6 Hasil percobaan tiga nilai parameter kernel Sigmoid Nilai parameter σ 8,98 2,90 30,00
Wine Training Testing 88,46 76,98 26,92 26,98 26,92 26,98
Iris Training Testing 33,33 33,33 91,11 97,14 33,33 33,33
BCWD Training Testing 62,94 62,66 62,94 62,66 79,41 76,44
Perbedaan keakuratan yang sangat besar ini dikarenakan oleh sensitifitas fungsi untuk kernel ini yang akan bernilai 1 atau -1 jika hasil perhitungannya terhadap parameter-parameternya mendekati suatu nilai tertentu. Berikut adalah gambar fungsi [
], dan
yang menjadi fungsi kernel Sigmoid dengan .
Gambar 4. 16 Gambar fungsi yang digunakan pada kernel Sigmoid Pada kernel sigmoid, nilai dengan
ditentukan oleh fungsi
adalah sample yang dihitung, sedangkan
kernel. Pada percobaan sebelumnya digunakan nilai
dan
(
),
adalah parameter . Agar nilai
tidak monoton di suatu nilai (1 atau -1), maka pemilihan nilai parameter Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
48
sangat berperan penting dan pemilihannya bergantung pada rentang nilai-nilai . Untuk data yang berbeda seperti data Wine, Iris, dan BCWD , rentang untuk masing-masing data pun berbeda-beda meskipun telah dilakukan normalisasi.Oleh karena itu, untuk data TIK, akan dilakukan beberapa kali percobaan, dan berikut hasil terbaik yang didapatkan terlihat pada gambar berikut: σ=5
Keakuratan (%)
100
σ=6
80
σ=7
60
σ=5,5
40
σ=5,6
20
σ=4,8
0
σ=4,9
σ=5,2
10 20 30 40 50 60 70 80 90 100 Persentase penggunaan data untuk training
σ=5,1
Gambar 4. 17 Grafik keakuratan hasil training untuk data TIK menggunakan
Keakuratan (%)
kernel Sigmoid 80 70 60 50 40 30 20 10 0
σ=5 σ=6 σ=7 σ=5,5 σ=5,6 σ=4,8 σ=4,9 σ=5,2
10 20 30 40 50 60 70 80 90 Persentase penggunaan data untuk training
σ=5,1
Gambar 4. 18 Grafik keakuratan hasil testing untuk data TIK menggunakan kernel Sigmoid Berikut adalah perbandingan keakuratan klasifikasi menggunakan kernel Sigmoid terhadap data-data yang berbeda: Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
49
Tabel 4. 7 Perbandingan keakuratan klasifikasi antara data Iris, BCWD, Segmentation, Wine, dan TIK menggunakan kernel Sigmoid Nama Data Iris BCWD Wine TIK
Banyak Sampel 150 569 178 25
Banyak Data Training 50 171 54 14
Kernel Sigmoid Training Testing 91,11 97,14 79,41 76,44 88,46 76,98 35,71 45,45
Dari hasil ketiga jenis percobaan yaitu dengan menggunakan kernel Gussian, Polinomial, dan Sigmoid, didapatkan bahwa kernel Gaussian dengan σ=0,2 memberikan keakuratan terbaik dalam klasifikasi data TIK. Keakuratan training dan testing yang diperoleh masing-masing 85,7% dan 63,64%. Kernel lain yang memberikan keakuratan training yang lebih tinggi tidak diperhitungkan karena keakuratan testingnya masih dibawah 60%. Begitu juga untuk keakuratan testing, meskipun ada kernel lain yang memberikan keakuratan testing yang lebih tinggi, hasil ini tidak ditunjang dengan keakuratan training yang cukup baik karena keakuratannya masih di bawah 60%. Pada ketiga jenis percobaan sebelumnya, kernel dan parameter yang digunakan pada setiap klasifikasi dua kelas dibuat sama. Dengan tujuan untuk meningkatkan keakuratan training dan testing untuk klasifikasi TIK, dilakukan metode percobaan yang lain yaitu dengan mengunakan kernel dan parameter yang berbeda pada setiap klasifikasi dua kelas. Pada subbab berikutnya akan dijelaskan hasil-hasil yang diperoleh dari percobaan dengan metode tersebut.
4. 7 Klasifikasi Multikelas dengan Multikernel
Data TIK dalam penelitian ini merupakan data multikelas dimana terdapat tiga kelas dengan label 1, 2, dan 3. Berdasarkan metode one-againt-one, terdapat tiga buah klasifikasi dua kelas, yaitu klasifikasi untuk sampel dengan label 1 dan 2, klasifikasi untuk sampel dengan label 1 dan 3, dan klasifikasi untuk sampel dengan label 2 dan 3. Dari setiap klasifikasi dua kelas itu akan dicari kernel dan Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
50
parameternya yang terbaik. Untuk selanjutnya akan dijelaskan kernel dan parameter kernel terbaik yang diperoleh pada setiap klasifikasi dua kelas. Dari hasil percobaan menggunakan sampel data yang tergolong kelas 1 dan 2 (lampiran 5) diperoleh keakuratan training dan testing yang cukup baik ketka digunakan kernel Gaussian yaitu dengan σ=0,1, σ=0,2, σ=0,3, σ=0,5, dan kernel Polinomial dengan
dan
. Sedangkan kernel
Sigmoid tidak lebih baik dibandingkan kernel Polinomial dari segi testing dan tidak lebih baik dari kernel Gaussian dari segi training. Oleh karena itu, kernel ini diabaikan pada percobaan lanjutan. Dari hasil percobaan menggunakan sampel data yang tergolong kelas 1 dan 3 (lampiran 6) diperoleh keakuratan training dan testing terbaik menggunakan kernel Gaussian dengan σ=0,1. Karena dari keseluruhan percobaan, kernel dan parameter ini memberikan keakuratan yang paling balik, maka kernel dan parameter yang lain, yang memberikan keakuratan lebih buruk, diabaikan pada klasifikasi dua kelas ini. Sedangkan hasil percobaan menggunakan sampel data yang tergolong kelas 2 dan 3 (lampiran 7) diperoleh keakuratan training dan testing terbaik menggunakan kernel Polinomial dengan
. Serupa dengan percobaan
terhadap kelas 1 dan 3, dimana hasil yang didapat dengan menggunakan kernel dan parameter ini jauh berbeda, maka kernel dan parameter yang lain, yang memberikan keakuratan lebih buruk, diabaikan untuk klasifikasi dua kelas ini. Dari ketiga klasifikasi dua kelas itu, pada klasifikasi kelas 1 dan 2, didapat ebih dari satu parameter yang memberikan training terbaik yang ditunjang dengan keakuratan testing yang cukup baik. Di sisi lain juga didapat parameter yang memberikan testing terbaik yang ditunjang dengan keakuratan training yang cukup baik. Akan tetapi, hal ini tidak terjadi untuk klasifikasi dua kelas antara kelas 1 dan 3 serta antara kelas 2 dan 3. Oleh karena itu, dilakukan percobaan lanjutan dengan menggunakan semua kernel dan parameter terbaik untuk klasifikasi pasangan kelas 1 dan 2, sementara untuk klasifikasi pasangan 1 dan 3 ditetapkan kernel Gaussian σ=0,1, dan untuk klasifikasi pasangan 2 dan 3 ditetapkan kernel Polinomial
.
Percobaan ini bertujuan untuk melihat hasil terbaik untuk klasifikasi TIK antara Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
51 penggunaan kernel Gaussian dengan σ=0,1, σ=0,2, σ=0,3, σ=0,5, dan kernel dan
Polinomial dengan
pada klasifikasi pasangan
kelas 1 dan 2.
Tabel 4. 8 Hasil percobaan menggunakan data dari darah dan cairan otak Kernel Gaussian
Kernel Polinomial
σ=0,1
σ=0,2
σ=0,3
σ=0,5
p=1
p=2
p=6
p=11
Training 85.71
85.71
85.71
85.71
78.57
78.57
78.57
85.71
Testing
72,73
72,73
72,73
81,82
81,82
81,82
72,73
72,73
Dari hasil percobaan didapat kernel-kernel dan parameter-parameter yang memberikan keakuratan yang sama. Untuk itu, dilihat hasil pelabelan dari kernel dan parameter yang memiliki keakuratan yang sama (lampiran 8). Dari hasil pelabelannya, didapat bahwa kernel-kernel dan parameter-parameter dengan keakuratan training dan testing masing masing 85,71% dan 72,73% memberikan pelabelan yang serupa. Begitu juga hasil pelabelan untuk kernel-kernel dan parameter-parameter dengan keakuratan training dan testing masing masing 78,57% dan 81,82% adalah serupa. Dari keadaan tersebut, belum diketahui hasil pelabelan terbaik antara keadaan dengan hasil training lebih tinggi atau testing lebih tinggi. Oleh karena itu, dibuat dua buah kelompok yang hasil pelabelannya akan dibandingkan. Kelompok A adalah kelompok dengan keakuratan training dan testing masing masing 85,71% dan 72,73%. Sedangkan kelompok B adalah kelompok dengan keakuratan training dan testing masing masing 78,57% dan 81,82%. Berikut adalah hasil pelabelan kedua kelompok dibandingkan dengan label sebenarnya:
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
52
Tabel 4. 9 Perbandingan hasil pelabelan 14 sampel training pada kelompok A dan B menggunakan data dari cairan otak dan darah
Label data sebenarnya Hasil pelabelan dengan multikernel pada kelompok A Hasil pelabelan dengan multikernel pada kelompok B
Training 1 1 2 2 2 2 2 2 3 3 3 3 3
3
1 1 2 2 3 2 2 2 3 3 3 3 3
2
1 1 1 2 3 2 2 2 3 3 3 3 3
2
Keterangan : Bagian yang diarsir menunjukkan kesalahan pelabelan dibandingkan dengan label data sebenarnya.
Tabel 4. 10 Perbandingan hasil pelabelan 11 sampel testing pada kelompok A dan B menggunakan data dari dairan otak dan darah Testing Label data sebenarnya Hasil pelabelan dengan multikernel kelompok pada A Hasil Klasifikasi dengan multikernel kelompok pada B
1 1 2 2 2 2 3 3 3 3 3 3 2 2 2 2 2 3 3 3 2 3
3 1 2 2 2 2 3 3 3 2 3
Keterangan : Bagian yang diarsir menunjukkan kesalahan pelabelan dibandingkan dengan label data sebenarnya.
Suatu kondisi saat model terlalu cocok untuk sampel training-nya namun tidak cocok untuk sampel diluar sampel training dinamakan kondisi over fit. Dari hasil tersebut, terlihat bahwa perhitungan-perhitungan yang tergolong kelompok A mengalami over fit sehingga tidak sanggup mengklasifikasikan sampel lain yang memiliki perbedaan dengan sampel training-nya. Dari hasil kelompok B, yang keakuratan trainingnya sedikit dibawah kelompok A, kernel dan parameternya menghasilkan keakuratan yang lebih baik pada saat testing dan tidak mengalami over fit. Berikut akan dibandingkan hasil pelabelan dengan Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
53
metode multikernel terhadap hasil pelabelan dengan metode yang menggunakan kernel yang sama pada setiap klasifikasi dua kelas. Dalam hal ini, akan dibandingkan hasil pelabelan kelompok B terhadap hasil pelabelan dengan menggunakan kernel Gaussian σ=0,2 pada setiap klasifikasi dua kelas. Tabel 4. 11 Perbandingan hasil pelabelan 14 sampel training menggunakan data dari dairan otak dan darah Training 1 1 2 2 2 2 2 2 3 3 3 3 3 3
Label data sebenarnya Hasil pelabelan dengan
1 3 2 2 2 2 2 2 3 3 3 3 3 2
kernel Gaussian Hasil pelabelan dengan
1 1 1 2 3 2 2 2 3 3 3 3 3 2
multikernel kelompok B
Keterangan : Bagian yang diarsir menunjukkan kesalahan pelabelan dibandingkan dengan label data sebenarnya.
Tabel 4. 12 Perbandingan hasil pelabelan 11 sampel testing menggunakan data dari dairan otak dan darah Testing Label data sebenarnya Hasil pelabelan dengan kernel Gaussian Hasil pelabelan dengan multikernel kelompok B
1 1 2 2 2 2 3 3 3 3 3 3 2 2 2 2 2 3 3 3 2 2
3 1 2 2 2 2 3 3 3 2 3
Keterangan : Bagian yang diarsir menunjukkan kesalahan pelabelan dibandingkan dengan label data sebenarnya. Hasil yang didapat dengan menggunakan kernel Gaussian σ=0,2 pada setiap klasifikasi dua kelas tidak mengalami over fit, akan tetapi kesalahan pada tahap testing masing jauh lebih besar dibandingkan kelompok B. Selain itu, dari hasil testingnya tidak ditemukan sama sekali pelabelan kelas 1, sehingga kernel Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
54
dan parameternya belum dapat dipastikan mampu melabelkan sampel baru dengan benar jika label sampel itu sebenarnya adalah 1 atau tergolong kelas 1. 4. 8 Percobaan Menggunakan Salah Satu Sumber Data Atribut Dalam penelitian ini, data atribut yang digunakan yaitu: konsentrasi SOD, Katalase, NADPH, dan MDA, berasal dari dua sumber yaitu darah dan cairan otak. Pada percobaan-percobaan sebelumnya digunakan semua atribut dari kedua sumber tersebut. Untuk percobaan selanjutnya, akan dibandingkan keakuratan antara penggunaan atribut-atribut yang berasal dari darah saja, cairan otak saja, dan gabungan dari keduanya. Metode percobaan yang akan dilakukan serupa dengan metode yang dilakukan pada subbab 4.5 yaitu mengunakan kernel dan parameter yang berbeda untuk setiap klasifikasi dua kelasnya.
4. 8. 1 Percobaan Menggunakan Data Atribut dari Cairan Otak
Dari semua klasifikasi dua kelas, dengan data atribut hanya berasal dari cairan otak saja (lampiran 9-11), menunjukkan bahwa penggunaan kernel Gaussian dengan σ=0,2 selalu memberikan hasil terbaik. Dengan menggunakan kernel tersebut, hasil percobaan klasifikasi keseluruhan untuk data TIK menghasilkan keakuratan training dan testing masing-masing 85,71% dan 63,64%. Berikut hasil pelabelannya dibandingkan dengan label data sebenarnya. Tabel 4. 13 Perbandingan hasil pelabelan 14 sampel training menggunakan data dari cairan otak Training Label data sebenarnya 1 1 2 2 2 2 2 2 3 3 3 3 3 3 Hasil pelabelan dengan multikernel
1 3 2 2 2 2 2 2 3 3 3 3 3 2
Keterangan : Bagian yang diarsir menunjukkan kesalahan pelabelan dibandingkan dengan label sebenarnya.
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
55
Tabel 4. 14 Perbandingan hasil pelabelan 11 sampel testing menggunakan data dari cairan otak Testing Label data sebenarnya
1 1 2 2 2 2 3 3 3 3 3
Hasil klasifikasi Hasil klasifikasi dengan multikernel
3 2 2 2 2 2 3 3 3 2 2
Keterangan : Bagian yang diarsir menunjukkan kesalahan pelabelan dibandingkan dengan label data sebenarnya. Hasil pelabelan yang diperoleh dengan memanfaatkan data dari cairan otak saja sama dengan pelabelan menggunakan kernel Gaussian dengan σ=0,2 pada setiap klasifikasi dua kelas yang memanfaatkan data atribut kedua sumber. 4. 8. 2 Percobaan Menggunakan Data Atribut dari Darah
Berdasarkan hasil klasifikasi dua kelas, untuk klasifikasi data dengan label 2 dan 3 (lampiran 14), kernel yang memberikan hasil terbaik adalah kernel Gaussian dengan σ=0,2. Akan tetapi pada masing-masing klasifikasi dua kelas lainnya, masih terdapat lebih dari satu kernel dan parameter yang memberikan hasil yang terbaik. Pada klasifikasi data dengan label 1 dan 2, kernel Gaussian dengan σ=0,1, σ=0,2, σ=0,3, kernel Polinomial dengan p=1, p=2, dan kernel Sigmoid σ=0,1 memberikan hasil terbaik (lampiran 12). Pada klasifikasi data dengan label 1 dan 3, kernel Gaussian dengan σ=0,1 dan σ=0,5 memberikan hasil terbaik dengan keakuratan yang sama (lampiran 13). Untuk itu, dilakukan percobaan kembali menggunakan beberapa parameter yang memberikan hasil terbaik. Tabel 4. 15 Hasil percobaan menggunakan data atribut dari darah Kernel dan paraemetr dari klasifikasi dua kelas 1 dan 2 Gaussian
Gaussian
Gaussian
Gaussian
Polinomial
Polinomial
Sigmoid
σ=0,1
σ=0,2
σ=0,3
σ=0,5
p=1
p=2
σ=1
Gaussian Training 78,57 78,57 78,57 78,57 78,57 71,43 78,57 σ=0.1 Testing 63,64 63,64 63,64 63,64 63,64 72,73 63,64 Gaussian Training 78,57 78,57 78,57 78,57 78,57 71,43 78,57 σ=0.5 Testing 63,64 63,64 63,64 63,64 63,64 72,73 63,64 Keterangan: Nilai Gaussian pada kolom pertama pada tabel adalah parameter untuk klasifikasi data 1 dan 3. Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
56
Seperti yang terjadi pada klasifikasi menggunakan semua data atribut, dari hasil percobaan di atas, didapat kernel dan parameter yang memberikan keakuratan yang sama. Untuk itu, kembali dibuat dua kelompok terbaik untuk melihat hasil pelabelan yang diberikan. Kernel dan parameter dengan keakuratan training dan testing masing masing 78,57% dan 63,64% memberikan pelabelan yang serupa. Begitu juga untuk kernel dan parameter dengan keakuratan training dan testing masing masing 71,43% dan 72,73% juga memberikan pelabelan yang serupa. Dari keadaan tersebut, belum diketahui hasil pelabelan terbaik antara keadaan dengan hasil training lebih tinggi atau testing lebih tinggi. Untuk itu, akan dilihat hasil pelabelan dari dua kelompok itu. Kelompok A adalah kelompok dengan keakuratan training dan testing masing masing 78,57% dan 63,64%. Sedangkan kelompok B adalah kelompok dengan keakuratan training dan testing masing masing 71,43% dan 72,73%.. Berikut hasil pelabelan kedua kelompok dibandingkan dengan label sebenarnya :
Tabel 4. 16 Perbandingan hasil pelabelan 14 sampel training menggunakan data dari darah Training Label data sebenarnya Hasil klasifikasi dengan multikernel kelompok A Hasil klasifikasi dengan multikernel kelompok B
1 1 2 2 2 2 2 2 3 3 3 3 3 3 1 3 2 2 3 2 2 2 3 3 3 3 3 2
1 3 1 2 3 2 2 2 3 3 3 3 3 2
Keterangan : Bagian yang diarsir menunjukkan kesalahan pelabelan dibandingkan dengan label data sebenarnya.
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
57
Tabel 4. 17 Perbandingan hasil pelabelan 11 sampel testing menggunakan data dari darah Testing Label data sebenarnya Hasil klasifikasi dengan multikernel kelompok A Hasil klasifikasi dengan multikernel kelompok B
1 1 2 2 2 2 3 3 3 3 3 3 2 2 2 2 2 3 3 3 2 2
3 1 2 2 2 2 3 3 3 2 2
Keterangan : Bagian yang diarsir menunjukkan kesalahan pelabelan dibandingkan dengan label data sebenarnya.
Dari kedua tabel tersebut terlihat bahwa tidak terjadi over fit ketika training pada kedua kelompok. Akan tetapi, dari hasil testing pada kelompok A tidak ditemukan sama sekali pelabelan kelas 1, sehingga kernel dan parameternya belum dapat dipastikan mampu melabelkan sampel baru dengan benar jika label sampel itu sebenarnya adalah 1 atau kelas 1. Untuk itu, kernel dan parameter yang digunakan kelompok B lebih dapat diterima untuk klasifikasi.
4. 9 Perbandingan Keakuratan SVM dan Fuzzy C-Means untuk Data TIK
Untuk mengetahui tingkat keberhasilan SVM dalam klasifikasi data TIK, digunakan metode klasifikasi lain sebagai pembanding. Dalam percobaan yang dilakukan, semua data atribut dari kedua sumber, baik darah maupun cairan otak digunakan selama training dan testing. Metode pembanding yang digunakan adalah Fuzzy C-Means. Fikri dkk (2010) mendapatkan keakuratan klasifikasi terbaik untuk data astrocytoma dengan menggunakan dengan derajat ke-fuzzy-an . Dalam penelitian ini, akan dilakukan percobaan terhadap beberapa derajat ke-fuzzy-an. Selain itu, ada dua bentuk normalisasi yang dilakukan dalam percobaan menggunakan metode Fuzzy C-Means. Bentuk normalisasi pertama adalah dengan mengurangkan setiap data pada suatu sampel dengan rata-ratanya dan membaginya dengan standar deviasi. Sedangkan bentuk normalisasi kedua Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
58
adalah dengan membagi setiap data pada suatu sampel dengan total nilai data pada sampel tersebut.
Tabel 4. 18 Hasil keakuratan klasifikasi data TIK dengan Fuzzy C-Means Bentuk data
Training 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 57,14 57,14 57,14 57,14 57,14 57,14 57,14 57,14
Nilai
Tanpa Normalisasi 0
Normalisasi bentuk pertama
Normalisasi bentuk kedua 0
Testing 18,18 27,27 36,36 36,36 36,36 45,45 45,45 45,45 45,45 45,45 45,45 45,45 45,45 45,45 45,45 45,45 45,45 36,36 36,36 36,36 36,36 36,36 36,36 36,36 36,36
Tabel 4. 19 Perbandingan keakuratan Metode SVM dengan Fuzzy C-Means Nama data Iris BCWD TIK
SVM Training 93,33 94,69 78,57
Testing 98,89 91,25 81,82
Fuzzy C-Means Training Testing 93,3 97,14 91,07 90,45 50 45,45
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
59
Berdasarkan tingkat keakuratannya, Fuzzy C-Means memberikan hasil yang baik untuk data dari UCI Machine Learning Repository. Akan tetapi, untuk data TIK, SVM jauh lebih akurat dibandingkan Fuzzy C-Means.
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
BAB 5 KESIMPULAN
Dari pembahasan pada bab sebelumnya, didapatkan parameter-parameter SVM yang digunakan untuk melakukan klasifikasi data TIK. Parameter-parameter yang dicari dalam percobaan adalah nilai pengali Lagrange awal, jenis kernel, serta parameter dari kernel tersebut. Dari hasil percobaan-percobaan, didapatkan hasil sebagai berikut: 1. Diantara pengali Lagrange awal
,
, atau yang diambil
secara acak, untuk algoritma SVM Sequential, pengali Lagrange awal memberikan keakuratan lebih baik; 2. Dengan menggunakan kernel dan nilai parameter kernel yang sama untuk setiap klasifikasi dua kelas, kernel Gaussian dengan σ=0,2 memberikan keakuratan yang paling baik dibanding kernel Polinomial dan Sigmoid. Keakuratan pada saat training dan testing menggunakan kernel tersebut masing-masing sebesar 85,71% dan 63,64%; 3. Dengan menggunakan kernel dan nilai parameter kernel yang berbeda untuk setiap klasifikasi dua kelas memberikan hasil testing yang jauh lebih baik yaitu sebesar 81,82%. Kernel yang digunakan untuk mendapatkan hasil ini adalah kernel Polinomial dengan
,
, atau
, untuk
klasifikasi pasangan kelas 1 dan 2. Untuk klasifikasi pasangan kelas 1 dan 3 digunakan kernel Gaussian dengan σ=0,1, dan klasifikasi pasangan kelas 2 dan 3 digunakan kernel Polinomial dengan
.
4. Hasil klasifikasi menggunakan data atribut yang berasal dari darah dan cairan otak memberikan keakuratan testing yang lebih baik (diatas 80%) dibandingkan dengan menggunakan data atribut yang hanya berasal dari darah saja atau cairan otak saja. 5. Dibandingkan dengan metode FCM, tingkat keakuratan metode SVM sudah cukup baik untuk data TIK. Keakuratan training dan testing 60
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
61
menggunakan SVM diatas 70% untuk percobaan dengan menggunakan 60 % sampel sebagai sampel training.
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
DAFTAR PUSTAKA
Asuncion, A., & Newman, D. (2007). Dipetik 11 Januari, 2011, dari UCI Machine Learning Repository: http://archive.ics.uci.edu/ml/about.html Banjeglav, S., Malarić, K., & Tkalec, M. (2010). The Effect of 1800 mhz Electromagnetic Field on Oxidative Stress Parameters in Earthworms (eisenia fetida). 18th International Conference on Software, Telecommunications and Computer Network, (hal. 126-130). Croatia. Bazaraa, M. S., Sherali, H. D., & Shetty, C. M. (1993). Nonlinear Programming Theory and Algorithms,2nd. USA: John Wiley & Sons,Inc. Chacón, M., & dkk. (2010). Non-Invasive Intracranial Pressure Estimation Using Support Vector Machine. 32nd Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBS), (hal. 996999). Buenos Aires. Cristianini, N., & Taylor, J. S. (2000). An Introduction to Support Vector Machines and Other Kernel-Based Learning Methods. UK: Cambridge University Press. Dingyu, H., & dkk. (2009). Stress Response to Hypoxia in Wistar Rat: LA, MDA, SOD and Na+-K+-ATPase. 3rd International Conference on Bioinformatics and Biomedical Engineering (ICBBE), (hal. 1-5). Beijing. Fikri, A., Rustam, Z., & Pandelaki, J. (2010). Brain Cancer (Astrocytoma) Clustering Menggunakan Metode Fuzzy C-Means. Prosiding Seminar Nasional Matematika FMIPA UI, (hal. 271-277). Depok. Jang, J.-S. R., Sun, C.-T., & Mizutani, E. (1997). Neuro-Fuzzy and Soft Computing. USA: Prentice Hall. Little, R. (2008). Increased Intracranial Pressure. Clinical Pediatric Emergency Medicine, 83-87. Liu, Y., & dkk. (2007). An Improvement of One-against-all Method for Multiclass Support Vector Machine. 4th International Conference: Sciences of Electronic, Technologies of Information and Telecommunications, (hal. 2915-2919). Tunisia. 62
Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
63 Murray, R. K., Granner, D. K., & Rodwell, V. W. (2006). Harper’s Illustrated Biochemistry 27th ed. McGraw-Hill. Plat, J. C. (1999). Fast Training of Support Vector Machines. Dalam B. SchPolkopt, C. Burges, A. Smola, & editor, Advances in kernel methods: Support vector Machine (hal. 185-208). Cambridge: MIT- Press. Purcell, E., Varberg, D., & Rigdon, S. (2003). Calculus, 8th Edition. Prentice Hall,Inc. Qiang, Z., & dkk. (2010). A Study on the Oxidative Damage of Esisenia foelide Cells Induced by DEHP. 4rd International Conference on Bioinformatics and Biomedical Engineering (ICBBE), (hal. 1-4). Wuhan. Ross, N., & Eynon, C. (2005). Intracranial pressure monitoring. Current Anaesthesia & Crtical care, 255-261. Rustam, Z. (2010). Intrusion Detection Systems Menggunakan Fuzzy Support Vector Machines. Prosiding Seminar Nasional Matematika FMIPA UI , (hal. 449-453). Depok. Sadewo, W. (2011, 24 Pebruari). Interval Pengelompokan Tekanan Intrakranial. (P. W. Angriyasa, Pewawancara) Shen, H. (2004). Enzymatic Biomarker Measurement and Study on Pollutioninduced Antioxidant Enzymes Responses in Freshwater Fish Liver, Brocarded Carp. 1rd International Conference on Bioinformatics and Biomedical Engineering (ICBBE), (hal. 90-93). Steiner, L. A., & Andrews, P. (2006). Monitoring The Injured Brain : ICP & CBF. British Journal of Anaesthesia, 26-38. Tejada, J., & Echevarría, J. (2007). Support Vector Machine. Dalam D. Andina, & D. T. Pham, Computational Intelligence (hal. 147-191). Netherlands: Springer. Vapnik, V. (1995). The Nature of Statistical Learning Theory. New York: Springer-Verlag. Vijayakumar, S., & Wu, S. (1999). Sequential Support Vector Classifers and Regression. International Conference of Soft Computing, (hal. 610-619). Genoa. Universitas Indonesia
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
64
LAMPIRAN 1
Hasil percobaan SVM Sequential dengan nilai pengali Lagrange awal yang berubah-ubah untuk data Iris: Data training (%) 10 20 30 40 50 60 70 80 90 100
α=0 α=C Training Testing Training Testing 93,33 94,07 100,00 94,81 96,67 91,67 96,67 91,67 91,11 93,33 91,11 97,14 90,00 94,44 85,00 92,22 89,33 94,67 86,67 92,00 91,11 93,33 87,78 90,00 92,38 93,33 91,43 93,33 93,33 90,00 86,67 93,33 91,85 100,00 89,63 93,33 92,67 92,67 -
Data training (%) 10 20 30 40 50 60 70 80 90 100
α=random pertama α=random kedua α=1/2 C Training Testing Training Testing Training Testing 93,33 93,33 93,33 94,07 93,33 94,07 96,67 93,33 96,67 92,50 96,67 93,33 91,11 96,19 91,11 97,14 93,33 98,10 91,67 98,89 93,33 98,89 93,33 98,89 94,67 97,33 92,00 98,67 93,33 98,67 95,56 96,67 91,11 98,33 93,33 98,33 94,29 97,78 92,38 93,33 96,19 100,00 96,67 100,00 91,67 93,33 96,67 100,00 97,78 100,00 97,78 100,00 97,04 100,00 97,33 96,00 98,00 -
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
65
LAMPIRAN 2
Hasil percobaan SVM Sequential dengan nilai pengali Lagrange awal yang berubah-ubah untuk data BCWD: Data training (%) 10 20 30 40 50 60 70 80 90 100 ] Data training (%) 10 20 30 40 50 60 70 80 90 100
α=0 Training Testing 92,86 91,15 92,35 92,48 89,44 89,44 88,16 88,11 87,67 88,22
89,28 92,11 91,48 89,80 86,67 86,40 87,21 86,96 91,38
α=C Training Testing 92,86 86,73 88,82 80,97 72,54 69,50 71,54 72,03 65,95 63,27
84,99 80,48 89,97 77,55 67,72 65,79 70,93 73,91 65,52
α=random pertama α=random kedua α=1/2 C Training Testing Training Testing Training Testing 92,86 89,86 92,86 92,01 92,86 91,23 92,92 90,13 94,69 90,35 93,81 91,01 94,12 90,98 94,12 91,23 94,12 91,23 95,58 92,13 95,13 91,55 94,69 91,25 90,49 85,96 93,66 88,77 94,37 90,18 94,43 91,23 93,55 91,23 93,55 91,23 85,64 84,30 84,63 81,98 85,64 84,30 92,07 88,70 92,29 86,96 91,19 87,83 89,82 89,66 88,26 94,83 88,26 89,66 88,22 86,47 86,99
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
66
LAMPIRAN 3
Hasil percobaan SVM Sequential dengan nilai pengali Lagrange awal yang berubah-ubah untuk data Segmentation: Data training (%) 10 20 30 40 50 60 70 80 90 100
α=0 α=C Training Testing Training Testing 100,00 42,86 100,00 43,39 100,00 58,93 100,00 56,55 95,24 65,31 96,83 59,86 94,05 70,63 98,81 63,49 95,24 72,38 97,14 69,52 93,65 70,24 95,24 72,62 93,88 68,25 95,92 63,49 94,05 73,81 96,43 78,57 93,12 76,19 94,71 66,67 93,81 96,19
Data training (%) 10 20 30 40 50 60 70 80 90 100
α=random pertama Training Testing 100,00 100,00 96,83 97,62 98,10 97,62 97,28 95,24 96,83 96,67
42,33 58,93 60,54 66,67 69,52 70,24 66,67 73,81 71,43
α=random kedua Training Testing 100,00 100,00 96,83 97,62 97,14 97,62 97,28 95,24 96,30 95,71
43,39 60,71 58,50 66,67 69,52 73,81 73,02 73,81 71,43
α=1/2 C Training Testing 100,00 100,00 96,83 96,43 98,10 96,83 97,28 96,43 95,24 96,67
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
43,39 51,79 59,18 65,87 68,57 73,81 68,25 78,57 76,19
67
LAMPIRAN 4
Hasil percobaan SVM Sequential dengan nilai pengali Lagrange awal yang berubah-ubah untuk data Wine: Data training (%) 10 20 30 40 50 60 70 80 90 100
α=0 α=C Training Testing Training Testing 87,50 71,60 87,50 87,65 82,35 76,39 91,18 75,69 69,23 63,49 80,77 73,81 70,00 64,81 71,43 75,93 60,23 63,33 71,59 70,00 59,05 67,12 72,38 73,97 58,54 67,27 72,36 76,36 60,28 64,86 63,12 64,86 61,01 63,16 64,78 68,42 61,24 67,42
Data training (%) 10 20 30 40 50 60 70 80 90 100
α=random pertama α=random kedua α=1/2 C Training Testing Training Testing Training Testing 93,75 81,48 93,75 83,95 93,75 81,48 91,18 84,03 88,24 89,58 88,24 82,64 82,69 73,81 84,62 80,95 84,62 73,81 84,29 80,56 85,71 83,33 81,43 77,78 68,18 70,00 78,41 84,44 70,45 64,44 71,43 72,60 76,19 83,56 70,48 68,49 87,80 89,09 77,24 83,64 78,86 76,36 68,09 70,27 85,11 94,59 70,21 75,68 82,39 94,74 89,94 94,74 80,50 89,47 83,71 82,58 82,58
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
68
LAMPIRAN 5 Hasil keakuratan (%) percobaan klasifikasi dua kelas untuk pasangan kelas 1 dan 2 menggunakan data atribut dari darah dan cairan otak.
Keakuratan
Hasil percobaan dengan kernel Gaussian 100 90 80 70 60 50 40
Training
Testing 0,1
0,2
0,3
0,5 0,6 nilai σ
0,8
1
2
Keakuratan
Hasil percobaan dengan kernel Polinomial 100 90 80 70 60 50 40
Training Testing 1 2 3 4 5 6 7 8 9 10 11 18 20 nilai p
Keakuratan
Hasil percobaan dengan kernel Sigmoid
100 90 80 70 60 50 40
Training Testing 0
1
2
3
4 5 nilai σ
6
7
10 15
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
69
LAMPIRAN 6 Hasil keakuratan (%) percobaan klasifikasi dua kelas untuk pasangan kelas 1 dan 3 menggunakan data atribut dari darah dan cairan otak.
Keakuratan
Hasil percobaan dengan kernel Gaussian 100 90 80 70 60 50 40
Training Testing 0,1
0,2
0,3 0,5 Nilai σ
0,7
1
Keakuratan
Hasil percobaan dengan kernel Polinomial 80 70 60 50 40 30 20 10 0
Training Testing 1 2 3 4 5 6 7 8 9 10 11 15 20 Nilai p
Keakuratan
Hasil percobaan dengan kernel Sigmoid
90 80 70 60 50 40 30 20
Training Testing 0
1
2
3
4 5 Nilai σ
6
7
10
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
70
LAMPIRAN 7 Hasil keakuratan (%) percobaan klasifikasi dua kelas untuk pasangan kelas 2 dan 3 menggunakan data atribut dari darah dan cairan otak.
Keakuratan
Hasil percobaan dengan kernel Gaussian 100 90 80 70 60 50 40 30
Training Testing 0,1 0,2 0,3 0,5 0,8 1 Nilai σ
2
5
10
Keakuratan
Hasil percobaan dengan kernel Polinomial 100 90 80 70 60 50 40 30 20
Training Testing 1
3
5
7
9 11 13 15 17 19 Nilai p
Hasil percobaan dengan kernel Sigmoid
Keakuratan
70 60 50
Training
40
Testing
30 0
1
2
3
4 5 Nilai σ
6
7
8
9
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
71
LAMPIRAN 8
Hasil pelabelan akhir dengan data atribut yang digunakan berasal dari darah dan cairan otak.
Testing
Training
Label sebenarnya 1 1 2 2 2 2 2 2 3 3 3 3 3 3 1 1 2 2 2 2 3 3 3 3 3 Keterangan : Kelompok A :
σ=0,1 1 1 2 2 3 2 2 2 3 3 3 3 3 2 3 2 2 2 2 2 3 3 3 2 3
Label Kelompok A σ=0,2 σ=0,3 σ=0,5 1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 2 2 2 3 3 3 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 2 2 2 3 3 3
p=11 1 1 2 2 3 2 2 2 3 3 3 3 3 2 3 2 2 2 2 2 3 3 3 2 3
Label Kelompok B p=1 p=2 p=6 1 1 1 1 1 1 1 1 1 2 2 2 3 3 3 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 2 2 2 3 3 3 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 2 2 2 3 3 3
Kelompok dengan keakuratan training dan testing masing masing 85,71% dan 72,73%.
Kelompok B :
Kelompok dengan keakuratan training dan testing masing masing 78,57% dan 81,82%.
Bagian yang diarsir adalah kesalahan pelabelan
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
72
LAMPIRAN 9
Hasil keakuratan (%) percobaan klasifikasi dua kelas untuk pasangan kelas 1 dan 2 menggunakan data atribut hanya dari cairan otak.
Keakuratan
Hasil percobaan dengan kernel Gaussian 100 90 80 70 60 50 40 30
Training Testing 0,2
0,5
0,8 Nilai σ
1
2
Keakuratan
Hasil percobaan dengan kernel Polinomial 100 90 80 70 60 50 40 30 20
Training Testing 1
2
3
4
5 6 Nilai p
7
8
10 20
Keakuratan
Hasil percobaan dengan kernel Sigmoid 90 80 70 60 50 40 30 20
Training Testing 0
1
2
3 5 Nilai σ
10
15
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
73
LAMPIRAN 10
Hasil keakuratan (%) percobaan klasifikasi dua kelas untuk pasangan kelas 1 dan 3 menggunakan data atribut hanya dari cairan otak.
Keakuratan
Hasil percobaan dengan kernel Gaussian 100 90 80 70 60 50 40 30
Training Testing 0,1
0,2
0,3 0,5 Nilai σ
0,7
1
Keakuratan
Hasil percobaan dengan kernel Polinomial 100 90 80 70 60 50 40 30 20 10
Training Testing 1
2
3
4
5 6 Nilai p
7
10
15
20
Keakuratan
Hasil percobaan dengan kernel Sigmoid 90 80 70 60 50 40 30 20
Training
Testing 0
1
2
3
5
10
Nilai σ
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
74
LAMPIRAN 11
Hasil keakuratan (%) percobaan klasifikasi dua kelas untuk pasangan kelas 2 dan 3 menggunakan data atribut hanya dari cairan otak.
Keakuratan
Hasil percobaan dengan kernel Gaussian 100 90 80 70 60 50 40 30
Training Testing 0,1 0,2 0,3 0,5 0,8 1 Nilai σ
2
5 10
Keakuratan
Hasil percobaan dengan kernel Polinomial 100 90 80 70 60 50 40 30 20
Training Testing
1
2
3
4
5 6 7 Nilai p
8
9 10 20
Keakuratan
Hasil percobaan dengan kernel Sigmoid 70 60 50 40 30
Training Testing 0
1
2 3 Nilai σ
4
9
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
75
LAMPIRAN 12 Hasil keakuratan (%) percobaan klasifikasi dua kelas untuk pasangan kelas 1 dan 2 menggunakan data atribut hanya dari darah.
Keakuratan
Hasil percobaan dengan kernel Gaussian 100 90 80 70 60 50 40 30
Training Testing 0,1
0,2
0,3 0,5 Nilai σ
1
2
Keakuratan
Hasil percobaan dengan kernel Polinomial 100 90 80 70 60 50 40 30 20
Training Testing 1
2
5
6 7 Nilai p
8
10
15
Keakuratan
Hasil percobaan dengan kernel Sigmoid 90 80 70 60 50 40 30 20
Training Testing 1
2
3
4
5 6 Nilai σ
6,5
7
10
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
76
LAMPIRAN 13 Hasil keakuratan (%) percobaan klasifikasi dua kelas untuk pasangan kelas 1 dan 3 menggunakan data atribut hanya dari darah.
Keakuratan
Hasil percobaan dengan kernel Gaussian 100 90 80 70 60 50 40 30
Training Testing 0,1
0,3
0,5
1
Nilai σ
Keakuratan
Hasil percobaan dengan kernel Polinomial 80 70 60 50 40 30 20 10
Training
Testing 1
2
3
4 5 Nilai p
10
11
15
Keakuratan
Hasil percobaan dengan kernel Sigmoid
90 80 70 60 50 40 30 20 10
Training Testing
0
1
2
3
4 5 Nilai σ
6
7
10
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011
77
LAMPIRAN 14 Hasil keakuratan (%) percobaan klasifikasi dua kelas untuk pasangan kelas 2 dan 3 menggunakan data atribut hanya dari darah.
Keakuratan
Hasil percobaan dengan kernel Gaussian 100 90 80 70 60 50 40 30
Training Testing 0,1
0,2
0,3
0,4 0,5 Nilai σ
0,8
1
2
Keakuratan
Hasil percobaan dengan kernel Polinomial 100 90 80 70 60 50 40 30 20
Training Testing
1
2
3
4
5
6 7 8 Nilai p
9 10 11 15
Hasil percobaan dengan kernel Sigmoid Keakuratan
70 60 50
Training
40
Testing
30 0
1
2
3
4
5
Nilai σ
Klasifikasi tekanan..., Putu Wira Angriyasa, FMIPA UI, 2011