PENGKLASIFIKASI GENUS PANTHERA (HARIMAU, SINGA, JAGUAR DAN MACAN TUTUL DENGAN METODE NAIVE BAYES Program Studi Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya Agus Suryanto, Brian Andrianto, Ferdi Alvianda, Harim Adi Saputro, Maria Stevani Siregar E-mail 1,2,3,4,5
[email protected],
[email protected],
[email protected],
[email protected],
[email protected]
ABSTRAK Pengklasifikasian kingdom panthera dapat dilakukan dengan melihat warna kulit dari masing-masing spesies. Sehingga dapat ditemukan suatu pola tertentu untuk mengklasifikasikannya. Tujuan klasifikasi ini untuk membantu mempermudah manusia mengenali setiap jenis dari genus panthera. Karena kalau kita lihat sekilas ke empat hewan tersebut hampir mirip. Penelitian ini menggunakan pengenalan pola suatu citra warna kulit dari spesies untuk diklasifikasi. spesies yang digunakan adalah singa, harimau, leopard dan jaguar. Dalam penelitian ini, proses ekstraksi fitur menggunakan nilai RGB dari warna kulit dan menggunakan metode naïve bayes untuk melakukan proses klasifikasi terhadap singa, harimau, leopard dan jaguar. Hasil penelitian ini menunjukkan bahwa tingkat akurasi pada singa adalah 100%, harimau 100%, macan tutul 0% dan jaguar 100%. Kata kunci: Klasifikasi, warna kulit, naïve bayes
ABSTRACT Panthera kingdom classification can be done by examining each species's colors. therefore some specific patterns used for classification can be found. The purpose of classification is to help facilitate human to recognize any kind of genus Panthera. Because if we see a glimpse into the four animals is similar. This research uses Image Pattern Recognition from some species' skin colors to be classified. Species used for this research are lion, tiger, leopard and jaguar. In this research, the feature extraction process uses the RGB from skin’s colors and uses Naive Bayes Method for classifying lion, tiger, leopard and jaguar. This research shows that the classification accuracy level for lion is 100%, tiger is 100%, leopard is 0% and jaguar is 100% Key words: Classificatian, skin’s color, naïve bayes.
1.
Pendahuluan Keanekaragaman hewan yang ada di dunia telah mendorong para ahli biologi untuk membuat suatu sistem untuk
mempelajari dan mengenali organisme dengan melalui klasifikasi. Pengklasifikasian merupakan pengelompokan organisme berdasarkan karakteristik tertentu. Pengklasifikasian
hewan bisa dilakukan dengan warna dan motif kulit. Pada beberapa sistem temu kembali citra, sebuah citra dapat diperbolehkan oleh beberapa fitur seperti warna. Untuk melakukan representasi terhadap bentuk objek pada citra dapat meggunakan ekstraksi warna. Setelah didapatkan fitur warna, maka akan terbentuk suatu pola tertentu darim RGB nya. Pola tersebut dapat digunakan untuk mengklasifikasikan. Pada penelitian ini digunakan metode naive bayes untuk menentukan klasifikasi dari binatang. Binatang yang kita gunakan pada penelitian ini adalah harimau, singa, macan tutul dan jaguar. Adapun ciri-ciri binatang tersebut antara lain : Harimau mempunyai motif loreng dengan garis-garis panjang Jaguar mempunyai motif dengan totol yang besar-besar dan tidak beraturan Leopard mempunyai motif yang sama dengan jaguar namun lebih berdekatan dan berukuran lebih kecil Singa tidak mempunyai motif pada tubuhnya sama sekali [3]. 2.
Dasar Teori Naïve bayes adalah suatu metode pengklasifikasian paling sederhana dengan menggunakan peluang yang ada, dimana diasumsikan bahwa setiap variable X bersifat bebas (independence)[1]. Karena asumsi variabel tidak saling terikat, maka didapatkan persamaan (1). 𝑛
𝑃(𝑋|𝐶𝑖) = ∏ 𝑃(𝑥𝑘|𝐶𝑖)
(1)
𝑘=1
Data yang digunakan dapat bersifat kategorial (diskrit) maupun kontinyu. Namun, pada penelitian ini kita mengguakan data komtinyu. Untuk data
kontinyu dapat diselesaikan dengan menggunakan langkah-langkah berikut. 1. Hitung probabilitas (Prior) tiap kelas yang ada dengan cara menghitung jumlah data tiap kelas dibagi jumlah total data secara keseluruhan. 2. Lalu hitung rata-rata (mean) tiap fitur dengan persamaan (2). 𝑁
1 𝜇 = ∑ 𝑥𝑖 𝑁
(2)
𝑖=1
Dimana : i = banyaknya data N = nilai data 3. Kemudian hitung nilai varian dari fitur tersebut seperti pada persamaan (3). 𝑁
1 𝜎=√ ∑(𝑥𝑖 − 𝜇)2 𝑁−1
(3)
𝑖=1
4.
Selanjutnya menghitung densitas probabilitasnya menggunakan persamaan (4).
𝜑𝜇,𝜎 (𝑥) =
1 √2𝜋𝜎 2
𝑒
(𝑥−𝜇)2 2𝜎2
(4)
5. Setelah didapatkan nilai varian dan prior, hitung likelihood masing-masing kelas dengan menggunakan persamaan (5). 𝑃(𝑑|ℎ) = 𝑃(𝑎1 , … , 𝑎 𝑇 |ℎ) = ∏ 𝑃(𝑎𝑡 |ℎ) (5) 𝑡
6. Mengalikan nilai prior dan nilai likehood yang sudah dihitung pada langkah sebelumnya dengan persamaan (6).
𝑉𝑀𝐴𝑃 =
7.
arg 𝑚𝑎𝑥 𝑉𝑗 ∈𝑉𝑃(𝑎1 , 𝑎2 , … , 𝑎𝑛 |𝑉𝑗 )𝑃(𝑉𝑗 )
(6)
Tahap Pengujian (Testing) Beberapa fitur (v1, v2, ... , vk), pilih kelas yang memaksimalkan Posterior mengguakan persamaan (7) :
𝑃(𝐶𝑖 |𝐴1 , 𝐴2 , … , 𝐴𝑛) ∏𝑛𝑖=1 𝑃(𝐴𝑖 |𝐶𝑗 )𝑃(𝐶𝑗 ) = (7) 𝑃(𝐴1 , 𝐴2 , … , 𝐴𝑛) Nilai hasil kali prior dan likelihood terbesar adalah kelas yang sesuai. Sedangkan untuk data kategorial, hanya memerlukan semua kemungkinan yang terjadi [4]. Naive Bayes mengedepankan penyederhanaan, sehingga kemungkinan hasil keputusan tidak sesuai realita yang ada. Namun metode ini bekerja dengan baik dan praktis [5]. 3.
Metode Penelitian Langkah-langkah metodologi penelitian yang kami gunakan adalah sebagai berikut : 1. Studi literatur Studi literatur kami lakukan untuk melengkapi pengetahuan dan teori-teori dasar melalui media seperti internet dan paper-paper lain yang mendukung. 2. Pengumpulan data Data yang digunakan berupa gambar yang kami cari dari internet yang nantinya akan kami jadikan data training. 3. Identifikasi masalah Tahap identifikasi masalah ini kami lakukan setelah mendapat dataset yang sesuai dengan permasalahan yang kami selesaikan untuk kemudian dilakukan proses klasifikasi. 4. Proses klasifikasi dengan metode Naive Bayes
Tahap ini merupakan proses dilakukannya klasifikasi berdasarkan atribut yang ada pada masalah pengklasifikasian ini yaitu RGB motif kulit dengan menggunakan metode Naïve Bayes. 5. Hasil Setelah proses klasifikasi, hasil yang didapat menunjukkan pengklasifikasian terhadap gambar yang kami pakai. 6. Evaluasi Tahap ini dilakukan untuk melakukan evaluasi apakah hasil yang didapat sesuai dan akurat sesuai dengan kenyataan yang ada atau tidak. 4.
Hasil dan Pembahasan Data training yang kami gunakan pada penelitian ini sebanyak 76 dengan fitur RGB pada gambar. Adapun jumlah rincinya adalah harimau sebanyak 26 buah, leopard sebanyak 15 buah, jaguar sebanyak 19 buah, dan singa sebanyak 16 buah, seperti terlihat pada tabel 1. Tabel 1. Data Training No Nama Hewan 1 Harimau 2 Leopard 3 Jaguar 4 Singa Total
jumlah 26 15 19 16 76
Sedangkan data uji yang kami gunakan dalam penelitian ini sebanyak 16 buah dengan rincian harimau 5, leopard 3, jaguar 5 dan singa 3 seperti tabel 2, 3, 4 dan 5. Tabel 2. Data RGB Harimau
No. 1 2 3 4 5
R 145 151 145 128 155
G 117 141 124 123 135
B 91 119 104 122 106
Tabel 3. Data RGB Jaguar
No. 1 2 3 4 5
R 73 93 83 86 76
G 64 72 71 72 55
5. B 52 46 61 67 38
Kesimpulan Hasil penelitian ini menunjukkan bahwa tingkat akurasi pada singa, harimau dan jaguar 100%, sedangkan pada leopard tingkat akurasinya 0%. Faktor kegagalan tersebut dikarenakan jaguar dan leopard memiliki kemiripan pada motif dan warna kulitnya.
Tabel 4. Data RGB Leopard
No. 1 2 3
R 41 55 63
G 39 43 55
B 32 34 44
[1]
B 120 146 151
[2]
Tabel 5. Data RGB Singa
No. 1 2 3
R 200 198 199
G 169 181 177
[3] Secara garis besar, sistem bekerja sebagai berikut. Pertama, pilih gambar jenis hewan yang ingin dikenali. Sebelum gambar diproses untuk mendapatkan nilai R, G, dan B, gambar akan melalui praproses antara lain, gambar akan di-resize untuk mendapatkan ukuran tertentu sehingga gambar lebih cepat untuk diproses selanjutnya. Kemudian gambar akan dipotong untuk mendapatkan objeknya saja dan mengurangi area yang tidak perlu dengan memotong bagian terluar gambar hingga bagian tertepi objek. Setelah mendapatkan nilai R, G, dan B, nilai tersebut akan diproses dengan Naive Bayes. [2] Dari 16 data sampel terdapat 3 data yang salah prediksi sehingga total akurasi dari pengujian adalah 81.25%. Keakurasiannya untuk tiap kelas harimau 100%, leopard 0%, jaguar 100% dan singa 100%.
[4]
[5]
Daftar Pustaka Cahyo Darujati dan Agustinus Bimo Gumelar, “Pemanfaatan Teknik Supervised untuk Klasifikasi Teks Bahasa Indonesia”, Sistem Informasi, Fakultas Ilmu Komputer, Universitas Narotama Surabaya, 2012. “How to: Crop an Image” URL : http://msdn.microsoft.com/enus/library/ms752345.aspx, diakses tanggal 20 April 2013 “Learn to Identify the Big Cats” URL : http://www.bigcats.com/learn-toidentify-the-big-cats,diakses tanggal 20 April 2013 Tom M. Mitchell, (2010), “Generatie and Discriminative Classifiers : Naïve Bayes and Logistic Regression”, hal. 17. M. Ammar Shadiq, (2011), “Keoptimalan Naïve Bayes dalam Klasifikasi”, hal. 1-8
Biodata Peneliti Agus Suryanto merupakan mahasiswa semester 4 jurusan Informatika, PTIIK, Universitas Brawijaya yang lahir di Nganjuk, 10 agustus 1993, tertarik dengan bidang yang berkaitan dengan Komputasi Cerdas. Brian Andrianto merupakan mahasiswa semester 4 jurusan Informatika, PTIIK, Universitas Brawijaya yang lahir di Lamonga, 4 Juli 1993 dan sekarang berdomisili di Malang, tertarik dengan bidang yang berkaitan dengan Komputasi Cerdas. Ferdi Alvianda merupakan mahasiswa semester 4 jurusan Informatika, PTIIK, Universitas Brawijaya yang lahir di Pasuruan, 10 Juni 1993 dan berdomisili di Malang, tertarik dengan bidang yang berkaitan dengan Komputasi Cerdas Harim Adi Saputro merupakan mahasiswa semester 4 jurusan Informatika, PTIIK, Universitas Brawijaya yang lahir di Tulungagung, 12 Februari 1992, tertarik dengan bidang yang berkaitan dengan Komputasi Cerdas.
Maria Stevani Siregar merupakan mahasiswi semester 4 jurusan Informatika, PTIIK, Universitas Brawijaya yang lahir di Tangerang, 8 September 1993 dan sekarang berdomisili di Malang, tertarik dengan bidang Rekayasa Perangkat Lunak