IDENTIFIKASI KUALITAS BERAS DENGAN CITRA DIGITAL MENGGUNAKAN METODE DECISION TREE – ITERATIVE DICHOTOMISER TREE (ID3) DAN C4.5 HALAMAN JUDUL SKRIPSI Diajukan untuk memenuhi salah satu syarat mencapai gelar Strata Satu Program Studi Informatika
Disusun oleh: ARISSA APRILIA NURCAHYANI M0511010
PROGRAM STUDI INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2016
i
SKRIPSI IDENTIFIKASI KUALITAS BERAS DENGAN CITRA DIGITAL MENGGUNAKAN METODE DECISION TREE – ITERATIVE DICHOTOMISER TREE (ID3) DAN C4.5
HALAMAN PENGAJUAN Disusun oleh: Arissa Aprilia Nurcahyani M0511010
Ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Strata Satu Program Studi Informatika
PROGRAM STUDI INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA
2016
ii
HALAMAN PERSETUJUAN
iii
HALAMAN P ENGESA HAN
iv
PERSEMBAHAN
Dengan segala rasa syukur, laporan skripsi ini penulis persembahkan kepada: Bapak Aries Ramelani dan Ibu Suci Nuryani serta adik-adik Hafidha Ainurrahma dan Indana Alya Mumtaza, Bapak Ristu Saptono, S.Si, M.T serta Ibu Esti Suryani, S.Si, M.Kom, Sahabat dan keluarga Informatika khususnya teman seperjuangan angkatan 2011, Keluarga SAT beserta Staff dan Karyawan UPT TIK UNS, Bolo Kurowo IPA 1 SMA Negeri 1 Gemolong
v
MOTTO “Inna ma’al ‘usri yusroo.” “Sesungguhnya bersama kesulitan itu ada kemudahan.” Q.S. Al Insyirah: 6
vi
KATA PENGANTAR Puji syukur kehadirat Allah SWT yang telah melimpahkan rahmatnya sehingga penulis dapat menyelesaikan Skripsi dengan judul “Identifikasi Kualitas Beras dengan Citra Digital Menggunakan Metode Decision Tree – Iterative Dichotomiser Tree (ID3) dan C4.5”. Laporan Skripsi ini disusun untuk memenuhi salah satu syarat dalam memperoleh gelar Sarjana Komputer pada Program Studi Informatika Universitas Sebelas Maret. Dalam melakukan penelitian dan penyusunan laporan Skripsi ini penulis telah mendapatkan banyak dukungan dan bantuan dari berbagai pihak. Penulis mengucapkan terimakasih yang tak terhingga kepada: 1. Bapak dan Ibu serta keluarga yang selalu memberikan dukungan dan semangat untuk menyelesaikan tugas akhir. 2. Prof. Ir. Ari Handono Ramelan M.Sc. (Hons), Ph.D. selaku Dekan Fakultas MIPA Universitas Sebelas Maret. 3. Bapak Drs. Bambang Harjito M.APP.Sc, Ph.D. selaku Kepala Program Studi Informatika Universitas Sebelas Maret. 4. Bapak Ristu Saptono S.Si., M.T. dan Ibu Esti Suryani S.Si., M.Kom. selaku dosen pembimbing yang telah dengan penuh kesabaran dan ketulusan memberikan ilmu dan bimbingan terbaik kepada penulis. 5. Para Dosen Program Studi Informatika Universitas Sebelas Maret yang telah memberikan bekal ilmu kepada penulis. 6. Para Staff dan karyawan serta keluarga SAT UPT. TIK UNS yang telah mendukung dan berbagi ilmu dalam dalam kuliah dan kerja. 7. Bapak Warsono dan Bapak Eko yang telah banyak membantu dalam memberikan informasi serta validasi dalam penelitian ini. Penulis menyadari sepenuhnya bahwa laporan Skripsi ini masih jauh dari sempurna. Walaupun demikian, semoga tulisan ini dapat memberikan manfaat dan memberikan wawasan tambahan bagi para pembaca dan khususnya bagi penulis. Surakarta, Januari 2016 Penulis vii
IDENTIFIKASI KUALITAS BERAS DENGAN CITRA DIGITAL MENGGUNAKAN METODE DECISION TREE – ITERATIVE DICHOTOMISER TREE (ID3) DAN C4.5 ARISSA APRILIA NURCAHYANI Program Studi Informatika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Sebelas Maret ABSTRAK Beras merupakan makanan pokok yang paling banyak di konsumsi oleh masyarakat Indonesia. Namun, seiring dengan bertambahnya kebutuhan beras di Indonesia, harga beras di pasaran justru semakin melonjak dan banyak beredar beras yang memiliki kualitas kurang baik. Oleh karena itu perlu adanya standar kualitas mutu dari pihak gudang beras saat mendistribusikan beras. Standar pengujian kualitas dari pihak Bulog adalah uji laboratorium dan uji visual. Namun, pengujian secara visual selama ini masih dilakukan secara manual sehingga masih sering terjadi kesalahan. Oleh karena itu, sistem pengujian secara visual dengan citra digital dapat menjadi solusi yang efektif untuk permasalahan tersebut. Proses pengujian dapat dilihat dari nilai putih, bersih, dan utuh beras yang diperoleh melalui pengolahan citra digital. Nilai bersih dan putih diperoleh dengan menganalisis nilai HSV, sedangkan nilai utuh diperoleh dengan menganalisis luas region objek. Sebelumnya, dilakukan training menggunakan 30 data untuk mendapatkan pohon keputusan ID3 dan C4.5. Data yang telah diperoleh dari pengolahan citra kemudian diklasifikasi ke dalam 3 kelas yaitu baik, kurang dan buruk menggunakan pohon keputusan. Hasil evaluasi data klasifikasi dengan metode supplied test menghasilkan akurasi 100% untuk ID3 dan 83.3% untuk C4.5. Sedangkan pengujian data dengan k-fold cross validation dengan k=5 didapatkan akurasi precision 0.969, recall 0.967, f-measure 0.967 untuk metode ID3 dan precision 0.97, recall 0.97, f-measure 0.97 untuk metode C4.5. Kata Kunci: Pengolahan Citra, Beras, Decision Tree, ID3, C4.5
viii
RICE GRAIN QUALITY IDENTIFICATION WITH DIGITAL IMAGE USING DECISION TREE – ITERATIVE DICHOTOMISER TREE (ID3) AND C4.5
ARISSA APRILIA NURCAHYANI Departement of Informatics, Faculty of Mathematics and Natural Science, Sebelas Maret University ABSTRACT Rice is the staple food which is consumed by Indonesian people. However, along with the increasing of rice demand, the price of rice in the market also increasing, and then many poor quality rice emerging. Therefore, we need for quality standards of rice from the rice warehouse while distribute the rice. The Bulog quality testing standards are laboratory tests and visual tests. However, the visual testing is still done manually consequently the errors are still occur. Therefore, the visual test system with digital image can be an effective solution to these problems. The testing process can be seen from the white, clean, and roundness value of rice acquired through digital image processing. Clean and white values are obtained by analyzing the value of HSV, while the value of the roundness is obtained by analyzing the wide region of the object. Previously, 30 data are used for training to get a decision tree ID3 and C4.5 model. The image data has been acquired then classified into three classes i.e., good, fair and poor using the decision tree. The classification data results that evaluated by supplied test method produces 100% of accuracy for ID3 and 83.3% for C4.5. While testing data by k-fold cross validation with k = 5 obtain precision 0.969, recall 0.967, f-measure 0.967 for ID3 and precision 0.97, recall 0.97, dan f-measure 0.97 for C4.5. Keywords: Image Processing, Rice, Decision Tree, ID3, C4.5
ix
DAFTAR ISI HALAMAN JUDUL................................................................................................ i HALAMAN PENGAJUAN .................................................................................... ii HALAMAN PERSETUJUAN ............................................................................... iii HALAMAN PENGESAHAN ................................................................................ iv PERSEMBAHAN ................................................................................................... v MOTTO.................................................................................................................. vi KATA PENGANTAR ............................................................................................ vii ABSTRAK ........................................................................................................... viii ABSTRACT ........................................................................................................... ix DAFTAR ISI ........................................................................................................... x DAFTAR TABEL................................................................................................. xiii DAFTAR GAMBAR ........................................................................................... xiv DAFTAR LAMPIRAN ......................................................................................... xv BAB I PENDAHULUAN ....................................................................................... 1 1.1 Latar Belakang ............................................................................................ 1 1.2 Rumusan Masalah ....................................................................................... 2 1.3 Batasan Masalah .......................................................................................... 2 1.4 Tujuan Penelitian ......................................................................................... 3 1.5 Manfaat Penelitian....................................................................................... 3 1.6 Sistematika Penulisan .................................................................................. 3 BAB II TINJAUAN PUSTAKA ............................................................................. 4 2.1 Dasar Teori .................................................................................................. 4 2.1.1 Definisi Citra Digital .............................................................................. 4 2.1.2 Pengolahan Citra Digital ........................................................................ 5 2.1.3 Model Warna .......................................................................................... 5 2.1.4 Segmentasi Citra ..................................................................................... 8 2.1.5 Connected Component Labelling ........................................................... 8 2.1.6 Decision Tree ........................................................................................ 10 2.1.7 Iterative Dichotomiser Tree (ID3) ........................................................ 10 2.1.8 C4.5 ...................................................................................................... 14 2.1.9 Distribusi Normal ................................................................................. 16 x
2.2 Penelitian Terkait ....................................................................................... 17 2.2.1 Quality Evaluation of Rice Using Morphological Methods (Ajay, Suneel, Kumar, & Prasad, 2013) ....................................................................... 17 2.2.2 Klasifikasi Kualitas Beras Berdasarkan Ciri Fisik Berbasis Pengolahan Citra Digital (Suminar, Hidayat, & Atmaja, 2012) ............................... 17 2.2.3 Identifikasi Mutu Fisik Beras dengan Menggunakan Teknologi Pengolahan Citra dan Jaringan Syaraf Tiruan (Somantri, Darmawati, & Astika, 2013) ........................................................................................ 18 2.2.4 A Comparative Study of Decision tree ID3 and C4.5 (Hssina, Merbouha, Ezzikouri, & Erritali, 2013) .................................................................. 18 2.2.5 Predicting Students’ Performance Using ID3 and C4.5 Classification Algorithms (Adhatrao, Gaykar, Dhawan, Jha, & Honrao, 2013) ......... 19 2.3 Rencana Penelitian .................................................................................... 19 BAB III METODOLOGI ...................................................................................... 23 3.1 Pengambilan Data Tekstual ....................................................................... 23 3.2 Penentuan Parameter dan Standar Kualitas Beras ..................................... 24 3.3 Akuisisi Data Citra Digital ........................................................................ 25 3.4 Segmentasi Citra ....................................................................................... 25 3.5 Ekstraksi Ciri dan Identifikasi ................................................................... 27 3.5.1 Analisis Jumlah Bulir Beras ................................................................. 27 3.5.2 Analisis Nilai Putih Beras .................................................................... 28 3.5.3 Analisis Nilai Bersih Beras................................................................... 30 3.5.4 Analisis Nilai Utuh Beras ..................................................................... 32 3.6 Training Data Tekstual .............................................................................. 33 3.7 Klasifikasi Kualitas Beras ......................................................................... 33 3.8 Evaluasi ..................................................................................................... 34 BAB IV HASIL DAN PEMBAHASAN .............................................................. 36 4.1 Pengambilan Data Tekstual ....................................................................... 36 4.2 Penentuan Parameter ................................................................................. 36 4.2.1 Parameter Nilai Utuh dan Noise ........................................................... 36 4.2.2 Parameter Nilai Putih ........................................................................... 37
xi
4.2.3 Parameter Nilai Bersih.......................................................................... 38 4.3 Segmentasi Citra ....................................................................................... 39 4.4 Ekstraksi Ciri dan Identifikasi ................................................................... 40 4.4.1 Analisis Jumlah Bulir Beras ................................................................. 40 4.4.2 Analisis Nilai Putih Beras .................................................................... 40 4.4.3 Analisis Nilai Bersih Beras................................................................... 41 4.4.4 Analisis Nilai Utuh Beras ..................................................................... 42 4.5 Pelatihan Data Tekstual ............................................................................. 43 4.6 Klasifikasi Kualitas Beras ......................................................................... 44 4.7 Pembahasan ............................................................................................... 45 4.7.1 Data Hasil Identifikasi Citra ................................................................. 45 4.7.2 Pohon Keputusan ID3 dan C4.5 ........................................................... 46 4.7.3 Evaluasi ................................................................................................ 47 BAB V KESIMPULAN DAN SARAN ................................................................ 50 5.1 Kesimpulan................................................................................................ 50 5.2 Saran .......................................................................................................... 50 DAFTAR PUSTAKA ............................................................................................ 51 LAMPIRAN .......................................................................................................... 54
xii
DAFTAR TABEL Tabel 2.1. Data klasifikasi .....................................................................................11 Tabel 2.2. Pemilihan root...................................................................................... 12 Tabel 2.3. Pemilihan node 1.1 .............................................................................. 13 Tabel 2.4. Keterkaitan penelitian dengan penelitian sebelumnya ........................ 20 Tabel 3.1. Tabel parameter kualitas beras ............................................................. 24 Tabel 3.2. Confucion matrix hasil klasifikasi ....................................................... 35 Tabel 4.1. Susunan kombinasi data tekstual ......................................................... 36 Tabel 4.2. Penentuan parameter keutuhan dan noise ............................................ 37 Tabel 4.3. Penentuan parameter HSV nilai putih ................................................. 37 Tabel 4.4. Penentuan batas nilai putih .................................................................. 38 Tabel 4.5. Penentuan parameter HSV nilai bersih ................................................ 38 Tabel 4.6. Hasil analisis jumlah bulir beras .......................................................... 40 Tabel 4.7. Hasil analisis nilai putih beras ............................................................. 41 Tabel 4.8. Hasil analisis nilai bersih beras............................................................ 42 Tabel 4.9. Hasil analisis nilai utuh beras .............................................................. 42 Tabel 4.10. Contoh hasil klasifikasi...................................................................... 44 Tabel 4.11. Data informasi kualitas per bulir beras .............................................. 46 Tabel 4.12. Tabel akurasi k-fold cross validation metode ID3 ............................. 48 Tabel 4.13. Tabel akurasi k-fold cross validation metode C4.5............................ 48 Tabel 4.14. Hasil pengujian ID3 ........................................................................... 49 Tabel 4.15. Hasil pengujian C4.5 ......................................................................... 49
xiii
DAFTAR GAMBAR Gambar 2.1. Aturan koordinat citra digital ........................................................... 4 Gambar 2.2. Struktur warna RGB ......................................................................... 6 Gambar 2.3. Struktur warna HSV ......................................................................... 6 Gambar 2.4. Citra grayscale ................................................................................. 7 Gambar 2.5. Representasi citra biner..................................................................... 7 Gambar 2.6. Labelling objek ................................................................................ 9 Gambar 2.7. Pohon keputusan tahap awal ........................................................... 13 Gambar 2.8. Hasil akhir pohon keputusan .......................................................... 14 Gambar 2.9. Kurva distribusi normal .................................................................. 16 Gambar 3.1. Diagram alir metodologi penelitian ................................................ 23 Gambar 3.2. Standar beras berkualitas baik. ....................................................... 24 Gambar 3.3. Data gambar beras. ......................................................................... 25 Gambar 3.4. Diagram alir segmentasi citra biner ................................................ 26 Gambar 3.5. Diagram alir hitung jumlah beras ................................................... 28 Gambar 3.6. Diagram alir analisis nilai putih beras ............................................ 29 Gambar 3.7. Diagram alir analisis nilai bersih beras ........................................... 31 Gambar 3.8. Diagram alir analisis nilai utuh beras ............................................. 33 Gambar 3.9. Diagram alir klasifikasi kualitas beras ............................................ 34 Gambar 4.1. Proses segmentasi citra biner .......................................................... 39 Gambar 4.2. Pohon keputusan ID3 ...................................................................... 43 Gambar 4.3. Pohon keputusan C4.5 .................................................................... 44 Gambar 4.4. Citra hasil labelling jumlah beras ................................................... 45 Gambar 4.5. Pohon keputusan ID3 ...................................................................... 47 Gambar 4.3. Pohon keputusan C4.5 .................................................................... 47
xiv
DAFTAR LAMPIRAN Lampiran 1. Kombinasi Data Tekstual ................................................................ 54 Lampiran 2. Data Informasi Beras Standar ......................................................... 55 Lampiran 3. Hasil Pengujian dengan Sistem ...................................................... 57 Lampiran 4. Tampilan Aplikasi ........................................................................... 60
xv