KLASIFIKASI & PENGENALAN POLA Tatap Muka 2
1
Pendahuluan
Bagaimana manusia mengenali ◦ ◦ ◦ ◦ ◦
Wajah Kata yang didengar Huruf yang ditulis tangan/mesin Bentuk benda Buah yang sudah masak (masih mentah?)
Pengenalan pola mengambil data lalu membuat tindakan berdasar kategori pola 2
Persepsi Mesin
Harus didesain dan dibangun mesin/algoritma yang dapat mengenali pola -- otomasi ◦ ◦ ◦ ◦ ◦
Speech recognition Fingerprint identification Character recognition DNA sequence identification Face recognition (Face detection? Smile detection? Big smile detection? Blink eye detection?) ◦ dan lain-lain
Aplikasi ◦ ◦ ◦ ◦
Keamanan/security (intelijen?) Bioinformatik – CAD (Computer Aided Diagnosis) Industri, proses produksi dan lain-lain 3
Ilustrasi 1 Pemilahan ikan salmon & sea-bass • Sortir dua jenis ikan, salmon dan sea-bass • Ambil gambar dengan kamera • Preprocessing supaya operasi selanjutnya menjadi lebih sederhana (misal dengan segmentasi) • Ekstraksi ciri (yang membedakan kedua jenis ikan) • Panjang ikan • Warna sisik • Lebar badan ikan • Klasifikasikan (tentukan ikan termasuk salmon atau sea-bass)
4
Memilih Ciri (Feature)
Biasanya satu ciri tidak cukup memadai Kasus salmon & sea-bass
Histogram ciri ‘panjang’ ikan
Histogram ciri ‘warna sisik’ ikan
◦ Menggunakan ciri ‘panjang’ error tinggi ◦ Menggunakan ciri ‘warna sisik’ error cukup rendah ◦ Minimalisasi error dengan menambah jumlah ciri yang digunakan, misal ditambah dengan ‘lebar badan ikan’ ◦ Vektor ciri = xT = (x1, x2) = (warna-sisik, lebar badan-ikan) 5
Ilustrasi 2 Klasifikasi leukosit normal & ALL leukosit normal
leukosit ALL
• Klasifikasi leukosit normal & ALL • Akuisisi citra leukosit mikroskopis • Preprocessing supaya operasi selanjutnya menjadi lebih sederhana (misal dengan segmentasi) mengambil sel leukositnya saja • Ekstraksi ciri (yang membedakan kedua jenis sel leukosit), misal: • warna • bentuk • tekstur • Klasifikasikan (tentukan leukositnya normal atau ALL) 6
Contoh hasil segmentasi leukosit hasil pengambangan citra asli
citra asli
hasil pengambangan
citra asli hasil pengambangan
hasil segmentasi hasil contrast-strecthing
hasil contrast-strecthing
hasil segmentasi
hasil contrast-strecthing hasil segmentasi
hasil pengambangan
hasil segmentasi 7
Decision Boundary
Permasalahan: bagaimana menentukan batas yang akan memisahkan wilayah ‘salmon’ dan ‘sea-bass’?
sederhana
kompleks
Trade off – kompleksitas sistem, error, biaya, waktu komputasi 8
Sistem Pengenalan Pola • • •
• •
Sensing -- kamera, mikrofon Segmentation -- memisahkan obyek dari latar belakang Feature extraction (ekstraksi ciri) • Ciri yang menyederhanakan proses klasifikasi • Ciri yang invarian • Kasus ikan : invarian terhadap translasi, rotasi, skala) • Dalam speech recognition: invarian terhadap translasi waktu, perubahan amplitude, durasi kata • Dalam character recognition? Classification • Menggu ciri untuk mengelompokkan obyek/data • Klasifikasi sempurna hampir tak mungkin Post-processing • Tindakan rekomendasi berdasar hasil klasifikasi
9
Siklus Desain
Koleksi data Memilih ciri ◦ Prior knowledge sangat penting ◦ Temukan ciri yang invarian terhadap translasi dan rotasi, insensitif terhadap derau, dan mampu membedakan kelompok-kelompok yang ada
Memilih model ◦ Model 1 berdasar warna sisik dan lebar badan ikan ◦ Model 2 berdasar warna mata dan posisi sirip ◦ dst, mana yang lebih baik?
Pelatihan (training the classifier) dan pengujian ◦ Menggunakan data/ciri (training data dan testing data)
Evaluasi Klasifikasi menggunakan 1 ciri apakah error besar? Klasifikasi menggunakan 2 ciri apakah selalu lebih baik?
Kompleksitas komputasi ◦ Keterbatasan dalam dunia praktis vs skala laboratorium 10
Pembelajaran & Adaptasi Klasifikasi selalu melibatkan pembelajaran (learning) – seringkali sangat time-consuming Jenis pembelajaran:
◦ Terawasi / supervised learning ◦ Tak-terawasi / unsupervised learning / clustering ◦ Reinforcement learning
11
Pengantar Tentang Data
Data yang akan digunakan untuk latihan dalam perkuliahan terdiri atas dua set yaitu: ◦ Set data untuk pelatihan ◦ Set data untuk pengujian Dalam latihan mungkin juga akan digunakan set data yang sama untuk pelatihan dan pengujian
Set data untuk kepentingan kuliah akan disediakan dan diunggah ke web FTI Berikut akan diberikan contoh set data yang bisa digunakan untuk klasifikasi Contoh data pelatihan dan pengujian.pdf
12