PENERAPAN LEARNING VECTOR QUANTIZATION UNTUK IDENTIFIKASI PEMBICARA DENGAN MENGGUNAKAN EKSTRAKSI CIRI PRINCIPAL COMPONENT ANALYSIS
ENDRIK SUGIYANTO
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Penerapan Learning Vector Quantization untuk Identifikasi Pembicara dengan Menggunakan Ekstraksi Ciri Principal Component Analysis adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
Bogor, Maret 2015 Endrik Sugiyanto NIM G64114046
ABSTRAK ENDRIK SUGIYANTO. Penerapan Learning Vector Quantization untuk Identifikasi Pembicara dengan Menggunakan Ekstraksi Ciri Principal Component Analysis. Dibimbing oleh AGUS BUONO. Keunikan manusia yang banyak digunakan sebagai identifikasi adalah sidik jari, wajah, retina, suara, dan DNA. Hingga saat ini, penelitian tentang suara sebagai identifikasi masih banyak diminati. Tujuan penelitian ini adalah mengembangkan metode Learning Vector Quantization (LVQ) untuk identifikasi pembicara dan mengetahui akurasi identifikasi pembicara dengan ekstraksi cirri Principal Component Analysis (PCA). Data yang digunakan adalah suara pembicara sebanyak 10 orang yang direkam selama 2 detik dengan sampling rate 11000 Hz. Perekaman dilakukan sebanyak 50 kali untuk masing-masing pembicara kemudian dinormalisasi. Setelah itu dilakukan ekstraksi ciri menggunakan PCA. Penelitian ini menunjukan bahwa akurasi tertinggi sebesar 96% dari (1) 100 dan 150 epoch dengan learning rate 0.0009, (2) 70 epoch dengan learning rate 0.001. Penurunan learning rate yang digunakan adalah 0.977 dan nilai eigen sebesar 95%. Hasil percobaan menunjukan bahwa, model LVQ dapat mengenali individu dan membedakan individu yang mirip. Kata kunci: identifikasi pembicara, LVQ, PCA.
ABSTRACT ENDRIK SUGIYANTO.Application of Learning Vector Quantization for Speaker Identification with Feature Extraction Using Principal Component Analysis. Supervised by AGUS BUONO. The uniqueness of humans that is widely used as identification includes fingerprints, faces, retinas, voices, and DNA’s. Until now, research on sound as identification is still much on demand. The purpose of this research is to develop Learning Vector Quantization (LVQ) for speaker identification. Feature extraction is conducted using Principal Component Analysis (PCA). The data 2-second voices taken from 10 speakers with sampling rate of 11000 Hz. The recording is perfomed 50 times for each speaker. Afterward, the recording is normalized and extracted using PCA to obtain its features. The results show that we obtain the highest accuracy of 96% with (1) learning rate 0.0009 with 100 epoch and 150 epoch, (2) learning rate 0.001 and 70 epoch. We used the eigen value of 95% and the learning-rate descrease-rate of 0.977. The results suggest the LVQ can recognize individuals and distinguises similar ones. Keywords: LVQ, PCA, speaker identification.
PENERAPAN LEARNING VECTOR QUANTIZATION UNTUK IDENTIFIKASI PEMBICARA DENGAN MENGGUNAKAN EKSTRAKSI CIRI PRINCIPAL COMPONENT ANALYSIS
ENDRIK SUGIYANTO
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015
Penguji: 1 Karlisa Priandana, ST MEng 2 Muhammad Asyhar Agmalaro, SSi MKom
Judul Skripsi : Penerapan Learning Vector Quantization untuk Identifikasi Pembicara dengan Menggunakan Ekstraksi Ciri Principal Component Analysis Nama : Endrik Sugiyanto NIM : G64114046
Disetujui oleh
Dr Ir Agus Buono, MSi MKom Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi MKom Ketua Departemen
Tanggal Lulus:
PRAKATA Puji dan syukur penulis ucapkan kepada Allah subhanahu wata’ala atas segala rahmat karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Solawat serta salam selalu tercurahkan kepada Nabi Muhammad Shalallahu ‘alaihi wa sallam. Tema yang dipilih dalam penelitian ini ialah Penerapan Learning Vector Quantization untuk Identifikasi Pembicara dengan Menggunakan Ekstraksi Ciri Principal Component Analysis. Terima kasih penulis ucapkan kepada: 1 Bapak Dr Ir Agus Buono, MSi MKom selaku dosen pembimbing yang telah banyak memberikan pengarahan, saran dan masukannya. 2 Ibu Karlisa Priandana, ST MEng dan Bapak Muhammad Asyhar Agmalaro, SSi MKom selaku penguji. 3 Emak, Bapak, Kakang, Ayuk serta seluruh keluarga yang telah memberikan dukungan,dan doanya sehingga penulis dapat menyelesaikan karya ilmiah ini. 4 Teman-temansatu bimbingan dan teman-teman Alih Jenis Ilmu Komputer IPB angkatan 6 atas kerjasamanya. 5 Teman-teman Asrama IPB Sukasari dan KAMUS atas persaudaraan yang telah diberikan. Semoga karya ilmiah ini bermanfaat. Bogor, Maret 2015 Endrik Sugiyanto
DAFTAR ISI DAFTAR TABEL ................................................................................................ viii DAFTAR GAMBAR ........................................................................................... viii DAFTAR LAMPIRAN ........................................................................................ viii PENDAHULUAN .................................................................................................. 1 Latar Belakang .................................................................................................... 1 Tujuan Penelitian ................................................................................................. 1 Manfaat Penelitian ............................................................................................... 1 Ruang Lingkup Penelitian ................................................................................... 1 METODE PENELITIAN ........................................................................................ 2 Lingkungan Pengembangan ................................................................................ 2 Pengumpulan Data .............................................................................................. 3 Praproses ............................................................................................................. 4 Pembagian Data ................................................................................................... 4 Ekstraksi Ciri ....................................................................................................... 5 Pelatihan dan Pengujian ...................................................................................... 6 Evaluasi ............................................................................................................... 8 HASIL DAN PEMBAHASAN ............................................................................... 8 Pengambilan Data Suara ..................................................................................... 8 Praproses ............................................................................................................. 9 Pelatihan dan Pengujian ...................................................................................... 9 Evaluasi ............................................................................................................. 10 SIMPULAN DAN SARAN .................................................................................. 12 Simpulan ............................................................................................................ 12 Saran .................................................................................................................. 12 DAFTAR PUSTAKA ........................................................................................... 13 LAMPIRAN .......................................................................................................... 14 RIWAYAT HIDUP ............................................................................................... 15 14
DAFTAR TABEL 1 Parameter pengujian LVQ 2 Matrik confusion suara pembicara
10 12
DAFTAR GAMBAR 1 2 3 4 5 6
Tahapan penelitian Blok diagram proses sinyal Alur proses pemotongan suara Ilustrasi proses frame blocking Arsitektur LVQ Ilustrasi cara kerja LVQ. (a) Bobot mendekati data, (b) Bobot menjauhi data (Desylvia 2013) 7 Ilustrasi silence removing. (a) suara yang belum silence, (b) suara yang sudah silence 8 Rata-rata akurasi PCA 80% berdasarkan epoch 9 Rata-rata akurasi PCA 95% berdasarkan epoch 10 Rata-rata akurasi berdasarkan learning rate
2 3 4 5 7 8 9 10 11 11
DAFTAR LAMPIRAN 1 Hasil percobaan dengan PCA 80% 2 Hasil percobaan dengan PCA 95%
14 14
PENDAHULUAN Latar Belakang Keunikan manusia yang banyak digunakan sebagai identifikasi adalah sidik jari, wajah, retina, suara, dan DNA. Hingga saat ini, penelitian tentang suara sebagai identifikasi masih banyak diminati. Perkembangan penelitian pada bidang identifikasi suara memicu banyak metode baru. Pada penelitian ini akan dilakukan identifikasi pembicara dengan menggunakan metode learning vector quantization (LVQ) yang merupakan suatu metode klasifikasi pola yang masing-masing unit output mewakili kategori atau kelas tertentu. Vektor bobot untuk unit output sering disebut vektor referensi untuk kelas yang dinyatakan oleh unit tersebut. LVQ mengklasifikasikan vektor input dalam kelas yang sama dengan unit output yang memiliki vektor bobot yang paling dekat dengan vektor input. Identifikasi pembicara memerlukan sebuah ekstraksi ciri, yang merupakan proses untuk menentukan satu nilai atau vektor yang dapat dipergunakan sebagai penciri dari suatu objek. Pada penelitian Susanto (2007), identifikasi suara dilakukan dengan menggunakan model jaringan saraf tiruan resilient backpropagation. Akurasi terbaik diperoleh dengan data yang menggunakan noise 30 dB sebesar 92.8%. Selanjutnya, Fansuri (2011) menggunakan LVQ untuk mengklasifikasi genre musik menghasilkan akurasi tertinggi 93.75% untuk durasi 10 detik. Pemilihan untuk ekstraksi ciri principal component analysis (PCA) diajukan karena menghasilkan akurasi 96% dengan menggabungkan metode MFCC pada penelitianPramiyanti (2011).
Tujuan Penelitian Tujuan dari penelitian ini adalah: 1 Mengembangkan metode LVQ untuk identifikasi pembicara. 2 Menghasilkan akurasi identifikasi pembicara dengan menggunakan ekstraksi ciri PCA. Manfaat Penelitian Penelitian ini diharapkan dapat memberikan informasi mengenai akurasi metode LVQ dengan ekstraksi ciri PCA. Ruang Lingkup Penelitian Ruang lingkup penelitian ini adalah: 1 Data yang digunakan adalah suara laki-laki dewasa pada kondisi normal. 2 Penelitian ini hanya sebatas pembuatan model, tanpa pembuatan sistem.
2
METODE PENELITIAN Penelitian ini dilakukan dengan beberapa tahapan, yaitu pengumpulan data, normalisasi, ekstraksi ciri dan pengenalan pola, Gambar 1 menunjukkan tahapan tersebut. Mulai
Pengumpulan Data Suara (500 data suata)
Praproses
Data Latih
Data Uji
PCA
PCA
LVQ
Hasil Pembobotan
Pengujian Model LVQ
Evaluasi
Selesai
Gambar 1 Tahapan penelitian Lingkungan Pengembangan Penelitian ini diimplementasikan menggunakan perangkat keras dan lunak sebagai berikut: 1 Perangkat Keras Spesifikasi perangkat keras yang digunakan adalah: Intel ® Core™ i5-3337U CPU 1.80 GHz. Memori 2 GB. Harddisk 250 GB. Keyboard dan mouse. Headphone. Monitor.
3 2 Perangkat Lunak Sistem operasi Windows 7 Profesional 32 bit. Matlab 7.7.0 (R2008b). Pengumpulan Data Data suara didapatkan dari 10 pembicara yang mengucapkan kata “KOMPUTER” masing-masing pembicara mengucapkan sebanyak 50 kali. Setiap suara direkam pada durasi waktu 2 detik dengan sampling rate 11000 Hz dalam fail berekstensi WAV sehingga diperoleh total data suara sebanyak 500 suara, 390 suara digunakan untuk data latih, 10 untuk bobot dan 100 suara sebagai data uji. Gambar 2 menunjukkan blok diagram proses sinyal dari awal suara diakusisi hingga diperoleh informasi.
Gambar 2 Blok diagram proses sinyal
4 Praproses Pada tahap ini, data akan melalui proses penghapusan silence di awal dan di akhir suara. Proses dapat dilihat pada Gambar 3.
Gambar 3 Alur proses pemotongan suara 1 Normalisasi Normalisasi dilakukan dengan mengabsolutkan nilai-nilai data suara dan mencari nilai maksimumnya. Setiap nilai data suara tersebut dibagi dengan nilai maksimumnya. Hal ini dilakukan agar menormalkan suara sehingga memiliki range nilai amplitudo maksimum satu dan minimum minus satu. 2 Penghapusan Silence Pada proses ini, silence di awal dan di akhir data dihilangkan dengan membuat batas threshold, untuk setiap frame ditandai dengan 1 jika sampel bersuara dan 0 jika sampel tidak bersuara, setelah itu didapat data suara yang tidak ada noise. Pembagian Data Pada tahap ini, dilakukan pembagian data latih dan data uji. Pembagian masing-masing data tersebut adalah 390 untuk data latih, 100 untuk data uji dan 10 untuk bobot. Kemudian data latih yang sudah dipilih akan digunakan sebagai vektor input dan data bobot untuk bobot awal LVQ.
5 Ekstraksi Ciri 1 Frame Blocking Pembagian sinyal suara menjadi beberapa frame yang akan mempermudah perhitungan dan analisa sinyal, setiap frame dengan lebar tertentu yang saling tumpang tindih. Tiap hasil frame dipresentasikan dalam sebuah vektor, panjang frame merupakan bilangan yang bernilai 256, frame dibuat secara tumpang tindih. Pada Gambar 4 di bawah, sinyal suara dibagi ke dalam 9 frame dengan tumpang tindih sebesar 50%.
Gambar 4 Ilustrasi proses frame blocking 2 Windowing
(1)
N : jumlah sampel pada setiap frame N : frame ke-n W(n) : fungsi window hamming 3 Fast Fourier Transform (FFT) FFT merupakan algoritme yang mengimplementasikan Discrete Fourier Transform (DFT), terdiri dari nilai real dan imajiner. DFT mengubah tiap frame dari domain waktu kedalam domain frekuensi yang didefinisikan pada persamaan berikut (Do 1994): (2) Xk Xn k N
: magnitude frekuensi : nilai sampel yang akan diproses pada domain waktu : N/2 + 1 ,j = bilangan imajiner : jumlah data
4 Principal Components Analysis (PCA) PCA merupakan teknik analisis peubah ganda yang sering digunakan untuk mereduksi dimensi data tanpa harus kehilangan nilai informasi. Peubah hasil transformasi PCA merupakan kombinasi linier dari peubah asli dan tersusun
6 berdasarkan informasi yang kandungnya disebut sebagai vektor eigen atau nilai komponen utama (Pramiyanti 2011). PCA merupakan teknik multivariate yang paling banyak digunakan pada hampir semua bidang (Abdi dan Williams 2010). Data masukan pada metode PCA adalah berupa matriks. Dari matriks dihitung kovarian S dengan menggunakan persamaan: (3)
S n Xi X
(X)T
: matrik kovarian : unit sampel : jumlah vektor : rata-rata vektor : transpose dari x
Setelah diperoleh matriks kovarian, ditentukan eigen vektor dan nilai eigen. Nilai eigen yang didapat diurutkan mulai yang terbesar sampai yang terkecil. Selanjutnya, penentuan nilai proporsi yang akan digunakan dalam PCA, besaran nilai proporsi ini berguna untuk menentukan besarnya komponen utama yang digunakan. Komponen utama nantinya akan digunakan sebagai masukan kedalam metode learning vector quantization. Ada beberapa parameter input yang dibutuhkan dalam proses ektraksi ciri, pada penelitian ini adalah inputan berupa suara digital dan disimpan dengan ekstensi fail WAV, time frame yang digunakan pada penelitian ini sebesar 23.27 ms, window hamming merupakan window yang digunakan pada tahapan windowing, overlapping yang digunakan sebesar 0.39 untuk penelitian ini. Overlapping digunakan untuk mengurangi kehilangan informasi pada saat proses frame blocking, nilai eigen sebesar 80% dengan 5 penciri dan 95% dengan 16 penciri. Pelatihan dan Pengujian Jaringan syaraf tiruan LVQ digunakan untuk pelatihan dan pengujian. LVQ merupakan suatu metode klasifikasi pola yang masing-masing unit output mewakili kategori atau kelas tertentu. Vektor bobot untuk unit output sering disebut vektor referensi untuk kelas yang dinyatakan oleh unit tersebut. LVQ mengklasifikasikan vektor input dalam kelas yang sama dengan unit output yang mewakili vektor bobot paling dekat dengan vektor input. Gambar 5 merupakan arsitektur LVQ dalam penelitian ini.
7
Gambar 5 Arsitektur LVQ 1 2 3 4 5
6 7
Algoritme dari LVQ adalah (Fausett, 1994): Tentukan vektor referensi dan learning rate, α (0). Selama kondisi berhenti belum terpenuhi, lakukan langkah 3-6. Untuk setiap vektor masukan X, lakukan langkah 4-5. Temukan j sehingga ||X - Wj|| bernilai minimum. Update nilai Wj sesuai ketentuan berikut: Jika T = Cj, Wj (baru) = Wj (lama) + α [X – Wj (lama)]. Jika T ≠ Cj, Wj (baru) = Wj (lama) – α [X – Wj (lama)]. Kurangi learning rate (Decα), dengan persamaan: α = α * Decα Cek kondisi berhenti: jumlah iterasi mencapai nilai yang ditentukan. dengan: X T Wj Cj ||X - Wj||
(4) (5) (6)
: vektor pelatihan atau vektor masukan ( X1,…,Xi,…Xn) : kategori atau kelas yang benar untuk vektor masukan : vektor bobot untuk unit keluaran j (W1j,…,Wij,…,Wnj) : kategori atau kelas direpresentasikan oleh unit keluaran ke j : jarak euclidean antara vektor masukandan unit keluaran ke j
Menentukan vektor referensi (vektor bobot) yaitu dengan cara mengambil sebanyak satu baris pertama atau terakhir pada vektor data latih dan menggunakannya untuk vektor bobot. Sisa vektor data latih digunakan untuk proses pelatihan. Cara kerja LVQ secara sederhana, yaitu membarui bobot agar lebih mendekati data, jika target samadengan kelas. Jika target tidak sama dengan kelas, bobot yang baru dijauhkan dari data (Desylvia 2013). Hal ini diilustrasikan pada Gambar 6.
8 W(old)
W(new)=W(old)-α(X-W(old)) W(new)=W(old)+α(X-W(old))
W(old)
X-W(old)
X-W(old)
X
X
(a)
(b)
W(old) : data bobot yang lama W(New) : data bobot yang baru X : data target α : learning rate Gambar 6 Ilustrasi cara kerja LVQ. (a) bobot mendekati data, (b) bobot menjauhi data (Desylvia 2013) Evaluasi Evaluasi merupakan tahap terakhir pada metode untuk menentukan apakah proses klasifikasi sudah tepat atau belum. Perhitungan dilakukan dengan membandingkan banyaknya hasil kata pembicara yang benar dengan kata pembicara yang diuji. Hasil dari tahap ini yaitu akurasi yang didapat dengan cara.
HASIL DAN PEMBAHASAN Pengambilan Data Suara Data suara yang digunakan pada penelitian ini direkam dari 10 pembicara yang mengucapkan kata “KOMPUTER”. Agar suara yang dihasilkan tidak banyak noise perekaman dilakukan di ruangan tertutup. Perekaman suara pembicara dilakukan dengan menggunakan fungsi wavrecord pada Matlab yang tidak dibatasi panjang pendek serta tekanan dalam pengucapannya. Suara direkam dengan rentang waktu 2 detik dengan sampling rate 11000 Hz dalam bentuk berekstensi WAV. Dari 10 pembicara masing-masing mengucapkan sebanyak 50 data, sehingga total suara yang dihasilkan sebanyak 500 data.
9 Praproses Data yang telah direkam akan dinormalisasi dengan mengabsolutkan dan memaksimumkan nilai data suara agar memiliki nilai amplitudo maksimum satu dan minimum minus satu. Data yang sudah diabsolutkan akan dihapus bagian awal dan akhirnya untuk menghilangkan noise yang adadengan algoritma silence removing. Contoh hasil dari silence removing yang dilakukan dapat dilihat pada Gambar 7.
(a)
(b)
Gambar 7 Ilustrasi silence removing. (a) suara yang belum silence, (b) suara yang sudah silence Proses selanjutnya adalah pembagian data. Data suara diambil sebanyak 500 suara dari 10 pembicara yang terbagi sebanyak 390 data latih, 100 data uji dan 10 untuk bobot. Pada penentuan bobot diambil dari data suara yang ke-40. Selanjutnya penentuan data uji diambil dari rekaman suara yang ke-41 sampai 50 dan sisanya menjadi data latih. Pelatihan dan Pengujian Data yang digunakan untuk proses pelatihan dan pengujian adalah data yang sudah dibagi manjadi data latih, data uji dan data bobot. Parameter yang diperlukan untuk LVQ adalah jumlah neuron input yang disesuaikan dengan nilai eigen PCA 80% yaitu sebanyak 5 penciri dan 95% sebanyak 16 penciri. Jumlah neuron output ditentukan berdasarkan jumlah kelas sebanyak 10 kelas. Learning rate yang digunakan adalah 0.0001, 0.0003, 0.0005, 0.0007, 0.0009, 0.001, 0.003, 0.005, 0.007, 0.009, 0.01, 0.03, 0.05, 0.07, dan 0.09. Penurunan learning rate yang digunakan sebesar 0.977. Jumlah epoch adalah pengulangan yang dilakukan utuk setiap iterasi. Bobot yang digunakan sebagai inisialisasi LVQ didapat dari salah satu data suara yang masing-masing mewakili tiap kelas. Data yang digunakan untuk bobot ini dipisahkan dari dari uji dan data latih. Tabel 1 menunjukkan parameter yang dimasukkan pada LVQ.
10
Neuron Input Neuron Output Epoch Learning Rate
Penurunan Learning Rate
Tabel 1 Parameter pengujian LVQ Parameter LVQ 5 untuk PCA 80% dan 16 untuk PCA 95% 10 30, 50, 70, 100, 150 dan 200 0.0001, 0.0003, 0.0005, 0.0007, 0.0009, 0.001, 0.003, 0.005, 0.007, 0.009, 0.01, 0.03, 0.05, 0.07, dan 0.09 0.977
Evaluasi Gambar 8 menyajikan akurasi hasil percobaan enam kali epoch yang berbeda yaitu 30, 50, 70, 100, 150 dan 200. Terlihat bahwa pada nilai eigen 80% rata-rata akurasi terendah sebesar 74.8% terdapat pada epoch 30 dan nilai rata-rata akurasi tertinggi sebesar 77.6% terdapat pada epoch 100. Dapat dilihat bahwa nilai epoch pada eigen 80% dari 30 sampai 100 mengalami kenaikan akurasi, sedangkan nilai epoch dari 150 sampai 200 mengalami penurunan akurasi. Oleh karena itu, dapat disimpulkan bahwa nilai epoch terbaik adalah 100.
Gambar 8 Rata-rata akurasi PCA 80% berdasarkan epoch Gambar 9 menyajikan akurasi hasil percobaan enam kali epoch yang berbeda yaitu 30, 50, 70, 100, 150 dan 200. Terlihat bahwa pada nilai eigen 95% rata-rata akurasi terendah sebesar 76.27% terdapat pada epoch 30 dan nilai ratarata akurasi tertinggi sebesar 86% terdapat pada epoch 150. Dapat dilihat bahwa nilai epoch dari 30 sampai 150 mengalami kenaikan akurasi, sedangkan nilai epoch 200 mengalami penurunan akurasi. Oleh karena itu, dapat disimpulkan bahwa nilai epoch terbaik adalah 150.
11
Gambar 9 Rata-rata akurasi PCA 95% berdasarkan epoch Gambar 10 menyajikan hasil rata-rata akurasi percobaan nilai learning rate 0.0001, 0.0003, 0.0005, 0.0007, 0.0009, 0.001, 0.003, 0.005, 0.007, 0.009, 0.01, 0.03, 0.05, 0.07, dan 0.09. Terlihat hasil rata-rata akurasi pada nilai eigen 80% akurasi terendah didapat pada learning rate 0.09 sebesar 10% dan akurasi tertinggi sebesar 89.67% pada learning rate 0.0009 dan 0.001. Pada nilai eigen 95% rata-rata akurasi terendah sebesar 62.67% terdapat pada learning rate 0.09 dan nilai rata-rata akurasi tertinggi sebesar 94.5% terdapat pada learning rate 0.0009. Dapat dilihat bahwa nilai learning rate dari 0.0001 sampai 0.0009 mengalami kenaikan akurasi, sedangkan nilai learning rate dari 0.001 sampai 0.09 mengalami penurunan akurasi. Oleh karena itu, dapat disimpulkan bahwa nilai learning rate terbaik adalah 0.0009. Tabel perhitungan hasil percobaan untuk PCA 80% dan 95% dapat dilihat pada Lampiran 1 dan 2.
Gambar 10 Rata-rata akurasi berdasarkan learning rate
12 Berdasarkan pada Tabel 2 matrik confusion dengan kontribusi nilai eigen 95%, parameter learning rate 0.0009 dan epoch 100 menghasilkan nilai akurasi pembicara sebesar 96%. Pembicara yang menghasilkan akurasi tertinggi yaitu 100% adalah Aji, Buldani, Chandra, Endrik, Janan, dan Uci. Pembicara tersebut dapat teridentifikasi dengan baik karena memiliki noise lebih kecil daripada pembicara lainnya. Pembicara yang menghasilkan akurasi 90% adalah Allan, Janan, Restu dan Vikhy. Kesalahan terdapat pada kelas pembicara. Dari 10 percobaan, Allan teridentifikasi sebagai Restu, Janan teridentifikasi sebagai Chandra, Restu 1 teridentifikasi sebagai Allan dan Vickhy teridentifikasi sebagai Buldani. Kesalahan identifikasi tersebut disebabkan oleh banyaknya noise yang ada pada data suara dan kemiripan suara pembicara. Tabel 2 Matrik confusion suara pembicara Aktual Aji Allan Buldani Chandra Endrik Janan Restu Taufik Uci Vickhy
Aji
Allan
Buldani
Chandra
Prediksi Endrik Janan
Restu
Taufik
Uci
Vikhy
Ratarata
0 0 0 0 0 0 0 0 0
9 0 0 0 0 1 0 0 0
0 10 0 0 0 0 0 0 1
0 0 10 0 1 0 0 0 0
0 0 0 10 0 0 0 0 0
1 0 0 0 0 9 0 0 0
0 0 0 0 0 0 10 0 0
0 0 0 0 0 0 0 10 0
0 0 0 0 0 0 0 0 9
100% 90% 100% 100% 100% 90% 90% 100% 100% 90%
0 0 0 0 9 0 0 0 0
SIMPULAN DAN SARAN Simpulan Penelitian ini telah berhasil menerapkan LVQ untuk identifikasi pembicara dengan menggunakan ekstraksi ciri PCA. Akurasi tertinggi yang diperoleh adalah 96% dari 100 dan 150 epoch dengan learning rate 0.0009 dan 70 epoch dengan learning rate 0.001. Penurunan learning rate yang digunakan adalah 0.977 dan nilai eigen sebesar 95%. Hasil percobaan menunjukan bahwa, model LVQ dapat mengenali individu dan membedakan individu yang mirip. Saran Saran untuk pengembangan selanjutnya, yaitu: 1 Penambahan jumlah data training untuk memberikan hasil yang maksimal. 2 Penggunaan metode ekstraksi ciri yang lain untuk memperoleh akurasai yang lebih baik. 3 Pencarian kombinasi nilai parameter dari LVQ yang lain untuk pengenalan pembicara. 4 Penambahan metode penghilangan noise untuk data suara yang lebih baik.
13
DAFTAR PUSTAKA Abdi H, Williams LJ. 2010. Principal component analysis. Wiley Interdisciplinary Reviews: Computational Statistics 2. 2: 433–459. Desylvia SN. 2013. Perbandingan SOM dan LVQ pada identifikasi citra wajah dengan wavelet sebagai ekstraksi ciri [skripsi]. Bogor (ID): Institut Pertanian Bogor. Do MN. 1994. Digital signal processing mini-project: an automatic speaker recognition system. Lausanne (CH): Swiss Federal Institute of Technology. Fansuri MR. 2011. Klasifikasi genre musik menggunakan learning vector quantization (LVQ) [skripsi]. Bogor (ID): Institut Pertanian Bogor. Fausett L. 1994. Fundamental of Neural Network: Architectures, Algorithm, and Application. United States (US): Prentice-Hall. Pramiyanti T. 2011. Pengembangan model sistem identifikasi pembicara dengan kombinasi teknik ekstraksi ciri suara mel-frequency cepstral coefficients (MFCC) dan principal component analysis (PCA). Jakarta (ID): UPNVJ. Susanto N. 2007. Pengembangan model jaringan syaraf tiruan resilent backprogation untuk identifikasi pembicara dengan praproses MFCC [skripsi]. Bogor (ID): Institut Pertanian Bogor.
14
LAMPIRAN Lampiran 1 Hasil percobaan dengan PCA 80% Learning Rate 0.0001 0.0003 0.0005 0.0007 0.0009 0.001 0.003 0.005 0.007 0.009 0.01 0.03 0.05 0.07 0.09 Rata-rata
epoch 30 68.00 71.00 76.00 76.00 82.00 83.00 84.00 84.00 84.00 84.00 84.00 82.00 77.00 77.00 10.00 74.80
50 68.00 69.00 76.00 82.00 91.00 92.00 84.00 84.00 84.00 82.00 82.00 82.00 76.00 75.00 10.00 75.80
70 68.00 70.00 77.00 84.00 92.00 92.00 84.00 84.00 82.00 82.00 82.00 82.00 82.00 76.00 10.00 76.47
100 67.00 72.00 82.00 91.00 92.00 90.00 84.00 84.00 82.00 82.00 82.00 82.00 82.00 82.00 10.00 77.60
150 67.00 73.00 82.00 92.00 91.00 87.00 84.00 82.00 82.00 82.00 81.00 82.00 81.00 81.00 10.00 77.07
200 67.00 74.00 83.00 92.00 90.00 86.00 84.00 82.00 82.00 81.00 81.00 81.00 81.00 81.00 10.00 77.00
150 87.00 91.00 93.00 95.00 96.00 93.00 87.00 87.00 83.00 83.00 78.00 83.00 78.00 78.00 78.00 86.00
200 87.00 91.00 93.00 95.00 94.00 91.00 87.00 87.00 83.00 83.00 78.00 83.00 78.00 78.00 78.00 85.73
Ratarata 67.50 71.50 79.34 86.11 89.67 88.33 84.00 83.33 82.67 82.17 82.00 81.67 79.83 78.67 10.00
Lampiran 2 Hasil percobaan dengan PCA 95% Learning Rate 0.0001 0.0003 0.0005 0.0007 0.0009 0.001 0.003 0.005 0.007 0.009 0.01 0.03 0.05 0.07 0.09 Rata-rata
epoch 30 79.00 87.00 88.00 91.00 92.00 92.00 87.00 87.00 85.00 85.00 85.00 79.00 49.00 31.00 27.00 76.27
50 81.00 88.00 90.00 92.00 94.00 95.00 87.00 87.00 85.00 83.00 82.00 78.00 69.00 56.00 43.00 80.67
70 81.00 88.00 91.00 94.00 95.00 96.00 87.00 87.00 84.00 80.00 80.00 78.00 79.00 73.00 72.00 84.33
100 83.00 88.00 92.00 94.00 96.00 94.00 87.00 87.00 83.00 80.00 80.00 78.00 78.00 78.00 78.00 85.07
Ratarata 83.00 88.83 91.17 93.50 94.50 93.50 87.00 87.00 83.83 82.33 80.50 79.83 71.83 65.67 62.67
15
RIWAYAT HIDUP Penulis dilahirkan di Natar, Lampung pada tanggal 7 Agustus 1990. Penulis merupakan anak kesembilan dari 9 bersaudara dari pasangan Mursiam dan Tukijan. Tahun 2008 penulis lulus dari SMA Negeri 1 Natar Lampung Selatan dan pada tahun yang sama penulis melanjutkan pendidikan Program Studi D3 Manajemen Informatika, Universitas Lampung dan lulus pada tahun 2011. Penulis kemudian melanjutkan studi ke Program S1 Ilmu Komputer Alih Jenis, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.