TEDC Vol. 8 No. 3 September 2014
ISSN: 1978 – 0060
TEDC
JURNAL ILMIAH BERKALA
VOLUME 8 , NOMOR 3,
SEPTEMBER 2014
SUSUNAN PENGELOLA
Penerbit
:
Unit Penelitian, Pengembangan dan Pengabdian Masyarakat Politeknik TEDC Bandung
Pembina/Penasehat
:
Drs. Sueb, M.Si., M.Pd.. (Direktur Politeknik TEDC Bandung).
Penanggung Jawab
:
Dendin Supriadi, S.Pd., MT (Pembantu Direktur I Politeknik TEDC Bandung).
Pemimpin Umum
:
Drs. Soekandar, BE., Dipl.Ed (Ketua Unit Penelitian, Pengembangan dan Pengabdian Masyarakat Politeknik TEDC Bandung).
Pemimpin Redaksi
:
Drs. Sutomo, M.Ed.
Sekretaris Redaksi
:
Yurike, ST., MT
Dewan Redaksi
:
Drs. Koharudin, M.Si Drs. Nugoho, M.S.H., M.Pd Yeti Suryati, S.Kep., S.Pd., M.M.Pd Drs. Chrestian Masemah., M.Pd Drs. Dodo Suhanda, M.Pd Drs. Darwis Sembiring, M.Pd Vitrasia, DUT., ST., MT
Redaksi Ahli
:
Dr. Dedi Lazuardi, DEA. Dr.Ir. Paulus Sukapto, MBA. Drs. Abdullah, M.Pd. Dr. Djadja Hadimaulana, Ir. Anton Gultom, SST., M.Pd. Drs. Pangoedi Rahardjo, M.Ed. Dahlan Kosasih, S.Pd., MT. Boyke Nugrahanto, SE., M.Ak. Ida Bagus Budiyanto, S.Kom., MT Dra. Srimara, THT., BSC., M.M.Pd. Dra. Ine. Martinah, MM
Kesekretariatan
:
Teddy Sutresna, Ir Mamay Sani, SST Indra Hermawan, SE Joseph Tum Murwanta, S.Si
Alamat Redaksi
:
Politeknik TEDC Bandung Jl. Pesantren km. 2 Cimahi 40513. Telp/Fax : (022) 6645951.
TEDC Vol. 8 No. 3 September 2014
ISSN: 1978 – 0060
TEDC
JURNAL ILMIAH BERKALA
VOLUME 8 , NOMOR 3,
SEPTEMBER 2014
Dari Redaksi: Alhamdulillah puji syukur kami panjatkan ke hadirat Tuhan Yang Maha Esa, Jurnal TEDC Volume 8 Nomor 3 September 2014 dapat diterbitkan oleh Unit Penelitian, Pengembangan dan Pengabdian Masyarakat Politeknik TEDC Bandung. Jurnal TEDC ini sudah diusahakan sesuai dengan aturan naskah yang telah ditetapkan DIKTI, sehingga diharapkan dapat segera terakreditasi. Kami senantiasa akan mengusahakan Jurnal TEDC terbit tiga kali penerbitan dalam setahun yaitu pada bulan Januari, Mei dan September. Kami mengucapkan selamat kepada para penulis yang tulisannya telah dimuat pada edisi September 2014. Mudah-mudahan Jurnal TEDC ini dapat menambah wawasan khususnya bagi penulis dan pembaca pada umumnya. Bandung, September 2014. Redaktur.
Jurnal TEDC merupakan jurnal Ilmiah berkala yang diterbitkan oleh Unit Penelitian, Pengembangan dan Pengabdian Masyarakat Politeknik TEDC Bandung. Redaksi mengundang para profesional dari dunia pendidikan, penelitian dan industri untuk menulis dan mempublikasikan artikel ilmiah berupa hasil penelitian, gagasan, dan konsepsi dalam ilmu pendidikan, ilmu pengetahuan, teknologi, seni, ekonomi dan bisnis maupun bidang-bidang ilmu lainnya serta tulisan-tulisan rekayasa, baik hasil penelitian maupun non hasil penelitian dari kalangan akademisi Politeknik TEDC maupun dari luar Politeknik TEDC.
Dilarang mengcopy, mengutip sebagian atau seluruhnya tanpa seizin penerbit.
TEDC Vol. 8 No. 3 September 2014
DAFTAR ISI. 1.
Perancangan aplikasi tag writer communication berbasis android. Ferry Satria
2.
Pengukuran fiber optik menggunakan photon kinetics 2400 optical 191 – 197 geometry
dengan
teknologi
near
field 186 –190
M. Farid Susanto 3.
Pengukuran energi listrik tidak langsung menggunakan KWH meter dan 198 –204 KVARH Meter. Dwi Asmono, Supriyanto
4.
Potensi biobriket berbahan baku blotong dinilai dari nilai kalor, waktu 205– 210 nyala, dan waktu pembakaran Andy Chandra
5.
Perancangan instalasi dan simulasi sistem monitoring pengendalian bahan 211 – 216 bakar minyak berdasarkan data RFID Vitrasia
6.
Kestabilan ketinggian level air pada bejana penampung mengggunakan 217 –224 ANFIS (Adaptive Neuro-Fuzzy Inference Systems) berbasis arduino Budi Setiadi
7.
Rancang bangun pengendali otomatis pada mesin oil separator berbasis 225 – 231 PLC ( Programmable Logic Controller) Eva Damayanti
8.
Analisa nilai dan resiko TI pada BRI menggunakan ISO 31000 Tri Herdiawan Apandi
9.
Distribusi spasial spesies simpatrik lalat buah (B. Carambolae dan B. 237– 241 Papayae) di daerah Jawa Barat Indonesia Hida Arliani Nur Anisa
10.
Relevansi dakwah kreatif (analisis terhadap dakwah kreatif yang 242 – 247 dikembangkan lembaga IHAQI di kota Bandung) Irfan Setia Permana
11.
Metode pelayanan yang cepat dalam pertumbuhan iman mahasiswa kristen 248– 253 di Politeknik TEDC Bandung Asmat Purba
12.
Analisis Performance multicast routing Tri Herdiawan Apandi
232 –236
254 – 258
TEDC Vol. 8 No. 3 September 2014
13.
Perbandingan metode pengenalan sinyal bicara berbahasa Indonesia 259– 263 berbasis statistik terhadap pengenalan suara berbasis frekuensi comparison of frequency and statistics method for voice recognition in Indonesia language Eva Damayanti
5.
Tinjauan teologis dan edukatif terhadap pluralitas agama serta tugas dosen 264 – 268 pendidikan agama kristen Asmat purba
Perbandingan metoda pengenalan sinyal bicara bahasa Indonesia..........
(Eva Damayanti)
PERBANDINGAN METODE PENGENALAN SINYAL BICARA BERBAHASA INDONESIA BERBASIS STATISTIK TERHADAP PENGENALAN SUARA BERBASIS FREKUENSI COMPARISON OF FREQUENCY AND STATISTICS METHOD FOR VOICE RECOGNITION IN INDONESIA LANGUAGE
Eva Damayanti Dosen Teknik Elektro Politeknik TEDC Bandung E-mail:
[email protected]
Abstract This study is aimed at investigating the effectiveness of two methodsfor speech recognition, the statisticsbased feature extraction and the frequency-based feature extraction. The study of voice identification system was carried out by testing the samples of different human sounds.The process of obtaining and analyzing the voice has several steps. First, the voice samples in thewav format were collectedand stored into the database. Second, the characteristics of those voiceswere extracted using statistical or frequencyfeature extraction methods. The statistical methods were conducted using the SSC method, autocorrelation and LPC, while the frequency method were carried out using FFT , STFT and RSD. Third, the results of the extraction werestored in a feature vector and then they were compared using euclidean distance, the distance value indicating the characteristics in common.The experimentsused male and female voiceswhen they uttered letters, both vowels and consonants, and numbers. The results indicated that the best FFT algorithm was for the letters of female voices/vowels with the highest distance value among letters was 5.49 in average and the highest distance value for the consonant letters was 5.63 in average (with the FFT algorithm). The highest distance value of male voices/vowels was 5.23 in average (the FFT algorithm as well as) and the highest distance value for consonant was 5.36 in average. In addition, the best rate was the FFT with the highest average distance of 5.92.
Key words: Voice recognition , statistics , frequency. I. Pendahuluan 1.1 Latar Belakang Suara merupakan suatu bentuk lazim dari sebuah komunikasi. Perkembangan terakhir menciptakan kemungkinan bahwa suara dapat digunakan dalam sistem keamanan[1]. Dalam pengenalan suara, tujuan yang ingin dicapai adalah menggunakan sampel dari suara untuk menentukan identitas seseorang yang mengeluarkan suara tersebut. Teknik ini memungkinkan penggunaan suara seseorang untuk memverifikasi identitas dan mengendalikan akses terhadap suatu layanan tertentu misalnya panggilan suara (voice dialing), telepon banking, akses database, akses informasi, bahkan akses ke suatu tempat/ruangan tertentu[6]. Perkembangan riset pengenalan suara semakin meningkat, untuk hasil yang lebih baik setidaknya diketahui terlebih dahulu bahwa suara tersebut berasal dari seorang pria atau wanita. Pada 259
penelitian sebelum sudah dilakukan penelitian tentang ekstraksi ciri untuk pengenalan sinyal suara yang digunakan untuk keperluan mengenali sinyal suara untuk menguji kemiripan sinyal suara atau dapat membedakan sinyal suara yang memiliki intonasi yang tinggi, rendah atau datar serta sinyal suara tanpa emosi maupun dengan emosi. Ekstraksi ciri yang digunakan pada penelitian sebelumnya adalah MelFrequency Cepstrum Coefficients (MFCC) , energy bit, dan Vector Quantization (VQ)[11]. Metode ekstraksi ciri yang digunakan untuk penelitian ini adalah metode berbasis Statistik dan berbasis frekuensi. Di mana sinyal suara terlebih dulu akan melalui proses preprocessing, ekstraksi ciri berbasis statistik yaitu dengan Statistical Signal Characterization (SSC), autokorelasi dan Linear Predictive Coding (LPC), sedangkan pada ekstraksi ciri
TEDC Vol.8 No.3 September 2014: 259-263
berbasis frekuensi yaitu dengan Fast Fourier Transform (FFT), Short-Time Fourier Transform (STFT) dan Rapat Spektral Daya (RSD). Dalam penerapannya, penelitian ini memanfaatkan MATLAB 2009a untuk mengolah data masukan yang didapatkan. 1.2 Tujuan Tujuan dan manfaat yang ingin dicapai dalam penyusunan penelitian ini adalah Membandingkan algoritma pengenalan suara berbasis statistik dan frekuensi , guna mendapatkan parameter mana yang lebih baik.
sebagai fungsi waktu, dalam hal ini ketika diamati pada durasi yang sangat pendek (5 sampai 100 mili detik) karakteristiknya masih stasioner. Tetapi bilamana diamati dalam durasi yang lebih panjang (> 1/5 detik) karakteristik sinyalnya berubah untuk merefleksikan wicara yang keluar dari pembicara. Gambar 2.3 menunjukkan tiga kondisi dasar sinyal wicara pada manusia. Tiga kondisi dasar tersebut adalah silence, jedah dan voiced.
1.3 Batasan Masalah Untuk memaksimalkan kinerja penelitian yang dibuat serta menghindari terjadinya kesalahan persepsi mengenai fokus dan isi penelitian. Dalam penelitian ini dilakukan pembatasan masalah sebagai berikut : sumber sinyal suara latih maupun uji adalah rekaman sinyal suara WAV, dengan yang menggunakan frekuensi sampling 8.000 Hz dan
durasi 2 detik. Jumlah rekaman sinyal suara untuk setiap orang terdiri dari angka (0-9) dan huruf (a-z) dalam bahasa Indonesia. Pembuatan program menggunakan bantuan Matlab seri 2009a.
dilakukan dengan bahasa pemrograman
II. Dasar teori 2.1 Pengenalan Sinyal Suara Secara umum, proses pengolahan sinyal suara pada penelitian ini terdiri dari tahapan-tahapan : sampling, frame blocking, windowing, normalisasi dan cropping. 2.2 Pengenalan Suara Berbasis Statistik Pada umumnya pengenalan sinyal suara tersebut melalui dua proses penting yaitu: 1. Feature Extraction. 2. Pattern classification.
Gambar 2.2 Statistik dalam amplitudo dan waktu
2.3 Pengenalan Suara Berbasis Frekuensi Sinyal suara merupakan sinyal yang bervariasi lambat
Gambar : Tiga Kondisi Dasar Sinyal Wicara Manusia
2.4 Pengukuran Jarak Dalam tahap pengenalan sinyal suara, yang tak dikenal direpresentasikan oleh deretan vektor-vektor ciri (x1, x2 ….xi), dan kemudian ini dibandingkan dengan codebook dari filebase. Persamaan yang digunakan untuk menghitung jarak Euclidean dapat didefinisikan dengan jarak Euclidean antara dua titik, yaitu: P = (p1, p2…pn) dan Q = (q1, q2...qn).
dimana D adalah jarak Euclidean antara 2 vektor P dan Q III. Pemodelan sistem Sistem yang telah dibangun adalah sebuah sistem yang dapat mengenali sinyal suara seseorang dengan format wav untuk tujuan pengenalan sinyal suara. Pada tahap proses, data wav melalui proses preprocessing yaitu frame blocking, windowing, normalisasi dan cropping. Setelah data wav melalui proses preprocessing, maka pada data tersebut dilakukan ekstraksi ciri yaitu pengambilan berbasis statistik dan berbasis frekuensi. Untuk lebih jelasnya dapat dilihat diagram blok sistem pada Gambar 3.1 berikut: 3.1 Diagram Blok Sistem
260
Perbandingan metoda pengenalan sinyal bicara bahasa Indonesia..........
(Eva Damayanti)
Pada proses latih dilakukan pengambilan ciri latih untuk menjadi ciri acuan pada saat proses uji.
Gambar 3.1 Diagram Blok Sistem
3.2 Perancangan Sistem Berikut ini adalah perancangan sistem yang akan dibangun Ilustrasi dari proses dapat dilihat pada Gambar 3.2 dan gambar 3.3
3.3 Sinyal latih dan sinyal uji Sebelum sistem dirancang, langkah pertama yang dilakukan dalam penelitian ini adalah merekam sinyal suara. Adapun langkah – langkah yang dilakukan adalah sebagai berikut Perekaman sinyal suara dalam perekaman sinyal suara ini dilakukan didalam ruangan kedap suara di laboratorium pengolahan sinyal digital IT Telkom. Sinyal suara tersebut direkam menggunakan mikropon beserta perangkat lunak Cool Edit Pro 2.0. Suara tersebut direkam secara mono menggunakan frekuensi sampling 8 KHz, bit kuantisasi sebesar 16 bit dan disimpan dalam bentuk file wav. Sinyal suara tersebut direkam sepanjang ±2 detik dan sebanyak 20 sampel (10 sampel laki – laki dan 10 sampel wanita yang berbeda). Dari 20 sampel tersebut, 10 sampel (10 laki – laki dan 10 wanita) digunakan untuk tahap pelatihan dan 10 sampel yang tersisa digunakan untuk tahap pengujian. 3.4 Preprocessing Dalam tahap preprocessing ini terdiri dari beberapa langkah yaitu pengubahan sinyal masukan ke dalam frame blocking, windowing, normalisasi dan terakhir adalah cropping. 3.5 Perancangan Form GUI Sistem Pengenalan Suara Setelah sistem Pengenalan sinyal suara berbasis Statistik dan berbasis Frekuensi dirancang untuk verifikasi penutur dan untuk ekstraksi ciri kata yang diucapkan, maka dapat dibuat software yang berbentuk form Graphical User Interface (GUI) pada MATLAB yang berfungsi sebagai antarmuka bagi user dalam menggunakan software ini.
Gambar 3.2 Flowchart Latih
Dalam GUI yang dirancang tersebut terdapat enam buah tombol command yang masing - masing berupa tombol SSC, Autokorelasi dan LPC untuk berbasis statistik,sedangkan untuk berbasis frekuensi FFT, STFT dan RSD.
Gambar 3.3 Flowchart uji Gambar 3.4 Tampilan Form GUI
261
TEDC Vol.8 No.3 September 2014: 259-263
IV. Hasil simulasi dan analisa Dalam penelitian ini dibuat simulasi dalam bentuk GUI (Guide User Interface) yang menampilkan perbandingan metode pengenalan suara berbasis statistik (SSC, Autokorelasi dan LPC) dan frekuensi (FFT, STFT dan RSD). Dari GUI tersebut dapat dilihat antara lain amplitudo dua sinyal suara dalam domain waktu, hasil ektraksi ciri, dan spektogram. Selain itu, dapat dilihat hasil perhitungan Euclidien Distance antara dua sinyal yang dibandingkan ektraksi cirinya dengan menggunakan batas ambang atau threshold 0,05. 4.1 Hasil Pengetesan Ucapan Huruf Vokal Laki-laki Berbasis Frekuensi dan Berbasis Statistik
Kesimpulan dan Saran Kesimpulan 1) Hasil perhitungan jarak Euclidean pengenalan suara berbasis statistik menunjukkan bahwa parameter SSC (Statistical Signal Characterization) memberikan jarak terkecil, sedangkan parameter autokorelasi memberikan jarak terbesar. Artinya parameter autokorelasi lebih bisa membedakan suara, jadi dengan perkataan lain parameter autokorelasi lebih baik dari parameter SSC untuk dipakai pada sistem pengenalan suara. 2) Hasil perhitungan jarak Euclidean pengenalan suara berbasis frekuensi menunjukkan bahwa parameter RSD (Rapat Spektral Daya) memberikan jarak terkecil, sedangkan parameter FFT (Fast Fourier Transform) memberikan jarak terbesar. Artinya parameter FFT lebih bisa membedakan suara, jadi dengan perkataan lain parameter FFT lebih baik dari parameter RSD untuk dipakai pada sistem pengenalan suara. 3)
4.2 Hasil Pengetesan Ucapan Huruf Konsonan Laki-laki Berbasis Statistik dan Frekuensi
4.3 Hasil Pengetesan Ucapan Huruf Vokal Wanita Berbasis Statistik dan Frekuensi
Parameter yang baik adalah berbasis frekuensi, karena hasil jarak Euclidean pengenalan suara jaraknya terbesar (5,914) terhadap berbasis statistik (1,43).
Saran Untuk penelitian selanjutnya, proses klasifikasi perlu dilakukan untuk memperkuat kesimpulan yang didapat pada penelitian ini. Daftar Pustaka [1]. Analisis of a wav line http://www.ymec.com/hp/signal2/gitar1.htm di download pada 26 Juli 2012 pukul 11.08 WIB [2].Furui, S., Digital Speech Processing, Synthesis,and Recognition, Marcel Dekker, Inc., New York, 1989. [3].Gerhard, D., Pitch Extraction and Fundamental Frequency: History and Current Techniques,Department of Computer Science University of Regina, Regina, 2003. [4]. Hansel, D., B Littlefield, J Edyanto, Matlab Bahasa Komputasi Teknis, Andi, Yogyakarta,2001. [5]. Harinaldi, Prinsip-Prinsip Statistik Untuk Teknik dan Sains, Penerbit Erlangga, Jakarta,2005. [6]. Hidayatno, A. dan Sumardi, Pengembangan dan Pendikte Otomatis Ucapan Bahasa Indonesia, Fakultas Teknik UNDIP, Semarang,2006. [7]. Ifeachor, E.C., Digital Signal Processing : A Practical Approach, Addison-Wesley Publishers Ltd., New York, 1993.
4.4 Hasil Pengetesan Ucapan Huruf Konsonan Wanita Berbasis Statistik dan Frekuensi
[8]. Proakis, J., G., Manolakis D., G., Pemrosesan Sinyal Digital: Prinsip, Algoritma, dan Aplikasi, 262
Perbandingan metoda pengenalan sinyal bicara bahasa Indonesia..........
Edisi bahasa Indonesia, PT Prehallindo, Jakarta, 1997. [9].
Rabiner, L., Biing-Hwang Juang. Fundamentals Of Speech Recognition, Prentice Hall, New Jersey, 1993.
[10]. Sudjana, Metoda Statistika, Penerbit Tarsito, Bandung, 2002. [11]. Fachrudin AN (L2F099604), Pengenalan Pengucap Tak Bergantung Teks dengan Metode Vector Quantization (VQ) Melalui Ektraksi Linear Predictive Coding (LPC),Universitas Diponegoro
263
(Eva Damayanti)