Perancangan Program Voice Recognition untuk Aplikasi Searching Pada World Wide Web denganMetode Hidden Markov Model Samuel Mahatmaputra TedjojuwonomS.Kom.M.Info.Tec; Ro’fah Nur Rachmawati,S.Si.,M.Si ; Deny Yovianto ABSTRACT Biometrics in general is the study of automated methods for recognizing humans by the human body, human attitudes and habits that have a uniqueness that can be used in the process of identification and verification. A given person's biometric is compared with existing data in the database so it can later be known to anyone about him. Voice Recognition has the advantage of not requiring a difficult tool, easy to apply, to any person, the cost is more expensive. The purpose of this thesis is to create a voice recognition program that will be used for searching applications on the world wide web by hidden Markov model method. The workings of this program through several stages of the vote, voice conversion, comparison with grammar, comparisons with the database and produce an answer. Votes taken in the form of analog signals and the signal is converted into digital signals and then processed by the method of hidden Markov model after processing the data it obtained a data to be compared with existing data in a database world wide web and produce an answer. Keywords: Searching ,world wide web, Voice Recognition,Hidden Markov Model. ABSTRAK Biometrik secara umum adalah studi tentang metode otomatis untuk mengenali manusia melalui bagian tubuh manusia, sikap dan kebiasaan manusia yang memiliki keunikan sehingga dapat digunakan dalam proses identifikasi dan verifikasi. Biometrik yang diberikan seseorang akan dibandingkan dengan data yang sudah ada di database sehingga nantinya dapat diketahui siapa tentang dirinya. Voice Recognition memiliki keunggulan yaitu tidak memerlukan alat yang sulit, mudah pengaplikasiannya kepada setiap orang, biaya yang dikeluarkan lebih murah. Tujuan dari skripsi ini adalah untuk membuat suatu program pengenalan suara yang nantinya digunakan untuk aplikasi searching pada world wide web dengan metode Hidden Markov Model. Cara kerja program ini melalui beberapa tahapan yaitu pengambilan suara, konversi suara, pembandingan dengan grammar, pembandingan dengan database dan menghasilkan jawaban. Suara yang diambil berupa sinyal analog dan sinyal tersebut akan dikonversi menjadi sinyal digital dan kemudian diolah dengan metode Hidden Markov Model setelah diolah datanya maka didapatkan sebuah data yang akan dibandingkan dengan data yang sudah ada di sebuah database world wide web lalu menghasilkan jawaban. Kata kunci : Searching ,world wide web, Voice Recognition,Hidden Markov Model.
PENDAHULUAN Biometrik adalah autentikasi secara biologis memungkinkan sistem dapat mengenali penggunanya lebih tepat. Beberapa aplikasi biometrik antara lain retinal scan, face recognition, fingerprint recognition,dan voice recognition.. Voice Recogntion yang secara umum digunakan untuk proses identifikasi dan verifikasi. Identifikasi digunakan untuk mengenali identitas seseorang dan verifikasi digunakan untuk memastikan apakah data yang diberikan cocok dengan data yang sudah ada. Dalam hal ini akan melakukan perbandingan kecocokan antara data biometrik yang diberikan seseorang yang akan dibandingkan dengan data yang sudah ada pada database lalu apabila ditemukan kecocokan maka akan diberikan jawaban yang sesuai dengan permintaan.
Sekarang ini voice recognition banyak sekali digunakan dalam dunia industri sebagai salah satu alat bantu dalam pengetikan maupun mempersingkat cara kerja sebuah alat, seperti Iphone 4S yang sudah menggunakan fitur voice controlling dalam menjalankan sebuah program aplikasi bahkan dapat pula saling Tanya jawab sebuah pertanyaan, ada pula Samsung Android Galaxy TAB yang juga menggunakan fitur voice recognition untuk membatu dalam masalah pengetikan dan mesin pencarian. Voice Recognition memiliki keunggulan yaitu tidak memerlukan alat yang sulit hanya membutuhkan microphone, mudah pengaplikasiannya kepada setiap orang,dan biaya yang dikeluarkan lebih murah.
Metode Hidden Markov Model (HMM) sebuah model statistik dari sebuah sistem yang diasumsikan sebuah proses markov dengan parameter yang tak diketahui, dan tantangannya adalah menentukan parameter-parameter tersembunyi (state) dari parameter-parameter yang dapat diamati (observer). Parameter-parameter yang ditentukan kemudian dapat digunakan untuk analisis yang lebih jauh, misalnya untuk aplikasi pengenalan pola. Sebuah HMM dapat dianggap sebagai sebuah Bayesian Network dinamis yang paling sederhana. Masalah ini dapat diselesaikan dengan algoritma Baum-Welch.
PEMBAHASAN Sebuah ADC (Analog to Digital Converter) berfungsi untuk mengkodekan tegangan sinyal analog waktu kontinu ke bentuk sederetan bit digital waktu diskrit sehingga sinyal tersebut dapat diolah oleh komputer. Proses konversi tersebut dapat digambarkan sebagai proses 3 langkah
Gambar 1. Proses Sinyal Analog ke Sinyal Digital
Prinsip umum Hidden Markov Model (Sri Mulyana,2008) adalah memodelkan simbol kedalam sebuah mesin finite state, sehingga diketahui simbol apa yang dapat mewakili sebuah parameter vektor dari sebuah kata dimasukkan kedalam mesin, dan diestimasi berulang–ulang hingga dihasilkan parameter vektor atau observasi ot dengan mean dan kovarian yang konvergen untuk setiap statenya . Pada implementasinya sistem pengenalan suara berbasis hidden markov model dibagi menjadi beberapa bagian sebagai berikut : 1. Data preparasi : pembentukan parameter vektor (observasi) Pemisahaan kata menjadi simbol yang dilafalkan (phone) menghasilkan rangakaian observasi o untuk setiap kejadian yang mungkin pada saat transisi antar state. Aggap suara sebagai sebuah rangkaian vektor suara atau observasi, yang didefinisikan sebagai berikut : O = o1,o2,o3,....,oT Dimana ot adalah vektor suara yang diobservasi pada saat t. Observasi pada dasarnya menentukan nilai dari persamaan berikut Argmax{P(Wi,O)} Dimana Wi adalah pengucapan yang ke-i, probabilitas ini tidak dapat dihitung secara langsung tetapi dapat dihitung dengan menggunakan aturan Bayes |
|
Maka, prioritas kemungkinan P(Wi) sangat tergantung pada P(O|Wi). Dalam pengenalan suara berbasis hmm, diasumsikan bahwa rangkaian vektor observasi berkorespondensi dengan masing masing word yang dihasilkan oleh markov model . Markov model adalah mesin finite state yang mengalami perubahan state sekali setiap satuan waktu t pada saat state j dimasuki, vektor suara ot dihasilkan berdasarkan nilai kemungkinan bj(ot). Selanjutnya transisi antara state i ke state j juga merupakan probabilitas diskrit aij. Gambar di bawah menunjukkan contoh dari proses ini dimana lima model state berupa rangakaian state X = 1,2,3,4,5,6 untuk membangun urutan o1 sampai o6.
Gambar 2. Bentuk State Hidden Markov Model Untuk membangun rangkaian observasi O dengan jumlah state 6. probabilitas diskrit untuk transisi dari state i ke state j ditentukan oleh aij sedangkan bj(ot) adalah probabilitas yang membentuk observasi pada saat t (ot) untuk state j
Probabilitaas O dibanguun oleh model M yang meelalui seluruh urutan state X dihitung sabaggai hasil perkkalian antara kemungkinan k n transisi dann kemungkinaan haasil. Jadi untuuk rangkaian sstate X pada gambar g 2. P(O,,X|M) = a12b2(o1)a22b2(o2)aa23b3(o3)... Meskipun demikian hanya h rangkaaian observaasi O yang diketahui daan raangkaian statee X yang menndasari adalahh ters an an embunyi. Itu mengaAnpa m ini disebut hidden markov moddel.
2. Traaining : inisiaalisasi dan esttimasi parameeter vector Inisialisasii dapat dilakkukan dengann menggunakkan algoritmaa viterbi untuuk menemukan jalur terbaik dalam sebbuah matrik dimana dim m mensi vertikkal m merepresentasi ikan state-staate hmm dan n dimensi hoorisontal merrepresentasikaan fraame suara. Masing maasing titik pada gambaar dibawah menunjukkaan keemungkinan terhadap fraame saat ituu dan daerahh antar titik menunjukkaan keemungkinan transisi. t
Gambar 3. A Alur algoritm ma viterbi (Ruvvinna, 2011) Untuk meencari urutan state setiap observasi o padda frame suarra diamana a35 menunjukkan kemungkinan m k n transisi darri state 3 ke state 5 dann b3(o4) adalaah prrobabilitas pem mbentukan obbservasi o3 paada state 3 Kemungkiian masing m masing jalur diihitung dengaan menjumlah h kemungkinaan traansisi dan kem mungkinan kkeluaran sepan njang path. P Pada waktu t masing m masinng baagian path dikketahui untukk semua statte i. dapat d dihitunng deengan persam maan di bawahh
Ko onsep path in ni sangat berguuna untuk suaara kontinyu ppada umumny ya. Proses esttimasi dilakuukan dengan menggunakann metode Baaum-Welch Reesstimation. Formula Baum m-Welch re-esstimasi untukk mean dan kovarian padda m masing masingg state HMM adalah a
daan
Esstimasi dilakkukan terhaddap mean daan varian hm mm yang mana m distribuusi keeluaran masinng masing state adalah ko omponen gauusian, didefin nisikan sebaggai beerikut :
Paarameter vek ktor akan dieestimasi denggan menggunnakan algorittma forewarddbaackward hinggga diperoleeh nilai probbabilitas P(O O|M) terbesaar berdasarkaan obbservasi pada masing m masing state.. Perhitungaan algoritma Baum-Welcch dilakukan berddasarkan diagrram alur berikkut :
Gambar 4. D Diagram Alurr Estimasi (Ru uvinna, 2011)) H dengaan Esstimasi dilakkukan terhaddap parameteer vector paada initial HMM m menggunakan m metode forwaard/backwardd hingga diperroleh parametter vektor yanng koonvergen (tiddak dapt diesttimasi lagi). Kriteria K updaate adalah nillai probabiltiaas obbservasi terhaadap model P((O|M) lebih tiinggi dari nilaai iterasi sebeelumnya. Nilai kemungkinan k n foreward staate didefinisaaikan sebagai
untuk beberapa moodel M dan N
keemungkinan ini dapat dihittung berdasarrkan rumus :
seedangkan nilai kemungkiinan backward didefinisikan seebagai daan dapat dihittung dengan ppersamaan :
untuuk model M dan N staate
berdasarkan persamaan ,
|
maka didapat persamaan untuk menentukan nilai probabilitas Lj(t) sebagai berikut : , 1 dimana P = P(O|M). Algoritma untuk membentuk re-estimasi parameter hmm dengan BaumWelch re-estimasi adalah sebagai berikut : 1. Untuk setiap vektor parameter/matrik, alokasikan storage untuk pembilang dan penyebut formula Baum-Welch sebagai acumulator. 2. Hitung kemungkinan foreward dan backward untuk semua state j pada waktu t. 3. Untuk setiap state j dan waktu t, gunakan probabiltas Lj(t) dan vektor observasi saat ini ot untuk merubah acumulator pada state itu. 4. Gunakan nilai acumulator terakhir untuk menghitung nilai parameter yang baru. Jika nilai P = P(O|M) iterasi saat ini kurang dari iterasi sebelumnya maka berhenti jika tidak ulangi langkah diatas dengan menggunakan nilai parameter yang baru. 3. Testing : pengenalan Setelah dirubah signalnya maka saatnya untuk membuat pembelajaran tentang apa yang dimasukkan, menurut Evandro Gouvêa pada tahun 2008, sinyal digital yang diterima memiliki 8 input untuk tiap huruf yang diberikan akan divariasikan dengan 3 hidden layer dan hanya menghasilkan satu output Program voice recognition dengan memasukkan suara lalu di tes kepada 3 orang untuk mengidentifikasi huruf dan kata, dengan melakukan percobaan identifikasi sebanyak 10 kali per orang(2 pria dan 1 wanita) dan untuk 26 jenis huruf, didapatkan: Tabel 1 Tabel Percobaan Voice Recognition 10 input huruf A-J Nama Deny Diana Darwin
A B C D E F B G B G B G B G B G B G 10 0 10 0 9 1 9 1 9 1 7 3 9 1 10 0 8 2 10 0 10 0 8 2 8 2 9 1 9 1 9 1 9 1 10 0
Keterangan: B = Berhasil
G = Gagal
B 9 7 5
G G 1 3 5
B 7 8 9
H G 3 2 1
I B 6 9 8
J G 4 1 2
B 5 9 8
G 5 1 2
Tabel 2 Tabel Percobaan Voice Recognition 10 input huruf K - T K L M B G B G B G Deny 9 1 8 2 10 0 Diana 8 2 9 1 7 3 Darwin 8 2 10 0 8 2 Keterangan:
Nama
B = Berhasil
N O P B G B G B G 9 1 10 0 8 2 8 2 9 1 10 0 9 1 10 0 9 1
Q R B G B G 6 4 7 3 8 2 7 3 7 3 10 0
S B 9 8 9
T G 1 2 1
B 8 7 8
G 2 3 2
G = Gagal Tabel 3 Tabel Percobaan Voice Recognition 6 input huruf U – Z Nama Deny Diana Darwin Keterangan:
U B 10 8 8
B = Berhasil
V G B G 0 7 3 2 8 2 2 5 5
W X B G B 3 7 10 3 7 8 2 8 9
Y G B 0 9 2 10 1 8
Z G 1 0 2
B 3 4 3
G 7 6 7
G = Gagal
Tabel 4 Tabel Percobaan Voice Recognition 6 jenis kata He say B G B G Deny 8 2 8 2 Diana 7 3 9 1 Darwin 8 2 10 0 Keterangan: Nama
B = Berhasil
Care where B G B G 7 3 4 6 6 4 5 5 5 5 2 8
Year Speech B G B G 7 3 9 1 8 2 8 2 6 4 7 3
G = Gagal
PENUTUP Program voice recognition menggunakan metode Hidden Markov Model mampu menampilkan hasil inputan suara yang baik dan dapat digunakan dalam sistem pencarian pada database sebuah website apabila ada konten yang sesuai sehingga dapat dinyatakan bahwa program ini sangat aplikatif dalam pengunaanya,selain itu tingkat keakuratan dalam mengenali suara dan merubah menjadi teks adalah 77.92% dimana dalam tingkatan tersebut masih dikategorikan dapat mengidentifikasikan suara dari kata yang diucapkan dn diubah menjadi teks. Sehingga dapat dikatakan bahwa tujuan dari penelitian ini terpenuhi. Beberapa saran yang dapat diajukan untuk pengembangan program aplikasi ini bagi peneliti lain adalah: 1. Dalam program ini noise dianggap hampir tidak ada, sehingga apabila dapat dikurangi lagi noisenya maka akan lebih optimal. 2. Program searching ini masih sederhana belum banyak interaksi seperti dapat mengontrol seluruh tombol di dalam website sehingga dapat dikembangkan lebih lanjut lagi.
3. Pendeteksian masih sebatas grammar bahasa inggris semoga dapat dikembangkan dengan grammar bahasa Indonesia.
DAFTAR PUSTAKA Afiahayati , Sri Mulyana. (2008) MULTIPLE SEQUENCE ALIGNMENT MENGGUNAKAN HIDDEN MARKOV MODEL. URL http://www.google.co.id/url?sa=t&source=web&cd=2&ved=0CBsQFjAB&url=http% 3A%2F%2Frepository.upnyk.ac.id%2F4%2F&ei=puFPTuz9MobMrQfDsNisAg&usg =AFQjCNFlZhQih8bcTKcIcJrJpeHsm9K9DQ. Akses 16 Agustus 2011. Asih, Eny Fitri. (2010). Perancangan Sistem Informasi Pengolahan Data Inventaris pada PT. POS Indonesia(PERSERO) cabang fatmawati. Universitas Pembangunan Nasional “Veteran”. Baumann, Jim. (2008). Voice Recognition. URL http://www.hitl.washington.edu/scivw/EVE/I.D.2.d.VoiceRecognition.html. Akses 27 September 2011. Bennett, Robert P.(2008). Voice Recognition Technology Help People Speak. URL http://www.disaboom.com/computer-technology/voice-recognition-programs-helppeople-speak . Akses 5 Januari 2012. Bruemmer, Claudia. (2005). Internet Writing – Editing – Constulting. http://www.claudiabruemmer.com/services . Akses 5 Januari 2012.
URL
Carniege Mellon University. (2002). A speech recognizer written entirely in the JavaTM programming language. URL http://cmusphinx.sourceforge.net/sphinx4/. Akses 16 Agustus 2011. Elan.(2006). Value Proposition. http://www.elanit.fi/imm/default.aspx?page=4897 . Akses 5 Januari 2012.
URL
E. Levison, Stephen. (2005). Mathematical Models for Speech Technology. John wiley&Sons,Inc., New Jersey. Frerking, Marvin E.(2002). Digital Signal Processing in Communication Systems. Kluwer Academic Publisher. Garrison, Gary. (2008). VOICE XML. URL http://faculty.bus.olemiss.edu/breithel/b620s02/garrison/ggarrison_VoiceXML..asp . Akses 27 September 2011. Halim, Cornelius Arianto.(2010) PERANCANGAN PROGRAM SIMULASI VOICE RECOGNITION UNTUK IDENTIFIKASI MENGGUNAKAN ALGORITMA FFT DAN DIVIDE AND CONQUER.URL http://library.binus.ac.id/Collections/ethesis_detail.aspx?ethesisid=2010-2-00425MTIF. Akses 16 Agustus 2011. Juang ,B. H. and Rabiner,L. R. Hidden Markov Models for Speech Recognition Technometrics, Vol. 33, No. 3. (Aug., 1991), pp. 251-272. URL http://luthuli.cs.uiuc.edu/~daf/courses/Signals%20AI/Papers/HMMs/0.pdf. Akses 16 Agustus 2011.
Muflihah, Siti.(2008). PENINGKATAN MUTU SISTEM INFORMASI MAHASISWA PADA PERGURUAN TINGGI RAHARJA DENGAN METODE IAC (INTELLIGENCE ACCESS CARD). SEKOLAH TINGGI MANAJEMEN DAN ILMU KOMPUTER (STMIK) RAHARJA. Kristiawan Yuniarto.(2011). Mereka Meyebutnya dengan Tablet. URL http://www.duniaku.net/2011/02/07/menyambut-era-tablet/ . Akses 5 Januari 2012. NCIP. (2003). Interactive Technology and The Young Child. http://www2.edc.org/ncip/library/ec/char.htm Akses 20 Desember 2011.
URL
Rabiner, Lawrence R.(February, 1989), fellow, IEEE. A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition. URL http://www.stat.columbia.edu/~liam/teaching/neurostat-spr11/papers/hmm/rabiner.pdf . Akses 5 Januari 2012. Proboyekti, Uni. (2011). User Interface Design. http://lecturer.ukdw.ac.id/othie/uid.pdf . Akses 27 September 2011.
URL
Reinstein. (2002). Why Companies Must Create Online Communities. URL http://www.business2community.com/online-marketing/why-companies-must-createonline-communities-045554. Akses 27 September 2011. Ruvinna.(2011). PENGENALAN KATA BERBAHASA INDONESIA DENGAN MENGGUNAKAN ALGORITMA BAUM-WELCH. URL http://repository.ipb.ac.id/handle/123456789/45622?show=full. Akses 16 Agustus 2011. V.Vaseghi, saeed.(2008). Advanced Digital Signal Processing and Noise Reduction. John wiley&Sons,Inc., New Jersey.
Voice Recognition Programs for Searching application in World Wide Web using Hidden Markov Model Method Samuel Mahatmaputra TedjojuwonomS.Kom.M.Info.Tec; Ro’fah Nur Rachmawati,S.Si.,M.Si ; Deny Yovianto ABSTRACT Biometrics in general is the study of automated methods for recognizing humans by the human body, human attitudes and habits that have a uniqueness that can be used in the process of identification and verification. A given person's biometric is compared with existing data in the database so it can later be known to anyone about him. Voice Recognition has the advantage of not requiring a difficult tool, easy to apply, to any person, the cost is more expensive. The purpose of this thesis is to create a voice recognition program that will be used for searching applications on the world wide web by hidden Markov model method. The workings of this program through several stages of the vote, voice conversion, comparison with grammar, comparisons with the database and produce an answer. Votes taken in the form of analog signals and the signal is converted into digital signals and then processed by the method of hidden Markov model after processing the data it obtained a data to be compared with existing data in a database world wide web and produce an answer. Keywords: Searching ,world wide web, Voice Recognition,Hidden Markov Model. ABSTRAK Biometrik secara umum adalah studi tentang metode otomatis untuk mengenali manusia melalui bagian tubuh manusia, sikap dan kebiasaan manusia yang memiliki keunikan sehingga dapat digunakan dalam proses identifikasi dan verifikasi. Biometrik yang diberikan seseorang akan dibandingkan dengan data yang sudah ada di database sehingga nantinya dapat diketahui siapa tentang dirinya. Voice Recognition memiliki keunggulan yaitu tidak memerlukan alat yang sulit, mudah pengaplikasiannya kepada setiap orang, biaya yang dikeluarkan lebih murah. Tujuan dari skripsi ini adalah untuk membuat suatu program pengenalan suara yang nantinya digunakan untuk aplikasi searching pada world wide web dengan metode Hidden Markov Model. Cara kerja program ini melalui beberapa tahapan yaitu pengambilan suara, konversi suara, pembandingan dengan grammar, pembandingan dengan database dan menghasilkan jawaban. Suara yang diambil berupa sinyal analog dan sinyal tersebut akan dikonversi menjadi sinyal digital dan kemudian diolah dengan metode Hidden Markov Model setelah diolah datanya maka didapatkan sebuah data yang akan dibandingkan dengan data yang sudah ada di sebuah database world wide web lalu menghasilkan jawaban. Kata kunci : Searching ,world wide web, Voice Recognition,Hidden Markov Model.
INTRODUCTION Biometrics is the biological authentication system allows users to identify more precisely. Some biometric applications such as retinal scans, face recognition, fingerprint recognition and voice recognition .. Voice Recogntion are generally used for identification and verification process. Identification used to identify a person's identity and verification used to determine whether the data provided matches the existing data. In this case the comparison would make a match between a given person's biometric data to be compared with existing data in the database and if a match is found it will be given an appropriate answer to the request. Now that voice recognition is widely used in industry as one tool in typing and shorten the workings of a device, such as 4S Iphone is already using the feature controlling voice in running an application program can also even answer a question asked each other, there is also a Samsung Android Galaxy TAB which also uses voice recognition feature to petrify in trouble typing and search engines. Voice Recognition has the advantage of not requiring a difficult tool requires only a microphone, easy to apply, to any person, and the cost is more expensive. Method of Hidden Markov Models (HMM) of a statistical model of a system that assumed a markov process with unknown parameters, and the challenge is to determine the hidden parameters (state) of the parameters which can be observed (observer). Specified parameters can then be used for further analysis, eg for pattern recognition applications. An HMM can be regarded as a dynamic Bayesian Network is the simplest. This problem can be solved by the Baum-Welch algorithm. DISCUSSION An ADC (Analog to Digital Converter) function to encode an analog signal voltage to form a continuous time series of digital bits so that the discrete time signal can be processed by computer. The conversion process can be described as a three step process.
Figure 1. Process Analog to Digital Signal General principles of Hidden Markov Models (Sri Mulyana, 2008) is modeling the symbol into a finite state machine, so it can know what the symbol represents a parameter vector of a word is inserted into the machine, and estimated repeatedly until the resulting parameter vector or observation ot the mean and covariance is convergent for every statenya. In the implementation of speech recognition systems based on hidden markov models are divided into sections as follows:
1. Data preparation: the establishment of the parameter vector (observation) became a symbol of separation which is spoken word (phone) produces o The set of observation for any events that may at the time of transition between states. Aggap voice as a sound or observation vector sequence, which is defined as follows: O = o1,o2,o3,....,oT Where ot is the noise vector observed at time t. Observations essentially determine the value of the following equation Argmax{P(Wi,O)} Where Wi is the pronunciation of the i, this probability can not be calculated directly but can be calculated using Bayes rule |
|
Thus, the priority of the possibility of P (Wi) is highly dependent on the P (O | Wi). In hmm-based speech recognition, it is assumed that the observation vector sequence corresponding to each word generated by markov model. Markov model is a finite state machine which changes state once every time unit t at state j is entered, the vector of noise generated by the possibility ot bj (ot). Furthermore the transition between state i to state j is also a discrete probability aij. The figure below shows an example of this process in which the five-state model of the form X = 1,2,3,4,5,6 The set state to construct a sequence o1 to O6.
Figure 2. Hidden Markov Model State form To construct a series of observations O with the number of state 6. discrete probability for a transition from state i to state j is determined by aij while bj (ot) is the probability of forming the observation at time t (ot) to state j Probability O M models built by the state through the entire sequence of X is calculated sabagai multiplication result between possible transitions and the possible outcomes. So for a series of state X in Figure 2. P(O,X|M) = a12b2(o1)a22b2(o2)a23b3(o3)...
Meskipunn demikian hhanya rangk kaian observvasi O yang diketahui daan raangkaian staate X yangg mendasarii adalah teers an an embunyi. Ittu m mengaAnpa inni disebut hiidden marko ov model.
2. Trraining: initiialization annd parameter estimation vector v Iniitialization can c be done uusing the vitterbi algorithhm to find thhe best path in i a matrix m wherre the verticcal dimensio on representts the state--state and thhe hoorizontal dim mension reprresents uh so ound frame. Each pointt in the figurre below shows the likelihoood of that tiime frame and a the areaa between thhe doots indicatingg a possible ttransition.
Figure 3. Groove G viterb bi algorithm (Ruvinna, 2011) To find a sequence of o observatioons on the sstate of eachh voice fram me diiamana A35 indicating a possible traansition from m state 3 to state s 5 and b3 b (O O4) is the proobability of formation off the state obbservation o3 3 The possiibility of eacch path is caalculated by adding up the t possibilitty off transition and a the possiibility of outtput along thhe path. At each e time t thhe paath ψ_i (t-1)) is known tto all the staate i. ψ_j (t) can be calcculated by thhe eqquation below w
The concept is very uuseful path too continuouss noise in general. mation proceess is done by b using thee method of Baum-Welcch The estim Ree-estimationn. Formula Baum-Welcch re-estimaation for thhe mean annd coovariance at each HMM state is
an nd
Performed too estimate tthe mean annd variance hmm whicch the outpuut i gausian coomponent, ddefined as folllows: diistribution off each state is
Vector of parameters p too be estimateed by using tthe foreward d-backward algorithm m to obtain thhe probabilitty P (O | M),, the largest based on observations in each statee. Baum-Weelch algorithm m calculatio on is based onn t following the g flow chart:
Fig gure 4. Estim mated Flow Diagram (R Ruvinna, 2011) Peerformed to estimate thee initial HMM M parameterr vector usinng the forwarrd / backward to t obtain a parameter vector whiich convergges (no morre APT). The crriteria update is rated prrobabiltias observation o o of esstimated DA thhe model P (O O | M) is higgher than thee previous iteeration. forewarrd possible vvalue (t) for some s model M and N ass the state
Thhis possibitilly can be callculated usinng the formuula:
w whereas the possibility p oof backwardd βj (t) for m models M and a N state is deefined as
A can be caalculated usiing : And
B the equation By
,
|
So we can get formula to calculate prpbability of Lj(t) : , 1 where P = P(O|M). Algorithm to form a re-estimation of hmm parameters with the BaumWelch re-estimation are as follows: 1. For each parameter vector / matrix, allocate storage for the numerator and denominator formula Baum-Welch as acumulator. 2. Calculate the likelihood foreward and backward to any state j at time t. 3. For each state j and time t, use probabiltas Lj (t) and the current observation vector ot acumulator the state to change that. 4. Use the last acumulator to calculate new parameter values. If the value of P = P (O | M) the current iteration is less than the previous iteration is stopped if it does not repeat the above steps using the new parameter values. 3. Testing :introduction Once converted signal then it is time to make learning about what is included, according to Evandro Gouvêa in 2008, received digital signal has eight inputs to any given letter will be varied with 3 hidden layer and only produce one outputProgram voice recognition dengan memasukkan suara lalu di tes kepada 3 orang untuk mengidentifikasi huruf dan kata, dengan melakukan percobaan identifikasi sebanyak 10 kali per orang(2 pria dan 1 wanita) dan untuk 26 jenis huruf, didapatkan: Table 1 Experiment 10 Voice Recognition input the letters A - J A B B G B G Deny 10 0 10 0 Diana 9 1 10 0 Darwin 8 2 9 1 Nama
C D E F B G B G B G B G 9 1 9 1 9 1 7 3 8 2 10 0 10 0 8 2 9 1 9 1 9 1 10 0
Keterangan: B = Success
G = Fail
G H B G B G 9 1 7 3 7 3 8 2 5 5 9 1
I J B G B G 6 4 5 5 9 1 9 1 8 2 8 2
Table 2 Experiment Table 10 Voice Recognition input the letter K - T K L M B G B G B G Deny 9 1 8 2 10 0 Diana 8 2 9 1 7 3 Darwin 8 2 10 0 8 2 Keterangan:
Nama
B = Success
N O P B G B G B G 9 1 10 0 8 2 8 2 9 1 10 0 9 1 10 0 9 1
Q R B G B G 6 4 7 3 8 2 7 3 7 3 10 0
S T B G B G 9 1 8 2 8 2 7 3 9 1 8 2
G = Fail Table 3 Experiment Voice Recognition input the letters U - Z U B G Deny 10 0 Diana 8 2 Darwin 8 2 Keterangan:
Nama
B = Success
V W X Y B G B G B G B G 7 3 3 7 10 0 9 1 8 2 3 7 8 2 10 0 5 5 2 8 9 1 8 2
Z B G 3 7 4 6 3 7
G = Fail
Table 4 Voice Recognition Experiments of speech He say B G B G Deny 8 2 8 2 Diana 7 3 9 1 Darwin 8 2 10 0 Keterangan: Nama
B = Success
Care where Year Speech B G B G B G B G 7 3 4 6 7 3 9 1 6 4 5 5 8 2 8 2 5 5 2 8 6 4 7 3
G = Fail
CONCLUSIONS AND RECOMMENDATIONS Voice recognition program using hidden Markov model capable of displaying the input sound is good and can be used in a database retrieval system on a website if there is appropriate content so that it can be stated that this program is applicable in pengunaanya, than the level of accuracy in recognizing the voice and change a text is 77.92% where the levels are still considered to identify the sound of the spoken word dn converted into text. So it can be said that the purpose of this study are met. Some suggestions can be submitted for the development of this application program to other researchers are: 1. In this program are considered virtually no noise, so if it can be reduced again noisenya it would be optimal. 2. Searching program is still not much interaction as simple to control all the buttons on the website so that it can be developed further. 3. Detection is still limited to grammar english grammar may be developed by the Indonesian language.
REFERENCES Afiahayati , Sri Mulyana. (2008) MULTIPLE SEQUENCE ALIGNMENT MENGGUNAKAN HIDDEN MARKOV MODEL. URL http://www.google.co.id/url?sa=t&source=web&cd=2&ved=0CBsQFjAB&url=http% 3A%2F%2Frepository.upnyk.ac.id%2F4%2F&ei=puFPTuz9MobMrQfDsNisAg&usg =AFQjCNFlZhQih8bcTKcIcJrJpeHsm9K9DQ. Akses 16 Agustus 2011. Asih, Eny Fitri. (2010). Perancangan Sistem Informasi Pengolahan Data Inventaris pada PT. POS Indonesia(PERSERO) cabang fatmawati. Universitas Pembangunan Nasional “Veteran”. Baumann, Jim. (2008). Voice Recognition. URL http://www.hitl.washington.edu/scivw/EVE/I.D.2.d.VoiceRecognition.html. Akses 27 September 2011. Bennett, Robert P.(2008). Voice Recognition Technology Help People Speak. URL http://www.disaboom.com/computer-technology/voice-recognition-programs-helppeople-speak . Akses 5 Januari 2012. Bruemmer, Claudia. (2005). Internet Writing – Editing – Constulting. http://www.claudiabruemmer.com/services . Akses 5 Januari 2012.
URL
Carniege Mellon University. (2002). A speech recognizer written entirely in the JavaTM programming language. URL http://cmusphinx.sourceforge.net/sphinx4/. Akses 16 Agustus 2011. Elan.(2006). Value Proposition. http://www.elanit.fi/imm/default.aspx?page=4897 . Akses 5 Januari 2012.
URL
E. Levison, Stephen. (2005). Mathematical Models for Speech Technology. John wiley&Sons,Inc., New Jersey. Frerking, Marvin E.(2002). Digital Signal Processing in Communication Systems. Kluwer Academic Publisher. Garrison, Gary. (2008). VOICE XML. URL http://faculty.bus.olemiss.edu/breithel/b620s02/garrison/ggarrison_VoiceXML..asp . Akses 27 September 2011. Halim, Cornelius Arianto.(2010) PERANCANGAN PROGRAM SIMULASI VOICE RECOGNITION UNTUK IDENTIFIKASI MENGGUNAKAN ALGORITMA FFT DAN DIVIDE AND CONQUER.URL http://library.binus.ac.id/Collections/ethesis_detail.aspx?ethesisid=2010-2-00425MTIF. Akses 16 Agustus 2011. Juang ,B. H. and Rabiner,L. R. Hidden Markov Models for Speech Recognition Technometrics, Vol. 33, No. 3. (Aug., 1991), pp. 251-272. URL http://luthuli.cs.uiuc.edu/~daf/courses/Signals%20AI/Papers/HMMs/0.pdf. Akses 16 Agustus 2011. Muflihah, Siti.(2008). PENINGKATAN MUTU SISTEM INFORMASI MAHASISWA PADA PERGURUAN TINGGI RAHARJA DENGAN METODE
IAC (INTELLIGENCE ACCESS CARD). SEKOLAH TINGGI MANAJEMEN DAN ILMU KOMPUTER (STMIK) RAHARJA. Kristiawan Yuniarto.(2011). Mereka Meyebutnya dengan Tablet. URL http://www.duniaku.net/2011/02/07/menyambut-era-tablet/ . Akses 5 Januari 2012. NCIP. (2003). Interactive Technology and The Young Child. http://www2.edc.org/ncip/library/ec/char.htm Akses 20 Desember 2011.
URL
Rabiner, Lawrence R.(February, 1989), fellow, IEEE. A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition. URL http://www.stat.columbia.edu/~liam/teaching/neurostat-spr11/papers/hmm/rabiner.pdf . Akses 5 Januari 2012. Proboyekti, Uni. (2011). User Interface Design. http://lecturer.ukdw.ac.id/othie/uid.pdf . Akses 27 September 2011.
URL
Reinstein. (2002). Why Companies Must Create Online Communities. URL http://www.business2community.com/online-marketing/why-companies-must-createonline-communities-045554. Akses 27 September 2011. Ruvinna.(2011). PENGENALAN KATA BERBAHASA INDONESIA DENGAN MENGGUNAKAN ALGORITMA BAUM-WELCH. URL http://repository.ipb.ac.id/handle/123456789/45622?show=full. Akses 16 Agustus 2011. V.Vaseghi, saeed.(2008). Advanced Digital Signal Processing and Noise Reduction. John wiley&Sons,Inc., New Jersey.