Wahana Fisika, 1(2), 2016 http://ejournal.upi.edu/index.php/wafi
Sistem Kontrol Robot Arm 5 DOF Berbasis Pengenalan Pola Suara Menggunakan Mel-Frequency Cepstrum Coefficients (MFCC) dan Adaptive Neuro-Fuzzy Inference System (ANFIS) W.S. Mada Sanjaya 12 *, Dyah Anggraeni 12 1
Program Studi Fisika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Sunan Gunung Djati Bandung, Jl. AH Nasution 105 Cibiru Bandung 40614, Indonesia
2
Bolabot Techno Robotic Institue, CV. Sanjaya Star Group, Komp. Permata Biru Blok AH No 75A Cibiru-Cinunuk Bandung 40624, Indonesia * E-mail:
[email protected] (Mada Sanjaya), Telp: +62-81227759579 ABSTRAK
Telah dilakukan penelitian yang menggambarkan implementasi pengenalan pola suara untuk mengontrol gerak robot arm 5 DoF dalam mengambil dan menyimpan benda. Dalam penelitian ini metode yang digunakan adalah Mel-Frequency Cepstrum Coefficients (MFCC) dan Adaptive Neuro-Fuzzy Inferense System (ANFIS). Metode MFCC digunakan untuk ekstraksi ciri sinyal suara, sedangkan ANFIS digunakan sebagai metode pembelajaran untuk pengenalan pola suara. Pada proses pembelajaran ANFIS data latih yang digunakan sebanyak 6 ciri. Data suara terlatih dan data suara tak terlatih digunakan untuk pengujian sistem pengenalan pola suara. Hasil pengujian menunjukkan tingkat keberhasilan, untuk data suara terlatih sebesar 87,77% dan data
152 | Copyright Β© 2016, Wahana Fisika
Wahana Fisika, 1(2), 2016 http://ejournal.upi.edu/index.php/wafi
tak terlatih sebesar 78,53%. Sistem pengenalan pola suara ini telah diaplikasikan dengan baik untuk mengerakan robot arm 5 DoF berbasis mikrokontroler Arduino. Kata Kunci
:
Pengenalan suara; ANFIS; robot arm Mel-Frequency
Cepstrum Coefficients
ABSTRACT
Have been implemented of sound pattern recognition to control 5 DoF of Arm Robot to pick and place an object. In this research used Mel-Frequency Cepstrum Coefficients (MFCC) and Adaptive Neuro-Fuzzy Interferense System (ANFIS) methods. MFCC method used for features extraction of sound signal, meanwhile ANFIS used to learn sound pattern recognition. On ANFIS method data learning use 6 features. Trained and not trained data used to examine the system of sound pattern identification. The result show the succesfull level, for trained data 87.77% and for not trained data 78.53%. Sound pattern identification system was appliedto controlled 5 DoF arm robot based Arduino microcontroller.
Keywords : Sound identification; ANFIS; arm robot; Mel-Frequency Cepstrum Coefficients Penerapan menggunakan
1. Pendahuluan Sistem
sistem
otomatisasi
pada
bidang
dilakukan
suara
oleh
kendali tidak
mesin,
mudah sehingga
robotika merupakan sistem yang dapat
dibutuhkan metode pembelajaran pada
memudahkan
manusia.
mesin untuk dapat mengekstraksi dan
Sistem kendali dengan menggunakan
mengenali ciri atau pola suara dengan
suara merupakan alternatif yang mudah
mempelajari ciri-ciri sebelumnya.
dan efektif khususnya untuk pengguna
Metode untuk mengekstrak ciri sinyal
yang
suara
memiliki
pekerjaaan
keterbatasan
fisik.
diantaranya
menggunakan
153 | Copyright Β© 2016, Wahana Fisika
Wahana Fisika, 1(2), 2016 http://ejournal.upi.edu/index.php/wafi
metode Linear Predictive Coding [1], [2]
dan
Mel-Frequency
Cepstrum 2. Landasan Teori
Coefficients [3] - [4] yang telah
2.1. Metode MFCC
diaplikasikan pada beberapa bidang
MFCC merupakan cara yang paling
diantaranya; pengenal pembicara [5] -
sering digunakan pada berbagai bidang
[6], mendiagnosis suatu penyakit [2],
area
[7] , kontrol robot [8], [9] , kontrol
dianggap
motor DC [10] , control robot arm [11]
merepresentasikan sinyal. Cara kerja
[12], smart home [13], biomatriks [14],
MFCC didasarkan pada perbedaan
kontrol otomatis kursi roda [15] dan
frekuensi yang dapat ditangkap oleh
lainnya
telinga
[16].
pembelajaran
Untuk
dan
metode
pengklasifikasian
pemrosesan
baik
dalam
manusia
sehingga
mampu
merepresentasikan
sinyal
suara
sebagaimana
menggunakan
merepresentasikannya.
Neuro-Fuzzy
karena
cukup
pola suara, telah banyak peneliti yang metode
suara,
manusia
[13], Artificial Neural Networks [17],
2.2 Preemphasis
[18] , dan metode soft computing
Dalam proses pengolahan sinyal wicara
lainnya [6], [19].
pre emphasis filter diperlukan setelah
Dalam penelitian ini dibahas pengujian
proses
sistem
pemfilteran
ekstraksi ciri
menggunakan
sinyal
suara
sampling. ini
Tujuan adalah
dari untuk
Mel-Frequency
mendapatkan bentuk spectral frekuensi
Cepstrum Coefficients (MFCC) dan
sinyal wicara yang lebih halus. Dimana
metode belajar serta klasifikasi pola
bentuk spectral yang relatif bernilai
suara menggunakan metode Adaptive
tinggi
Neuro-Fuzzy
System
cenderung turun secara tajam untuk
(ANFIS). Terakhir, dalam penelitian ini
daerah fekuensi diatas 2000 Hz. Filter
juga dilakukan implementasi sistem
pre-emphasis didasari oleh hubungan
pengenalan pola suara untuk sistem
input/output dalam domain waktu yang
Inferense
untuk
daerah
rendah
dan
kontrol robot arm pemindah barang menggunakan mikrokontroler Arduino. 154 | Copyright Β© 2016, Wahana Fisika
Wahana Fisika, 1(2), 2016 http://ejournal.upi.edu/index.php/wafi
dinyatakan
dalam
persamaan
π¦1 (π) = π₯1 (π)π€(π), 0 β€ π β€ π β
berikut:π¦(π) = π₯(π) β ππ₯ (π β 1) (1)
1
dimana a merupakan konstanta filter
dimana w(n) biasanya menggunakan
pre-emhasis, biasanya bernilai 0.9 < a
window
< 1.0.
bentuk:
2.3 Frame Blocking
π€(π) = 0.54 β 0.46. πππ (πβ1) , 0 β€
Pada
proses
ini,
sinyal
suara
yang saling tumpang tindih (overlap). Hal ini dilakukan agar tidak ada sinyal
yang
hilang
(deletion). Proses ini akan berlanjut sampai seluruh sinyal sudah masuk ke dalam satu atau lebih frame.
Sinyal analog yang sudah diubah menjadi sinyal digital dibaca frame demi frame dan pada setiap frame-nya dilakukan windowing dengan fungsi window tertentu. Proses windowing untuk
yang
memiliki
πβ€πβ1
(3)
2.5 Fast Fourier Transform (FFT) FFT merupakan fast algorithm dari Discrete Fourier Transform (DFT) yang berguna untuk mengonversi setiap frame dengan N sampel dari domain waktu
menjadi
sebagaimana
2.4 Windowing
bertujuan
Hamming
2ππ
disegmentasi menjadi beberapa frame
sedikitpun
(2)
meminimalisasi
domain
frekuensi,
didefinisikan
sebagai
βππ
πππ/π΅ berikut πΏπ = βπ΅βπ π=π ππ π
(4) dimana
π = 0, 1, 2, β¦ , π β 1
dan
π = ββ1. Hasil dari tahapan ini biasanya disebut dengan spectrum atau periodogram.
ketidakberlanjutan sinyal pada awal dan akhir setiap frame.
Jika kita
2.6 Mel-Frequency Wrapping
definisikan window sebagai w(n), 0 β€ n
Persepsi sistem pendengaran manusia
β€ N β 1, dimana N adalah jumlah
terhadap frekuensi sinyal suara tidak
sampel pada setiap frame-nya, maka hasil dari windowing adalah sinyal:
dapat diukur dalam skala linear. Untuk setiap nada dengan frekuensi aktual, f, diukur dalam Hz, sebuah subjective pitch diukur dalam sebuah skala yang
155 | Copyright Β© 2016, Wahana Fisika
Wahana Fisika, 1(2), 2016 http://ejournal.upi.edu/index.php/wafi
disebut βmelβ. Skala mel-frequency
spectrum ke dalam domain waktu
ialah sebuah frekuensi rendah yang
dengan menggunakan Discrete Cosine
bersifat linear di bawah 1000 Hz dan
Transform (DCT). Hasilnya disebut
sebuah frekuensi tinggi yang bersifat
dengan
logaritmik di atas 1000 Hz. Persamaan
coefficient (MFCC). Berikut adalah
berikut menunjukkan hubungan skala
persamaan
mel dengan frekuensi dalam Hz:
transformasi
πΉπππ =
βπ π=1 ππ πππ (π (π β 1)/2 π)
mel-frequency
yang
digunakan cosinus: π
πΉπ»π
cepstrum
dalam πΆπ = (7)
2595 β πππ10 (1 + 700 ), πΉπ»π > 1000 dimana j = 1, 2, 3,β¦, K (K = jumlah πΉπ»π , πΉπ»π < 1000 koefisien yang diinginkan) dan M (5) adalah jumlah filter. Proses wrapping terhadap sinyal dalam 2.8 Adaptive Neuro Fuzzy Inferense domain frekuensi dilakukan System (ANFIS) menggunakan persamaan berikut: Neuro-fuzzy adalah gabungan dari dua πβ1 ππ = πππ10(βπ=0 |π(π )| π»π (π)) (6) sistem yaitu sistem logika fuzzy dan dimana i = 1,2,3,β¦,M (M adalah jaringan syaraf tiruan. Sistem neurojumlah filter segitiga) dan Hi(k) adalah fuzzy berdasar pada sistem inferensi nilai filter segitiga ke-i untuk frekuensi fuzzy yang dilatih menggunakan akustik sebesar k. algoritma pembelajaran yang 2.7 Cepstrum diturunkan dari sistem jaringan syaraf Pada tahap ini akan dikonversi meltiruan. {
Gambar 5. Contoh struktur ANFIS Roger Jang [20]
156 | Copyright Β© 2016, Wahana Fisika
Wahana Fisika, 1(2), 2016 http://ejournal.upi.edu/index.php/wafi
Salah satu bentuk struktur yang sudah
π€1 = ππ΄1 (π₯ ) π΄ππ· ππ΅1 (π¦)
(11)
sangat dikenal adalah seperti terlihat
π€2 = ππ΄2 (π₯ ) π΄ππ· ππ΅2 (π¦)
(12)
pada Gambar 5
Output pada lapisan ini bertindak
yang merupakan
struktur ANFIS. Dalam struktur ini,
sebagai fungsi bobot.
sistem inferensi fuzzy yang diterapkan
Lapisan 3: Lapisan Normalisasi
adalah inferensi fuzzy model Takagi-
Dinotasikan dengan N. Setiap node
Sugeno-Kang.
pada lapisan ini bersifat non-adaptif
Lapisan 1: Proses Fuzzyfication
yang berfungsi hanya untuk
Output dari node i pada layer 1
menghitung rasio antara firing strength
dinotasikan
pada rule ke-i terhadap total firing
sebagai
O1,i
bersifat
adaptif:
strength dari semua rule:
π1,π = ππ΄π (π₯ ),
π = 1,2
(8)
π1,π = ππ΅π (π¦),
π = 1,2
(9)
π3,π = π€ Μ
π = π€
π€π
1 +π€2
, π = 1,2
(13)
Lapisan 4: Lapisan Defuzzyfication
dimana x dan y adalah nilai-nilai input
Setiap node pada lapisan ini bersifat
untuk node tersebut dan Ai dan Bi
adaptif dengan fungsi:
adalah himpunan fuzzy. Jadi, masing-
π4,π = π€ Μ
π ππ = π€ Μ
π (ππ π₯ + ππ π¦ + ππ ) (14)
masing node pada layer 1 berfungsi
dimana π€ Μ
π adalah output pada layer 3
membangkitkan derajat keanggotaan.
dan {π₯ + ππ π¦ + ππ } adalah himpunan
Lapisan 2: Lapisan Product
parameter pada fuzzy model Sugeno
Dinotasikan dengan Ο. Setiap node pada
layer
ini
berfungsi
untuk
menghitung kekuatan aktivasi (firing strength) pada setiap rule sebagai product dari semua input yang masuk atau
sebagai
(triangular
operator norm):
ππ΄π (π₯ )β ππ΅π (π¦),
π = 1,2
t-norm
π2,π = π€π = (10)
orde pertama. Lapisan 5: Lapisan Total Output Satu node tunggal yang dilambangkan dengan Ξ£ pada layer ini berfungsi mengagregasikan seluruh output pada layer 4 (penjumlahan dari semua sinyal yang masuk): π5,π = βπ π€ Μ
π ππ =
βπ π€π ππ βπ π€π
(15)
157 | Copyright Β© 2016, Wahana Fisika
Wahana Fisika, 1(2), 2016 http://ejournal.upi.edu/index.php/wafi
Sehingga secara keseluruhan, kelima
db dengan spesifikasi (impedansi 32
layer tersebut akan membangun suatu
ohm at 1 kHz sensitivitas 102db/mW),
adaptive-networks
secara
laptop, mikrokontroler arduino, relay,
fuzzy
lampu AC. Kabel USB dan komputer
fungsional
yang
ekivalen
dengan
model Sugeno orde pertama.
digunakan sebagai komunikasi data
3. Metodologi dan Perancangan Sistem Peralatan
yang
digunakan
pada
penelitian yaitu michrophone -54db+2
menggunakan
software
MATLAB
2012. Metode penelitian secara garis besar dapat dilihat :
Gambar 6. Skema umum kontrol robot arm menggunakan perintah suara Terdapat dua bagian proses dalam
komunikasi data secara serial antara
penelitian ini, proses pertama adalah
komputer
proses pembelajaran sistem yang
Arduino untuk menggerakan robot
didalamnya meliputi proses ekstraksi
arm dalam memindahkan barang
ciri menggunakan MFCC dan proses
menggnakan perintah suara manusia.
belajar
3.1. Perancangan Elektronik
menggunakan
ANFIS
dengan
mikrokontroler
sehingga terbentuk database berupa
Berikut ini adalah skema robot lengan
formulasi logika fuzzy. Proses kedua
yang
adalah proses pengujian sistem yang
penelitian. Robot arm ini terdiri dari
meliputi proses ekstraksi ciri MFCC,
lima komponen motor servo yang
proses pengklasifikasian data ANFIS,
terkoneksi
serta
implementasi
akan
digunakan
dengan
dalam
mikrokontroler
berupa 158 | Copyright Β© 2016, Wahana Fisika
Wahana Fisika, 1(2), 2016 http://ejournal.upi.edu/index.php/wafi
Arduino
seperti
terlihat
pada
Gambar7.
Gambar 7 Skema robot lengan dengan 5 DoF dan realisasinya Susunan rangkaian robot terlihat seperti
terhubung pada pin 11 yang berfungsi
skema robot arm 5 DoF pada Gambar
seperti pergelangan tangan (bergerak
7, tiap servo harus diberi sumber
untuk
tegangan berupa baterai 5 volt dan
pergelangan/horizontal). Dan Servo 5
berarus 100 mA (sesuai datasheet tiap
terhubung pada pin 12, berfungsi
servo) agar dapat beroperasi dengan
sebagai pencapit atau jari tangan
baik. Ground tiap servo terkoneksi
sederhana
dengan ground pada mikrokontroler
memindahkan barang.
memutarkan
untuk
mengambil
dan
Arduino. Robot arm yang telah dibuat terdiri dari 5 bauh servo. Servo1 adalah
3.2 Perancangan Antarmuka
servo paling bawah yang terhubung
Antarmuka
dengan pin 8, berfungsi seperti leher
mempermudah penggunaan dari sistem
(berputar secara horizontal). Servo 2
yang dibuat. Pada penelitian ini telah
terhubung dengan pin 9 yang fungsinya
dibuat antarmuka menggunakan GUI
sama seperti tulang lengan bawah
MATLAB. Antarmuka yang dibuat
manusia
vertikal).
berisi setting komunikasi serial antara
Servo 3 terhubung pada pin 10, yang
mikrokontroler dan komputer, nilai
berfungsi seperti pergelangan tangan
koefisien ekstraksi ciri menggunakan
manusia (bergerak vertikal). Servo 4
metode MFCC, grafik time series
(bergrak
secara
diperlukan
untuk
159 | Copyright Β© 2016, Wahana Fisika
Wahana Fisika, 1(2), 2016 http://ejournal.upi.edu/index.php/wafi
sinyal suara, tombol record suara, serta
suara.
output ANFIS berupa pengenalan pola
Gambar 9. Rancangan antarmuka
seorang responden degan mengucapkan
4. Hasil dan Pembahasan 4.2 Pembuatan Database Ekstraksi
dua buah kata βambilβ dan βsimpanβ
Ciri Menggunakan MFCC
dengan
Telah dilakukan pembuatan database 6
pengulangan yang secara lengkap dapat
buah
dilihat pada tabel berikut:
ciri
/pola
sinyal
suara
masing-masing
10
kali
menggunakan metode MFCC terhadap Tabel 1. Hasil ekstraksi ciri MFCC dan target N
Ciri 1
Ciri 2
Ciri 3
Ciri 4
Ciri 5
Ciri 6
Targe
o 1
2
3
t 1.02576
0.43096
0.70954
-
-
-
4
8
3
1.16757
0.06185
0.16551
3.8107
1.84287
2.48224
0.71784
0.53090
-
7
2
6
0.22903
-
-
0.51325
0.43964
2.99013 1
4
5
1.32624
1.37000 7
-2.0106
1.00477
0.26855
0.43315
-
-
-
7
4
1
1.36025
0.33288
0.24274
3.64567
2.84625
2.53058
-
-
-
4
6
6
2.41073
0.95367
0.77988
1
1
1
1
1
160 | Copyright Β© 2016, Wahana Fisika
Wahana Fisika, 1(2), 2016 http://ejournal.upi.edu/index.php/wafi
11
12
13
14
15
3.26284
0.24001
0.26511
0.23590
1
6
2
9
4.70256
0.25053
7
9
5.07718
3.75179
7
0.06330
0.16143
0.24529
0.16729
0.06532
7
5
6
2.55767
-
-
2
1
3.76957
0.70939
2.31811
0.30361
0.57216
-
-
-
8
9
1
1.03665
0.00629
0.17874
0.27633
1.02744
2.55203
0.91949
8
-
-
1.39003
0.54355
0
2
0
-0.5631
0
0
-0.4275
0
Dari tabel di atas terlihat bahwa
Hasil pengujian pengenalan ucapan
kataβambilβ dan βsimpanβ memiliki
menunjukkan
pola ciri berbeda. Pola suara βambilβ
akurasi antara responden di dalam
akan di simbolkan dengan nilai target
database
sebesar
β1β sedangkan pola suara βsimpanβ
responden
di
akan disimbolkan dengan nilai target
menghasilkan akurasi sebesar 78,53%.
β0β. Pola ini kemudian akan menjadi
Kesalahan-kesalahan pengenalan pola
input
suara
ANFIS
untuk
metode
yang
pembelajaran
kemudian
akan
dapat
aksen/intonasi
bahwa
total
tingkat
87,77% luar
database
dipengaruhi kata
(noise)
masukan dari
dan
oleh dan
menghasilkan database berupa logika
gangguan
lingkungan
Fuzzy.
mengingat waktu pengujian responden di dalam database dan responden di
4.3 Pengujian Sistem Pengenalan
luar database yang berbeda.
Pola Suara
161 | Copyright Β© 2016, Wahana Fisika
Wahana Fisika, 1(2), 2016 http://ejournal.upi.edu/index.php/wafi
Tabel 2. Hasil pengujian pengenalan ucapan responden di dalam database. Pengulangan
1
2
3
4
5
Kata
Output Pengenalan Database
Target
Output Pengenalan Luar Database
Ambil
1
1.05553
0.883592
Simpan
0
0.005402
0.188365
Ambil
1
0.904094
1.15296
Simpan
0
0.150967
0.0114219
Ambil
1
0.940149
1.23366
Simpan
0
0.16039
0.366108
Ambil
1
0.778915
1.51449
Simpan
0
0.210363
0.0297445
Ambil
1
1.24385
0.73461
Simpan
0
0.019448
-0.268652
saat
βsimpanβ direcord maka sistem akan
dilakukan pengujian terhadap kataβambilβ
mengenali dengan output sebesar 0.490851
dan βsimpanβ. Dari Gambar 11 terlihat,
yang
saat kata βambilβ direcord maka sistem
komputer akan mengirimkan data serial
akan mengenali dengan output 0.811674
berupa karakter β0β ke mikrokontroler
yang
sehingga
untuk menggerakan robot arm dalam posisi
komputer akan mengirimkan data serial
menyimpan benda. Sehingga secara umum
berupa karakter β1β ke mikrokontroler
alat berfungsi dengan baik 100% karena
untuk menggerakan robot arm dalam posisi
adanya pembulatan nilai pengenalan.
Berikut
adalah
mendekati
tampilan
nilai
β1β
GUI
mendekati
nilai
β0β
sehingga
mengambil benda. Sedangkan saat kata
162 | Copyright Β© 2016, Wahana Fisika
Wahana Fisika, 1(2), 2016 http://ejournal.upi.edu/index.php/wafi
(a)
(b)
Gambar 11. Tampilan GUI MATLAB kontrol robot arm menggunakan perintah suara
Dalam pengujian untuk mengontrol
5. Simpulan Berdasarkan hasil penelitian diatas
robot arm 5 DoF memindahkan barang,
dapat
pengujian
sistem dapat bekerja dengan baik 100%
gerak sistem menunjukan bahwa sistem
melalui pembulatan nilai output hasil
telah bekerja
pengenalan pola suara.
disimpulkan hasil
dengan baik sesuai
dengan perintah yang diberikan. Dari 6. Ucapan Terima Kasih hasil pengujian sistem pengenal ucapan
Penelitian ini didanai oleh DIPA-BLU
yang didapatkan penerapan metode
FST,
MFCC dan ANFIS memiliki tingkat
Bandung.
UIN
Sunan
Gunung
Djati
akurasi yang tinggi, yaitu 87,77% untuk responden yang terdapat dalam data latih (database) dan 78,53% untuk responden diluar data latih (database). 163 | Copyright Β© 2016, Wahana Fisika
Wahana Fisika, 1(2), 2016 http://ejournal.upi.edu/index.php/wafi
6. Referensi
[1]
[2]
[3]
[4]
[5]
[6]
2010. [7] "Ekstrasi Ciri Suara Jantung menggunakan Metode Dekomposisi Thiang and S. Wijoyo, "Speech dan Korelasi Sinyal (Dekoriet) Recognition Using Linear Predictive Berbasis Jaringan Saraf Tiruan," Coding and Artificial Neural Jurnal Teori dan Aplikasi Fisika, vol. Network for Controlling Movement 3, no. 1, pp. 51-59, 2015. of Mobile Robot," International [8] Y.-m. Koo, G.-B. Kim, S.-C. Jang, Conference on Information and W.-S. Lee, H.-G. Kim and S.-H. Han, Electronics Engineering, vol. 6, pp. "A Study on Travelling Control of 179-183, 2011. Mobile Robot by Voice Commend," A. Rizal, L. Anggraeni and V. International Conference on Control, Suryani, "Pengenalan Suara ParuAutomation and Systems, vol. 15, pp. Paru Normal Menggunakan LPC dan 13-16, 2015. Jaringan Syaraf Tiruan Back- [9] A. Punchihewa and Z. M. Arshad, Propagation," Proceeding EECCIS, "Voice Command Interpretation for 2006. Robot Control," International B. Abinayaa, D. Arun, B. Darshini Conference on Automation, Robotics and C. Nataraj, "Voice Command and Applications, vol. 5, pp. 90-95, Based Computer Application," 2011. International Journal of Innovative [10] B. Kulji, S. JΓ‘nos and S. Tibor, Research in Science, Engineering "Mobile robot controlled by voice," and Technology, vol. 4, no. 4, pp. 57International Symposium on 63, 2015. Intelligent Systems and Informatics, G. Chauhan and P. Chaudhari, vol. 5, pp. 189-192, 2007. "Robotic Control using Speech [11] M. Varalakshmi and N. N. Raju, Recognition and Android," "Design of Speech Controlled Pick International Journal of Engineering and Place Robot with Wireless Research and General Science, vol. Zigbee Technology," International 3, no. 1, 2015. Journal of Scientific Engineering and S. Tripathy, N. Baranwal and G. Technology Research, vol. 3, no. 20, Nandi, "A MFCC based Hindi pp. 4062-4066, 2014. Speech Recognition Technique using [12] K. S. Jadhav and S. M. Gaikwad, HTK Toolkit," IEEE Second "Writing Robotic Arm by Speech International Conference on Image Recognition," International Journal Information Processing, pp. 539-544, of Advanced Research in Electrical, 2013. Electronics and Instrumentation B. A. Q. Al-Qatab and R. N. Ainon, Engineering, vol. 4, no. 6, pp. 4983"Arabic Speech Recognition Using 4990, 2015. Hidden Markov Model [13] W. S. M. Sanjaya and Z. Salleh, Toolkit(HTK)," IEEE, pp. 557-562, "Implementasi Pengenalan Pola 164 | Copyright Β© 2016, Wahana Fisika
Wahana Fisika, 1(2), 2016 http://ejournal.upi.edu/index.php/wafi
Suara Menggunakan Mel_Frequency Journal of Applied Control, Cepstrum Coefficients (MFCC) dan Electrical and Electronics Adaptive Neuro-Fuzzy Inferense Engineering (IJACEEE), vol. 2, no. System (ANFIS) sebagai Kontrol 4, pp. 13-22, 2014. Lampu Otomatis," Al-Hazen Journal [18] N. Srivastava, "Speech Recognition of Physics, vol. 1, no. 1, pp. 44-54, using Artificial Neural Network," 2014. International Journal of Engineering [14] D. Rudrapal, S. . D. Smita Das and Science and Innovative Technology, N. D. N. Kar, "Voice Recognition vol. 3, no. 3, pp. 406-412, 2014. and Authentication as a Proficient [19] I. M. M. El-emary, M. Fezari and Biometric Tool and its Application in Hamz, "Hidden Markov Online Exam for P.H People," model/Gaussian mixture International Journal of Computer models(HMM/GMM) based voice Applications, vol. 39, no. 12, pp. 6command system: A way to improve 12, 2012. the control of remotely operated [15] Srishti, P. Jain, Shalu and S. Singh, robot arm TR45," Scientific Research "Design and Development of Smart and Essays, vol. 6, no. 2, pp. 341Wheelchair using Voice Recognition 350, 2011. and Head Gesture Control System," [20] R. Jang, C.-T. Sun and E. Mizutani, International Journal of Advanced Neuro-Fuzzy and Soft Computing, Research in Electrical, Electronics Prentice-Hall, Inc., 1997. and Instrumentation Engineering, vol. 4, no. 5, pp. 4790-4798, 2015. [16] C.-Y. Liu, T.-H. Hung, K.-C. Cheng and T.-H. S. Li, "HMM and BPNN based Speech Recognition System for Home Service Robot," International Conference on Advanced Robotics and Intelligent Systems, 2013. [17] N. Rai and B. Rai, "An ANN Based Mobile Robot Control Through Voice Command Recognition Using Nepali Language," International
165 | Copyright Β© 2016, Wahana Fisika