JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012
ISSN : 2086 – 4981
PERBANDINGAN METODA EKSTRAKSI CIRI FAST FOURIER TRANSFORM (FFT) DAN MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) PADA LOGIKA FUZZY UNTUK IDENTIFIKASI PENUTUR Fitrilina1 Hendra Suryana Putra2
ABSTRACT Identification of speakers is one of the emerging technologies in the processing of sound that aims to recognize and identify the source of the human voice (speakers). In this research, speaker identification system established by the stages of extraction parameters of sound speakers and the formation of fuzzy rule for each speaker. This study compared two speaker identification system that uses two different parameter extraction methods, namely the Fast Fourier Transform (FFT) and Mel Frequency Cepstral Coefficients (MFCC). Each parameter used as the extraction of data to form a fuzzy rule in each system. This study identifies five speakers. In this study the accuracy of the system in identifying speakers reached 93.33% for FFT-Fuzzy method and 96% for MFCCfuzzy method. In the fuzzy logic system for speaker identification, usage MFCC parameter extraction has better accuracy than the FFT parameter extraction. Keywords: speaker identification, fuzzy logic, Mel-Frequency Cepstral Coefficients (MFCC), FFT INTISARI Identifikasi penutur merupakan salah satu teknologi yang berkembang dalam pengolahan suara yang bertujuan untuk mengenali dan mengidentifikasi sumber suara manusia (penutur). Pada penelitian ini sistem identifikasi penutur dibentuk dengan tahapan yaitu ekstraksi parameter dari suara penutur dan pembentukan rule fuzzy untuk setiap penutur. Penelitian ini membandingkan dua buah sistem identifikasi penutur yang menggunakan dua metoda ekstraksi parameter yang berbeda, yaitu Fast Fourier Transform (FFT) dan Mel Frequency Cepstral Coefficients (MFCC). Masing-masing hasil ekstraksi parameter dijadikan data untuk membentuk rule fuzzy pada masing-masing sistem. Penelitian ini mengidentifikasi lima orang penutur. Pada penelitian ini akurasi sistem dalam mengidentifikasi penutur mencapai 93,33% untuk metoda FFT-Fuzzy dan 96% untuk metoda MFCC-fuzzy. Pada sistem logika fuzzy untuk identifikasi penutur, penggunanaan ekstraksi parameter MFCC memiliki akurasi yang lebih baik dibandingkan ekstraksi parameter FFT. Kata Kunci : Identifikasi penutur, logika fuzzy, Mel-Frequency Cepstral Coefficients (MFCC),FFT. 1 2
Dosen Jurusan TeknikElektro Universitas Andalas Mahasiswa Jurusan Teknik Elektro Universitas Andalas
189
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012 PENDAHULUAN Sinyal suara mengandung dua informasi yaitu identitas sumber suara dan informasi ucapan dari suara tersebut. Teknologi pengenalan suara dibagi atas dua jenis, yaitu speech recognition untuk mengenali ucapan dan speaker recognition untuk mengenali identitas sumber suara (penutur). Teknologi speaker recognition umumnya berkembang ke arah security atau keamanan, seperti password dengan suara, selain itu dapat diaplikasikan pada sistem absensi dengan suara. Pada prisnsipnya Teknologi speaker recognition bekerja dengan cara identify dan verification sehingga hanya orang tertentu yang diizinkan atau bisa memiliki akses ke peralatan yang menggunakan sistem tersebut. Tahapan awal yang harus dilakukan dalam pembentukan sistem identifikasi penutur adalah mengekstrak ciri-ciri atau parameter yang dapat mewakili karakter suara dari penutur. Berbagai metoda dikembangkan untuk mendapatkan parameter yang optimal seperti Fast Fourier Transform (FFT), Mel Frequency Cepstrum Coefficients (MFCC), linear predicttive coeficient (LPC). Tahap berikutnya adalah membentuk pola suara. Pembentukan pola suara dapat berupa codebook, HMM, rule fuzzy, jaringan saraf tiruan, dan lain-lain. Pada penelitian ini digunakan logika fuzzy, karena logika fuzzy merupakan suatu sistem yang bisa memberikan suatu keputusan yang baik untuk kondisi yang tidak pasti (mutlak) seperti sinyal suara yang memiliki pola berbeda-beda satu sama lain. Proses pembuatan sistem dengan logika fuzzy cenderung lebih sederhana tetapi dapat mengambil keputusan yang akurat sehingga dapat digunakan dalam sistem voice recognition seperti penelitian [5][6][7]. Semakin baik kualitas parameter hasil ekstraksi maka
ISSN : 2086 – 4981
semakin baik parameter tersebut dalam mewakili karakter si penutur sehingga diharapkan akan memberi kemudahan bagi sistem pembentukan pola yaitu logika fuzzy untuk membuat pola suara yang mampu mewakili identitas penutur. Oleh karena itu pada penelitian ini dilakukan perbandingan antara dua ekstraksi ciri suara yaitu FFT dan MFCC dengan pembentukan pola suara menggunakan logika fuzzy. Ruang lingkup penelitian yaitu dirancang dengan menggunakan perangkat lunak Matlab R2010a dengan input masukan adalah suara manusia berformat “.wav”. Sinyal diasumsikan ideal, yaitu tidak memperhitungkan noise. Sistem akan mengidentifikasi (mengenal) suara dari lima orang penutur dan menolak (tidak mengenali) suara dari selain dari lima penutur tersebut. PENDEKATAN PEMECAHAN MASALAH Ekstraksi Parameter Ekstraksi parameter adalah proses yang dilakukan untuk mengambil informasi atau ciri suara yang akan dibutuhkan untuk pemrosesan selnajutnya. Jika akan diproses untuk pengenalan ucapan (Speech Recognition) maka diambil informasi kata yang diucapkan. Jika akan diproses untuk pengenalan penutur maka diambil informasi karakter suara penutur. Pada penelitian ini dibandingkan 2 metoda ekstraksi yaitu MFCC dan FFT. Ada pun proses pengolahan sinyal pada ekstraksi ciri menggunakan MFCC dapat dilihat pada gambar 1[14].
190
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012
ISSN : 2086 – 4981
2n ; w(n) 0,54 0,46 cos N 1
0 n N 1 (1)
Pre-emphasis
0 ≤ n ≤ N-1 dimana:
Frame Blocking
w(n) = window digunakan;
yang
y(n) = sinyal hasil windowing
frame Windowing
x1(n) = sinyal input. N
FFT(Fast Fourr Transform) mel spectrum
DCT
y1(n) = x1(n).w(n), (2)
= jumlah cuplikan/sample dalam masing-masing frame
Fast Fourier Transform : mengubah masing-masing frame N sampel dari domain waktu menjadi domain frekuensi. FFT menguraikan sinyal kedalam suatu fungsi eksponesial pada frekuensi sesuai dengan persamaan ditunjukan oleh persamaan 3 N 1 (3) X(k) = X (n) exp j 2 nk / N
spectrum Mel Frequency Wrapping mel cepstrum
n 0
Gambar 1. Diagram Blok MFCC Pre-emphasis : Pada langkah ini, cuplikan sinyal dalam bentuk digital ditapis dengan menggunakan FIR filter orde satu untuk meratakan spektral sinyal suara tersebut.[14] Frame blocking : Tahap awal suara masukan diblok menjadi frame. Frame dibentuk dalam ukuran yang kecil dengan tujuan membuat sinyal menjadi stasioner sehingga dapat diasumsikan spektrum konstan[14]. Untuk frame pertama dimulai dari N cuplikan, dan frame kedua dimulai setalah M cuplikan dari frame pertama, terjadi overlap sebesar N – M cuplikan. Windowing : Windowing dilakukan pada setiap frame untuk meminimalisasi ketidak kontinuan atau mengurangi distorsi spektrum pada awal dan akhir frame, sehingga diujung-ujungnya mendekati nol. Window yang digunakan adalah Hamming window dengan bentuk seperti pada persamaan 1[14].
dimana : X(n) = domain waktu
Fungsi
dalam
X(k) = domain frekuensi
Fungsi
dalam
N
= Jumlah titik(sampel)
k
= 0,1,2,……,N-1
Mel-Frequency Wrapping Bentuk grafik dari skala mel tersebut dapat dilihat pada gambar 2 [9]: 3000
Pitch (mels)
2000
1000
100
500
1000
Frekuensi (Hz)
Gambar 2. Grafik skala mel Skala frekuensi mel merupakan suatu skala yang bersifat linier untuk
191
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012
k ~ ~ 1 c n (log s) cosnk k 1 2 2
frekuensi di bawah 1000 Hz dan logaritmis pada frekuensi diatas 1000 Hz. Untuk mendapatkan koefisien mel maka digunakan mel filter bank. Mel filter bank adalah filter bank berbentuk segitiga seperti pada gambar 3 magnitude
k i 1
ki
Dimana:
= nilai cepstrum
LOGIKA FUZZY Logika Fuzzy pertama kali dikembangkan tahun 1965 oleh Prof. Lotfi Zadeh dari University of California [12]. Ide dari logika fuzzy adalah bahwa di alam ini tidak ada sesuatu yang mutlak „benar‟ atau mutlak “salah‟. Antara “benar’ dan ‘salah’ ada suatu perubahan sehingga suatu kejadian bisa dinyatakan sebagai sebagian ‘benar’ dan sebagian ‘salah’ secara bersamaan. Logika fuzzy merupakan suatu konsep dari “ketidakpastian”. Hal inilah yang membedakan logika fuzzy dari logika Boolean. Perbedaan atara logika Boolean dan Logika Fuzzy dapat dilihat pada gambar 4. berikut. Logika Boolean
k i +1
frekwensi
Secara matematis filter bank segitiga dapat didefenisikan dalam bentuk hubungan seperti persamaan 4 0 (k k ) /( k k ) i 1 i i 1 F (i, k ) 1 (k k ) /( k k ) i 1 i +1 i 0
k ki 1 ki 1 k ki k ki ki k ki +1 k ki +1
n=
1,2,...,k (5)
Gambar 3. Filter Bank Segitiga
\
ISSN : 2086 – 4981
Logika
(4)
Fuzzy
Gambar 4. Logika Boolean dan Logika Fuzzy
Dimana: F(i,k)= frekuensi dalam filter bank
Metode fuzzy menggunakan pernyataan-pernyataan jika-maka (ifthen) untuk menyatakan hubungan antara input dengan output sistem[13]. Pernyataan-pernyataan ini dibangun berdasarkan pengalaman, pengetahuan ataupun intuisi (common sense) dari seorang pakar. Pengetahuan yang didapat bisa berasal dari percobaanpercobaan yang dilakukan untuk mengenali tingkah laku (behaviour) dari proses. memetakan masukan ke keluaran yang mungkin untuk model sistem tak linear, bahkan komplek. Ini adalah keunggulan utama fuzzy logik. Sistem ini juga dapat beradaptasi dengan baik pada sistem yang berbeda, karena sistem Fuzzy Logik
k = frekuensi yang bernilai 1000 Hertz. Cepstrum : Untuk mendapatkan koefisien cepstrum maka koefisien mel diproses dengan menggunakan tranformasi kosinus diskrit (Discrete cosinus transform/DCT). Jika koefisien spektrum mel hasilnya adalah , k=1,2,..,K , sehingga MFCC dapat dihitung . Secara matematis hal ini dapat dinyatakan dengan persamaan 5.
192
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012
ISSN : 2086 – 4981
bersifat toleran terhadap data yang tidak tepat. Konsep dari logika fuzzy dapat dilihat pada gambar 5.
Gambar 6 Bagian-bagian Fungsi Keanggotaan a. Label : Merupakan deskripsi dari nama yang digunakan untuk mengidentifikasi membership function. Labellabel ini menunjukkan suatu keadaan misalnya very low, low,medium, high, very high. b. Derajat Keanggotaan (Degree of Membership) : Menyatakan derajat keanggotaan dari crisp input yang sesuai dengan membership function dengan nilai antara 0 sampai dengan 1. Juga disebut sebagai membersip grade, truth value, atau fuzzy input. c. Masukan Crisp (Crisp input) : Merupakan nilai input dari proses fuzzy yang merupakan besaran suatu kondisi nyata. d. Fungsi Keanggotaan (Membership Function) : Mendefenisikan fuzzy set dengan memetakan crisp input dari nilai domainnya kedalam derajat keanggotaan e. Semesta Pembicaraan (Universal of Discourse) : range dari semua nilai yang mungkin dipakai dalam variabel sistem, merupakan semesta dari himpunan input.
Gambar 5. Konsep dari logika Fuzzy Pernyataan-pernyataan ‘ifthen’ pada logika fuzzy disebut rules[13]. Pernyataan ‘if’ digunakan untuk menggambarkan kondisi sistem yang terjadi. Pernyataan „then’ digunakan untuk menggunakan aksi yang dilakukan oleh sistem. Logika fuzzy menyatakan perubahan secara gradual sehingga setiap kondisi mempunyai derajat yang disebut sebagai Derajat Keanggotaan (Degree of membership). Fungsi yang menyatakan hubungan antara suatu kondisi dengan derajatnya disebut sebagai Fungsi Keanggotaan (Membership Function). Fungsi Keanggotaan ini bisa berbentuk segitiga, trapesium, singleton, maupun kurva. Bagian-bagian dari Fungsi Keanggotaan dapat dilihat pada gambar 6 berikut :
Fuzzifikasi Proses fuzzifikasi adalah proses pengubahan masukan crisp menjadi masukan fuzzy dengan kata lain memetakan angka-angka masukan crisp ke dalam himpunan
193
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012 Fuzzy Logik. Untuk mentransformasikan masukan crisp menjadi masukan fuzzy, diperlukan Fungsi Keanggotaan untuk setiap input. Proses fuzzifikasi mengambil nilai masukan crisp dan membandingkannya dengan Fungsi Keanggotaan yang telah ada untuk menghasilkan harga masukan fuzzy. Dalam proses fuzzifikasi dapat diolah lebih dari satu macam masukan crisp. Fungsi Keanggot dari masukan fuzzy dapat dilihat pada gambar 7
ISSN : 2086 – 4981
Pada metode ini setiap fungsi keanggotaan output yang mempunyai nilai diatas nilai fuzzy output akan dipotong. Pemotongan ini disebut lambda cut. Hasilnya (fungsi keanggotaan yang telah terpotong) digabungkan lalu baru dihitung Center of Gravity keseluruhannya. Pada penelitian ini dilakukan atas dua tahap yaitu tahapan pelatihan dan tahap pengujian. Tahap pelatihan bertujuan untuk membentuk polaatau rule fuzzy yang dapat mewakili karakter suara untuk setiap penutur yang akan diiedntifikasi. Tahapan pelatihan dapat dilihat pada gambar 8. Tahap pengujian bertujuan untuk melihat kinerja dari sistem yang telah dirancang, dan prosesnya dapat dilihat pada gambar 9
Gambar 7 Contoh Fungsi Keanggotaan Evaluasi Rule Pada evaluasi rule ini, fuzzy menggunakan rules yang telah dibuat untuk menentukan aksi yang harus dilakukan. Pada tahap ini dilakukan evaluasi tiap rule dengan input yang dihasilkan dari proses fuzzifikasi. Proses selanjutnya adalah menentukan keluaran fuzzy dengan cara membandingkan rule strength dari rule yang mempunyai label consequent sama. Defuzzifikasi Pada proses defuzzifikasi, semua nilai keluaran fuzzy yang dihasilkan pada proses evaluasi rule dikombinasikan dengan Fungsi Keanggotaan keluaran untuk mendapatkan keluaran sesuai sistem yang diinginkan. Ada beberapa metode dalam proses defuzzifikasi yaitu : 1. Metode Maximizer Metode ini mengambil lokasi dari nilai tertinggi pada fuzzy output sebagai hasil akhrinya. 2. Metode Centroid (Center of Gravity)
Gambar 8. Proses pelatihan untuk membentuk rule fuzzy
194
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012
ISSN : 2086 – 4981
sama yaitu “Laboratorium Kontrol Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas” dengan perulangan sebanyak 10 (sepuluh) kali oleh setiap penutur. Pengujian : Ada 3 (tiga) jenis pengujian yang akan diujikan ke dalam sistem, yaitu : 1. Pengujian terhadap penutur yang menjadi filebase dalam pembuatan sistem. Kalimat yang diucapkan adalah kalimat yang sama yang digunakan dalam pembuatan sistem rule fuzzy yaitu “Laboratorium Kontrol Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas”. 2. Pengujian terhadap setiap penutur yang menjadi filebase dalam pembuatan sistem. Tetapi kalimat yang diucapkan adalah kalimat yang berbeda dengan yang digunakan dalam pembuatan sistem rule fuzzy. Kalimat-kalimat tersebut yaitu : a. Laboratorium Telekomunikasi Universitas Andalas Fakultas Teknik Jurusan Teknik Elektro. b. Laboratorium Dasar Teknik Elektro Jurusan Teknik Elektro Universitas Andalas. c. Laboratorium Tegangan Tinggi Jurusan Teknik Elektro Universitas Andalas. d. Laboratorium Konversi Energi Fakultas Teknik Jurusan Teknik Elektro. e. Laboratorium Elektronika Industri Jurusan Teknik Elektro Universitas Andalas. 3. Pengujian terhadap penutur diluar penutur pada filebase sistem. Kalimat yang diucapkan adalah kalimat yang sama yang diucapkan oleh penutur filebase dalam pembuatan rule fuzzy yaitu “Laboratorium Kontrol Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas”.
Gambar 9. proses pengujian sistem (Evaluasi Rule) Data Penelitian berupa sinyal suara penutur yang direkam dengan menggunakan mikropon yang terhubung dengan komputer. Perekaman suara dilakukan dengan bantuan program aksesoris windows yaitu sound recorder dengan frekuensi sampling 12.000Hz, 8 bit, mono. Kemudian suara tersebut disimpan dalam bentuk file yang bereksitensi “.wav”. Suara yang akan diproses pada penelitian ini dan dijadikan referensi dalam pembentukan sistem identifikasi penutur diambil dari lima orang sumber penutur yang berbeda. Masing-masing penutur mengucapkan sebuah kalimat yang
195
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012 HASIL DAN PEMBAHASAN Hasil Pembentukan Rule untuk Segmentasi FFT - Fuzzy Proses pembentukan rule fuzzy untuk masing-masing penutur menggunakan metode Fuzzy Inference System (FIS) tipe Sugeno Orde Nol. Proses dalam FIS ini dimulai dengan pembentukan membership function masukan dan membership function keluaran, pembentukan rule, dan penentuan metoda defuzzifikasi yang akan digunakan dalam evaluasi FIS.
ISSN : 2086 – 4981
Gambar 11Variabel input segment2
Membership function Sistem Segmentasi FFT - Fuzzy Pembentukan Membership Function terbagi dua yaitu membership function masukan dan membership function keluaran. Untuk membership function masukan, terdapat 5 (lima) variabel input yaitu variabel segment1, segment2, segment3, segment4, dan segment5. Untuk variabel keluaran terdapat 5 (lima) Membership Function yaitu speaker “Putra”, “Rahman”, “Budi”, “Chandra”, dan “Rio”. Pada membership function keluaran hanya berupa singleton karena sistem inferensi fuzzy yang digunakan adalah FIS Sugeno Orde Nol. Untuk membership function masukan dapat dilihat pada gambar 10 sampai gambar 14. dan membership function keluaran pada gambar 15.
Gambar 12 Variabel input segment3- FFT
Gambar 13 Variabel input segment4-FFT
Gambar 10. Variabel input Segment1- FFT
Gambar 14 Variabel input Segment5-FFT
196
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012
ISSN : 2086 – 4981
function setiap segmen yang telah terbentuk. Hasil perbandingan ini akan menentukan pada magnitudo mana data tersebut berada dari ketujuh magnitudo yang ada pada setiap segmen yaitu; lowest, very low, low, medium, high, very high, dan highest. Jumlah rule yang terdapat pada sistem ini berjumlah 10 (sepuluh) rule dimana setiap penutur memiliki dua buah rule. Masingmasing rule untuk setiap penutur dapat dilihat pada tabel 1.
Gambar 15. Variabel output spekaer Rule Fuzzy Sistem Segmentasi FFT - Fuzzy Rule fuzzy dibentuk dari analisa terhadap keseluruhan hasil segmentasi FFT yang diperoleh dari proses ekstraksi parameter setiap penutur filebase. Data-data hasil segmentasi tersebut kemudian dibandingkan dengan membership Rule yang Digunakan Speaker (menggunakan operator AND) Segmen Segmen 2 Segmen 3 Segmen 4 1 Lowest Medium Very Low Very High Putra Lowest Medium Low Lowest Low Medium High Medium Rahman Low Very Low Very High Low Lowest Lowest Low Very Low Budi Lowest Lowest Low Lowest Very Low High Low Chandra Low Lowest Low Medium Low Lowest Medium Lowest Very High Rio Lowest Lowest Lowest Lowest
Segmen 5 Low Low High High Very Low Very Low Medium Lowest Lowest Lowest
Tabel 1 Rule Fuzzy Sistem Identifikasi Penutur Segmentasi FFT Pengujian dilakukan dengan 3 variasi yaitu indetifikasi sumber yang ada dalam data base dengan mengucapkan kalimat yang sama dengan pelatihan (pengujian 1), identifikasi sumber yang ada dalam data base tetapi dengan kalimat yang berbeda dengan kalimat pelatihan (pengujian 2) dan menolak atau menyatakan tidak mengenal penutur yang tidak ada didalam data base. Pengujian 1 dapat dilihat pada tabel 2. Pengujian 2 dapat dilihat pada tabel 3 dan pengujian 3 dapat dilihat pada tabel 4
197
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012
ISSN : 2086 – 4981
Tabel 2 Hasil Pengujian Penutur sebagai filebase dengan kalimat yang sama metodaSegmentasi FFT Kesalahan pada Penutur yang identifikasi Jumlah dikenali Speaker penutur Pengucapan Jumlah % Jumlah % Putra 10 10 100% 0 0% Rahman 10 9 90% 1 10% Budi 10 8 80% 2 20% Chandra 10 9 90% 1 10% Rio 10 10 100% 0 0% Total Jumlah & 46 92% 4 8% Persentase Tabel 3 Hasil Pengujian Penutur dalam filebase dengan kalimat yang berbeda dengan kalimat pembentukan rule metodaSegmentasi FFT
Speaker
Jumlah Penguca pan
Putra 10 Rahman 10 Budi 10 Chandra 10 Rio 10 Jumlah & Persentase keseluruhan
Penutur yang dikenali
9 9 8 10 8
Persentas e 90% 90% 80% 100% 80%
44
88%
Jumlah
Kesalahan pada identifikasi penutur Persentas Jumlah e 1 10% 1 10% 2 20% 0 0% 2 20% 6
12%
Tabel 4. Hasil pengujian penutur yang bukan merupakan filebase sistem segmentasi FFT
Speaker
Jumlah Pengucap an
Bari 5 Tika 5 Icha 5 Jumlah & Persentase keseluruhan
Pengenalan penutur tidak dikenali Persenta Jumlah se 5 100% 5 100% 5 100% 15
100%
198
Kesalahan Pengenalan penutur Jumlah
Persentase
0 0 0
0% 0% 0%
0
0%
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012 Berdasarkan tabel 2 dan tabel 3 dapat dinyatakan bahwa sistem mampu mengidentifikasi penutur yang ada dalam data base baik megucapkan kalimat yang sama maupun berbeda dengan kalimat pelatihan, dengan akurasi 90 %. Berdasarkan tabel 3 dapat dinyatakan bahwa sistem mampu menolak atau tidak mengenali penutur yang tidak terdapat dalam data base dengan kata lain sistem memiliki respon yang sangat baik dalam mengidentifikasi penutur yang tidak memenuhi rule fuzzy dalam sistem identifikasi ini. Hal ini dikarenakan dalam sistem fuzzy digunakan logika “AND” untuk masing-masing rule. Sehingga apabila salah satu rule segmen tidak terpenuhi, maka input akan langsung tidak dikenali oleh sistem. Oleh karena itu sistem ini sangat baik dalam mengidentifikasi penutur yang bukan berasal dari filebase sistem. Berdasarkan tabel 2,3,4 didapatkan akurasi rata-rata sistem identifikasi penutur dengan metoda FFT-fuzzy mencapai 93,33%
ISSN : 2086 – 4981
Gambar 16 Variabel input meanMFCC1
Gambar 17 Variabel input meanMFCC2
Hasil dan Pembahasan Identifikasi Penutur MFCC – Fuzzy Gambar 18 Variabel input meanMFCC3
Untuk Membership Function masukan, terdapat 5 (lima) variabel input yaitu variabel meanMFCC1, meanMFCC2, meanMFCC3, meanMFCC4, dan meanMFCC5. Untuk variabel keluaran terdapat 5 (lima) membership function yaitu speaker “Putra”, “Rahman”, “Budi”, “Chandra”, dan “Rio”. Pada membership function keluaran hanya berupa singleton karena sistem inferensi fuzzy yang digunakan adalah FIS Sugeno Orde Nol. Untuk membership function masukan dapat dilihat pada Gambar 16 sampai Gambar 20
Gambar 19. Variabel input meanMFCC4
199
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012
Gambar 20. Variabel input meanMFCC5 Rule Fuzzy Sistem MFCC – fuzzy Karena penelitian ini bertujuan untuk membandingkan dua metoda ekstraksi ciri yang berbeda dalam sistem identifikasi penutur, maka digunakan data masukan yang sama dalam pembentukan dan pengujian sistem fuzzy. Dalam sistem MFCC – Fuzzy ini, karakter suara masingmasing penutur diwakili oleh 5 (lima) buah data berupa nilai rata-rata koefisien cepstrum (meanMFCC) hasil ekstraksi parameter MFCC yang telah dibagi menjadi 5 (lima) segmen. Data-data tersebut kemudian dibandingkan kembali dengan membership function setiap meanMFCC yang telah terbentuk. Hasil perbandingan ini akan menentukan pada rentang nilai mana data tersebut berada dalam ketujuh rentang nilai dalam setiap meanMFCC yaitu : lowest, very low, low, medium, high, very high, highest. Jumlah rule yang terdapat pada sistem ini berjumlah 5 (lima) buah rule dimana setiap penutur memiliki satu buah rule. Masingmasing rule untuk setiap speaker atau penutur dapat dilihat pada tabel 5.8.
200
ISSN : 2086 – 4981
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012
ISSN : 2086 – 4981
Tabel 5. Rule Fuzzy Sistem Identifikasi Penutur MFCC – Fuzzy Speaker
Putra Rahman Budi Chandra Rio
Rule yang Digunakan (menggunakan operator AND) meanMF meanMFCC2 meanMFCC3 meanMFCC4 CC1 Lowest Lowest Lowest Lowest Highest Highest Highest Highest Medium Medium Medium Medium High High High High Low Low Low Low
Analisa Hasil Pengujian Sistem MFCC – Fuzzy Suara yang diujikan pada sistem MFCC-Fuzzy sama dengan pengujian FFT-Fuzzy. Pengujian pertama untuk suara penutur yang telah dijadikan filebase. Pengujian kedua yaitu juga suara penutur yang dijadikan filebase tetapi mengucapkan kalimat yang berbeda dengan pelatihan. Pengujian terakhir yaitu pengujian terhadap suara penutur yang bukan berasal dari penutur filebase sistem.
201
meanMFCC5 Lowest Highest Medium High Low
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012
ISSN : 2086 – 4981
Tabel 6 Hasil Pengujian Penutur sebagai filebase (Jenis pengujian 1) metodaMFCC Kesalahan Penutur yang pada identifikasi Jumlah dikenali Speaker penutur Pengucapan Jumlah % Jumlah % Putra 10 9 90% 1 10% Rahman 10 10 100% 0 0% Budi 10 9 90% 1 10% Chandra 10 10 100% 0 0% Rio 10 10 100% 0 0% Jumlah & Persentase 48 96% 2 4% keseluruhan Tabel 7. Hasil Pengujian Penutur dalam filebase dengan kalimat yang berbeda dengan kalimat pembentukan rule (pengujian 2) metoda MFCC Kesalahan pada Penutur yang identifikasi Jumlah dikenali Speaker penutur Pengucapan Jumlah % Jumlah % Putra 10 9 90% 1 10% Rahman 10 10 100% 0 0% Budi 10 8 90% 2 10% Chandra 10 9 100% 1 0% Rio 10 10 100% 0 0% Jumlah & Persentase 46 92% 4 8% keseluruhan Tabel 8. Hasil pengujian penutur yang bukan merupakan filebase MFCC
Speaker
Jumlah Pengucapan
Bari Tika Icha
5 5 5
Pengenalan penutur tidak dikenali Jumlah % 5 100% 5 100% 5 100%
202
Kesalahan Pengenalan penutur Jumlah % 0 0% 0 0% 0 0%
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012 Berdasarkan tabel 6 dan tabel 7 dapat dinyatakan bahwa sistem mampu mengidentifikasi penutur yang ada dalam data base baik megucapkan kalimat yang sama maupun berbeda dengan kalimat pelatihan, dengan akurasi 94 %. Berdasarkan tabel 8 dapat dinyatakan bahwa sistem mampu menolak atau tidak mengenali penutur yang tidak terdapat dalam data base dengan kata lain memiliki respon yang sangat baik dalam mengidentifikasi penutur yang tidak memenuhi rule fuzzy dalam sistem identifikasi ini. Berdasarkan tabel 2,3,4 didapatkan akurasi rata-rata sistem identifikasi penutur dengan metoda FFT-fuzzy mencapai 96%
ISSN : 2086 – 4981
beberapa membership function (dalam hal ini berupa segmensegmen input) penutur yang bernilai sama dengan penutur lain. Sedangkan dalam metoda MFCC fuzzy, hampir seluruh penutur memiliki data hasil ekststraksi parameter yang berbeda secara signifikan untuk setiap penutur. Sehingga hal ini berpengaruh kepada kemudahan pembentukan rule dan akurasi yang bisa dicapai oleh sistem fuzzy dalam pengidentifikasian. Perbedaan akurasi yang disebabkan oleh ekstraksi parameter tersebut merujuk kepada tahapan ekstraksi pada kedua metoda. Sistem dengan ekstraksi parameter menggunakan MFCC memiliki akurasi lebih tinggi dikarenakan proses ekstraksi lebih mendekati sistem pendengaran manusia. Dimana setelah dilakukan proses transformasi ke dalam domain frekuensi menggunakan FFT, sinyal suara diolah lagi dengan cara memetakan frekuensi sinyal tersebut ke dalam frekuensi mel untuk mendapatkan hasil yang lebih merepresentasikan bagaimana sinyal suara tersebut dipersepsikan oleh telinga manusia. Proses dilanjutkan dengan mentransformasikan spektrum mel ke bentuk koefisien cepstral yang bisa mewakili karakter suara dari setiap penutur. Sedangkan pada ekstraksi parameter FFT proses ekstraksi hanya sampai pentransformasian sinyal dari domain waktu ke domain frekuensi dengan menggunakan FFT. Kemudian sinyal disegmentasi dan dimodelkan oleh fuzzy sehingga hasil ekstraksi parameter kurang akurat dalam mewakili informasi karakter suara setiap penutur jika dibandingkan dengan MFCC, tetapi masih cukup baik jika digunakan dalam sistem identifikasi penutur dengan menggunakan logika fuzzy.
Analisa Perbandingan Hasil Ekstraksi Parameter Berdasarkan hasil yang didapat, kedua metoda ekstraksi parameter tersebut dapat digunakan dalam sistem pengenalan identifikasi penutur menggunakan logika fuzzy. Hal ini dikarenakan akurasi yang dicapai untuk masing-masing metoda dalam identifikasi penutur cukup baik meskipun terdapat perbedaan yang signifikan dalam hal akurasi sistem. MFCC-Fuzzy memiliki akurasi 96 % sedangkan FFT-fuzzy memiliki akurasi 93,33% Dalam hal ini proses ekstraksi parameter memegang peranan cukup penting dalam mendesain sistem identifikasi penutur yang baik dan akurat. Metoda segmentasi FFT – fuzzy memiliki akurasi yang lebih rendah karena data ekstraksi ciri hasil segmentasi FFT lebih bervariasi dan memiliki range atau rentang yang cukup lebar dalam mengekstrak beberapa suara penutur yang sama. Hal ini juga berpengaruh kepada pembentukan rule fuzzy. Rentang yang cukup lebar tersebut membuat sistem mengenali penutur terkadang sebagai penutur lain, karena pada proses pengidentifikasian ada
203
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012 KESIMPULAN Dari penelitian yang telah dilakukan, dapat disimpulkan bahwa : 1. Kualitas hasil ekstraksi parameter sangat mempengaruhi kinerja sistem dalam mengidentifikasi penutur. 2. Pengujian sistem identifikasi penutur segmentsi FFT – fuzzy dalam mengidentifikasi penutur filebase mencapai akurasi sebesar 92% untuk kalimat yang sama, 88% untuk kalimat yang berbeda, dan 100% untuk penutur diluar filebase, rata-rata akurasi 93,33% 3. Pengujian sistem identifikasi penutur MFCC – fuzzy dalam mengidentifikasi penutur filebase mencapai akurasi sebesar 96% untuk kalimat yang sama, 92% untuk kalimat yang berbeda, dan 100% untuk penutur diluar filebase, rata2 keberhasilan 96 % 4. Kedua metoda identifikasi penutur memiliki akurasi yang cukup baik dalam mengidentifikasi penutur. Tetapi dalam hal ini sistem MFCC – fuzzy memiliki akurasi yang lebih tinggi.
ISSN : 2086 – 4981
[3] Chornas, Christian & Urs Hunkeler. Digital Signal Processing Mini-Project: An Automatic Speaker Recognition. Ecole Polythecnique Federale De Lausanne. [4] Devi, Harlin Fristianti.2009. Aplikasi Voice Recognition pada Sistem Keamanan File Pribadi. Proyek Akhir. Surabaya: PNES ITS. [5] Herlim, Lukman. 2002. Pengenalan Kata Dengan Menggunakan Fuzzy Logic Untuk Menggerakkan Robot Mobil. Surabaya : Universitas Kristen Petra. [6] Lee, Ki Young. Local fuzzy PCA based GMM with dimension reduction. School of Electronic Engineering, Soong Sil University. http://citeseerx.ist.psu.edu/viewd oc/download?doi=10.1.1.109.60 78&rep=rep1&type=pdf diakses pada tanggal 15 Agustus pukul 01.56 WIB. [7] Lien, Nguyen T. H. A Speaker Recognition Method Based on Personal Identification Voice and Trapezoidal Fuzzy Similarity. 1Department of Computational Intelligence and Systems Science, Tokyo Institute of Technology. http://www.cit.iit.bas.bg/CIT_08/ v8-4/40-56.pdf diakses pada tanggal 15 Agustus pukul 01.45 WIB.”
DAFTAR PUSTAKA [1] Buono, Agus, Wisnu Jatmiko, dan Benyamin Kusumoputro. Perluasan Metode MFCC 1D ke 2D Sebagai Esktraksi Ciri pada Sistem Identifikasi Pembicara Menggunakan Hidden Markov Model (HMM). Makara, Sains, Vol. 13, No. 1, April 2009: 8793. Bogor : IPB. Depok : UI
[8] Manunggal, Heri Sugianto.2005. Perancangan dan Pembuatan Perangkat Lunak Pengenalan Suara Pembicara dengan Menggunakan Analisis MFCC Feature Extraction. Surabaya : Universitas Kristen Petra.
[2] Balentine,, Bruce . Speker Identification And Verification. Enterprise Integration Group. http://www.w3.org/2008/08/siv/P apers/EIG/SIV-Workshop2009Balentine-v0.04.pdf diakses pada tanggal 15 Agustus pukul 01.49 WIB.
204
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 5 NO. 2 SEPTEMBER 2012 [9] Mustofa, Ali.2007. Sistem Pengenalan Penutur dengan Metode Mel-frequency Wrapping. Jurnal Teknik Elektro Vol. 7, No. 2, September 2007: 88 – 96. Malang : Universitas Brawijaya. [10] Prihadi. 2010. Perancangan dan Implementasi sistem Pengenalan Ucapan Jenis Digit Speech Recognition dengan menggunakan Logika Fuzzy. Tugas Akhir. Padang: Teknik Elektro Univeritas Andalas [11] Tran , Dat dan Michael Wagner. Fuzzy Nearest Prototype Classifier Applied to Speaker Identification. University of Tasmania. http://citeseerx.ist.psu.edu/viewd oc/download?doi=10.1.1.126.42 98&rep=rep1&type=pdf diakses pada tanggal 15 Agustus pukul 01.44 WIB. [12] Tran, Dat Tat. Fuzzy Approaches to speech and speaker recognation. University of Canberra. http://citeseerx.ist.psu.edu/viewd oc/download?doi=10.1.1.117.68 04&rep=rep1&type=pdf diakses pada tanggal 15 Agustus pukul 01.49 WIB. [13] Hellman, Martin. 2001. Fuzzy logic Introduction [14] Ishibuchi,Hisao;Tadahiko Murata, and Mitsuo Gen. Performance Evaluation of Fuzzy Rule-Based Classification Systems Obtained by Multi-Objective Genetic Algorithms.1998 [15] Prateek Srivastava, Reena Panda, A Novel, Robust, Hierarchical, Text-Independent Speaker
205
ISSN : 2086 – 4981