Identifikasi Suara Serak Berbasis Transformasi Wavelet Dan Algoritma Jaringan Syaraf Tiruan Luqman Hakim*, Achmad Arifin, Tri Arief Sardjono Jurusan Teknik Elektro Institut Teknologi Sepuluh Nopember Surabaya 60111 * email:
[email protected]
Abstrak –Paper ini membahas identifikasi suara serak berbasis transformasi wavelet dan algoritma jaringan syaraf tiruan (JST). Serak merupakan indikator gangguan pada pita suara, sehingga identifikasi jenis suara normal dan serak yang sistematis dapat membantu diagnosa gangguan pita suara. Continous Wavelet Transform (CWT) dengan fungsi morlet digunakan untuk mengeksplorasi karakter sinyal suara dalam domain waktu dan frekuensi secara simultan Data objek penelitian berupa suara vokal “A”, “E”, “I”, “O”,”U” normal dan serak karena radang tenggorokan.Topologi JST terdiri 900 neuron pada layer input, 40 neuron pada hidden layer 1 dan 2, dan 10 neuron layer output. Hasil CWT menunjukan perbedaan karakter waktu-frekuensi antara sinyal suara normal dan serak. Pengujian menggunakan yang sudah dilatih (50 data, terdiri atas 5 sampel dari setiap vokal normal dan serak) 100% teridentifikasi dengan tepat. Kemampuan JST mengenali data baru diuji secara online dengan suara normal dan suara serak secara random. Didapatkan nilai sensitifitas 84%, spesifisitas 86%, dan efisiensi rata–rata 85% untuk kelima jenis suara vokal. Dengan hasil tersebut dapat diketahui bahwa CWT dan JST dapat digunakan untuk mengidentifikasi jenis suara normal dan serak. Hasil penelitian ini diharapkan dapat dikembangkan hingga terealisasi sisitem identifikasi jenis penyakit daerah pita suara berdasarkan analisa suara pasien. Kata Kunci: Suara serak, transformasi wavelet, jaringan syaraf tiruan. 1. PENDAHULUAN Serak bukan merupakan penyakit tetapi sering menjadi gejala penyakit yang berhubungan dengan gangguan pita suara. Diagnosa berdasarkan analisa akustik suara dapat menjadi sebuah alat yang dapat membantu tenaga kesehatan dalam pendeteksian dini adanya gangguan atau penyakit pada pita suara. Bagi pasien, diagnosa berdasarkan suara lebih memberikan kenyamanan karena tidak memerlukan adanya peralatan yang dimasukan ke dalam tenggorokan seperti fiberoptic laryngoskop. Akan tetapi diagnosa penyakit berdasarkan analisa suara ini masih memerlukan kajian dan penelitian lebih lanjut karena sampai saat ini belum didapatkan sebuah formula yang dapat mendefinisikan jenis penyakit tertentu dari informasi pada sinyal suara yang dikeluarkan dari pasien penyakit tertentu. Penelitian di bidang suara
dengan penyakit tertentu telah banyak dilakukan berbasis pada analisa sinyal suara pada ranah domain waktu atau frekuensi yang berbasis pada transformasi fourier [1][2]. Sinyal suara merupakan salah satu sinyal yang secara alamiah bersifat kompleks dan non stasioner. Seseorang yang sedang dalam keadaan serak akan kesulitan dalam mengucapkan suara vokal dengan jernih secara merata sepanjang durasi pengucapan. Oleh karena itu, ciri sebuah sinyal suara serak atau normal dapat diperoleh dari sampel suara vokal yang diucapkan dalam durasi waktu tertentu [3]. Kemajuan riset di bidang pengolahan sinyal kompleks non stasioner telah menghasilkan satu alat transformasi yang dapat digunakan untuk menggali informasi frekuensi dan waktu secara simultan dari sebuah sinyal, yaitu transformasi wavelet. Dalam prakteknya, secara umum telah berkembang dua macam transformasi wavelet yaitu discrete wavelet transform (DWT) dan continuous wavelet transform (CWT). DWT menghasilkan pemisahkan sinyal dalam domain waktu pada band – band frekuensi yang lebih kecil. Sedangkan hasil CWT berupa koefisien– koefisien baru yang merupakan fungsi dari skala frekuensi dan translasi waktu dalam bentuk matrik dan dapat ditampilkan dalam bentuk scalogram. Skala merupakan variabel fungsi wavelet yang mengatur dilasi window fungsi wavelet. Sedangkan translasi merupakan variabel yang mengatur lokasi window fungsi wavelet pada sinyal yang ditinjau. Fungsi wavelet yang dapat digunakan untuk menggali informasi dari sinyal kompleks adalah fungsi wavelet morlet. Hasil CWT ini lebih memudahkan dalam penggambaran pola spektral dalam durasi waktu sinyal [4] . Algoritma jaringan syaraf tiruan (JST) atau Artificial Neural Network (ANN) merupakan sebuah algoritma dalam sistem komputasi di mana arsitektur dan operasinya meniru cara kerja otak manusia dalam mempelajari sesuatu, di mana kemampuan klasifikasi atau identifikasi didapatkan dari proses pembelajaran. Salah satu jenis JST yang digunakan untuk keperluan klasifikasi adalah multi lapisan perseptron (multi layer perceptron /MLP) [5]. Pada paper ini akan dipaparkan hasil sistem identifikasi suara serak atau normal dengan
119
menggunakan JST dengan proses ekstraksi fitur sinyal suara menggunakan CWT dengan fungsi wavelet morlet. Sampel yang digunakan untuk proses pembelajaran terdiri 5sampel setiap vokal “A” “E” “I” “O” dan “U” dalam kondisi normal dan serak.
2.
METODOLOGI
Skema metodologi yang digunakan untuk membuat sistem identifikasi suara serak dan normal ditunjukan pada Gambar 1. Sinyal suara yang diucapkan ditangkap menggunakan mikrofon dan didigitalisasi menggunakan soundcard komputer. Sinyal suara dalam domain waktu x(t ) didigitalisasi dengan frekuensi sampling 11025 Hz menjadi sinyal digital x[n] . Setelah semua sinyal suara dirubah dalam bentuk sinyal digital, secara garis besar ada tiga langkah lagi yang dilakukan untuk sisitem identifikasi suara serak atau normal. Langkah 1 Normalisasi dan pemisahan sinyal suara (voice) dan bukan suara (unvoice) Pada saat perekaman sinyal suara sering terjadi perbedaan besar amplitudo dari satu sampel dengan sampel yang lain. Hal ini dapat disebabkan oleh beberapa faktor diantaranya jarak mikrofon dengan pembicara yang terkadang tidak sama. Sebab lainya bisa jadi suara dari satu orang memang relatif lebih keras atau lebih lemah dari yang lain. Oleh karena itu, setiap suara yang akan dianalisa dinormalisasi terhadap nilai mutlak maksimum amplitudo sinyal bersangkutan. Dengan normalisasi ini maka besar setiap sinyal yang akan dianalisa mempunyai besar maksimum 1 atau minimum -1. Persamaan normalisasi dari sinyal digital x[n] dengan sejumlah N data dapat dituliskan dengan persamaan (1), x[n] x n [ n] = (1) max x[n] di mana n = 1,2,3, ..., N. Pemisahan sinyal suara (voice) dan bukan suara (unvoice) dilakukan dengan mencari titik awal dan akhir sinyal suara (voice). x(t )
x[n]
xn [n]
cwt[a, b]
Gambar 1. Skema sistem identifikasi suara serak serak / normal
120
Dari pengamatan terhadap hasil rekaman terlihat perbedaan tingkat energi sinyal suara dan bukan suara. Penentuan titik awal dan akhir sinyal dilakukan secara statistik, yaitu berdasarkan pada nilai standar deviasi energi sinyal dalam frame tertentu dan menerapkan moving standar deviasi untuk mendapatkan nilai threshold untuk membedakan sinyal suara dan sinyal bukan suara. Moving standar deviasi dapat digambarkan dengan persamaan (2). Nw
σw =
∑ ( x[n] − µ
w)
2
i =1
(2)
Nw
di mana µ w nilai rata–rata atau mean nilai sinyal x dalam frame yang dirumuskan dengan persamaan (3). Nw
µw =
∑ x[n] n =1
(3)
Nw
N w menunjukan lebar frame atau jumlah data yang diambil untuk dicari standar deviasinya. Dengan melakukan perhitungan standar deviasi dari setiap frame sinyal, maka untuk keseluruhan sinyal akan diperoleh sederetan nilai standar deviasi dari frame pertama dan terakhir. Bagian sinyal suara (voice) dan bukan suara ditandai dengan nilai threshold dari nilai standar deviasi maksimum dari sampel sinyal bukan suara (unvoice) yang ditunjukan dengan persamaan (4) [6]. threshold = α .σ w− max , (4) di mana α adalah faktor pengali.
Pemisahan sinyal suara dan bukan suara ini menjadi bagian yang sangat penting pada sistem identifikasi berbasiskan CWT. Hal ini dikarenakan hasil CWT merupakan representasi dari keberadaan frekuensi– frekuensi formant sinyal suara sepanjang durasi waktu pengucapan yang dipresentasikan dengan sejumlah titik translasi. Jika pemisahan sinyal suara dengan bukan suara tidak bekerja dengan tepat, maka nilai CWT tidak sepenuhnya menggambarkan karakter sinyal suara yang diucapkan. Langkah 2 Mentransformasi sinyal suara (voice) dengan CWT CWT sebuah sinyal kontinyu non stasioner x(t ) didefiniskan dengan persamaan (5). Variabel a merupakan skala yang mengatur dilasi fungsi wavelet. Variabel b merupakan translasi yang mengatur letak posisi induk wavelet dalam durasi sinyal. Karena yang dianalisa merupakan sinyal kompleks, maka fungsi wavelet yang digunakan adalah fungsi morlet yang ditunjukan dengan persamaan (6).
di
a
1 4
π
∫ x(t ).ψ
−∞
ψ'
mana
ψ (t ) =
∞
1
CWT( a ,b ) =
e
−b dt , a
,t
konjugate
(5) fungsi
t2 jω0 t 2 e
wavelet. (6)
Di mana ω 0 merupakan frekuensi sentral fungsi wavelet. f f = 0 (7) a Frekuensi sentral fungsi wavelet dan nilai skala yang digunakan berpengaruh pada dilasi atau lebar sempitnya jangkauan wavelet. Frekuensi sentral wavelet 5,33 rad/s atau f 0 = 0,849 Hz telah banyak digunakan oleh para peneliti dan memberikan hasil yang baik untuk digunakan menggali informasi dalam sebuah sinyal alami kompleks non stasioner. Skala fungsi wavelet berhubung terbalik dengan frekuensi sinyal yang ditinjau, dan secara pendekatan dirumuskan dengan persamaan (7). Karakter setiap sinyal digambarkan dengan nilai CWT ternormalisasi terhadap range nilai CWT setiap sinyal yang dihitung dengan persamaan(8) dan digambarkan dalam bentuk scalogram, yaitu gambar 2 dimensi yang menunjukan hubungan waktu dan frekuensi sebuah sinyal dengan nilai CWT digambarkan dengan intensitas warna [4].
cwt[a, b] =
CWT [a, b] − min(CWT [a, b]) max(CWT [a, b]) − min(CWT [a, b]) (8)
Langkah 3 Menggunakan hasil CWT untuk proses identifikasi menggunakan JST Topologi JST yang digunakan untuk proses identifikasi ditunjukan pada Gambar 2. Masukan JST berupa nilai CWT ternormalisasi dalam matrik 1x900. JST yang digunakan multi layer perseptron dengan dua hidden layer. Pada layer input terdiri atas 900 neuron, yakni menyesuaikan dengan jumlah data masukan yang berjumlah 900 data. Layer output terdiri atas 10 neuron, yang menyesuaikan dengan jumlah kelas yang akan diklasifikasi.
Gambar 2. Topologi JST
Setiap jenis vokal dan kondisi masing–masing mempunyai target tersendiri. Jumlah neuron pada hidden layer 1 dan hidden layer 2 masing–masing 40 neuron. Proses pembelajaran menggunakan metode backpropagasi [7]. Untuk mengevaluasi hasil identifikasi, dari hasil pengujian dihitung sensitifitas (SE), spesifisitas (SP), dan efisiensi sistem (E). Sensitifitas dihitung dari jumlah identifikasi benar dari pengujian dengan suara normal. Spesifisitas dihitung dari jumlah identifikasi benar dari pengujian suara serak. Efisiensi dihitung dari total identfikasi benar dari total pengujian dengan suara normal dan serak [5].
SE =
TP .100 TP + FP
(8)
SP =
TN .100 FN + TN
(9)
E=
TP + TN .100 TP + FP + TN + FN
(10)
di mana : TP = Identifikasi benar pada pengujian suara normal FP = Identifikasi salah pada pengujian suara normal TN = Identifikasi benar pada pengujian suara serak FN = Identifikasi salah pada pengujian suara serak
3. HASIL Proses identifikasi suara diawali dengan proses normalisasi dan pemisahan sinyal suara (voice) dan sinyal bukan suara (unvoice). Proses pemisahan sinyal tersebut kebanyakan berhasil dilakukan dengan baik dengan treshold empat kali standar deviasi maksimum periode unvoice. Untuk seluruh sinyal dilakukan framing dan perhitungan standar deviasi dan dibuat deret logika. Deret logika berniali 0 jika nilai standar deviasi kurang dari threshold dan bernilai 1 jika lebih atau sama dengan. Dari deret logika yang terbentuk, kemudian dicari titik awal dan titik akhir dari sinyal suara. Dari hasil tersebut, maka sinyal yang ditransformasi dengan CWT hanya bagian sinyal suara. Sinyal suara normal yang telah dipisahkan dari sinyal bukan suara ditunjukan pada Gambar 3.a, sedankan scalogram hasil CWT ditunjukan pada Gambar 3.b. Sinyal suara serak dan hasil CWTnya ditunjukan Gambar 4.a dan 4.b.. Pada fase pembelajaran JST dengan batas SSE < 0.001, konvergensi nilai bobot dicapai pada iterasi ke 476967. Pada pengujian menggunakan data yang telah ditrainingkan, setiap data teridentifikasi dengan benar 100%. Pengujian secara online dilakukan sebanyak 100 kali dengan
121
masing–masing vokal normal dan serak 10 kali. Hasil pengujian secara online ditampilkan pada Tabel 1. Pada Tabel 2 ditampilkan rekapitulasi identifikasi kondisi normal atau serak dari setiap jenis vokal yang diujikan dengan kondisi normal atau seraka. Hasil perhitungan performa JST terhadap identifikasi jenis suara normal atau serak ditampilkan pada Tabel 3.
Tabel 2. Rekap hasil identifikasi kondisi normal atau serak
Suara Uji Vokal A
Tabel 1. Rekap data hasil pengujian online
Jumlah Identifikasi Benar
Suara Uji
Jumlah Pengujian Vokal & Kondisi
Vokal
Kondisi
E
I
Identifikasi
Kondisi
Normal
Serak
Total
Normal
9
1
10
Serak
0
10
10
Normal
9
1
10
Serak
8
2
10
Normal
5
5
10
Serak
8
2
10
Normal
9
1
10
Serak
1
9
10
Normal
6
4
10
Serak
1
9
10
A normal
10
7
7
10
E normal
10
5
8
9
I normal
10
5
5
8
O normal
10
5
6
9
U normal
10
0
2
6
A serak
10
3
3
10
E serak
10
2
2
10
I serak
10
3
7
5
O serak
10
5
5
9
SE
100
90
80
90
60
84
15,17
U serak
10
2
2
9
SP
100
100
50
90
90
86
20,74
Total
100
40
47
85
E (%)
100
95
65
90
75
85
14,58
40,00%
47,00%
85,00%
Keberhasilan
O
U
Tabel 3. Indikator performa identifikasi suara normal atau serak Indikator A E I O U Mean SD
Gambar 3. Sinyal suara normal (a) Sinyal dalam domain waktu (b) Scalogram hasil CWT sinyal suara normal
122
Gambar 4. Sinyal suara serak(a) Sinyal dalam domain waktu (b) Scalogram hasil CWT sinyal suara serak
4.
PEMBAHASAN
Sinyal suara yang terekam hampir selalu terdiri atas sinyal suara (voice) dan sinyal bukan suara (unvoice). Keberadaan sinyal bukan suara ini dikarenakan mikrofon memerlukan waktu beberapa saat untuk merubah getaran yang disebabkan gelombang suara menjadi sinyal listrik. Di samping itu, pada saat perekaman sering terjadi jeda waktu antara titik mulai perekaman dengan dimulainya pengucapan suara sehingga ada durasi diam di awal sinyal yang terekam. Begitu juga di akhir pengucapan suara juga sering terjadi jeda waktu dengan akhir perekaman sehingga ada durasi diam di akhir sinyal.. Metode Pemisahan sinyal suara dengan bukan suara yang digunakan memberikan hasil pemisahan yang cukup baik. Threshold yang digunakan terhadap kebanyakan sampel suara adalah empat kali standar deviasi maksimum dari sampel sinyal bukan suara yang diambil. Operasi CWT pada sebuah sinyal pada dasarnya adalah menjumlahkan hasil perkalian sinyal dalam jangkauan fungsi wavelet dengan fungsi wavelet dengan nilai skala tertentu pada satu titik translasi. Operasi dengan satu jenis nilai skala dilakukan pada setiap translasi hingga akhir durasi sinyal. Kemudian operasi tersebut diulang dengan nilai skala yang lebih besar. Semakin besar nilai skala, maka hasil CWT yang dihasilkan merupakan representasi frekuensi sinyal yang semakin kecil. Pada sistem yang digunakan, nilai skala dasar yang digunakan sebesar 0.00018 dan delta skala 0.00018 hingga 18 kali variasi nilai skala. Berdasarkan persamaan (7), dapat dihitung keberadaan frekuensi sinyal suara yang dapat terwakili oleh nilai CWT yang dihasilkan. Frekuensi tertinggi sinyal yang dapat diwakili oleh nilai CWT pada nilai skala 0.00018 adalah 4680 Hz. Frekuensi terendah dari sinyal suara terwakili oleh nilai CWT
pada skala ke 18, yaitu nilai skala 0.00454 mewakili frekuensi 187 Hz. Penggunaan ke 18 variasi skala tersebut sudah dapat mewakili informasi keberadaan frekuensi pada sebuah sinyal suara, karena frekuensi sinyal suara yang dihasilkan organ penghasil suara manusia tidak pernah lebih dari 4000 Hz. [6] Hasil CWT menggambarkan keberadaan frekuensi sebuah sinyal sepanjang durasi pengucapan dengan resolusi frekuensi yang tinggi pada range frekuensi rendah. Hal ini dapat dilihat pada scalogram pada Gambar 3.b dan Gambar 4.b. Pada nilai skala terkecil, lebar jangkauan fungsi morlet menjadi paling pendek sehingga memberikan resolusi waktu yang tinggi. Dengan resolusi waktu yang tinggi ini menyebabkan CWT dapat dengan baik menggambarkan keberadaan frekuensi–frekuensi tinggi. Dapat dilihat pada scalogram contoh sinyal suara, frekuensi yang ada pada sinyal tidak lebih dari 4 kHz. Hasil penting dari penggunaan CWT adalah dapat diketahuinya keberadaan komponen frekuensi setiap sinyal suara sepanjang durasi pengucapan, di mana informasi ini tidak bisa didapatkan dengan menggunakan analisa domain frekuensi saja seperti penggunaan transformasi fourier. Hal ini menjadi sangat penting karena perbedaan suara normal dengan suara serak terletak tidak hanya saja di ranah frekuensi saja tetapi juga di ranah waktu. Dapat dilihat dari Gambar 3.b dan Gambar 4.b, terdapat perbedaan pola spektral yang ditunjukan perbedaan nilai CWT pada skala yang sama dan juga pola keteraturan nilai CWT yang berbeda sepanjang durasi waktu. Perbedaan karakter suara normal dan serak pada domain waktu dan frekuensi yang ditunjukan oleh hasil CWT ini dijadikan dasar sistem identifikasi. Bentuk hasil CWT setiap sinyal suara berupa matrik 18x50 yang merupakan nilai–nilai operasi CWT dari setiap skala pada 50 titik translasi waktu. Sebelum digunakan sebagai masukan sistem JST, nilai hasil CWT
123
dinormalisasi terlebih dahulu terhadap jangkauan range nilai CWT masing–masing sampel suara seperti ditunjukan pada persamaan (8) dan matrik 18x50 diubah menjadi matrik 1x900. Proses pembelajaran JST dengan konfigurasi yang digunakan berlangsung dengan baik. Hal ini ditandai dengan proses pembelajaran yang mencapai konvergen, yakni berhentinya proses iterasi berdasarkan nilai SSE yang ditentukan yakni 0,001 dan pada saat dilakukan pengujian seluruh data yang telah dibelajarkan 100% dapat teridentifikasi dengan benar baik jenis vokal maupun kondisi serak atau normal. Pada pengujian secara online, sistem dapat mengidentifkasi dengan tepat suara serak dan suara normal sebanyak 85 kali dari 100 pengujian. Untuk identifikasi jenis vokal teridentifikasi dengan tepat 47 kali dari 100 pengujian (47%). Untuk identifikasi tepat keduanya baik jenis vokal maupun kondisi hanya 40 kali dari 100 kali pengujian (40%). Dari hasil pengujian secara online ini sistem belum berhasil dengan baik mengidentifikasi jenis vokal dan kondisi sekaligus. Akan tetapi kesalahan identifikasi jenis suara serak atau normal tanpa melihat jenis vokal yang diucapkan mencapai efisiensi rata-rata 85% dengan standar deviasi 14,58% untuk kelima jenis vokal. Pada pengujian secara online ini cukup sulit didapatkan hasil yang tepat untuk semua jenis vokal dan kondisi. Faktor yang mempengaruhi antara lain perbedaan intonasi pengucapan suara pada saat pengujian yang kemungkinan besar berbeda dengan intonasi suara yang ditrainingkan. Perbedaan intonasi ini mempengaruhi amplitudo dan frekuensi sinyal yang kemudian berpengaruh juga pada hasil CWT. Akan tetapi perbedaan pola karakter antara suara normal dan serak dapat tergambar dengan baik pada hasil CWT, sehingga meskipun identifikasi jenis vokal banyak terjadi kesalahan tetapi identifikasi jenis suara normal atau serak tetap bekerja dengan baik. Dari hasil pengujian terlihat bahwa suara vokal “I” teridentifikasi dengan benar sebagai suara normal atau serak paling sedikit di antara jenis vokal yang lain. Pengujian dengan vokal A, baik normal maupun serak dapat teridentifikasi dengan baik sebagai suara normal ataupun serak. Dengan sistem yang telah dibuat, dengan mengambil sampel suara vokal A, E, I, O atau U maka dapat dideteksi suara tersebut serak atau normal dengan tingkat keberhasilan 85%. Kemampuan JST mengenali suara normal yang belum ditrainingkan ditunjukan dengan nilai sensitifitas rata– rata 84% dengan standar deviasi 15,17% untuk kelima jenis vokal. Kemampuan JST untuk mengenali jenis suara serak ditunjukan dengan nilai spesifisitas rata– rata 86% dengan standar deviasi 20,74 % untuk kelima jenis vokal. Total efisiensi JST dalam identifikasi jenis suara normal atau serak rata–rata 85% dengan standar deviasi 14,58%.
124
5.
KESIMPULAN
Dari hasil dan pembahasan di atas dapat disimpulkan bahwa CWT dan JST dapat digunakan untuk membuat sistem pengidentifikasi jenis suara secara online. Akan tetapi keberhasilan identifikasi juga sangat dipengaruhi oleh proses pre-prosesing dan pengkondisian pengucapan sinyal suara. CWT dapat menggambarkan dengan baik perbedaan karakter antara suara normal dan suara serak dan hasil CWT ini dapat digunakan sebagai masukan sistem identifikasi menggunakan JST. Kemampuan JST dalam mengenali data baru dari jenis suara normal ditunjukan dengan nilai sensitifitas 84%. Kemampuan JST dalam mengenali data baru dari jenis suara serak ditunjukan spesifisitas 86%, dan efisiensi identifikasi jenis suara normal dan serak rata–rata 85% untuk kelima jenis suara vokal. Dengan hasil tersebut dapat diketahui bahwa CWT dan JST dapat digunakan untuk mengidentifikasi jenis suara normal dan serak. Hasil penelitian ini daharapkan dapat dikembangkan lagi untuk merealisasikan sisitem identifikasi jenis penyakit daerah pita suara berdasarkan analisa suara pasien.
DAFTAR REFERENSI [1] Fonesca, Everton S and Jose C. Pereira, “Normal Versus Pathological Voice Signals”, IEEE Engineering in Medicine and Biology magazine edisi september / oktober 2009, hal. 44 – 48, 2009 [2] Yusif A. El-Imam,”On the assessment and evaluation of voice hoarseness”, Biomedical Signal Processing and Control 3, hal. 283–290, 2008 [3] Umapathy Karthikeyan and Sridhar Krishnan and Vijay Parsa and Donald G. Jamieson, “ Discrimination of Pathological Voices Using a Time-Frequency Approach”, IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING, VOL. 52, NO. 3. Hal. 421-431., 2005 [4] Paul S. Addison,James Walker, and Rodrigo C. Guido, “ Time–Frequency Analysis of Biosignals “,IEEE Engineering in Medicine and Biology magazine edisi september / oktober 2009, hal. 14 – 29, 2009 [5] J. I. Godino-Llorente and P. Gómez-Vilda (2004), “Automatic Detection of Voice Impairments by Means of Short-Term Cepstral Parameters and Neural Network Based Detectors”, IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING, VOL. 51, NO. 2. Hal.380 – 385. [6] L.R. Rabiner and R.W. Scafer, 1978, Digital Processing For Speech Signals, Prentice Hall [7] Kiri Wagstaff, “ANN Backpropagation:Weight updates for hidden nodes”, http://www.wkiri.com, 31 Januari 2012 09:00 WIB