Jurnal Teknik Elektro dan Komputer, Vol 2, No 2, Oktober 2014, 173-180
173
Analisa Suara Normal Dan Suara Gangguan Tenggorokan Dalam Domain Waktu-Frekuensi Menggunakan Transformasi Wavelet
Luqman Hakim1& Putri Madona2 1
Program Studi Teknik Mekatronika, Politeknik Caltex Riau, Pekanbaru 28265 Program Studi Teknik Elektronika, Politeknik Caltex Riau, Pekanbaru 28265 Email:
[email protected],
[email protected]
2
Abstrak Pada paper ini ditunjukan hasil analisa karakter domain waktu-frekuensi antara sinyal suara normal dengan suara pasien gangguan tenggorokan berbasis tranasformasi wavelet. Suara merupakan bunyi yang dihasilkan oleh sistem organ penghasil suara yang diawali dengan bergetarnya pita suara. Jika ada gangguan ataupun penyakit pada daerah pita suara maka akan menghasilkan suara yang berbeda dari suara normalnya. Sedangkan transformasi wavelet merupakan salah satu jenis transformasi yang banyak digunakan untuk menganalisa sebuah sinyal alam yang bersifat kompleks non stasioner dalam domain waktu dan frekuensi secara simultan. Dari perhitungan indeks kemiripan antara sampel suara normal dengan sampel suara traumatic laryngitis dan viral laryngitis menunjukan tingkat kemiripan yang rendah dari hasil transformasi wavelet sampel suara normal, rata – rata indeks kemiripan 0.131 dan 0.1688. Dengan hasil tersebut menunjukan bahwa transformasi wavelet tersebut dapat digunakan untuk mengklasifikasi jenis suara normal dengan suara pasien penyakit atau gangguan tenggorokan. Kata kunci: suara, penyakit, gangguan, wavelet
Abstract In this paper described the results of characters time-frequency domain analyses of normal voices and pathologic voices based on wavelet transformation. The voice is sound produced by organs system that begins with vocal cord vibration. If there is a disease or disorder in the area of the vocal cords will produce a different sound than normal voices. While the wavelet transform is one kind of transformation that is widely used for analyzing a signal that is complex nature non-stationary in time and frequency domains simultaneously. From the calculation of similarity index between normal voices samples and traumatic and viral laryngitis showed a low degree of similarity of the results of wavelet transform normal voice samples, the average number of index similarly is 0.131 and 0.1688. With these results indicate that the wavelet transform can be used to classify the type of normal voices and pathologic or disturbances in throat area voices. Keywords: voice, pathologic, disturbance, wavelet
1
Pendahuluan
Suara merupakan bunyi yang dihasilkan oleh sistem organ penghasil suara yang diawali dengan bergetarnya pita suara. Jika ada gangguan ataupun penyakit pada daerah pita suara maka akan menghasilkan suara yang berbeda dari suara normalnya. Pada bagian tengah pita suara terdapat lobang tenggorokan (trachea) yang menuju paru – paru seseorang. Ketika bernafas, kedua pita suara membuka (abducted). Pada saat berbicara, kedua pita suara tersebut bergerak menutup secara simultan (adducted). Saat menciptakan suara, kedua pita suara tersebut bergetar dengan sangat cepat untuk menciptakan bunyi. Ketika kedua pita suara datang menutup secara bersamaan maka akan dihasilkan suara yang bersih dan jelas. Namun jika ada sisi yang kasar
174
Luqman Hakim, Putri Madona
atau kejang karena pembengkakan akibat kelelahan atau radang atau ada massa seperti kista, tonjolan, maka getaran pada pita suara menjadi terganggu sehingga suara yang dihasilkan menjadi tidak jelas, serak atau parau[1]. Transformasi wavelet merupakan salah satu jenis transformasi yang banyak digunakan untuk menganalisa sebuah sinyal alam yang bersifat kompleks non stasioner dalam domain waktu dan frekuensi secara simultan[2]. Dalam penelitian telah dicoba melakukan analisa domain waktu-frekuensi menggunakan tranasformasi wavelet untuk melihat adakah ciri atau karakter domain waktu-frekuensi yang dapat membedakan sinyal suara normal dengan suara dari pasien yang mengidap gangguan / penyakit pada daerah tenggorokan. Dari karakter / ciri pembeda bisa didapatkan, maka dari analisa tersebut dapat dikembangkan untuk membuat sebuah sistem komputasi untuk identifikasi secara dini gangguan / penyakit tenggorokan secara sistematis berdasarkan analisa suara pasien. Peneltian dalam hal pengambilan ciri sinyal suara normal dengan suara normal dengan suara pasien penyakit telah dilakukan[3], dalam paper ini dicoba dilakukan kembali dengan menggunakan transformasi wavelet sebagai basis karakterisasi sinyal suara. Pada paper ini ditunjukan karakteristik sinyal suara normal dan dari pasien yang mengalami gangguan tenggorokan dalam domain waktu-frekuensi secara simultan menggunakan tranasformasi wavelet. Hasil transformasi wavelet tersebut kemudian dibandingkan dengan hasil tranasformasi wavelet dari suara orang yang sehat. 2
Metodologi
2.1
Sampel Suara
Sampel suara yang telah didapatkan terdiri dari sampel suara manusia normal terdiri dari 13 laki-laki dan 5 perempuan. Sampel suara dari pasien gangguan tenggorokan baru didapatkan dari sumber rekaman dari pengidap laryngitis atau radang tenggorokan. Dari klik Dr. Chang didapatkan sampel suara dari pasien traumatic laryngitis dan viral laryngitis.
2.2
Perancangan Perangkat Lunak
Perangkat lunak dibuat untuk mengimplementasikan formula transformasi wavelet untuk mendapatkan informasi waktu dan frekuensi sebuah sinyal secara simultan. Transformasi wavelet yang digunakan adalah Continuous Wavelet Transformation (CWT). Transformasi wavelet dari sebuah sinyal non stasioner kontinyu dalam domain waktu x (t ) didefiniskan sebagai : ∞
1 t− b CWT (a , b)= x( t ) ψ ' ( ) dt ∫ a √a − ∞
(1)
di mana ψ' merupakan konjugate complex dari fungsi wavelet , a adalah parameter dilasi wavelet atau skala dan b adalah parameter lokasi atau translasi waktu. Setiap nilai skala a wavelet berkorelasi invers sebuah nilai frekuensi tertentu sinyal yang didekomposisi. Dari sini dapat dilihat bahwa hasil transformasi CWT CWT (a , b) merupakan sebuah nilai yang mempresentasikan keberadaan sebuah frekuensi pada sebuah sinyal pada translasi waktu ke b. Dengan variasi nilai a dan operasi wavelet dilakukan setiap translasi b sepanjang waktu sinyal, maka akan didapatkan informasi keberadaan frekuensi – frekuensi pada sinyal pada lokasi waktu yang ditunjukan dengan nilai translasi sinyalnya. Untuk menganalisa sinyal – sinyal kompleks, digunakan fungsi wavelet morlet, yang didefinisikan :
Analisa Suara Normal Dan Suara Gangguan Tenggorokan Dalam Domain...
1 jω t ψ( t)= 4 e e √π o
−t 2
175
2
(2)
dengan ω0 adalah frekuensi sentral fungsi morlet. Penggunaan ω0 = 5,33 rad/s atau 0,849 Hz telah banyak digunakan oleh para peneliti untuk menyelesaikan berbagai masalah analisa sinyal kompleks non stasioner.[2] Pada penelitian yang dilakukan untuk menganalisa sinyal suara menggunakan fungsi morlet dengan f 0 0,849 Hz. Digunakan fungsi morlet karena sinyal suara merupakan salah satu sinyal kompleks yang secara alamiah terdiri atas komponen sinusoidal. Untuk realisasi komputasi, nilai CWT dari sebuah sinyal diskrit x [ n ] dapat ditulis dengan persamaan 3. Koefisien – koefisien hasil CWT merupakan penjumlahan dari perkalian nilai sinyal x dengan fungsi wavelet pada skala a dan translasi b fungsi wavelet yang bersangkutan dibagi akar skala.
CWT (a , b)=
2.3
1
√a
∑ x [ n ] ψ '(a ,b )
(3)
Pengujian dan Analisa
Perangkat lunak yang merupakan implementasi dari tranasformasi wavelet diujikan terlebih dahulu dengan sinyal non stasioner yang dibuat dengan persamaan dimana besar amplitude dan frekuensi telah ditentukan. Dari pengujian tersebut digunakan untuk melihat apakah hasil transformasi aplikasi yang dibuat dapat dengan tepat mentranasformasi sinyal tersebut dalam domain waktu dan frekuensi secera simultan sehingga didapatkan karakteristik waktu-frekuensi dengan tepat. Setelah diketahui bahwa aplikasi yang dibuat dapat menghasilkan koefisien wavelet dengan tepat, maka aplikasi tersebut digunakan untuk melakukan tranasformasi terhadap sinyal suara sampel. Nilai hasil transformasi wavelet dari sampel suara orang normal dan suara dengan gangguan kemudian dibandingkan dengan mencari indeks kemiripan. Indeks kemiripan nilai CWT sampel suara normal dengan nilai CWT sampel suara pasien dikuantifikasi menggunakan equality distance berbasiskan keberadaan nilai terdekat antara dua nilai matrix dengan menggunakan Euclidean distance. Matrik euclidean distance anatara matrix x1[i,j] dan matrik x2[i,j] dirumuskan:[4]
d ij = ( x 1 [ i , j ]− x 2 [i , j ])
2
(4)
i= n i n j
∑ ∑ s ij sk=
i= 1 j = 1
(5)
ni n j
Dari nilai euclidean distance tersebut dibuat vektor baru S ij yang menunjukan kedekatan atau kemiripan dua vektor yang dibandingkan. Jika d ij < 0.0001 maka S ij = 1 jika tidak maka 0. Tingkat kemiripan (similarity index) dihitung dengan menggunakan persamaan 4.9. Notasi n i adalah jumlah kolom matrik dan n j adalah jumlah baris matrik. Dengan menggunakan batas d ij 0.01 maka index yang didapatkan menunjukan tingkat kemiripan hingga 99.99 %. Nilai index kemiripan ini berkisar antara 0 sampai dengan 1. Nilai index 0 menunjukan perbedaan sempurna sedangkan nilai 1 menunjukan persamaan sempurna.
176
Luqman Hakim, Putri Madona
3
Hasil dan Pembahasan
3.1
Pengujian CWT dengan Sinyal Non Stasioner Buatan
Pengujian pertama dilakukan dengan menggunakan sinyal non stasioner buatan dengan hanya satu komponen frekuensi pada termin waktu tertentu. Sinyal non stasioner x (t ) yang diuji mempunyai komponen frekuensi yang tidak tetap (200 Hz, 700 Hz, 1200 Hz, 3000 Hz, dan 15000 Hz) pada termin – termin waktu yang ada, yang ditunjukan dengan bentuk persamaan sinyal sebagai fungsi waktu t sebagai berikut: 1. 2. 3. 4. 5.
Saat waktu Saat waktu Saat waktu Saat waktu Saat waktu
0< t < 125 ms sinyal x (t )= 0.95 cos 2 π200t 125< t < 250 ms sinyal x (t )= 1.cos 2 π700t 250< t < 500 ms sinyal x (t )= 0.9cos 2 π1200t 500< t < 750 ms sinyal x (t )= 1.cos 2 π3000t 750< t < 1000 ms sinyal x (t )= 0.95.cos 2 π15000t
Frekuensi sampling yang digunakan sama dengan frekuensi sampling saat dilakukan perekaman, yaitu 44,1 kHz maka total seluruh data digital sinyal ada 44100. Tampilan penggalan sinyal dalam bentuk grafik terhadap jumlah data N ditampilkan pada Gambar 1. Hasil CWT dari sinyal uji 1 diatas ditampilkan dalam grafik 3 dimensi diperlihatkan pada Gambar 2. Pada Gambar 2 terlihat bahwa keberadaan setiap komponen frekuensi sinyal dapat tergambar dengan tepat pada skala dan transalasi yang sesuai. Total durasi sinyal uji adalah 1 s atau 1000 ms atau sebanyak 44100 jumlah sampel pada frekuensi sampling 44,1 kHz. Pada pengoperasian CWT, fungsi wavelet morlet digeser sepanjang sinyal dengan pergeseran setiap 1/100 durasi atau jumlah sampel sehingga pada kasus di sini 1 translasi mewakili 10 ms durasi sinyal atau 441 sampel.
Gambar 1
Gambar 2
Grafik sinyal uji 1
Grafik 3 dimensi sinyal uji 1
Analisa Suara Normal Dan Suara Gangguan Tenggorokan Dalam Domain...
177
Pada contoh sinyal di atas, pada 125 ms pertama sinyal mempunyai frekuensi 200 Hz. Waktu 125 ms pertama sama dengan 5512 data N sama dengan 12,5% dari seluruh jumlah data atau durasi sinyal, keberadaanya dalam domain waktu t atau jumlah data N di wakili oleh translasi ke 1 sampai 12. Pada grafik hasil CWT terlihat pada translasi ke 1 sampai sekitar 12 terbentuk kubah CWT dengan nilai puncak pada sekitaran skala ke 80-an. Dari Tabel 1 dapat dilihat bahwa skala ke 80, 81, 82, 84, 85 berkorelasi dengan nilai frekuensi masing – masing 209, 207, 204,202, dan 199 Hz. Pada translasi selanjutnya dapat dilihat dari grafik 3 dimensi pada Gambar 2 dan Tabel 1 bahwa hasil CWT dapat melokalisir setiap komponen frekuensi pada termin translasi dengan tepat.
3.2
Analisa CWT pada Sampel Sinyal Suara Normal
Penggunaan CWT ditujukan untuk mendapatkan ciri karakteristik suara normal dan suara dengan gangguan laryngitis. Mengingat setiap nilai hasil CWT berkoresponden dengan frekuensi sinyal, dengan melihat grafik dari arah skala akan dapat dilihat peta spektral sinyal. Dengan melihat dari arah translasi waktu, dapat dilihat keberadaan setiap spektral sinyal sepanjang durasi waktu sinyal. Dengan melihat rata – rata nilai CWT per skala sepanjang translasi dapat dilihat karakter spektral atau keberadaan frekuensi formant (resonansi) sinyal suara. Tingkat stabilitas keberadaan frekuensi sinyal selama durasi pengucapan suara dapat dilihat dari parameter standar deviasi. Contoh sinyal suara vokal “I” normal dan hasil CWT dari sinyal suara tersebut diperlihatkan pada Gambar 3 dan Gambar 4. Dalam bentuk grafik 3 dimensi seperti terlihat pada Gambar 4 dapat dilihat komponen – komponen frekuensi yang ada dan pada translasi ke berapa frekuensi tersebut ada.
Gambar 3
Gambar 4
Gambar 4.6 Sampel sinyal suara “I” Normal
Grafik 3 dimensi hasil CWT sampel sinyal suara “I”
178
Luqman Hakim, Putri Madona
Dari grafik hasil CWT, dapat dilihat puncak kubah pertama terletak pada skala ke 25, kubah kedua terletak pada skala ke 65, sedangkan kubah ke tiga terletak pada skala di atas 100. Pada skala ke 25 bernilai 0,00125 dan berkorelasi dengan frekuensi 679 Hz. Skala ke 65 bernilai 0,00325 berkorelasi dengan frekuensi 261 Hz, sedangkan skala ke 100 bernilai 0,005 berkorelasi dengan frekuensi 169 Hz. Pengujian CWT terhadap sinyal suara normal dilakukan pada sampel suara-suara vocal yang lain juga. Ringkasan frekuensi formant sampel – sampel setiap vokal ditampilkan pada Tabel 1. Tabel 1 Vokal
3.3
Frekuensi formant rata – rata 5 sampel vokal Frekuensi Formant (Hz)
F1
F2
F3
A
242 - 283
566 - 849
1132 - 1415
E
283 - 339
424 - 566
2125 - 2425
I
169 - 175
283 - 339
2125 - 2425
O
297 - 326
424 - 566
998 - 1132
U
238 - 339
424 - 485
679 - 849
Analisa CWT Sampel Suara Dari Pasien Laryngitis
Sampel suara seseorang yang mengidap laryngitis didapatkan dari video fiberoptic laryngoscop yang direkam di klinik Dr. Christopher Y. Chang yang diunggah di http://www.fauquierent.net. Beberpa sampel yang didapatkan dan dicoba dianalisa menggunakan CWT adalah sebagai berikut :
1. Traumatic Laryngitis Traumatic Laryngitis adalah radang pada laring atau pita suara yang disebabkan oleh trauma karena terlalu banyak mengeluarkan suara, infeksi atau karena sebab yang lain. Didapatkan satu sampel suara “I” untuk pasien yang menderita traumatic laryngitis. Gambar sinyal suara ditunjukan pada Gambar 5. Hasil CWT dalam bentuk grafik 3 dimensi ditunjukan pada Gambar 6. Dari grafik hasil CWT terlihat dengan jelas ketidakteraturan pada hasil CWT setiap skala sepanjang durasi waktu. Kubah signifikan muncul pada skala ke 10 yang berkorelasi dengan frekuensi 1698 Hz dan skala ke 62 yang berkorelasi dengan frekuensi 273 Hz.
Gambar 5
Sinyal sampel suara terkena traumatic laryngitis
Analisa Suara Normal Dan Suara Gangguan Tenggorokan Dalam Domain...
Gambar 6
179
Grafik 3 dimensi hasil CWT untuk sinyal sampel suara terkena traumatic laryngitis
2. Viral Laryngitis Viral laryngitis adalah radang pada larng atau pita suara yang disebabkan oleh virus. Gambar pita suara pasien viral laryngitis ditunjukan pada Gambar 7. Sampel suara pasien viral laryngitis juga berupa suara vokal “I”. Ketidakteraturan hasil CWT pada skala – skala signifikan juga terlihat jelas sepanjang translasi seperti terlihat pada Gambar 8 Bentuk spektral yang terlihat dari grafik rata – rata CWT per skala seperti terlihat pada Gambar 8 tampak relatif sama dengan spektral dari suara “I” pasien traumatic laryngitis. Perbedaanya pada puncak kubah yang mengalami pergeseran. Pada Gambar 8 terlihat kubah pertama berada sekitar skala ke 7 yang berkorelasi dengan frekuensi 2425 Hz dan kubah ke dua pada skala ke 50 yang berkorelasi dengan frekuensi 339 Hz.
Gambar 7
Gambar 8
Sinyal sampel suara terkena viral laryngitis
Grafik hasil CWT sampel suara terkena viral laryngitis
180
Luqman Hakim, Putri Madona
Nilai index kemiripan nilai CWT suara sampel dengan suara pasien ditunjukan pada Tabel 1. Dari nilai rata-rata nilai indeks kemiripan antara CWT suara pasien dengan CWT suara normal nilainya cukup kecil, sehingga dapat disimpulkan bahwa tranasformasi wavelet dalam hal ini adalah CWT dapat digunakan untuk mengkarakterisasi jenis suara sehat dengan suara dengan gangguan atau penyakit daerah tenggorokan. Tabel 2
Index kemiripan sampel suara normal dengan sampel suara pasien Indeks Kemiripan
Sampel
4
Normal 1
Normal 2
Normal 3
Normal 4
Normal 5
Rata - rata
Traumatic Laryngitis
0,1278
0,1344
0,1349
0,1278
0,1301
0,1310
Viral Laryngitis
0,1630
0,1714
0,1735
0,1619
0,1672
0,1688
Kesimpulan
Dari analisa hasil tranasformasi wavelet terhadap sampel – sampel sinyal suara bisa didapatkan karakterisasi masing – masing jenis vokal normal dan gangguan. Setiap suara vokal mempunyai karakter spektral frekuensi resonansi (formant) masing – masing dilihat dari nilai rata – rata hasil CWT setiap skala sepanjang translasi. Dari perhitungan indeks kemiripan antara sampel suara normal dengan sampel suara traumatic laryngitis dan viral laryngitis menunjukan tingkat kemiripan yang rendah, rata – rata indeks kemiripan 0.131 sampai 0.1688. Dengan hasil tersebut menunjukan bahwa CWT dapat digunakan untuk mengklasifikasi jenis suara normal dengan suara dari pasien penyakit atau gangguan pada daerah tenggorokan. 5
Daftar Pustaka
[1]
Chang, Cristopher Y. “The Human Voice: In Health & In Disease“, http://www.fauquierent.net/voice.htm , 4 Desember 2011 08:56 Addison, Paul S., James Walker, and Rodrigo C. Guido, “ Time–Frequency Analysis of Biosignals “, IEEE Engineering in Medicine and Biology Magazine,september / oktober 2009, pp. 14 – 29. Fonesca, Everton S. and Jose C. Pereira, “Normal Versus Pathological Voice Signals”, IEEE Engineering in Medicine and Biology Magazine., september / oktober 2009, pp. 44 – 48. Thompson, E. Bautista and S. Santos De la Cruz, “Shape Similarity Index for Time Series based on Features of Euclidean Distances Histograms”, Proceedings of the 15th International Conference on Computing (CIC'06), 2006.
[2]
[3]
[4]