PEMISAHAN BANYAK SUMBER SUARA MESIN DARI MIKROFON BERBASIS TIME-FREQUENCY BLIND SOURCE SEPARATION Sherly Sabaraya, Dhany Arifianto Jurusan Teknik Fisika-Fakultas Teknologi Industri Institut Teknologi Sepuluh Nopember Kampus ITS, Sukolilo, Surabaya – 60111 email :
[email protected],
[email protected]
Abstrak
Umumnya industri manufaktur secara operasional tidak terlepas pada ketergantungan pada mesin-mesin berputar misalnya pompa, kompresor dan lainnya yang beroperasi terus-menerus. Faktor perawatan (maintenance) berkala terhadap mesin pabrik sangatlah vital untuk menjaga kontinuitas produksi. Hingga saat ini teknik yang lazim dipakai adalah vibrometer yang dilengkapi accelerator sebagai sensor getaran (vibrasi) yang harus ditempelkan pada badan mesin kemudian dengan transformasi Fourier dapat diketahui frekuensi diri mesin apakah masih baik atau harus dirawat. Kendala dari teknik ini, jumlah mesin yang banyak sehingga perlu diperiksa satu per satu in-situ, sehingga mempersulit operator. Pada penelitian ini diusulkan teknik analisa sinyal suara yang diemisikan oleh mesin berputar tersebut untuk mempermudah monitoring tanpa sentuh. Teknik yang dipakai untuk memisahkan suara mesin yang saling bercampur antara satu dengan mesin tetangganya yaitu metode time-frequency Blind Source Separation (tfBSS). Campuran sinyal suara banyak mesin (convolutive mixtures) mampu dipisahkan menjadi sinyal suara masing-masing mesin dan jenis kerusakan mesin dapat ditentukan berdasarkan frekuensi yang diekstraksi dengan Wigner-Ville distribution dibandingkan dengan sinyal suara rujukan (baseline) mesin. Fokus pada penelitian ini yaitu jumlah sensor lebih besar atau sama dengan sumber mesinnya sehingga perlu joint-diagonalization mixing matrices untuk memperoleh invers matriks. Dengan demikian, sinyal yang sama dari beberapa sensor dapat diwakilkan oleh satu sinyal saja (redundancy elimination) sehingga jumlah keluaran dari algoritma ini sama dengan jumlah sumber mesinnya. Berdasarkan eksperimen yang dilakukan dengan teknik microphone array, maka pemisahan sinyal suara mesin dari sinyal campuran secara convolutive mixture tidak sebaik instantaneous linear mixture. Perbandingan ini dapat ditunjukkan dari hasil MSE antara sinyal estimasi dan sinyal rujukan. Sehingga algoritma tfBSS ini lebih baik digunakan untuk sinyal campuran secara instantaneous linear mixture (scalar mixing). Kata kunci: tfBSS, Redundant Signals, Convolutive Mixture, Wigner-Ville Distribution
I. PENDAHULUAN Teknik yang sering digunakan dalam mendeteksi kerusakan mesin di industri manufaktur yaitu Vibrometer yang disertai dengan accelerator. Dengan teknik ini, frekuensi diri atau frekuensi natural dari mesin dapat diketahui sehingga dapat ditentukan apakah mesin tersebut dalam kondisi baik atau diperlukan perawatan. Kelemahan dari teknik ini yaitu operator harus mengecek satu per satu mesin-mesin tersebut dalam jumlah yang banyak. Oleh karena itu, diperlukan perkembangan penelitian terhadap analisa sinyal suara mesin yang diemisikan oleh mesin-mesin berputar tersebut untuk mempermudah monitoring tanpa sentuh. Alasan lain yang melatar belakangi penelitian ini yaitu adanya penelitian tentang pemisahan banyak sumber suara (speech) dari mikrofon. Dari penelitian tersebut, suara campuran dari percakapan mampu dipisahkan menjadi suara tunggal sesuai dengan suara aslinya. Dari pemecahan masalah inilah kemudian dikembangkan penelitian kembali namun dengan mengambil objek yang berbeda yaitu mesin pompa. Dari latar belakang tersebut maka tujuan dari penelitian ini yaitu mampu memisahkan banyak sumber suara
mesin dari mikrofon dengan metode tfBSS (TimeFrequency Blind Source Separation) dan dengan pendekatan distribusi Wigner Ville. Dimana asumsi yang digunakan dalam penelitian ini yaitu jumlah sensor lebih besar atau sama dengan jumlah sumber, setiap mesin pompa memiliki karakter independensi dan pencampuran suara secara konvolutif. Akibat dari asumsi ini dimana jumlah sensor harus lebih besar dari jumlah sumber maka akan terjadi redudansi sinyal (sinyal yang sama). Dari permasalahan ini, maka tujuan yang ingin dicapai yaitu sinyal redundant mampu dihilangkan atau direduksi sehingga hanya terwakili oleh satu sinyal saja agar jumlah output sinyal estimasi sama dengan jumlah sumbernya. Hasil pemisahan (sinyal estimasi) ini akan dibandingkan dengan sinyal sumber (baseline) dengan menghitung nilai MSE (Mean Square Error). Dari penelitian ini diharapkan dapat bermanfaat bagi praktisi industri dalam penentuan kerusakan mesin dengan analisa pola suara.
II. TFBSS
Blind Source Separation merupakan suatu metode yang digunakan untuk memisahkan sinyal campuran dari banyak sumber suara tanpa mengetahui
banyak informasi mengenai sumber tersebut dan bagaimana proses pencampurannya [1]. Unknown mixing system
S
m
A
Separation system
X n
W
m
y Gambar 2.3 Seleksi Single Auto Term (SAT)[1]
Gambar 2.1 Diagram Blind Source Separation[3]
Gambar 2.2 Diagram pencampuran dan pemisahan sinyal[11]
(2.1) (2.2) Secara diagram, BSS dapat dilihat pada gambar 2.1. Gambar tersebut terdiri dari 2 proses yaitu proses pencampuran sinyal dan proses pemisahan sinyal. Dalam proses pencampuran, S ditunjukkan sebagai sinyal sumber sedangkan A adalah matrik pencampur dimana kedua hal ini tidak diketahui sebelumnya. Karena tidak diketahui kedua hal tersebut maka disebut Blind. Untuk proses pemisahan sinyal, adanya variable X menunjukkan sinyal observasi atau sinyal hasil pengukuran sedangkan W menunjukkan matrik invers dari A dan y adalah sinyal estimasi (hasil pemisahan). Sinyal estimasi ini diperoleh dari perkalian matrik W dan X. Diagram detail dalam pencampuran dan pemisahan sinyal dapat dilihat pada gambar 2.2. Dari diagram ini terlihat bahwa sensor satu (X1) menerima sinyal dari S1 dan S2 begitupula X2. Kemudian X1 dan X2 akan dipisahkan dengan dikalikan matrik W sehingga menjadi sinyal estimasi Y1 dan Y2. Perbedaan mendasar dari metode TFBSS ini yaitu persamaan matematisnya dimana Wigner Ville spectrum menjadi dasar dari plotting TFD (Time Frequency Distribution). Persamaan ini dapat dilihat pada persamaan 2.3. Secara detail, langkah-langkah dalam pemisahan sinyal suara dengan TFBSS yaitu : 1. Whitening data 2. Menghitung STFD (Spatial Time Frequency Distribution) dari sinyal observasi yang sudah diwhitening 3. Menghitung criterion 4. Mengumpulkan Single Auto Term (SAT) 5. Joint Diagonalization Dalam proses whitening data, sinyal suara campuran yang merupakan distribusi Gaussian akan diproses sehingga distribusinya menjadi distribusi Gaussian. Hal ini sesuai dengan central limit theorem dalam ilmu statistika. Untuk menghitung STFD digunakan distribusi Wigner-Ville. Distribusi ini sesuai dengan persamaan
yang tertera pada persamaan 2.3. Kemudian dalam pemisahan sinyal, diperlukan perhitungan criterion dimana perhitungan ini merupakan analogi dari perhitungan energi masing-masing sinyal campuran. Sehingga untuk sinyal yang memiliki energy lebih besar maka mendekati sinyal asli yang dibandingkan tersebut. Dari perhitungan energy ini, posisi single auto-term dapat ditentukan. Dalam gambar 2.3, ditunjukkan adanya perpotongan 2 sinyal campuran dimana perpotongan ini tidak lain adalah diagonal dari matrik estimasi. Selanjutnya, proses joint diagonalization dapat diterapkan. ( (
) )
∫ ( ̂(
)
(
)
( ̂
) )̂
(2.3)
(2.4)
Karena fokus pada penelitian ini, jumlah sensor lebih dari atau sama dengan jumlah sumbernya maka pada saat proses pemisahan diperlukan teknik joint diagonalization mixing matrices agar perkalian matrik yang semula tidak square dapat menjadi square. Sehingga akan didapatkan invers matriknya guna memperoleh sinyal estimasi. Persamaan dalam joint diagonalization ini dapat dilihat pada persamaan 2.4. Dari persamaan tersebut, Im merupakan matrik Identitas yang jika dikalikan dengan varians ( ̂) nol maka akan menghasilkan nol pula. Matrik ̂ adalah matrik sinyal estimasi hermitian dimana sifat dari matrik hermitian yaitu jika dikalikan dengan suatu matrik akan menghasilkan matrik Identitas. Sehingga dari persamaan 2.4, hasil perkalian tersebut adalah diagonal matrik itu ( ). sendiri Convolutive Mixture
g ( n)
h( k ) f ( n k )
(2.5)
k
Data yang diperoleh dari perekaman langsung sumber suara pompa misalnya, merupakan sinyal-sinyal campuran yang sifatnya konvolutif. Sehingga asumsi dalam penelitian ini menggunakan pencampuran secara konvolutif. Persamaan matematis convolutive mixture ini ditunjukkan pada persamaan 2.5. Microphone Array Dalam pengambilan data sinyal suara mesin, teknik yang digunakan yaitu teknik microphone array.
Gambar 2.3 Ilustrasi sudut datang antar sumber dan sensor dalam BSS[5]
Microphone array yaitu susunan beberapa mikrofon yang berfungsi sebagai sensor dalam menangkap sinyal dari banyak sumber suara[3]. Faktor atau parameter utama yang harus diperhatikan dalam teknik ini yaitu jarak antar mikrofon dan sudut datang yang dibentuk antara sumber dan sensor. Apabila dua parameter ini diabaikan maka akibat yang dapat terjadi adalah spatial aliasing dimana sinyal dari sumber satu tidak dapat ditangkap oleh sensor lainnya. Sudut datang berbeda yang dibentuk oleh sumber dan sensor diilustrasikan seperti gambar 2.3.
III.
EKSPERIMEN
Tabel 3.1 Konfigurasi Perekaman Sinyal Sumber (Baseline) No. Perekaman Baseline Normal 1. Bearing Fault 2. Unbalance 3. Tabel 3.2 Konfigurasi Desain Eksperimental Sensor > Sumber Sensor = Sumber Matrik Konfigurasi Matrik Konfigurasi BU BU 3x2 2x2 BN NB NU NU BU BNU 4x2 3x3 BN NU 4x3 BNU Keterangan : N = Normal B = Bearing Fault U = Unbalance Pada pengambilan data, teknik yang digunakan yaitu microphone array. Susunan dari microphone ini dapat dilihat pada gambar 3.1. Dari gambar tersebut, jarak antar mikrofon (d) ditentukan sebesar 30 cm, jarak antar sumber (pompa) sebesar 30 cm sedangkan jarak antar mikrofon dan sumber (pompa) sebesar 25 cm. Sudut datang yang diambil yaitu 0o dimana posisi sumber tepat berada di depan mikrofon. Agar hasil perekaman sinyal suara dapat tersimpan pada komputer maka diperlukan DAC
Gambar 3.1 Setting Desain Eksperimental di Ruang Semi Unechoic Lab. Akustik dan Fisika Bangunan
(Digital Analog Converter) multi-channel. Kemudian diperlukan kalibrasi alat untuk mengetahui perbandingan antara sinyal suara mesin pompa terhadap background noise atau mencari SNR-nya. Setalah itu, dapat dilakukan inti dari penelitian ini. Langkah pertama yang harus dilakukan yaitu perekaman sinyal sumber masing-masing kondisi pompa dengan perekaman 1 sinyal sumber suara terhadap 1 mikrofon. Konfigurasi perekaman ditunjukkan pada tabel 3.1. Langkah kedua yaitu perekaman banyak sumber suara dengan teknik microphone array. Untuk konfigurasi desain eksperimen dapat dilihat pada tabel 3.2. Konfigurasi tersebut merupakan kombinasi maksimal 4 jumlah sensor dan maksimal 3 jumlah sumber . Perekaman ini dilakukan dengan software adobe audition 3.0 dimana sinyal suara yang didapat akan disimpan dengan ekstensi (.wav). Frekuensi sampling yang diambil yaitu sebesar 44100Hz. Setelah data diperoleh, maka proses selanjutnya yaitu pengolahan data dengan software matlab. Dalam pengolahan tersebut faktor utama dalam mengeksekusi program yaitu panjang data. Panjang data yang digunakan dalam penelitian ini yaitu sebesar 1024. Sedangkan frekuensi samplingnya di-downsample menjadi 256Hz.
IV. HASIL DAN PEMBAHASAN
Dalam penelitian ini, pemisahan sinyal suara dari jumlah mikrofon yang lebih besar atau sama dengan dari jumlah sumber suara pompa berhasil dilakukan dengan metode TFBSS atau Time-Frequency Blind Source Separation. Asumsi yang diambil pada metode ini yaitu tiap sumber pompa harus memiliki karakteristik independensi. Artinya, sinyal suara pada 1 pompa tidak mempengaruhi sinyal suara pompa lainnya.. Sehingga dalam penelitian ini, permasalahan bagaimana menjadikan sinyal redundant hanya diwakili satu sinyal saja dapat tercapai. Sampel kasus yang diambil dalam pembahasan ini yaitu kasus dengan konfigurasi 4 sensor dan 3 sumber pompa (seperti ditunjukkan pada tabel 3.2) dimana sumber yang digunakan yaitu pompa normal, pompa bearing fault, dan pompa unbalance. Seperti telah dijelaskan dalam prosedur eksperimen, bahwa sebelum perekaman inti dimulai, maka SNR antara sinyal suara mesin pompa
terhadap background noise harus diketahui dahulu. Hasil perhitungan SNR dengan Matlab ternyata diperoleh nilai 18 dB. Artinya sinyal suara mesin pompa 18 kali lebih besar dibanding background noise. Kemudian hasil yang diperoleh dari pengambilan data dengan perekaman baseline ditampilkan seperti gambar 4.1.
Gambar 4.3 Plotting Sinyal Estimasi beserta TFD dari 4 mikrofon dan 3 sumber suara pompa
Gambar 4.1 Sinyal Suara Baseline dengan panjang data 1024 (a) Bearing Fault (b) Normal (c) Unbalance
Pada gambar 4.1(a) normalisasi frekuensi untuk pompa dengan kerusakan bearing fault adalah 0.13. Besarnya nilai ini diindikasikan oleh warna merah berarti besarnya amplitudo sekitar 25x10-7. Sedangkan gambar 4.1(b), normalisasi frekuensi untuk pompa normal sekitar 0.05, dan gambar 4.1(c) normalisasi frekuensi sekitar 0.1. Setelah pengolahan sinyal baseline, dilakukan pengolahan terhadap sinyal campuran dari tiga sinyal suara pompa dengan karakteristik berbeda tersebut. Asumsi pada saat pencampuran sinyal tersebut adalah convolutive mixture. Hasil pencampuran sinyal secara konvolutif tersebut kemudian dipisahkan dengan Blind Source Separation dengan ekstraksi dari distribusi Wigner-Ville yang merupakan Time-Frequency Distribution (TFD). Hasil dari pemisahan sinyal tersebut kemudian di-plot 1 gambar dengan sinyal baseline-nya sehingga perbedaan antara sinyal estimasi dan sinyal baseline dapat dengan jelas dilihat secara visualisasi. Plot gambar sinyal estimasi dan baseline ditampilkan pada gambar 4.2. Sinyal estimasi ditunjukkan dengan warna merah sedangkan sinyal warna biru ditunjukkan warna biru.
Dari perekaman 4 sensor ini, hasil pemisahan sinyal atau sinyal estimasinya mampu mengeluarkan 3 output sesuai jumlah sumbernya seperti pada gambar 4.3. Pada gambar (a), hasilnya adalah sinyal untuk pompa bearing fault, gambar (b) sinyal estimasi untuk pompa sinyal normal, dan (c) sinyal estimasi untuk pompa unbalance. Masing-masing normalisasi frekuensi tersebut adalah 0.17,0.1, dan 0.16. Dari hasil pemisahan dengan TFD tersebut kemudian akan diuji dengan mengukur varians dari perbandingan antara sinyal baseline dan sinyal sensor. Metode yang digunakan untuk mengukur besarnya varians dari dua sinyal tersebut yaitu MSE (Mean Square Error). Nilai MSE ini ditampilkan dalam tabel 4.1 pada kolom convolutive mixture. Untuk MSE sinyal estimasi pompa bearing fault sebesar 2.4393, sinyal estimasi pompa normal 2.357 dan pompa unbalance 2.4013. Nilai MSE ini merupaka nilai error terkecil hasil perbandingan sinyal estimasi masing-masing pompa dengan sinyal baseline masing-masing pompa juga. Besarnya nilai MSE pada tabel tersebut sangat besar sehingga hasil ini dapat dinyatakan tidak cukup baik meski masih dapat terpisah. Tabel 4.1 MSE hasil perbandingan sinyal baseline dengan sinyal estimasi dari 4 mikrofon dan 3 sumber suara pompa MSE Sinyal estimasi Bearing Normal Unbalance
Gambar 4.2 Plotting Sinyal Estimasi dan Baseline dari 4 mikrofon dan 3 sumber suara pompa
Pencampuran Sinyal Convolutive Mixture 2.4393 2.3570 2.4013
Instantaneous Linear Mixture 0.0336 0.0766 0.0501
Jika sebelumnya pencampuran dilakukan secara konvolutif maka kini hasil tersebut akan dibandingkan dengan pencampuran sinyal secara instantaneous linear mixture [1]. Hasil yang perbandingan sinyal estimasi dan baseline yang ditampilkan dalam 1 gambar dengan instantaneous linear mixture ditunjukkan pada gambar 4.4 sedangkan pada gambar 4.5 ditunjukkan sinyal estimasi dan TFD-nya.
digunakan haruslah sama sehingga konfigurasi yang dipilih adalah 3 sensor dan 3 sumber atau dengan kata lain jumlah sensornya sama dengan jumlah sumbernya (m=n). Dimana asumsi pencampuran yang dipakai dalam tfBSS dan ICA di sini adalah convolutive mixture. Uji varians dari sinyal estimasi dan baseline dari kedua metode ini ditampilkan pada tabel 4.2 dengan ditentukan besarnya nilai MSE masing-masing sinyal. Dari tabel tersebut, terlihat bahwa nilai MSE ICA lebih kecil dibandingkan nilai MSE tfBSS. Dengan demikian, hasil pemisahan sinyal suara dengan pencampuran convolutive mixture lebih baik dengan algoritma ICA. Gambar 4.4 Plotting Sinyal Estimasi beserta TFD dari 4 mikrofon dan 3 sumber suara pompa untuk Instantaneous Linear Mixture
Gambar 4.5 Plotting Sinyal Estimasi beserta TFD dari 4 mikrofon dan 3 sumber suara pompa untuk Instantaneous Linear Mixture
Berdasarkan tampilan TFD, sinyal estimasi tidak jauh berbeda dengan sinyal baseline. Sedangkan hasil sinyal estimasinya berbeda jauh dengan sinyal estimasi dengan convolutive mixture. Pada gambar 4.4 sinyal estimasi (merah) lebih rapat dengan sinyal baseline-nya (biru) sehingga pemisahan ini dapat dikatakan sangat baik. Hal ini diperkuat dengan nilai MSE yang ada pada tabel 4.1 untuk kolom instantaneous linear mixture. Untuk MSE sinyal estimasi pompa bearing fault sebesar 0.0336, sinyal estimasi pompa normal 0.0766 dan pompa unbalance 0.0501. Dari hasil tersebut bisa disimpulkan bahwa hasil pemisahan sinyal campuran dengan tfBSS untuk convolutive mixture tidak sebaik instantaneous linear mixture. Tabel 4.2 MSE hasil sinyal suara pompa antara ICA dengan TFBSS dengan konfigurasi 3 sensor - 3 sumber MSE
TDICA
TFBSS
Bearing
0.0833
1.8863
Normal
0.0833
1.8019
Unbalance
0.0993
1.8805
Kemudian hasil ekstraksi sinyal estimasi dari tfBSS ini akan dibandingkan lagi dengan ICA. Untuk membandingkan dua metode ini konfigurasi yang
V.
KESIMPULAN
Dari eksperimen yang telah dilakukan maka kesimpulan yang dapat diambil dari penelitian ini yaitu sebagai berikut : 1. Sinyal suara campuran (convolutive mixture) berhasil dipisahkan dengan metode time frequency blind source separation dan sinyal redundant dari sensor berhasil terwakili satu sinyal saja pada output sinyal estimasi akibat jumlah sensor yang lebih besar dari jumlah sumber. 2. Dengan metode tfBSS ini, pemisahan sinyal suara campuran (instantaneous linear mixture) lebih baik dari pada sinyal suara campuran (convolutive mixture) terbukti dari hasil MSE (Mean Square Error) masing-masing sinyal. 3. Dalam pengolahan data, untuk kasus jumlah sensor sama dengan jumlah sumber, metode ICA lebih baik dibandingkan tfBSS. 4. Hasil yang diperoleh dari estimasi TFD dengan jumlah sensor 4 dan jumlah sumber 3 secara convolutive mixture yaitu frekuensi normalisasi pompa dengan kerusakan Bearing Fault 0.17, pompa Normal 0.1 dan pompa Unbalance 0.16. VI. SARAN Saran yang bisa diberikan dari hasil penelitian ini yaitu pemisahan sinyal suara dengan algoritma tfBSS sebaiknya digunakan dengan mengambil asumsi instantaneous linear mixture atau pencampuran secara superposisi agar memperoleh nilai MSE yang kecil. DAFTAR PUSTAKA [1] Fevotte, Cedric., Doncarli, Christian. 2004. “Two Contribution to Blind Source Separation Using Time-Frequency Distribution”. IEEE Signal Processing Letters vol 11 no.3 March. Processing, vol. 46, pp. 2888–2897, Nov 1998. [2] Firmanda, Septian. 2010. Identifikasi Secara Serentak Kerusakan Mesin Menggunakan Independent Component Analysis Berdasarkan Convolutive Mixture. Teknik Fisika ITS Surabaya.
[3] Atmaja, B.,T., 2009 ”Machines Sound Separation from Microphone Array using Independent Component Analysis (ICA) for Fault Detection” Indonesia: Teknik Fisika-ITS [4] Yunata, Aris Surya. 2010. “Identifikasi Kerusakan Mesin Secara Serentak di Ruang
Terbuka dengan Independent Component Analysis”. Teknik Fisika, ITS Surabaya. [5] Makino, Shoji. Te-WonLee, Sawada, Hiroshi. 2007. Blind Source Separation. Netherlands : Springer.
BIOGRAFI PENULIS Nama : Sherly Sabaraya Alamat : Jl. Beringin I/04 BTN PKT Bontang TTL : Bontang, 8 Februari 1988 Riwayat Pendidikan : SD-2 Yayasan Pupuk Kaltim (1994-2000) SLTP Yayasan Pupuk Kaltim (2000-2003) SMA Yayasan Pupuk Kaltim (2003-2006) Teknik Fisika ITS (2006- Skrg)