1
Pembangkitan Suara Sintetik Berbasis Spectrum Density pada Gamelan Kelompok Balungan Biyan Oscar, Yoyon Kusnendar Suprapto, Stevanus Hardiristanto Jurusan Teknik Elektro, Fakultas Teknologi Industri, Institut Teknologi Sepuluh Nopember (ITS) Jl. Arief Rahman Hakim, Surabaya 60111 E-mail: yoyonsuprapto[at]ee.its.ac.id dan hardi[at]ee.its.ac.id
Abstrak— Gamelan adalah salah satu alat musik tradisional di beberapa daerah di Indonesia. Satu set gamelan mempunyai nada dasar yang berbeda dari set gamelan yang lain, tidak seperti alat musik modern yang mempunyai standar. Ini dikarenakan nada dasar gamelan disesuaikan dengan nada dasar lagu yang dinyanyikan penyanyi daerah setempat. Gamelan di Indonesia memiliki banyak jenis. Perbedaan jenis-jenis gamelan terletak pada frekuensi nada dasar antara suatu set gamelan dengan gamelan yang lain. Perkembangan teknologi saat ini memungkinkan alat musik tertentu digunakan sebagai media dalam membangkitkan suara alat musik lain. Teknologi ini dapat diterapkan juga dalam menghasilkan suara buatan dari gamelan sehingga suara gamelan yang bermacam-macam dapat mudah didapatkan. Dalam tugas akhir ini dibangkitkan suara sintetik berdasarkan analisis spektrum suara gamelan. Gelombang dasar yang digunakan adalah gelombang sinusoidal, gelombang ini dimodifikasi agar sesuai dengan suara gamelan asli. Dari hasil penelitian diketahui bahwa parameter frekuensi adalah parameter utama dalam membentuk suara sintetik. Parameter frekuensi terdiri atas frekuensi fundamental dan partial. Frekuensi fundamental mendefinisikan pitch. Lalu bila ditambah frekuensi partial akan membentuk warna suara gamelan. Hasil pembangkitan suara sintetik sangat mendekati suara asli. Output mempunyai perbedaan frekuensi sebesar 1Hz dan error magnitudo rata-rata sebesar 4,2107 dari sinyal asli. Nilai Mean absolute Error hasil sintetik kedua parameter frekuensi adalah 0,017449.
menghambat orang yang ingin mempelajari gamelan. Suara gamelan juga menjadi tidak mudah diperoleh. Pengolahan sinyal gamelan sekarang sangat bergantung pada rekaman suara asli gamelan, sehingga input gamelan yang digunakan terbatas. Selain itu, penggunaan input dari rekaman suara gamelan asli tidak praktis karena memperberat proses pengolahan sinyal. Di sisi lain, perkembangan teknologi saat ini memungkinkan penggunaan alat musik tertentu sebagai media untuk membangkitkan suara alat musik lain, contohnya synthesizer. Alat tersebut dapat menghasilkan suara sintetis dengan mengatur beberapa parameter. Parameter diatur agar suara sintetik menyerupai sinyal suara yang diinginkan. Hal ini dapat diterapkan untuk menghasilkan suara buatan dari gamelan yang mempunyai bermacam-macam frekuensi dasar. Dalam tugas akhir ini dibangkitkan suara sintetik berdasarkan analisis spektrum suara gamelan. Parameter utama dari spektrum suara gamelan yang digunakan adalah frekuensi, amplitudo, dan phasa. Hasil penelitian ini akan menunjukan bagaimana bentuk perubahan amplitudo, frekuensi yang terkandung, dan fase dalam sinyal suara gamelan.
Input Rekaman Nada Asli
Analisis Frekuensi Estimasi nilai frekuensi/ pitch dengan menggunakan FFT
Menentukan Panjang Window
Kata Kunci— digital signal processing, musik sintetik, gamelan. Melakukan analisis Amplitudo dan fasa Tiap windownya
I. PENDAHULUAN
G
amelan adalah salah satu alat musik tradisional beberapa daerah di Indonesia. Gamelan tidak mempunyai nada dasar seperti alat musik umumnya, karena nada dasar gamelan disesuaikan dengan nada dasar lagu yang dinyanyikan penyanyi daerah setempat. Hal ini membuat alat musik gamelan memiliki beberapa jenis. Perbedaan jenis-jenis gamelan ini terletak pada frekuensi nada dasar antara suatu set gamelan dengan gamelan yang lain. Jenis gamelan berdasarkan sifat kedaerahan disebut gagrak. Ada beberapa macam gagrak, antara lain Gagrak Surakarta, Gagrak Yogyakarta (Mataraman), Gagrak Banyumasan, Gagrak Semarangan dan lain sebagainya. Selain itu, gamelan juga memiliki perbedaan jenis berdasarkan sifat-sifat yang berbeda dari setiap daerah. Ada gamelan yang bersifat lembut, rancak, dan mendayu-dayu. Saat ini harga gamelan mahal dan tidak mudah dipindah dari satu tempat ke tempat lainnya. Hal ini akan
Analisis Amplitudo Mengambil Amplitude Envelope sinyal dari nada asli.
Analisis Fase Estimasi titik mulai dari nada asli
Menunjuk Window selanjutnya
Output: Frekuensi, Amplitude Envelope, Sudut fasa
Seluruh Sinyal telah dianalisis Yes
Gambar. 1. Alur Program Analisis Spektrum
No
2 II. DESAIN SISTEM DAN IMPLEMENTASI
2) Analisis Amplitudo
A. Tahapan Analisis Spektrum Dengan menganalisis Spektrum suatu sinyal, akan diperoleh informasi tentang apa yang terkandung dalam suatu sinyal. Alur program analisis spektrum dapat dilihat pada gambar 1. Analisis yang pertama dilakukan adalah analisis frekuensi. Selanjutnya ditentukan panjang window untuk melakukan analisis amplitudo dan fase. Tiap panjang window dilakukan sampling pada sinyal tersebut dan dilakukan analisis amplitudo dan fase. 1) Analisis Frekuensi Frekuensi mendefinisikan suatu pitch atau tinggi rendah suatu nada. Dalam sinyal suara dari alat musik terdapat frekuensi fundamental dan frekuensi partials.[2] Frekuensi fundamental adalah frekuensi dasar yang mendefinisikan suatu pitch, dan frekuensi partials adalah potongan-potongan frekuensi yang mempunyai magnitudo lebih kecil. Untuk dapat melakukan estimasi frekuensi, sinyal harus dianalisis dalam domain frekuensi. Dalam tugas akhir ini digunakan Fast Fourier Transform (FFT) untuk mengestimasi nilai frekuensi. Prinsip kerja Pencarian Frekuensi dalam Spektrum Bagan alur dapat dilihat pada gambar 2. Setelah didapatkan spektrum FFT, selanjutnya dicari spektrum frekuensi yang mempunyai magnitudo terbesar. Nilai frekuensi pada spektrum tersebut disimpan. Berikutnya spektrum frekuensi tersebut dihapus dan mencari frekuensi lainnya.
Input Nada Asli
Amplitudo
Amplitudo adalah puncak tertinggi suatu gelombang.[3] Apabila suatu gamelan dipukul, suara yang dihasilkan perlahan-lahan melemah. Dalam pembangkitan suara sintetik diperlukan nada sintetik yang mempunyai volume berubahrubah sesuai dengan nada asli. Perubahan amplitudo ini disebut juga sebagai envelope dari suatu sinyal.[2] Tahap analisis amplitudo menggunakan metode Least square. Metode ini digunakan karena dapat menemukan amplitudo beberapa gelombang sinyal yang berbeda frekuensi. b)
Least Square
Metode Least Square ini berbasis dari persamaan bentuk rectangular gelombang sinusoidal (persamaan (1))[4]. Metode ini digunakan untuk mencari amplitudo dari sinyal input. Hasil dari analisis akan menghasilkan amplitude envelope. Bentuk rectangular sinusoidal A cos(t + ) = A cos( ) cos(t) - A sin( ) sin(t)
didapat C = A cos ( ) dan D = A sin ( ) .[4] Setelah kuadrat C dan D dijumlahkan didapat nilai untuk parameter A, hal ini ditunjukkan pada persamaan (2) dan (3).[4] 2
2
2
2 2 2 2 2 C D A cos sin
Selanjutnya diilustrasikan gelombang sinusoidal biasa. a)
2
2
2
(2) (3)
implementasi metode b)
Nilai frekuensi disimpan
Spektrum pada frekuensi tersebut dihapus
Ya
c)
d)
Masih ditemukan kandidat frekuensi Tidak
Proses pencarian frekuensi berakhir
Gambar. 2. Bagan pencarian nilai frekuensi dengan FFT
(1)
= C cos(t) - D sin(t) dengan C = A cos( ) dan D = -A sin( ) Dengan mengambil bentuk kuadrat dari parameter C dan D
2 2 2 2 2 A C D A C D
Fast Fourier Transform
Mencari spektrum frekuensi yang punya magnitudo terbesar
a)
Gambar. 3. Pencarian Frekuensi dengan FFT (a)Loop pertama; (b) loop kedua; (c) loop ketiga; (d) loop keempat
pada
3
Tahapan Least Square: Berikut metode dilakukan pada sinyal sinusoidal satu frekuensi. 1. Mengambil potongan sinyal input yang akan dianalisis Di sini diilustrasikan Least Square digunakan pada Sinyal Y. Sinyal Y adalah sinyal sinusoidal dengan frekuensi 131 Hz. Di mana besar amplitudo diatur sama dengan dua (gambar 4).
ada pada persamaan (4).[4] C (4) tan 1 D B. Tahap Resynthesis-Modifikasi Sinyal Bila tahap analisis spektrum sudah selesai dilakukan, maka selanjutnya suatu sinyal baru dibangkitkan. Spektrum sinyal yang baru ini kemudian diatur supaya sesuai informasi yang diperoleh dari analisis spektrum sinyal input. Parameter yang diatur yaitu frekuensi, amplitudo, dan fase. Input dari tahap analisis (Frekuensi, Amplitude Envelope, sudut fase)
Membangkitkan sinyal sinusoidal
Resynthesis Frekuensi
Resynthesis Fase
Resynthesis Amplitudo
Gambar. 4. Plot Sinyal Y gelombang satu frekuensi
2. Membentuk sinyal komponen sinus dan cosinus Lalu dibentuk matrix A yang terdiri atas sinyal Sinus dan Sinyal Cosinus. Frekuensi sinyal A diatur besarnya sama dengan frekuensi nada C. Pada gambar 5, komponen sinyal sinus digambarkan dengan garis putus-putus berwarna hijau dan komponen sinyal cosinus digambarkan dengan garis berwarna biru.
Output Sinyal Sintetik
Gambar. 6. Alur tahap resynthesis- modifikasi sinyal
1) Membangkitkan sinyal sinusoidal Pada tugas akhir ini digunakan sinyal sinusoidal karena sinyal sinusoidal adalah sinyal harmonik sederhana yang paling dasar. Persamaan sinyal sinus ditunjukkan pada persamaan (5).[3]
y(t ) A. sin2. . f .t
(5)
Tabel 1. Parameter sinyal Sinus Parameter
Deskripsi
A f t
Amplitudo (contoh -1.0 sampai +1.0) Frekuensi dalam Hertz (Hz) Waktu dalam sekon Fase awal dalam radian
a)
b)
Gambar. 5. Matrix sinyal komponen (dua sinyal)
3. Menghitung besar amplitudo Konsep yang digunakan di sini adalah dihitung nilai C dan D dari persamaan (3). Nilai C dan D yang dihitung dari gelombang masing-masing nada. Hasil perhitungan disimpan dalam matrix x. Pada contoh ini ditemukan komponen C dan D sebesar:
c)
d)
xx = -1.7321 1.0000
Dan dengan menggunakan persamaan 3 akan ditemukan nilai amplitudo yaitu: amp = 2.0000
3) Analisis Fase Analisis fase dilakukan dengan perhitungan lanjutan dari bentuk rectangular sinyal sinusoidal. Persamaan perhitungan
Gambar. 7. Resynthesis Frekuensi pada sinyal Sinus (a) Resynthesis Frekuensi fundamental(581 Hz); (b) Resynthesis Frekuensi partial(3443 Hz) ; (c) Resynthesis Frekuensi partial (2585 Hz);(d) Resynthesis Frekuensi partial(3061 Hz)
4 2) Resynthesis Frekuensi Pada tahap ini dilakukan modifikasi frekuensi pada sinyal sinus. Hasil yang diharapkan yaitu suara sinus yang mempunyai pitch yang sama dengan nada asli. Resynthesis frekuensi ini dilakukan dengan memasukkan parameter frekuensi yang ditemukan tahap analisis frekuensi ke dalam persamaan sinyal sinus Dari tahap analisis frekuensi diketahui bahwa ada frekuensi fundamental dan frekuensi-frekuensi partials dalam suatu nada. Selanjutnya dibangkitkan sinyal sinus sejumlah fundamental dan partial yang disintetik. Nilai frekuensi pada sinyal-sinyal sinus disesuaikan. Tahap ini digambarkan pada gambar 7. 3) Implementasi Pitch Shift Dari satu nada gamelan dapat dibangkitkan suara sintetik suatu nada gamelan lain dengan menggunakan Pitch Shift. Cara yang digunakan yaitu menghitung frekuensi baru dari suatu nada referensi. Perhitungan kenaikan dilakukan berdasarkan kenaikan cents dalam tangga nada gamelan. Tangga nada gamelan slendro adalah tangga nada pentatonik, dalam satu oktaf ada 5 nada, di mana antar nada berbeda 240 cents.[5] Untuk mencari frekuensi nada lain dari 1 nada dihitung dengan persamaan (6).[6]
f j f i.2
m
5
(6)
f saron2 f saron1 . 2
1
5
(7)
di mana j adalah saron nada berapa yang dicari, i adalah saron referensi, dan m adalah interval antara i ke j.. Misal persamaan digunakan untuk menghitung nilai frekuensi saron 2 maka besar kenaikan interval adalah 1 (m=1) dan j=2 karena saron yang dicari adalah saron ke-2. Hal ini ditunjukan pada persamaan(7) Sedangkan cara yang digunakan untuk menghitung kenaikan Pitch saron pelog berbeda. Hal tersebut dikarenakan jarak antar nada yang tidak seragam seperti Slendro. 4) Resynthesis Amplitudo Gelombang sinus dari terbangkitkan pada tahap resynthesis sebelumnya mempunyai amplitudo yang tetap. Pada tahap analisis telah diperoleh envelope (perubahan amplitude) dari nada gamelan tersebut. Envelope ini digunakan pada sinyal sintetik yang dibuat agar bunyi yang dihasilkan mempunyai perubahan volume yang sama dengan nada yang asli. Teknik yang digunakan pada tahap ini yaitu Amplitude Modulation.[7] Pertama diambil sinyal sinus hasil Resynthesis frekuensi dan envelope dari tahap analisis. Pada tahap ini, sinyal sinus itu dimodifikasi supaya besar amplitudo sesuai dengan Envelope nada. Sinyal sinus dan envelope dapat digambarkan pada gambar 8. Pada amplitude modulation ini, envelope berperan sebagai sinyal modulator(M). Sinyal sinusoidal berperan sebagai sinyal carier(C).[7] Dengan mengalikan kedua gelombang C dan M (gambar 8), sebuah Envelope akan diaplikasikan ke dalam sinyal. Proses ini berasal dari persamaan 8. Hasil amplitude envelope ini berada pada gambar 9.
AmpModt = Ct x Mt
(8)
(a) Gambar. 8. Sinyal Sinus (a) dan sinyal Envelope (b)
(b)
Gambar. 9. Sinyal hasil Sintetik
5) Resynthesis Fase Tahap ini dimasukkan sudut fase yang diperoleh saat tahap analisis ke sinyal sinusoidal. Ini akan membuat titik mulai gelombang sinyal sinusoidal sintetik sesuai dengan titik mulai gelombang suara asli. III. HASIL PENGUJIAN A. Spectrum Domain Waktu Pada bagian ini dilakukan analisis spektrum domain waktu dari hasil sintetik. Ada dua kondisi yang diujikan yaitu sintetik frekuensi fundamental saja, dan sintetik frekuensi fundamental bersama frekuensi-frekuensi partial dari suatu nada. Pengujian dilakukan pada keseluruhan sinyal dan bagian attack sinyal dari saron asli dan sintetik, dalam hal ini diambil bagian 30ms awal sinyal. Gambar 10 menunjukan spektrum sinyal keseluruhan sinyal. Hasil sintetik baik melakukan sintetik pada fundamental saja a)
b)
c)
Gambar. 10. Perbandingan Spektrum sinyal keseluruhan dalam domain waktu (a) Saron 1 asli; (b) Saron 1 Sintetik(fundamental); (c) Saron 1 sintetik (fundamental dan partial)
5 dan sintetik pada fundamental dan partial menunjukkan amplitude envelope yang dihasilkan sama. Jadi dengan membuat sintetik hanya pada frekuensi fundamental saja, amplitude envelope sudah serupa. Dari perbandingan fase attack sinyal pada gambar 11, Spektrum menunjukkan bentuk gelombang hasil sintetik fundamental masih seperti bentuk sinyal sinusoidal biasa. Sehingga warna suara yang dihasilkan belum menghasilkan warna suara seperti gamelan asli. Sedangkan spektrum sinyal sintetik yang dilakukan pada frekuensi fundamental dan a)
frekuensi-frekuensi partial akan menghasilkan spektrum pada frekuensi tinggi. Sedangkan pada fundamental, spektrum hanya terdapat pada frekuensi fundamental saja. Hasil fft ada pada gambar 12. C. Pengujian sudut fase Untuk proses pengujian ini, dilakukan perubahan fase pada saat pembangkitan sintetik. Fase dirubah-rubah agar mengetahui pengaruh fase terhadap hasil sintetik. Di sini sintetik kondisi awal adalah saat suara sintetik paling mendekati suara asli yaitu sintetik nada fundamental dan partial-nya. Kemudian fase pada sinyal tersebut dirubah 1) Pergeseran fase dari gelombang fundamental sebesar 40o Dari hasil analisis spektrum domain waktu menunjukkan ada pergeseran gelombang. Tetapi bila didengarkan, suara sintetik yang dihasilkan mempunyai bunyi yang sama. a)
b)
b)
c)
Gambar. 11. Perbandingan bagian 30ms awal Spektrum sinyal keseluruhan dalam domain waktu (a) Saron 1 asli; (b) Saron 1 Sintetik(fundamental); (c) Saron 1 sintetik (fundamental dan partial)
partial menunjukkan bentuk gelombang hasil sintetik menghasilkan bentuk gelombang yang lebih menyerupai sinyal asli. Selain itu warna suara yang dihasilkan menyerupai warna suara gamelan asli B. Pengujian Frekuensi Pengujian Frekuensi dilakukan dengan menggunakan FFT. Sintetik yang dilakukan pada frekuensi fundamental bersama a)
Gambar. 13. Perbandingan attack sinyal bergeser 40o (a) sebelum digeser; (b) setelah digeser 40o;
2) Pergeseran fase dari gelombang sebesar 135o Gambar 14 menunjukkan gelombang saat fase digeser 135o. Hasil sintetik kembali menunjukkan adanya pergeseran gelombang. Kali ini lebih besar daripada saat digeser 40o. Tetapi bila didengarkan, suara sintetik Gambar. 14. Bagian attack sinyal yang bergeser 135o mempunyai bunyi yang sama. D. Pengujian Pitch Shifting 1) Pengujian frekuensi Hasil sintetik Pitch Shift pada saron Slendro dapat dilihat di tabel 2. Output sintetik yang dihasilkan ternyata menunjukan hasil yang cukup baik. Dapat dilihat selisih frekuensi antara yang asli dengan yang sintetik adalah kecil,
b)
Gambar. 12. Perbandingan plot FFT Saron asli dan sintetik (a) 0 sampai 2000Hz ; (b) 2000 Hz sampai 5000 Hz;
Gambar. 15. Grafik kenaikan frekuensi Saron Slendro(SARONSL)
6 tidak ada yang selisihnya lebih dari 12Hz. Grafik kenaikan frekuensi antara saron slendro asli dan sintetik dapat dilihat pada gambar 4.43 dan 4.44. Tabel 3. Tabel kenaikan Pitch Saron Slendro dalam ukuran cents
SARON1SL SARON2SL SARON3SL SARON5SL SARON6SL s1pa s2pa s3pa s4pa s5pa
Frekuensi Sinyal Asli 581 Hz 668 Hz 763 Hz 873 Hz 1013 Hz 465 Hz 531 Hz 613 Hz 701 Hz 799 Hz
Frekuensi Sinyal Sintetik 582 Hz 668 Hz 768 Hz 882 Hz 1013 Hz 466 Hz 535 Hz 615 Hz 706 Hz 811 Hz
langsung dari lagu. Gambar 18 adalah gambar plot STFT lagu sintetik. Lagu hasil sintetik mempunyai kekuatan yang konstan antara satu nada dengan nada lainnya, sedangkan pada rekaman lagu asli, intensitas tidak sama antar nada.
Error 1 0 5 9 0 1 4 2 5 12
Hz Hz Hz Hz Hz Hz Hz Hz Hz Hz
Gambar. 17. Plot STFT rekaman lagu gamelan asli
2) Pengujian dengan survey dan Mean Opinion Score (MOS) Pada pengujian ini sintetik semua nada satu set Saron dibuat dari input satu nada saja yaitu s1pa. Setelah menghasilkan output, dilakukan survey terhadap 33 orang responden untuk membandingkan kemiripan sinyal sintetik yang dibuat dengan yang asli. Tabel 4. Tabel kenaikan Pitch Saron Pelog dalam ukuran cents Kualitas Saron s1pa s2pa s3pa s4pa s5pa
Tidak Mirip(1) 0 0 1 1 3
Kurang mirip(2) 1 1 10 8 12
Cukup Mirip(3) 5 8 10 12 5
Mirip (4) 15 17 7 6 9
Sangat Mirip(5) 12 7 5 6 4
Gambar. 18. Plot STFT lagu gamelan sintetik
IV. KESIMPULAN/RINGKASAN Berdasarkan hasil pengujian dari keseluruhan sistem pembangkitan suara sintetik dalam Tugas Akhir ini, maka diperoleh kesimpulan sebagai berikut. Untuk membangkitkan suara sintetik, parameter frekuensi terdiri dari fundamental dan partial. Keduanya digunakan untuk membuat timbre suara asli. Bila hanya dilakukan sintesis frekuensi fundamental saja, maka suara khas gamelan belum terbentuk. Nilai Mean Absolute Error(MAE) saat keduanya disintetik adalah 0.017449. Sedangkan nilai MAE dari sintesis frekuensi fundamental saja adalah 0.018086 Jadi nilai error tersebut lebih kecil 0,000637. Suara sintetik yang dihasilkan sudah mempunyai pitch yang sangat mendekati suara asli, dengan error frekuensi=1 Hz dan error magnitudo=4,2107. DAFTAR PUSTAKA [1]
Gambar. 16. Grafik MOS Pitch Shift [2]
E. Implementasi Sintetik dalam bentuk satu baris lagu Dalam pengujian ini, suara sintetik dibuat dalam bentuk lagu. Notasi yang digunakan adalah notasi pada satu baris awal lagu Manyar Sewu. Notasi: i. 6. i. 6. 5. 3. 5. 3. Untuk rekaman lagu asli adalah permainan lagu yang direkam secara langsung. Sedangkan untuk sintetik, menggunakan rekaman nada saron 1 saja selanjutnya membangkitkan satu baris lagu tersebut. Setelah didengarkan, hasil sintetik yang dihasilkan cukup sama. Gambar 17 adalah plot STFT dari suara rekaman
[3] [4]
[5]
[6] [7]
Wawancara dengan ahli pembuat gamelan di bali di desa Klungkung, Oktober 2013. Loy, D. Gareth. “Musimathics : a guided tour of the mathematics of music”, The MIT Press, United States of America, Ch 2 dan Ch. 3, 2006. Park, Tae Hong. “Introduction To Digital Signal Processing”, World Scientific Publishing Co. Pte. Ltd, Ch. 1, 2010. Gunawan, Dadang dan Juwono, Filbert Hilman, “Pengolahan Sinyal Digital dengan Pemrograman MATLAB”, Graha Ilmu, Yogyakarta, 2012. Sumarsam, “Cultural Interaction and Musical Development in Central Java” The University of Chicago Press, ISBN 0-226-78011-2,19921995. Suprapto, Yoyon Kusnendar, “Spectral Density Based on Phase Shifting for Music Notation”, Jurnal Ilmiah Kursor Vol. 6, No. 3, Januari 2012. Roads, Curtis [et.al]. 1996. The computer music tutorial. London, England: The MIT Press.