pernah Playtahu ?
Play
Manipulasi suara ucapan (speech morphing) Proses manipulasi parameter-parameter fisik Sintesis suara ucapan Suatu proses pembangkitan suara ucapan yang terdapat pada sinyal suara, sehingga melalui suatu program dalam komputer (speech synthesis) menghasilkan suara yang lain frekuensi | amplitudo | periode
perubahan tinggi rendahnya frekuensi dan tekanan (intonasi), perubahan durasi atau lamanya waktu pengucapan suatu suara, serta komponen aperiodik
|
suara yang lain ?
Speech Transformation and Representation using Adaptive Interpolation of weiGHTed Spectogram (STRAIGHT) dikembangkan sejak tahun 1997 hingga saat ini oleh Hideki Kawahara et al. di Jepang.
Mengenal metode 2003, speech morphing dalam bahasa Inggris dan bahasa Jepang.
analisis, manipulasi, sintesis suara ucapan . . .
STRAIGHT Digunakan dalam proses manipulasi sinyal suara ucapan, Speech morphing, memerlukan parameter-parameter fisik sinyal Bagaimana hal ini: bisa terjadi? . . . Tetap fokus, dan terus perhatikan suara F0 atau frekuensi dasar Power Komponan aperiodik
Speech morphing Bahasa Inggris Bahasa Jepang dan Tim
2013
Penerapan Metode STRAIGHT (Speech Transformation Dosen Pembimbing : Interpolation of and Representation using Adaptive weiGHTed Spectogram) pada Manipulasi Sinyal Suara Prof. Dr. Ir. Sekartedjo, M.Sc. NIP. 195004021979011001 dalam Pengucapan Berbahasa Indonesia Dr. Dhany Arifianto, S.T., M.Eng. NIP. 197310071998021001 Rizki Amalia Febriyanti Kartikasari
NRP. 2409100095
Tujuan 1. Didapatkannya teknik penerapan metode STRAIGHT untuk memanipulasi sinyal suara dengan pengucapan berbahasa Indonesia. 2. Didapatkannya kualitas hasil manipulasi sinyal suara berdasarkan uji subjektifitas yang akan didapatkan dengan Mean Opinion Score (MOS).
Batasan masalah 1.
2.
3.
Kalimat bahasa Indonesia yang digunakan adalah 15 kalimat yang diucapkan oleh wanita, diambil dari 1529 database kalimat bahasa Indonesia yang telah dibuat. Manipulasi dilakukan pada frekuensi dasar (fundamental frequency) sinyal suara secara manual menggunakan program STRAIGHT pada program Matlab, sedangkan parameter sinyal suara ucapan yang lain dianggap tetap. Uji subjektifitas dilakukan untuk mengetahui kualitas hasil manipulasi sinyal suara ucapan.
Metodologi penelitian
Tidak
atau
Metodologi penelitian
Parameter Kualitas Sangat baik Baik atau Cukup baik Buruk Sangat buruk
Score 5 4 3 2 1
Hasil penelitian Database suara ucapan berbahasa Indonesia
Vokal Tunggal 18000 16000 14000 12000 10000 8000 6000 4000 2000 0
1529 kalimat bahasa Indonesia memenuhi kesetimbangan fonetik (phoneticaly balanced)
16916
6426
a
5583
4444
i
628
u
1111
e
ǝ
o
Vokal Rangkap
Konsonan
300
6000 5072
4699
4000 3000
1000
c
78 987 d
f
g
200 3953 3899 3511
100 626 367 27 893 4 22
854 h
j
150
26052465
2508
2206
354 b
3708
3200
2000 2451 0
281
250
5000
k
l
m n
p ng r
s
t ny w z
y kh sy
119
50 0
aw = [au]
ay = [ai]
4
2
ey = [ei]
oy = [oi]
Data awal suara ucapan intonasi normal suara ucapan dengan kategori kalimat tanya “Siapa bilang bahwa hidup ini penuh permasalahan rumit?”
suara ucapan dengan kategori kalimat pendek “Sudah bukan waktunya lagi kita berada pada zona aman”
suara ucapan dengan kategori kalimat panjang “Degradasi moral berpengaruh terhadap jatuhnya wibawa sebagai bangsa di mata bangsa lain”
Data hasil manipulasi sinyal suara ucapan Suara Suara ucapan berbahasa Indonesia dengan 3 intonasi : ucapan berintonasi marah Marah suara ucapan dengan kategori kalimat tanya Sedih “Siapa bilang bahwa hidup ini penuh permasalahan rumit?” Senang suara ucapan dengan kategori kalimat pendek “Sudah bukan waktunya lagi kita berada pada zona aman”
suara ucapan dengan kategori kalimat panjang “Degradasi moral berpengaruh terhadap jatuhnya wibawa sebagai bangsa di mata bangsa lain”
Data hasil manipulasi sinyal suara ucapan Suara ucapan berintonasi sedih suara ucapan dengan kategori kalimat tanya “Siapa bilang bahwa hidup ini penuh permasalahan rumit?”
suara ucapan dengan kategori kalimat pendek “Sudah bukan waktunya lagi kita berada pada zona aman”
suara ucapan dengan kategori kalimat panjang “Degradasi moral berpengaruh terhadap jatuhnya wibawa sebagai bangsa di mata bangsa lain”
Data hasil manipulasi sinyal suara ucapan Suara ucapan berintonasi senang suara ucapan dengan kategori kalimat tanya “Siapa bilang bahwa hidup ini penuh permasalahan rumit?”
suara ucapan dengan kategori kalimat pendek “Sudah bukan waktunya lagi kita berada pada zona aman”
suara ucapan dengan kategori kalimat panjang “Degradasi moral berpengaruh terhadap jatuhnya wibawa sebagai bangsa di mata bangsa lain”
Data hasil uji subjektif Uji subjektif hasil manipulasi suara ucapan 5
4
Mean Opinion Score
5
4
4 4 3
3
3
3
Manipulasi Total suara ucapan hasil manipulasi ada Asli 45 suara ucapan
2 2 1 1 0
3
4 orang naracoba/ responden, 20 Memberikan score untuk suara ucapan hasil manipulasi
Marah
Sedih Emosi
15 suara ucapan berintonasi marah 15 suara ucapan berintonasi sedih Senang15 suara ucapan berintonasi senang
Perbandingan hasil uji MOS suara ucapan manipulasi dengan suara ucapan beremosi asli.
Pembahasan Normal Vs Marah suara ucapan dengan kategori kalimat tanya “Siapa bilang bahwa hidup ini penuh permasalahan rumit?”
suara ucapan dengan kategori kalimat tanya “Siapa bilang bahwa hidup ini penuh permasalahan rumit?”
Sama ?
Pembahasan Normal Vs Sedih suara ucapan dengan kategori kalimat pendek “Sudah bukan waktunya lagi kita berada pada zona aman”
suara ucapan dengan kategori kalimat pendek “Sudah bukan waktunya lagi kita berada pada zona aman”
Sama ?
Pembahasan Normal Vs Senang suara ucapan dengan kategori kalimat panjang “Degradasi moral berpengaruh terhadap jatuhnya wibawa sebagai bangsa di mata bangsa lain”
suara ucapan dengan kategori kalimat panjang “Degradasi moral berpengaruh terhadap jatuhnya wibawa sebagai bangsa di mata bangsa lain”
Sama ?
Pembahasan Uji subjektif hasil manipulasi suara ucapan 5
4
Mean Opinion Score
5 4 3
3
3
3 2 2 1 1 0
4
4
4
Marah
Sedih Emosi
3
Parameter Kualitas Sangat baik Baik Manipulasi Cukup baikAsli Buruk Sangat buruk
Score 5 4 3 2 1
Senang
Perbandingan hasil uji MOS suara ucapan manipulasi dengan suara ucapan beremosi asli.
Kesimpulan 1. Telah didapatkan teknik penerapan metode STRAIGHT untuk memanipulasi sinyal suara ucapan berbahasa Indonesia. Yaitu untuk mengubah intonasi suara normal ke dalam emosi marah, sedih, dan senang dapat dilakukan dengan mengubah parameter F0 dari suara normal, sedangkan parameter-parameter fisik lainnya tetap. 2. Kualitas hasil manipulasi yang diperoleh dari uji MOS yaitu 3 untuk suara ucapan manipulasi emosi marah; 3 untuk suara ucapan manipulasi emosi sedih dan suara ucapan hasil manipulasi emosi senang mendapatkan score rata-rata 3. Dengan demikian rata-rata kualitas suara ucapan hasil manipulasi adalah cukup baik.
semoga bermanfaat . . .
Dan Dia telah memberikan kepadamu (keperluanmu) dan segala apa yang kamu mohonkan kepadanya. Dan jika kamu menghitung nikmat Allah, tidaklah dapat kamu menghinggakannya. Sesungguhnya manusia itu, sangat zalim dan sangat mengingkari (nikmat Allah). [QS. Ibrahim : 34]