Jawa Pengubahan Grafem Ke Fonem Bahasa Yohanes SuYantol dan Sri iFrartaJ2
Elins Fisika FMIPA' UGM' SekiP Utara' YogYakarta
E-mail :
1
)
v
o6,usm'
ant
a
c'
i
)
d' 1
sh
art a ti @'ugm' ac' id
Abstrak sistem sintesis Grafemadalahsatuanterkecilsebagaipembedadalamsebuahsistemaksarasedangkanfonemadalah dapat mern-bedakan makna' Dalam aufu.."u'in;;;;t"g jika terkecil yang bunyi adalah kesatuan Gtuf"rn bahasa Jawa menggunakan pengubahan g;;i; menjadi-fone-' p"rlrffire, dan teks vokal 5 dari ada Lalin ucapan ."dung.;ifca menesunakan aksara
menggukan aksara l"*"""i" 22 konsonan. Fonem b;h"r;
;ngu*ffi;;*it-
i u'Ji au.r 20 i;;;;"r, dijelaskan a^n i-r-"?i-uotal' Pada makalah ini l*u uau r0 r"k;;;;'tt"r"*r,fonem'
menjadi uurtu*u Jawa dalam aksara Latin
sintesis ucapan Katu Kunci : grafem, fonem, bahasa Jawq'
PENDAHULUAN Ucapan adalah kegiatan yang menghasilkan
rntngubah tekanan udara dalam
suara dengan
"u.u (Dutoit, 1997)' Sintesis ucapal ;ir; aiimlusi slntesls adalah tiruan ucapan manusia sedangkan
otomatis dari teks menjadi ucapan adalah konversi t:ks ke mengtodekal. ,r"upu' dengan I in guistik rmasi g info dalam sinyal yung -"ngu*ndun
il; ;;;fii
.
ot"t'-*esin' Fungsi utama dari il;;iilutut" menjadi ucagan adalah teks ;it;;; ,i.,t"ris misalnya deretan *ergubut representasi linguistik'
ucapan' ri*U""f fonetii<, ke dalam mesin penghasil
ucapan melibatkan proses Sistesis teks menjadi "
(huruf) menjadi o"n"ri".rnut",un dari graphe'me kamus daftar dalam 'f;;;;;.- e;;; i, m e adalah Luruf terkecil dari satuan i"" t"O-itan fonem adalah
membedakan satu kata dengan lainnva' ;;;; '..-n"gto,,'"tsi ";r; dari huruf menjadi fonem' ;;k ucapan melibatkan menjadi Jt-*" ,i",."tis teks (natural language -
modul pengolah -rr*"rrirn"-
bahasa alami
dalam NLP) untuk menganalisis teks
analisis sintaktis' analisis fi;*;";r.liri, prosody'-Kalimat yang r.ri"rit, dan pembangkit -mod"l tersebut kemudian ;;"h;lpt"ses oleh
ion"t,
p-engolah ai-"""t"t sebagai masukan oleh modul DSP)' processing -rir.i J[i,.r @isital signal ""'' -blirJn intesi s teks menj adi
J"'*ilti*it
,"up*-liput
ittem
s
g:j't {i'} *:1ll DSP' Modul NLP mengkonversl
dibagi menjaai ?
Xii' au" modul bentuk yang mengaldung, informasi i.[t *"r:"ai -'intonmi, t"iing..giun nldu'.. O.un durasi fl*tit, dari modul ;;;;. Modul DSP mJJproses hasil I menunjukkan NLP menjadi suara ucapan' Gambar
teks menjadi Gambar 1: Modul dalam sistem sintesis ucapan
Makalah
ini
membahas konversi grafem
untuk
G2P) *."j;Jii;;;; (grapheme to phoneme -bahasa Jawa dala-m (hurufl) ffi;t; ia*a. G-.af"* atau (Hanacaraka) Jawa ;;;;;;;t;nakan aksara 20 huruf pokok
ilffi;;,f:nu*ututu
terdiri atas
sedang fonem Bahasa Jawa ada
l0'
GRAFEM DALAM BAHASA JAWA sebagai pembeda Grafem adalah satuan terkecil aksara (Pusat-Bahasa' )' Dalam
aufurn--r"U"uf, sistem
aksara, Jawa' iliilt, l"*^ awalnya menggunakan huruf Latin Akso:; i"*":it" ditransliterasi dalam l,ta/' lsa/' tha/, lna/, lca/' ha/' lkal.',ldal,' ;;#i";;t 'i i,' nJ,\oi, ga/' lba/' dhu/, -1ul, lv al' nv al' l -mal' 'tiiii, -T"e;l' iSelain tanda-tanda vang itu ada mati' huruf vokal' ;;;"d-tebagai representasi l
l
angka. dan "-^'-V;fu
lel' dalam aksara Jawa ada lal' lil' -lul' 'e' vang rct, tot,"iotit/O/ dinamakan 'pepet' "*l"lalymatan iedang sepuluh' t"i'a"p" pada kata /e{ liuil.,g' uaurun 'e' yang terdapat padakalasate' -seUuah aksara (huruf) Jawa Pada dasarnya huruf Latin' ,n"*iutu, ,"Ut'ut' suku kata..dalam 'K;;;il;; dengan sesuai ditulis suatu aksara Jawa atau kata suku suatu huruf Latin
i*ri"n"""fisan
hubungan modul NLP dan DSP'
pengubahan Grarem ke
r"l,TfltffiJ;il:
I
ss
(Cahyono and berdasarkan bunyi pengucapannya Suyanto,2005).
Tabel 1: Vokal bahasa Jawa dan contoh katanya
ln1
FONEM BAIIASA JAWA
tulang rusuk
kecil
Fonem adalah kesatuan bunyi yang terkecil
kulit
dalam sebuah bahasa yang dapat membedakan makna (Pusat-Bahasa, )' Fonetik Qthonetics) adalah ilmu . yang ,.r"ry"iialn bunli bahasa ianpa melihat fungsi bunyi iJ t"tugui penrbeda makna dalam suatu bahasa' tuturan Fonetik irenyelidiki bunyi bahasa aarl sy$yj
sakit sabit
Dalam fonetik diselidiki dan bunyi ".;u.un. dirumuskan secara teratur tentang hal ikhwal
utu"
cara terbentuknya bunyi; berapa bahasa. Bagaimana -intensitas, timbrenya sebagai - getaran frekuensi, ,i*u; a^n bagaimana bunyi itu diterima oleh telinga (Marsono, 1999). ' Secara umum bunyi bahasa dibedakan menj{i
vokal, konsonan, dan semivokal' Pembedaan tnt didasarkun pada ada tidaknya hambatan .(proses jika pua utut bicara' Bunyi disebut vokal bicara' "*t"i"tO alat pada t"r:rairy" iia* t"4uai hambatan j"di ,ii* ada artikulasi. Hambatan untuk vokal hanya hanya pada pita suara saja' Hambatan yang terjadi puaa plta suara tidak lazim disebut artikulasi (Marsono, 1999).
'
Bunyi disebut konsonan, bila
terjadinya
pada dibentuk dengan menghambat arus udara Proses jadi artikulasiada sebagian alat bicata, hamiatan atau artikulasi ini dapat disertai dengan
dengan bergetarnya pita suara. Jika artikulasi disertai pita suara maka yang t:!1di adalah
berletamya
konsonan bersuara. Jika artikulasi tidak dengan bergetarnya pita suara maka dihasilkan
disertai
konsonan tak bersuara'
Bunyi semi-vokal ialah bunyi yang
secara
praktis tennasuk konsonan tetapi saat diartikulasikan
telum membentuk konsonan murni' Misalnya bunyi atas lwl yang mempunyai tempat artikulasi bibir
e;g;, 6iuit uu*ut, atau bibir bawah dengan gigi atas.
jumlah
Jumlah vokal bahasa Jawa sama dengan a' vokal bahasa Indonesia, yaitu sepuluh: [i' I' e' €' ' vokal o; , U, ul. Contoh kaii yang menggunakan i"tt"Uut iapat dilihat pada Tabel 1 yang disusun oleh Marsono (1999)'
100
r".iir,1i:'3lrq?,i"'ke I
Fonem Bahasa rawa
Secara praktis biasanya konsonan dibedakan menurut 1. cara dihambat (cara artikulasi); 2. tempat hambatan (tempat artikulasi);
t.
hubungan posisional antara penghambatpenghimbatnya atau hubungan antata uttik lutot aktif dengan Pasif;
4.
bergetar tidaknYaPita suara'
dari Konsonan bahasa Jawa hasil pengolahan
Marsono (1999) terlihat pada Tabel 2'
Tabel2: Konsonan bahasa Jawa dan contoh katanya N(
Awal kata lontoh {rtl
Kon9nm
Akilr
Tenqah kata
{di
Contoh
Ani
teteP
Iekp
tpl
otP?
prpa
\Pa
butlr n4r
&l
bapak
bapak
sarr
sab{
3.
trl
lawa
taw{
tua
Bta
4.
tdl
dawa
pmjag
rada
agak
5.
tl
,rukul
tumbuh
cethak
legit-lmgit
6.
tq1
dhzleg
dalug
ce/hak
dekat
'1.
lcl
(&
c&
w&
brca
8.
Lil
lala
iala
wEa
baja
9.
tkl
tula
sl8
sala
timg
10.
tel
gula
gula
iaca
jag
ll.
t?l
salwat
12.
Im]
ha|eng
matang
13.
lnl
nugla
14.
till
15.
l.
kata
lotrtoh
papd
empat
GRAFEM MENJADI FONEM DALAM BAIIASA JAWA Pengubahan dari grafem menjadi fonem Grapheme
to
Phoneme
- G2P adalah Proses
penetapan fonem berdasarkan huruf dari kata dalam kalimat diperlukan dalam sistem pengubahan teks
menjadi ucapan (text-to-speech - ff$ untuk menghasilkan pengucapan yang cocok dari kata tersebut (Kee et a1.,2004). freteI
iembata n
seketika
ana*
anak
sui
sama
ulu
ikil
nmgka
8ua
guM
piw
etu kali
n)at^
nyata
lulo
licin
fl
,8OnO
begitu
sugu
tdduk
lawug
piotu
16.
trl
lali
lupa
ba.li
pulmg
smbei
mbal
11.
tfl
Foto
foto
tq6it
laGir
sey'
sef
18.
lvI
wterm
vetero
delalusi devaluci
19.
tsl
segu
b€kal
rua
N
alu
hutm
20.
lz\
zakat
z*at
,j*uh
rjuah
2t.
thl
iawa
udm
tulu
setia
sava,fi
letih
22.
kl
nda
agak
pm
bagi
l,*
plM
bmil
Walaupun dimungkinkan untuk membuat daftar fonem untuk setiap kata dalam suatu bahasa yang dikerjakan oleh ahli bahasa tersebut, namun metode ini akan memakan waktu, tergantung pada bahasa, mudah terjadi kesalahan, dan tidak dapat menangangi kata yang belum terdaftar (out of
vocabulary - OOn secara langsung. Dengan demikian diperlukan sistem yang secara otomatis menghasilkan bentuk fonetik dari setiap kata baik
yang ada dalam daftar maupun tidak. Metode yang dapat diggnakan untuk transkripsi fonem antara lain
aturan fonologis (pendekatan berdasarkan aturan) dan pengucapan dengan analogi (pendekatan statistis) (Kee dkk, 2004). Aturan fonologis adalah penerapan ide bahwa pengucapan huruf atau diftong dapat diketahui jika
konteksnya diketahui, yaitu
huruf-huruf disekitarnya. Bentuk aturan ini didasarkan pada konsep fonologi generatif (Chomsky dan Halle, -): Dari bentuk tersebut huruf B, dengan konteks I di kiri dan C di kanan akan dihasilkan pengucapan D. Aturan ini dapat dengan mudah diterapkan dalam pemrograman bahasa tingkat tinggi rnenjadi bentuk TF ... THEN. Pengucapan dengan analogi pronunciation by
Menurut Verhaar dalam (Marsono, 1999) bunyi semi-vokal secara praktis termasuk konsonan tetapi karena pada waktu diartikulasikan belum membentuk konsonan murni, maka bunyi-bunyi itu disebut semi-vokal. Dalam bahasa Jawa ada 2 semi-
vokal yaitu [w] dan [y]. Keduanya tidak pemah
berada di akhir kata, tetapi hanya di awal dan tengah
kata saja. Tabel
3
menunjukkan
2
semi-vokal
tersebut beserta contohnya.
Tabel 3: Semi-vokal bahasa Jawa dan contoh katanya No-
Tengah kata
Awal kata
Konso-
nm
Contoh
Arti
lontoh
Arti
I
Iw.]
watu
batu
aru
abu
2
tvl
yen
kalau alru
cantik
Akhir kata lontoh Ani
analogy - PbA menerapkan pengetahuan fonologis yang didapat secara implisit pada kamus kata yang dilengkapi dengan pengucapannya. Idenya adalah bahwa pengucapan kata yang belum diketahui cara pengucapannya dapat disusun dari pengucapan penggalan kata yang sudah diketahui dari kata-kata lain. Menurut R. I. Damper 0 ada 2PbA dasar yaitu eksplisit dan implisit. Analogi eksplisit (Dedina and Nusbaum, ) mensyaratkan kamus yang berisi daftar kata dan cara pengucapannya. Pada saat penentuan cara pengucapan dari kata yang belum dikenal diperlukan komputasi proses penggandengan. Pada analogi implisit (Sullivan and
Damper, ) basisdata kamus disusun terlebih dahulu untuk membangun basis pengetahuan fonologis, yang nantinya basisdata ini digunakan sebagai acuan saat dilakukan proses transkripsi fonemik. Contoh PbA antara lain sistem grafem-ke-fonern (Andersen,
1996), pemodelan pengucapan (Byrne, 1998), translasi huruf-ke-suara (Pagel, 1998) dan pemodelan teks-ke-fonem (Suontausta dan Hiikkinenen, 2000). pengubahan Grarem
ke."ff,flXigjg
I
ror
Proses
adalah transkipsi fonetik secara-umum
,"-rru g.rf". i'r* Jii."a*"'l:T:'i dapat mempunyat lain pihak grafem yung 'utnu tergantung gTuigu)' b;beda rimJir"r"iir yang *:"^-.U*; konteksnva. Dari hasil p"n"iitiunnyu konverst ionteksnya dapat mengurangi ambiguitas'
Hubungan grafem bahasa J:Yi^j::g* Gambar fonemnya dapat digambarkan seperti
2
tl*"1*"*' I tonem' dengan berpatut'gun aa" t-"a"i aksara -:"t" gub"eun beberapa aKsara ""pi t.tp;rfi;; oLG* i simb-ot fonem atau.l ,aksara Beberapa "
mempunyai beberapa simbol fonem' 1 fonem adalah aksara yang b"rpurungui--J"ngutt
tnl,1l'-uefrasansan 'dh
dengan
[]'
a"ng* []' dan PerpTTcan dapat a.ngun'Ldj. Iatu aksara vang -fo""* *T::"** adalah 'k' dengan beberapa t'*Uof 'e' ;;d;;r*;a-."e", [kl atau [? ]; berpasangan [u1 dengan [e], [e], atau [];"u' Ut'put*gan^de.ngan 'o' atau.[]; atau [U]; 'a' berpasairgan dengan [a] selengkapnva
b6":;tt"; dapat
dengan [ofatau
Isl
20. 21.
Z
Lz)
h
thl Ir]
r
23.
w
24.
v
26.
i i
[wl tvl til ul
11
e
28.
e
lel lel
29. 30. 31.
e
u
a
Ia]
32. 33. 34.
dengan adalah aksara sedang adalah
U"rpurung'un
S
25.
dan fonem Gambar 2: Hubungan grafem
'tt'
19.
1',)
tut'*u pada i;*ft;illr.un ro,,i* 'jikl.proses mempethatikan grafem menjadi
h/';#;'"d;
lvl
18.
sulit, tidak
[]' Daftar
dilihat pada Tabel4'
a
tl
o o
[o]
u
tul
u u
35.
1 aksara yang hanya Dengan demikian untuk
u"rpl'r-Jni,.'*9:'l,qr"ro""t?il"*r.T"i[r#"1 ax
eabungan beberaPa langsung dengan i"""*"J"p" dilakukan pengubahan untuk vang lainnva
iuu"t +''Nu"*un ffi;ffi;;npemahamana" font"ftt agar dapat dipilih dioerlukan
;o"n;;;^t
cocok sesuai konteks'
KESIMPULAN
grafem ke ion11-. untuk Proses pengubahan konteks unruk bahasa Jawa memerl'tun fr"*uhuman mengurangi ambi guitas'
DAFTAR PUSTAKA
(aksara) dan fonem Table 4: Tabel hubungan grafem bahasa Jawa
I1l.
Andersen,
O,
Octob
er
1996' Comparison of
APProaches for Two rr""-si*ttut"A Conversion-'Ir' Proc' C.Jpn"*"-to-pt'on"*"
PA' zoo-l 703' Philadelphia' pton'nciation Modeling Byrne, W,Mry iss8' for Using u duna-Labelled .gotPut
;;i;i,pue"'
r
1.
p
lpl
2.
b
[b]
3.
t
ttl
Conversationut
d th
tdl
lCASSP'pages
dh c
rdl
8.
j
Lil
9.
k
10.
a
tkl tel
11.
k
i?l
t2.
m
Im] In]
4. 5.
6. '7.
I
Ic]
13.
n
14.
ny
15.
ng
16.
1
0l
f
tfl
17.
ke Fonem Bahasa ^^ I Pensubahan Grafem tuz Yoh"urr., Suyanto
.
I
tnl u
Jawa
[2]'
if""tt' \ttoq'itl:,n; ln Proc' I 6' Seattle' wa'
3
13-3
r3r'c';hv";;' l, Transltl1i-11J,f,Hl"i;,J' 2005,
J'';il::;
5(2): I01-106'-' lu*lu" Uuaio Teknika' ";;;'"Htiil' v' -'- The sound [4]. chomskv, -Nnn*glish' Harper and Row' New Pattern o1 York' and Nusbaum' H' C' t5l. t"' Dedina, M' J u p'og'u* for pronunciation ;*o'N6LrNcE; and Language' Lv unurogv' Con'piter Speech
(5):55-64'
[6]. Dutoit, T, 1997, An Introduction to Test-ToSpeech Synthesis. Kluwer Academics [7].
Publisher, The Netherlands. Kee, T. Y, Seong, T. B, and Haizhou, L,2004.
Grapheme
to
R.I, Novelstudy. language a cross word pronunciation:
[12]. Sullivan, Sp
and Damper,
eech Communication, (13):441452.
[13]. Suontausta,
J
and H[kkinenen, J, October
2000, Decision Tree Based Text-to-Phoneme Mapping for Speech Recognition. ln Proc.
Phoneme Conversion for
Standard Malay.
[8]. Marsono, 1999, Fonetik. Gadjah
K. P.H
ICSLP,pages 83 1-834, Beijing,China.
Mada
University Press, Yogyakarta.
[9]. Pagel, V, December 1998, Letter-to-Sound
Rules for Accented Lexicon Compression' Iu
Proc. ICSLP, pages 20151018,
SYdneY,
CV PENULIS
l.
Australia.
[0]. Pusat-Bahasa, edisi
Kamus Besar Bahasa Indonesia.
III.
tlll.R.LDamper, J. F. G.E, Pronunciation by analogy: impact of implementational choices on performance. Language and Speech, (a0):123.
2.
Yohanes Suyanto, lulusan Sl Fisika UGM dan 52 Ilmu Komputer UI, bekerja sebagai dosen di Program Studi Elekronika dan Instrumentasi
UGM. Sri Hartati, lulusan S1 Fisika UGM, mendapat gelar M.Sc. Dan Ph.D dari University of New Brunswick Canada.
ru*u I 103 YohanesSuyantol ---
Pengubahan Grafem ke Fonem Bahasa