Teknik Pemenggalan Kata Bahasa Indonesia Dalam Dokumen LATEX Eri Prasetyo, Thodo Timoteus Universitas Gunadarma e-mail:
[email protected], thodo
[email protected]
ABSTRAK LATEX adalah suatu aplikasi yang digunakan untuk penyiapan dokumen yang memiliki dukungan penulisan dokumen dalam berbagai macam bahasa. Namun dalam kenyataannya LATEX belum mampu diadopsi dengan baik oleh Bahasa Indonesia. Salah satu kendalanya adalah dalam Sistem Pemenggalan Kata. Pemenggalan terhadap kata-kata dalam Bahasa Indonesia belum mampu dilakukan dengan baik. Untuk itulah perlu dirancang suatu Sistem Pemenggalan Kata yang sesuai dengan aturan Bahasa Indonesia ke dalam Sistem LATEX. Dengan sistem tersebut diharapkan diperoleh suatu dokumen yang baik yang sesuai dengan aturan penulisan Bahasa Indonesia. Artikel ini membahas tentang teknik pembuatan dan modifikasi tex file yang digunakan untuk melakukan pemenggalan kata dalam Bahasa Indonesia serta implementasinya dalam dokumen LATEX. Kata Kunci : LATEX, pemenggalan, kata, hyphenation, bahasa, Indonesia.
1. Latar Belakang Masalah Kebutuhan akan teknologi digital untuk melakukan pengolahan dokumen menjadi sangat vital di era ini. Hampir semua kalangan, dari mulai rumah tangga, sektor ekonomi, pekerja, pengusaha dan terlebih kalangan akademisi memerlukan pengolahan dokumen secara digital. Secara bertahap orang mulai meninggalkan cara konvensional untuk menulis dokumen. Dalam pembuatan laporan tugas akhir seperti skripsi dan tesis ataupun juga dokumen lain yang membutuhkan konsistensi pada dokumennya, standar penulisan dokumen menjadi sesuatu yang sangat penting. Standar penulisan dokumen tersebut merupakan aturan wajib yang harus diikuti oleh penulisnya. Dengan adanya aturan wajib tersebut, diharapkan semua dokumen yang sejenis memiliki format penulisan yang sama. Selama ini untuk melakukan standar penulisan tersebut yang digunakan adalah word processor seperti Word dari Microsoft atau Writer dari openOffice. Padahal kedua aplikasi tersebut tidak memiliki fungsi utama untuk melakukan standarisasi penulisan dokumen. Dengan menggunakan aplikasi ini yang terjadi adalah penulis berusaha secara manual mencocokkan penulisannya dengan suatu dokumen contoh yang sudah ada sebelumnya. Hal ini menjadi kurang bahkan tidak efisien karena harus menghabiskan waktu untuk menyamakan
penulisan. Terlebih yang sering terjadi adalah format penulisan menjadi tidak seragam karena penyusunannya dilakukan secara manual. LATEX adalah alternatif pengganti Ms. Word atau pun openOffice Writer untuk menangani standar penulisan dokumen. Dengan menggunakan LATEX aktifitas penulis hanya berfokus pada isi dari penulisan tanpa perlu memikirkan segala macam aturan standar penulisannya. Dalam melakukan standarisasi penulisan dokumen, LATEX memiliki kemampuan untuk diadopsi dengan menggunakan banyak bahasa, termasuk juga Bahasa Indonesia. Namun untuk penulisan dokumen dalam format Bahasa Indonesia, masih memiliki kelemahan. Kelemahan tersebut terutama dalam melakukan pemenggalan kata. Pemenggalan kata yang dilakukan oleh Sistem LATEX dalam penulisan dokumen yang menggunakan Bahasa Indonesia banyak dilakukan dengan tidak tepat. Sehingga harus ditemukan solusi bagaimana agar dokumen LATEX tersebut dapat sesuai dengan aturan penulisan dalam Bahasa Indonesia terutama dalam Sistem Pemenggalan Kata. 2. Pemenggalan Kata Pemenggalan yang dikenal juga dengan istilah hyphenation adalah tanda horizontal kecil yang memisahkan dua atau lebih elemen dari sebuah kata yang terpecah atau tanda pemisah di akhir baris dari sebuah hasil ce-
tak. Dengan adanya pemenggalan kata, maka kualitas dari sebuah hasil cetakan secara estetis dan teknis menjadi lebih baik. Dari berbagai penilitan yang dilakukan oleh berbagai pihak (contohnya seperti HYPHENOLOGIST-Sebuah organisasi yang mengembangkan algoritma pemenggalan kata untuk lebih dari 50 bahasa menggunakan Bahasa C. tahun 1985). Saat ini kemampuan sistem pemenggalan kata berkembang dengan cepatnya. Berbagai algoritma dikembangkan untuk dapat membuat posisi pemenggalan yang baik. Prinsipnya adalah mengenali semua daftar karakter yang mungkin terdapat di dalam sebuah kata, dan mencocokkannya dengan kriteria penempatan pemenggalannya (tergantung dari aturan bahasa yang digunakan). Terdapat banyak sekali kombinasi kemungkinan karakter pada suatu bahasa tertentu. Selain itu, setiap bahasa bersifat dinamis. Secara konstan suatu bahasa membentuk suatu bentuk kata yang baru. Di dalam dunia modern hal ini terutama karena adanya penyerapan dan adaptasi kata yang berasal dari bahasa lain atau bahasa asing. 2.1. Pemenggalan Kata Dalam Bahasa Indonesia Setiap bahasa memilki aturan pemenggalan katanya sendiri. Untuk dapat membuat algoritma pemenggalan pada suatu bahasa tertentu, maka diperlukan aturan pemenggalan yang dianut oleh bahasa tersebut. Pemenggalan kata di dalam Bahasa Indonesia diatur oleh suatu pedoman yang dikenal dengan ”Pedoman Umum Ejaan Bahasa Indonesia Yang Disempurnakan”. Pemenggalan kata menurut pedoman tersebut dilakukan sebagai berikut: 1) Jika ditengah kata ada vokal yang berurutan, pemenggalan kata itu dilakukan di antara kedua huruf vokal itu. Misalnya: ma-in, sa-at, buah. Huruf diftong ai, au, dan oi tidak pernah diceraikan sehingga pemenggalan kata tidak dilakukan di antara kedua huruf itu. Misalnya: au-la bukan a-u-la, sau-da-ra bukan sa-u-da-ra. 2) Jika di tengah kata ada huruf konsonan, termasuk gabungan huruf konsonan, di antara dua buah huruf vokal, pemenggalan dilakukan
sebelum huruf konsonan. Misalnya: ba-pak, ba-rang, su-lit, la-wan, dengan, ke-nyang, mu-ta-khir. 3) Jika di tengah kata ada dua huruf konsonan yang berurutan, pemenggalan dilakukan di antara kedua huruf konsonan itu. Gabungan huruf konsonan tidak pernah diceraikan. Misalnya: man-di, som-bong, swasta, cap-lok, Ap-ril, bang-sa, makhluk. 4) Jika di tengah kata ada tiga buah huruf konsonan atau lebih, pemenggalan dilakukan di antara huruf konsonan yang pertama dan huruf konsonan yang kedua. Misalnya: in-strumen, ul-tra, in-fra, bangkrut, ben-trik, ikh-las. Imbuhan akhiran dan imbuhan awalan, termasuk awalan yang mengalami perubahan bentuk serta partikel yang biasanya ditulis serangkai dengan kata dasarnya, dapat dipenggal pada pergantian baris. Misalnya: makan-an, me-rasa-kan, mem-bantu, pergi-lah. Catatan: a. Bentuk dasar pada kata turunan sedapat-dapatnya tidak dipenggal. b. Akhiran -i tidak dipenggal. c. Pada kata yang berimbuhan sisipan, pemenggalan kata dilakukan seperti contoh berikut: te-lun-juk, si-nambung, ge-li-gi. Jika suatu kata terdiri atas lebih dari satu unsur dan salah satu unsur itu dapat bergabung dengan unsur lain, pemenggalan kata dapat dilakukan a. di antara unsur-unsur itu atau b. pada unsur gabungan itu sesuai dengan kaidah 1, 2, 3, dan 4 di atas. Misalnya: bio-grafi, bi-o-gra-fi foto-grafi, fo-to-gra-fi intro-speksi, in-tro-spek-si kilo-gram, ki-lo-gram pasca-panen, pas-ca-pa-nen. 3. Pemenggalan Kata Dalam Dokumen LATEX LATEX sebagai perangkat lunak penyiapan dokumen mendukung banyak bahasa, atau dikenal dengan istilah multilingual. Sebagai software yang mendukung banyak ba-
hasa, LATEX harus mampu mendukung teknik pemenggalan kata. Pemenggalan kata dalam dokumen LATEX menjadi sangat penting. Dan disinilan salah satu letak keunggulan LATEX dibanding dengan aplikasi word processor. Pada aplikasi word processor yang dilakukan adalah membagi ruang baris, sehingga jarak spasi antar kata berbeda-beda. Dalam melakukan pemenggalan kata, LATEX membutuhkan suatu aturan pemenggalan kata yang harus didefinisikan terlebih dahulu. Hal ini dilakukan agar aturan tersebut sesuai dengan aturan tata bahasa yang ingin digunakan. LATEX menggunakan beberapa perintah untuk membuat bentuk atau format pemenggalan kata. Perintah-perintah tersebut terdiri dari: 1) Perintah \patterns 2) Perintah \hyphenation 3) Perintah \-
dibagi menjadi dua, yaitu ganjil dan genap. a) Angka ganjil merepresentasikan sebuah pemenggalan yang dapat diterima atau diperbolehkan. b) Angka genap merepresentasikan sebuah pemenggalan yang tidak dapat diterima atau tidak diperbolehkan. Nilai yang lebih tinggi mendapat perioritas lebih besar daripada yang lebih kecil. Nilai di atas 4 jarang sekali digunakan. Bahkan jika yang digunakan adalah nilai di atas 8, maka kekuatannya tidak akan berpengaruh. Contoh penggunaannya seperti berikut: •
3.1. Perintah patterns Perintah \patterns{} adalah perintah utama LATEX yang digunakan untuk membuat algoritma aturan pemenggalan kata yang sesuai dengan tata bahasa yang diinginkan. Algoritma pemenggalan kata yang tersebut dimasukkan di dalam tanda kurung yang berada pada perintah \patterns{} ini. Algoritma yang dimasukkan itu sendiri sebenarnya adalah pola-pola dari berbagai kata yang dikandung dari suatu jenis tata bahasa tertentu. Ada beberapa karakter-karakter yang dapat digunakan untuk mendifinisikan pola-pola pemenggalan kata ini. Berikut ini adalah karakter-karakter tersebut dan penjelasannya: 1) Karakter non-numerik Karakter non-numerik yang dimaksudkan disini adalah semua huruf yang akan dievaluasi. 2) Karakter titik (.) Karakter titik (.) merepresentasikan batas dari sebuah kata, misalnya batas awal atau batas akhir dari sebuah kata. 3) Karakter numerik Karakter numerik atau angka merepresentasikan sebuah sistem penilaian untuk identifikasi penerimaan dari pemenggalan di lokasi yang bersangkutan. Karakter numerik ini
2s1kan. Dalam aturan ini maka pemenggalan kata tidak boleh dilakukan sebelum huruf s. Pemenggalan hanya diizinkan setelah huruf s dan sebelum akhiran -kan. Titik di akhir menandakan akhir dari kata. Kata-kata yang cocok digunakan untuk algoritma ini adalah: le-pas-kan, be-bas-kan, menu-lis-kan atau meng-habis-kan.
Yang sangat perlu diketahui bahwa, perintah \patterns{} harus dikompilasi dengan menggunakan IniTEX1 sebelum dapat digunakan di dalam dokumen LATEX. 3.2. Perintah hyphenation LATEX melakukan pemenggalan kata yang sesuai dengan algoritma patterns. Namun ada kalanya terdapat beberapa kata yang bertabrakan dengan algoritma yang menggunakan perintah patterns. Jika hal itu yang terjadi, maka kita membutuhkan suatu pengecualian dari algoritma patterns tersebut. Untuk menangani hal itu LATEX menyediakan perintah \hyphenation. Perintah ini digunakan untuk pengecualian dari algoritma patterns. Bentuk umunya adalah: \hyphenation{daftar kata} 1
Kompiler yang digunakan untuk meng-inisialisasi konfigurasi LATEX.
Perintah ini menyebabkan daftar kata yang berada di dalam argumennya(dalam tanda kurung) dipenggal di bagian yang ditandai oleh karakter ”-”. Setiap kata yang ada dipisahkan dengan tanda spasi kosong. Contohnya: \hyphenation{bi-o-lo-gi} Hasil yang akan diperoleh di dokumen LATEX adalah bahwa kata biologi dipenggal seperti yang tertulis di dalam argumen \hyphenation{}. Hasil keluaran yang didapat tergantung dari jumlah karakter sebelum dan sesudah kata ”biologi”. Perintah \hyphenation{} didefinisikan langsung di bagian preambule dokumen LATEX. Namun demikian perintah \hyphenation{} dapat pula digabungkan dengan perintah \patterns{} untuk dikompilasi dengan menggunakan IniTEX. 3.3. Perintah Perintah \- digunakan jika pemenggalan kata dilakukan langsung di dalam penulisan dokuemen LATEX. Penggunaannya hanya dilakukan, jika LATEX harus memenggal kata yang bersangkutan dengan tidak benar dengan cara menyisipkannya ke bagian kata yang dikehendaki untuk dipenggal. Penggunaan perintah ini adalah seperti penggalan dokumen berikut ini: ...Teknik In\-for\-ma\-ti\-ka ...menikmati ku\-li\-ah saya. Dari contoh di atas, jika kata ”Informatika” berada di ujung baris, maka pemenggalan hanya boleh dilakukan pada titik-titik ”In-forma-ti-ka”. Hasil keluaran yang didapat tergantung dari jumlah karakter sebelum dan sesudah kata ”Informatika”. Perintah \- biasanya digunakan untuk kata-kata yang salah pemenggalannya, namun jarang muncul di dalam dokumen. 4. Implementasi Pemenggalan Kata Dalam Dokumen LATEX Teknik pemenggalan kata terutama menggunakan perintah \patterns{} dan perintah \hyphenation{}. Kedua perintah ini dapat digunakan bersama-sama untuk dikompilasi dengan menggunakan IniTEX. Karena perintah \patterns{} tidak dapat langsung digunakan ke dalam file tex dokumen sumber, maka kedua perintah
\patterns{} dan \hyphenation{} harus dibuat ke dalam satu file khusus yang juga berkestensi *.tex. File inilah yang akan berisi semua aturan dan pola pemenggalan setiap kata yang memenuhi aturan pemenggalan kata dalam suatu bahasa tertentu. 4.1. Modifikasi File inhyph.tex menjadi indohyph.tex Pada dasarnya Bahasa Indonesia dan Bahasa Melayu (Malaysia) pun sudah memilki file pemenggal kata bersama. Adalah dua orang Jerman yang bernama J¨org Knappen dan Terry Mart yang mengembangkan dan menyusunnya ke dalam sebuah file yang bernama ”inhyph.tex”. Namun mungkin karena J¨org Knappen dan Terry Mart belum sepenuhnya mempelajari aturan Bahasa Indonesia dengan baik atau justru lebih banyak mengadopsi Bahasa Melayu, ternyata file ini pada beberapa bagian masih ada yang perlu diperbaiki dan ditambahkan. Oleh karena itu perlu dilakukan modifikasi terhadap file inhyph.tex tersebut. Untuk memodifikasi file inhyph.tex, pertama yang harus kita lakukan adalah mengetahui apa isi dari file inhyph.tex tersebut. File inhyph.tex sendiri berisi polapola aturan pemenggalan. Berikut ini adalah pola-pola yang menggunakan perintah patterns dan hyphenation: a1 e1 i1 o1 u1 2b1d 2b1j 2b1k 2b1n 2b1s 2b1t 2c1k 2c1n 2d1k 2d1n 2d1p 2f1d 2f1k 2f1n 2f1t 2g1g 2g1k 2g1n 2h1k 2h1l 2h1m 2h1n 2h1w 2j1k 2j1n 2k1b 2k1k 2k1m 2k1n 2k1r 2k1s 2k1t 2l1b 2l1f 2l1g 2l1h 2l1k 2l1m 2l1n 2l1s 2l1t 2l1q 2m1b 2m1k 2m1l 2m1m 2m1n 2m1p 2m1r 2m1s 2n1c 2n1d 2n1f 2n1j 2n1k 2n1n 2n1p 2n1s 2n1t 2n1v 2p1k 2p1n 2p1p 2p1r 2p1t 2r1b 2r1c 2r1f 2r1g 2r1h 2r1j 2r1k 2r1l 2r1m 2r1n 2r1p 2r1r 2r1s 2r1t 2r1w 2r1y 2s1b 2s1k 2s1l 2s1m 2s1n 2s1p 2s1r 2s1s
2s1t 2s1w 2t1k 2t1l 2t1n 2t1t 2w1t 2ng1g 2ng1h 2ng1k 2ng1n 2ng1s 2n3s2t .be2r3 .te2r3 .me2ng3 .pe2r3 2ng. 2ny. i2o1n a2ir 1ba1ga2i 2b1an. 2c1an. 2d1an. 2f1an. 2g1an. 2h1an. 2j1an. 2k1an. 2l1an. 2m1an. 2ng1an. 2n1an. 2p1an. 2r1an. 2s1an. 2t1an. 2v1an. 2z1an. 3an. .a2ta2u .ta3ng4an. .le3ng4an. .ja3ng4an. .ma3ng4an. .pa3ng4an. .ri3ng4an. .de3ng4an. be-ra-be be-ra-hi be-rak be-ran-da be-ran-dal be-rang be-ra-ngas-an be-rang-sang be-ra-ngus be-rani be-ran-tak-an be-ran-tam be-ran-tas be-ra-pa be-ras be-ren-deng be-re-ngut be-re-rot be-res be-rewok be-ri be-ri-ngas be-ri-sik be-ri-ta be-rok be-ron-dong be-ron-tak be-ru-du be-ruk be-run-tun peng-eks-por peng-im-por te-ra te-rang te-ras te-ra-si te-ra-tai te-ra-wang te-ra-weh te-ri-ak te-ri-gu te-rik te-ri-ma te-ri-pang te-ro-bos te-ro-bos-an te-ro-mol te-rom-pah te-rom-pet te-ro-pong te-ro-wong-an te-ru-buk te-ru-na te-rus te-rusi.
Modifikasi terhadap file inhyph.tex ini terdiri dari pengubahan pola yang sudah ada sebelumnya dan penambahan pola baru. Polapola yang mengalami modifikasi tersebut ditampilkan melalui tabel 1. Hasil modifikasi file inhyph.tex seperti yang ditunjukkan dalam tabel 1 atas permintaan pembuatnya selanjutnya disimpan dalam file baru yang memiliki nama yang berbeda. Nama file baru yang digunakan untuk melakukan pemenggalan kata Bahasa Indonesia tersebut adalah ”indohyph.tex”.
Penejelasan Huruf diftong
Gabungan vokal Awalan meng-
Sebelum – – – – .me2ng3
Akhiran -kan
2k1an.
Gabungan 3 konsonan Partikel -lah
– –
Sesudah a2i a2u o2i 2i1o .me2ng3 .me3ng4a4 .me3ng4i4 .me3ng4u4 .me3ng4e4 .me3ng4o4 2b1kan. 2c1kan. 2d1kan. 2f1kan. 2g1kan. 2h1kan. 2j1kan. 2l1kan. 2m1kan. 2ng1kan. 2n1kan. 2p1kan. 2r1kan. 2s1kan. 2t1kan. 2v1kan. 2z1kan. 3s4k4ri4p3 2n1lah. 1lah.
Tabel 1 H ASIL M ODIFIKASI F ILE INHYPH . TEX
4.2. Instalasi indohyph.tex Seperti yang telah dijelaskan bahwa, file pemenggal kata (indohyph.tex) tidak dapat langsung digunakan atau ditempelkan begitu saja ke dalam dokumen utama LATEX. Hal ini dikarenakan file tersebut harus dikompilasi. Bagian ini akan membahas langkah-langkah instalasi indohyph.tex di Windows (MikTeX). Hal pertama yang harus dilakukan setelah pembuatan file indohyph.tex adalah memindahkan file indohyph.tex ke folder hyphen yang terdapat di: ..\MikTeX 2.6\tex\generic\ Setelah itu membuka pengaturan MikTeX yang terdapat di Start - All Programs MikTeX 2.6 - Settings. Pada tampilan MikTeX Options memilih tab ”Language” dan klik New untuk mendifinisikan paket bahasa baru. Lalu mengisikan ”Language name” menjadi ’indonesia’ (sesuai dengan opsi paket babel yang dibuat). Jika pada tab ”Language” tersebut terdapat paket ”indonesian”, maka yang dilakukan adalah meng-klik ”edit” pada tab ”Language” dan melakukan pengubahan ”Language name” menjadi ”indonesia”. Langkah berikutnya pada kotak teks hyphenation file, melakukan browse ke file indohyph.tex yang telah disalin sebelumnya. Terakhir melakukan klik tombol Apply dan melakukan klik OK. Setelah MikTeX melakukan pengaturan
file, langkah selanjutnya adalah menjalankan kompiler IniTEX. Melalui command prompt menjalankan perintah seperti di bawah ini: initexmf --dump MikTeX akan melakukan pengaturan sekali lagi. Pastikan bahwa proses kompilasi tidak terjadi masalah. Setelah proses kompilasi berhasil dilakukan, maka file indohyph.tex dapat langsung digunakan untuk melakukan pengaturan pemenggalan kata di dalam dokumen LATEX. Apabila terjadi perubahan pada file indohyph.tex, yang dilakukan adalah menjalankan langkah terakhir dengan perintah initexmf pada command prompt. Hal ini sangat penting. Karena apabila terjadi perubahan, namun tidak menjalankan perintah initexmf, maka perubahan yang terjadi menjadi tidak berarti. 5. Simpulan Dari pembahasan yang dilakukan oleh penulis dapat diambil kesimpulan sebagai berikut: 1) Pemenggalan kata pada dokumen LATEX, khususnya yang menggunakan Bahasa Indonesia telah selesai dibuat. Walaupun demikian masih terdapat kekurangan terutama dalam menangani masalah pemenggalan kata yang berawalan ber-, ter- dan per-. Pemenggalan terhadap kata-kata tersebut masih harus dilakukan dengan pengecualian(menggunakan perintah \hyphenation{}. 2) Dengan adanya pemenggalan kata pada dokumen LATEX, khususnya yang menggunakan Bahasa Indonesia dapat meningkatkan kualitas dokumen LATEX tersebut. Kualitas ini mencakup aspek teknis (sesuai dengan Tata Bahasa Indonesia) dan juga estetis (keindahan tulisan). DAFTAR PUSTAKA [1] G. Keraf, Komposisi: Sebuah Pengantar Kemahiran Bahasa Oleh Gorys Keraf. Jakarta: Percetakan Ikrar Mandiri, edisi 10, 1994. [2] “Pedoman umum ejaan bahasa indonesia yang disempurnakan,” 2007.
[3] “Fop: Hyphenation,” [4] D. Fawthrop, A discussion of the changing principles of word division, now implemented by computers, in British English and American English, with notes on hyphenation of 39 other languages. Computer Hyphenation Ltd, 2000. [5] V. Eijkhout, TEX by Topic. United Kingdom: Addison-Wesley, 2004. [6] H. J. Greenberg, A Simplified Intoduction to LaTeX. Denver: University of Colorado, 1999. [7] H. Dulimarta, Pengenalan TEX dan LATEX. Home page : http://www.egr.msu.edu/dulimart, Januari 2001.