IMPLEMENTASI ALGORITMA ENHANCED CONFIX STRIPPING STEMMER PADA KAMUS SISTEM BAHASA ISYARAT INDONESIA
SKRIPSI
ANNIFA IQRAMITHA 091402028
PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2013
Universitas Sumatera Utara
IMPLEMENTASI ALGORITMA ENHANCED CONFIX STRIPPING STEMMER PADA KAMUS SISTEM BAHASA ISYARAT INDONESIA SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi
ANNIFA IQRAMITHA 091402028
PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2013
Universitas Sumatera Utara
ii
PERSETUJUAN
Judul
Kategori Nama Nomor Induk Mahasiswa Program Studi Departemen Fakultas
: IMPLEMENTASI ALGORITMA ENHANCED CONFIX STRIPPING STEMMER PADA KAMUS SISTEM BAHASA ISYARAT INDONESIA : SKRIPSI : ANNIFA IQRAMITHA : 091402028 : SARJANA (S1) TEKNOLOGI INFORMASI : TEKNOLOGI INFORMASI : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
Diluluskan di Medan, 22 Juli 2013 Komisi Pembimbing
:
Pembimbing 2
Pembimbing 1
M. Anggia Muchtar, ST., MM.IT NIP 198001102008011010
Dr. Erna Budhiarti Nababan, M.IT NIP -
Diketahui/Disetujui oleh Program Studi S1 Teknologi Informasi Ketua,
Prof. Dr. Opim Salim Sitompul, M.Sc. NIP196108171987011001
Universitas Sumatera Utara
iii
PERNYATAAN
IMPLEMENTASI ALGORITMA ENHANCED CONFIX STRIPPING STEMMER PADA KAMUS SISTEM BAHASA ISYARAT INDONESIA
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, 22 Juli 2013
Annifa Iqramitha 091402028
Universitas Sumatera Utara
iv
PENGHARGAAN
Alhamdulillah, puji dan syukur penulis ucapkan kehadirat Allah SWT, serta shalawat dan salam kepada junjungan kita nabi Muhammad SAW, karena atas berkah, rahmat dan hidayahnya penulis dapat menyelesaikan penyusunan skripsi ini. Dalam penulisan skripsi ini penulis banyak mendapatkan bantuan serta dorongan dari pihak lain. Dalam kesempatan ini dengan segala kerendahan hati,penulis mengucapka terima kasih kepada: 1. Ketua dan Sekretaris Jurusan Prof. Dr. Opim Salim, M.Sc dan Drs.Sawaluddin, M.IT. 2. Kepada Bapak M. Anggia Muchtar, ST, M.MIT dan Ibu Dr. Erna Budhiarti Nababan, MIT selaku dosen pembimbing penulis yang telah memberikan saran dan masukan serta bersedia meluangkan waktu, tenaga dan pikiran dalam membantu menyelesaikan skripsi ini. 3. Bapak Muhammad Andri Budiman, S.T., M.Comp.Sc. dan Bapak M. Fadly Syahputra, ST., M.MIT selaku dosen pembanding dan penguji yang telah banyak memberikan petunjuk, saran dan kritik dalam menyelesaikan skripsi ini. 4. Kedua orang tua penulis, yaitu Mama, Analisa beserta Ayah, Muhammad Amin, karena berkat dukungan mereka baik secara moril maupun materil secara terus-menerus sehingga penulis dapat menyelesaikan skripsi ini. Kepada adik-adik penulis, Annisa Iqramina dan Muhammad Alhamidi serta kepada Donny Fadli, Amd. yang telah banyak memberikan dukungan moril maupun materil kepada penulis selama ini, dan seluruh keluarga besar atas perhatiannya dan dukungannya kepada penulis. 5. Bapak M. Safri Lubis, ST, M.Com selaku dosen penasihat akademik saya. 6. Seluruh Dosen yang mengajar dan staff tata usaha pada program studi Teknologi Informasi Universitas Sumatera Utara. 7. Teman-teman Teknologi Informasi stambuk 2009, baik yang sudah tamat atau pun sedang menyelesaikan skripsi, Umay, Jihan, Nurul, Dila, Amira, Rafiqa, Lisa, Fadil, Alvin, Sion, Fida, Stella, Cynthia, Riska, Asri, Iqbal, Firdaus, Denny, Mahatir, Dulah, Yunisha, Ade dan mamanya, Dijah, Bagus, Ari, dan Satria serta Bang Nazar dan Bang Nasir yang bersedia meluangkan waktunya untuk membantu penulis.. 8. Seluruh rekan-rekan kuliah sejawat yang tidak dapat disebutkan satu persatu. Dalam penyusunan skripsi ini penulis menyadari bahwa masih banyak kekurangan, untuk itu penulis mengharapkan saran dan kritik yang bersifat membangun dari semua pihak demi kesempuranaan skripsi ini. Akhir kata penulis mengharapkan semoga skripsi ini dapat bermanfaat dan membantu semua. pihak yang memerlukannya
Universitas Sumatera Utara
v
ABSTRAK
Bahasa isyarat merupakan bahasa alami yang memiliki proses penentuan struktur kalimat berdasarkan aturan tata bahasa dan kamus kata sesuai dengan bahasa isyarat. Aturan tata bahasa dalam bahasa isyarat memiliki sedikit perbedaan dengan tata aturan dalam bahasa Indonesia. Untuk penguraian kata berimbuhan, bahasa isyarat hanya mengenal awalan me-, berbeda dengan bahasa Indonesia yang terdapat awalan me-, men-, meng-, menge-. Begitu juga dengan awalan pe- pada bahasa isyarat, yang di dalam bahasa Indonesia terdapat awalan pe-, pen-, peng-, penge-. Melihat aturan tata bahasa dalam bahasa isyarat yang memerlukan penguraian imbuhan, maka diperlukan proses stemming untuk mendapatkan kata imbuhan dan kata dasar yang diinput-kan. Proses stemming yang dilakukan menggunakan algoritma Enhanced Confix Stripping Stemmer. Algoritma ini dapat menghasilkan kata dasar yang lebih akurat, sehingga penerjemahan sesuai dengan kaedah yang berlaku pada system bahasa isyarat Indonesia. Algoritma Enhanced Confix Stripping Stemmer dapat diterapkan dalam sistem pembelajaran bahasa isyarat. Algoritma ini mampu memenggal kata dengan kombinasi Prefiks 1 ditambah Prefiks 2 ditambah Kata dasar ditambah Sufiks 3 ditambah Sufiks 2 ditambah Sufiks 1 dimana Sufiks 3 adalah akhiran, Sufiks 2 adalah kata ganti kepunyaan, dan Sufiks 1 adalah partikel. Output yang dihasilkan berupa gambar dari database yang sesuai dengan kata yang di-inputkan user.
Kata kunci :bahasa isyarat, confix stripping stemmer, stemming.
Universitas Sumatera Utara
vi
ABSTRACT
Sign languageis a natural language that has the process of determining the structure of sentences based on rules of grammar and dictionary of words according to the sign language. Grammar rulesin sign languagehas littledifferencewith thegrammarrules inIndonesian language. For the decomposition of confixes, sign language only has the prefix me-, which in Indonesian language has prefix me-, men-, meng-, menge-. It is same to the prefix pe- in sign language, which in Indonesian language has prefix pe-, pen-, peng-, penge-. The rules of grammar in sign language which require to parse the word has confixes, accordingly require stemming process to get the confixes and the root word that user has input. Algorithm of stemming process are performed using enhanced confix stripping stemmer. This algorithm can produce more accurate root word in previous research, so the translation can be match with the grammar of Indonesian sign language. Enhanced Confix Stripping Stemmer algorithm is applied to a sign language learning system. This algorithm is able to cut off the word with a combination of prefixes 1 plus prefixes 2 plus root word plus suffix 3 plus suffixes 2 plus suffixes 1 where the suffix 3 is a suffix, suffix 2 is a possessive pronoun, and the suffix 1 is a particle. The output is an image from the database according to the words that the user has input. Keywords : sign language , confix stripping stemmer, stemming.
Universitas Sumatera Utara
vii
DAFTAR ISI
PERSETUJUAN PERNYATAAN PENGHARGAAN ABSTRAK ABSTRACT DAFTAR ISI DAFTAR TABEL DAFTAR GAMBAR BAB 1PENDAHULUAN 1.1Latar Belakang 1.2Rumusan Masalah 1.3Batasan Masalah 1.4Tujuan Penelitian 1.5Manfaat Penelitian 1.6Metodologi Penelitian 1.7Sistematika Penulisan BAB 2 TINJAUAN PUSTAKA 2.1Kamus Sistem Bahasa Isyarat Indonesia 2.2Proses Stemming 2.3Algoritma Enhanced Confix Stripping Stemmer 2.4Bahasa Pemrograman PHP BAB 3 ANALISIS DAN PERANCANGAN SISTEM 3.1Data Yang Digunakan 3.2Agoritma Enhanced Confix Stripping Stemmer (ECS) 3.3Analisis Sistem 3.3.1 System Requirement 3.3.2 Process Modeling 3.3.3 Kebutuhan Hardware 3.3.4 Kebutuhan Software 3.3.5 Antarmuka Sistem BAB 4IMPLEMENTASI DAN PENGUJIAN 4.1Implementasi 4.1.1 Tampilan Halaman Utama 4.1.2 Tampilan Halaman Input 4.1.3 Tampilan Halaman Output 4.1.4 Tabel Kata Pada Database Kata 4.2Pengujian BAB 5 KESIMPULAN DAN SARAN 5.1Kesimpulan 5.2Saran DAFTAR PUSTAKA LAMPIRAN A: Listing Program
ii iii iv v vi vii viii ix 1 1 2 2 2 2 3 3 6 6 7 9 14 18 18 18 23 23 23 26 26 26 29 29 29 29 29 29 30 33 33 33 34 36
Universitas Sumatera Utara
viii
DAFTAR TABEL
Halaman Tabel 2.1 Kombinasi Awalan-Akhiran yang dilarang 10 Tabel 2.2 Aturan Pemenggalan Awalan Stemmer Nazief dan Adriani yang sudah dimodifikasi 12 Tabel 4.1 Output Sistem dari input-an kalimat “Ayah membaca koran Tribun dan ibu pergi membeli ikan ke pasar.” 28
Universitas Sumatera Utara
ix
DAFTAR GAMBAR
Gambar 2.1 Contoh kata melempar Gambar 2.2 Contoh kata alirkan Gambar 2.3 Contoh kata berlompatan Gambar 2.4 Flowchart Proses Stemming Gambar 3.1 Diagram Sistem Gambar 3.2 Flow Chart Sistem Gambar 3.3 Flow Chart Proses Stemming Gambar 3.4 Context Diagram Gambar 3.5 DFD Level 1 Gambar 3.6 Rancangan halaman utama Gambar 3.7 Rancangan halaman output Gambar 4.1 Halaman Utama Gambar 4.2 Halaman Input Gambar 4.3 Halaman Output Gambar 4.4 Database Gambar
Halaman 6 6 7 13 18 20 22 24 25 27 27 31 31 32 32
Universitas Sumatera Utara