PENGUBAHAN SINGKATAN PADA PESAN SINGKAT TELEPON SELULER DENGAN MEMANFAATKAN POHON KEPUTUSAN C4.5
LAPORAN TUGAS AKHIR
Disusun sebagai syarat kelulusan tingkat sarjana
oleh: Rian Hadisaputra / 13503026
PROGRAM STUDI TEKNIK INFORMATIKA SEKOLAH TEKNIK ELEKTRO DAN INFORMATIKA INSTITUT TEKNOLOGI BANDUNG 2007
Lembar Pengesahan Program Studi Sarjana Teknik Informatika
Pengubahan Singkatan Pada Pesan Singkat Telepon Seluler dengan Memanfaatkan Pohon Keputusan C4.5
Tugas Akhir Program Studi Sarjana Teknik Informatika ITB
Oleh Rian Hadisaputra / 13503026
Telah disetujui dan disahkan sebagai laporan tugas akhir di Bandung, pada tanggal
Pembimbing
Nur Ulfa Maulidevi, S.T, M.Sc NIP.999 023 503
ii
RINGKASAN Kehadiran teknologi pesan singkat atau lebih sering disebut SMS pada telepon seluler memacu perubahan cara berkomunikasi. Penggunaan pesan singkat pada telepon seluler semakin hari semakin signifikan di kalangan pengguna telepon seluler. Namun, keterbatasan panjang pesan pendek yang dapat dikirimkan oleh pengguna telepon seluler membuat perubahan yang lebih signifikan lagi, yaitu perubahan cara penulisan kata pada pesan singkat, misalnya disingkat. Hal ini menyebabkan sulitnya jika suatu saat nanti akan dibuat suatu aplikasi yang masukannya adalah pesan singkat telepon seluler, seperti SMS Text To Speech atau SMS Natural Language Processing.
Tugas akhir ini menjadi perantara antara pesan singkat yang dituliskan oleh pengguna dengan aplikasi-aplikasi tersebut diatas. Perangkat lunak pada tugas akhir ini akan mengubah singkatan pada pesan singkat, yang disingkat, menjadi pesan singkat yang cara penulisannya tidak disingkat lagi. Untuk melaksanakan hal tersebut, tugas akhir ini memanfaatkan pohon keputusan C4.5 untuk melakukan pengklasifikasian katakata yang ditulis dengan menggunakan cara penulisan pesan singkat. Selain pohon keputusan C4.5, juga dikembangkan algoritma preprocessing dan postprocessing kata. Setelah terklasifikasikan maka kata-kata tersebut dapat diproses lebih lanjut menjadi kata yang cara penulisannya benar, tidak disingkat.
Dari hasil pengujian dapat disimpulkan pohon keputusan, algoritma preprocessing dan algoritma postprocessing mampu melakukan pengubahan cara penulisan pesan singkat menjadi pesan singkat yang cara penulisannya benar, walaupun nilai akurasi rata-ratanya tidak mencapai 100 persen. Salah satu kekurangan tugas akhir ini adalah keterbatasan jumlah kata yang dapat diproses. Kata-kata yang dapat diproses hanyalah kata yang masuk dalam domain yang ditetapkan oleh tugas akhir ini.
Kata kunci: singkatan, pesan singkat, telepon seluler, pohon keputusan, C4.5.
iii
KATA PENGANTAR
Alhamdulillahi rabbil ’alamin. Puji syukur dipanjatkan ke hadirat Allah SWT atas rahmat-Nya sehingga Tugas Akhir yang berjudul ”Pengubahan Cara Penulisan Pesan Singkat Telepon Seluler dengan Memanfaatkan Pohon Keputusan” ini dapat terselesaikan.
Begitu banyak pihak yang turut membantu penulis dalam mengerjakan dan menyelesaikan Tugas Akhir ini. Oleh karena itu penulis ingin mengucapkan terima kasih sebesar-besarnya kepada: 1. Ibu Nur Ulfa Maulidevi, S.T, M.Sc, yang telah bersedia menjadi pembimbing dan setia membantu penulis dalam mengerjakan Tugas Akhir ini dari awal hingga akhir. Terima kasih atas seluruh waktunya yang telah banyak diberikan untuk memberi masukan dan evaluasi atas Tugas Akhir ini. 2. Ibu Henny Yusnita Zubir, B.Sc., M.T, yang telah menjadi dosen pembimbing penulis selama 4 tahun. 3. Ibu Masayu Leylia Khodra, S.T., M.T. yang telah menjadi penguji pada presentasi proposal, dan pra-sidang penulis. Terima kasih banyak atas ilmu dan bantuan yang diberikan. 4. Bapak Dr. Santika Wachyudin P. Yang telah menjadi penguuji pada seminar dan sidang penulis. Terima kasih banyak atas ilmu dan bantuan yang diberikan. 5. Orangtua penulis di Bogor dan adik-adik penulis, Lia dan Maya, yang telah banyak memberi dukungan dari jauh. Terima kasih atas kasih sayang dan perhatian yang diberikan kepada penulis sepanjang hidupnya. 6. Diah Eka Yulianti yang sering menemani penulis mengerjakan Tugas Akhir hingga larut malam maupun di hari libur, dan telah memberikan kasih sayang, dukungan material dan spiritual, dan semangat 7. Kepada para sahabat dari Informatika, Dewangga, Teguh, Unggul, Tangju, Riza. Terima kasih banyak atas waktunya bersama penulis dalam suka maupun duka. 8. Kepada para sahabat yang sama-sama dibimbing oleh Ibu Ulfa, Pram, Rika, Dhani, Donny. Terima kasih banyak atas kebersamaannya selama bimbingan bersama. 9. Kepada para sahabat yang telah bersama penulis mengikuti lomba Imagine Cup, Boyke, Andresta, Fitrasani. Terima kasih banyak atas bantuannya selama masa perlombaan berlangsung, karena dengan bantuan kalin penulis tidak mengenyampingkan tugas akhir ini.
iv
10. Rekan-rekan dari Laboratorium Grafik dan Inteligensia Buatan yang selama beberapa bulan terakhir ini sudah menjadi rumah kedua bagi penulis. Terima kasih telah mau menerima kehadiran penulis yang hampir setiap hari mengunjungi dan mengerjakan Tugas Akhir di sana. 11. Rekan-rekan
Informatika
2003
atas
kebersamaannya
selama
4
tahun
yang
menyenangkan dan penuh kenangan ini. 12. Seluruh staf akademik Departemen Teknik Informatika yang banyak direpotkan oleh mahasiswa-mahasiswanya. 13. Pihak lain yang tidak dapat disebutkan satu persatu yang turut membantu penulis dalam mengerjakan Tugas Akhir ini.
Penulis menyadari dalam pembuatan laporan tugas akhir ini masih terdapat banyak kekurangan dan jauh dari kesempurnaan. Untuk itu, penulis mengharapkan saran dan kritik dari berbagai pihak untuk perbaikan serta pengembangan lebih lanjut. Semoga laporan Tugas Akhir ini bermanfaat bagi pembaca sekalian.
Bandung, September 2007
Penulis
v
DAFTAR ISI Lembar Pengesahan Program Studi Teknik Informatika ................................................... ii RINGKASAN.......................................................................................................................... iii KATA PENGANTAR ............................................................................................................ iv DAFTAR ISI ........................................................................................................................... vi DAFTAR GAMBAR .............................................................................................................. ix DAFTAR TABEL .................................................................................................................... x BAB I PENDAHULUAN ......................................................................................................I-1
1.1
Latar Belakang ............................................................................................ I-1
1.2
Rumusan Masalah ....................................................................................... I-3
1.3
Tujuan ......................................................................................................... I-3
1.4
Ruang Lingkup dan Batasan Masalah......................................................... I-4
1.5
Metodologi .................................................................................................. I-4
1.6
Sistematika Pembahasan ............................................................................. I-5
BAB II STUDI PUSTAKA ................................................................................................. II-1
2.1
Pengertian Short Message Service (SMS) ................................................. II-1
2.2
Bahasa SMS ............................................................................................... II-1
2.3
Pohon Keputusan ....................................................................................... II-2
2.3.1
Representasi Pohon Keputusan .......................................................... II-2
2.3.2
Inferensi Pohon Keputusan ................................................................ II-3
2.4
Pohon Keputusan di C4.5 .......................................................................... II-4
2.4.1
Deklarasi Kelas dan Atribut Data ...................................................... II-4
2.4.2
Data Pelatihan .................................................................................... II-5
2.4.3
Pembentukan Pohon Keputusan ........................................................ II-5
2.4.4
Pembentukan Aturan Produksi .......................................................... II-6
BAB III ANALISIS DAN PERANCANGAN ................................................................. III-1
3.1
Analisis Pola Penulisan Bahasa SMS ...................................................... III-1
3.1.1
Menghapus Huruf dari Kata............................................................. III-1
3.1.2
Pengulangan Kata atau Suku Kata dengan Angka ........................... III-1
3.1.3
Substitusi Huruf dengan Angka yang Mirip .................................... III-2
3.1.4
Substitusi Fonetik............................................................................. III-3
3.2
Analisis Pemanfaatan Pohon Keputusan C4.5 ......................................... III-4
3.2.1
Kelas Data ........................................................................................ III-4
vi
3.2.2 3.3
Atribut Data ..................................................................................... III-5
Analisis Representasi Data Pesan Singkat dalam C4.5 ........................... III-5
3.3.1
Deklarasi Kelas dan Atribut Data Pesan Singkat............................. III-6
3.3.2
Representasi Data Pesan Singkat ..................................................... III-7
3.4
Analisis Metode Data Preprocessing ....................................................... III-8
3.5
Inferensi Pohon Keputusan .................................................................... III-11
3.6
Analisis Metode Data Postprocessing.................................................... III-12
3.6.1 3.7
Perhitungan Akurasi Pengubahan SMS ......................................... III-14
Model Analisis Perangkat Lunak ........................................................... III-15
3.7.1
Kebutuhan Perangkat Lunak .......................................................... III-15
3.7.2
Use Case SMSRenderer ................................................................. III-15
3.7.3
Identifikasi Kelas Objek ................................................................ III-16
3.8
Model Perancangan Perangkat Lunak ................................................... III-19
3.8.1
Perancangan Arsitektural ............................................................... III-19
3.8.2
Perancangan Kelas ......................................................................... III-20
3.8.3
Perancangan Struktur Data ............................................................ III-20
3.8.4
Perancangan Antarmuka ................................................................ III-20
3.8.4.1
Layar Saji Utama ....................................................................... III-20
3.8.4.2
Layar Saji Buka Berkas SMS .................................................... III-22
3.8.4.3
Layar Saji Buka Berkas SMS Pembanding ............................... III-22
3.8.4.4
Layar Saji Buka Berkas SMS Contoh ........................................ III-23
BAB IV IMPLEMENTASI DAN PENGUJIAN .............................................................. IV-1
4.1
Implementasi ............................................................................................ IV-1
4.1.1
Lingkungan Implementasi ............................................................... IV-1
4.1.2
Batasan Implementasi ...................................................................... IV-1
4.1.3
Status Implementasi ......................................................................... IV-2
4.1.4
Implementasi Antarmuka ................................................................. IV-3
4.1.4.1 4.2
Layar Saji Utama ......................................................................... IV-3
Pengujian.................................................................................................. IV-5
4.2.1
Lingkungan Pengujian ..................................................................... IV-5
4.2.2
Rencana Pengujian ........................................................................... IV-5
4.2.3
Hasil Pengujian ................................................................................ IV-5
4.2.4
Analisis Hasil Uji ............................................................................. IV-6
4.2.4.1
Analisis Hasil Uji Kebenaran Perangkat Lunak .......................... IV-6 vii
4.2.4.2
Pembahasan Hasil Uji Kebenaran Algoritma .............................. IV-6
BAB V KESIMPULAN DAN SARAN .............................................................................. V-1
5.1
Kesimpulan ................................................................................................V-1
5.2
Saran ..........................................................................................................V-1
DAFTAR REFERENSI ......................................................................................................... xi LAMPIRAN A ALUR PROSES ........................................................................................ A-1 LAMPIRAN B POHON KEPUTUSAN ............................................................................ B-1 LAMPIRAN C DATA CONTOH SMS ............................................................................. C-1 LAMPIRAN D DOKUMEN SPESIFIKASI SMSRenderer ............................................ D-1 LAMPIRAN E USE CASE SMSRenderer ........................................................................ E-1 LAMPIRAN F DIAGRAM KELAS SMSRenderer .......................................................... F-1 LAMPIRAN G SEQUENCE DIAGRAM ......................................................................... G-1 LAMPIRAN H DETAIL KELAS PERANCANGAN ...................................................... H-1 LAMPIRAN I RENCANA PENGUJIAN DAN KASUS UJI ............................................I-1
viii
DAFTAR GAMBAR Gambar II-1 Pohon Keputusan Weather .................................................................... II-3 Gambar V-1 Representasi deklarasi kelas dan atribut data ....................................... II-4 Gambar V-2 Representasi data pelatihan ................................................................... II-5 Gambar III-1 Deklarasi kelas dan atribut data pesan singkat .................................. III-6 Gambar III-2 Representasi data pesan singkat dalam format C4.5 ......................... III-8 Gambar III-3 Algoritma Pemecahan Kalimat menjadi Kata ................................... III-8 Gambar III-4 Algoritma Preprocessing ................................................................. III-11 Gambar III-5 Pohon Keputusan yang terbentuk .................................................... III-12 Gambar III-6 Algoritma postprocessing ................................................................ III-13 Gambar III-7 Struktur penyimpanan daftar kata huruf “A”................................... III-14 Gambar III-8 Algoritma pencarian kata dari daftar kata ....................................... III-14 Gambar III-9 Use Case SMSRenderer ................................................................... III-16 Gambar III-10 Deskripsi Sistem ............................................................................ III-19 Gambar III-11 Layar Saji Utama ........................................................................... III-22 Gambar III-12 Layar Saji Buka Berkas SMS ........................................................ III-23 Gambar III-13 Layar Saji Buka Berkas SMS Pembanding ................................... III-23 Gambar III-14 Layar Saji Buka Berkas SMS Contoh ........................................... III-23 Gambar IV-1 Implementasi Antarmuka Layar Saji Utama ..................................... IV-4
ix
DAFTAR TABEL Tabel III-1 penggunaan pola menghapus huruf ....................................................... III-2 Tabel III-2 penggunaan pola angka untuk pengulangan .......................................... III-2 Tabel III-3 penggunaan pola penggunaan angka menggantikan huruf .................... III-3 Tabel III-4 penggunaan pola penggunaan substitusi fonetik ................................... III-3 Tabel III-5 data kata dalam pesan singkat ............................................................... III-7 Tabel III-6 Pola-pola penulisan kata dalam pesan singkat .................................... III-10 Tabel III-7 Metode Postprocessing tahap awal ..................................................... III-13 Tabel III-8 Tabel Keterhubungan Antar Kelas ...................................................... III-18 Tabel III-9 Kelas-kelas pada Perangkat Lunak SMSRenderer .............................. III-21 Tabel IV-1 Perangkat lunak yang digunakan untuk pengembangan aplikasi .......... IV-2 Tabel IV-2 Package Kelas ....................................................................................... IV-2 Tabel IV-3 Implementasi Kelas dalam File Java ..................................................... IV-3 Tabel IV-4 Objek Antarmuka Layar Saji Utama ..................................................... IV-4 Tabel IV-5 Nilai Rata-rata Akurasi untuk setiap jumlah data yang bervariasi ....... IV-6
x