PENAMAAN LABEL TEKS PENDEK (TWEET) DI TWITTER MENGGUNAKAN JACCARD COEFFICIENT
TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Oleh : ROUDHOTUL JANNAH 09560502
JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG 2013
i
LEMBAR PERSETUJUAN
PENAMAAN LABEL TEKS PENDEK (TWEET) DI TWITTER MENGGUNAKAN JACCARD’S COEFFICIENT
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Menyetujui,
Pembimbing I
Pembimbing II
Yuda Munarko,S.Kom, M.Sc
Yufis Azhar, S.Kom
NIP. 108.0611.0443
NIDN.0728088701
ii
LEMBAR PENGESAHAN PENAMAAN LABEL TEKS PENDEK (TWEET) DI TWITTER MENGGUNAKAN JACCARD’S COEFFICIENT
TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Disusun Oleh : Roudhotul Jannah NIM.09560502
Tugas Akhir ini telah diuji dan dinyatakan lulus melalui sidang majelis penguji pada tanggal 3 Agustus 2013
Menyetujui, Penguji I
Penguji II
Zamah Sari, ST, MT
Dhebys Suryani, S.Kom, MT
NIDN. 0708087701
NIDN.07061188303
Mengetahui Ketua Jurusan Teknik Informatika
Eko Budi Cahyono, S.Kom, MT NIP. 108.9504.0330
iii
LEMBAR PERNYATAAN Yang bertanda tangan di bawah ini : NAMA
: ROUDHOTUL JANNAH
NIM
: 09560502
FAKULTAS / JURUSAN
: TEKNIK / INFORMATIKA
Dengan ini saya menyatakan bahwa Tugas Akhir dengan judul “PENAMAAN LABEL TEKS PENDEK (TWEET) DI TWITTER MENGGUNAKAN JACCARD’S COEFFICIENT” beserta seluruh isinya adalah karya saya sendiri dan bukan merupakan karyatulis orang lain, baik sebagian maupun keseluruhan, kecuali dalam bentuk kutipan yang telah disebutkan sumbernya. Demikian surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya saya ini, atau diklaim dari pihak lain terhadap keaslian karya saya ini maka saya siap menanggung segala bentuk resiko / sanksi yang berlaku.
Malang, 23 Agustus 2013 Yang Membuat Pernyataan
(Roudhotul Jannah)
Mengetahui,
Dosen Pembimbing I
Dosen Pembimbing II
(Yuda Munarko,S.Kom, M.Sc)
(Yufis Azhar, S.Kom )
NIP. 108.0611.0443
NIDN.0728088701
iv
LEMBAR PERSEMBAHAN Dengan mengucap puji syukur kehadirat Allah SWT atas segala rahmat serta hidayahnya sehingga laporan tugas akhir dengan judul : “Penamaan Label Teks Pendek (Tweet) di Twitter Menggunakan Jaccard Coefficient” dapat penulis selesaikan. Tugas Akhir ini merupakan salah satu prasyarat untuk menyelesaikan studi tingkat strata satu di Fakultas Teknik Jurusan Informatika Universitas Muhammadiyah Malang. Selama penyelesaian tugas akhir ini, penulis telah memperoleh banyak bantuan, bimbingan, motivasi dan saran yang berguna dari berbagai pihak. Oleh karena itu, pada kesempatan ini penulis ingin mengucapkan rasa terima kasih kepada : 1. Bapak Yuda Munarko,S.Kom, M.Sc, MT. selaku Dosen Pembimbing I, yang telah meluangkan waktu untuk memberikan bimbingan maupun pengarahan dalam penyelesaian tugas akhir ini. 2. Bapak Yufis Azhar, S.Kom selaku Dosen Pembimbing II, yang telah meluangkan waktu dalam memberikan bimbingan maupun pengarahan dalam pencapaian hasil yang maksimal pada penelitian tugas akhir ini. 3. Bapak Eko Budi Cahyono, S.Kom, MT dan Seluruh Dosen serta staff Jurusan Teknik Informatika. 4. Kedua orang tua dan keluarga yang selalu memberikan dukungan, motivasi dan do’a dan semangat materiil maupun spirituil yang tak ternilai harganya. 5. Para sahabat- sahabat dan teman-teman saya utamanya keluarga Upin-Ipin (Dini/Susanti,Nora /Upin, dan Iva/Ipin)yang selalu memberikan supprot dan dukungannya serta menyediakan waktu dan tempat untuk membantu proses pengerjaan pengambilan data utamanya. 6. Sahabat- sahabat dan teman- temanku jurusan teknik informatika angkatan 2009 khusunya kelas J, 7. Mbak ratna, Pak Bambang, Mas Windra dan Rozik dan bapak ibu dosen pasca psikologi selaku rekan di kantor Direktur Pasca Sarjana Psikologi UMM yangsudah memberikan dukungan dan do’anya. 8. Buat teman-teman dikos 14 B yang telahmemberi supportdan mendo’akan selalu.
v
KATA PENGANTAR
Assalamu’alaikum Wr. Wb Dengan memanjatkan puji syukur kehadirat Allah SWT, atas limpahan rahmat dan hidayah-Nya serta salawat dan salam yang tercurahkan kepada junjungan nabi besar Muhammad SAW sehingga penulis dapat menyelesaikan Tugas Akhir yang berjudul : “PENAMAAN LABEL TEKS PENDEK (TWEET) DI TWITTER MENGGUNAKAN JACCARD’S COEFFICIENT”. Penyusunan Laporan Tugas Akhir ini merupakan salah satu persyaratan untuk mencapai kelulusan dan memperoleh gelar Sarjana Teknik dalam Program Studi Teknik Informatika Program Strata I Jurusan Teknik Informatika, Fakultas Teknik, Universitas Muhammadiyah Malang. Di dalam tulisan ini disajikan pokok-pokok bahasan mengenai penjelasan penaman label pada teks pendek (Tweet) di twitter menggunakan perhitungan jaccard’s coefficient untuk menentukan kedekatan kata dan sebagaianya, sehingga bisa dilakukan penamaan label. Penulis menyadari sepenuhnya bahwa Laporan Tugas Akhir ini masih jauh dari kesempurnaan, oleh karena itu penulis sangat mengharapkan kritik dan saran yang membangun dari semua pihak sehingga di dalam pembuatan laporan yang akan datang akan jauh lebih sempurna. Akhir katapenulis berharap, semoga Laporan Tugas Akhir ini dapat bermanfaat bagi penulis khususnya dan para pembaca pada umumnya. Wassalamu’alaikum Wr. Wb.
Malang, 23 Agustus 2013
Roudhotul Jannah
vi
DAFTAR ISI HALAMAN JUDUL ................................................................................... LEMBAR PERSETUJUAN ......................................................................... LEMBAR PENGESAHAN .......................................................................... HALAMAN PERNYATAAN KEASLIAN ................................................. ABSTRAK .................................................................................................. ABSTRACT ................................................................................................ LEMBAR PERSEMBAHAN ....................................................................... KATA PENGANTAR ................................................................................. DAFTAR ISI ............................................................................................... PENDAHULUAN 1.1 Latar Belakang ............................................................ 1.2 Rumusan Masalah ...................................................... 1.3 Tujuan ......................................................................... 1.4 Batasan Masalah ............................................................ 1.5 Metodologi Penyelesaian Masalah ................................. 1.5.1 Pengumpulan Data ............................................. 1.5.2 Membangun Sistem............................................ 1.5.3 Alur Perancangan Sistem ................................... 1.5.4 Analia Karakteristik ........................................... 1.5.5 Pengujian Sistem................................................ 1.5.6 Penyusunan Laporan .......................................... 1.6 Sistematika Penulisan ................................................... BAB II LANDASAN TEORI 2.1 Defini Twitter....................................................................... 2.2 Label Teks............................................................................ 2.2.1Definisi Label Teks .................................................... 2.2.2 Fungsi Penamaan Label Teks .................................... 2.3 Ekstraksi Kata Pokok ........................................................... 2.3.1 Definisi........................................................................ 2.4 Definisi Jaccard Coefficient.................................................... 2.5 Java ........................................................................................ 2.6 MySQL .................................................................................. 2.6.1 Pengertian MySQL ...................................................... 2.6.2 Fitur-fitur MySQL ....................................................... BAB III ANALISIS DAN PERANCANGAN 3.1 Analisa Masalah ................................................................... 3.1.1 Desain Perangkat Lunak .............................................. 3.2 Pengumpulan Data ............................................................... 3.2.1 Aplikasi Pengambilan Tweet ........................................
i ii iii iv v vi vii viii ix
BAB I
vii
1 2 2 2 3 3 3 3 4 4 5 5 6 6 6 7 8 8 8 9 11 11 11 13 13 14 15
3.3
Penyaringan Data Training ................................................... 16 3.3.1 Penyaringan Data Training dan Testing ....................... 16 3.3.2 Pemisahan Atribut-atribut di Twitter ............................ 17 3.4 Ekstraksi Data Fitur-Fitur Tweet ........................................... 17 3.4.1 Penghapusan Nama Author .......................................... 17 3.4.2 Ekstraksi Kata Pokok Atau Istilah ................................ 18 3.4.3Tweet dalam Bahasa Indonesia ..................................... 18 3.4.4 Pengelompokkan Istilah Dalam Kategori ..................... 18 3.5 Mekanisme Data Testing Menggunakan Jaccard Coefficient Untuk Penamaan Label ................................................................. 19 3.5.1 Penerapan Jaccard coefficient pada Similaritas Kata Pokok ....................................................................... 19 3.5.2Mekanisme Penerapan Jaccard Coefficient Pada Penamaan Label Teks Pendek atau tweet ................................................ 20 BAB IV IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Interface Program Pengambilan Data ............. 21 4.1.1 Form Login.................................................................. 21 ` 4.1.2 Form Tampilan Tweet .................................................. 22 4.2 Pengujian Sistem dan Analisa ............................................... 22 4.2.1 Pengujian Fungsi ......................................................... 23 4.2.2 Pengujian Sistem ......................................................... 24 4.2.2.1 Proses Insert Istilah dan Kategori ........................ 24 4.2.2.2 Proses Menambah Istilah Dan Kategori ............... 28 4.2.2.3 Pengujian Penerapan Jaccard Coefficient ............ 30 4.2.2.4 Perbandingan Hasil Uji Data Testing dan Data Training ............................................................... 33 4.3 Implementasi Database ......................................................... 34 BAB V KESIMPULAN DAN SARAN 5.1 Kesimpulan ......................................................................... 36 5.2 Saran .................................................................................... 37 DAFTAR PUSTAKA LAMPIRAN
viii
DAFTAR PUSTAKA 1. Hermawan, B. 2004.”Menguasai JAVA 2 & Object Oriented Programming”.Yogyakarta: ANDI 2. Heymann,Paul.2008.”Label Teks and Tagging teks”.Fukuoka, Kyushu University. 3. Kadir, A. 2009. “Membuat Aplikasi Web dengan PHP + Database Mysql”.Yogyakarta: ANDI 4. Mashable .http://mashable.com/2008/07/18/twitter-not-amicroblogging-tool/ (di akses November 2012). 5. Ohiolink.edu.http://etd.ohiolink.edu/sendpdf.cgi/. (di akses November 2012 ). 6. Puslit jurnal. http://puslit2.petra.ac.id/ejournal/. (di akases November 2012). 7. Ramadhan, fakhriy. 2011.”Implementasi MYSQL Cluster Menggunakan Pemanfaatan Avalaibility Pada Penginputan Data Mahsiswa Dengan Aplikasi Berbasis Java”.Bandung:Skripsi 8. Sriram Barath. 2010. Short Text Classification in Twitter to Improve Information Filtering (di akses November 2012). 9. Wibisono,Yudi.2011.http://yuliadi.com/file/paper/yudi_wibisono_siste m_analisis_opini_microblogging_ver4.pdf (di akses Februari 2013).
ix