BAB 1
PENDAHULUAN
1.1
Latar Belakang
Banyak kemudahan yang kita dapat dari teknologi informasi. Penggunaan internet sebagai media komunikasi, penyebaran informasi dan banyaknya layanan penyedia email membuat semua menjadi ringkas dan mudah. Kita dapat mengirim informasi dalam hitungan menit dan bahkan detik ke seluruh dunia ini. Begitupun penerima informasi dapat dengan mudah dan cepat membalas informasi tersebut. Teknologi itu disebut internet dan email.
Semakin banyaknya orang yang terhubung ke internet, menjadikan electronic mail (email) sebagai salah satu bentuk komunikasi yang paling cepat dan ekonomis. Banyaknya informasi digital dalam email sebagai akibat dari perkembangan teknologi informasi membutuhkan suatu cara pengorganisasian dan pengelompokan informasi dalam inbox email untuk kemudahan penggunanya. Pengelompokan informasi tak terstruktur ini dikenal dengan pengklasifikasian dokumen.
Bila kita berkunjung ke perpustakaan atau toko buku, biasanya kita akan melihat buku-buku diletakkan di rak-rak dalam kelompoknya masing-masing. Misalnya rak komputer, berisi segala judul buku yang membahas mengenai komputer, program, software, hardware, teknik informatika, dan lain-lain. Buku-buku yang membahas tema tertentu umumnya dikelompokkan menurut tema bahasannya masingmasing. Pengelompokan atau klasifikasi ini memudahkan kita menemukan buku yang kita cari. Oleh sebab itu maka penulis ingin membuat suatu sistem yang dapat mengklasifikasikan email sesuai dengan keyword yang didasarkan pada sender,subject dan body dari inbox email tersebut.
Universitas Sumatera Utara
Mengkategorikan dokumen teks pada email secara otomatis sangatlah membantu, karena pengorganisasian dokumen yang dilakukan secara manual akan sangat mahal, atau tidak flexible mengingat keterbatasan waktu dari aplikasi atau jumlah dokumen yang digunakan. Oleh karenanya, kebutuhan akan klasifikasi otomatis semakin diperlukan.
Ada beberapa teknik yang dapat digunakan untuk mengatasi klasifikasi email ini, seperti SVM, ANN, Naïve Bayes, dan Vector Space Model. Berdasarkan penelitian yang dilakukan oleh Srivinas Mukkamala dan Andrew H.Sung (2003) menyatakan bahwa kinerja algortima SVM lebih baik jika dibandingkan dengan ANN dalam hal solusi yang dicapai untuk kasus pengklasifikasian IDS. Dari penelitian yang dilakukan Mruntujaya Panda dan Mana R. Prata (2007) menyatakan algortima Bayesian lebih efisien dalam mengklasifikasikan Network IDS dibanding SVM. Vektor Space Model merupakan metode dengan proses perhitungan intensif sehingga membutuhkan waktu komputasi lebih banyak (Santosa 2007). Penerapan VSM sebagai model dasar dalam Sistem Temu Kembali Informasi memilki keunggulan pada perhitungan yang mendetail dan meyeluruh untuk mengetahui jarak dokumen.
Berdasarkan uraian diatas, peneliti akan mencoba melakukan klasifikasi pada sisi klien dengan menggunakan algortima Vector space model yang memproses berdasarkan dari sender,subject,body email yang dijalankan pada sisi klien. Email yang digunakan adalah email berbasis teks, email yang telah disimpan didalam computer, dan aplikasi tidak terkoneksi secara lansung dengan mail server.
Universitas Sumatera Utara
1.2
Rumusan Masalah
Klasifikasi pada sisi klien lebih mudah diterapkan dan lebih besar kemungkinan memberikan hasil yang diharapkan. Oleh karena itu peneliti akan melakukan penelitian bagaimana mengaplikasikan metode Vector Space Model untuk memanagement inbox email sehinggga memudahkan pengguna email dalam pengorganisasian setiap email yang masuk kedalam inbox pengguna fasilitas email.
1.3.
Batasan Masalah
Dalam pengklasifikasian email menggunakan algoritma Vector Space Model dilakukan beberapa batasan sebagai berikut :
1. Pengklasifikasian hanya dilakukan pada sisi klien. 2. Vector Space Model digunakan untuk pengukuran kemiripan suatu dokumen dalam pengklasifikasiannya. 3. Email server adalah menggunakan Google Mail Server untuk mengunduh dan mengirim email 4. Bahasa pemograman yang digunakan untuk membuat aplikasinya menggunakan bahasa vb.net 5. Hak akses terhadap email yang diunduh masih terbatas 6. Dalam proses Text Mining hanya melibatkan tokenizing dan analizing 7. Keyword hanya meggunakan satu kata
1.4. Tujuan Penelitian
Adapun tujuan penelitian ini adalah mengimplementasi algoritma Vector Space Model pada sistem mail klien untuk memklasifikasi inbox email sesuai dengan kata kunci dan jenis field yang dipilih dengan tingkat akurasi yang tinggi dan juga menampilkan peringkat klasifikasi email.
Universitas Sumatera Utara
1.5
Manfaat Penelitian
Adapun manfaat penelitian ini adalah sebagai berikut: 1.
Memberikan kemudahan dalam pengklasifikasian email oleh pengguna fasilitas email karena setiap email yang masuk dapat terklasifikasikan sesuai kata kunci dan sesuai dengan jenis field yang ada .
2.
Mendapatkan hasil yang optimal dalam pengukuran tingkat similiaritas dokumen sehingga didapatkan filtering klasifikasi email yang signifikan.
1.6
Metodologi Penelitian
Tahapan yang akan dilakukan pada pelaksanaan penelitian ini adalah sebagai berikut: 1. Studi Literatur Studi literatur yang dilakukan dalam penelitian ini adalah mengumpulkan bahan referensi mengenai konsep mail server, pengambilan data melalui POP3, algoritma vector space model,dan implementasinya dalam dokumen .
2. Analisa Permasalahan Pada tahap ini dilakukan analisis terhadap hasil studi literatur untuk mengetahui dan mendapatkan pemahaman mengenai algoritma Vector Space Model untuk mengklasifikasi email
3. Perancangan Sistem Pada
tahap
perancangan
pengumpulan data
sistem
dilakukan
perancangan
arsitektur,
pelatihan, merancang antarmuka. Proses perancangan
dilakukan berdasarkan hasil analisis studi literature yang telah didapatkan.
Universitas Sumatera Utara
4. Implementasi Sistem Pada tahap implementasi sistem ini akan dilakukan pengkodean program dalam sistem komputer dengan menggunakan Bahasa VB.NET
5. Pengujian Pada tahap ini memastikan aplikasi klasifikasi mail klien yang telah dibuat sudah berjalan sesuai diharapkan, dan kemudian dianalisis kinerja dan penerapan algoritma tersebut.
6. Dokumentasi dan Penyusunan Laporan Pada tahap ini dilakukan dokumentasi hasil penerapan algoritma
Vector
Space Model untuk mengklasifikasi email.
1.7
Sistematika Penulisan
Adapun langkah langkah dalam menyelesaikan penelitian ini adalah sebagai berikut:
BAB 1: PENDAHULUAN Bab ini menjelaskan mengenai latar belakang pemilihan judul skripsi “Klasifikasi Email Client menggunakan algoritma VSM”, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metode penelitian, dan sistematika penulisan.
BAB 2: LANDASAN TEORI Bab ini membahas mengenai teori teori yang berkaitan dengan perancangan aplikasi klasifikasi mail client menggunakan algoritma vector space model dan teori lainnnya yang mendukung pembuatan aplikasi.
Universitas Sumatera Utara
BAB 3: ANALISIS DAN PERANCANGAN SISTEM Bab ini terdiri dari analisis sistem dan perancangan aplikasi untuk klasifikasi email. Pada bagian analisis sistem dimuat uraian tentang analisis data sistem dan komponen sistem. Pada bagian perancangan aplikasi, membahas tentang algoritma vector space model
dalam
pengklasifikasian
email
dan
perancangan
form
yang
akan
diimplementasikan ke aplikasi.
BAB 4: IMPLEMENTASI DAN PENGUJIAN Bab ini membahas bagaimana mengimplementasikan aplikasi yang telah dirancang kedalam bahasa pemprograman dan menguji aplikasi yang telah dibangun.
BAB 5: KESIMPULAN DAN SARAN Bab ini memuat kesimpulan dari keseluruhan uraian uraian bab-bab sebelumnya dan saran saran yang diharapkan dapat bermanfaat dalam pengetahuan selanjutnya
Universitas Sumatera Utara