PENG EMBANGAN APLIKAS I MESIN PENJ AWAB O TO MATIS PADA LAYANAN PESAN S ING KAT DENG AN PENDEKATAN LATEN T S EMANTIC INDEXING
Da vid Binus Univer sity, Jakarta, DKI Jakarta, In donesia Afif Ali Binus Univer sity, Jakarta, DKI Jakarta, In donesia Gana Irwansyah Binus Univer sity, Jakarta, DKI Jakarta, In donesia
Abstrak Aplik asi dibuat untuk membalas Short Message S ervice secara otom atis pada han dphone andro id. Metode p enelitian yan g digunak an ialah pen gum pulan data yaitu den gan surv ey dan kuisoner, dan an alisis data yaitu dengan m en ggunakan pendekatan Latent Sem antic Indexing untuk m em peroleh hasil yan g akan digunakan sebagai pem ilihan kategori. Hasil dari penggun aan aplikasi in i adalah kem udahan bagi user untuk memberikan informasi didalam keadaan user tidak dapat mem beri tahuk an informasi keadaannya. Sim pulan adalah den gan penggun aan aplikasi ini m aka efisiensi bagi user dalam pem balasan pesan sin gkat dapat dioptimalkan dan den gan pen dek atan Latent Semantic Indexin g ketepatan dalam pemilihan kategori dapat dimaksimalk an.
Kata Kunci : Aplik asi, otomatis, Latent Semantic Indexing, Sho rt Message Service, kategori, efesiensi, optim al.
1. Pendah uluan Terkadang banyak sekali p ertanyaan y an g in gin dijawab nam un terhalan g oleh ber bagai kondisi sehin gga user yang mana bertin dak sebagai pemberi jawaban menuntut adanya sebuah kemudahan dalam hal jawab-menjawab pertanyaan. Kemunculan mesin penjawab otom atis pada telefon memudahkan user untuk menin ggalkan pesan apabila user sedan g berada pada kondisi tidak bisa m enjawab telefon. Seir in g perkembangan zaman m uncul ber bagai m edia kom unikasi dan seiring itu juga dit untut banyaknya tools unt uk memudahkan komunikasi diber bagai media. Handphone sekarang sudah m enjadi kebut uhan primer dikalan gan m anusia dan proses
kirim-m engirim pesan sudah menjadi aksi yan g pasti dilak ukan setiap har i. Den gan alasan ini m esin penjawab otomatis diterapkan pada aplikasi handphone, mem ang sudah bany ak sek ali jenis aplikasi mesin p enjawab otom atis yan g ada pada handphon e akan tetapi adakah m esin penjawab otomatis yang dapat menjawab pertanyaan sesuai den gan apa yan g ditanyak an. Den gan alasan ini lah ap likasi m esin penjawab otomatis den gan p en dekatan Latent Sem antic Indexing menjadi so lusi untuk otomatisasi pembalasan pesan singkat apabila user sedan g tidak bisa membalas pesan dik arenakan aktivitasnya dan ap likasi in i lebih dikh ususkan
kep ada
penggun a
yan g
sedang
berkendara
dikar enakan
akan
membahayakan diri sendiri dan oran g lain. Dengan adanya aplikasi ini banyak pihak yang akan terbantu dalam membalas pesan sin gkat sesuai den gan apa yang ditanyakan pada pesan tersebut.
2. Metodologi Metodolo gi penelitian y ang digunakan ter bagi em pat, yaitu metode pen gumpulan data, m etode analisis data, metode peran can gan, metode st udi p ustaka. A. Metode Pen gum pulan Data • Survey: den gan menggun akan for um untuk mengetah ui kata-kata yang ser ing m uncul pada pen ggunaan layanan pesan singkat yan g dibatasi oleh kategori y ang tersedia. • Kuisioner: pen gum pulan data terawasi atas kata-kata yan g sering digunak an penggun a lay anan pesan sin gkat pada kategori yan g ditentukan serta balasannya.
B. Metode An alisis Data • Menentukan jum lah yan g optimal dari dimensi untuk digunakan dalam Singular Va lue Decomposition untuk mendapatkan hasil yan g optim al antara waktu perhitun gan dan ketepatan hasil perhitungan.
C. Metode Perancangan Metode perancangan m elalui tiga tahap sebagai berik ut: a) Perancan gan pen ggunaan Latent Semantic Indexing untuk pencar ian data. b) Perancan gan Str uktur men u, berisi men u-m enu yang ak an digunak an dalam aplikasi.
c) Perancan gan User Interface, ber isi lay ar tampilan aplikasi yan g akan dibuat.
D. Metode Studi Perp ustakaan Metode kep ustakan digunak an untuk men gum pulkan inform asi yang ber bentuk literatur tertulis ataupun buku dan juga r eferensi dari In ternet sebagai lan dasan teori dalam peny usun an skr ipsi.
2.1 Pengum pulan Data Pengum pulan bentuk bebagai kata Short Messag e Service yang masuk ke handphone perlulah disurvey unt uk m engolah kata-kata yan g akan diekstrak oleh enginer untuk dijadik an bentuk dokumen kata dalam proses Latent Sem antic Indexing.
2.2 Analisis Data Penggunaan dim ensi untuk m elak ukan proses Singula r Va lue Decom posite memang dibut uhkan untuk m en dapatkan hasil per bandingan, secara um um semakin sedikit dim ensi yang digunakan maka semakin besar perban din gan terhadap konsepkonsep yan g terkandung dalam k um p ulan teks, sem entara jum lah yan g lebih bany ak memungkinkan dimensi yan g lebih sp esifik p er ban dingan kon sep. Jumlah y ang dap at digun akan dibatasi o leh jum lah dok um en. 2.3 Perancangan Dalam perancan gan pro gram dibutuhk an sebuah gam baran singk at tentang program yang akan dibuat . Pengambar an itu meliputi interface pro gram, kinerja program, dan fitur-fitur y ang terdapat didalamnya. Dalam m em proses SVD dibutuhk an sebuah konten library yaitu lingpipe. Lin gpipe ini
berguna
TERM_DOCUMENT
sebagai pem buat
bentuk
nilai vektor m atrix dar i
_MATRIX, TERM_DOCUMENT, dan
DOCUMENT.
Program m em iliki beberapa bent uk tem plate yang bertujuan sebagai kalimat pesan agar m em udahkan pengguna dalam membalas pesan sin gkat. User dap at m erubah dan membentuk template nya sen diri sesuai kein ginan u ser itu sen diri. Pemrosesan Latent S em antic Indexing ber upa per ubahan bentuk nilai matrixmatrix menjadi bentuk n ilai vektor yan g didapatkan m elalui pro ses S ingula r Value Decom potion. Sebuah bentuk data y ang diproses ke dalam Term. Lalu unt uk matriks A ber dasarkan hasil kem un culan banyak data didok umen. Hasil yang diin gink an
terdapat dimatriks q ber upa po sisi dim ana. Lalu nilai dimasukan kedalam fun gsi SVD untuk mendapatkan hasil nilai v ektor.
2.4 Studi P ustaka Mengumpulkan ber bagai bent uk metode pen gkerjaan dalam pencarian data melalui internet maup un dari perp ustakaan.
3. Kesimpulan Program telah selesai dibuat dan ber jalan dengan baik. Mudah diin stall dalam handphone. Dalam exper iment program berjalan dengan sem purna. Den gan kesalahan yang terletak dalam keter batasan kata. Den gan demikian pro gram ini dapat dikatakan telah m enyelesaik an permasalah an yan g ada. Sho rt Message S ervice balasan yang dik irim bisa menjawab pertanyaan pada Sho rt Message S ervice yan g m asuk dengan baik. Fitur balas automatis yan g ada, telah m enguran gi waktu p en gguna dalam berinteraksi den gan handphon enya saat berkendara. Ini tentu saja akan membantu pengguna dalam berkon sentrasi saat berk en dara. Sehin gga m en ghin dar i dari adany a kecelak aan. Pengguna dapat tetap berh ubungan den gan orang lain meskip un sedang sibuk berk en dara. Software bisa dibuat den gan cepat karena masih ber up a open so urce dar i andro id. Sehingga semua m odul bisa diimplentasikan den gan terpisah, dengan bantuan kom un itas yang banyak dari internet dikarenakan an droid baru saja terken al sehin gga banyak orang yang m embuat modul-modul maka resou rce modul di luar sana banyak sekali yan g bisa dijadik an referensi. Ap likasi sudah berjalan secara lancar dan dalam mengek strak kata dibutuhkan waktu estimasi antara 10 sam pai 30 detik samapi SM S terkirim .
Daftar Pustaka Anonym ous Telegraphone: http://cs-exhibitions. uni-k lu.ac. at/in dex.php?id=220 Anonym ous Artificial Neural Net work : http://www.learnartificialneuraln et works.com/intelligentsearch.html Anonym ous Classifier Sho wdo wn: http://blo g.peltarion.com /2006/07/10 /classif iersho wdown/ Anonym ous SM S( Short Message Service): http://www.calsoftla bs.com/whitepapers/sms‐ messag e.html
Kusumadewi Sri (2003). Artificial Intelligence (Teknik dan Ap likasiny a). Edisi p ertama, Graha Ilm u, Yogyakarta. Garcia Edel (2006), Latent Semantic Indexin g(LSI) A Fast Track Tutorial, [pdf], http://www.m iislita.com/information-retrieval-t utorial/latent-semantic-in dex in g-fasttrack-tutorial.pdf Rosario Barbara (2000), Latent Sem antic In dexing: An ov erview, [pdf], http://people.ischool. berkeley.edu/~rosario/pro jects/LSI.p df Jiang Jingqian (1997),Using Latent Sem antic In dexing for Data minin g, [p df], http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.43.8381&rep=rep1&type=pd f Murphy P. Ke vin (2006), Naive Bayes classif ier s, [p df], http://www.cs. ubc.ca/~m urphyk/Teach in g/CS340-Fall06/reading/NB.pdf Delany Jane Sarah, Cunningham Padraig (2007), k-Near st Neigh bour Classifier s, [p df], http://www.csi.ucd. ie/files/UCD- CSI-2007-4.p df Fom by Tom (2008), Naïv e Bayes Classif ier, [pdf], http://faculty.smu.edu/tfomby/eco5385 /lecture/NA%C3%8 FVE%20BAYES%20 CLAS SIFIER.p df
TH E DEV ELO PMENT O F AUTO MATIC ANSW ERING MACH INE FO R SHO RT MESSAG E SERVIC E USING LATENT S EM ANTIC INDEXING APPRO ACH
Da vid Binus Univer sity, Jakarta, DKI Jakarta, In donesia Afif Ali Binus Univer sity, Jakarta, DKI Jakarta, In donesia Gana Irwansyah Binus Univer sity, Jakarta, DKI Jakarta, In donesia
Abstract This paper presents an analysis for develop ing an automatic answer ing machine for short message service using latent sem antics in dex in g. An application made for answerin g short message services on an an droid based mo bile phone. The data co llecting m ethods used in this paper ar e surveys and questionnaire. Data then analyzed using latent sem antics in dex in g to get the best result in determining the best category. The main interest in develop in g this application is to help users to reply comin g SMS wh ile they cannot m ake contact with their mobile phone, in this case dr ivin g. The experim ent results sho w that usin g latent semantic indexin g in the developm ent of this application giv es goo d result in categorization of incoming SMS, thus determ ining the best answer.
Key wor d: application, autom atic, Latent Sem antic Indexing, Sho rt Message Service, category, efficiency, optim al.
1. Introduction Mobile phones ar e used for a variety of purpo ses, including keeping in touch with fam ily mem bers, con ducting business, an d hav in g access to a telephon e in the ev ent of an emergen cy. Mobile phone use while dr ivin g is comm on but controversial. Being distracted while operatin g a motor vehicle has been sho wn to increase the risk of accident. Because of this, many jur isdictions proh ibit the use of mobile phones while driv ing. Egypt, Israel, Japan, Portugal an d Singapor e ban both handh eld and han ds-fr ee use of a m obile phon e; others —includin g the UK, France, an d m any U. S. states—ban
handheld phone use only, allo win g hands-fr ee use. Avoidin g this peop le tend to use text messages to keep in touch even while drivin g. Based on this matter we see this problem as solvable by developin g an autom atic answering machine for shot m essage services usin g latent sem antic in dexing. This way people can still be in to uch ev en while dr ivin g without en dan gering the surroun din g.
2. Methodolo gy The m ethodology used in this paper is divided in 4 steps, wh ich are data collecting, data an aly sis, design, and literatur e. A. Data collecting Collection of data are needed to classify in comin g text message then replying it with the appropriate answer. Some method used in this step: • Survey: usin g internet forum to collect data, wor ds, used by user in text m essages with 3 categories. • Questionnaire: a sup ervised data co llecting procedure of wor ds frequently used in text m essages.
B. Data analysis Determinin g the best dimension in using Sin gular Value Decomposition that will be used for calculation in Latent Sem antic In dexing. The lar ger the dim ension the bigger correctness of the result but with longer compiling tim e and vice ver sa. The m ain point for observation are compilin g tim e and correctness of the result.
C. Design In design in g this the application, we divided it to 3 m ajor part: a) Designin g the use of Latent Sem antic Indexin g. Designin g a classif ier usin g Latent Semantic Indexin g that can separ ate incom ing text messages into several predef ined categories. Categories used in this application are time, position, an d activity. In Latent Sem antic Index in g some m atrices are need. This can be provided by SVD, Sin gular Values Decomposition. SVD creates sin gular, lefteigenvector and righteigenvector that will be used to determine the in dex ing of in com ing text m essage. LSI then compare those m atrices
with TERM_ DOCUMENT_MATRIX, TERM_DOCUMENT, and DOCUMENT to determ ine the class of incoming text message.
b) Designin g m enus that will be used. Some m ain menu provided ar e ‘pen gem balian setting’, ‘pen gat uran kata’. In ‘pengembalian setting’ user can m ake all chan ges back to its or iginal state. In ‘pengaturan k ata’ user can determine reply SM S for all categories.
c) Designin g user interface for user. All interface are made to its sim ple form. Som e buttons, check list, and inp ut area are given there to help user in operatin g this application.
D. Literature Literatures used in this paper are taken from textbook and references from internet as supporting m aterials in makin g this pap er.
3. Conclusion The developm ent of this application hav e come to an en d with goo d r esult an d work properly. It is easy to install in any an droid based m obile phone. Correctness rate lies in 74% in experim ent with all error com es from the lack of key wor ds used in the system. The reply sent can answer all incomin g text messages really well. The automatic replying feature has reduce the interaction of the user with its mobile device to the minimum thus making the user have more time to concentrate in drivin g an m inim ize the potential hazard that can happen. With this, we believe this application can solve the problem stated befor e. The application can be m ade in relatively short tim e because andro id is still an op en source soft war e. Many andro id com munities hav e given their ideas in m odules for beginner s to use an d study which helps in m akin g of this application. An d through java technology all this modules can be integr ated to one.
Daftar Pustaka Anonym ous Telegraphone: http://cs-exhibitions. uni-k lu.ac. at/in dex.php?id=220 Anonym ous Artificial Neural Net work : http://www.learnartificialneuraln et works.com/intelligentsearch.html Anonym ous Classifier Sho wdo wn: http://blo g.peltarion.com /2006/07/10 /classif iersho wdown/ Anonym ous SM S( Short Message Service): http://www.calsoftla bs.com/whitepapers/sms‐ messag e.html
Kusumadewi Sri (2003). Artificial Intelligence (Teknik dan Ap likasiny a). Edisi p ertama, Graha Ilm u, Yogyakarta. Garcia Edel (2006), Latent Semantic Indexin g(LSI) A Fast Track Tutorial, [pdf], http://www.m iislita.com/information-retrieval-t utorial/latent-semantic-in dex in g-fasttrack-tutorial.pdf Rosario Barbara (2000), Latent Sem antic In dexing: An ov erview, [pdf], http://people.ischool. berkeley.edu/~rosario/pro jects/LSI.p df Jiang Jingqian (1997),Using Latent Sem antic In dexing for Data minin g, [p df], http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.43.8381&rep=rep1&type=pd f Murphy P. Ke vin (2006), Naive Bayes classif ier s, [p df], http://www.cs. ubc.ca/~m urphyk/Teach in g/CS340-Fall06/reading/NB.pdf Delany Jane Sarah, Cunningham Padraig (2007), k-Near st Neigh bour Classifier s, [p df], http://www.csi.ucd. ie/files/UCD- CSI-2007-4.p df Fom by Tom (2008), Naïv e Bayes Classif ier, [pdf], http://faculty.smu.edu/tfomby/eco5385 /lecture/NA%C3%8 FVE%20BAYES%20 CLAS SIFIER.p df