1 BAB I PENDAHULUAN
1.1 Latar Belakang Perkembangan teknologi internet memberikan perubahan terhadap aspek perilaku manusia termasuk cara individu berkomunikasi dan berinteraksi (Whittle, Hamilton-Giachritsis, Beech, & Collings, 2013). Komunikasi dapat dilakukan lebih efektif, mudah dan murah dengan adanya teknologi internet. Namun, manfaat dari teknologi internet disalahgunakan untuk perbuatan kriminal,salah satunya yaituonline child grooming. Menurut Child Exploitation and Online Protection, online child grooming dilaporkan sebagai aktivitas paling sering dilaporkan di UK pada tahun 20092010 (Whittle, Hamilton-Giachritsis, Beech, & Collings, 2013). Onlinechild grooming merupakanproses mendekati dan membujuk anak sebagai korbanagar bersedia melakukan aktivitas seksual dengan memanfaatkan teknologi internet. Pelaku mendekati korban untuk membangun tidak hanya hubungan seksual tetapi juga emosional (Olson, Daggs, Ellevold, & Rogers, 2007).Ketergantungan terhadap teknologi internetdalam aktivitas sehari-hari, kurangnya pengawasan orang tua terhadap aktivitas online anak, serta rasa keingintahuan anak yang besar untuk berkomunikasi dengan orang asing menjadi penyebab terjadinya online child grooming (Whittle, Hamilton-Giachritsis, Beech, & Collings, 2013). Online child grooming akan memberikan dampakkepada korban secara psikologis
dan
fisik
termasuk
1
emosi,
tingkah
laku
dan
2
psychosocial(Michalopoulos & Mavridis, 2011). Dampak tersebut,khususnya psikologis tidak dapat disembuhkan dalam waktu singkat (Michalopoulos & Mavridis, 2011). Untuk mengidentifikasi tindakan online child grooming, data percakapan teks antara korban dan pelaku menjadi sumber penting untuk menganalisis pola tindakan yang dilakukan pelaku (Kontostathis, Edwards, & Leatherman, 2010). Dengan jumlah data percakapan teks yang besar di mana rata-rata online child grooming dilakukan dalam jangka waktu 32.9 hari (Brigg, Simon, & Simonsen, 2011), proses analisis sulit akan dilakukan secara manual karena membutuhkan banyak waktu dan rentan terhadap kesalahan. Oleh karena itu diperlukan sistem yang dapat menganalisis dan mendeteksi percakapanonline child grooming secara otomatis. Dalam lima tahun terakhir terdapat beberapa penelitian terkait analisis dan deteksionline child grooming menggunakan text miningdengan melakukan klasifikasi percakapan teks.Kontostathis, Edwards, and Leatherman (2010) menggunakan k-meansclustering untuk mengidentifikasi tipe-tipe pelaku berdasarkan pola percakapan. Penelitian dilakukan Mcghee et al (2011) menggunakan ruled based approach untuk klasifikasi percakapanteks ke dalam kategori strategi pelaku dalam melakukan online child grooming. Penelitian dilakukan oleh Pandey, Klapaftis dan Manandhar (2012) menggunakan Support Vector Machine (SVM) untuk mendeteksi online child grooming pada percakapan teks. Kemudian, penelitian dilakukan oleh Pranoto, Gunawan dan Seowito (2015) yang mengidentifikasi dua puluh karakteristik online child
3
grooming pada percakapan teks dan membangunmodellogistic regression untuk mendeteksi online child grooming pada percakapan teks. Terdapat berbagai metode klasifikasi khususnya teks. Berdasarkan penelitian yang telah dilakukan (Khan, Baharudin, Lee, & Khan, 2010), SVM merupakan metode yang menghasilkan tingkat akurasi yang baik. Selain itu, banyak penelitian menggunakan SVM untuk klasifikasi lainnya seperti menentukan penyakit corona artery(Babaoglu, Findik, & Ülker, 2010), klasifikasi kondisi kanker payudara(Acharya, Ng, Tan, & Sree, 2012), serta Intrusion Detection System(Horng, et al., 2011). Atas dasar tersebut akan dilakukan penelitian untuk mendeteksi online child grooming pada percakapan teks menggunakan metode text miningdengan mengembangkan penelitian sebelumnya dari Pranoto, Gunawan dan Seowito (2015). Penelitian dilakukan dengan mengidentifikasi karakteristik online child pada percakapan serta melakukan klasifikasi menggunakan metode SVM dan metode lainnya untuk perbandingan.
1.2 Perumusan Masalah Secara umum, pertanyaan yang dapat dijawab setelah penelitian ini selesai dilakukan adalah sebagai berikut: 1. Bagaimanatext mining dapat mendeteksi percakapanonline child grooming pada percakapan teks? 2. Bagaimana menentukan karakteristik-karakteristik online child grooming yang akan digunakan untuk penelitian ini?
4
3. Bagaimanamengindentifikasi
karakteristik-karakteristik
online
child
grooming yang terdapatpada percakapanteks? 4. Metode mana yang menghasilkan akurasi paling baikdalamklasifikasi percakapan teks sebagai online child grooming atau bukan?
1.3 Tujuan Penelitian Berikut tujuan dari penelitian ini adalah 1. Mengembangkan penelitian sebelumnya dari Pranoto, Gunawan dan Soewito (2015) dengan meningkatkan akurasi dalam mendeteksi online child grooming dalam percakapan teks 2. Menentukan karakteristik-karakteristik online child grooming yang tepat untuk mendeteksi online child grooming pada percakapan teks. 3. Mengidentifikasi karakteristik online child grooming yang terdapat pada percakapan teks.
1.4 Manfaat Penelitian Adapun manfaat yang didapat dari penelitian ini adalah: 1. Dapat digunakan sebagai alat bantu dalammendeteksipercakapanonline child grooming secara otomatis. 2. Mengetahui karakteristik online child grooming yang terdapat pada percakapan teks. 3. Dari karakteristikonline child grooming yang telah ditentukandapat diketahui ada tidaknya karakteristik yang tidak memberikan kontribusiatau
5
pengaruh yang signifikan dalam menentukan hasil klasifikasi percakapan teks.
1.5 Ruang Lingkup Ruang lingkup dari penelitian ini melingkupi: 1. Dokumen yang digunakan untuk penelitian adalah percakapan teks yang diambil dari www.perverted-justice.com untuk percakapan online child grooming dan www.literotika.com untuk percakapan non online child grooming. 2. ProsesklasifikasidilakukanpadadokumenberbahasaInggris. 3. Karakteristikonline child grooming yang diidentifikasi pada percakapan yaitu 17karakteristik yang telah ditentukan berdasarkan proses online child grooming menurut Gupta, Kumaraguru, dan Ashish (2014). 4. Klasifikasi yang dilakukan yaitu klasifikasibiner (online chid grooming atau non online chid grooming) 5. Metode klasifikasi yang digunakan dalam penelitian yaitu SVM, k-Nearest Neighbor (kNN) dan berdasarkan jumlah karakteristik grooming yang terdapat pada dokumen.