BAB I PENDAHULUAN
1.1 Latar Belakang Seiring dengan berkembangnya teknologi berkembang berbagai macam konten beserta berbagai macam pemanfaatannya. Tidak semua konten bernilai positif, namun banyak berkembang pula konten bermuatan negatif. Oleh sebab itu Pemerintah Indonesia berupaya untuk menanggulangi berkembangnya konten negatif melalui Peraturan Menteri Komunikasi dan Informatika (Permenkominfo) Republik Indonesia Nomor 19 Tahun 2014 tentang Penanganan Situs Internet Bermuatan Negatif [1]. Pada Permenkominfo No. 19 Tahun 2014 [1] pada pasal 4 memberikan definisi yang jelas mengenai konten negatif yakni situs internet yang mengandung : a) pornografi, b) kegiatan illegal berdasarkan peraturan perundang-undangan, c) kegiatan illegal lainya yang pelaporannya berasal dari Kementrian atau lembaga Pemerintah yang berwenang. Kemudian dijelaskan pada pasal 10 pada Permenkominfo No.19 Tahun 2014 [1], tentang pelaporan kegiatan illegal yang bersifat mendesak, apabila menyangkut : a) privasi, b) pornografi anak, c) kekerasan, d) suku, agama, ras dan antargolongan (SARA), dan/ atau, e) muatan lainnya yang berdampak negatif yang menjadi keresahan masyarakat luas. Berdasarkan penjelasan pada pasal 4 Permenkominfo No.14 Tahun 2014 [1] telah dijelaskan bahwa konten negatif adalah pornografi, kemudian kegiatan ilegal sesuai perundangundangan (contohnya kejahatan transaksi elektronik, melanggar UU No. 11 Tahun 2008 [2]
tentang Informasi dan Transaksi Elektronik), serta
kegiatan ilegal yang dilaporkan pada
Pemerintah, terutama yang bersifat mendesak yang dijelaskan pada pasal 10 Permenkominfo No. 14 Tahun 2014. Pada penjelasan tersebut, pornografi diletakkan pada definisi pertama tentang konten negatif. Pornografi sangatlah merusak masyarakat, terlebih pada generasi muda. Peraturan Menteri tersebut menegaskan kembali dua landasan hokum yang telah dimuat sebelumnya yakni UU No. 11 Tahun 2008 tentang Informasi dan Transaksi Elektronik, yang melarang peredaran dokumen yang bermuatan pelanggaran norma kesusilaan, serta UU No. 44 Tahun 2008 yang secara khusus membahas pornografi. Definisi pornografi menurut UU No. 44 Tahun 2008 adalah gambar sketsa, ilustrasi, foto, tulisan, suara, bunyi, gambar bergerak, animasi, kartun, percakapan, gerak tubuh, atau bentuk pesan lainnya melalui berbagai bentuk media komunikasi dan/atau pertunjukan dimuka umum, yang membuat kecabulan atau eksploitasi seksual yang melanggar norma kesusilaan dalam masyarakat [3]. Pengertian yang sama juga dimuat dalam Kamus Besar Bahasa Indonesia (KBBI), pornografi adalah pengembaran tingkah laku secara erotis dengan lukisan atau tulisan untuk membangkitkan nafsu birahi, bahan bacaan yang dengan segaja dan semata- mata dirancang untuk membangkitkan nafsu birahi seks [2]. Berkembangnya pornografi menjadi sebuah industri di era modern ini telah menimbulkan banyaknya konten negatif internet berupa pornografi, baik itu berupa gambar, teks, maupun suara. Pemerintah harus dapat membendung konten bermuatan pornografi demi menyelamatkan generasi penerus, dari bahaya laten pornografi yang merusak bangsa terutama generasi muda. Pemerintah mengeluarkan UU No.44 Tahun 2008 tentang Pornografi yang mendeskripsikan secara detail muatan pornografi yang dilarang [3], namun implementasi di lapangan masih belum terlihat nyata. Usaha pemerintah untuk memblok situs porno baru dengan menggunakan DNS yang sifatnya statis dan bukan merupakan filter cerdas yang dapat mengenali konten dari halaman web [4]. Oleh sebab itu dibutuhkan teknologi yang mampu untuk mengenali konten secara cerdas khususya melalui pengolahan citra untuk dapat mengklasifikasikan citra porno dan non porno. Klasifikasi citra porno dapat dibagi menjadi 2 jenis metode. Fitur jenis pertama adalah operasi deteksi bagian tubuh seperti dada, wajah dan kelamin [3][4][5][6][7], sedangkan metode kedua adalah berbasis kulit [3][7][8][9][10][11]. Metode yang berbasis deteksi bentuk, sifatnya
kaku karena bentuk polanya harus sama, menghadap kedeepan dan mempunyai toleransi kemiringan yang sedikit, sehingga kurang baik digunakan untuk teknik penapis konten porno. Sedangkan metode berbasis kulit lebih banyak diaplikasikan sebagai basis metode untuk penapis konten negatif (pornografi). Metode berbasis kulit diawali dengan segmentasi kulit untuk mendapatkan fitur yang akan digunakan untuk klasifikasi porno dan non porno. . Permasalahan pada segmentasi kulit adalah masalah intensitas cahaya [5] dan citra nonkulit [5][13] yang memiliki warna sama seperti kulit. Permasalahan pencahayaan dapat menciptakan area gelap dan area terang, sedangkan pada citra digital perubahan intensitas cahaya dapat merubah warna yang dapat menyebabkan kesalahan segmentasi kulit [5][13][15]. Dengan demikian dibutuhkan teknik untuk dapat memperbaiki citra (preprocessing) untuk menghindari kesalahan segmentasi kulit akibat masalah intensitas cahaya. Permasalahan pada kesalahan hasil segmentasi kulit pada citra non kulit yang memiliki warna seperti kulit, seperti binatang, kayu dan pasir [5][13][16], Hal ini terjadi karena hanya digunakan segmentasi warna saja, maka dibutuhkan ciri lain untuk membedakan objek kulit dengan non kulit. Setelah proses segmentasi kulit berhasil, permasalahan berikutnya adalah pemilihan fitur untuk klasifikasi porno dan non porno [7]-[15]. Permasalahan pertama kebanyakan metode menggunakan anggapan bahwa semua citra porno mempunyai proporsi area yang besar terhadap seluruh citra [8][13][15] atau semua objek porno pasti berada di zona pusat/ tengah citra [7][15], misalnya seorang model telanjang/ berbikini menawarkan sebuah iklan. Tentu model hanya berapa bagian dari proporsi iklan yang ada, dan tidak ada jaminan bahwa model akan berpose di tengah citra, mungkin di sisi pinggir citra atau di sisi bawah atau atas. Oleh sebab itu dibutuhkan fitur klasifikasi citra porno berbasis lokalisasi citra [12]. Permasalahan kedua adalah citra yang memiliki proporsi kulit yang besar terhadap area citra adalah citra porno, misalnya citra close up wajah yang memiliki proporsi area wajah yang besar dibandingkan keseluruhan citra [7][8][15]. Dibutuhkan fitur yang mampu untuk dapat mengklasifikasi citra porno dan non porno dengan tantangan kedua masalah tersebut.
1.2 Perumusan Masalah a. Penyaringan konten berbasis segmentasi kulit memiliki kelemahan terhadap benda non kulit yang memiliki warna mirip kulit. b. Hasil segmentasi kulit terpengaruh dengan perubahaan intensitas cahaya.
c. Pada foto close up, memiliki proporsi area kulit yang luas, namun bukan termasuk citra porno. d. Tidak semua citra porno mempunyai rasio area yang besar terhadap area seluruh citra, dan tidak semua citra porno terfokus pada bagian tengah citra.
1.3 Keaslian Penelitian Studi ini telah diawali dengan review (ulasan) paper yang difokuskan pada beberapa metode dan teknik untuk penyaringan konten negatif (porno). Berikut ini adalah perbandingan antara penelitian yang dilakukan penulis dengan penelitian lain sebelumnya. Keaslian penelitian disini adalah untuk dapat menunjukkan letak perbedaan penelitian antara penelitian ini dengan penelitian sebelumnya. Keaslian penelitian ditunjukkan pada Tabel 1.1.
Tabel 1.1 Keaslian Penelitian
No. Nama 1. Putro dan Adji [5]
2.
Efendi, dkk [6]
Tujuan Penelitian Menapis konten porno berdasarkan deteksi wajah dan segmentasi kulit
Menapis konten porno dengan mendeteksi alat vital 3. Sukaridhoto, dkk Menapis konten [7] porno dengan mendeteksi alat vital dan mensegmentasi kulit 4. Wang,dkk [8] Menapis konten porno dengan deteksi putting 5. Karavarmnsamis, Mengklasifikasi dkk [9] konten porno dengan rasio area kulit terhadap rasio area lokalisasi kulit. 6 Kuo,dkk [10] Klasifikasi konten porno dengan No. Nama Tujuan Penelitian pendekatan 7. Zuo,dkk [11] Klasifikasi segmentasi konten kulit dan porno deteksidengan tekstur menggunakan deteksi
Metode yang digunakan Viola Jones untuk mendeteksi wajah, HSV untuk segmentasi kulit, dan klasifikasi dengan menggunakan rasio area kulit/ area citra keseluruhan. Linier Vector Quantification untuk mendeteksi bagian vital (porno), seperti payudara, vagina. Menggunakan Deteksi Haar dan segmentasi kulit untuk dapat mendeteksi objek vital negatif.
Tabel 1.1
Mendeteksi putting dengan Viola Jones Segmentasi Kulit dengan YCbCr , Lokalisasi dengan Convex Hull, Klasifikasi dengan Decision Tree.
Keaslia n Peneliti an (lanjuta n)
Deteksi wajah dengan Viola Jones, Segmentasi Kulit dengan threshold Metode yangnilai digunakan adaptif dari chromatic, deteksi Viola Jones untuk deteksi objek tekstur dengan coarseness vital, Segmentasi Kulit dengan YCbCr.
bagian vital dan deteksi kulit.
8.
9.
Bassilio,dkk [12]
Santos, dkk [13]
Klasifikasi konten porno dengan segmentasi kulit dan rasio kulit terhadap citra seluruhnya Klasifikasi konten porno dengan menggunakan pendekatan segmentasi kulit, tekstur dan scoring.
Klasifikasi dilakukan dengan scoring objek porno terdeteksi, rasio area kulit wajah terhadap area kulit yang lain, area kulit terhadap area citra seluruhnya. Segmentasi Kulit dengan YCbCr
Berdasa rkan pada Tabel
Segmentasi kulit dengan YCbCr, Pengenalan Tekstur dengan GLCM dengan klasifikasi LDA (Linier Discriminant Analisys dan scoring dengan menggunakan jarak pusat kontur dengan titik pusat citra.
1.1, dapat dilihat perband ingan
keaslian penelitian ini dibandingkan dengan penelitian sebelumnya. Putro dan Adji [5] meneliti tentang penapis konten negatif berbasis deteksi wajah berbasis Viola Jones dan segmentasi kulit dengan menggunakan HSV. Klasifikasi porno dilakukan dengan membandingkan rasio kulit wajah dan area kulit lain, serta jarak antara titik tengah citra dengan titik tengah dari kontur area kulit tersegmentasi. Kelebihan penelitian ini adalah dapat mengklasifikasi citra porno dengan bantuan deteksi wajah, segmentasi kulit dan posisi titik tengah kontur area terhadap titik tengah citra. Kelemahan dari metode ini adalah tidak ada lokalisasi untuk menghitung rasio citra area dan penelitian dibatasi hanya pada citra yang menghadap ke depan saja. Effendi dan Ahmad [6] meneliti tentang penapis konten negatif berbasis deteksi Linier Vector Quantization untuk dapat mendeteksi bagian tubuh manusia yang porno, seperti payudara dan vagina. Metode yang diusulkan hanya berorientasi deteksi bagian tubuh, sehingga penelitian dibatasi pada deteksi bagian tubuh tampak depan dan tegak. Sedangkan Sukaridhoto,dkk [7] meneliti tentang penapis konten negatif berbasis deteksi Viola Jones dan segmentasi kulit dengan YCbCr untuk mendeteksi bagian vital, seperti vagina dan payudara. Metode ini juga dibatasi pada deteksi bagian tubuh, meskipun ditambahkan deteksi kulit untuk dapat mengurangi tingkat false positive Wang, dkk [8] meneliti tentang penapis konten negatif berbasis deteksi Viola Jones dengan objek putting. Metode yang diusulkan sangat terbatas pada deteksi putting, bahkan banyak terjadi
false positif seperti di area mata dan pusar. Karavarsamis, dkk [9] mengusulkan deteksi pornograpfi dengan melokalisasi Skin ROI[9]. Untuk dapat membandingkan area skin terdeteksi dan area bagian tubuh perlu dilakukan lokalisasi Skin ROI dengan menggunakan Convex Hull. Convex Hull dapat menghubungkan komponen biner hasil deteksi kulit yang terpisah oleh suatu objek yang bukan kulit. Convex Hull dapat menyatukan beberapa segmentasi citra kulit homogen yang terpisah sebagai suatu objek. Klasifikasi porno dan tidak porno dilakukan dengan perhitungan rasio area kulit terhadap area lokalisasi dan rasio area kulit dengan keseluruhan citra. Zuo, dkk [11] mengusulkan pendeteksian citra porno dengan menggunakan klasifikasi Viola-Jones dan Skin Detection dengan YCbCr. Viola Jones dilatih untuk mendeteksi objek-objek yang dianggap porno, contohnya adalah payudara wanita, putting, dan kemaluan. Kemudian metode Viola Jones tersebut dikombinasikan dengan deteksi kulit (Skin Detection) Yakni metode YCbCr. Dengan mengkombinasikan kedua metode ini, akurasi deteksi dapat dinaikkan (False Positive atau True Negative juga dapat berkurang). Dengan kombinasi kedua metode ini didapatkan berapa parameter antara lain jumlah objek wajah, kemaluan, dan dada (puting) yang dapat dideteksi, rasio skin area pada bagian wajah dan bagian lain pada suatu frame, perbandingan skin area
dengan seluruh pixels pada frame, serta jumlah skin area yang
terdeteksi. Kemudian rasio parameter-parameter itu dilatih dengan random forest classifier. Kelemahan dari metode ini adalah tidak adanya fungsi lokalisasi untuk membantu menghitung rasio area kulit dan beberapa parameter mengacu pada deteksi objek tubuh sehingga dapat disimpulkan metode ini dibatasi pada citra yang benar-benar telanjang sehingga tidak dapat digunakan pada citra bikini. Bassilio, dkk [12] mengusulkan teknik segmentasi kulit dengan YCbCr dengan klasifikasi porno dan tidak porno berdasarkan pada rasio luas area tersegmentasi terhadap luas citra. Metode yang diusulkan sangat terbatas pada segmentasi kulit, tidak terdapat kombinasi deteksi bagian tubuh, perhitungan tekstur dan lokalisasi area kulit. Sehingga penerapan metode yang diusulkan sangat terbatas. Santos, dkk [13] mengusulkan teknik segmentasi kulit dengan YCbCr dan pengenalan tekstur dengan menggunakan Kombinasi Fitur dari GLCM. Klasifikasi dilakukan dengan menggunakan LDA. Pembobotan dilakukan dengan menghitung bobot kulit berdasarkan
posisinya didalam citra. Semakin ditengah/ mendekati titik tengah, maka bobot klasifikasi porno lebih besar. Penelitian ini mempunyai kelebihan yakni deteksi tekstur untuk membedakan kulit dengan benda yang berwarna mirip kulit, namun dalam klasifikasi citra porno, dilakukan dengan pembobotan titik tengah kontur kulit terhadap titik tengah citra. Metode yang diusulkan ini sangat terbatas pada citra porno yang terpusat pada gambar porno, sedangkan tidak semua citra porno terpusat di titik tengah. Penelitian yang menggabungkan teknik deteksi teksur kulit dan deteksi intensitas cahaya dilakukan oleh Kuo, dkk [10]. Penelitian yang dilakukan Kuo,dkk [10] adalah dengan mengembangkan metode deteksi kulit yang bersifat adaptif, dengan cara menggunakan deteksi wajah untuk dapat menghitung rata-rata nilai rentang kromatik warna pada wajah. Untuk mengurangi tingkat error, kemudian digunakan analisis tekstur kulit dengan menggunakan Coarseness untuk dapat mengurangi false positive, dari citra bukan kulit yang memiliki kesamaan tekstur dengan kulit. Klasifikasi porno dilakukan dengan menggunakan pendekatan parameter ratio area kulit terhadap lokalisasi area, ratio area wajah dengan area kulit yang lain untuk menghindari kesalahan pada foto closeup, serta menggunakan nilai pembobotan terhadap titik tengah citra, dimana semakin banyak area kulit yang berada di area tengah citra, maka semakin besar kemungkinan untuk diklasifikasikan sebagai citra porno. Pada penelitian diatas terdapat beberapa hal yang dapat dijadikan celah penelitian. Celah penelitian yang pertama adalah tidak ada usaha untuk menormalisasi intensitas cahaya dari masukan citra yang akan diproses. Intensitas cahaya yang tidak stabil akan menimbulkan efek gelap dan terang, dan ditangkap oleh citra digital dalam warna yang berbeda. Penelitian yang dilakukan ini menggunakan teknik preprocessing Homomorphic Filter untuk normalisasi cahaya pada citra yang mempunyai intensitas cahaya yang kurang, atau terlalu terang sehingga menimbulkan area gelap dan terang. Hal ini akan memperbaiki hasil segmentasi citra. Teknik preprocessing untuk normalisasi cahaya ini tidak terdapat pada metode yang diusulkan Putro dan Adji [5], Effendi, dkk [6], Sukaridhoto, dkk [7], Wang, dkk [8],
Karavarsamis [9], Kuo, dkk
[10], Zuo, dkk [11], Basilio, dkk [12], Santos, dkk [13]. Hal ini akan meningkatkan kemampuan penapis konten porno untuk menapis konten yang punya pencahayaan yang buruk. Celah penelitian kedua, pada penelitian ini digunakan teknik klasifikasi kulit untuk mengurangi kesalahan dalam segmentasi kulit dengan menggunakan fitur GLCM (Homogenity
dan Correlation) dengan klasifikasi SVM Linier. Hal tersebut tidak ditemui pada penelitian yang dilakukan Putro dan Adji [5], Effendi, dkk [6], Sukaridhoto, dkk [7], Wang, dkk [8], Karavarsamis [9], Zuo, dkk [11], Basilio, dkk [12]. Kuo, dkk [10] hanya menggunakan coarseness untuk klasifikasi kulit dan non kulit, sedangkan Santos, dkk [13] menggunakan fitur GLCM dengan metode klasifikasi LDA. Celah penelitian ketiga adalah klasifikasi porno dilakukan dengan lokalisasi dengan menggunakan bantuan deteksi wajah (Viola-Jones). Berbeda dengan yang dilakukan Karavarsamis, dkk [8], pada penelitian ini terdapat 2 macam rule (aturan), jika terdeteksi wajah maka area kulit adalah area kulit seluruhnya akan dikurangi dengan area kulit wajah, jika tidak terdeteksi wajah area kulit adalah area kulit seluruhnya. Fitur klasifikasi adalah rasio area kulit terhadap area lokalisasi Convex Hull dan rasio area kulit terhadap area citra keseluruhan. Oleh sebab itu prosentase rasio pada rule tidak terdeteksi wajah lebih besar daripada rule terdeteksi wajah karena tidak dikurangi dengan area wajah. Oleh sebab itu tiap rule diklasifikasikan dengan SVM Linier masing-masing, tiap rule memiliki attribute batas klasifikasi porno dan non porno masing-masing. Pada penelitian yang dilakukan Karavarsamis, dkk [8], dilakukan tanpa deteksi wajah. Sehingga fitur klasifikasi adalah rasio area kulit terhadap area lokalisasi Convex Hull dan rasio area kulit terhadap area citra keseluruhan, fitur kemudian diklasifikasikan dengan Decision Tree. Lokalisasi area kulit pada citra ini tidak ditemukan pada penelitian yang dilakukan Putro dan Adji [5], Effendi, dkk [6], Sukaridhoto, dkk [7], Wang, dkk [8], Zuo, dkk [11], Basilio, dkk
[12] yang menggunakan perbandingan area kulit tersegmentasi dengan area keseluruhan. Berbeda juga dengan penelitian yang dilakukan Kuo, dkk [10] dan Santos, dkk [13] yang menggunakan jarak pusat kontur citra terhadap titik tengah citra. Sebagai ringkasan, penelitian ini memberikan tiga kontribusi yakni : 1.
Normalisasi Citra dengan Homomorphic Filtering.
2.
Pengambilan fitur tekstur kulit dengan GLCM (Homogenity dan Correlation), dan klasifikasi kulit dengan SVM Linier.
3.
Pengambilan fitur untuk klasifikasi porno dengan fitur rasio area kulit terhadap area lokalisasi dan rasio area kulit terhadap area keseluruhan citra. Pengambilan fitur dilakukan dengan rule terdeteksi wajah dan tidak terdeteksi wajah. Jika terdeteksi wajah
maka area kulit adalah area kulit keseluruhan dikurangi wajah, jika tidak terdeteksi wajah maka area kulit adalah area kulit seluruhnya. Tiap rule diklasifikasikan dengan SVM Linier, dan tiap rule memiliki atribut batas klasifikasi porno dan non porno masingmasing.
1.4 Manfaat Penelitian Hasil dari penelitian ini diharapkan dapat memberi manfaat, diantaranya adalah sebagai berikut : a. Mengenali konten secara cerdas menggunakan pengolahan citra untuk dapat memblok akses terhadap konten negatif internet b. Sebagai upaya nyata dalam mendukung UU anti Pornografi, demi menyelematkan bangsa dari bahaya laten pornografi, terlebih pada generasi muda. c. Sebagai pengembangan metode untuk dapat mengenali konten negatif internet dengan menggunakan pendekatan deteksi warna dan kontur kulit serta dibantu dengan deteksi wajah. d. Hasil penelitian dapat dijadikan sebagai referensi khususnya pada penelitian-penelitian dengan topik Content Filtering dengan pendekatan deteksi kulit.
1.5 Tujuan penelitian Tujuan dari penelitian ini adalah mengembangkan model sistem deteksi, klasifikasi dan penapis konten negatif (pornografi) berdasarkan deteksi citra yang dapat menapis konten negatif secara otomatis, dalam kondisi pencahayaan yang cukup maupun gelap sehingga dapat bekerja secara efektif untuk menapis citra porno.
1.6 Batasan Masalah Dari rumusan masalah tersebut di atas, maka dalam penelitian ini hanya dibatasi pada permasalahan-permasalahan sebagai berikut : a. Bahan uji sampel adalah berasal dari pihak ketiga yang penulis dapatkan dengan mendownload gambar di internet. b. Citra adalah berupa image statis, bukan berupa video. c. Citra adalah citra natural yang belum pernah diedit ataupun diberi efek, dengan software pengolah citra.
d. Citra yang akan diujicoba tidak terdapat 2 macam klasifikasi data. Contoh pada klasifikasi kulit tidak boleh terdapat 2 objek secara langsung yaitu objek kulit dan objek bukan kulit (mirip warna kulit). e. Citra yang diolah bukan hasil rekayasa/ photo edit, namun murni merupakan asli hasil dari capture devices.