3 BAB I PENDAHULUAN
1.1. Latar Belakang Semakin banyaknya pengunaan teknologi informasi pada pemerintahan, dapat mempermudah masyarakat dalam pelayanan masyarakat itu sendiri. Seperti misalnya ketika sesorang ingin mencari tahu tentang undang-undang yang diperlukan atau berita tertentu yang ada pada web pemerintahan, maka, orang tersebut mencari pada mesin pencari. Namun, tidak semua situs pemerintahan tersebut rajin mengunggah informasi penting yang dibutuhkan oleh masyarakat. Ada pula situs pemerintahan yang mengunggah informasi penting tetapi sangat jarang dilakukan, ada pula situs pemerintahan yang rajin mengunggah informasi tetapi informasi yang diberikan cenderung bukanlah informasi yang diperlukan oleh masyarakat, dan ada juga situs yang isi didalamnya kosong. Untuk itulah dibuatkannya Sistem klasifikasi reporting berita pada pemerintahan untuk dapat mengetahui seberapa sering suatu situs pemerintahan tersebut mengunggah berita atau informasi yang diperuntukan untuk masyarakat nantinya. Dengan ada reporting berita ini, diharapkan nantinya situs-situs yang lain dapat melihat seberapa banyak berita yang sudah di unggah oleh seluruh SKPD sesuai dengan katagori yang ada. Klasifikasi reporting berita dengan menggunakan metode Naïve Bayes merupakan salah satu metode machine learning yang menggunakan perhitungan probabilitas. Konsep dasar yang digunakan oleh Naïve bayes adalah Teorema Bayes, yaitu teorema yang digunakan dalam statistika untuk menghitung suatu peluang. Bayes Optimal Classifier menghitung peluang dari satu kelas dari masing-masing kelompok atribut yang ada sehingga dapat menentukan kelas mana yang paling optimal. Beberapa pengujian telah dilakukan menggunakan metode Naive Bayes itu sendiri diantaranya Klasifikasi Teks Dengan Naïve Bayes Classifier (NBC) Untuk Pengelompokan Teks Berita Dan Abstract Akademis (Amir Hamzah, 2012) yang menggunakan 1000 dokumen berita dan 450 dokumen abstrak dengan hasil
3 persentase maksimal 91%. Klasifikasi Konten Berita Dengan Metode Text Mining (Bambang K, Syahril E,dan Opim Salim S, 2012) yang menggunakan 100 berita disetiap kategori, dimana 90 berita digunakan untuk proses training dan 10 berita digunakan untuk proses testing dengan menunjukan bahwa berita testing bisa terklasifikasi secara otomatis seluruhnya. Klasifikasi Dokumen Teks Berbahasa Indonesia Dengan Menggunakan Naive Bayes (Joko S, Surya S, Mochamad H, 2009) dengan hasil dari dokumen training yang mencapai 83,57% dan terus meningkat hingga 87.63%.
1.2. Rumusan Masalah Berdasarkan dengan latar belakang yang telah dijelaskan di atas, maka dapat dirumuskan sebuah pokok permasalahan, yaitu 1. Bagaimana nantinya metode Naive Bayesian ini dapat diterapkan pada Sistem klasifikasi reporting berita pada pemerintahan? 2. Bagaimana
merancang
Sistem klasifikasi reporting berita pada
pemerintahan menggunakan metode Naive Bayesian?
1.3. Tujuan Penelitian Tujuan dilakukannya penelitian ini adalah: 1. Memberikan informasi kepada admin website portal tentang kelompok atau klasifikasi berita yang diunggah oleh dinas, sebagai alat bantu mempercepat penilaian kinerja SKPD dalam memberikan informasi publik melalui website subdomain. 2. Mengetahui kinerja dari Naive Bayes dalam melakukan klasifikasi berita.
1.4. Batasan Masalah Adapun batasan masalah dari penelitian ini adalah: 1. Data yang digunakan dalam penelitian ini adalah berita-berita yang diunggah pada 42 situs SKPD di Bali. 2. Berita-berita yang ada di atur berdasarkan enam kelas yang telah ditentukan.
3 3. Database yang digunakan dalam penelitian ini adalah database milik SKPD Bali
1.5. Manfaat Penelitian Adapun manfaat
dari Sistem klasifikasi berita pada pemerintahan
menggunakan metode Naive Bayes adalah 1. Dapat meningkatkan pelayanan pemerintahan bagi masyarakat. 2. Dapat mengetahui SKPD mana yang memiliki tingkat keaktifan yang tinggi dan seberapa penting berita yang diunggah.
1.6. Metodelogi Penelitian Pada metodologi penelitian ini akan mejelaskan mengenai apa saja langkahlangkah yang akan dilakukan dalam pembuatan Sistem Klasifikasi Reporting Berita Pada Pemerintahan. 1.6.1. Desain Penelitian Desain dari penelitian ini menggunakan judul “Sistem Klasifikasi Reporting Berita Pada Pemerintahan” yang dimana penelitian ini mengambil situs resmi dari SKPD Bali. Pembangunan sistem ini akan dilakukan pada sistem yang sudah ada sebelumnya dengan menggunakan basis web. Data yang digunakan adalah data-data dari sistem SKPD itu sendiri. Terdapat enam kelas yang akan digunakan nantinya seperti: layanan publik, peraturan dan perundang-undangan, kegiatan, anggaran dinas, informasi umum, dan tata cara / SOP. Data-data tersebut kemudian akan diberikan label agar dapat disesuaikan dengan kelas yang ada agar dapat dilakukannya reporting. Dilakukan pula pengamatan dari hasil klasifikasi yang dilakukan, apakah hasil yang diberikan sudah sesuai dengan yang diharapakan. Yang dilakukan pada tahapan ini: a. Mengumpulkan data-data pada situs-situs resmi SKPD di Bali. b. Menganalisis kebutuhan Sistem klasifikasi reporting berita, baik dari segi functional, non-functional maupun kebutuhan yang lainnya. c. Menentukan hasil output dari Sistem klasifikasi reporting berita tersebut kedalam kelas-kelas yang sudah ditentukan sebelumnya.
4 Untuk gambaran dari sistem yang akan dibuat bisa dilihat dari flowchart berikut ini: Hitung jumlah probabilitas
Mulai
Lihat Grafik
Y Input berita
Y
Case folding, tokenizing, stopwords, filtering, stemming
Bandingkan hasil dengan setiap kategori
Tentukan Kategori Berita
Input SKPD dan Kategori
Tampilkan Grafik T
Hitung klasifikasi berita
Tambahkan Kategori
T
selesai
Gambar 1. 1 Flowchart Sistem KlasifikasiReproting Berita 1.6.2. Pengumpulan Data Dalam penelitian ini, data diperoleh dari situs SKPD bali dengan mengakses situs tersebut. Terdapat sekitar 42 SKDP di Bali yang nantinya akan diambil beritanya. Dalam setiap SKPD ini terdapat beberapa konten seperti pengumuman, berita utama, berita lain dan informasi. Berita-berita ini lah yang nantinya akan diklasifikasikan kedalam enam kelas yang telah ditentukan sebelumnya, enam kelas tersebut yaitu: a. Layanan Publik b. Produk Hukum c. Kegiatan Pemerintahan
5 d. Anggaran Dinas e. Informasi Umum f. Tata Cara / SOP Kemudian berita-berita yang telah dikumpulkan tersebut akan dibagi menjadi dua, yaitu berita-berita untuk data training dan berita-berita untuk data uji. 1.6.3. Pengolahan Data Awal Proses selanjutnya yang dilakukan setalah mendapatkan data yang terkait dengan penelitan adalah pengolahan data awal. Pengolahan data awal ini ditujukan untuk dapat mempersiapkan pada proses klasifikasi nantinya. Beberapa tahapan awal yang dilakukan dalam sistem: 1. Pembagian Data Pada tahap pembagian data ini, data yang telah diperoleh sebelumnya akan dibagi menjadi dua kelompok data yaitu kelompok data untuk data training dan kelompok data untuk data set. Pada data training dan data set ini nantinya akan diberikan label yang sesuai dengan enam kelas yang sudah disebutkan sebelumnya. 2. Case Folding dan Tokenizing Pada tahapan ini berita yang telah terkumpul setelah dibagi dan diberikan label sesuai kelanya, maka langkah selanjutnya adalah berita tersebut secara keseluruhan akan dirubah kedalam huruf kecil, dibuang tanda baca yang terdapat pada berita tersebut dan kemudian dipotong perkata pada setiap penyusunan kalimat pada berita tersebut. 3. Stop-word Pada tahapan ini kata-kata yang sering kali hadir di dalam dokumen yang tergolong tidak berhubungan dengan subyek utama dari database akan dihilangkan atau dihapus, seperti misalnya “itu”, “ke”, “yang”, “dan”, “atau” dan yang lainnya. 4. Stemming Tahapan ini adalah tahapan terakhir dalam pengolahan data awal, yang dimana pada tahapan ini kata-kata yang sudah dipisah, dihilangkan tanda bacanya, dan kemudian dihapus kata-kata yang tidak berhubungan dengan subyek utama tersebut akan dihilangkan semua imbuhannya, baik yang
6 terdiri dari awalan (prefix), akhiran (surfix), sisipan (infix), bentuk perulangan dan kombinasi antara awalan dan akhiran (confix).
1.6.4. Metode yang Digunakan Sistem klasifikasi reporting berita ini menggunakan metode Naive Bayes untuk dapat mengetahui suatu berita tersebut termasuk kedalam kelas-kelas yang ada. Selain itu juga digunakan text mining dalam menentukan inti dari judul berita tersebut sehingga memudahkan kerja metode Naive Bayes dalam menetukan dan memberikan label kelas yang sesuai. Penggunaan Naive Bayes ini desuaikan dengan persamaan bayes dimana seperti pada persamaan (4) dengan asumsi bahwa tidak adanya hubungan antara satu kata dengan kata yang lainnya. Namun, tidak semua kata dapat diasumsikan bahwa antara satu kata dengan kata lainnya tidak memiliki hubungan karena kata-kata yang bersifat individual tergolong jarang. Untuk dapat mengatasi hal tersebut dilakukanlah proses training sehingga nantinya kita dapat mengestimasikan probabilitas suatu kalimat berita itu termasuk kelas yang mana serta dapat menghitung seberapa sering data tersebut muncul. Sehingga untuk dapat menyelesaikan permasalahan tersebut dapat digunakan persamaan : 𝑗𝑢𝑚𝑙𝑎 ℎ 𝑡𝑖𝑎𝑝 𝑘𝑎𝑡𝑒𝑔𝑜𝑟𝑖 𝑘𝑒𝑙𝑎𝑠
P(berita) = 𝑗𝑢𝑚𝑙𝑎 ℎ 𝑑𝑎𝑡𝑎
𝑦𝑎𝑛𝑔 𝑑𝑖𝑔𝑢𝑛𝑎𝑘𝑎𝑛
................................ (1)
atau 𝑗𝑢𝑚𝑙𝑎 ℎ 𝑘𝑒𝑚𝑢𝑛𝑐𝑢𝑙𝑎𝑛 𝑘𝑎𝑡𝑎 𝑑𝑎𝑙𝑎𝑚 𝑘𝑒𝑙𝑎𝑠 +1
P(berita|kata)=𝑗𝑢𝑚𝑙𝑎 ℎ 𝑠𝑒𝑚𝑢𝑎
𝑘𝑎𝑡𝑎 𝑑𝑎𝑙𝑎𝑚 𝑘𝑒𝑙𝑎𝑠 +𝑗𝑢𝑚𝑙𝑎 ℎ 𝑠𝑒𝑚𝑢𝑎 𝑘𝑎𝑡𝑎
............ (2)
Penambahan angka 1 dan juga jumlah semua dari semua token biasa disebut add one yang berfungsi untuk menanggulangi jika terdapat suatu kalimat yang mengandung token tak terdefinisikan yang dapat menghasilkan probabilitas bernilai 0 dan tidak bisa diklasifikasikan. 1.6.5. Eksperimen dan Pengujian Dalam membangun Sistem Klasifikasi Reporting Berita Pada Pemerintahan ini menggunakan model proses perangkat lunak SDLC dengan model Waterfall. Berikut merupakan tahapan – tahapan yang akan dilakukan pada model proses Waterfall yaitu:
1. Requirements analysis and definition Pada tahap ini akan dilakukan konsultasi dengan admin dari SKPD Bali mengenai sistem reporting berita yang diinginkan dengan mencatat setiap kebutuhan dan keinginan dari admin tersebut. 2. System and software design Pada tahapan ini, peneliti akanmembuat diagram aliran data pada sistem, merancang antar muka, dan lain-lain dengan menggunakan DFD yang dapat menggambarkan abstraksi dari system tersebut sehingga nantinya sistem tersebut dapat dimengerti oleh pengguna kedepannya. 3. Implementation and unit testing Pada tahap ini, peneliti akan mengimplementasikan perancangan perangkat lunak yang sudah dibuat ke dalam bahasa pemrograman seperti PHP dan Java Script dengan menggunakan metodeNaive Bayes dan basis data serverMySQL. Lalu, pada tiap-tiap fungsi yang ada pada sistem tersebut akan diuji untuk megetahui apakah sistem tersebut sudah memberikan hasil / output yang sesuai. 4. Integration and system testing Tahapan ini, program yang telah dibuat kemudian secara keseluruhan akan diuji sebagai sistem yang lengkap agar dapat memastikan bahwa semua persyaratan perangkat lunak telah dipenuhi dan sesuai dengan keinginan pengguna. Pengujian yang digunakan disini berupa blackbox testing dan pengujian akurasi. 5. Operation and maintenance Pada tahap ini, jika terdapat kesalahan atau kekurangan pada system yang tidak ditemukan pada awal tahap siklusakan dilakukan pemeliharaan dan dipebaiki dan juga akan dilakukan pengembangan sistem seperti penambahan fitur dan fungsi baru.
1.6.6. Evaluasi dan Validasi Hasil Pada tahap evaluasi dan validasi hasil ini dilakukan dengan dua cara, yaitu untuk evaluasi dengan menggunakan pengujian blackbox dan untuk validasi hasil menggunakan pengujian akurasi. Pengujian yang dilakukan pada sistem ini adalahuntuk menguji sistem apakah sistem yang telah dibuat mampu melakukan pengelompokan pesan kedalam kelas-kelas yang telah ditentukan sehingga dapat melakukan reporting disetiap bulannya serta mengukur kinerja dari sistem reporting ini apakah sudah sesuai dengan yang diinginkan atau tidak.
a. White Box Testing Pengujian Whiteboxmerupakan metode desain uji kasus yang menggunakan struktur kontrol dari desain proseduraldengan memeriksa kode sumber dari sistem yang dibuat yang terdapat baris-baris kode yang beragam,
dapat
berupa
suatu
seleksi
kondisi,
perulangan
untuk
menghasilkan kasus-kasus uji. Adapun metode yang digunakan dalam pengujian white box ini adalahmetode basis path. Metode basis path memungkinkanperancang kasus uji untuk mendapatkan perkiraan logic yang kompleks dari desain prosedural danmenggunakan perkiraan ini untuk mendefenisikan aliran eksekusi.Adapun rancangan tahapan pengujian dengan basis path yaitu, 1. Mengubah pseudocode Algoritma Genetika menjadi flowchart kemudian menjadi flow graphsehingga menggambarkanalur dari algoritma. 2. Dariflow graph, dapat dihitung cyclomatic complexity, yakni : V(G) = Jumlah Busur – Jumlah simpul + 2 3. Berdasarkan jumlah Cyclomatic Complexitymaka dapat dibuat jalur (path) pengujian sesuai flow graph.
b. Black Box Testing Perhatian utama dalam pengujian blackbox fungsionalitas program yang sering disebut functional testing, yaitu sebuah metode pengujian yang fokus pada eksekusi fungsi dalam program dan mengamati data input sesuai dengan output. Pengujian blackbox dilakukan dengan melihat hasil dari eksekusi sistem dengan pengujian hak akses user, pengujian data seperti penambahan berita, menampilkan berita sesuai dengan kelasnya, penghapusan berita dan yang lainnya. c. Pengujian Akurasi Pengujian kinerja sistem klasifikasi repoting berita yang dilakukan dengan menghitung nilai akurasi pemeriksanya. Penggujian ini nantinya akan dilakukan dengan cara menghitung data-data yang sudah memiliki label secara manual dengan hasil yang diberikan oleh sistem. 𝑃 𝑁𝐴 =
𝐷𝑎𝑡𝑎 𝑋
𝑥100% …………….......................(3)
Keterangan: P(NA) : Persentase nilai akurasi Data : jumlah data uji yang bernilai benar X
: total jumlah sampel
1.6.7. Jadwal Penelitian Jadwal pelaksanaan pelatihan dimaksudkan untuk dapat menyampaikan lamanya rencana peneliti untuk dapat menyelesaikan penelitiannya. Tabel 1.1 Jadwal Pengujian Minggu ke No
Kegiatan 1
1
2
3
4
5
6
Studi Literatur Analisis kebutuhan Desain Sistem Implementasi sistem Pengujian sistem Membuat Laporan TA
2
3
4
5
6
7
8
9
10
11
12