Desain Sistem Terintegrasi Analisis Persepsi Publik pada Media Sosial Berbasis Internet of Thing untuk Pendukung e-Government Studi Kasus : Badan Pusat Statistik Arie Wahyu Wijayanto Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung
[email protected]
Abstrak Tren penerapan e-government yang menjadi kunci modernisasi penyelenggaraan pemerintahan menuntut kemudahan proses, transparansi, keterbukaan data dan keterlibatan publik. Kepuasan publik terhadap kinerja pemerintah seringkali baru mencakup survei terhadap konsumen langsung dan belum menyentuh hingga ke pola interaksi dan komunikasi harian masyarakat. Penggunaan media sosial telah menjadi peluang bagi analisis persepsi (sentiment analysis) oleh publik terhadap instansi pemerintahan, misalnya Badan Pusat Statistik (BPS) sebagai penyedia data statististik. Dengan konsep internet of thing, pemanfaatan analisis persepsi pada media sosial ini dapat dirancang menjadi sistem yang terintegrasi. Pada sistem terintegrasi ini, dilakukan pengklasifikasian persepsi pada status media sosial dengan implementasi Machine Learning oleh penyedia layanan yang menggunakan beberapa metode Text Classifier, yaitu: Naive Bayes, Softmax Regression dan Max Entropy. Hasil rancangan diharapakan dapat diterapkan untuk membantu mendukung pengambilan kebijakan dalam penyediaan data yang lebih baik sebagai bagian dari inisiatif e-Government. Kata Kunci : Internet of Things, e-Government, Sentiment Analysis, Social Media.
I.
PENDAHULUAN
Inisiatif pelaksanaan E-Government telah menjadi tren modernisasi pemerintahan di berbagai negara [1]. Sebagai bagian dari rencana strategis lembaga pemerintah yang berusaha menerapkan E-Government, Badan Pusat Statistik (BPS) menetapkan beberapa tujuan pembangunan statistik, yang diantaranya yaitu meningkatkan ketersediaan data dan informasi statistik yang berkualitas serta meningkatkan pelayanan prima [2]. Masing-masing tujuan tersebut diukur dengan beberapa indikator yaitu persentase konsumen yang merasa terpenuhi kebutuhan datanya dan yang merasa puas dengan layanan BPS [2], [3]. Untuk menangkap kedua indikator tersebut telah tersedia survei yang hanya menjangkau konsumen langsung yang berkunjung atau berinteraksi langsung dengan BPS, baik melalui website, kuesioner, dsb [3], [4]. Sedangkan masyarakat umum yang tidak berinteraksi langsung dengan BPS masih belum terjangkau persepsinya.
Di sisi lain, media sosial seperti Facebook dan Twitter yang melekat pada pola komunikasi dan interaksi pada masyarakat dapat dimanfaatkan untuk analisis persepsi publik terhadap publikasi data pemerintah, sehingga pengukuran kepuasan pengguna data dapat lebih meningkat cakupannya [1], [5], [6]. Selain itu, profesionalisme kerja pimpinan yang padat dan mobile membutuhkan media pendukung kebijakan yang dapat menyertai dengan mudah di manapun berada [7]. Aplikasi mobile yang diperuntukkan bagi mobile gadget digunakan sebagai pilihan solusi untuk memenuhi kebutuhan ini. Upaya ini sekaligus untuk menunjang proses menuju penyelenggaraan e-Government pada instansi pemerintah, salah satunya di Badan Pusat Statistik. Makalah ini bertujuan untuk mendesain sistem pendukung keputusan bagi pimpinan BPS terkait penyediaan data dan publikasi statistik yang tepat sasaran dan bermanfaat luas bagi masyarakat melalui input
e-Indonesia Initiatives (eII-Forum) 2014, Institut Teknologi Bandung ICT For Smart Society | Think Ecosystem Act Convergence
analisis persepsi (sentiment analysis) masyarakat pengguna data pada media sosial. Sistem didesain dan diimplementasikan berbasiskan konsep Internet of Things. Penggunaan konsep Internet of Things dalam sistem meliputi interaksi antara aplikasi server dan aplikasi mobile serta layanan Software as a Service. Desain sistem mencakup proses bisnis, basis data dan infrastruktur yang diperlukan. Prototype sistem usulan telah dikembangkan dengan implementasi Machine Learning yang menggunakan beberapa metode Text Classifier, yaitu: Naive Bayes, Softmax Regression dan Max Entropy.
Desain mekanisme untuk mengekstraksi opini/sentimen dari internet baik forum maupun media sosial secara umum didahului dengan proses crawling, feature extraction dan feature reduction kemudian diikuti sentiment classification, seperti salah satu contoh desain yang dilakukan oleh Abbasi (2007) berikut ini :
II. TINJAUAN LITERATUR II.1 E-Government E-Government merupakan inisiatif penyelenggaraan pemerintahan dengan pemberdayaan teknologi informasi, terutama di antaranya adalah internet, sebagai wahana untuk mencapai penyelenggaraan pemerintahan yang lebih baik [5], [8]. II.2 Internet of Thing Internet of Thing merupakan paradigma yang mengusulkan bahwa objek-obejk di sekitar kita akan saling terkoneksi satu dengan yang lainnya di dalam jaringan internet, baik itu komputer, laptop, peralatan rumah tangga, industri, kesehatan, dsb [9]. Paradigma ini mengusung slogan anytime, anything, anywhere sebagai visi komunikasi antar perangkat atau objek tersebut [9], [10]. Di antara beberapa perkembangan kunci pada aplikasi IoT adalah intelligent analytics [9], yang mana hal ini dapat diaplikasikan pada sistem analisis sentimen otomatis.
Gambar 1. Contoh desain analisis persepsi [13] II.3 Naive Bayes Naive Bayes merupakan salah satu algoritma klasifikasi dalam data mining yang bekerja sangat efektif pada berbagai dataset, terutama bila dikombinasikan dengan beberapa prosedur seleksi atribut [14]. Algoritma klasifikasi ini mengasumsikan bahwa efek dari nilai atribut pada kelas tertentu independen dari nilai-nilai atribut lainnya, yang dilakukan untuk menyederhanakan perhitungan yang terlibat [15].
II.3 Analisis Persepsi (Sentiment Analysis) Analisis persepsi atau dikenal juga sebagai Opinion mining merupakan proses pengklasifikasian polaritas dari sebuah korpus tekstual (dokumen, kalimat, dsb) sebagai pesan positif, negatif atau netral tergantung pesan yang disampaikan [11], [12]. Analisis sentimen ini seringkali bukan merupakan tugas yang mudah karena dalam satu pesan dapat berisi sejumlah informasi yang secara bersamaan membawa perasaan positif dan negatif dari pengirimnya [11].
III. DESAIN SISTEM TERINTEGRASI II.1 Model Bisnis Perancangan sistem terintegrasi ini dilakukan dengan mengidentifikasi model bisnis dari usulan layanan analisis persepsi publik secara terintegrasi bagi pimpinan. Gambar berikut menampilkan business model canvas sebagai analisis urgensi pengadaan sistem ini. Kepuasan masyarakat, serta reputasi bagi BPS menjadi revenue stream yang diharapkan diperoleh.
e-Indonesia Initiatives (eII-Forum) 2014, Institut Teknologi Bandung ICT For Smart Society | Think Ecosystem Act Convergence
Gambar 2. Business Model Canvas Gambar 3. Diagram Infrastruktur Sistem
II.2 Infrastruktur Sistem Terintegrasi yang dibangun, memanfaatkan Machine Learning API dari DatumBox [16], [17], yang bekerja dengan pengkombinasian beberapa metode Text Classifier, yaitu Naive Bayes, Softmax Regression dan Max Entropy.
II.3 UML
Aplikasi ini berjalan dengan menelusuri posting Facebook dan tweet pada Twitter dengan memanfaatkan :
Facebook’s Graph API Search (melalui Facebook PHP SDK) Twitter REST API 1.1v (melalui PHP-TwitterAPI client) Datumbox API 1.0v.
Sesuai dengan diagram infrastruktur pada gambar berikut, hasil analisis disimpan dalam database server sebagai dokumentasi dan kemudian disinkronisasi ke aplikasi mobile bagi pimpinan maupun web bagi administrator sistem. Sistem usulan menggunakan paradigma Internet of Thing dan memanfaatkan Software as a Service (SaaS), di mana interaksi dapat berlangsung secara Machine to Machine untuk sinkronisasi antara aplikasi mobile pada gadget dengan server. Server sendiri memanfaatkan informasi yang diolah oleh Software as a Service, yaitu Datumbox Analyzer.
Gambar 4. Sequence Diagram Koneksi Client-Server
II.4 Database Untuk menyimpan semua data dan informasi pada aplikasi yang didesain pada penelitian ini, digunakan database yang terdiri dari 6 buah tabel utama, beserta dengan field masing–masing di dalamnya. Skema relasional database tersebut dapat tersajikan pada gambar berikut:
e-Indonesia Initiatives (eII-Forum) 2014, Institut Teknologi Bandung ICT For Smart Society | Think Ecosystem Act Convergence
Gambar 7. Pengkategorian Persepsi
Gambar 5. Skema Relasional Basis Data
Terdapat 2 (dua) pilihan media sosial, yaitu ‘Facebook’ dan ‘Twitter’ yang digunakan untuk melakukan analisis persepsi berdasarkan media sosial yang dipilih. Dengan kata kunci (keyword) tertentu sistem akan menampilkan hasil analisis persepsi pada media sosial terpilih. Hasil analisis akan ditampilkan sesuai dengan kategori warna dan disimpan pada basis data secara historis.
IV. HASIL DAN ANALISIS IV.1 Implementasi Aplikasi Server Aplikasi server berbasis web dapat menampilkan statistik sentimen masyarakat terhadap BPS dan juga statistik pengguna layanan berdasarkan asal provinsi. Aplikasi server ini diimplementasikan bagi administrator, staf IT yang ditunjuk. Gambar 8. Hasil Analisis Persepsi atas Kata Kunci
IV.2 Implementasi Otomatisasi Penjadwalan Analisis
Gambar 6. Tampilan Antarmuka Aplikasi Server Terdapat 4 kategori peringkasan berdasarkan penghitungan klasifikasi sentimen posting dan tweet, yaitu , ‘Belum ada data’, ‘Dominan Negatif’, ‘Dominan Netral’, dan ‘Dominan Positif. Masing-masing peringkat dibeadakan berdasarkan warna untuk memudahkan dalam membaca hasil sentimen analisis, seperti pada gambar berikut :
Untuk mengimplementasikan otomatisasi pencarian dan analisis sesuai dengan jadwal penerbitan publikasi, mekanisme penjdawalan dirancang untuk sesuai dengan Advanced Release Calendar (ARC) publikasi. Pada gambar berikut, pengaturan penjadwalan administrator dapat menambah, mengedit, dan menghapus jadwal sentimen analisis. Sistem usulan menggunakan paradigma memanfaatkan Software as a Service (SaaS), di mana interaksi dapat berlangsung secara Machine to Machine untuk sinkronisasi executive summary antara aplikasi mobile pada gadget dengan server.
e-Indonesia Initiatives (eII-Forum) 2014, Institut Teknologi Bandung ICT For Smart Society | Think Ecosystem Act Convergence
analisis dideskripsikan sesuai dengan pengkategorian sebelumnya pada server.
Gambar 9. Pengaturan Penjadwalan Keyword Pencarian
IV.3 Implementasi Aplikasi Client Pada gambar berikut ini adalah tampilan aplikasi client pada perangkat mobile berbasis Android. Pengguna mobile, pimpinan BPS, diharuskan untuk melakukan autentikasi terlebih dahulu sebelum menggunakan aplikasi ini. Tidak ada fitur registrasi pada aplikasi ini sehingga jika ada penambahan pengguna selain melalui administrator pada server. Hal ini untuk menjaga integritas data dan keamanan informasi.
Gambar 11. ContohTampilan Antarmuka Aplikasi Client
V.
KESIMPULAN
Berdasarkan penelitian yang telah dilakukan, desain sistem terintegrasi telah dirancang dengan mencakup model bisnis, basis data dan infrastruktur yang diperlukan. Sistem didesain dan diimplementasikan berbasiskan konsep Internet of Things. Prototype sistem usulan telah dikembangkan dengan implementasi Machine Learning oleh penyedia layanan Software as a Service (SaaS) yang menggunakan beberapa metode Text Classifier, yaitu: Naive Bayes, Softmax Regression dan Max Entropy. Sistem ini dapat membantu mendukung keputusan bagi pimpinan BPS terkait penyediaan data dan publikasi statistik yang tepat sasaran dan bermanfaat luas bagi masyarakat melalui input analisis persepsi (sentiment analysis) masyarakat pengguna data pada media sosial. Gambar 10. Implementasi Aplikasi Client untuk Mobile Halaman executive summary aplikasi ini dapat dilihat pada gambar berikut. Terdapat 3 bagian utama, yaitu hasil sentimen analisis dari Facebook, Twitter, dan hasil sentimen analisis secara umum yang merupakan gabungan dari hasil analisis dari kedua media sosial tersebut. Pengkategorian ringkasan hasil sentimen
Pengembangan penelitian ke depannya dapat dilakukan dengan mengevaluasi efektivitas dan efisiensi penerapan sistem. Selain itu dapat pula diujicoba dengan algoritma klasifikasi teks yang lain untuk meningkatkan akurasi pengklasifikasian persepsi.
e-Indonesia Initiatives (eII-Forum) 2014, Institut Teknologi Bandung ICT For Smart Society | Think Ecosystem Act Convergence
analysis of twitter posts,” Expert Syst. Appl., vol. 40, no. 10, pp. 4065–4074, Aug. 2013.
DAFTAR PUSTAKA [1]
[2]
J. C. Bertot, P. T. Jaeger, and J. M. Grimes, “Using ICTs to create a culture of transparency: E-government and social media as openness and anti-corruption tools for societies,” Gov. Inf. Q., vol. 27, no. 3, pp. 264–271, Jul. 2010.
[13]
A. Abbasi, H. Chen, and A. Salem, “Sentiment analysis in multiple languages,” ACM Trans. Inf. Syst., vol. 26, no. 3, pp. 1–34, Jun. 2008.
[14]
I. H. Witten, E. Frank, and M. A. Hall, Data Mining, Practical Machine Learning Tools and Techniques, Third. Elsevier, 2011.
[15]
J. Han and M. Kamber, Data Mining, Concepts and Techniques, Second. Elsevier, 2006.
[16]
V. Vryniotis, “DatumBox : Machine Learning API,” 2013. [Online]. Available: http://www.datumbox.com/machine-learningapi/. [Accessed: 26-Feb-2014].
[17]
V. Vryniotis, Datumbox API Documentation 1.0v. London: Datumbox, 2013, pp. 1–11.
BPS, Rencana Strategis Badan Pusat Statistik 2010-2014 : Review Kedua. Badan Pusat Statistik, 2012.
[3]
BPS, Analisis Hasil Survei Kebutuhan Data 2013. Jakarta: Badan Pusat Statistik, 2013.
[4]
BPS, Analisis Survei Kebutuhan Data 2012. Jakarta, 2012.
[5]
E. Bonsón, L. Torres, S. Royo, and F. Flores, “Local e-government 2.0: Social media and corporate transparency in municipalities,” Gov. Inf. Q., vol. 29, no. 2, pp. 123–132, Apr. 2012.
[6]
A. Agarwal, B. Xie, I. Vovsha, O. Rambow, and R. Passonneau, “Sentiment Analysis of Twitter Data,” in Workshop on Languages in Social Media, 2011.
[7]
BPS, BPS Analysis Document, version 3.1, 3.1 (19 Ma., vol. 1. Badan Pusat Statistik, 2011.
[8]
OECD, The e-government imperative : main findings. Paris: OECD, 2003.
[9]
J. Gubbi, R. Buyya, S. Marusic, and M. Palaniswami, “Internet of Things (IoT): A vision, architectural elements, and future directions,” Futur. Gener. Comput. Syst., vol. 29, no. 7, pp. 1645–1660, Sep. 2013.
[10]
L. Li, “Application of the Internet of Thing in Green Agricultural Products Supply Chain Management,” 2011 Fourth Int. Conf. Intell. Comput. Technol. Autom., pp. 1022–1025, Mar. 2011.
[11]
A. Bifet and E. Frank, “Sentiment Knowledge Discovery in Twitter Streaming Data,” in Discovery Science, Springer, 2010.
[12]
E. Kontopoulos, C. Berberidis, T. Dergiades, and N. Bassiliades, “Ontology-based sentiment
e-Indonesia Initiatives (eII-Forum) 2014, Institut Teknologi Bandung ICT For Smart Society | Think Ecosystem Act Convergence