Tugas Makalah
Sistem Temu Kembali Informasi (STKI)
TI029306
Analisa Kelompok Pergaulan dengan Temu Kembali Informasi pada Jejaring Sosial
Oleh :
I Putu Gede Mayu Krisnawan 1204505037
Dosen : I Putu Agus Eka Pratama, ST MT
Jurusan Teknologi Informasi Fakultas Teknik Universitas Udayana 2015
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa karena dengan rahmat, karunia, dan berkat-Nya penulis dapat menyelesaikan makalah dengan judul Analisa Kelompok Pergaulan dengan Temu Kembali Informasi pada Jejaring Sosial ini dengan baik. Penulis juga berterima kasih pada Bapak I Putu Agus Eka Pratama, ST MT selaku Dosen mata kuliah Sistem Temu Kembali Informasi di jurusan Teknologi Informasi Universitas Udayana yang telah membimbing pengerjaan makalah ini. Penulis sangat berharap makalah ini dapat berguna dalam rangka menambah wawasan serta pengetahuan kita mengenai teori dan penerapan dari sistem temu kembali informasi. Penulis juga menyadari sepenuhnya bahwa makalah yang dikerjakan belum dapat disebut sempurna. Oleh sebab itu, penulis berharap adanya kritik, saran dan usulan demi perbaikan makalah yang telah kami buat di masa yang akan datang, mengingat tidak ada sesuatu yang sempurna tanpa saran yang membangun. Penulis juga mohon maaf apabila terdapat kata-kata kurang berkenan. Semoga makalah ini dapat dipahami bagi siapapun yang membacanya. Sekiranya makalah yang telah disusun ini dapat berguna bagi penulis sendiri maupun pihak yang membacanya.
Jimbaran, Mei 2015
Penyusun
ABSTRAK
Jejaring sosial sudah menjadi tren yang tidak bisa dihindari lagi. Melalui jejaring sosial terjadi berbagai interaksi sosial. Interaksi sosial yang terjadi pada jejaring sosial kemudian menimbulkan berbagai fenomena sosial. Salah satu fenomena sosial yang patut diperhatikan adalah permasalahan yang terjadi dalam pergaulan. Kurangnya perhatian terhadap permasalahan dari pergaulan dalam jejaring sosial inilah yang menimbulkan berbagai permasalahan. Pencegahan permasalahan pada pergaulan dapat dilakukan dengan analisis kelompok pergaulan pada jejaring sosial. Sebagaimana data pada jejaring sosial yang terus berkembang, maka penerapan information retrieval dapat dilakukan untuk menemukan kembali data berupa interaksi sosial yang membentuk pola pergaulan dari individu pengguna jejaring sosial. Konten pada jejaring sosial juga dapat diperoleh sentimennya melalui analisis sentimen dengan penerapan natural language processing. Sentimen dari konten jejaring sosial inilah dapat menjadi acuan untuk memperoleh pola pergaulan yaitu berupa kelompok pergaulan pada jejaring sosial.
Kata kunci : Information Retrieval, Social Network, Natural Language Processing
BAB I PENDAHULUAN
1.1
Latar Belakang Penggunaan jejaring sosial merupakan tren yang tidak bisa dihindari lagi.
Melalui jejaring sosial terjadi berbagai interaksi sosial. Interaksi sosial yang terjadi pada jejaring sosial kemudian menimbulkan berbagai fenomena sosial. Salah satu fenomena sosial yang patut diperhatikan adalah permasalahan yang terjadi
dalam
pergaulan.
Terkadang
pergaulan
melalui
jejaring
sosial
menimbulkan dampak positif maupun negatif. Pergaulan melalui jejaring sosial pun relatif lebih sulit untuk dikontrol mengingat pengguna jejaring sosial dari seluruh dunia semakin meningkat. Menurut portal statistik yaitu statista, pengguna jejaring sosial dari seluruh dunia hingga tahun 2013 diperkirakan sudah mencapai 1,59 miliar pengguna. Pada tahun 2011 jumlah pengguna mencapai 1,22 miliar pengguna dan tahun 2012 mencapai 1,4 miliar pengguna. Jumlah ini diperkirakan meningkat dari tahun ke tahun (statista, 2013). Perkembangan pengguna dari jejaring sosial yang terus berkembang inilah yang tentunya dapat menyebabkan ruang lingkup pergaulan semakin luas dan sulit untuk diawasi. Berbagai kasus penyimpangan sosial dan berbagai jenis kriminalitas dapat terjadi pada jejaring sosial. Mulai dari kasus anak dibawah umur yang melarikan diri dengan teman jejaring sosialnya hingga kasus pencurian ataupun pembunuhan dapat terjadi akibat kurangnya pengawasan terhadap aktivitas media sosial. Kurangnya perhatian terhadap permasalahan dari pergaulan dalam jejaring sosial inilah yang menimbulkan berbagai permasalahan yang tidak harusnya terjadi. Selain itu upaya pencegahan akan lebih baik dilakukan daripada penanggulangan terhadap permasalahan yang sudah terjadi. Berbagai pihak yang terlibat dalam permasalahan ini tentunya harus memperhatikan upaya pencegahan terlebih dahulu.
Salah satu kasus yang sering terjadi adalah permasalahan pada pergaulan remaja. Melalui data statistik, jumlah dari pengguna jejaring sosial secara umum didominasi oleh usia yang tergolong remaja (jetscram, 2014). Selain itu remaja sebagai usia yang secara umum masih berkembang dalam segi kematangan emosional umumnya sulit dalam menentukan keputusan yang tepat bagi masa depannya. Oleh karena itu peran pengawasan dari pihak-pihak terkait seperti orang tua dan sekolah tentunya penting dalam pergaulan remaja. Upaya pencegahan yang mungkin dapat dilakukan adalah dengan memberikan pembelajaran yang baik. Namun dalam proses pembelajaran tentunya memerlukan fungsi pengawasan yang baik. Fungsi pengawasan dalam pergaulan jejaring sosial tentunya akan sulit untuk dilakukan apabila tidak tersedia metode atau sistem yang dapat mempermudah fungsi pengawasan pergaulan pada jejaring sosial. Sebagaimana fungsi pengawasan pergaulan pada jejaring sosial merupakan hal yang penting untuk dilakukan, maka ketersediaan metode atau sistem yang tepat guna dalam pengawasan pergaulan pada jejaring sosial merupakan prioritas yang cukup perlu untuk diperhatikan. Apabila pengawasan dilakukan dengan baik maka proses pembelajaran bagi remaja dalam penggunaan jejaring sosial dapat dilakukan dengan baik juga. Temu kembali informasi yang merupakan upaya untuk memperoleh kembali informasi melalui sekumpulan sumber, dapat diterapkan pada jejaring sosial. Salah satu bentuk temu kembali informasi yang dapat diterapkan adalah temu kembali informasi dengan sumber data dari jejaring sosial. Melalui analisa kelompok pergaulan dengan temu kembali informasi pada jejaring sosial, diharapkan fungsi pengawasan pergaulan pada jejaring sosial dapat dilakukan dengan lebih baik lagi.
1.2
Rumusan Masalah Secara umum masalah yang dikaji adalah penerapan temu kembali
informasi pada analisa kelompok pergaulan dengan jejaring sosial. Berikut merupakan penjarbaran masalah yang akan dikaji lebih lanjut. 1)
Apakah analisa kelompok pergaulan dapat dilakukan dengan temu kembali informasi pada jejaring sosial?
2)
Bagaimanakah analisa kelompok pergaulan dengan temu kembali informasi pada jejaring sosial dapat dilakukan?
3)
Apakah temu kembali informasi pada jejaring sosial dapat diterapkan sebagai solusi yang efektif dalam analisa kelompok pergaulan?
1.3
Solusi Analisa kelompok pergaulan pada jejaring sosial dapat dilakukan dengan
temu kembali informasi pada jejaring sosial yang populer untuk digunakan. Sebagaimana situs jejaring sosial yang umumnya digunakan oleh banyak pengguna dari seluruh dunia, ketersediaan seperti API (Application Programming Interface) yang membantu pengembang membuat layanan third party umumnya tersedia dan dapat diakses oleh publik. Hal ini tentunya dapat memudahkan proses temu kembali informasi pada jejaring sosial. Temu kembali informasi yang dibantu dengan API pada jejaring sosial tentunya dapat dengan mudah dilakukan untuk melakukan analisa kelompok pergaulan pada jejaring sosial. Pengolahan statistik seperti jumlah ketertarikan antar pengguna jejaring sosial dapat dijadikan dasar untuk melakukan analisa kelompok pergaulan. Misalnya saja pada jejaring sosial seperti facebook, data pengguna seperti jumlah like atau komentar dapat menjadi acuan untuk melakukan pengelompokan pergaulan. Data ketertarikan antar pengguna dapat diolah secara statistik melalui penerapan algoritma data minning yaitu clustering. Karena ketertarikan antar pengguna dapat dibentuk menjadi angka pasti tentunya penerapan algoritma clustering dapat dengan mudah dilakukan. Namun sebelum data dapat diolah
tentunya diperlukan proses untuk mengubah jenis sumber data yang berbeda dari masing-masing jejaring sosial media menjadi satu bentuk data kuantitatif yang bersifat eksak. Misalnya saja pada jejaring sosial facebook ketertarikan antar pengguna dapat dilihat dari jumlah like atau komentar, maka pada jejaring sosial seperti twitter ketertarikan pengguna dapat dilihat dari frekuensi pengguna untuk melakukan mention pada pengguna lain. Lebih lanjut lagi penerapan natural language processing dapat dilakukan untuk menemukan sentimen dari konten yang dibuat pengguna jejaring sosial terhadap pengguna lain. Data eksak dari ketertarikan dari pengguna secara lebih lanjut dapat diolah dengan penerapan algoritma clustering. Namun perlu diperhatikan juga volume data yang digunakan dalam analisa kelompok pergaulan yang akan dilakukan. Apabila volume data cukup besar, maka sistem untuk proses analisa haruslah memiliki skalabilitas yang baik agar sistem tetap dapat melakukan pengolahan data tanpa penambahan infrastruktur yang siginifikan. Pemilihan sistem penyimpanan data merupakan salah satu hal yang penting untuk dilakukan. Sistem penyimpanan data yang dapat diterapkan tentunya harusnya menyesuaikan dengan volume data yang akan digunakan. Salah satu sistem penyimpanan data yang sedang menjadi tren dalam penerapan data minning adalah penerapan sistem database NoSQL. Sistem database NoSQL umumnya memiliki struktur yang tidak konvensional dan memiliki perbedaan performa dengan sistem database relasional dalam penggunaannya untuk melakukan analisis data. Disamping penerapan algoritma dan sistem penyimpanan data yang tepat tentunya diperlukan sumber data yang tepat. Pemilihan sumber data yang tepat tentunya perlu untuk dilakukan agar hasil analisa menjadi lebih relevan. Pemilihan jejaring sosial yang tepat hingga rentang dan porsi data yang tepat tentunya merupakan faktor yang penting dalam melakukan analisa kelompok pergaulan dengan temu kembali informasi pada jejaring sosial.
BAB II LANDASAN TEORI & DESAIN SOLUSI
2.1
Landasan Teori Makalah ini mengacu pada berbagai teori yang menjadi landasan dalam
penyusunannya. Berbagai teori yang digunakan dalam makalah ini antara lain adalah sebagai berikut. 2.1.1 Temu Kembali Informasi Temu kembali informasi atau Information Retrieval (IR) adalah kegiatan untuk menemukan informasi (biasanya berupa dokumen) dalam bentuk yang kurang terstruktur yang nantinya akan berguna untuk memenuhi kebutuhan akan informasi yang diinginkan. Data yang kurang terstruktur dan diolah dalam IR berhubungan dengan data yang memiliki relasi semantik kurang jelas dan tidak mudah untuk dimengerti oleh komputer (struktur datanya masih sulit diolah). Hal ini bertentangan dengan data yang terstruktur, contoh sederhananya adalah database relasional yang lebih mudah untuk diolah lebih lanjut. IR mencakup proses pencarian dan proses pemilahan kumpulan dokumen. Misalnya saja tersedia beberapa dokumen, clustering merupakan kegiatan yang berhubungan dengan pengelompokan dokumen berdasarkan kontennya sedangkan klasifikasi merupakan kegiatan untuk menentukan kelompok dari sebuah dokumen berdasarkan topiknya. Dalam kaitannya dengan dunia nyata, hampir tidak ada data yang benar-benar terstruktur. Contoh sederhananya adalah bahasa manusia yang sebenarnya memiliki struktur tersendiri. Karena data yang tersedia tidak ada yang benar-benar tidak terstruktur maka IR juga mencakup mengenai pengolahan data semi terstruktur. Metode yang digunakan pada IR umumnya adalah metode berupa pencarian dan pengelompokan data. Beberapa contoh metode dalam bentuk algoritma yang dipergunakan pada IR antara lain adalah boolean retrieval, hierarchial clustering dan juga support vector machine. Dalam melakukan pengelompokan data pada IR haruslah menggunakan metode pemberian bobot yang cukup baik apabila hasil dari IR yang diinginkan adalah hasil yang cukup relevan dan efisien.
2.1.2 Jejaring Sosial Jejaring sosial adalah sebuah layanan yang memungkinkan individu untuk (1) membangun profil publik atau semi-publik dalam sistem yang memiliki ruang lingkup tertentu, (2) mengartikulasikan daftar pengguna lain dengan siapa mereka berbagi koneksi dan (3) melihat dan melintasi daftar hubungan lain yang dibuat oleh orang lain dalam sistem. Sifat dan nomenklatur hubungan ini dapat bervariasi dari masing-masing jejaring sosial. Situs jejaring sosial pertama kali diluncurkan pada tahun 1997. Pada tahun 1997, SixDegrees.com merupakan jejaring sosial pertama yang memungkinkan pengguna untuk membuat profil, daftar. Masing-masing fitur ini ada dalam beberapa bentuk sebelum sixdegrees, tentu saja. Profil ada di sebagian besar situs kencan utama dan banyak situs komunitas. AIM dan ICQ mendukung daftar pertemanan, meskipun daftar pertemanan tersebut tidak terlihat oleh orang lain. Classmates.com memungkinkan orang untuk afiliasi dengan sekolah tinggi atau perguruan tinggi dan penelusuran bagi orang lain yang juga berafiliasi, tapi pengguna tidak dapat membuat profil atau daftar teman sampai tahun kemudian. Sixdegrees adalah jejaring sosial pertama yang mencakup fitur dasar yang merupakan kriteria dari jejaring sosial. Berikutnya Ryze.com diluncurkan pada tahun 2001 untuk membantu orang memanfaatkan jaringan bisnis mereka. Pendiri Ryze melaporkan bahwa dirinya pertama kali memperkenalkan situs tersebut anggota bisnis dan teknologi masyarakat San Francisco, termasuk pengusaha dan investor. Secara khusus, orang-orang di belakang Ryze, Tribe.net, LinkedIn, dan Friendster yang erat terjalin secara pribadi dan profesional. Mereka percaya bahwa mereka bisa saling mendukung tanpa bersaing. Namun pada akhirnya, Ryze tidak pernah diperoleh popularitas massa, Tribe.net tumbuh memiliki jumlah pengguna yang banyak, LinkedIn menjadi layanan bisnis yang kuat, dan Friendster menjadi yang paling signifikan pada saat itu. Pada tahun 2003 juga berdiri jejaring sosial MySpace yang bersaing dengan Friendster dengan menambahkan fitur berdasarkan permintaan pengguna
yaitu memungkinkan pengguna untuk melakukan
personalisasi halaman pengguna. Hal inilah yang pada saat itu membuat MySpace menjadi unik. Pada awal tahun 2004 munculah Facebook yang berdiri sebagai jejaring sosial yang hanya tersedia bagi mahasiswa Harvard namun akhirnya dapat digunakan oleh umum. Pada tahun 2006 kemudian didirikanlah Twitter. Twitter disebut bukan sebagai jejaring sosial oleh beberapa pihak karena Twitter memiliki bentuk interaksi yang berbeda dan berdasarkan pihak eksekutif Twitter yaitu Kevin Thau memberikan statemen pada Nokia World 2010 bahwa twitter bukanlah jejaring sosial. Namun melalui aktivitas dan fitur yang tersedia pada Twitter, Twitter dapat tergolong sebagai jejaring sosial juga. Fitur yang dimaksud adalah fitur untuk membuat profil pengguna, membuat daftar pertemanan dan melakukan interaksi sosial antar pengguna. Baik Twitter maupun Facebook menyediakan pihak ketiga sarana untuk mengakses data yang tersimpan melalui mekanisme penggunaan API (Application Programming Interface) yang memiliki batasan-batasan tertentu.
2.1.3 API (Application Programming Interface) API (Application Programming Interface) adalah seperangkat rutin, protokol, dan alat-alat untuk membangun aplikasi perangkat lunak. API mengekspos komponen software dalam hal operasi, input, output, dan jenis yang mendasarinya. API mendefinisikan fungsi yang independen dari implementasi masing-masing, yang memungkinkan definisi dan implementasi. Sebuah API yang baik memudahkan proses pengembangan program dengan menyediakan kumpulan fungsi yang dapat digunakan programmer. Seorang programmer kemudian menempatkan fungsi-fungsi tersebut secara bersama-sama. Programmer dapat membuat request dengan memasukkan pemanggilan fungsi pada API dalam kode program. Sintaks API umumnya dijelaskan dalam dokumentasi dari API yang digunakan. Berbagai jenis API juga tersedia pada berbagai platformi dan bahasa pemrograman. Tujuan utamanya tersedia API adalah agar programmer dapat dengan mudah mengakses fungsi yang dibutuhkan untuk membuat program.
2.1.4 Data Mining Data mining adalah kegiatan mengekstraksi atau menambang pengetahuan yang bermanfaat dari data yang berukuran/berjumlah besar. Data Mining memang salah satu cabang ilmu komputer yang relatif baru. Hingga saat ini penempatan data mining di bidang ilmu tertentu masih menjadi perdebatan. Hal ini dikarenakan data mining menyangkut database, kecerdasan buatan (artificial intelligence) dan statistik. Sebagai ssebuah kegiatan, data mining tentunya memiliki berbagai langkah umum. Langkah-langkah yang dimaksud adalah sebagai berikut. a.
Data cleaning (untuk menghilangkan noise data yang tidak konsisten)
b.
Data selection (dimana data yang relevan dengan tugas analisis disimpan ke dalam database)
c.
Data transformation (dimana data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi agresi)
d.
Data mining (proses esensial di mana metode yang intelejen digunakan untuk mengekstrak pola data)
e.
Pattern evolution (untuk mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa tindakan yang menarik)
f.
Knowledge presentation (di mana gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah ditemukan kepada user). Sebagai sebuah kegiatan penggalian informasi, data minning memiliki
berbagai pokok permasalahan yang sering dikaji. Permasalahan tersebut dapat dibagi menjadi beberapa jenis kegiatan yang menerapkan algoritma-algoritma tertentu. Misalnya saja kegiatan clustering dikenal algoritma hierarchial dan KMeans clustering, sedangkan pada kegiatan klasifikasi data dapat menggunakan algoritma seperti C.45 atau Support Vector Machine. Selain itu kegiatan lain seperti analisis asosiasi dan prediksi data juga termasuk ke dalam ranah data mining.
2.1.5 Natural Language Processing Natural Language Processing (NLP) adalah bidang penelitian yang mengeksplorasi bagaimana komputer dapat digunakan untuk memahami dan memanipulasi teks dari bahasa alami atau sebuah percakapan untuk mendapatkan informasi yang bermanfaat. Peneliti NLP bertujuan untuk mengumpulkan pengetahuan tentang bagaimana manusia memahami dan menggunakan bahasa sehingga alat dan teknik yang tepat dapat dikembangkan untuk membuat sistem komputer yang memahami dan memanipulasi bahasa alami untuk melakukan tugas-tugas yang diinginkan. Fondasi NLP terletak pada beberapa disiplin ilmu seperti ilmu komputer dan informasi, linguistik, matematika, teknik kelistrikan, kecerdasan buatan dan robotika, psikologi. Aplikasi NLP mencakup sejumlah bidang studi, seperti mesin penerjemah, pengolahan teks dengan bahasa alami dan summarization, cross language information retrieval (CLIR), pengenalan suara, kecerdasan buatan dan sistem pakar. NLP juga dapat diterapkan dalam analisis sentimen dari konten yang berbasis teks maupun non teks. Analisis sentimen biasa ditujukan untuk mencari makna kontekstual dari sebuah konten yang tersedia. Sentimen yang ditemukan bisa saja berupa sentimen negatif, positif atau netral. Isu penting dalam analisis sentimen adalah untuk mengidentifikasi bagaimana sentimen disajikan dalam teks dan apakah sebuah ekspresi menunjukkan pendapat positif (menguntungkan) atau negatif (tidak menguntungkan). Secara lebih detail lagi analisis sentimen melibatkan identifikasi dari beberapa aspek. Berikut merupakan merupakan aspek yang dimaksud. a.
Ekspresi sentimen
b.
Polaritas dan kuat tidaknya suatu ekspresi
c.
Hubungan antar subjek dalam ekspresi
Misalnya kalimat “XXX mengalahkan YYY”. Bisa saja berarti XXX memiliki sentimen positif sedangkan YYY memiliki sentimen negatif dengan polaritas dan kuat tidaknya sentimen yang berbeda.
2.1.6 NoSQL NoSQL adalah jenis database yang digunakan untuk menyimpan volume data yang besar. Database NoSQL adalah database skalabilitasnya dapat berkembang secara horizontal (penambahan cluster yang terhubung satu sama lain), terdistribusi dan bersifat open source dan non-relasional. Peforma yang baik adalah perhatian utama hampir dari setiap sistem data-driven. NoSQL database diklaim dapat memberikan kinerja lebih cepat dari sistem database relasional dalam berbagai kasus penggunaan, terutama dalam kasus penggunaan yang melibatkan volume data yang besar. Namun perlu dipahami juga bahwa tidak semua database NoSQL adalah dibuat dengan struktur dan fungsionalitas yang sama. Berikut merupakan jenis-jenis database NoSQL sesuai strukturnya. a.
Key-Value Stores Jenis database NoSQL key-value stores adalah jenis database dengan
struktur tidak relasional yang hanya terdiri dengan kumpulan key unuk yang masing-masing memiliki satu nilai. Contoh dari jenis key-value stores adalah memcached dan redis. b.
Document Stores Jenis database NoSQL document stores memiliki struktur yang sedikit lebih
kompleks dari key-value stores namun tetap tidak memiliki relasi antar dokumen (dianalogikan sebagai tabel dalam database relasional). Data yang disimpan pada jenis database ini adalah data dalam format dokumen, misalnya JSON (Javascript Object Notation). Contoh dari jenis database ini adalah MongoDB, CouchDB dan SimpleDB. c.
Extensible Record Stores Jenis database NoSQL ini memiliki model data berupa kumpulan baris dan
kolom dan model skalabilitas dasarnya berupa pembagian baris dan kolom ke dalam node yang terhubung menjadi satu. Jenis database seperti ini awal kemunculannya termotivasi oleh BigTable dari Google. Contoh lain dari extensible record stores adalah HBase, HyperTable dan Cassandra.
2.2
Desain Solusi Solusi yang diterapkan dalam penerapan temu kembali informasi dalam
analisa kelompok pergaulan memiliki inti berupa pemanfaatan API dari masingmasing jejaring sosial ke dalam sebuah sistem temu kembali informasi. Data yang ditemukan pada jejaring sosial dan disimpan ke dalam sistem kemudian dapat diolah lebih lanjut untuk analisa kelompok pergaulan. Berikut merupakan desain solusi dari permasalahan yang dimaksud secara lebih detail. 2.2.1 Tahapan Penerapan Solusi Tahapan penerapan solusi diawali dengan studi pustaka yang dapat mendukung penerapan solusi. Selanjutnya secara lebih spesifik, penerapan solusi akan dilaksanakan ke dalam empat tahap utama yaitu perencanaan awal, proses pengembangan sistem, uji kelayakan sistem dan uji akurasi hasil analisis. Gambar 2.1 mengilustrasikan tahapan dari tahapan penerapan solusi secara lebih spesifik.
Gambar 2.1 Tahapan Penerapan Solusi
Gambar 2.1 menunjukan bahwa sebelum sistem dikembangkan akan dilakukan perencanaan awal yang mencakup perencanaan sumber data yang relevan dan struktur data yang sesuai. Kemudian pada proses pengembangan sistem rancangan struktur data diterapkan pada media penyimpanan yang sesuai. Selain itu terdapat dua modul dalam sistem yaitu modul crawler dan modul utama. Modul crawler bertugas untuk mengumpulkan data jejaring sosial. Sedangkan modul utama akan menjadi bagian sistem yang mengolah data yang telah dikumpulkan. Selain itu modul utama juga menjadi antarmuka utama bagi pengguna sistem. Pada penerapan solusi terdapat uji kelayakan sistem dan uji akurasi hasil analisis. Uji akurasi hasil analisis ini akan dilakukan dengan basis kuesioner. Narusumber yang akan mengisi kuesioner adalah individu-individu yang menjadi target dalam analisis kelompok pergaulan dan pihak yang terlibat dalam kehidupan sosial individu-individu terkait.
2.2.2 Metode Pengumpulan Data Interaksi sosial merupakan aspek utama yang perlu diperhatikan dalam analisis kelompok pergaulan. Jejaring sosial sebagai sebuah media yang memungkinkan pengguna dapat saling berinteraksi satu sama lain melalui dunia maya menimbulkan data berupa interaksi sosial yang dapat diolah lebih lanjut. Data interaksi sosial ini dapat dimanfaatkan dengan cara melakukan temu kembali informasi. Data interaksi sosial pada jejaring sosial tersedia dalam bentuk yang cukup berbeda dari satu jejaring sosial dengan jejaring sosial lainnya. Misalnya saja interkasi sosial yang berupa hubungan ketertarikan dapat dianalogikan sebagai jumlah like pada facebook dan jumlah favourite tweet pada twitter. Secara lebih lanjut konten yang memiliki sentimen yang belum pasti seperti komentar pada facebook dan isi tweet pada twitter perlu untuk dianalisis lebih lanjut dengan penerapan natural language processing. Gambar 2.2 merupakan ilustrasi dari dari tahapan pengumpulan data yang akan dilakukan.
Gambar 2.2 Tahapan Pengumpulan Data
Gambar 2.2 menunjukan bahwa dalam pengumpulan data akan ada tiga tahapan yaitu tahap persiapan, utama dan akhir. Pada tahap persiapan jangkauan data dapat diartikan sebagai ruang lingkup pergaulan dari individu terkait. Pembatasan ruang lingkup dimaksudkan agar temu kembali informasi yang dilakukan menjadi efektif dan akurat. Pada tahap utama terdapat tahapan analisis sentimen. Analisis sentimen dilakukan pada konten dengan sentimen yang belum pasti (belum dapat menggambarkan hubungan ketertarikan dengan jelas). Hal ini bertujuan agar sumber data menjadi lebih berkualitas. Mengingat juga keberagaman jenis konten yang tersedia pada masing-masing jejaring sosial, perlu untuk dilakukan standarisasi penilaian terhadap nilai ketertarikan antar individu. Standarisasi ini ditujukan agar hasil dari analisis menjadi lebih relevan. Pada tahap akhir dilakukan penyesuaian struktur data. Penyesuaian struktur data ini dilakukan karena keberagaman dari bagian data lain pada masingmasing jejaring sosial. Bagian data lain yang dimaksud misalnya adalah identitas individu (nama, umur, dll.). Struktur data akan disesuaikan dengan dengan sistem database yang digunakan untuk menyimpan data.
2.2.3 Metode Evaluasi Solusi Pada tahapan penerapan solusi terdapat tahap uji kelayakan sistem dan juga uji akurasi hasil analisis. Sistem dianggap layak apabila sistem dapat berjalan tanpa adanya kesalahan yang signifikan terhadap serangkaian fitur yang sesuai kebutuhan penggunaan sistem. Uji kelayakan sistem selanjutnya adalah uji performa berupa kecepatan sistem dan kemampuan sistem dalam menangani volume data yang ditentukan dalam serangkaian kasus yang signifikan mempengaruhi kebutuhan penggunaan sistem secara keseluruhan. Uji akurasi hasil analisis kelompok pergaulan dilakukan dengan cara mengumpulkan data dalam bentuk kuesioner. Narasumber dari kuesioner adalah individu-individu sampel dan pihak yang terlibat dalam kehidupan sosial dari individu-individu yang menjadi target dari analisis kelompok pergaulan. Kuesioner yang telah diisi selanjutnya akan dinilai dan menjadi tolak ukur dari akurasi sistem dalam memberikan hasil dari analisa kelompok pergaulan.
BAB III ANALISA SOLUSI DAN KESIMPULAN
3.1
ANALISA SOLUSI Desain dari solusi permasalahan sebelumnya merupakan sebuah penerapan
dari temu kembali informasi pada jejaring sosial. Bentuk penerapan yang dilakukan memerlukan rancang bangun sebuah sistem temu kembali informasi. Sistem dapat diterapkan dalam berbagai platform perangkat lunak seperti perangkat lunak berbasis web, desktop maupun mobile. Solusi yang diberikan dapat menjadi salah satu bentuk permasalahan dalam analisa perilaku sosial. Analisis sentimen pada pengumpulan data dari jejaring sosial merupakan aspek yang penting dalam solusi secara keseluruhan. Dengan adanya tahapan analisis sentimen tentunya perilaku sosial yang cenderung tidak bersifat eksak dapat diukur melalui sentimen yang diperoleh. Namun sebagaimana sentimen dari mahluk sosial bukan merupakan aspek yang eksak, tentunya akurasi dari hasil analisis sentimen perlu untuk diperhatikan lebih lanjut lagi. Sumber data yang tersedia pada jejaring sosial tentunya memiliki volume yang beragam menurut penggunaannya. Misalnya saja ruang lingkup pergaulan individu dapat saja sempit ataupun luas. Namun asumsi penulis adalah pada kasus rata-rata tentunya ruang lingkup pergaulan individu tidak terlalu luas, sehingga penggunaan sistem database seperti NoSQL tidak wajib untuk dilakukan. Solusi yang diberikan juga memiliki keterbatasan terhadap beberapa kasus. Salah satunya adalah pada saat akun individu pada jejaring sosial memiliki terlalu banyak hubungan antar akun yang lain yang tidak relevan dalam pergaulan individu yang dimaksud. Hal ini tentunya dapat menimbulkan penyimpangan dari hasil yang lebih relevan. Namun masalah ini dapat diatasi dengan melakukan pemilahan terhadap hubungan-hubungan yang terjadi antar pengguna berdasarkan relevansi hubungan-hubungan tersebut. Pemilihan yang dimaksud harusnya dapat dilakukan dengan efisiensi yang cukup baik tanpa mengurangi akurasi secara signifikan. Aspek pemilihan inilah yang menjadi kekurangan dari solusi yang diberikan penulis.
3.2
KESIMPULAN Berdasarkan studi pustaka dan analisis solusi yang telah dilakukan dapat
ditarik kesimpulan dari beberapa pokok permasalahan yang didefinisikan sebelumnya. Berikut merupakan pokok-pokok dari kesimpulan yang dimaksud. 1)
Analisa kelompok pergaulan dapat diterapkan dengan temu kembali informasi pada jejaring sosial namun terdapat beberapa batasan dari solusi yang diberikan sehingga menyebabkan efektivitas solusi kurang baik pada beberapa kasus.
2)
Analisa kelompok pergaulan dengan temu kembali informasi pada jejaring sosial dapat diterapkan dengan melakukan rancang bangun sistem temu kembali informasi yang memanfaatkan data berupa aktivitas sosial yang terjadi antar beberapa individu pada jejaring sosial.
3)
Temu kembali informasi pada jejaring sosial dapat diterapkan sebagai solusi yang efektif dalam analisa kelompok pergaulan. Namun pada beberapa kasus seperti terlalu banyaknya noise pada data jejaring sosial dapat mengurangi efektivitas dari solusi yang diberikan.
DAFTAR PUSTAKA
http://www.statista.com/statistics/278414/number-of-worldwide-social-networkusers/ (diakses pada tanggal 11 Mei 2015) http://jetscram.com/blog/industry-news/social-media-user-statistics-and-agedemographics-2014/ (diakses pada tanggal 12 Mei 2015) Cattell, Rick. Scalable SQL and NoSQL data stores. ACM SIGMOD Record 39.4 (2011): 12-27. Oricchio, R. (2010). Is Twitter A Social Network? Inc. Magazine. http://www.inc.com/tech-blog/is-twitter-a-social-network.html
(diakses
pada
tanggal 19 Mei 2015) Kwak, Haewoon, et al. "What is Twitter, a social network or a news media?." Proceedings of the 19th international conference on World wide web. ACM, 2010. Ellison, Nicole B. "Social network sites: Definition, history, and scholarship." Journal of Computer-Mediated Communication 13.1 (2007): 210-230. Manning, Christopher D., Prabhakar Raghavan, and Hinrich Schütze. Introduction to information retrieval. Vol. 1. Cambridge: Cambridge university press, 2008. http://en.wikipedia.org/wiki/Application_programming_interface (diakses pada tanggal 19 Mei 2015) Tan, Pang-Ning, Michael Steinbach, and Vipin Kumar. Introduction to data mining. Vol. 1. Boston: Pearson Addison Wesley, 2006. http://ilmukomputer.org/wpcontent/uploads/2011/03/Ari_Fadli_Konsep_Data_Mining.pdf
Tan, Pang-Ning, Michael Steinbach, and Vipin Kumar. Introduction to data mining. Vol. 1. Boston: Pearson Addison Wesley, 2006. Jacquemin, Christian. Spotting and discovering terms through natural language processing. MIT press, 2001. Chowdhury, Gobinda G. "Natural language processing." Annual review of information science and technology 37.1 (2003): 51-89. Gu, Yunhua, Shu Shen, and Guansheng Zheng. "Application of nosql database in web crawling." JDCTA: International Journal of Digital Content Technology and its Applications 5.6 (2011): 261-266.