LAPORAN TAHAP 2 Eksplorasi Media Sosial dan Perancangan Prototipe
PENGHIMPUNAN DATA MELALUI MEDIA SOSIAL SECARA OTOMATIS UNTUK MENDUKUNG TRACER STUDY VIrtual ALumni TracER (VILTER)
Tim Peneliti Ketua Dr. Hapnes Toba, M.Sc. (710004 / 04-2610-7602) Anggota 1. Maresha Caroline Wijanto, S.Kom., M.T. (720302 / 04-0911-8802) 2. Oscar Karnalim, S.T., M.T. (720309 / 04-0708-8802)
Fakultas Teknologi Informasi Universitas Kristen Maranatha Bandung September 2015
DAFTAR ISI DAFTAR ISI ..............................................................................................................................3 ABSTRAK..................................................................................................................................4 BAB I PENDAHULUAN ...........................................................................................................5 BAB II TINJAUAN PUSTAKA .................................................................................................7 1. Pembentukan Model dengan Naïve Bayes ........................................................................7 2. Application Programming Interface..................................................................................8 3. Facebook API ................................................................................................................. 10 4. Twitter API .................................................................................................................... 11 5. LinkedIn API.................................................................................................................. 12 BAB III METODE PENELITIAN ............................................................................................ 13 1. Reduksi Halaman Temu Balik dan Pembentukan Kluster UPND .................................... 13 2. Pembentukan Model Naïve Bayes .................................................................................. 14 3. Eksplorasi API dalam Berbagai Media Sosial ................................................................. 21 4. Perancangan Prototipe Sistem VILTER .......................................................................... 21 BAB IV_HASIL DAN ANALISIS............................................................................................ 22 1. Reduksi Halaman Temu Balik ........................................................................................ 22 2. Pembentukan Model Naïve Bayes .................................................................................. 23 3. Eksplorasi API dalam Berbagai Media Sosial ................................................................. 26 4. Perancangan Prototipe Sistem VILTER .......................................................................... 30 BAB V KESIMPULAN & KEBERLANJUTAN ...................................................................... 43 DAFTAR PUSTAKA ............................................................................................................... 46 LAMPIRAN A HASIL FACEBOOK API................................................................................. 48 LAMPIRAN B HASIL TWITTER API..................................................................................... 51 LAMPIRAN C HASIL LINKEDIN API ................................................................................... 52
3
ABSTRAK Penelitian tahap kedua kali ini difokuskan pada kajian lebih jauh terkait pemanfaatan algoritma pembentukan kluster Unsupervised Person Name Disambiguation (UPND) untuk memprediksi jenis pekerjaan seorang alumni. Disamping itu, dalam laporan ini diberikan pula uraian mengenai eksplorasi yang telah dilakukan dalam rencana pemanfaatan Application Programming Interface (API) - dari beberapa media sosial popular, yaitu: Facebook, Twitter, LinkedIn - untuk diintegrasikan ke dalam sistem Virtual Alumni Tracer (VILTER). Dalam akhir pembahasan laporan ini diberikan pula hasil perancangan prototipe yang akan dikembangkan sebagai implementasi sistem VILTER dalam penelitian tahap ketiga. Kata kunci: algoritma unsupervised person name disambiguation, media sosial, Facebook, Twitter, LinkedIn, perancangan sistem.
4
BAB I PENDAHULUAN Sebagai tindak lanjut dari hasil penelitian tahap pertama pada bulan Juni yang lalu, diusulkan penekanan pada kebutuhan utama dilakukannya pelacakan alumni, yaitu untuk menelusuri dua hal sebagai berikut: 1. Untuk mengetahui apakah seorang alumni bekerja pada bidang kerja yang sesuai dengan rumpun ilmu yang digelutinya selama masa perkuliahan; dan 2. Untuk mengetahui kapan seorang alumni mulai menekuni dunia pekerjaan yang sebenarnya setelah masa perkuliahan. Guna menjawab kedua permasalahan di atas tersebut, maka dalam penelitian tahap kedua ini dilakukan dua kegiatan utama. Adapun kegiatan-kegiatan tersebut mencakup pada: pembentukan model klasifikasi untuk prediksi bidang pekerjaan alumni, dan eksplorasi API dari media-media sosial popular yang banyak digunakan oleh mahasiswa, yaitu: Facebook, Twitter dan LinkedIn.
Prediksi pekerjaan dilakukan dengan memanfaatkan isi kluster yang terbentuk dari algoritma UPND (Delgado et al., 2014) setelah melalui proses reduksi jumlah halaman temu balik. Isi kluster yang perlu dianalisis adalah kemunculan kata-kata penting tertentu dan terkait erat dengan sebuah profesi. Misalnya, untuk profesi dalam bidang medis diharapkan kata-kata tertentu - seperti: sakit, pasien, obat, suntik, dan sejenisnya - akan memiliki kontribusi yang signifikan dibandingkan di bidang profesi lainnya. Dengan melakukan penghitungan statistik kata dari berbagai deskripsi pekerjaan dan mencocokkannya dengan kemunculan kata dalam kluster diharapkan akan dapat diprediksilah bidang pekerjaan yang dianggap relevan untuk seorang alumni.
Informasi pekerjaan yang diperoleh melalui hasil prediksi model belum tentu dapat mewakili kebutuhan yang sesungguhnya, namun demikian hasil tersebut merupakan sebuah pendekatan yang diasumsikan dapat memenuhi kebutuhan dasar dalam pelacakan alumni. Hal tersebut didukung oleh semakin besarnya peluang seseorang untuk melakukan posting sesuatu pada media nirkabel, seperti Internet, yang pada akhirnya dapat terlacak oleh mesin temu balik. Lebih jauh lagi, saat ini sudah menjadi suatu tren bahwa sebagian besar orang memiliki akun dalam 5
berbagai media sosial yang sangat popular, seperti: Facebook, Twitter ataupun LinkedIn. Dapat dibayangkan, apabila 'nama pengguna' suatu akun media sosial berhasil ditemukan (misalnya melalui mesin temu balik), maka akan didapatkanlah informasi-informasi dasar yang mungkin akan bermanfaat untuk pelacakan alumni, seperti misalnya alamat email. Media sosial seperti LinkedIn bahkan mampu menyediakan informasi mengenai riwayat pekerjaan dan portofolio seseorang terkait bidang pekerjaannya. Dengan demikian tentu akan sangat bermanfaat apabila ada sebuah sistem yang dapat 'membaca' informasi dari media-media sosial tersebut dan hasilnya disimpan sebagai kebutuhan lokal, misalnya terkait pelacakan alumni.
Laporan penelitian tahap kedua ini memiliki susunan sebagai berikut: 1. Bab II berisi pembahasan mengenai ulasan literatur dan pendekatan teoritis yang digunakan dalam perancangan prototipe VILTER. 2. Bab III berisi metodologi penelitian secara lebih spesifik terkait: a. Reduksi halaman temu balik; b. Pembentukan model Naïve Bayes untuk prediksi pekerjaan; c. Eksplorasi API media sosial; dan d. Perancangan prototipe VILTER. 3. Bab IV berisi hasil-hasil tercapai dan analisis umum terkait butir nomor dua di atas. 4. Bab V berisi kesimpulan terhadap hasil-hasil yang telah tercapai sampai saat ini dan perkiraan aktivitas yang akan dilakukan dalam penelitian tahap ketiga berikutnya.
6
BAB II TINJAUAN PUSTAKA 1. Pembentukan Model dengan Naïve Bayes Naïve Bayes classifier banyak digunakan dalam berbagai bidang keilmuan, seperti: medical image processing, pengklasifikasian teks, diagnostic/prognostic query, dan lainnya. Keuntungan utama dari klasifikasi Naïve Bayes adalah kemudahan implementasi dan tingginya tingkat akurasi yang sampai saat ini seringkali mengungguli metode-metode kompleks terkini (Bui & Taira, 2010). Model Naïve Bayes didasarkan pada asumsi yang kuat mengenai ketidak-ketergantungan dari model atribut. Dengan kata lain setiap atribut memiliki peluang awal yang sama untuk muncul dalam berbagai kelas, namun akan dibatasi pada nilai kemunculannya. Perhitungan nilai kemunculan inilah yang pada akhirnya akan membedakan peluang akhir dari berbagai atribut. Bentuk umum untuk melakukan prediksi dengan Naive Bayes dapat dilihat dalam Formula 1.
...
(1)
Dengan: P(h)
= probabilitas untuk sebuah kelas h;
P(D) = probabilitas untuk kumpulan atribut D; P(h/D) = probabilitas kelas h jika diberikan kumpulan atribut D; P(D/h) = probabilitas kumpulan atribut D jika diberikan kelas h;
Pembentukan model dengan Naïve Bayes dilakukan dengan menghitung nilai kemunculan suatu atribut dalam kelas yang akan dipelajari (Wenyuan, Gui-Rong, Qiang, & Yong, 2007; Manning, Raghavan, & Schütze, 2008). Tujuan dari dilakukannya pembelajaran tersebut adalah untuk memberikan nilai bobot untuk sebuah atribut tertentu. Terkait dengan penelitian ini, maka atribut yang akan dihitung kemunculannya adalah 'kata'.
7
Nilai kemunculan kata perlu dibatasi pada kata-kata yang dianggap penting saja (non-stopwords) dengan mengacu pada akar katanya (kata dasar = stem). Selain itu untuk menambah kekuatan asumsi kesalinglepasan antar atribut di dalam model, maka akan dibedakan juga pembentukan model yang dibatasi dalam kelas katanya, yaitu kata benda dan kata kerja, secara kemunculan binomial (binary). 2. Application Programming Interface Application Programming Interface (API) adalah sekumpulan perintah, fungsi, dan protokol yang dapat digunakan oleh programmer saat membangun perangkat lunak untuk sistem operasi tertentu. API memungkinkan programmer untuk menggunakan fungsi standar untuk berinteraksi dengan sistem operasi lain. API diimplementasikan dengan menulis fungsi panggilan atau sintaks dalam program, yang menyediakan sarana yang diperlukan untuk meminta layanan program. Pada dasarnya, program API mendefinisikan cara yang tepat bagi pengembang untuk meminta layanan dari program itu. Sebagai contoh, Amazon.com merilis API sehingga pengembang situs web dapat lebih mudah mengakses informasi produk Amazon, menggunakan Amazon API, sebuah situs web pihak ke-tiga dapat memposting link langsung ke produk Amazon dengan harga yang terupdate dan pilihan untuk “beli sekarang”. (Prasetyo, 2014)
Dalam API terdapat fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih terstruktur dan mudah dimengerti oleh pengembang. Fungsi yang dibuat dengan menggunakan API tersebut kemudian akan memanggil system calls sesuai dengan sistem operasinya. Tidak tertutup kemungkinan nama dari system calls sama dengan nama di API.
Gambar 1.Cara kerja API
8
Keuntungan memprogram dengan menggunakan API adalah: 1. Portabilitas Pengembang yang menggunakan API dapat menjalankan programnya dalam sistem operasi mana saja asalkan sudah ter-install API tersebut. Sedangkan system call berbeda antar sistem operasi, dengan catatan dalam implementasinya mungkin saja berbeda (Gambar 1). 2. Lebih mudah dimengerti API menggunakan bahasa yang lebih terstruktur dan mudah dimengerti daripada bahasa system call. Hal ini sangat penting dalam hal editing dan pengembangan (Gambar 2).
Gambar 2. API Network
System call interface ini berfungsi sebagai penghubung antara API dan system call yang dimengerti oleh sistem operasi. System call interface ini akan menerjemahkan perintah dalam API dan kemudian akan memanggil system calls yang diperlukan.
Untuk membuka suatu file tersebut user menggunakan program yang telah dibuat dengan menggunakan bantuan API, maka perintah dari user tersebut diterjemahkan dulu oleh program menjadi perintah open(). Perintah open() ini merupakan perintah dari API dan bukan perintah yang langsung dimengerti oleh kernel sistem operasi. Oleh karena itu, agar keinginan user dapat dimengerti oleh sistem operasi, maka perintah open() tadi diterjemahkan ke dalam bentuk system call oleh system call interface. Implementasi perintah open() tadi bisa bermacam-macam tergantung dari sistem operasi yang kita gunakan (Setiawan, 2014). 9
3. Facebook API Facebook adalah jejaring social terbesar di dunia (Statista, 2015), dimana para pengguna bisa membuat profil nya dan melakukan aktifitas unggah gambar atau video, saling mengirimkan pesan antar teman, kolega atau keluarga. Facebook memiliki antarmuka dengan 37 bahasa, dan memiliki beberapa fitur umum seperti user dapat bergabung di grup, membuat event, membuat halaman umum tentang beberapa topik, dan berkomunikasi dengan sesama penggunanya.
Di dalam profil pribadi pengguna, ada beberapa komponen media sosial. Yang paling populer ini bisa dibilang Wall, yang pada dasarnya adalah sebuah papan buletin virtual. Pesan yang ada di Wall pengguna dapat berupa teks, video atau foto. Komponen yang populer adalah Photo Album. Komponen lainnya profil populer adalah update status, fitur microblogging yang memungkinkan anggota untuk menyiarkan pengumuman seperti Twitter untuk teman-teman mereka. Semua interaksi yang diterbitkan dalam news feed, yang didistribusikan secara real-time ke temanteman pengguna. (Dean, 2014)
3.1 Facebook Login
Facebook Login adalah cara aman bagi orang-orang untuk dapat masuk ke aplikasi. Di Facebook Login memiliki fitur keamanan untuk melindungi data orang-orang dan dapat juga untuk mengontrol data apa saja yang akan di bagikan. Untuk di web, Facebook Login ini menggunakan varian dari protokol OAuth2.0 untuk memastikan identitas seseorang serta mengendalikan data apa saja yang akan dibagikan, mekanisme ini juga sama dengan yang digunakan pada iOS dan Android.
Ketika seseorang menghubungkan dengan sebuah aplikasi menggunakan Facebook Login, maka aplikasi akan selalu dapat mengakses profil publik mereka. Aplikasi mungkin akan meminta informasi lain juga. Ini dapat termasuk daftar teman yang menggunakan aplikasi, email, peristiwa yang mereka menghadiri, kampung halaman mereka atau hal-hal yang mereka suka. Semua ini tersedia di izin opsional, yang ada selama proses login. Aplikasi juga dapat meminta izin tambahan kemudian, setelah seseorang telah login. Orang yang menggunakan Facebook 10
Login bisa memilih untuk menolak berbagi data yang aplikasi inginkan. Jika ingin membuat sebuah Post di Facebook (penerbitan) maka harus menggunakan izin yang terpisah dari membaca data dalam profil seseorang.
Facebook menawarkan beberapa alur masuk untuk berbagai perangkat. Beberapa mudah diimplementasikan menggunakan SDK resmi, sementara yang lain akan membutuhkan beberapa kode tambahan. Berikut beberapa alur masuk yang menggunakan SDK resmi (Facebook, 2015a): 1. Login untuk iOS Apps atau Game 2. Login untuk Android Apps atau Game 3. Login untuk Website menggunakan Facebook JavaScript SDK 4. Login untuk Website tidak menggunakan Facebook JavaScript SDK 5. Login untuk game yang dimainkan di Facebook.com
3.2 Graph API
Graph API adalah inti dari Facebook Platform, dan cara utama aplikasi untuk membaca dan menulis ke Facebook. Graph API berbasis HTTP , sehingga bisa bekerja dengan bahasa yang memiliki HTTP library , seperti Curl , urllib. Graph API adalah representasi dari informasi di Facebook terdiri dari node, edges, dan fields. Nodes biasanya adalah sesuatu di Facebook, seperti User, sebuah Photo, sebuah Page, atau sebuah komentar. Edges adalah koneksi antara Nodes itu, seperti Photo di sebuah Page, atau komentar di sebuah Photo. Fields adalah info tentang Nodes tersebut, seperti nama dari sebuah Page, nama dari User dan tanggal lahir dari User.
Graph API memiliki beberapa versi yang tersedia untuk di akses pada satu waktu. Setiap versi berisi 1 set Fields inti dan beberapa operasi Edge. Facebook menjamin bahwa Core API akan tersedia dan tidak di ubah selama minimal 2 tahun dari rilis (Facebook, 2015b). 4. Twitter API Twitter adalah sebuah jaringan informasi yang terdiri dari pesan-pesan sepanjang 140 karakter yang disebut tweet (microblog). Dengan cara ini lebih mudah menemukan berita terbaru dengan 11
topik yang disukai. Pesan dari pengguna yang di pilih untuk diikuti akan ditampilkan di halaman beranda untuk di baca. Seperti siaran berita yang tajuknya selalu menarik minat pembaca, dapat menemukan berita hangat, mengetahui lebih lanjut tentang topik yang di minati, dan mendapatkan informasi terbaru secara aktual (Twitter, Inc., 2011). Untuk melakukan akses masuk ke server Twitter menggunakan Oauth untuk proses autentifikasi, maka pengguna dapat pula menggunakan pustaka PHP yang telah dibuat oleh pihak ketiga. 5. LinkedIn API LinkedIn adalah situs jaringan yang terkait dengan bisnis sosial. Didirikan pada bulan Desember 2002 dan diluncurkan pada Mei 2003, digunakan utama untuk jaringan profesional. Sejak diluncurkan dalam bahasa Indonesia Desember 2011, LinkedIn telah digunakan berbagai tingkatan profesional dan eksekutif, dan dilaporkan telah mencapai 1 juta pengguna. Menggunakan
LinkedIn
sama
mudahnya
seperti
menggunakan situs jaringan
sosial
lainnya. LinkedIn tidak menawarkan aplikasi permainan ataupun konten rekreatif lainnya, dan lebih mengarahkan secara khusus untuk koneksi para profesional (Bambang, 2012).
LinkedIn API menyediakan akses informasi untuk mendapatkan informasi pengguna dalam halhal sebagai berikut (LinkedIn Corp., 2015):
Industri
Geografi
Bahasa
Mata uang
Profil perusahaan
Jabatan
Fungsi/bidang pekerjaan
12
BAB III METODE PENELITIAN 1. Reduksi Halaman Temu Balik dan Pembentukan Kluster UPND Reduksi jumlah halaman hasil temu balik – dalam hal ini hasil dari Google1 API – dilakukan untuk menekan kompleksitas algoritma UPND, yang berada dalam O(n2). Secara intuitif, jika jumlah halaman temu balik berhasil direduksi, maka pembentukan kluster akan menjadi lebih efisien. Dalam penelitian tahap kedua ini diujicobakan sebuah pendekatan sederhana dalam mereduksi jumlah halaman hasil temu balik.
Algoritma yang dikembangkan, yaitu: Red-UPND, dapat dilihat dalam Listing 1. Secara umum yang dilakukan di dalam algoritma tersebut adalah mendeteksi tautan halaman web dari hasil temu balik dalam urutan 100 besar, dan membuang halaman-halaman urutan bawah yang mengandung tautan yang sama (Radlinski, 2011). Dengan demikian hanya akan menyisakan halaman yang terbaik (urutan tertinggi saja) saja.
Input: WL a list of web links, i.e. the query results from the search engine Output: UpndClust the UPND clusters Procedure: For all links (Li…Lj) ϵ WL do { Remove duplicate links(Li…Lj) Maintain the HURL, i.e. highest unique rank link in (Li…Lj) } Call UPND(HURL)->UpndClust Return UpndClust End Procedure
Listing 1. Algoritma Red-UPND untuk mereduksi duplikasi halaman hasil temu balik.
1
https://support.google.com/webmasters/answer/6080548?hl=en
13
2. Pembentukan Model Naïve Bayes Untuk dapat mendapatkan informasi seseorang maka diperlukan informasi yang tersebar di internet. Karena pesatnya perkembangan teknologi informasi, maka informasi di internet terlalu massive. Masalah selanjutnya adalah penduduk dunia yang amat banyak, mengakibatkan banyak orang yang memiliki nama yang sama. Oleh karena itu, perlu diimplementasikan algoritma yang membedakan satu individu dengan individu lainnya. Dalama penelitian ini, dipergunakan algoritma UPND sebagai salah satu teknik yang digunakan untuk mengelompokan individu.
Hasil setelah diterapkannya UPND adalah terbentuknya kluster halaman-halaman web yang terkait dengan nama seseorang. Konsekuensi terbentuknya kluster tersebut adalah dapat dihasilkannya nilai isi kluster yang beragam. Misalnya, profesi untuk seseorang yang bernama Evelyn sebagai seorang dokter terkelompok di kluster 1, Evelyn yang berprofesi sebagai programmer terdapat di kluster 2, dan Evelyn yang memimpin perusahan terdapat di kluster 3. Dari hasil yang dihasilkan, dapat ditemukan individu yang dicari diantara jutaan individu dengan nama yang sama.
Tidak hanya mengelompokan data-data individu, dalam penelitian ini diujicobakan deteksi profesi untuk setiap kluster. Hal ini erat kaitannya dengan seberapa banyak alumni UKM yang bekerja sesuai dengan disiplin ilmu yang mereka tempuh (menjawab pertanyaan riset pertama). Dalam penelitian ini didefinisikan 143 profesi manusia, sesuai dengan data yang terdapat dalam Wikipedia2 bahasa Indonesia.
Langkah pertama yang dilakukan adalah menebak profesi individu secara spesifik. Misalnya, Evelyn berprofesi sebagai dokter bedah, Fifie berprofesi sebagai programmer, dan Anastasia berprofesi sebagai seorang guru. Langkah kedua dari penebakan profesi dalam penelitian ini adalah memprediksi profesi seseorang secara umum. Contohnya, Evelyn berprofesi di bidang medis, Fifie bekerja di bidang IT Specialist, dan Anastasia bekerja di bidang pendidikan. Job prediction ini menebak profesi individu berdasarkan bidang kerja.
2
https://id.wikipedia.org/wiki/Kategori:Pekerjaan
14
Erat kaitannya dengan bidang kerja, universitas adalah wadah yang mempersiapkan setiap mahasiswa agar dapat mengembangkan dirinya menjadi seorang yang ahli di bidang tertentu. Di Universitas Kristen Maranatha, terdapat 9 fakultas. Fakultas-fakultas itu antara lain; fakultas kedokteran, fakultas ekonomi, fakultas IT, fakultas teknik, fakultas seni rupa dan desain, fakultas sastra, fakultas psikologi, fakultas kedokteran gigi, dan fakultas hukum. Berdasarkan fakultasfakultas tersebut, peneliti mengelompokan profesi sebagai berikut. Tabel 1. Pengelompokan Profesi berdasarkan Fakultas-Fakultas UKM
Fakultas
Profesi Umum
Fakultas Ekonomi
Ekonom
Fakultas Kedokteran
Dokter
Fakultas IT
IT specialist
Fakultas Seni Rupa dan Desain
Desainer
Fakultas Psikologi
Psikologi
Fakultas Kedokteran Gigi
Dokter
Fakultas Teknik
Engineer Specialist
Fakultas Sastra
Sastrawan
Fakultas Hukum
Politikus
Dalam penelitian ini, diterapkan 3 tahap pengelompokan profesi. Tabel 1 adalah tahap pertama pengelompokan profesi. Tahap I adalah tahap pengelompokan profesi berdasarkan fakultasfakultas di Universitas Kristen Maranatha. Tahap II adalah pengelompokan profesi berdasarkan disiplin ilmu di top-15 Sekolah Tinggi Indonesia (menurut survey SNMPTN 2015). Tabel 2 memberikan data top-15 Sekolah Tinggi Indonesia. Tabel 2. Top-15 Sekolah Tinggi Indonesia
Top
Nama Sekolah Tinggi
Kota
1
Sekolah Tinggi Akuntansi Negara - STAN
Jakarta
2
Sekolah Tinggi Hukum Militer – STHM
Jakarta
3
Sekolah Tinggi Ilmu Administrasi
Bandung
4
Sekolah Tinggi Ilmu Administrasi – LAN
Jakarta
5
Sekolah Tinggi Ilmu Administrasi – Ujung Pandang
Makasar
6
Sekolah Tinggi Ilmu Kepolisian PTIK
Jakarta
7
Sekolah Tinggi Ilmu Pelayaran – STIP
Jakarta
15
8
Sekolah Tinggi Ilmu Statistik – STIS
Jakarta
9
Sekolah Tinggi Manajemen Industri – STMI
Jakarta
10
Sekolah Tinggi Penerbangan Indonesia – STPI
Jakarta
11
Sekolah Tinggi Perikanan - STP
Jakarta
12
Sekolah Tinggi Pertahanan Nasional – STPN
Yogyakarta
13
Sekolah Tinggi Sandi Negara – STSN
Bogor
14
Sekolah Tinggi Seni Indonesia – STSI
Bandung
15
Sekolah Tinggi Seni Indonesia
Padangpanjang
Dari 15 Sekolah Teknik tersebut dapat dikembangkan pengelompokan tambahan dari profesi Tahap I. Tabel 3 menunjukan pengelompokan profesi Tahap II. Tabel 3. Tahap II Penentuan Jenis Profesi Umum (Utama).
Fakultas atau Bidang Keilmuan
Profesi Umum
Fakultas Ekonomi
Ekonom
Fakultas Kedokteran
Dokter
Fakultas IT
IT specialist
Fakultas Seni Rupa dan Desain
Desainer
Fakultas Psikologi
Psikologi
Fakultas Kedokteran Gigi
Dokter
Fakultas Teknik
Engineer Specialist
Fakultas Sastra
Sastrawan
Fakultas Hukum
Politikus
Akademi Penerbangan
Penerbangan
Akademi Kedisiplinan, Ketahanan Negara
Keamanan
Akademi Model dan Artis
Hiburan
Tahap III dari pengelompokan profesi ini adalah pengelompokan berdasarkan pengetahuan umum peneliti. Misalnya bidang keilmuan pendidikan dan teologi. Jika memang profesi tertentu dapat didapatkan seseorang tanpa berkuliah, maka profesi tersebut termasuk profesi lain-lain. Profesi-profesi yang dimaksud adalah algojo, badut, barista, buruh, buruh tani, butler, caddy, disjoki, dukun, juru parkir, dan sebagainya.
16
Tabel 4. Tahap III Penentuan Jenis Profesi Umum (Utama).
Fakultas atau Bidang Keilmuan
Profesi Umum
Fakultas Ekonomi
Ekonom
Fakultas Kedokteran
Dokter
Fakultas IT
IT specialist
Fakultas Seni Rupa dan Desain
Desainer
Fakultas Psikologi
Psikologi
Fakultas Kedokteran Gigi
Dokter
Fakultas Teknik
Engineer Specialist
Fakultas Sastra
Sastrawan
Fakultas Hukum
Politikus
Akademi Penerbangan
Penerbangan
Akademi Kedisiplinan, Ketahanan Negara
Keamanan
Akademi Model dan Artis
Hiburan
Pendidikan
Pendidikan
Keagamaan
Teologi
Profesi tanpa bidang keahlian
Lain-lain
Tabel 5 menunjukan profesi-profesi spesifik yang termasuk dalam kelas ekonom. Tabel 5. Profesi Spesifik Kelas Ekonom
Profesi Spesifik Ekonom Akuntan Akuntan publik Auditor Broker properti Ekonom Makelar
Tabel 6 menunjukan profesi-profesi spesifik yang termasuk dalam kelas medis.
17
Tabel 6. Profesi Spesifik Kelas Medis
Profesi Spesifik Medis Ahli bedah Ahli gizi Apoteker Asisten apoteker Bidan Dokter Paramedis Perawat
Tabel 7 menunjukan profesi-profesi spesifik yang termasuk dalam kelas IT Specialist. Tabel 7. Profesi Spesifik Kelas IT Specialist
Profesi Spesifik Illustrator Peretas Programmer
Tabel 8 menunjukan profesi-profesi spesifik yang termasuk dalam kelas Engineer Specialist. Tabel 8. Profesi Spesifik Kelas Engineer Specialist
Profesi Spesifik Insinyur Teknisi Arsitek
Tabel 9 menunjukan profesi-profesi spesifik yang termasuk dalam kelas sastrawan. Tabel 9. Profesi Spesifik Kelas Sastrawan
Profesi Spesifik Kurator Novelis Penerjemah bahasa Pengarang
18
Profesi Spesifik Penulis skenario Penyair
Tabel 3.10 menunjukan profesi-profesi spesifik yang termasuk dalam kelas desainer. Tabel 10. Profesi Spesifik Kelas Desainer
Profesi Spesifik Desainer Desainer huruf Illustrator Pelukis Pemahat Penjahit Perancang grafis Perupa Seniman
Tabel 11 menunjukan profesi-profesi spesifik yang termasuk dalam kelas politikus. Tabel 11. Profesi Spesifik Kelas Politikus
Profesi Spesifik Politikus Diktator Hakim Jaksa Pengacara
Tabel 12 menunjukan profesi-profesi spesifik yang termasuk dalam kelas psikolog. Tabel 12. Profesi Spesifik Kelas Psikolog
Profesi Spesifik Psikolog Psikiater
19
Tabel 13 menunjukan profesi-profesi spesifik yang termasuk dalam kelas pendidikan. Tabel 13. Profesi Spesifik Kelas Pendidikan
Profesi Spesifik Guru Dosen Konselor pendidikan Professor Pustakawan
Tabel 14 menunjukan profesi-profesi spesifik yang termasuk dalam kelas teologi. Tabel 14. Profesi Spesifik Kelas Teologi
Profesi Spesifik Konselor Penasihat perkawinan Ustad Kiai Pastur Pendeta Rohaniwan
Tabel 15 menunjukan profesi-profesi spesifik yang termasuk dalam kelas hiburan. Tabel 15. Profesi Spesifik Kelas Hiburan
Profesi Spesifik Aktor Go go dancer Pramuwisata
Tabel 16 menunjukan profesi-profesi spesifik yang termasuk dalam kelas keamanan. Tabel 16. Profesi Spesifik Kelas Keamanan
Profesi Spesifik Polisi Polisi khusus kereta api
20
Profesi Spesifik Satpam
Tabel 17 menunjukan profesi-profesi spesifik yang termasuk dalam kelas penerbangan. Tabel 17. Profesi Spesifik Kelas Penerbangan
Profesi Spesifik Pilot Co pilot Pramugari
Bila seseorang adalah dokter maka akan besar kemungkinan informasi tentang orang tersebut mengarah ke deskripsi dan ciri-ciri seorang dokter. Kemudian dihitung bobot dari kata-kata deskripsi pekerjaan dan deskripsi seseorang. Teknik klasifikasi yang digunakan dalam penelitian ini adalah Naïve Bayes classifier. Naïve bayes classifier adalah klasifikasi yang menggunakan teorema Bayesian. Teorema Bayes digunakan untuk menghitung probabilitas terjadinya suatu peristiwa berdasarkan pengaruh yang didapat dari hasil observasi. 3. Eksplorasi API dalam Berbagai Media Sosial Eksplorasi mengenai fitur API dilakukan pada media sosial Facebook, Twitter dan LinkedIn. Hasil eksplorasi dituangkan dalam bentuk dokumentasi lengkap dari semua beserta contoh pemakaiannya. Pengembangan aplikasi berbasis web dilakukan untuk mengetahui potensi setiap fitur API tersebut dan bagaimana kode sumber dapat digunakan secara lebih aplikatif. 4. Perancangan Prototipe Sistem VILTER Perancangan prototipe dilakukan berbasis orientasi obyek dengan berfokus pada skenario pemanfaatannya oleh calon pengguna (use case).
21
BAB IV HASIL DAN ANALISIS 1. Reduksi Halaman Temu Balik Hasil eksperimen dengan menggunakan algoritma Red-UPND pada Listing 1 menunjukkan potensi reduksi waktu eksekusi yang cukup signifikan. Tabel 18 menunjukkan perbandingan lama waktu eksekusi pembentukan kluster untuk 119 nama alumni dari hasil tracer study UKM terakhir. Tabel 18. Perbandingan Lama Waktu Eksekusi UPND dan Red-UPND
Jenis
Mulai
Selesai
Lama Waktu (Jam)
UPND
22 Mei 2015 (13:30)
03 Jun 2015 (15:50)
290.33
Red-UPND
09 Jul 2015 (16:10)
13 Jul 2015 (15:25)
95.25
Hasil dalam Tabel 18 menunjukkan selisih waktu eksekusi3 yang sangat signifikan, yaitu 195.08 jam atau terjadi 67.20% efisiensi waktu. Hal ini juga menunjukkan bahwa banyak terjadi redundansi dalam hasil temu balik oleh Google. Dari pengamatan ada dua penyebab utama terjadinya redundansi tersebut: 1. Bentuk kueri yang dimasukkan ke dalam mesin temu balik ada kueri-kueri yang berupa frasa, misalnya kombinasi kueri "NAMA"+"UNIVERSITAS"+"JURUSAN". Meskipun setiap kata kunci sudah dijadikan sebagai frasa, namun halaman-halaman yang ditemukan tetap mengandung halaman-halaman yang bernilai true-positive, baik untuk sebagian maupun keseluruhan kueri. 2. Banyaknya halaman dari media sosial yang saling merujuk satu dengan lainnya untuk nama-nama popular.
Jika ditinjau dari sisi kualitas kluster yang terbentuk, maka antara hasil UPND dan Red-UPND sepintas terlihat tidak terlalu jauh berbeda, bahkan ada beberapa kueri yang berkualitas lebih baik. Hal ini ditunjukkan dalam Tabel 19 yang menunjukkan selisih akurasi penggunaan RedUPND dan UPND. Evaluasi yang dilakukan untuk kualitas memakai strategi yang sama seperti 3
Eksperimen dilakukan dengan Intel i3 CPU 3.07 GHz.; 14 GB RAM.
22
pada tahap penelitian pertama sebelumnya, yaitu dengan menggunakan konsep string matching melalui longest common subsequnce (LCS). Tabel 19. Selisih Akurasi Penggunaan Red-UPND dan UPND
DIFFERENCE [RedUPND - UPND] KUERI (119 alumni per kueri) Nama + Univ inggris + Jur Inggris Nama + Univ indo + jur indo Nama + Univ Inggris Nama + Univ Indo Nama Nama + Jurusan Indo Nama + Jurusan Inggris
Kelengkapa Tanggal n Nama Asal SMU Propinsi Tempat lahir lahir (1.82) 1.95 3.05 (2.08) 1.26 2.93 (0.41) 0.36 2.02 0.37 (4.13) 0.27 (6.07) (4.51) (1.01) (1.40) (2.25) (6.32) (1.63) (0.41) 0.91 0.35 (0.59) (0.76) (0.37) 0.85 0.19 0.23 (0.08) 0.22 0.99 (1.06) (0.69) (2.11) 0.11
Alamat kantor 0.72 0.52 (1.39) 2.37 (0.04) 0.43 1.05
Alamat rumah 0.52 0.27 (0.54) (0.91) (0.02) 0.03 (0.19)
Tahun masuk (8.73) (8.83) (5.66) 6.10 17.96 5.55 7.83
Alamat Average e-mail 11.72 0.73 9.23 0.72 0.62 (2.49) (11.52) (1.77) (18.85) (0.16) (5.32) 0.23 (7.67) (0.19)
Nilai akurasi yang diperbaiki dengan penggunaan RedUPND ditunjukkan dengan sel pada tabel yang diberi arsiran berwarna hitam. Terlihat bahwa dengan menggunakan kombinasi "NAMA"+"UNIVERSITAS"+"JURUSAN" menghasilkan perbaikan, meskipun tidak signifikan.
Secara statistik perbedaan signifikan (p=0.05), hanya ditunjukkan oleh kombinasi kueri "NAMA"+"UNIVERSITAS
INGGRIS", yaitu penurunan sekitar 2.5% secara rata-rata. Hal ini
mengindikasikan adanya informasi-informasi yang hilang melalui pemanfaatan Red-UPND untuk kombinasi kueri tersebut. Dengan kata lain, cukup banyak alumni yang menyediakan informasi dalam bahasa Inggris, meskipun hal ini bukan berarti konten halaman web adalah dalam bahasa Inggris seluruhnya, namun ada bagian-bagian tertentu yang tersaji dalam bahasa Inggris.
Secara umum, hasil penggunaan Red-UPND tidak berbeda secara signifikan dengan UPND. Hasil akurasi terbaik tetap diperoleh oleh kombinasi kueri "NAMA"+"UNIVERSITAS"+"JURUSAN", baik untuk bahasa Indonesia maupun bahasa Inggris, dengan nilai rata-rata akurasi sebesar 32.57% dan 32.66%. 2. Pembentukan Model Naïve Bayes Probabilitas Bayesian adalah suatu interpretasi dari kalkulus yang memuat konsep probabilitas sebagai derajat dimana suatu pernyataan dipercaya benar. Teori Bayesian juga dapat digunakan 23
sebagai alat pengambilan keputusan untuk memperbaharui tingkat kepercayaan dari suatu informasi. Teori probabilitas Bayesian merupakan satu dari cabang teori statistik matematik yang memungkinkan kita untuk membuat satu model ketidakpastian dari suatu kejadian yang terjadi dengan menggabungkan pengetahuan umum dengan fakta dari hasil pengamatan. Oleh karena itu, teknik Naïve Bayes Classifier berpotensi untuk dapat digunakan untuk menebak pekerjaan seseorang berdasarkan model yang dibuat dari fakta deskripsi-deskripsi kata profesi.
Teorema Bayes menerangkan hubungan antara probabilitas terjadinya peristiwa A dengan syarat peristiwa B telah terjadi dan probabilitas terjadinya peristiwa B dengan syarat peristiwa A telah terjadi. Teorema ini didasarkan pada prinsip bahwa tambahan informasi dapat memperbaiki probabilitas. Teorema Bayes ini bermanfaat untuk mengubah atau memutakhirkan probabilitas yang dihitung dengan tersedianya data dan informasi tambahan. Sesuai dengan probabilitas subyektif, bila seseorang mengamati kejadian B dan mempunyai keyakinan bahwa ada kemungkinan B akan muncul, maka probabilitas B disebut probabilitas prior. Setelah ada informasi tambahan bahwa misalnya kejadian A telah muncul, mungkin akan terjadi perubahan terhadap perkiraan semula mengenai kemungkinan B untuk muncul. Probabilitas untuk B sekarang adalah probabilitas bersyarat akibat A dan disebut sebagai probabilitas posterior. Teorema Bayes merupakan mekanisme untuk memperbaharui probabilitas dari prior menjadi probabilitas posterior, lihat pada Formula (2).
… (2) Dalam penerapannya untuk prediksi profesi, dibentuk 134 kelas sesuai dengan profesi detil pada Tabel 5-17 pada bab sebelumnya. Adapun strategi prediksi profesi dapat dilakukan dengan beberapa kombinasi, yaitu: 1. Semua kata pada kelas profesi umum 2. Kata benda saja pada kelas profesi umum 3. Kata kerja saja pada kelas profesi umum 4. Semua kata pada kelas profesi spesifik 24
5. Kata benda saja pada kelas profesi spesifik 6. Kata kerja saja pada kelas profesi spesifik 7. Agregasi kluster dengan semua kata pada hirarki kelas profesi umum dan spesifik 8. Agregasi kluster dengan kata benda saja pada hirarki kelas profesi umum dan spesifik 9. Agregasi kluster dengan kata kerja saja pada hirarki kelas profesi umum dan spesifik
Pada saat ini eksperimentasi dengan kesembilan skenario di atas sedang dilangsungkan dengan memanfaatkan 119 nama dari hasil tracer study UKM yang terakhir. Listing 2 di bawah ini memberikan contoh pemanfaatan hasil Red-UPND untuk sebuah nama, yaitu Ade Kurnia Surawijaya, dan prediksi profesinya. Full Name
: Ade Kurnia Surawijaya
Top-n, n
: 100
Choose one category : 1. All + General 2. Noun + General 3. Verb + General 4. All + Specific 5. Noun + Specific 6. Verb + Specific Your choice : 1
### CLUSTER 1 ### P(psikolog|Wn) = 0.00012 P(sastrawan|Wn) = 0.00006 P(ekonom|Wn) = 0.00002
### CLUSTER 2 ### P(politikus|Wn) = 0.00003 P(ekonom|Wn) = 0.000002 P(psikolog|Wn) = 0.0000003
### CLUSTER 3 ### P(psikolog|Wn) = 0.00002 P(desainer|Wn) = 0.00001 P(ekonom|Wn) = 0.0000009
25
### CLUSTER 4 ### P(desainer|Wn) = 0.00021 P(sastrawan|Wn) = 0.000002 P(psikolog|Wn) = 0.0000006
=== AGREGATION CLUSTER === P(desainer|Wn) = 0.00021 P(psikolog|Wn) = 0.00012 P(politikus|Wn) = 0.00003 P(ekonom|Wn) = 0.00002
Listing 2. Contoh Prediksi Pekerjaan untuk Sebuah Nama dari Hasil Red-UPND
Contoh pada Listing 2 adalah hasil prediksi profesi untuk 'Ade Kurnia Surawijaya', dengan mengambil 100 kata terbanyak dari deskripsi nama tersebut dan menggunakan penebakan profesi secara umum tanpa mengelompokan kelas kata (semua kata, termasuk kata benda dan kata kerja). Kluster agregasi adalah perhitungan penebakan profesi dari satu individu, yakni mengambil nilai terbesar dari setiap cluster.
Dari hasil agregasi yang terbentuk, diketahui bahwa kelas desainer memiliki nilai tertinggi, namun kelas psikolog merupakan mayoritas. Kesimpulan yang diambil adalah Ade adalah seorang yang bekerja di bidang psikolog. Metode agregasi yang dipakai adalah sistem voting dari top-3 hasil prediksi dalam setiap kluster. Jika hasil agregasi menghasilkan keadaan yang seimbang, maka akan diambil dari nilai probabilitas yang terbesar. 3. Eksplorasi API dalam Berbagai Media Sosial Eksplorasi telah dilakukan oleh dua orang mahasiswa S1 Teknik Informatika pada periode Kerja Praktek Magang di bulan Juli-Agustus yang lalu. Hasil eksplorasi dituangkan dalam bentuk dokumentasi pemanfaatan API untuk media sosial Facebook, Twitter dan LinkedIn. Walaupun belum berbentuk sebagai suatu aplikasi khusus, namun hasil telah eksplorasi menunjukkan: 1. Adanya fitur API pada jejaring sosial memudahkannya pengembang untuk mendapatkan informasi yang terdapat pada setiap pengguna yang terhubung dalam jejaring sosial tersebut. 26
2. Untuk mengakses REST API pengguna dapat menggunakan pemrograman PHP dengan menggunakan library yang telah dibuat oleh pihak ketiga. 3. Tidak semua API dapat di akses untuk diambil datanya. Beberapa jejaring sosial biasanya membatasi penggunaan fitur pada API untuk melindungi data penting yang di simpan oleh setiap pengguna. Hal ini akan menjadi titik perhatian dalam pengembangan prototipe VILTER. 4. Dengan menggunakan REST API ini pengguna dapat mengambil data data yang di perlukan untuk kebutuhan. Seperti melihat data profile pengguna lain dan menyimpannya ke dalam struktur basis data terpisah. Adapun ruang lingkup eksplorasi Facebook API adalah sebagai berikut (beberapa hasil dan tampilan dapat dilihat dalam Lampiran A):
Create App
Authentication
Parameter
User
Page
Group
Search
Post
Comment dan Likes
Event
Album
Ruang lingkup eksplorasi Twitter API adalah sebagai berikut (beberapa hasil dan tampilan dapat dilihat dalam Lampiran B):
Statuses
Direct Messages
Search
Friends
Followers 27
Friendship
Blocks
Users
Favorites
Show
Members
Membership
Subscriber
Supscriptions
Ruang lingkup eksplorasi LinkedIn API adalah sebagai berikut (beberapa hasil dan tampilan dapat dilihat dalam Lampiran C):
Koneksi dan autentikasi
Member profile
Full member profile
Company profile
Developer Program Transition
Berikut dalam Listing 3 diberikan cuplikan hasil dari ekstraksi profil dasar untuk seorang anggota LinkedIn, yaitu ‘Faqih Salban’. 1. SimpleXMLElement Object 2. ( 3. [id] => eCXH_7IcJo 4. [first-name] => Faqih 5. [last-name] => Salban 6. [formatted-name] => Faqih Salban 7. [headline] => Computer Network Engineer 8. [location] => SimpleXMLElement Object 9. ( 10. [name] => West Java Province, Indonesia 11. [country] => SimpleXMLElement Object 12. ( 13. [code] => id 14. ) 15. 16. ) 17. [email-address] =>
[email protected] 18. [industry] => Information Technology and Services 19. [current-share] => SimpleXMLElement Object
28
… 20. 21.
[comment] => I connected my LinkedIn and SlideShare accounts [position] => SimpleXMLElement Object …
22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40.
[start-date] => SimpleXMLElement Object ( [year] => 2014 [month] => 3 ) [is-current] => true [company] => SimpleXMLElement Object ( [id] => 2388818 [name] => NoLimit Indonesia [size] => 11-50 employees [type] => Privately Held [industry] => Information Technology and Services ) ) ) …
41. 42. )
[public-profile-url] => https://www.linkedin.com/in/faqihsalban
Listing 3. Cuplikan Hasil dari Ekstraksi Profil Dasar LinkedIn
Bagian yang diarsir dengan warna kuning memberikan beberapa informasi penting, seperti: alamat email, pekerjaan, lokasi tempat tinggal, tahun bergabung dengan LinkedIn, bidang profesi. Dengan diperolehnya informasi mengenai perusahaan beserta tahun dan tanggal bergabungnya anggota, diharapkan dapat menjawab pertanyaan riset kedua.
Ekstraksi informasi penting lainnya dapat dilakukan melalui pemanfaatan 'Full Member Profile'. Namun hal ini tidak selalu dapat dilakukan karena memerlukan 'Private ID' dari anggota yang tidak selalu tersedia, karena memerlukan persetujuan (approval) dari anggota yang bersangkutan terkait aplikasi yang dikembangkan, dan juga harus lolos dari ijin otentikasi LinkedIn. Selain permasalahan di atas, untuk ekstraksi full profile perlu dipertimbangkan pula perlunya 'sistem jemput bola' dari pengembang aplikasi untuk meminta keterlibatan aktif dari anggota media sosial dalam hal approval tersebut. 29
4. Perancangan Prototipe Sistem VILTER Pada bagian ini disampaikan hasil perancangan prototipe sistem VILTER yang akan dikembangkan dalam penelitian tahap ketiga. Dalam penelitian tahap ketiga tersebut akan dilakukan pula evaluasi secara online dengan melibatkan beberapa alumni di luar 119 nama yang telah digunakan sebelumnya. Hal ini dilakukan untuk dapat mengetahui tingkat responsi yang didapatkan melalui sistem yang lebih terbuka (bukan hanya sekedar pengisian survei).
Di dalam sistem VILTER akan diijinkan tiga jenis tingkatan pengguna utama, yaitu pihak pengelola (UKM) dan pihak alumnus (dan juga umum). Kemampuan utama dari pihak pengelola adalah untuk melakukan proses indeksasi dan klusterisasi untuk disimpan di dalam basis data dan diharapkan dapat melengkapi basis data yang ada sekarang ini. Sedangkan kemampuan utama dari pihak alumnus adalah untuk melakukan temu balik informasi terkait nama alumni tertentu, serta dapat memberikan umpan balik. Gambar 4 memberikan use case dari prototipe yang direncanakan. Tampilan utama situs VILTER dapat dilihat pada Gambar 3.
Gambar 3. Tampilan Utama Prototipe VILTER
30
Statistik pekerjaan lulusan dapat dilihat oleh semua aktor dimana data ini merupakan gabungan dari prediksi data pekerjaan otomatis dan manual. Data alumnus akan otomatis dilengkapi dengan prediksi data pekerjaan dimana data tersebut nantinya dapat dikoreksi kembali oleh alumnus terkait. Pengguna dapat memilih filter yang akan digunakan dalam menampilkan data dimana pemilihan filter dapat dilihat pada Gambar 5.
Vilter System Lihat Calon Pekerja
Guest
Kontak Admin
Lihat Statistik Pekerjaan Lulusan
Update Data Pribadi sebagai Alumni Alumnus Lihat Log
Atur Indeks Data Alumnus
Admin
Atur Data Alumnus
Atur Data Admin
Atur Profil
Gambar 4. Use case Prototipe Sistem VILTER
31
Gambar 5. Seleksi Tampilan Sesuai Kebutuhan Pengguna
Pengguna dapat memilih untuk menampilkan data statistik berdasarkan tahun, bidang pekerjaan, atau nama perusahaan. Jika pengguna memilih menampilkan berdasarkan tahun, maka pengguna hanya dapat memfilter berdasarkan bidang pekerjaan dan nama perusahaan. Jika pengguna memilih menampilkan berdasarkan bidang pekerjaan, maka pengguna hanya dapat memfilter berdasarkan range tahun dan nama perusahaan. Hal yang serupa juga akan dilakukan jika pengguna memilih berdasarkan nama perusahaan. Contoh tampilan jika pengguna memilih menampilkan data berdasarkan bidang pekerjaan dapat dilihat pada Gambar 6.
Setelah pengguna menekan tombol filter, maka data statistik akan ditampilkan dimana contoh tampilan dapat dilihat pada Gambar 7-9. Pengguna dapat memilih mode tampilan yang diinginkan, berdasarkan jenis graf yang diinginkan. Khusus untuk tampilan berdasarkan tahun, pengguna dapat menampilkan dalam representasi graf. Pengguna dapat memfilter ulang dengan menekan tombol refilter dimana tombol ini akan mengalihkan situs ke halaman filter awal.
32
Gambar 6. Tampilan Seleksi Berdasarkan Bidang Pekerjaan
Gambar 7. Statistik Data Mode Bar Chart
33
Gambar 8. Statistik Data Mode Pie Chart
Gambar 9. Statistik Data Mode Line Chart
Beberapa contoh tampilan lainnya berdasarkan informasi yang hendak diperlihatkan dapat dilihat pada Gambar 10-14.
34
Gambar 10. Tampilan Bar Chart pada Bidang Pekerjaan
Gambar 11. Tampilan Pie Chart pada Bidang Pekerjaan
35
Gambar 12. Tampilan dengan Filter Tahun pada Bidang Pekerjaan
Gambar 13. Tampilan dengan Filter Bidang Pekerjaan pada Tahun
36
Gambar 14. Tampilan dengan Filter Bidang Pekerjaan dan Ttempat Pekerjaan pada Tahun
Pengguna umum (Guest) dapat melihat calon pekerja dan dapat mengunduh CV mereka. Calon pekerja yang ditampilkan hanyalah alumnus yang menyatakan bersedia untuk menampilkan datanya pada bagian ini. Beberapa alumnus akan otomatis dianggap bekerja jika data pekerjaan alumnus tersebut ditemukan pada internet atau alumnus tersebut mengubah informasi kesediaaannya. Contoh tampilan list calon pekerja dapat dilihat dalam Gambar 15.
Guest dapat menghubungi pihak UKM dengan memilih fitur contact us. Contact us akan otomatis mengirimkan email pada administrator. Pengguna akan mendapatkan balasan ke email yang diberikan pada kolom your email. Contoh tampilan contact us dapat dilihat pada Gambar 16.
37
Gambar 15. Contoh tampilan list calon pekerja
Gambar 16. Contoh tampilan Contact Us
Alumnus dapat mengubah data pribadi alumnus (termasuk mengkoreksi hasil prediksi pekerjaan) dengan cara memilih update your alumnus profile. Untuk mengubah data alumnus, pengguna disarankan menggunakan akun SAT yang diperolehnya selama masa perkuliahan (Gambar 17). 38
Gambar 17. Tampilan Login untuk Alumnus dengan Akun SAT
Setelah login, pengguna dapat meng-update data pribadi. Pengguna juga dapat menambahkan tautan media sosial yang dimilikinya guna mempermudah sistem mengekstrak data pekerjaan. Contoh tampilan update data pribadi dapat dilihat pada Gambar 18.
Gambar 18. Tampilan update Data Pribadi
39
Alumnus dapat memilih untuk save data alumnus dan logout. Pada data pribadi alumnus terdapat ceklis “add me in find your employees section”, dimana ceklis ini digunakan untuk menentukan apakah data alumnus disertakan dalam section find your employees atau tidak. Section find your employees merupakan bagian yang akan sering diakses oleh para calon pemberi pekerjaan. Alumnus juga dapat mengunggah CV dalam bentuk doc atau pdf pada bagian update alumnus profile. CV tersebut nantinya dapat diakses oleh para calon pemberi pekerjaan pada section find your employees.
Admin dapat mengakses fitur admin dengan mengakses halaman 'administrator.php' dari url. Admin harus login terlebih dahulu menggunakan akun admin. Contoh tampilan login untuk admin dapat dilihat pada Gambar 19.
Gambar 19. Tampilan Login untuk Administrator (pihak UKM)
Setelah login, seorang admin dapat melihat log rincian tindakan yang telah dilakukan oleh para admin lainnya untuk melihat aktivitas, notifikasi, serta aksi yang perlu dilakukan. Log ini hanya akan menyimpan semua rangkaian aktifitas sebulan terakhir (Gambar 20).
40
Gambar 20. Tampilan Log Aktivitas para Administrator (pihak UKM)
Seorang administrator dapat memprediksi pekerjaaan untuk beberapa alumnus dengan memilih fitur alumnus indexes. Fitur ini akan menginformasikan data alumnus mana yang sudah diindeks, yang sedang diindeks, dan yang belum diindeks (Gambar 21-22). Sebelum masuk ke halaman data indeks alumnus, pengguna dapat memfilter data alumnus yang akan ditampilkan.
Gambar 21. Contoh Tampilan untuk Melakukan Proses Indeksasi Alumnus (1)
41
Gambar 22. Contoh Tampilan untuk Melakukan Proses Indeksasi Alumnus (2)
Seorang administrator dapat melihat detil data alumnus dengan menekan tombol detail dan dapat memilih aksi terhadap data indeks pada bagian action. Data yang sudah terindeks dapat dibuang, data yang sedang diindeks dapat dibatalkan, dan data yang belum diindeks dapat mulai diindeks. Admin juga dapat mengatur data alumnus dan admin pada situs dimana data alumnus dapat diimpor menggunakan berkas csv. Seorang administrator dapat meng-update informasi pribadi mengenai dirinya sendiri, seperti mengubah password dan mengubah username pada section profile. Adapun use case yang khusus ditujukan untuk administrator dalam kaitannya dengan proses indeksasi alumnus dapat dilihat pada Gambar 23.
Gambar 23. Use case Mesin Pencari Informasi Individu dan Job Prediction
42
BAB V KESIMPULAN & KEBERLANJUTAN 1. Kesimpulan Dalam penelitian tahap kedua ini telah tercapai hal-hal sebagai berikut: 1. Perbaikan proses pembentukan kluster UPND dengan melakukan reduksi jumlah halaman
hasil temu balik mesin pencarian Google melalui penerapan algoritma Red-UPND. Penerapan algoritma tersebut berhasil menekan sekitar 67% kompleksitas UPND dengan akurasi kluster yang tidak berbeda secara signifikan (lihat Tabel 18 pada subbab IV.1). 2. Telah dikembangkan model profesi untuk 143 jenis pekerjaan yang dikelompokkan ke dalam
12 kelas utama bidang pekerjaan (subbab IV.2). Telah dikembangkan pula mekanisme agregasi kluster hasil UPND untuk prediksi pekerjaan dengan pendekatan hirarkis melalui voting dan perhitungan nilai probabilitas terbesar. 3. Telah dilakukan eksplorasi API dalam tiga media sosial, yaitu Facebook, Twitter dan
LinkedIn. Dari ketiga media sosial tersebut terkuak potensi untuk mendapatkan profil pengguna (dalam hal ini diasumsikan alumni terlibat di dalamnya). Dalam profil-profil tersebut dapat diekstrak informasi dasar, seperti: alamat email, bidang pekerjaan, perusahaan, dan waktu bekerja (subbab IV.3; contoh-contoh hasil ekstraksi dapat dilihat dalam Lampiran A-C). 4. Telah dibentuk perancangan prototipe VILTER untuk dikembangkan lebih lanjut dalam
tahap penelitian berikutnya (subbab IV.4). Diharapkan bahwa melalui prototipe semacam ini dapat dievaluasi potensi keterlibatan alumni dalam proes pelacakan alumni secara lebih otomatis dan terstruktur. Selain itu diharapkan pula bahwa prototipe dapat memberikan 'asumsi' terkait aktivitas alumni setelah kelulusan melalui pemanfaatan hasil temu balik dan ekstraksi informasi dari media sosial. 2. Keberlanjutan Dalam tahap penelitian ketiga berikutnya (sampai dengan bulan Desember 2015), akan dilaksanakan aktivitas-aktivitas sebagai berikut:
43
1. Melakukan eksperimentasi untuk melihat komposisi model yang mewakili kebutuhan
pelacakan alumni dengan sembilan skenario sebagaimana diberikan pada subbab IV.2. 2. Mengembangkan prototipe berdasarkan use case dan skenario penggunaan yang telah
diberikan dalam subbab IV.4, dengan menerapkan pula peran media sosial melalui implementasi API (subbab IV.3) dalam prototipe tersebut. 3. Melakukan evaluasi melalui proses pelacakan alumni virtual dengan membandingkan dataset
119 alumni sebagaimana didapatkan dari UKM dan dataset baru yang saat ini sedang dikembangkan. Dataset baru tersebut dikembangkan dengan melibatkan para alumni Fakultas Teknologi Informasi periode 2006-2014. Sampai dengan tanggal 17 September 2015 telah terkumpul sekitar 40 alumni yang telah memberikan informasi tahap awal (melalui email:
[email protected]), berisi informasi mengenai: a. Tahun masuk b. Waktu/periode kelulusan; c. Pekerjaan pertama beserta instansi; d. Waktu yang diperlukan untuk memperoleh pekerjaan pertama; e. Pekerjaan saat ini; f.
Instansi pekerjaan saat ini
Beberapa alumni dalam 119 nama yang diperoleh dari UKM akan dipilih berdasarkan potensi keikutsertaannya sebagai pembanding terhadap dataset tersebut. Diharapkan hasil evaluasi ini akan dapat memberikan pula perbandingan tingkah laku antara alumni berlatar belakang teknologi informasi dan non-teknologi informasi.
44
45
DAFTAR PUSTAKA Bambang. (2012, Februari 27). Apa itu LinkedIn? Yuk berjelajah ke LinkedIn. Retrieved Juli 28, 2015,
from
http://gadgetan.com/:
http://gadgetan.com/apa-itu-linkedin-yuk-berjelajah-ke-
linkedin/17883
Bui, A. A., & Taira, R. K. (2010). Medical Imaging Informatics. London: Springer Science+Business Media, LLC.
Dean,
A.
(2014,
Agustus).
Facebook.
Dipetik
Juli
28,
2015,
dari
WhatIs.com:
http://whatis.techtarget.com/definition/Facebook
Delgado, A. D., Martınez, R., Fresno, V., & Montalvo, S. (2014). A Data Driven Approach for Person Name Disambiguation in Web Search Results. In COLING, 2014.
Facebook. (2015a). Facebook Login Overview. Dipetik Juli 28, 2015, dari Developer Facebook: https://developers.facebook.com/docs/facebook-login/overview/v2.3
Facebook. (2015b). Graph API Overview. (Facebook) Dipetik Juli 28, 2015, dari Facebook Developer: https://developers.facebook.com/docs/graph-api/overview
LinkedIn Corp. (2015, Juli 29). LinkedIn Developers Documentation. Retrieved from developer.linkedin.com: https://developer.linkedin.com/docs/
Manning, C. D., Raghavan, P., & Schütze, H. (2008). Introduction to Information Retrieval. Cambridge: Cambridge University Press.
Prasetyo, A. B. (2014, Januari 2). Mudahnya Memahami Application Programming Interface (API). Retrieved Juli 31, 2015, from jejaring.web.id/: http://www.jejaring.web.id/mudahnyamemahami-application-programming-interface-api/
46
Radlinski, F., Bennett, P. N., & Yilmaz, E. (2011, February). Detecting duplicate web documents using clickthrough data. In Proceedings of the fourth ACM international conference on Web search and data mining (pp. 147-156). ACM.
Setiawan, W. (2014, Agustus 17). Apa itu API?. Dipetik Juli 28, 2015, dari Logbook: https://wirasetiawan29.wordpress.com/2014/08/17/apa-itu-api/
Statista. (2015, Maret). Global Social Network Ranked bu number of User 2015. Dipetik Juli 31, 2015,
dari The Statistics
Portal:
http://www.statista.com/statistics/272014/global-social-
networks-ranked-by-number-of-users/
Twitter,
Inc.
(2011).
Memulai
Twitter.
(Twitter)
Retrieved
Juli 28,
2015,
from
https://support.twitter.com/groups/31-twitter-basics/topics/104-welcome-to-twittersupport/articles/20169365-twitter-101-bagaimana-cara-saya-memulai-menggunakan-twitter#
Wenyuan, D., Gui-Rong, X., Qiang, Y., & Yong, Y. (2007). Transferring Naive Bayes Classifiers for Text Classification. Association for the Advancement of Artificial.
47
LAMPIRAN A HASIL FACEBOOK API Login Pengguna
Tempat Bekerja
48
Asal Sekolah Menengah
Tempat Kuliah (Universitas)
49
Pertemanan dan Aktivitas dalam Grup Facebook
50
LAMPIRAN B HASIL TWITTER API Login Pengguna
Ekstraksi Profil Sebuah Akun Twitter
51
LAMPIRAN C HASIL LINKEDIN API Login Pengguna
Profil Seorang Pengguna Akun LinkedIn
52