Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016
ISSN: 2089-9815
PEMBANGUNAN SISTEM TEMU BALIK INFORMASI (INFORMATION RETRIEVAL) DALAM PEMILIHAN PEMAIN SEPAK BOLA BERKUALITAS DI INDONESIA BERBASIS ANALISIS SENTIMEN Wina Witanti, Herry Rahmanto, Faiza Renaldi Program Studi Informatika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Jenderal Achmad Yani Jl. Terusan Jenderal Sudirman, PO BOX 148 Cimahi, Jawa Barat, Indonesia ABSTRAKS Sepak bola merupakan salah satu olahraga yang sangat disukai dibandingkan dengan olahraga yang lainnya. Hal ini disebabkan karena dalam sepak bola mengutamakan strategi dan kerjasama tim dari seluruh pemain. Menjadi tim terbaik diperlukan pemain yang termasuk ke dalam kategori berkualitas. Oleh karena itu pencarian terhadap pemain sepak bola yang berkualitas memerlukan sistem yang mampu merekomendasikan 11 pemain sepak bola terbaik dan data yang digunakan berjumlah 120 artikel serta 70 pemain sepak bola. Pada penelitian ini menggunakan metode Naïve Bayes Classifier dengan beberapa tahapan yaitu Convert Emoticon, Cleansing, Case Folding, Convert Negation, Tokenizing, Stemming. Adapun hasil uji coba menunjukkan bahwa perangkat lunak memiliki penilaian fungsi-fungsi yang ada pada sistem ini yaitu 89,26% sistem dapat berjalan. Kata Kunci: Pemain Sepak Bola, Berkualitas, Naïve Bayes Classifier melakukan pencarian pemain sepak bola yang berkualitas sesuai dengan kebutuhan tim maupun keinginan dari pelatih di dalam suatu tim dalam mengumpulkan data terkait dengan biodata pemain, serta dengan menggunakan analisis sentimen maka proses seleksi melibatkan publik untuk memberi penilaian terhadap seorang pemain sepak bola yang dianggap populer dan berbakat dalam arti lain “berkualitas” dan memberi suatu rekomendasi kepada pelatih untuk dapat memilih pemain sepak bola berkualitas. Pada penelitian sebelumnya mengenai Klasifikasi Data Forum dengan menggunakan Metode Naïve Bayes Classifier. Naïve Bayes Classifier adalah metode klasifikasi yang berdasarkan probabilitas dan Teorema Bayesian. Dengan Naïve Bayes Classifier, diperoleh hasil akurasi kebenaran melakukan klasifikasi terhadap 15 data uji sebesar 73%. Pada penelitian ini, pengukuran efektivitas klasifikasi dengan menggunakan Confusion Matrix dengan cara menentukan nilai TP, TN, FP, dan FN. Dalam dunia pendidikan sebuah komunikasi sangat penting sebagai penunjang pembelajaran, baik komunikasi antara dosen dan mahasiswa maupun antar mahasiswa itu sendiri. Sampai saat ini, komunikasi atau diskusi yang biasa dilakukan masih banyak yang melalui tatap muka atau bertemu secara langsung. Diskusi yang dilakukan melalui tatap muka masih terdapat kekurangan-kekurangannya, antara lain: sibuk atau padatnya jadwal dosen sehingga membuat mahasiswa harus antri atau menunggu jika ada sesuatu yang ingin didiskusikan, tentu saja ini akan membuang waktu, segan atau takutnya mahasiswa untuk bertemu dengan dosen secara langsung, dan lain sebagainya.
1. PENDAHULUAN 1.1 Pendahuluan Jumlah pemain sepak bola dalam menentukan kriteria yang diinginkan melalui proses seleksi harus secara langsung serta melewati beberapa tahapan. Tahapan tersebut antara lain yaitu observasi langsung terhadap pemain, memantau dari rekaman pertandingan, membaca informasi pemain dari media, melihat data statisitik dan sejarah pemain. Hal ini tentu memerlukan waktu dan tenaga yang digunakan. Pemanfaatan informasi berbasis internet memungkinkan pencarian terhadap pemain sepak bola menjadi lebih mudah dan cepat dalam mendapatkan data yang diperlukan. Di sisi lain dengan menggunakan informasi berbasis internet akan memberikan suatu keuntungan dari segi waktu menjadi lebih efisien dan tenaga yang digunakan tidak terlalu banyak. Perpaduan antara Information Retrieval dengan Analisis Sentimen sebagai metode yang digunakan pada proses pemilihan pemain berkualitas di Indonesia diharapkan mampu memberikan rekomendasi terbaik. Ini merupakan alternatif lain pada proses seleksi dalam pencarian pemain sepak bola berkualitas di Indonesia, dengan banyaknya jumlah pemain sepak bola yang aktif bermain oleh karena itu diperlukan sistem temu balik informasi (information retrieval). Information Retrieval adalah sebuah metode untuk mengambil data terstruktur yang tersimpan dalam koleksi dokumen, kemudian menyediakan informasi yang diperlukan. Tujuan dari sistem Information Retrieval adalah untuk mengambil dan menampilkan dokumen yang relevan dengan pengguna (query). Penggunaan Information Retrieval diharapkan mampu
484
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016
Salah satu cara untuk mengubah gaya berdiskusi antara dosen dan mahasiswa maupun antar mahasiswa itu sendiri yaitu dengan membuatkan sebuah media komunikasi yaitu forum. Di dalam forum itu sendiri terdapat beberapa kelas (kategori) dengan tujuan untuk memudahkan mahasiswa dalam mencari informasi terkait dengan tugas-tugas matakuliah maupun dalam pembuatan skripsi/tugas akhir, untuk menghasilkan pengkategorian data forum yang tepat yaitu dengan melakukan proses klasifikasi terhadap pertanyaan atau pernyataan yang dituliskan oleh pengguna. Dalam penelitian ini, digunakan metode Naïve Bayes Classifier untuk melakukan klasifikasi otomatis berdasarkan pertanyaan atau pernyataan yang dimasukkan oleh pengguna. Untuk mengukur akurasi klasifikasi data forum, penulis menggunakan Confusion Matrix [3]. Penelitian lainnya mengenai Penerapan Metode Naïve Bayes untuk Sistem Klasifikasi SMS Pada Smartphone Android. SMS merupakan media komunikasi yang paling sering digunakan walaupun sekarang Ponsel telah memiliki berbagai media komunikasi aplikasi Messenger. Maraknya aksi penipuan sekarang ini membuat masyarakat semakin tidak nyaman dengan menggunakan SMS. Maka aplikasi SMS spam ini yang fiturnya dapat menggolongkan atau melakukan klasifikasi suatu SMS mana yang termasuk SMS spam dan bukan spam secara otomatis. Dengan pemilihan metode Naïve Bayes untuk melakukan proses klasifikasi diharapkan dapat dilakukan klasifikasi SMS dengan tingkat keakuratan yang tinggi sehingga spam SMS dapat teridentifikasi dengan baik. Metodologi pengembangan sistem menggunakan Microsoft Solutions Framework (MSF) [4].
ISSN: 2089-9815
dokumen yang dapat dibaca oleh sistem berformat *.doc, *.docx, dan *.pdf. Output dari sistem Information Retrieval ini adalah list dokumen yang sesuai dengan pencarian yang dimasukan oleh pengguna, list yang ditampilkan dimulai dari dokumen yang memiliki bobot tertinggi yang sesuai dengan tingkat kemiripan dengan query hingga bobot dokumen yang terendah. setiap list dapat dilihat sebagai preview dan juga dapat dilihat dengan membuka dokumen tersebut menggunakan aplikasi microsoft word untuk dokumen yang berformat *.doc dan *.docx sedangkan dokumen yang berformat *.pdf dapat dijalankan dengan menggunakan aplikasi pdf reader [5]. 1.2.2
Analisis Sentimen Pada penelitian tentang Analisis Sentimen terhadap Acara Televisi Berdasarkan Opini Publik. Data yang digunakan berbentuk tweet yang diambil langsung memanfaatkan API twitter. Dalam penelitian ini yang dimaksud dengan fitur adalah kata kunci yang akan menjadi parameter satuan data latih, yaitu dokumen (tweet) untuk diklasifikasikan ke dalam kelas yang telah ditentukan (positif atau kelas negatif). Dalam kata lain fitur adalah kata yang memiliki nilai sentimen. Setelah dibentuk fitur dengan kemunculannya dari data latih. Selanjutnya menghitung probabilitas dari setiap kelas. Setelah didapat probabilitas dari setiap kelas, selanjutnya menghitung probabilitas setiap fitur pada setiap kelas. Berdasarkan pada hasil penelitian yang telah dilakukan terlihat bahwa algoritma naïve bayes dapat melakukan klasifikasi suatu opini yang berupa tweet ke dalam dua kelas yaitu positif dan negatif dengan akurat. Tingkat keakurasian dari melakukan klasifikasi tersebut sangat dipengaruhi oleh proses training, sehingga dapat disimpulkan dari hasil proses klasifikasi yang disajikan dalam bentuk grafik dapat terlihat dengan jelas informasi sentimen publik terhadap suatu acara televisi dan dapat dijadikan sebagai referensi untuk menonton acara televisi [1].
1.2 Landasan Teori 1.2.1 Information Retrieval Pada penelitian tentang Implementasi Metode Generalized Vector Space Model Pada Aplikasi Information Retrieval. Algoritma Generalized Vector Space Model yang dibahas menggunakan konsep ruang vektor. Masukan dari pengguna dan kumpulan dokumen diterjemahkan menjadi vektor-vektor, kemudian vektor-vektor tersebut dikenakan operasi perkalian titik dan hasilnya menjadi acuan dalam menentukan relevansi masukan pengguna (query) terhadap kumpulan dokumen. Pada aplikasi Information Retrieval ini terdapat dua proses operasi, proses pertama dimulai dari koleksi dokumen dan proses kedua dimulai dari query yang dimasukkan oleh pengguna. Setiap dokumen yang berada pada document collection (folder file) akan dibaca oleh sistem. Dokumen-
1.2.3 Naive Bayes Classifier Naive Bayes Classifier merupakan salah satu metode machine learning yang menggunakan perhitungan probabilitas. Konsep dasar yang digunakan oleh Bayes adalah Teorema Bayes, yaitu melakukan klasifikasi dengan melakukan perhitungan nilai probabilitas. Klasifikasi dilakukan untuk menentukan kategori dari suatu dokumen. Sebuah keuntungan dari Naïve Bayes Classifier adalah bahwa akan hanya membutuhkan sejumlah kecil data pelatihan untuk memperkirakan parameter (sarana dan varians dari variabel-variabel) yang diperlukan untuk klasifikasi. Karena variabel
485
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016
independen diasumsikan, hanya varians dari variabel untuk masing-masing kelas harus ditentukan dan tidak seluruh matriks kovariansi. Terdapat tujuh tahap pada pre-processing yang ada di metode Naïve Bayes Classifier. Tahapan pertama Convert Emoticon merupakan salah satu cara pengungkapan ekspresi perasaan secara tekstual. Tahap kedua Cleansing merupakan proses membersihkan kata-kata yang tidak diperlukan untuk mengurangi noise. Tahap ketiga Case Folding merupakan tahapan merubah bentuk kata-kata menjadi sama bentuknya, baik semuanya menjadi lower case ataupun menjadi upper case. Tahap keempat Convert Negation seperti halnya ilmu matematika, dalam bahasa terdapat kata yang dapat membalikan arti dari kata tersebut atau bersifat negasi. Tahap kelima Tokenizing bekerja untuk mengidentifikasi kata-kata dalam teks menjadi beberapa urutan yang terpotong oleh spasi atau karakter spesial. Tahap keenam Stopping berperan untuk membuang kata-kata yang sering muncul dan bersifat umum, kurang menunjukkan relevansinya dengan teks. Tahap ke tujuh Stemming adalah tahapan untuk membuat kata yang berimbuhan kembali ke bentuk asalnya [2]. Naive Bayes Classifier menganggap sebuah dokumen sebagai kumpulan dari kata-kata yang menyusun dokumen tersebut, dan tidak memperhatikan urutan kemunculan kata pada dokumen, sehingga perhitungan probabilitas dapat dianggap sebagai hasil perkalian dari probabilitas kemunculan kata-kata pada dokumen. Perhitungan Naïve Bayes Classifier dapat dilakukan dengan persamaan 2.1 sampai dengan 2.3
adalah jumlah
dokumen
yang
memiliki kategori
adalah dokumen
jumlah
seluruh
training
Untuk penentuan kategori dokumen : (2.3)
adalah kategori yang memiliki nilai probabilitas kemunculan adalah nilai maksimal dari seluruh data training
2.
(2.1)
ISSN: 2089-9815
PEMBAHASAN DAN HASIL 2.1 Analisis Sistem Berjalan Analisis sistem berjalan menjelaskan alur kegiatan yang sedang berjalan saat ini dalam melakukan pemilihan pemain sepak bola yang bertujuan untuk menentukan kategori pemain sepak bola berkualitas di Indonesia. Pertama, pelatih mengumpulkan data pemain sepak bola dari berbagai klub untuk proses penyeleksian. Setelah itu staff kepelatihan mencatat data pemain sepak bola dari usulan pelatih. Setelah mencatat data pemain sepak bola lalu staff kepelatihan membuat catatan dokumen berupa laporan daftar pemain sepak bola serta melakukan proses seleksi terhadap pemain sepak bola. Proses seleksi tersebut antara lain yaitu observasi langsung terhadap pemain, melihat data statistik dan sejarah pemain, memantau dari rekaman pertandingan, membaca informasi dari media. Kemudian setelah melewati tahapan pada proses seleksi akan menghasilkan suatu rekomendasi hasil seleksi secara keseluruhan. Alur kegiatan tersebut dapat dilihat pada Gambar 1.
adalah nilai kemunculan kata pada kategori
adalah jumlah keseluruhan kata pada kategori
jumlah keseluruhan kata/fitur yang digunakan
Dan
(2.2) Gambar 1 Flowmap sistem yang sedang berjalan
486
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016
ISSN: 2089-9815
Perancangan Sistem Pada perancangan sistem akan dijelaskan perangkat lunak yang akan dibangun, yaitu sebuah perangkat lunak yang dapat membantu dalam melakukan pemilihan pemain sepak bola yang bertujuan untuk menentukan ke dalam kategori pemain sepak bola berkualitas di Indonesia, dengan memanfaatkan data pemain sepak bola di beberapa situs media online, di mana data tersebut akan menjadi acuan dalam mencari infomasi terkait dalam hal pemilihan pemain sepak bola berkualitas di Indonesia. Aktor yang berperan di sistem yaitu Staff Kepelatihan, untuk dapat memperoleh informasi tersebut dibutuhkan data pemain sepak bola antara lain berupa nama pemain dan posisi. Hal tersebut bertujuan agar memudahkan pelatih dalam melakukan pemilihan pemain sepak bola berkualitas di Indonesia. Berikut merupakan proses umum dari perangkat lunak dalam pemilihan pemain sepak bola berkualitas di Indonesia, diantaranya adalah: a. Proses input data pemain sepak bola. b. Proses filtering dalam pengelompokan kategori pemain sepak bola. c. Proses perhitungan bobot dalam menentukan pemain sepak bola yang termasuk ke dalam kategori berkualitas sebagai suatu rekomendasi.
11 pemain berdasarkan hasil analisa sentimen. Gambaran umum sistem secara rinci, untuk lebih jelasnya dapat dilihat pada Gambar 2.
Naïve bayes classifier adalah penggolong menggunakan statistik sederhana berdasarkan teorema bayes yang mengasumsikan bahwa keberadaan atau ketiadaan dari suatu fitur tertentu dari suatu kelas tidak berhubungan dengan keberadaan atau ketiadaan fitur lainnya. Sifatnya yang sebagai model probabilitas, naïve bayes classifier bisa dilatih dengan efisien sebagai supervised learning. Pada pengaplikasiannya, parameter estimasi untuk model naïve bayes menggunakan metode kemungkinan maksimum. Dengan kata lain, masih dapat bekerja dengan model naïve bayes tanpa harus mempedulikan Bayesian probabilitas atau metode bayesian lainnya. Pada penelitian ini input yang digunakan yaitu nama pemain dan posisi. Kemudian kedua kriteria tersebut akan melewati tahap preprocessing data yang ada pada metode Naïve Bayes Classifier antara lain Convert Emoticon, Cleansing, Case Folding, Convert Negation, Tokenizing, Stopping, Stemming. Setelah itu masuk pada tahap proses utama yang terbagi menjadi 4 tahapan. Tahap pertama, melakukan pencarian terhadap subjek nama pemain sepak bola dengan artikel yang terkait. Tahap kedua, menghitung bobot secara keseluruhan berdasarkan sentimen yang ada dalam artikel. Tahap ketiga, membandingkan jumlah total sentimen dari setiap pemain. Tahap keempat, mengurutkan rating tertinggi sampai rating terendah yang diperoleh pemain dari sentimen yang didapat. Output akan berupa rekomendasi
Hasil analisis yang dapat disimpulkan dari perancangan sistem antara lain: a. User/Aktor yang digunakan hanya 1 (satu) yaitu staff kepelatihan. b. Proses yang diubah berfokus pada tahap seleksi menjadi proses seleksi dengan menggunakan metode Naive Bayes Classifier. c. Output dari sistem berupa hasil rekomendasi daftar pemain sepak bola yang akan menempati suatu daftar pola formasi. d. Data yang digunakan dalam penelitian ini meliputi 50 pemain sepak bola dan 80 artikel tentang sepak bola dari situs Goal.com e. Business Use Case yang akan digunakan meliputi menu Kelola Informasi, Kelola Klasifikasi, Kelola Berita, Pemilihan Pemain, dan Line Up Pemain. f. Class Diagram, pada setiap kelas ini yaitu: 1) Kelola Informasi memiliki attribut no, nama, usia, klub, posisi. Operasi yang berfungsi tambah pemain, edit, hapus. 2) Kelola Klasifikasi memiliki attribut no, kata, klasifikasi. Operasi yang berfungsi tambah kata, edit, hapus. 3) Kelola Berita memiliki attribut no, judul. Operasi yang berfungsi tambah berita, lihat, hapus.
2.2
Gambar 2 Gambaran Umum Sistem
487
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016
4) Pemilihan Pemain memiliki attribut posisi, nama pemain. Operasi yang berfungsi proses, batal. 5) Line Up Pemain memiliki attribut formasi. Operasi yang berfungsi proses, batal.
4
5
2.3
Use Case Diagram Use case diagram adalah diagram yang menggambarkan fungsi yang dapat dijalankan dalam sebuah sistem terhadap aktor, interaksi antara aktor terhadap sistem akan digambarkan pada use case diagram. Pada sistem yang akan dibangun terdapat satu aktor yang akan berinteraksi dengan sistem yaitu staff kepelatihan, aktor tersebut dapat berinteraksi dengan sistem melalui fungsi - fungsi seperti yang ada pada Gambar 3.
No 1 2 3 4 5 6
No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Gambar 3 Use case diagram sistem pemilihan pemain sepak bola
2.4 No 1
2
3
2.5
Dataset Tabel 1 Teks Uji Teks “Dalam saat sesi tanya jawab, pemain Mitra Kukar, Rahmad Affandi, berharap agar kompetisi liga bergulir lagi. Namun Jokowi kembali hanya menegaskan, pertengahan November ini dipastikan ada turnamen lagi” “Perhelatan Piala Presiden 2015 sudah selesai, untuk sementara tak ada kompetisi atau turnamen sepakbola profesional yang bergulir di Indonesia. Situasi yang tak menguntungkan ini membuat resah para pemain, tak terkecuali bek asing Persib, Vladimir Vujovic” “Hasil evaluasi setelah main di Bali, skema defense belum
Kategori Positif
No 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Negatif
Negatif
488
ISSN: 2089-9815
berjalan optimal. Apalagi kita tanpa Dutra.” “Waktu Piala Presiden kita pinjam beberapa pemain dari Semen Padang.” “Fabiano Beltrame senang dengan minat Persib Bandung merekrut dirinya.”
Negatif
Positif
Tabel 2 Konversi Emoticon Emoticon Konversi :) :-) :3 =) :> e_happy :D >:D B-D XD =D e_laught :( :’( :-( :[ >.< e_sad :P :-P X-P :b :p e_tongue :O :-O >:o e_shock :| :-| :/ :S =/ e_straightface Tabel 3 Konversi Kata Negasi Kata Konversi Tdk Tidak G Tidak Gg Tidak Gag Tidak Gug Tidak Enggak Tidak Tak Tidak Bkn Bukan Jgn Jangan Ngga Tidak Blh Boleh Y Ya Yg Yang Yup Ya Bnr Benar
Perhitungan Nilai Probabilitas Tabel 4 Frekuensi Kemunculan Kata Pada Teks 1 (Kategori Positif) Kata Frekuensi Frekuensi Positif Negatif berharap 1 0 kompetisi 1 0 liga 1 0 bergulir 2 0 namun 1 0 jokowi 1 0 hanya 1 0 menegaskan 2 0 pertengahan 1 0 november 1 0 ini 1 0 dipastikan 2 0 ada 2 0 turnamen 2 0
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016
Setelah mendapatkan nilai probabilitas kata pada setiap kategori, kemudian hitung nilai probabilitas kategori dengan menggunakan rumus P(Vj) = Jumlah dokumen setiap kategori/total dokumen. Diketahui : Jumlah teks Positif = 5 Jumlah teks Negatif = 0 Jumlah teks =5 Sehingga didapatkan : P(Positif) = 5/5 = 1 P(Negatif) = 0/5 = 0 2.6
ISSN: 2089-9815
Nilai Probabilitasnya = P(Positif) * P(|Positif) = 0,5 * 0,00000002051 = 0,00000001026 = 1,026*10-8 Dari perhitungan di atas dapat disimpulkan bahwa kategori dari teks uji 1 yaitu termasuk kategori positif, karena nilai probabilitas teks uji 1 pada kategori positif (3,184*10-9) lebih besar dari nilai probabilitas teks pada kategori negatif (1,026*10-8).
Tahap Klasifikasi Naïve Bayes Classifier Tabel 5 Frekuensi Kemunculan Kata (Teks Uji 1) Kata Frekuensi berharap 1 kompetisi 1 liga 1 1 bergulir namun 1 jokowi 1 hanya 1 1 menegaskan pertengahan 1 november 1 ini 1 1 dipastikan 1 ada 1 turnamen
2.7
Tampilan Program
Gambar 4 Tampilan halaman login
Dari tabel 5 didapat frekuensi kemunculan kata pada dokumen baru. Kemudian hitung nilai probabilitas pada setiap kategori dengan menghitung nilai probabilitas setiap kata. Perhitungan yang dilakukan menggunakan persamaan: P(wkj|Ci) = (f kata pada kategori Ci+1) / (Frekuensi kategori Ci + Jumlah kata pada dokumen test). a. Kategori Positif P(bergulir|Positif) = 0,024 P(menegaskan|Positif) = 0,024 P(dipastikan|Positif) = 0,024 P(ada|Positif) = 0,024 P(turnamen|Positif) = 0,024 P(|Positif) = 0,024* 0,024*0,024*0,024*0,024 = 0,00000000796 Nilai Probabilitasnya = P(Positif) * P(|Positif) = 0,4 * 0,00000000796 = 0,000000003184 = 3,184*10-9 b. Kategori Negatif P(bergulir|Negatif) = 0,029 P(menegaskan|Negatif) = 0,029 P(dipastikan|Negatif) = 0,029 P(ada|Negatif) = 0,029 P(turnamen|Negatif) = 0,029 P(|Positif) = 0,029*0,029*0,029*0,029*0,029 = 0,00000002051
Gambar 5 Tampilan form Pemilihan Pemain
Gambar 6 Tampilan form Line Up Pemain
489
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016
ISSN: 2089-9815
fungsi dapat berjalan sesuai dengan yang diharapkan. 3.2
Gambar 7 Tampilan hasil dari Pemilihan Pemain
Gambar 8 Tampilan hasil dari Line Up Pemain 3. KESIMPULAN 3.1 Kesimpulan Pada penelitian ini menghasilkan sistem yang dapat merekomendasikan 11 pemain sepak bola berkualitas dan terbaik berupa pola strategi dalam formasi. Dalam penelitian ini digunakan 2 kriteria yaitu nama pemain dan posisi. Dimana kriteria tersebut dipadukan dengan artikel yang tersedia di situs internet. Data yang digunakan dalam penelitian ini berjumlah 120 artikel dan 70 pemain sepak bola, serta menggunakan metode Naïve Bayes Classifier sebagai penggolong statistik sederhana berdasarkan teorema bayes. Ketepatan dalam menentukan kategori pada dokumen dipengaruhi oleh data latih pada setiap kategori. Data latih ini berisi kata positif dan negatif dari masing-masing kategori atau kata-kata yang dapat mewakili kategori tertentu. Tetapi banyaknya kata pada data latih dapat menyebabkan menurunnya tingkat kecepatan sistem dalam memproses data, itu dikarenakan sistem harus memeriksa setiap kata pada data latih dari masingmasing kategori yang ada pada sistem. Sedangkan untuk fungsi-fungsi yang ada pada sistem ini dapat berjalan sesuai dengan apa yang diharapkan, itu semua dapat dilihat dari hasil implementasi dan pengujian pada bab IV, dengan hasil persentase 89,26%
Saran Saran-saran yang dikemukakan diharapkan dapat lebih meningkatkan hasil yang telah didapatkan. Berikut beberapa saran yang disampaikan sebagai masukan untuk penelitian selanjutnya. a. Jumlah data yang diolah diharapkan lebih banyak dari yang sebelumnya, agar dapat memberikan informasi pendukung yang mampu membantu dalam menangani kendala yang ada dalam pencarian terhadap pemain sepak bola. b. Pada kategori klasifikasi kata diharapkan memiliki unsur kata yang sering muncul di dalam suatu artikel atau berita, sehingga proses yang dapat dilakukan dengan menggunakan metode lain bisa menghasilkan persentase angka yang maksimal. c. Proses dalam hasil pencarian pemilihan pemain dan penentuan line up formasi membutuhkan waktu yang cukup lama tergantung dengan banyaknya data yang diolah.
4. PUSTAKA [1] Aditia Rakhmat Sentiaji, Adam Mukaharil Bachtiar, “Analisis Sentimen Terhadap Acara Televisi Berdasarkan Opini Publik,” Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) ISSN : 20899033 [2] B. Pang dan L. Lee, “Opinion Mining and Sentiment Analysis,” Foundation and Trends In Information Retrieval, Jurnal Informatika, vol. 2, p. 10, 2008 [3] Indriani, Aida, “Klasifikasi Data Forum dengan menggunakan Metode Naïve Bayes Classifier” Program Studi Teknik Informatika, STMIK PPKIA Tarakanita Rahmawati, Jurnal Informatika, Seminar Nasional Aplikasi Teknologi Informasi (SNATI) Yogyakarta, 21 Juni 2014 ISSN: 1907-5022 [4] Ebranda A.W, Mardiani, Tinaliah, “Penerapan Metode Naïve Bayes Untuk Sistem Klasifikasi SMS Pada Smartphone Android” Jurusan Teknik Informatika, STMIK MDP, Jurnal Informatika [5] Jasman Pardede, Mira Musrini Barmawi, Wildan Denny Pramono, “Implementasi Metode Generalized Vector Space Model Pada Aplikasi Information Retrieval,” Jurnal Informatika, No.1 , Vol. 4, Januari – April 2013 ISSN: 2087‐5266
490
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) Yogyakarta, 18-19 Maret 2016
[6] Saraswati, Ni Wayan S., 2011, “Text Mining dengan Metode Naïve Bayes Classifier dan Support Vector Machine Untuk Sentimen Analysis”, Tesis - Universitas Udayana, Tesis Magister Program Studi Teknik Elektro Program Pascasarjana, Denpasar
BIODATA PENULIS 1. Wina Witanti Dosen Jurusan Informatika FMIPA Unjani 2. Herry Rahmanto Alumni Jurusan Informatika FMIPA Unjani 3. Faiza Renaldi Dosen Jurusan Informatika FMIPA Unjani
491
ISSN: 2089-9815