SKRIPSI
KLASIFIKASI PENGGUNAAN PROTOKOL KOMUNIKASI PADA TRAFIK JARINGAN MENGGUNAKAN ALGORITMA NAÏVE BAYES
I MADE BAYU DIBAWAN
JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS UDAYANA JIMBARAN-BALI 2016
SKRIPSI
KLASIFIKASI PENGGUNAAN PROTOKOL KOMUNIKASI PADA TRAFIK JARINGAN MENGGUNAKAN ALGORITMA NAÏVE BAYES
I MADE BAYU DIBAWAN (1104405023)
JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS UDAYANA JIMBARAN-BALI 2016
i
KLASIFIKASI PENGGUNAAN PROTOKOL KOMUNIKASI PADA TRAFIK JARINGAN MENGGUNAKAN ALGORITMA NAÏVE BAYES
Skripsi Ini Diajukan Sebagai Persyaratan Memperoleh Gelar Sarjana S1 (Starata1) Pada Jurusan Teknik Elektro Fakultas Teknik Universitas Udayana
I MADE BAYU DIBAWAN NIM 1104405023
JURUSAN TEKNIK ELEKTRO DAN KOMPUTER FAKULTAS TEKNIK UNIVERSITAS UDAYANA BUKIT JIMBARAN 2016
ii
LEMBAR PERNYATAAN ORISINALITAS
Tugas Akhir / Skripsi ini adalah hasil karya saya sendiri, dan semua sumber baik yang dikutip maupun dirujuk telah saya nyatakan dengan benar.
Nama
: I Made Bayu Dibawan
NIM
: 1104405023
TandaTangan : Tanggal
: 3 Februari 2016
i
Scanned by CamScanner
KATA PENGANTAR Om Swastyastu puji syukur kehadapan Ida SangHyang Widhi Wasa/Tuhan Yang Maha Esa, karena atas segala limpahan berkat dan Rahmat-Nya, sehingga proposal yang berjudul ʻʻKLASIFIKASI PENGGUNAAN PROTOKOL KOMUNIKASI ALGORITMA
PADA
TRAFIK
JARINGAN
MENGGUNAKAN
NAÏVE BAYES” ini dapat diselesaikan dengan tepat waktu.
Tugas akhir ini disusun untuk memenuhi salah satu syarat dalam menyelesaikan pendidikan sarjana strata satu (S1) pada Jurusan Teknik Elektro Fakultas Teknik Universitas Udayana. Terwujudnya tugas akhir ini tidak lepas dari bantuan berbagai pihak yang telah mendorong dan membimbing penulis, baik tenaga, ide-ide, maupun pemikiran. Oleh karena itu dalam kesempatan ini penulis ingin mengucapkan terimakasih yang sebesar-besarnya kepada :. 1. Bapak Prof. Ir. Ngakan Putu Gede Suardana, MT.,.Ph.selaku Dekan Fakultas Teknik Universitas Udayana. 2. Bapak Wayan Gede Ariastina, ST.M.Engsc.Ph.D selaku Ketua Jurusan Teknik Elektro Fakultas Teknik Universitas Udayana. 3. Bapak Dr. I Made Oka Widyantara, ST., MT. selaku dosen pembimbing I yang telah banyak memberikan arahan, waktu, semangat serta saran-saran selama penyusunan tugas akhir. 4. Ibu Ir.Linawati. MEngSc.PhD. selaku dosen pembingbing II yang telah banyak memberikan arahan, waktu, semangat, serta saran-saran selama penyusunan tugas akhir. 5. Bapak Ir. I Made Mataram, M.Erg.,MT selaku pembimbing akademik yang telah membimbing dari semester 1, memberikan semangat dan dukungan dalam menjalani perkuliahan. 6. Bapak Dandy Permana Hostiadi yang telah membimbing penulis, memberikan motivasi dan dukungan dalam pembuatan tugas akhir.
i
7. Bapak dan Ibu beserta keluarga besar atas motivasi, dukungan, serta saransaran yang selalu diberikan. 8. Rekan - rekan mahasiswa angkatan 2011 Fakultas Teknik Elektro Universitas Udayana. Penulis menyadari bahwa tugas akhir ini masih jauh dari kesempurnaan, oleh karena itu kritik saran yang membangun dari berbagai pihak sangat penulis harapkan demi perbaikan-perbaikan ke depan. Akhir kata, Saya mohon maaf yang sebesar-besarnya apabila dalam penyusunan tugas akhir ini terdapat banyak kesalahan. Semoga tugas akhir ini dapat bermanfaat khususnya bagi penulis tugas akhir ini dan pada umumnya bagi para pembaca.
Bukit Jimbaran, 26 Februari 2016
ii
ABSTRAK Penggunaan model komunikasi berbasiskan teknologi jaringan komputer merupakan teknologi yang sudah banyak digunakan. Model komunikasi pada jaringan komputer, menggunakan aturan komunikasi yang sesuai dengan standar tipe komunikasi yang sering dikenal dengan nama network protocol. Penggunaan network protocol dalam komunikasi di jaringan komputer, terkadang menuntut adanya prioritas komunikasi yang sering dikenal dengan QoS (Quality of Service). Dasar pemberian prioritas (QoS) adalah dengan penganalisaan terhadap Trafik Jaringan.. Pada penelitian ini melakukan klasifikasi terhadap data capture Trafik Jaringan yang di olah menggunakan Algoritma Naïve Bayes. Tools yang digunakan untuk capture Trafik Jaringan yaitu aplikasi wireshark. Dari hasil observasi terhadap dataset jaringan melalui proses perhitungan menggunakan Algoritma Naïve Bayes memiliki tingkat keakuratan yang sangat tinggi. Hal ini dibuktikan dengan hasil perhitungan yang mencapai nilai 92,34 %. Hasil proses klasifikasi akan dijadikan sebagai acuan dalam penentuan pemberian Prioritas terhadap Network protocol yang sering digunakan dalam komunikasi jaringan. Kata kunci : Network protocol, Naïve Bayes QoS, network capture
i
ABSTRACT Usage-based communication model of computer network technology is a technology that is already widely used. Model communications on a computer network, using the rules of communication in accordance with the standard type of communication that is often known as the network protocol. Use of network communication protocol in computer networks, sometimes requires the priority communication commonly known as QoS (Quality of Service). Basic prioritization (QoS) is by analyzing the network traffic. In this study the classification of the data capture network traffic that though the use of Naïve Bayes algorithm. Tools used to capture network traffic that wireshark application. From the observation of the network dataset through the calculation process using Naïve Bayes algorithm has a very high level of accuracy. This is evidenced by the results of calculations which reached 92.34%. The results of the classification process will be used as a reference in determining giving priority to the Network protocol that is often used in network communications. Keywords: Network protocol, Naïve Bayes QoS, network capture
i
DAFTAR ISI
Halaman JUDUL. ............................................................................................................ i LEMBAR PERSYARATAN GELAR............................................................. ii LEMBAR PERNYATAAN ORISINALITAS ................................................ iii LEMBAR PENGESAHAN ........................................................................... iv KATA PENGANTAR ..................................................................................... v ABSTRAK ....................................................................................................... vii ABSTRACT....................................................................................................... viii DAFTAR ISI.................................................................................................... ix DAFTAR TABEL .......................................................................................... xi DAFTAR GAMBAR ....................................................................................... xii DAFTAR SINGKATAN ................................................................................. xiii BAB I PENDAHULUAN 1.1 Latar Belakang .................................................................................. 1 1.2 Rumusan Masalah ............................................................................. 4 1.3 Tujuan Penulisan ............................................................................... 4 1.4 Manfaat Penulisan ............................................................................. 4 1.5 Ruang Lingkup Dan Batasasn Masalah .............................................. 5 1.6 Sistematika Penulisan ......................................................................... 5 BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Mutakhir................................................... ............................. 7 2.2 Tinjauan Pustaka ................................................................................. 10 2.2.1 Data Mining ............................................................................... 10 2.2.2 Cross Industry Standard Process for Data Mining..................... 14 2.2.3 Klasifikasi................................................................................... 17 2.2.4 Protokol Jaringan …………………………………………....... 17 2.2.5 Algoritma Naïve Bayes .............................................................. 21 2.2.6 Pengukuran Kinerja Klasifikasi ................................................. 24 2.2.7 Topologi Jaringan....................................................................... 25 i
2.2.8 Wireshark ................................................................................... 26 2.2.9 Pentaho Data Integration (PDI).................................................. 27 BAB III METODE PENELITIAN 3.1 Lokasi dan Waktu Penelitian ............................................................. 29 3.2 Sumber dan Jenis Data Penelitian...................................................... 29 3.2.1 Sumber Data.............................................................................. 29 3.2.2 Metode Pengumpulan Data....................................................... 30 3.2.3 Jenis Data Penelitian ................................................................. 30 3.3 Alat Penelitian.................................................................................... 30 3.4 Tahapan Penelitian............................................................................. 31 3.4.1 Pengembangan Metode Data Mining....................................... 31 3.4.1.1 Pemahaman Bisnis......................................................... 32 3.4.1.2 Pemahaman Data ........................................................... 33 3.4.1.3 Pengolahan Data ............................................................ 35 3.4.1.4 Pemodelan...................................................................... 36 3.4.1.5 Implementasi dengan MATLAB ..................................... 37 3.4.1.6 Implementasi Model Algoritma pada MATLAB ............ 41 3.5 Metode Analisis ................................................................................. 42 BAB IV HASIL DAN PEMBAHASAN 4.1 Pengolahan Data Mentah ................................................................. 44 4.1.1 Transformasi Data ................................................................... 45 4.2 Perhitungan Data Mining ................................................................... 47 4.2.1 Perhitungan Akurasi................................................................. 49 4.3 Evaluasi.............................................................................................. 50 4.3.1 Hasil Pengukuran Akurasi ....................................................... 50 4.3.2 Data Hasil Klasifikasi .............................................................. 52 BAB V KESIMPULAN DAN SARAN 5.1 Simpulan ............................................................................................ 55 5.2 Saran .................................................................................................. 55
ii
DAFTAR TABEL
Halaman Tabel 2.1 Tinjauan mutakhir (state of the art) ......................................... 5 Tabel 2.2 Tinjauan mutakhir (state of the art) Lanjutan .......................... 9 Tabel 2.3 Tinjauan mutakhir (state of the art) Lanjutan .......................... 10 Tabel 2.4 Perbedaan data mining dengan yang bukan data mining. ........ 8 Tabel 2.5 Confusion Matriks.................................................................... 24 Tabel 3.1 Tabel Contoh Kelas Label (dandy, 2013) ................................ 27 Tabel 3.1 Parameter Akurasi ................................................................... 40 Tabel 3.2 Model label kelas ..................................................................... 43 Tabel 4.1 Model label kelas ..................................................................... 46 Tabel 4.2 Data latih yang telah dilakukan inisialisasi .............................. 47 Tabel 4.3 Perhitungan manual.................................................................. 48 Tabel 4.4 Confusion matrik...................................................................... 49 Tabel 4.5 Hasil klasifikasi naïve bayes .................................................... 52
i
DAFTAR GAMBAR
Halaman Gambar 2.1 Gambar Tahapan Data Mining ............................................ 9 Gambar 2.2 CRISP – DM........................................................................ 15 Gambar 2.3 Topologi jaringan Universitas Udayana .............................. 26 Gambar 2.4 Gambar aplikasi wireshark.................................................. 18 Gambar 2.5 Pengolahan data pada aplikasi PENTAHO ......................... 28 Gambar 3.1 CRISP – DM........................................................................ 32 Gambar 3.2 Penempatan capturing data.................................................. 33 Gambar 3.3 Proses export .csv ................................................................ 34 Gambar 3.4 Atribut capture wireshark............................................................... 34 Gambar 3.5 Pemilihan Atribut ................................................................ 35 Gambar 3.6 Flowchart Sistem Naïve Bayes............................................ 37 Gambar 4.1 Preprocessing data ............................................................. 44 Gambar 4.2 Execution Result .................................................................. 45 Gambar 4.3 Hasil akurasi Klasifikasi Trafik Jaringan Universitas Udayana menggunakan Algoritma Naïve Bayes................................. 51 Gambar 4.4 Banyak protokol berdasarkan prioritas................................ 53 Gambar 4.5 Banyak length range berdasarkan prioritas ......................... 53 Gambar 4.6 Banyak counting range berdasarkan prioritas ..................... 54
i
DAFTAR SINGKATAN K-NN
= K-Nearest Neighbor
SVM
= Support Vector Machine
JST
= Jaring Saraf Tiruan
WWW
= World Wide Web
HTTP
= Hypertext Transfer Protocol
DNS
= Domain Name System
UDP
= User Datagram Protokol
MAD
= Mean Absolute Difference
TCP
= Transmission Control Protocol
IMAP
= Internet Message Access Protocol
SSH
= Secure Shell Hosting
FTP
= File Transfer Protocol
SSL
= Secure Socket Layer
Qos
= Quality Of Service
GUI
= Graphical User Interface
TCP
= Transmission Control Protocol
SNMP
= Simple Network Management Protocol
RARP
= Reverse Address Resolution Protocol
ICMP
= Internet Control Massage Protocol
i