SKRIPSI KLASIFIKASI PENGGUNAAN PROTOKOL KOMUNIKASI PADA TRAFIK JARINGAN MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR
I KOMANG KOMPYANG AGUS SUBRATA
JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS UDAYANA JIMBARAN-BALI 2016
i
SKRIPSI KLASIFIKASI PENGGUNAAN PROTOKOL KOMUNIKASI PADA TRAFIK JARINGAN MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR
I KOMANG KOMPYANG AGUS SUBRATA (1104405026)
JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS UDAYANA JIMBARAN-BALI 2016
i
KLASIFIKASI PENGGUNAAN PROTOKOL KOMUNIKASI PADA TRAFIK JARINGAN MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR
Skripsi Ini Diajukan Sebagai Persyaratan Memperoleh Gelar Sarjana S1 (Starata1) Pada Jurusan Teknik Elektro Fakultas Teknik Universitas Udayana
I KOMANG KOMPYANG AGUS SUBRATA NIM 1104405026
JURUSAN TEKNIK ELEKTRO DAN KOMPUTER FAKULTAS TEKNIK UNIVERSITAS UDAYANA BUKIT JIMBARAN 2016
ii
LEMBAR PERNYATAAN ORISINALITAS
Tugas Akhir / Skripsi ini adalah hasil karya saya sendiri, dan semua sumber baik yang dikutip maupun dirujuk telah saya nyatakan dengan benar.
Nama
: I Komang Kompyang Agus Subrata
NIM
: 1104405026
TandaTangan : Tanggal
: 26 Februari 2016
i
Scanned by CamScanner
KATA PENGANTAR Om Swastyastu puji syukur kehadapan Ida SangHyang Widhi Wasa/Tuhan Yang Maha Esa, karena atas segala limpahan berkat dan Rahmat-Nya, sehingga proposal yang berjudul ʻʻKLASIFIKASI PENGGUNAAN PROTOKOL KOMUNIKASI
PADA
TRAFIK
JARINGAN
MENGGUNAKAN
ALGORITMA K-NEAREST NEIGHBOR” ini dapat diselesaikan dengan tepat waktu. Tugas akhir ini disusun untuk memenuhi salah satu syarat dalam menyelesaikan pendidikan sarjana strata satu (S1) pada Jurusan Teknik Elektro Fakultas Teknik Universitas Udayana. Terwujudnya Tugas akhir ini tidak lepas dari bantuan berbagai pihak yang telah mendorong dan membimbing penulis, baik tenaga, ide-ide, maupun pemikiran. Oleh karena itu dalam kesempatan ini penulis ingin mengucapkan terimakasih yang sebesar-besarnya kepada :. 1. Bapak Prof. Ir. Ngakan Putu Gede Suardana, MT.,.Ph. selaku Dekan Fakultas Teknik Universitas Udayana. 2. Bapak Wayan Gede Ariastina, ST.M.Engsc.Ph.D selaku Ketua Jurusan Teknik Elektro Fakultas Teknik Universitas Udayana. 3. Bapak Dr. I Made Oka Widyantara, ST., MT. selaku dosen pembimbing I yang telah banyak memberikan arahan, waktu, semangat serta saran-saran selama penyusunan tugas akhir. 4. Ibu Ir.Linawati. MEngSc.PhD. selaku dosen pembingbing II yang telah banyak memberikan arahan, waktu, semangat, serta saran-saran selama penyusunan tugas akhir. 5. Bapak Ir. I Made Mataram, M.Erg.,MT selaku pembimbing akademik yang telah membimbing dari semester 1, memberikan semangat dan dukungan dalam menjalani perkuliahan. 6. Bapak Dandy Permana Hostiadi yang telah membimbing penulis, memberikan motivasi dan dukungan dalam pembuatan tugas akhir. 7. Bapak dan Ibu beserta keluarga besar atas motivasi, dukungan, serta saransaran yang selalu diberikan.
i
8. Rekan - rekan mahasiswa angkatan 2011 Fakultas Teknik Elektro Universitas Udayana. Penulis menyadari bahwa tugas akhir ini masih jauh dari kesempurnaan, oleh karena itu kritik saran yang membangun dari berbagai pihak sangat penulis harapkan demi perbaikan-perbaikan ke depan. Akhir kata, Saya mohon maaf yang sebesar-besarnya apabila dalam penyusunan tugas akhir ini terdapat banyak kesalahan. Semoga tugas akhir ini dapat bermanfaat khususnya bagi penulis tugas akhir ini dan pada umumnya bagi para pembaca.
Bukit Jimbaran, 26 februari 2016
ii
ABSTRAK Trafik jaringan internet adalah lalu lintas komunikasi data dalam jaringan yang ditandai dengan satu set aliran statistik dengan penerapan pola terstruktur. Pola terstruktur yang dimaksud adalah informasi dari header paket data. Klasifikasi yang tepat terhadap sebuah trafik internet sangat penting dilakukan terutama dalam hal disain perancangan arsitektur jaringan, manajemen jaringan dan keamanan jaringan. Analisa terhadap suatu trafik jaringan komputer merupakan salah satu cara mengetahui penggunaan protokol komunikasi jaringan komputer, sehingga dapat menjadi dasar penentuan prioritas Quality of Service (QoS). Dasar pemberian prioritas QoS adalah dengan penganalisaan terhadap data trafik jaringan. Pada penelitian ini melakukan klasifikasi terhadap data capture Trafik Jaringan yang di olah menggunakan Algoritma K-Neaerest Neighbor (KNN). Tools yang digunakan untuk capture Trafik Jaringan yaitu aplikasi wireshark. Dari hasil observasi terhadap dataset trafik jaringan dan melalui proses perhitungan menggunakan Algoritma K-NN didapatkan sebuah hasil bahwa nilai yang dihasilkan oleh klasifikasi K-NN memiliki tingkat keakuratan yang sangat tinggi. Hal ini dibuktikan dengan hasil perhitungan yang mencapai nilai 99,14 % yaitu dengan perhitungan k = 3. Kata kunci : Network protocol, K-NN, QoS, network capture
i
ABSTRACT
Network traffic internet traffic is data communication in a network characterized by a set of statistical flow with the application of a structured pattern. Structured pattern in question is the information from the packet header data. Proper classification to an Internet traffic is very important to do, especially in terms of the design of the design of the network architecture, network management and network security. The analysis of computer network traffic is one way to know the use of the computer network communication protocol, so it can be the basis for determining the priority of Quality of Service (QoS). QoS is the basis for giving priority to analyzing the network traffic data. In this study the classification of the data capture network traffic that though the use of K-Neaerest Neighbor algorithm (K-NN). Tools used to capture network traffic that wireshark application. From the observation of the dataset and the network traffic through the calculation process using K-NN algorithm obtained a result that the value generated by the K-NN classification has a very high level of accuracy. This is evidenced by the results of calculations which reached 99.14%, ie by calculating k = 3. Keywords : Network protocol, K-NN, QoS, network capture
i
DAFTAR ISI
Halaman JUDUL. ............................................................................................................ i LEMBAR PERSYARATAN GELAR............................................................. ii LEMBAR PERNYATAAN ORISINALITAS. ............................................... iii LEMBAR PENGESAHAN ........................................................................... iv KATA PENGANTAR ..................................................................................... v ABSTRAK ....................................................................................................... vii ABSTRACT..................................................................................................... viii DAFTAR ISI.................................................................................................... ix DAFTAR TABEL .......................................................................................... xi DAFTAR GAMBAR ....................................................................................... xii DAFTAR SINGKATAN ................................................................................. xiii BAB I : PENDAHULUAN 1.1. Latar Belakang .................................................................................. 1 1.2 Rumusan Masalah ............................................................................. 2 1.3 Tujuan Penulisan ............................................................................... 3 1.4 Manfaat Penulisan ............................................................................. 3 1.5 Ruang Lingkup Dan Batasasn Masalah .............................................. 3 1.6 Sistematika Penulisan ........................................................................ 4 BAB II : TINJAUAN PUSTAKA 2.1 Tinjauan Mutakhir................................................... ............................. 5 2.2 Tinjauan Pustaka ................................................................................. 7 2.2.1 Data Mining ................................................................................ 7 2.2.2 Klasifikasi.................................................................................... 11 2.2.3 Protokol Jaringan …………………………………………........ 11 2.2.4 Algoritma K-NN ......................................................................... 16 2.2.4.1 Proses K-NN.................................................................... 17 2.2.4.2 Penerapan Algoritma K-NN ……………. ...................... 17 2.2.4.3 Pengujian Algoritma K-NN............................................. 18 i
2.2.5 Topologi Jaringan........................................................................ 18 2.2.6 Wireshark ................................................................................... 19 2.2.7 Pentaho Data Integration (PDI) ................................................. 20 BAB III : METODE PENELITIAN 3.1 Lokasi dan Waktu Penelitian ............................................................. 23 3.2 Sumber dan Jenis Data Penelitian...................................................... 23 3.2.1 Sumber Data.............................................................................. 23 3.2.2 Metode Pengumpulan Data....................................................... 24 3.2.3 Jenis Data Penelitian ................................................................. 24 3.3 Alat Penelitian.................................................................................... 24 3.4 Tahapan Penelitian............................................................................. 25 3.4.1 Pengembangan Model Data Mining. ........................................ 25 3.4.1.1 Pembentukan Data Latih................................................. 25 3.4.1.2 Klasifikasi K-NN............................................................. 28 3.4.1.3 Implementasi dengan MATLAB ..................................... 30 3.4.1.4 Implementasi Model Agoritma Pada MATLAB ............. 32 3.4.2 Metode Analisis ........................................................................ 33 BAB IV HASIL DAN PEMBAHASAN 4.1 Pengolahan Data Mentah ................................................................. 35 4.1.1 Transformasi Data.................................................................... 37 4.2 Perhitungan Data Mining ................................................................... 39 4.3 Perhitungan Akurasi........................................................................... 42 4.5 Evaluasi.............................................................................................. 44 4.5.1 Hasil Klasifikasi Algoritma K-NN .......................................... 44 4.5.2 Hasil Akurasi ........................................................................... 47 BAB V KESIMPULAN DAN SARAN 5.1 Simpulan ............................................................................................ 49 5.2 Saran .................................................................................................. 49
ii
DAFTAR TABEL
Halaman Tabel 2.1 Tinjauan mutakhir (state of the art) ......................................... 5 Tabel 2.2 Tinjauan Mutahir (State of the art ) Lanjutan .......................... 6 Tabel 2.3 Perbedaan data mining dengan yang bukan data mining. ........ 8 Table 2.4 Confusion matrix...................................................................... 18 Tabel 3.1 Model label kelas ..................................................................... 32 Tabel 4.1 Model klas label ....................................................................... 37 Tabel 4.2 Data yang telah dilakukan inisialisasi ...................................... 38 Tabel 4.3 Data Sampel (training) ............................................................. 39 Tabel 4.4 Data Testing (uji)...................................................................... 39 Tabel 4.5 Data Hasil Perhitungan Perbandingan Jarak ............................ 40 Tabel 4.6 Data yang telah diurutkan ........................................................ 41 Tabel 4.7 Data Hasil Klasifikasi .............................................................. 41 Tabel 4.8 hasil klasifikasi K-NN .............................................................. 41 Tabel 4.9 Confusion matrix ...................................................................... 42 Tabel 4.10 Hasil Penghitungan akurasi klasifikasi K-NN ...................... 46
i
DAFTAR GAMBAR
Halaman Gambar 2.1 Gambar Tahapan Data Mining ............................................ 9 Gambar 2.2 Topologi Jaringan Universitas Udayana.............................. 19 Gambar 2.3 Gambar aplikasi wireshark.................................................. 18 Gambar 2.4 Pengolahan data pada pentaho............................................. 21 Gambar 3.1 Gambaran umum sistem ...................................................... 26 Gambar 3.2 Data capture tools wireshark............................................... 27 Gambar 3.3 Penempatan capturing data.................................................. 27 Gambar 3.4 flowchart Algoritma K-NN .................................................. 29 Gambar 4.1 Input File .csv ...................................................................... 35 Gambar 4.2 Filter format atribut menggunakan pentaho ........................ 35 Gambar 4.3 Hasil Output filter format atribut......................................... 36 Gambar 4.4 Banyak protokol berdasarkan prioritas................................ 45 Gambar 4.5 Banyak length range berdasarkan prioritas ......................... 46 Gambar 4.6 Banyak counting range berdasarkan prioritas ..................... 46 Gambar 4.7 Pengaruh Nilai k pada 6257 Data Latih........................................ 47
i
DAFTAR SINGKATAN K-NN
= K-Nearest Neighbor
SVM
= Support Vector Machine
JST
= Jaring Saraf Tiruan
WWW
= World Wide Web
HTTP
= Hypertext Transfer Protocol
DNS
= Domain Name System
UDP
= User Datagram Protokol
MAD
= Mean Absolute Difference
TCP
= Transmission Control Protocol
IMAP
= Internet Message Access Protocol
SSH
= Secure Shell Hosting
FTP
= File Transfer Protocol
SSL
= Secure Socket Layer
Qos
= Quality Of Service
GUI
= Graphical User Interface
TCP
= Transmission Control Protocol
SNMP
= Simple Network Management Protocol
RARP
= Reverse Address Resolution Protocol
ICMP
= Internet Control Massage Protocol
i