1
BAB I PENDAHULUAN
1.1 Latar Belakang Perkembangan pesat teknologi dan informasi saat ini menjadikan internet bagian dari kehidupan masyarakat modern. Internet telah memberikan berbagai kemudahan dengan akses informasi yang luas dan beragam. Dengan hal itu, akses terhadap internet memicu terjadinya trafik yang tinggi / anomali trafik di dalam suatu jaringan komputer. Trafik yang tinggi / anomali trafik dapat terjadi akibat flash crowd dan serangan flooding trafik. Flash crowd merupakan fenomena peningkatan akses / trafik secara tinggi ke suatu server karena suatu kejadian tertentu. Serangan Denial of Service (DoS) dan Distributed Denial of Service (DDoS) merupakan serangan flooding trafik. Serangan Denial of Service (DoS) dan Distributed Denial of Service (DDoS) merupakan serangan yang terjadi dengan membanjiri lalu lintas jaringan dengan banyak data (traffic flooding) atau membanjiri jaringan dengan banyak request terhadap sebuah host atau service sehingga tidak dapat diakses oleh user yang terdaftar / berhak (request flooding). Serangan DoS dan DDoS akan menggunakan resource jaringan yang sangat besar karena paketnya sangat banyak, sehingga sumber daya bandwith pada server penuh kemudian sistem pengolah kehabisan sumber daya dan akhirnya crash / down sehingga tidak dapat melayani service yang diminta user. Dalam skema serangannya, DDoS akan menyerang sisi availability dari suatu service yang terjadi antara server target serangan dan user yang terdaftar / berhak. Oleh karena itu, diperlukan suatu sistem untuk mendeteksi (Intrussion Detection System) anomali trafik di jaringan komputer. Salah satu teknik deteksi yang dapat digunakan untuk mendeteksi anomali trafik yaitu clustering based yang
2
merupakan metode dalam data mining. Pada Tugas Akhir ini, algoritma clustering CURE (Clustering Using Representatives) yang merupakan modernisasi dari algoritma hirarki tradisional digunakan untuk melakukan proses deteksi. Kemudian, fokus penelitian Tugas Akhir ini adalah dalam hal menangani titik outlier dari dataset yang digunakan. Outlier akan di eliminasi dengan teknik outlier removal clustering (ORC). Dengan teknik clustering based, maka dilakukan proses penganalisaan data ke dalam struktur kelompok-kelompok data yang memiliki kesamaan berdasarkan jenis anomali trafik (normal, flash crowd, serangan DDoS) dengan algortima CURE yang digunakan. 1.2 Perumusan Masalah Menurut survey Monowar H. Bhuyan, D. K. Bhattacharyya, dan J. K. Kalita [1], metode clustering based dapat dilakukan untuk deteksi anomali jaringan dalam sebuah lingkungan offline. Pada survey ini, metode clustering based juga memberikan kinerja yang lebih stabil jika dibandingkan dengan metode statistik. Dalam penelitian [2] berhasil menemukan suatu algoritma clustering baru berbasis hierarchical yang dinamakan CURE. Dari penelitian Sudipto Guha, Rajeev Rastogi, dan Kyuseok Shim ini, Algoritma CURE (Clustering Using Representatives) dapat mengurangi ukuran input dataset yang besar tanpa mengorbankan kualitas clustering, dapat menemukan cluster dalam bentuk yang menarik dan mengurangi tingkat sensitif pada outlier. Akan tetapi, dalam penelitian ini algoritma CURE memiliki beberapa kekurangan. CURE memiliki keterbatasan dalam berurusan dengan database yang memiliki bentuk tertentu (umum). Selain itu, masih ada kemungkinan CURE kurang sensitif terhadap outlier. Pada CURE, proses eliminasi outlier berdasarkan dengan threshold jumlah anggota cluster, sehingga cluster tersebut dihapus jika memenuhi nilai threshold yang ditentukan (semua data/titik dalam cluster dihapus).
3
Penelitian Tugas Akhir ini menggunakan algoritma CURE untuk melakukan proses deteksi (Intrussion Detection System) terhadap anomali trafik pada jaringan komputer. Fokus penelitian ini yaitu modifikasi pada proses eliminasi outlier yang terdapat pada dataset dalam algoritma clustering CURE dengan menerapkan metode outlier removal clustering (ORC). Pada penelitian ini proses eliminasi outlier dilakukan dengan menghapus titik yang dianggap sebagai outlier saja dengan mekanisme ORC
yang digunakan. Penghapusan
cluster
dapat
menyebabkan besarnya jumlah data yang hilang/packet loss bukan merupakan outlier, hal ini sewaktu-waktu dapat menyebabkan sistem tidak dapat mendeteksi anomali trafik dengan baik atau dengan kata lain memiliki nilai DR yang cukup rendah. Dengan penelitian yang dilakukan, maka algoritma CURE yang digunakan dapat meminimalisir masih adanya kemungkinan kurang sensitif terhadap outlier dan memiliki tingkat keakuratan algoritma / benchmarking algoritma tinggi berdasarkan parameter Detection Rate (DR), False Positive Rate (FPR) dan Accuracy. Berdasarkan uraian diatas, maka masalah yang akan dibahas pada penelitian Tugas Akhir ini, sebagai berikut : 1. Perancangan sistem deteksi anomali trafik menggunakan algoritma clustering CURE. 2. Penerapan teknik outlier removal clustering (ORC) pada proses menangani outlier dalam algoritma clustering CURE dengan menghapus titik yang dianggap sebagai outlier. 3. Proses prepocessing untuk mendapatkan fitur dari dataset yang digunakan untuk kemudian diolah dalam sistem deteksi anomali trafik menggunakan algoritma CURE. 4. Analisis metode ORC dalam mengeliminasi titik outlier dan performansi algoritma CURE dalam proses deteksi anomali trafik.
4
1.3 Tujuan Tugas Akhir mengenai analisis sistem deteksi menggunakan algoritma clustering CURE dengan outlier removal clustering (ORC) dalam menangani outlier memimiliki beberapa tujuan, yaitu : 1.
Merancang sistem deteksi anomali trafik menggunakan algoritma clustering CURE
2. Menerapkan teknik outlier removal clustering (ORC)
pada proses
menangani outlier dalam algoritma clustering CURE dengan mendeteksi dan menghapus titik yang dianggap sebagai outlier. 3. Prepocessing untuk mendapatkan fitur dari dataset yang digunakan untuk kemudian diolah dalam sistem deteksi anomali trafik menggunakan algoritma CURE. 4. Analisis metode ORC dalam mendeteksi titik outlier dengan paramater threshold dan distorsi, serta performansi algoritma CURE dalam proses deteksi anomali trafik dengan parameter detection rate (DR), false positive rate (FPR), dan accuracy. 1.4 Batasan Masalah Berikut merupakan hal-hal yang dibatasi dalam penelitian Tugas Akhir ini : 1. Membahas tentang sistem deteksi anomali trafik (Intrussion Detection System) 2. Membahas tentang metode yang digunakan untuk melakukan proses deteksi anomali trafik. 3. Analisis dilakukan dengan menggunakan tools / software berbasis java yaitu netbeans 8.0.2 IDE. 4. Menggunakan dataset (KDD Cup 99 dan DARPA 1998) real time yang sudah terekam (ter-capture) berupa network log connection untuk trafik
5
normal dan serangan DDoS, sedangkan untuk trafik flash crowd menggunakan dataset flash crowd . 5. Tidak membahas mengenai pencegahan (prevention) terhadap serangan yang ada pada jaringan 6. Parameter yang digunakan untuk menganalisis proses eliminasi outlier dengan teknik ORC meliputi threshold dan distorsi. Untuk perfomansi algoritma CURE dalam proses deteksi anomali trafik meliputi detection rate (DR), false positive rate (FPR), dan accuracy. 1.5 Metodologi Penyelesaian Masalah Metodologi penelitian yang digunakan adalah: a. Studi literatur, yaitu mempelajari literatur-literatur yang ada sesuai dengan permasalahan yang akan dibahas meliputi, konsep deteksi anomali trafik (Intrussion Detection System), teori serangan flooding traffic (DDoS) dan flash crowd, konsep preprocessing, teori hierarchical clustering, konsep algoritma clustering CURE, konsep teknik outlier removal clustering (ORC), dan teori mengenai uji perfomansi menggunakan parameter detection rate (DR), false positive rate (FPR), dan accuracy. b. Analisis terhadap kebutuhan dan pemodelan sistem untuk proses deteksi anomali trafik c. Perancangan dan analisis menggunakan tools untuk sistem deteksi anomali trafik d. Uji performansi dan analisis hasil penelitian e. Pembuatan laporan dari hasil penelitian
1.6 Sistematika Penulisan TA Adapun sistematika penulisan pada Tugas Akhir ini adalah :
6
BAB I PENDAHULUAN Berisi tentang latar belakang penelitian, rumusan masalah, batasan masalah, tujuan penelitian, metodologi penelitian, dan sistematika penelitian BAB II TINJAUAN PUSTAKA Berisi tentang penjelasan mengenai deteksi anomali trafik (Intrussion Detection System), penjelasan mengenai serangan flooding traffic (DDoS) dan flash crowd, penjelasan mengenai hierarchical clustering, konsep algoritma clustering CURE dan teknik outlier removal clustering (ORC), penjelasan mengenai parameter uji. BAB III PERANCANGAN SISTEM Berisi tentang perancangan sistem yang akan dibangun BAB IV PENGUJIAN DAN ANALISIS Berisi tentang pengujian performansi dan analisis hasil penelitian BAB V KESIMPULAN DAN SARAN Berisi kesimpulan dari hasil penelitain yang dilakukan dan rekomendasi untuk penelitian berikutnya