PERANCANGAN SISTEM MONITORING JARINGAN PADA PT. INFRACOM TELESARANA Wendy Tandang Sirait Binus University, Jakarta,
[email protected]
Arif Zulfikar Pelian Binus University, Jakarta,
[email protected]
Desy Sukmawati Binus University, Jakarta,
[email protected]
Tatang Gunar Setiadji, M.Eng Binus University, Jakarta,
[email protected]
ABSTRAK Tujuan penelitian ini ialah untuk merancang sebuah sistem monitoring jaringan yang mampu memenuhi sebagian fungsi-fungsi dari manajemen jaringan dengan memanfaatkan teknologi software berbasis open source. Sistem monitoring yang dibuat mampu membantu proses analisis, troubleshooting, development, dan reporting sehingga dapat mengukur kinerja jaringan dan terus meningkatkan pelayanan. Metode penelitian yang digunakan adalah analisis permasalahan, analisis sistem jaringan yang sedang berjalan, studi pustaka, perancangan, dan implementasi. Dengan memanfaatkan software open source, maka biaya dalam penyediaan infrastruktur menjadi lebih murah bahkan fiturnya dapat dimodifikasi sesuai dengan kebutuhan. Sistem ini telah diuji coba secara langsung di lapangan dan dapat berfungsi dengan baik. Dengan demikian, dapat terus meningkatkan kinerja serta kualitas dari sistem jaringan yang berjalan di PT. Infracom Telesarana dan menjadi lebih baik. Kata Kunci : monitoring, jaringan, open source, nagios, nagvis
PENDAHULUAN Teknologi informasi yang semakin berkembang menjadikan teknologi banyak membantu dan mempermudah pekerjaan di berbagai bidang, termasuk dalam bidang jaringan komputer. Namun, hal ini menimbulkan masalah baru karena semakin banyak komputer yang terhubung ke dalam sebuah jaringan ataupun internet maka semakin banyak pula masalah yang akan muncul dan tidak dapat diprediksi secara spesifik kapan waktunya akan terjadi. PT. Infracom Telesarana merupakan merger dari dua perusahaan IT yaitu PT. Indonusa Sistem Integrator Prima dan PT. Khasanah Teknologi Persada yang bisnisnya bergerak pada bidang provider jaringan telekomunikasi, internet service provider, sistem integrator, dan subkontraktor bidang jaringan dan telekomunikasi. Dengan memperhatikan keadaan perusahaan yang memiliki jangkauan jaringan yang luas dan kompleks, sedangkan sistem monitoring yang mereka gunakan masih sangat sederhana dimana hanya bisa memantau kondisi konektivitas saja, maka diperlukan suatu sistem yang lebih baik. Sistem yang akan dibuat menggunakan teknologi open source dan mampu membantu proses analisis, troubelshooting, maintenance, reporting, dan dokumentasi. Selain murah, open source juga dapat dimodifikasi, bahkan kinerjanya juga tidak kalah dengan software yang berbayar. Setelah melakukan kajian terhadap software yang akan digunakan dan menyesuaikannya terhadap kebutuhan di perusahaan tersebut, nagios dipilih sebagai sistem utamanya dengan menambahkan beberapa plugins dan software sebagai fitur tambahan
untuk memaksimalkan kinerjanya sehingga sistem yang dibuat sesuai dengan yang diharapkan. Dengan adanya sistem ini diharapkan kinerja jaringan di perusahaan ini dapat menjadi lebih baik. Berikut ini merupakan kajian dan peninjauan terhadap perkembangan teknologi software monitoring jaringan beserta penggunaanya yang diambil dari beberapa jurnal dan penelitian sebelumnya. Contohnya oleh Antonios Danalis dan Constantinos Dovrolis dalam jurnal yang berjudul “ANEMOS: An Autonomous Network Monitoring System” mengatakan bahwa, “Anemos memungkinkan operator jaringan dan end-user untuk menampilkan dan menganalisis pengukuran secara aktif di dalam jaringan melalui GUI berbasis Web. Pengukuran dapat dilakukan dengan alat "off-the-shelf" seperti dengan bantuan ping, arus prototipe end-to-end bandwidth tersedia dengan pathload, pengukuran diarsipkan menggunakan database MySQL dan dapat divisualisasikan menggunakan MRTG. Fitur utama Anemos adalah mendukung rules, postprocessing, dan alarm.” Selain itu, L. Deri, R. Carbone, dan S. Suin, pada jurnal yang berjudul “Monitoring Networks Using Ntop” mengatakan bahwa, “Dunia jaringan saat ini menyajikan beberapa tantangan manajemen karena berbagai jenis jaringan dan integrasi media jaringan yang berbeda. Administrator jaringan membutuhkan alat otomatis untuk mendukung usaha manusia, sehingga dapat mengumpulkan informasi tentang status dan perilaku dari sebuah elemen jaringan. Ntop adalah aplikasi open-source yang dapat melakukan pengukuran trafik secara portabel yang mendukung berbagai kegiatan pengelolaan, termasuk optimalisasi jaringan, perencanaan, dan network intrusion detection. Ntop dirancang sebagai aplikasi monitoring mandiri yang ditargetkan untuk organisasi kecil yang tidak mempunyai sumber daya manusia untuk melakukan konsol terhadap perangkat komputer dan jaringan, oleh sebab itu tampilan dikembangkan dengan HTTP. Ntop saat ini berfokus pada bidang fungsional seperti traffic measurement, traffic characterisation dan monitoring, network optimisation dan planning, dan deteksi network security violations.” Dari proses tinjauan pustaka yang telah dilakukan terdapat beberapa simpulan, di antaranya adalah Web-Based GUI merupakan metode paling populer dalam menampilkan informasi dan kondisi jaringan. Tampilan informasi dalam bentuk grafis merupakan metode yang paling umum digunakan terutama dalam monitoring bandwidth. Traffic Analysis merupakan teknik yang paling sering digunakan saat ini terhadap isu-isu keamanan jaringan. Network Monitoring merupakan aktivitas dari manajemen jaringan untuk membangun sistem jaringan yang reliable. Namun, sistem yang dibuat serta diusulkan dari jurnal dan penelitian sebelumnya ini terdapat beberapa hal yang harus ditambahkan dalam aktivitas monitoring jaringan, yaitu diperlukan sebuah fitur yang mampu mengukur kinerja sistem jaringan, sehingga event yang sifatnya merugikan dapat diantisipasi. Diperlukan sebuah fitur yang mampu mengukur tingkat kehandalan sebuah sistem jaringan yang diukur bedasarkan availability dalam periode waktu tertentu. Diperlukan software yang mampu membuat aktivitas monitoring jaringan menjadi lebih menarik seperti memperbaiki visualisasi tampilan terhadap end-users. Dan diperlukan sebuah fitur alert sehingga setiap event yang terjadi dalam sistem jaringan dapat diketahui secara dini. Tujuan dari skripsi ini adalah untuk merancang sistem monitoring jaringan yang mampu memenuhi kebutuhan perusahaan tersebut, murah, dan multifungsi dengan memanfaatkan free software dan open source. Selain itu, juga untuk membuat sistem yang dapat me-monitor kondisi dan kinerja seluruh perangkat jaringan yang berjalan di PT. Infracom Telesarana.
METODE PENELITIAN Metodologi yang digunakan dalam skripsi ini antara lain : a. Metode Analisis Sebelum proses perancangan sistem, perlu dilakukan beberapa hal sebagai berikut ini : • Wawancara mengenai permasalahan yang dihadapi serta solusi yang diharapkan. • Menganalisis topologi dan sistem jaringan yang sedang berjalan saat ini. • Mengidentifikasi kebutuhan sistem seperti hardware dan software yang akan digunakan serta perangkat-perangkat lain yang akan berguna dalam proses berjalannya sistem ini. b. Studi pustaka • Mempelajari jurnal dan literatur untuk mendapatkan informasi, teori, dan perkembangannya. • Mempelajari buku-buku dan sumber tulisan terpercaya untuk menemukan landasan teori yang mendukung penyelesaian skripsi ini. • Mempelajari dan mencari informasi dari internet. c. Metode Perancangan • Merancang sistem yang akan dipergunakan. • Mempersiapkan software dan hardware yang dibutuhkan. • Instalasi dan Konfigurasi.
d. Metode Implementasi • Rangkaian proses uji coba untuk memastikan sistem berjalan sesuai dengan yang diharapkan.
HASIL DAN BAHASAN Monitoring Kondisi Host Sistem ini mampu memonitor kondisi host dengan menampilkan kondisi uptime sebuah host dalam bentuk grafik. Pada sebelah kanan dari icon kaca pembesar terdapat icon bergambar seperti grafik [perform extra host action]. Jika icon tersebut diklik, maka akan muncul gambar seperti contoh gambar 1.1.
Gambar 1.1 Tampilan Grafik Uptime Gambar 1.1 merupakan sampel grafik dari salah satu host yang dimonitor berdasarkan service ping dan terdiri dari dua grafik. Grafik pertama seperti yang di atas, yaitu grafik RTA (Round Trip Times Average). Grafik RTA merupakan data mengenai RTA maximum dan average terakhir yang dicek oleh sistem pada periode tertentu. Sedangkan grafik kedua seperti yang ada di bawah ini menampilkan data mengenai paket lost yang dikirim dari server ke host yang di-monitor. Berdasarkan data di atas terlihat pada grafik yang pertama, RTA rata-rata dari hari senin pukul 18.00 sampai selasa pukul 18.00 adalah 8.16 ms. Dan berdasarkan data dari grafik yang kedua, tidak ada paket yang lost selama periode waktu tersebut dari server yang me-monitor sampai ke host yang di-monitor.
Monitoring Bandwidth a. Monitoring dari Nagios
Gambar 2.1 Tampilan Penggunaan Bandwidth
Gambar 2.1 menampilkan trafik data dari interface bonding yang ada di salah satu perangkat yang dimonitor di Gedung Cyber. Trafik data yang ditampilkan merupakan trafik data yang melewati sebuah interface suatu perangkat. Pada data di atas juga terdapat data warning on dan critical on. Warning muncul ketika trafik mencapai 300 Mbps dan critical ketika trafik mencapai 400 Mbps. Hal ini dapat membantu analisis jika sewaktu-waktu terjadi serangan seperti ddos bahkan ketika trafik drop. Terdapat juga data traffik average sebagai gambaran rata-rata traffik yang melewati perangkat tersebut dalam periode waktu tertentu. b. Monitoring dari NagVis Gambar 2.2 di bawah ini merupakan hasil visualisasi yang menggambarkan sebagian jaringan PT. Infracom Telesarana dengan menggunakan NagVis. Pada gambar 2.2 di bawah ini terdapat icon dan line antar icon yang merepresentasikan media transmisi antara setiap PoP dengan Gedung Cyber.
Gambar 2.2 Visualisasi Jaringan Infracom dengan NagVis Gambar 2.2 dapat digunakan untuk mendapatkan rincian informasi mengenai perangkat yang digunakan. Misalnya : • Jika memilih icon Gedung Cyber yang telah diberi tanda kotak berwarna kuning, maka akan ditampilkan perangkat yang dimonitor di Gedung Cyber seperti gambar 2.3.
Gambar 2.3 Perangkat yang dimonitor di Gedung Cyber
Gambar 2.3 menggambarkan host jaringan PT. Infracom Teleserana yang tersusun pada 4 rak di data center APJII, Gedung Cyber. Icon host tersebut disesuaikan dengan kondisinya. Jika icon berwarna hijau dan bergambar checklist seperti contoh di atas, berarti host dalam kondisi yang baik. Tetapi jika berwarna merah dan bergambar “x”, berarti terjadi sesuatu pada host tersebut. Kemudian double click salah satu host yang di-monitor untuk mendapatkan rincian informasinya. • Jika memilih line di antara Gedung Cyber dan PoP GO-Cikarang yang telah diberi tanda berwarna biru, maka akan ditampilkan informasi status layanan dari line tersebut seperti gambar 2.4.
Gambar 2.4 Informasi Status Layanan Gambar 2.4 berisi informasi status layanan yang bisa didapatkan. Misalnya yang telah diberi kotak berwarna merah, yaitu besarnya receive dan transmit pada line tersebut. Selain itu, terdapat pula fitur “Extra Actions” yang jika diklik maka akan muncul informasi penggunaan bandwidth seperti gambar 2.5.
Gambar 2.5 Extra Actions Penggunaan Bandwidth
Monitoring Service Level Fitur service level mampu merepresentasikan kinerja keseluruhan jaringan. Tidak hanya dalam bentuk deskripsi, tetapi juga mampu menampilkannya dalam bentuk statistik berdasarkan peristiwa apa saja yang terjadi pada host yang dimonitor. Pada tab di sisi kiri, terdapat “Service Level” yang jika diklik akan muncul gambar 3.1 seperti di bawah ini :
Gambar 3.1 Halaman Service Level Gambar 3.1 di atas merupakan salah satu fitur tambahan yang telah diintegrasikan ke dalam sistem utama, yaitu nagiosdigger. Fitur ini dapat memenuhi kebutuhan perusahaan yang membutuhkan sistem yang mampu menampilkan informasi dalam bentuk statistik, grafik, dan juga mampu menampilkan apa dan kapan peristiwa tertentu terjadi pada jaringan perusahaan. • Global Statistic Jika memilih global statistic pada menu service level, maka informasi akan ditampilkan seperti di bawah ini :
Gambar 3.2 Halaman Global Statistic
Gambar 3.2 adalah informasi umum yang menampilkan data kapan event pertama kali terjadi setelah sistem dijalankan sampai kapan event yang paling terakhir terjadi. Selain itu, event atau peristiwa apa saja yang terjadi setiap harinya juga dapat dilihat dan ditampilkan dalam bentuk statistik. Terlihat pada tanggal 12 desember 2012 terjadi 17 events, paling tinggi terjadi pada tanggal 31 desember 2012 terjadi 36 events dan menurun keesokan harinya. Statistik ini berguna untuk proses dokumentasi dan antisipasi sehingga kejadian yang statusnya merugikan dan jumlahnya banyak dapat ditekan di kemudian hari untuk meningkatkan pelayanan. Masih pada global statistic, di bawah gambar 3.2 terdapat gambar 3.3 seperti di bawah ini :
Gambar 3.3 Halaman Detail Global Statistic Gambar 3.3 di atas adalah informasi yang lebih rinci dari halaman global statistic. Terdapat informasi kejadian per hari dan jumlah kejadiannya, termasuk statistiknya dalam bentuk grafik. Terdapat pula informasi kejadian per minggu, per jam, serta per bulan. Semua data di atas diperoleh berdasarkan aktivitas dari network yang ada di PT. Infracom Telesarana. Data ini bisa dijadikan sebuah pegangan untuk menghitung performance jaringan pada organisasi yang bersangkutan. Dari data yang didapat mengenai seberapa banyak kejadian setiap hari, jam, bahkan setiap bulannya, diharapkan dapat membantu untuk melakukan analisis lebih lanjut. Misalnya untuk mencari akar permasalahan, kerangka kerja untuk menyelesaikan masalah, antisipasi, rencana untuk pengambilan keputusan, dan yang paling penting menghasilkan sebuah solusi yang tepat untuk memperbaiki layanan agar menjadi lebih baik. • Statistics per service dan Statistics per host Jika ingin melihat lebih rinci lagi data statistik per host dan per service, pilih “statistic per host” dan “statistic per service” dan kemudian muncul tampilan seperti gambar 3.4. Pada gambar 3.4 diperoleh data yang lebih rinci per host dan per service. Pada bagian statistic per service menampilkan semua service yang dijalankan pada perangkat yang dimonitor, dari kejadian pertama sampai yang paling akhir. Selain itu, untuk mengetahui apa saja yang terjadi pada host dan kapan kejadian tersebut terjadi dapat dilihat dengan meng-klik tombol “what” dan “when” di samping masing-masing service. Demikian juga pada bagian statistic per host. Parameter yang penting ialah jumlah kejadian, data kapan kejadian pertama dan terakhir kali terjadi, jumlah hari selama kejadian berlangsung, dan rata-rata kejadian per hari selama dimonitor oleh sistem.
Gambar 3.4 Halaman Statistic per service dan Statistic per host
• Service Level pada Tanggal 8 Januari 2013 - 14 Januari 2013
Gambar 3.5 Statistik Jaringan 8 Januari 2013 - 14 Januari 2013 Gambar 3.5 di atas merupakan representasi kinerja jaringan PT. Infracom Telesarana dalam bentuk statistik dan grafik pada hitungan hari dan jam selama 7 hari berturut-turut. Pada gambar 4.17 di atas terlihat statistik kejadian per hari selama satu bulan paling banyak terjadi pada tanggal 9 Januari 2013, dimana terjadi 28 kejadian. Sedangkan statistik per jam menunjukan jam 3 sore merupakan jam yang paling banyak terjadi kejadian, dengan 22 kejadian pada jaringan PT. Infracom Telesarana. Terdapat juga rata-rata kejadian yang terjadi baik itu pada tampilan statistik per jam maupun per hari.
Gambar 3.6 Statistik Service Jaringan Tanggal 14 Januari 2013 Gambar 3.6 di atas merupakan statistik per service yang di monitor selama 7 hari berturut-turut. Pada gambar 3.6 dapat dilihat service PING menunjukan jumlah kejadian paling tinggi. Hal itu menandakan bahwa host tersebut tidak dapat terjangkau karena berbagai sebab, seperti rusaknya perangkat atau masalah pada media transmisi.
Gambar 3.7 Problem Service Jaringan 8 Januari 2013 – 14 Januari 2013 Sedangkan gambar 3.7 adalah tampilan seluruh problem yang terjadi dari service PING. Jika diperhatikan, masalah paling banyak terjadi pada “stpik” yang merupakan perangkat radio di Rumah Sakit Pantai Indak Kapuk. Hal ini menyebabkan router-RSPIK juga bermasalah. Setelah ditelusuri, hal tersebut disebabkan oleh backbone dari station “stpik” (stpik merupakan perangkat radio di Rumah Sakit PIK) sampai ke access point menggunakan wireless dan jaraknya juga sekitar 5,8 km. Karena dapat menyebabkan kemungkinan RTA yang tinggi sampai paket loss menjadi tinggi juga karena berbagai penyebab seperti inteferensi, noise, dan pergeseran antena.
Gambar 3.8 Service Level untuk Customer di RS PIK Gambar 3.8 menunjukan masalah di rumah sakit PIK paling sering terjadi pada jam 11 siang dan 3 sore. Perlu diingat juga ketika skripsi ini dibuat merupakan musim hujan dan banyak terjadi angin kencang. Sehingga, keadaan ini sangat mempengaruhi kinerja dan juga service level yang diberikan kepada pelanggan di site tersebut. Hal ini karena backbone dari site customer di Rumah Sakit Pantai Indah Kapuk sampai ke access point di PoP Indovision menggunakan perangkat radio, sehingga faktorfaktor seperti rain attenuation dan juga fading sangat mempengaruhi keadaan link tersebut.
Monitoring Event Proses monitoring dilakukan dengan merangkum kejadian yang terjadi selama 7 hari berturut-turut terhitung sejak tanggal 9 Januari 2013 sampai dengan 15 Januari 2013.
Gambar 4.1 Aktivitas Jaringan Tanggal 9 Januari 2013 Gambar 4.1 di atas merupakan tampilan NagVis pada tanggal 9 Januari 2013 yang memberi tanda bahwa terdapat perangkat di PoP Cikokol yang statusnya down, indikatornya ialah tampilan menjadi warna merah dan icon simbolnya berubah menjadi “x”.
Gambar 4.2 Aktivitas Jaringan Tanggal 9 Januari 2013 Setelah icon yang berubah parameternya pada gambar 4.1 diklik, maka tampilan berubah menjadi seperti gambar 4.2 yang menandakan bahwa terjadi masalah pada perangkat yang ada di PoP Cikokol. Jika icon tersebut diklik lagi, maka akan muncul tampilan seperti gambar 4.3.
Gambar 4.3 Aktivitas Jaringan Tanggal 9 Januari 2013 Pada gambar 4.3 terdapat informasi bahwa link dari Cyber ke arah PoP Cikokol sudah down selama 8 jam 48 menit dan 26 detik. Setelah kejadian tersebut dianalisis oleh tim, ternyata terjadi masalah pada link fiber optik di daerah Bintaro.
Monitoring Availability Sistem dapat ditampilkan availability report seluruh host group pada jangka waktu yang telah ditentukan sebelumnya. Berikut ini adalah beberapa contoh availability report seluruh host group dari tanggal 8 Januari 2013 – 14 Januari 2013 :
a.
Availability Report yang seluruh Time Up-nya 100%
Gambar 5.1 Availability Perangkat Cyber Apjii Lt 1(iix)
b.
Availability Report jika Time Up-nya ada yang kurang dari 100%
Gambar 5.2 Availability Perangkat Customer POP Indovision Bila dilakukan evaluasi, pada gambar 5.2 ada beberapa “hostgroup” yang average “time up”-nya tidak mencapai 100% selama seminggu. Hal ini disebabkan karena beberapa masalah seperti putusnya fiber optik, cuaca yang buruk sehingga menyebabkan “rain attenuation” dan “fading” pada saat kondisi hujan seperti pada beberapa perangkat radio di customer PoP Indovision. Ada juga perangkat yang sengaja dimatikan untuk beberapa hari oleh customer tersebut sehingga tidak dapat di-monitor dari sistem dan hal tersebut juga mempengaruhi persentase availability perangkat yang di-monitor.
SIMPULAN DAN SARAN Simpulan Setelah proses ujicoba serta evaluasi terhadap sistem yang telah dibuat, maka dapat ditarik simpulan sebagai berikut : a. Berdasarkan hasil ujicoba dan evaluasi yang dilakukan selama 7 hari dapat disimpulkan bahwa sistem yang telah dibuat mampu berjalan sesuai dengan fungsinya. b. Besarnya skala jaringan yang harus dimonitor tidak menjadi masalah untuk sistem ini. c. Sistem yang sama dapat dikembangkan di perusahaan atau di organisasi lain yang sejenis. d. Sistem yang dikembangkan ini mampu mengantisipasi kebutuhan pada masa mendatang dengan menambahkan plugins-plugins yang sesuai dengan kebutuhan pengguna. e. Sistem monitoring ini mampu membuat sebuah sistem jaringan yang telah dibangun menjadi lebih proaktif, salah satunya terbukti dengan adanya fitur alert dan trend prediction sehingga masalah yang mengganggu kinerja jaringan dapat secepatnya diketahui. Sistem ini juga dapat digunakan untuk monitoring Service Level Agreement (Bandwidth dan Availability) sehingga tingkat kepercayaan konsumen terhadap perusahaan menjadi lebih baik. f. Adanya fitur service level dapat membuat admin dan teknisi siaga pada waktu-waktu tertentu berdasarkan statistik dari event yang terjadi, sehingga dapat menekan event yang sifatnya merugikan kinerja sistem jaringan yang sedang berjalan. Selain itu, fitur ini juga dapat dikembangkan untuk mengukur performa jaringan secara periodic, sehingga pihak terkait dapat mengambil sebuah keputusan untuk menghindari kerugian yang disebabkan oleh buruknya performa jaringan yang telah dibangun. g. Tidak semua insiden dalam jaringan dapat diatasi dengan metode proaktif, terkadang admin dan teknisi harus bertindak secara reaktif untuk menyelesaikan beberapa insiden yang menggangu kinerja jaringan. h. Kelemahan sistem ini ialah tidak adanya fitur recovery ataupun backup yang praktis sehingga seluruhnya harus dilakukan secara manual.
Saran Saran dan harapan untuk proses pengembangan selanjutnya ialah : a. Mempergunakan software alert yang lebih canggih dimana alert notification untuk sebuah insiden dilengkapi oleh sebuah “escalation procedure” atau tahapan eskalasi yang harus dilakukan sesaat setelah insiden terjadi. b. Dilengkapi dengan kemampuan untuk memberikan sebuah notifikasi yang dapat membedakan mana perangkat yang bermasalah karena mati listrik, karena proses maintenance¸ atau karena penyebab lainnya. c. Pada proses pengembangan selanjutnya sebaiknya dilengkapi dengan software untuk incident management, hal ini dapat mengukur kinerja teknisi dan juga helpdesk dalam penanganan sebuah insiden yang terjadi. d. Dilengkapi dengan kemampuan untuk melakukan traffic analysis, hal ini membantu dalam menangani isu-isu security.
REFERENSI Abiona, O., Aladesanmi, T., Onime, C., et al. (2009). A Scalable Architecture Network Traffic Monitoring and Analysis Using Free Open Source Software. Int. J. Communications, Network and System Sciences, 6, 528-539. Agrawal, Shipra., Kanthi, C.N., Naidu K.V.M., et.al. (2007). Monitoring Infrastructure for Converged Network and Services. Bell Labs Technical Journal, 12 (2), 63-78. Anonymous. (n.d). WAN Topologies. Diakses tanggal 18 januari 2013 dari http://www.angelfire.com/mech/phattony/wan_topologies.htm Anonymous. (n.d). Compare Network Management Software. Diakses tanggal 28 Februari 2013 dari http://network-management.findthebest.com/ Anonymous. (2000). Dictionary of Networking. Alamenda : Sybex. Anonymous. (2013). Nagios. Diakses tanggal 11 Januari 2013 dari http://www.nagios.org/about/ Anonymous. (2013). Nagios. Diakses tanggal 11 Januari 2013 dari http://www.nagios.org/about/overview Anonymous. (2013). NagVis. Diakses tanggal 11 Januari 2013 dari http://www.nagvis.org/about/ Beyda, William J. (2000). Data Communications : From Basic to Broadband. (3 rd Edition). New Jersey : Prentice Hall. Clemm, A. (2007). Network Management Fundamentals. Indianapolis : Cisco Press. Danalis, A., dan Dovrolis, C. ANEMOS : An Autonomous Network Monitoring System. Diakses tanggal 1 Februari 2013 dari http://www.cc.gatech.edu/fac/constantinos.dovrolis/Papers/anemos-pam03.pdf/ Deri, L., Carbone, R., dan Suin, S. Monitoring Networks Using Ntop. Diakses tanggal 1 Februari 2013 dari http://webcache.googleusercontent.com/search?q=cache:Y61JfxKhxAJ:svn.ntop.org/IM2001.pdf.gz+L.+Deri,+R.+Carbone+S.+Suin+Monitoring+Networks+Using+Nt op&cd=1&hl=id&ct=clnk&gl=id FitzGerald J., Dennis, A. (2007). Business Data Communication and Networking. (9th edition). USA : Wiley. Forouzan, Behrouz A. (2007). Data Communication and Networking. (4rd edition). New York : McGrawHill. Kundu, D., dan Lavlu, S.M. Ibrahim. (2009). Cacti 0.8 Network Monitoring. Birmingham : Packt Publishing Ltd. Ohara, G.H. (2005). Aplikasi Sistem Monitoring Berbasis Web untuk Open Cluster. Diakses tanggal 18 Januari 2011 dari http://www.komputasi.lipi.go.id/data/1014224400/data/1123986736.pdf Sofana, Iwan. (2011). Teori dan Modul Praktikum Jaringan Komputer. Bandung : Modula. Sofana, Iwan. (2012). CISCO CCNA dan Jaringan Komputer. (Edisi Revisi). Bandung : Informatika Bandung. Sofana, Iwan. (2012). CISCO CCNP dan Jaringan Komputer. Bandung : Informatika Bandung. Stallings, William. (2004). Data and Computer Communications. (7th Edition). New Jersey : Pearson Prentice Hall. Subramanian, Mani. (2000). Network Management : An introduction to principals and practice. USA : Addison Wesley Longman. Tanenbaum, Andrew S. (2003). Computer Networks. (4th edition). New Jersey : Prentice Hall. Wilson, Ed. (2000). Network monitoring and analysis : a protocol approach to troubleshooting. New Jersey : Prentice Hall PTR.
RIWAYAT PENULIS Wendy Tandang Sirait lahir di kota Bandung pada 17 Maret 1991. Penulis menamatkan pendidikan S1 di Universitas Bina Nusantara dalam bidang Teknik Informatika pada tahun 2013. Arif Zulfikar Pelian lahir di kota Jakarta pada 19 September 1991. Penulis menamatkan pendidikan S1 di Universitas Bina Nusantara dalam bidang Teknik Informatika pada tahun 2013. Desy Sukmawati lahir di kota Jakarta pada 28 September 1991. Penulis menamatkan pendidikan S1 di Universitas Bina Nusantara dalam bidang Teknik Informatika pada tahun 2013.
DESIGN OF NETWORK MONITORING SYSTEM IN PT. INFRACOM TELESARANA Wendy Tandang Sirait Binus University, Jakarta,
[email protected]
Arif Zulfikar Pelian Binus University, Jakarta,
[email protected]
Desy Sukmawati Binus University, Jakarta,
[email protected]
Tatang Gunar Setiadji, M.Eng Binus University, Jakarta,
[email protected]
ABSTRACT The purpose of this study was to design a network monitoring system that is able to fulfill some of the functions of network management by utilizing software based on open source technology. The monitoring system is able to assist the process of analysis, troubleshooting, development, and reporting so as to measure network performance and continue to improve services. The method used in this research is the analysis of problems, the analysis of the network system is running, literature, design, and implementation. By leveraging open source software, the cost of providing infrastructure to be cheaper even features can be modified as needed. This system has been tested directly in the field and to function properly. Thus, to continuously improve performance and the quality of the network system running on PT. Infracom Telesarana and better. Key Words: monitoring, network, open source, nagios, nagvis
INTRODUCTION Growing information technology makes a lot of technology to assist and facilitate the work in various fields, including in the field of computer networks. However, this raises new problems as more and more computers connected to a network or the internet then the more problems will arise and can not be specifically predicted would happen when it's time. PT. Infracom Telesarana a merger of two IT companies, namely PT. Indonusa System Integrator Prima and PT. Technology repertoire Persada whose business operates in the field of telecommunication network providers, Internet service providers, system integrators, and subcontractor network and telecommunications fields. Having regard to the state of a company that has a wide range of networks and complex, while the monitoring systems they use are very simple which can only monitor the condition of connectivity alone, we need a better system. The system to be created using open source technologies and able to assist in the analysis, troubelshooting, maintenance, reporting, and documentation. Besides low cost, open source can also be modified, even the performance is not inferior to paid software. After a review of the software to be used and adapt to the needs of the company, Nagios selected as the primary system by adding some plugins and software as an additional feature to maximize the performance are made so that the system as expected. With the system's expected performance in the company's network could be better. Here is an assessment and review of the developments in technology and its use is network monitoring software were taken from several journals and previous research. For example, by Antonios Danalis and Constantinos Dovrolis in the journal entitled “Anemos: An Autonomous Network Monitoring System” saying that, “Anemos allows network operators and end-users to view and analyze active measurements in the network through a Web-based GUI. Measurements can be done by means of "off-the-
shelf" like with the help of ping, the current prototype end-to-end available bandwidth pathload, archived measurements using MySQL database and can be visualized using MRTG. Anemos main feature is support rules, post-processing, and alarm.” In addition, L. Deri, R. Carbone, and S. Suin, the journal entitled “Monitoring Networks Using Ntop” says that, “The world's current network management presents several challenges due to various types of networks and integration of different network media. Network administrators need automated tools to support the work of men, so as to gather information on the status and behavior of a network element. Ntop is open-source application that can perform measurements in a portable that supports traffic management activities, including network optimization, planning, and network intrusion detection. Ntop monitoring is designed as a standalone application targeted for small organizations that do not have the human resources to carry out the console to the computer and the network, and therefore display developed by HTTP. Ntop is currently focusing on functional areas such as traffic measurement, traffic characterization and monitoring, network optimization and planning, and detection of network security violations.” From the literature review that has been done there is some stiffness, which include Web-Based GUI is the most popular method of displaying the information and network conditions. Display of information in graphical form is the most common method used especially in monitoring bandwidth. Traffic Analysis is a technique most often used today for network security issues. Network Monitoring is an activity of network management to build a reliable network system. However, the proposed system is made and from journals and previous research, there are some things that should be added to the network monitoring activity, which is required of a feature that is able to measure the performance of the network system, so that its adverse event can be anticipated. Needed a feature that can measure the reliability of a system is measured on fixed network availability in a given time period. Required software that can make network monitoring activity becomes more interesting as the view of improving the visualization of end-users. And required an alert feature that every event that occurs in the network can be known in childhood. The purpose of this essay is to plan for network monitoring systems that can meet the needs of the enterprise, cheap, and multifunctional leveraging free software and open source. In addition, also to make a system that can monitor condition and performance across network devices that run on the PT. Infracom Telesarana.
RESEARCH METHODS The methodology used in this paper include: a. Analysis Method Before the process of designing the system, to do some of the following: • Interview about the problems faced and the solutions are expected. • Analyze the network topology and systems that are currently running. • Identify the needs of the system such as hardware and software to be used with other devices that will be useful in the running system. b. Literature Analysis Method • Learning journals and literature to obtain information, theory, and development. • Learn about books and writing reliable source to find the theoretical basis to support the completion of this thesis. • Studying and seeking information from the Internet. c. Iterative Methods • Design the system to be used. • Prepare software and hardware required. • Installation and Configuration. d. Method of Implementation • The series of tests to ensure the system is running as expected.
RESULT AND DISCUSSION Monitoring Host Condition The system is able to monitor the condition of the host with a host uptime display conditions in the form of graphs. On the right of the magnifying glass icon icon display there as graphs [Extra host perform action]. If the icon is clicked, the image will appear as the example image 1.1.
Gambar 1.1 Graphic Uptime View Figure 1.1 is a sample graph from one host to be monitored by pinging service and consists of two graphs. The first graph as above, ie graphs RTA (Round Trip Times Average). Graph data on RTA RTA is maximum and average last checked by the system at a certain period. Whereas the second graph like the one below displays data on lost packets are sent from the server to the monitored host. Based on the above data is shown in the first graph, RTA average at 18.00 from Monday until Tuesday at 18.00 is 8.16 ms. And based on the data from the second chart, no packets are lost during the time period of the monitoring server to the monitored host.
Monitoring Bandwidth a. Monitoring with Nagios
Gambar 2.1 Tampilan Penggunaan Bandwidth Figure 2.1 displays the data traffic from existing bonding interface on one device are monitored in Cyber Building. Traffic data displayed is data traffic that passes through an interface of a device. In the above data there is also a warning on the data and critical on. Warning appears when the traffic up to 300 Mbps and critical when traffic reached 400 Mbps. This can help the analysis if at any time such as DDoS attacks even when the traffic drop. There is also data traffic averages as a rough average traffic passing through the device in a certain time period. b. Monitoring with NagVis Figure 2.2 below is the result of a partial network visualization PT. Infracom Telesarana using NagVis. In the picture below there are 2.2 icon and the icon that represents the line between the transmission medium between each PoP with Cyber Building.
Gambar 2.2 Infracom Network Visualization with NagVis Figure 2.2 can be used to obtain detailed information about the device being used. For example: • If you select the icon Cyber Building that has been marked yellow box, it will display the monitored device as shown in Cyber Building 2.3.
Gambar 2.3 Monitored devices in Gedung Cyber Figure 2.3 illustrates the network host PT. Infracom Teleserana arranged in 4 racks in the data center APJII, Cyber Building. Icon host adapted to the conditions. If the icon is green and pictorial checklist like the example above, the host is in good shape. But if the red and display "x", means there is something on that host. Then double click on one of the host-monitor to get a detailed information. • If you select a line in between the building and the PoP GO Cyber-Cikarang that has been marked in blue, it will display status information from online services such as picture 2.4.
Gambar 2.4 Status Service Information Figure 2.4 contains the service status information that can be obtained. For example, who have been given a red box, the size of receive and transmit on the line. In addition, there is also the "Extra Actions" which when clicked will display information such as bandwidth utilization 2.5 picture below :
Gambar 2.5 Extra Actions Bandwidth usage
Monitoring Service Level Features service level to represent the overall performance of the network. Not only in the form of a description, but it is also able to display it in the form of statistics based on what events are happening on the monitored host. On the tab on the left side, there is a "Service Level" which when clicked will display the image at 3.1 as follows :
Gambar 3.1 Service Level Page Figure 3.1 above is one additional feature that has been integrated into the main system, which nagiosdigger. This feature could meet the needs of companies that need a system that is capable of displaying information in the form of statistics, graphs, and is also capable of displaying what and when certain events occur on the corporate network. • Global Statistic If you choose global service level statistics on the menu, then the information will be displayed as below:
Gambar 3.2 Global Statistic Page
Figure 3.2 is general information that displays when the event first occurred after the system starts up when the last event occurred. In addition, any event or events that occur every day can also be viewed and displayed in the form of statistics. Seen on 12 December 2012 happened 17 events, the highest place on 31 December 2012 and declining happened 36 events the next day. These statistics are useful for process documentation and the anticipation that the status of adverse events and the polynomial can be reduced in the future to improve services. Still in the global statistic, below pictures 3.2 are picture 3.3 as below :
Gambar 3.3 Global Statistic Detail Page Figure 3.3 above is more detailed than the global statistic pages. There is information of events per day and the number of events, including the statistics in graphical form. There is also information events per week, per hour and per month. All the above data obtained by the activity of the network in PT. Infracom Telesarana. This data can be used as a handle to quantify network performance in the organization. From the data obtained on how many occasions each day, hour, even every month, is expected to help to do further analysis. For example, to find the root of the problem, the framework to solve problems, anticipate, plan for decision-making, and most importantly produce an appropriate solution to improve the service to make it better. • Statistics per service and Statistics per host If you want to look in more detail statistics per host and per service, select "statistics per host" and "statistics per service" and then the picture appears as 3.4. At picture 3.4 the picture obtained more detailed data per host and per service. On the statistics per service displays all services running on the monitored devices, from the first scene to the last. Moreover, to know what is happening on the host and when the incident occurred can be viewed by clicking on the "what" and "when" next to each service. Similarly, the statistical section per host. Important parameter is the number of events, the data when the event first and last time this has happened, the number of days during the incident took place, and the average per day during the events monitored by the system.
Gambar 3.4 Statistic per service and Statistic per host Page
• Service Level in January 8, 2013 – January 14, 2013
Gambar 3.5 Network Statistic in January 8, 2013 – January 14, 2013 Figure 3.5 above is a representation of the network performance PT. Infracom Telesarana in the form of statistics and charts in a matter of days and hours for 7 consecutive days. At 4:17 the picture above shows statistics of events per day for one month at the most occurred on January 9, 2013, which occurred 28 events. While the hourly statistics show at 3 pm is the hour of the most common events, with 22 events on the PT. Infracom Telesarana network. There is also an average of events that occur in both the statistics display per hour or per day.
Gambar 3.6 Service Network Statistic in January 14, 2013
Figure 3.6 above statistics are a service that monitors for 7 consecutive days. At picture 3.6 the picture visible service PING shows the highest number of occurrences. This indicates that the host can not be reached due to various reasons, such as damage to the device or transmission problems on the media.
Gambar 3.7 Service Network Problem in January 8, 2013 – January 14, 2013 While the image 3.7 is display all the problems that occur from PING service. If you notice, most problems occur in "stpik" which is a radio device in Kapuk Indak Coast Hospital. This causes the routerRSPIK also problematic. Once traced, it is caused by the backbone of the station "stpik" (stpik a radio device in the Hospital PIK) to use a wireless access point and the distance is also approximately 5.8 miles. Because it can lead to a higher likelihood RTA to be high packet loss as well as a variety of causes such as inteferensi, noise, and shift the antenna.
Gambar 3.8 Service Level for RS PIK Customer Figure 3.8 shows a problem in hospitals PIK most common at 11 am and 3 pm. Keep in mind also when the thesis is a rainy season and a lot going strong winds. Thus, this situation greatly affects the performance and service levels provided to customers on the site. This is because the backbone of the customer site at the Hospital Pantai Indah Kapuk up to the access point in PoP Indovision use the radio, so factors such as rain attenuation and fading also greatly affect the state of the link.
Monitoring Event Process monitoring is done by summarizing events that occurred during the 7 consecutive days from the date of January 9, 2013 until January 15, 2013.
Gambar 4.1 network Activity in January 9, 2013 Figure 4.1 above is NagVis appearance on January 9, 2013 that signals that there is a device in the status PoP Cikokol down, the indicator is a red display and icon symbols changed to "x".
Gambar 4.2 Network Activity in January 9, 2013 Once the icon has changed the parameters in 4.1 image is clicked, the display turned into a 4.2 image that indicates a problem with the devices in the PoP Cikokol. If the icon is clicked again, then it will appear like the picture 4.3.
Gambar 4.3 Network Activity in January 9, 2013 At picture 4.3 of the information that links to the PoP Cikokol Cyber been down for 8 hours 48 minutes and 26 seconds. After the incident analyzed by the team, there was a problem with the fiber-optic link in the Bintaro.
Monitoring Availability System availability can be displayed around the host group report on the period of time that has been predetermined. Here are some examples of availability report a whole host group from the date of January 8, 2013 - January 14, 2013 :
a.
Availability Report with all 100% Time Up
Gambar 5.1 Devices Availability in Cyber Apjii Lt 1(iix)
b.
Availability Report if its Time Up are less than 100%
Gambar 4.5.2 Availability Perangkat Customer POP Indovision When evaluated, the picture 5.2 drawing some "hostgroup" the average "time up" it does not reach 100% during the week. This is due to several problems such as optical fiber breakdown, bad weather causing "rain attenuation" and "fading" when the rain as some radio equipment in customer PoP Indovision. There also are deliberately turned off for a few days by the customer so that can not be monitored from the system and it also affects the percentage of the monitored device availability.
CONCLUSION AND RECOMMENDATIONS Conclusions After the testing and evaluation of a system that has been created, it can be drawn the following conclusions: a. Based on the test results and evaluations conducted for 7 days can be concluded that the system has been made to walk according to function. b. The scale of the network to be monitored is not a problem for this system. c. The same system can be developed in the company or in other similar organizations. d. The system developed is able to anticipate the needs of the future by adding plugins-plugins to suit user needs. e. The monitoring system is able to create a network system that has been built to be more proactive, as evidenced by the presence of one feature alerts and trend prediction that the problems that plague network performance can be immediately known. This system can also be used for monitoring Service Level Agreement (Bandwidth and Availability) so that the level of consumer confidence in the company for the better. f. A feature service level admin and technicians can make idle at certain times based on statistics of the events that occurred, so as to suppress events that are detrimental to the performance of the network system is running. In addition, this feature can also be developed to measure network performance periodically, so that stakeholders can take a decision to avoid losses caused by poor performance of the network that has been built. g. Not all incidents in the network can be addressed with proactive method, sometimes admins and technicians should act reactively to resolve incidents that interfere with network performance. h. The weakness of this system is the lack of recovery or backup feature so entirely practical to be done manually.
Recommendations Recommendations and hope for further development of the process are : a. Using sophisticated software which alerts the alert notification to an incident supplemented by an "escalation procedure" or stages of escalation should be done shortly after the incident occurred. b. Equipped with the ability to deliver a notification to tell which device is problematic because a power failure, because the process ¸ maintenance or due to other causes. c. In the process of further development should be equipped with software for incident management, it can measure performance and also help desk technicians in the handling of an incident that occurred. d. Equipped with the ability to perform traffic analysis, it helps in dealing with security issues.
REFERENCES Abiona, O., Aladesanmi, T., Onime, C., et al. (2009). A Scalable Architecture Network Traffic Monitoring and Analysis Using Free Open Source Software. Int. J. Communications, Network and System Sciences, 6, 528-539. Agrawal, Shipra., Kanthi, C.N., Naidu K.V.M., et.al. (2007). Monitoring Infrastructure for Converged Network and Services. Bell Labs Technical Journal, 12 (2), 63-78. Anonymous. (n.d). WAN Topologies. Accessed in January 18, 2013 from http://www.angelfire.com/mech/phattony/wan_topologies.htm Anonymous. (n.d). Compare Network Management Software. Accessed in February 28, 2013 fromhttp://network-management.findthebest.com/ Anonymous. (2000). Dictionary of Networking. Alamenda : Sybex. Anonymous. (2013). Nagios. Accessed in January 11, 2013 from http://www.nagios.org/about/ Anonymous. (2013). Nagios. Accessed in January 11, 2013 from http://www.nagios.org/about/overview Anonymous. (2013). NagVis. Accessed in January 11, 2013 from http://www.nagvis.org/about/ Beyda, William J. (2000). Data Communications : From Basic to Broadband. (3 rd Edition). New Jersey : Prentice Hall. Clemm, A. (2007). Network Management Fundamentals. Indianapolis : Cisco Press. Danalis, A., dan Dovrolis, C. ANEMOS : An Autonomous Network Monitoring System. Diakses tanggal 1 Februari 2013 dari http://www.cc.gatech.edu/fac/constantinos.dovrolis/Papers/anemos-pam03.pdf/ Deri, L., Carbone, R., dan Suin, S. Monitoring Networks Using Ntop. Diakses tanggal 1 Februari 2013 dari http://webcache.googleusercontent.com/search?q=cache:Y61JfxKhxAJ:svn.ntop.org/IM2001.pdf.gz+L.+Deri,+R.+Carbone+S.+Suin+Monitoring+Networks+Using+Nt op&cd=1&hl=id&ct=clnk&gl=id FitzGerald J., Dennis, A. (2007). Business Data Communication and Networking. (9th edition). USA : Wiley. Forouzan, Behrouz A. (2007). Data Communication and Networking. (4rd edition). New York : McGrawHill. Kundu, D., dan Lavlu, S.M. Ibrahim. (2009). Cacti 0.8 Network Monitoring. Birmingham : Packt Publishing Ltd. Ohara, G.H. (2005). Aplikasi Sistem Monitoring Berbasis Web untuk Open Cluster. Accessed in January 18, 2013 from http://www.komputasi.lipi.go.id/data/1014224400/data/1123986736.pdf Sofana, Iwan. (2011). Teori dan Modul Praktikum Jaringan Komputer. Bandung : Modula. Sofana, Iwan. (2012). CISCO CCNA dan Jaringan Komputer. (Edisi Revisi). Bandung : Informatika Bandung. Sofana, Iwan. (2012). CISCO CCNP dan Jaringan Komputer. Bandung : Informatika Bandung. Stallings, William. (2004). Data and Computer Communications. (7th Edition). New Jersey : Pearson Prentice Hall. Subramanian, Mani. (2000). Network Management : An introduction to principals and practice. USA : Addison Wesley Longman. Tanenbaum, Andrew S. (2003). Computer Networks. (4th edition). New Jersey : Prentice Hall. Wilson, Ed. (2000). Network monitoring and analysis : a protocol approach to troubleshooting. New Jersey : Prentice Hall PTR.
WRITER’S HISTORY Wendy Away Sirait was born in the city in March 17, 1991. The author graduated S1 at Bina Nusantara University in the field of Information Technology in 2013. Arif Zulfikar Pelian was born in Jakarta in September 19, 1991. The author graduated S1 at Bina Nusantara University in the field of Information Technology in 2013. Desy Sukmawati was born in Jakarta in September 28, 1991. The author graduated S1 at Bina Nusantara University in the field of Information Technology in 2013.