BAB III ANALISIS DAN PERANCANGAN 3.1 Pengumpulan Data Pada bab ini akan dibahas mengenai perancangan sistem monitoring power PLN menggunakan router wifi sebagai trigger agar bisa mengirim notifikasi dalam bentuk email, serta dapat melakukan event handler. Selain itu, alur kerja sistem akan dijelaskan menggunakan flowchart. Pembahasan tersebut dibagi menjadi beberapa subbab, yaitu : a. Pencarian referensi dan sumber-sumber yang berhubungan dengan Nagios dan pengimplementasiannya. b. Pencarian referensi dan sumber-sumber yang berhubungan dengan email server, event handler nagios, MTA (Mail Transfer Agent) c. Mempelajari implementasi dari Postfix sebagai MTA (Mail Transfer Agent) untuk digabungkan dengan sistem monitoring .
3.2 Diagram Alir Perancangan Pada tugas akhir ini berikut langkah – langkah yang dilakukan dalam perancangan pemonitoran status PLN di site Local Network PT. Indosat, Tbk.
39
Mulai
Router Wifi off karena power AC PLN down
Nagios Gunakan Event Handler untuk mereset service & sistem
Nagios mengirim info
TIDAK Problem solved?
YA
Mail-X menyampaikan data dari Nagios ke Postfix sebagai MTA (Mail Transfer Agent)
Postfix mengirimkan info ke mail server berupa notifikasi email ke contact distribution list
Email diterima
Selesai
YA
Gambar 3.2 Diagram Alir
40
Email sukses terkirim?
TIDAK
Penjelasan dari diagram flow diatas adalah sebagai berikut: a. Ketika power AC yang berasal dari PLN di shelter off atau down, maka otomatis router wifi yang catuannya adalah power AC PLN 220 volt juga akan down atau dalam keadaan mati. b. Pada saat router wifi down, Nagios tetap mengirimkan ping ke router wifi yang sedang dimonitoring, dikarenakan router wifi sedang dalam keadaan down maka tidak akan ada balasan ping dari router wifi yang dimonitoring. c. Pada saat Nagios tidak menerima ping dari router wifi, Nagios tidak lantas langsung menyatakan status bahwa router wifi yang sedang dimonitoring dalam keadaan status DOWN. Ada beberapa kali phase ping yang dilakukan oleh Nagios dan phase ping ini bisa diatur sesuai dengan keinginan sang admin jaringan begitu pula dengan durasi pingnya. d. Dalam waktu yang bersamaan dengan proses ping, Nagios juga menggunakan apa yang disebut dengan event handler, dimana event handler melakukan tugasnya untuk mereset service dan sistem yang ada di dalam router wifi. e. Ketika event handler telah melakukan tugasnya dan router wifi yang dimonitoring service dan sistemnya masih dalam keadaan belum normal, maka pada saat itulah Nagios menyatakan bahwa router wifi yang dimonitoring dalam keadaan state “DOWN” dan menggunakan Mailx sebagai penyampai data dari Nagios ke MTA (Mail Transfer 41
Agent) Postfix untuk mengirimkan notifikasi berupa email ke admin jaringan melalui Mail Server IT Indosat. f. Apabila email notifikasi gangguan tidak diterima oleh admin jaringan atau oleh Operasional Local Network, biasanya ada masalah pada mail server dan harus berkordinasi dengan IT. g. Apabila email notifikasi sudah diterima oleh admin jaringan atau oleh Operasional Local Network, maka selanjutnya adalah eskalasi gangguan ke tim terkait sesuai dengan area site yang telah ditentukan.
3.2.1 Implementasi Nagios dalam hal monitoring host
Monitoring
Gambar 3.1 Monitoring Admin jaringan mengkonfigurasi Nagios untuk memonitor komponen atau host IT atau jaringan yang vital, termasuk metric sistem, protocol jaringan, aplikasi, server – server, dan infrastruktur jaringan.
42
Alerting
Gambar 3.2 Alerting atau notifikasi gangguan Nagios mengirimkan alert atau peringatan ketika infrastruktur yang dimonitoring dalam keadaan Down dan Recovery, menberikan admin jaringan informasi – informasi event yang penting. Alert atau peringatan bisa dikirimkan atau direlay melalui email, sms, atau custom script.
Response
Admin jaringan ataupun Operasional Local Network bisa mengidentifikasi dan sudah tahu gangguan apa yang terjadi dan mulai menyelesaikan gangguan dan menginvestigasi penyebab gangguan dengan cepat. Alert atau notfikasi bisa dieskalasikan ke divisi lain yang berbeda jika diperlukan.
Reporting
Reports atau laporan meyediakan history dari gangguan yang terjadi, event – event, notifikasi dan respons dari gangguan yang terjadi untuk di review dikemudian hari. Ketersediaan laporan – laporan ini membantu dalam penyesuaian target – target SLA
43
Planning
Gambar 3.3 Trending Graph Trending dan grafik perencanaan kapasitas dan kumpulan laporan memudahkan admin untuk mengidentifikasi peningkatan performansi apa yang peelu dilakukan sebelum gangguan terjadi lagi di kemudian hari.
3.2.2 Notifikasi Email dan Mail Server Notifikasi email adalah suatu peringatan yang dibuat dengan suatu software email, email daemon dan aplikasi pendukungnya yang digunakan untuk memberikan suatu informasi dari suatu respon yang akan dilakukan. Sedangkan sebuah mail server (juga dikenal sebagai Mail Transfer Agent atau MTA, pengirim mail, router mail atau mailer Internet) adalah sebuah aplikasi yang menerima mail masuk dari pengguna lokal (orang dalam domain yang sama) dan meneruskan mail keluar untuk pengiriman. Sebuah komputer yang didedikasikan untuk menjalankan aplikasi tersebut juga disebut mail server. 3.2.3 Mail Transfer Agent (MTA) MTA
merupakan
program
yang
bertanggung jawab
dalam
hal
pengiriman sebuah email ke alamat tujuan. Beberapa Jenis MTA antara lain:
44
Sendmail, Qmail, Mercury, Postfix. MTA menggunakan port 25 untuk penghubung antar MTA. 3.2.4 Postfix Postfix adalah Mail Transfer Agent yang dikembangkan oleh Wietse Venema. Beberapa fitur yang ditawarkan oleh Postfix: a. Performance. Postfix mampu melayani sejuta e-mail dalam sehari. Hal ini menunjukkan kalau Postfix dapat dikategorikan sebagai mail server berskala besar. b. Kompatibilitas. Postfix sangat kompatibel dengan Sendmail (yang sudah banyak dipergunakan orang sebagai MTA di UNIX). c. Postfix terdiri beberapa program kecil yang saling terpisah. Jika Sendmail hanya mempunyai satu program besar dan satu file konfigurasi besar, Postfix memiliki program-program kecil yang menjalankan tugasnya secara spesifik. d. Multiple Transport. Postfix dapat mengirim surat dengan modus SMTP (Simple Mail Transfer Protocol) dan UUCP (Unix to Unix Copy Protocol) sekaligus. e. Mendukung
format
Maildir.
Maildir
adalah
format boks
penyimpanan surat dalam bentuk folder daripada berbentuk satu file.
45
f. Kemudahan
konfigurasi.
Meskipun
Postfix
terdiri dari
banyak
program kecil,namun hanya memiliki satu file konfi gurasi yang mudah untuk di-setting, yakni /etc/Postfix/main.cf. Setelah membahas fitur – fitur yang disedakan oleh Postfix sebagai MTA (Mail Transfer Agent), berikut sekilas gambaran bagaimana Postfix bekerja: a. Jika ada email lokal, maupun email remote yang mempergunakan SMTP, diletakkan ke dalam direktori /var/mail/Postfix/maildrop. Direktori ini world writable, dan permissionnya selalu dicek oleh pickup daemon setiap kali ada mail masuk. b. Di sini akan dicek host, domain, maupun username yang dituju. Pengecekan juga termasuk yang didefinisikan di /etc/aliases dan ~/.forward. Jika bermasalah, mail akan dikembalikan ke pengirim. Biasanya ada satu tembusan ke postmaster. c. Dari maildrop, mail akan di-clean-up dengan menambahkan header, dan meletakkannya di direktori /var/mail/postfix/incoming. Di sini program queue manager akan diaktifkan. d. Queue Manager akan memisahkan email yang ditujukan untuk jaringan local dan mail yang ditujukan untuk host/jaringan remote. Jika ada mail yang macet, Queue Manager akan memilahnya, sehingga tidak mempengaruhi pengantaran email lainnya. e. Trivial-rewrite adalah program yang dipanggil oleh Queue Manager untuk resolving alamat dari tujuan surat.
46
3.3 Perancangan Sistem Nagios sebagai monitoring server, Postfix sebagai mail transfer agent akan diinstal pada sistem operasi Ubuntu. Agar aplikasi berjalan dengan lancar maka dibutuhkan spesifikasi minimum pada server yaitu dengan penggunaan processor minimum Pentium 4 (atau yang setara) dan RAM tidak kurang dari 512 MB. Kebutuhan perangkat keras dan lunak merupakan salah satu aspek utama yang diperhatikan dalam pembuatan proyek akhir ini. Tidak semua perangkat keras sesuai dengan kebutuhan perangkat lunak, misal pada modem, modem harus menggunakan spesifikasi yang sudah didukung oleh perangkat lunak. Oleh karena itu kebutuhan perangkat keras disesuaikan dengan perangkat lunak yang akan digunakan. Sistem monitoring server yang dirancang diharapkan sesuai dengan fungsinya yaitu mampu melakukan event handler dan mengirimkan notifikasi ke administrator. Sehingga dibuat sebuah diagram alur sebagai pedoman alur kerja sistem yang akan diimplementasikan nanti. Untuk lebih jelasnya dari rancangan proyek ini, dapat dilihat dari gambar-gambar berikut berikut:
47
Gambar 3.4 Desain sistem secara umum Pemasangan router wifi di shelter – shelter Indosat menitikberatkan pada peningkatan performansi jaringan, tepatnya optimasi dari CoS atau Continuity of Service atau keberlangsungan service yang ada pada suatu perangkat dan telah ditentukan nilai standartnya sehingga perangkat dan jaringan tersebut masih dalam level KPI ( Key Performance Indicator ) yang baik. Pada perancangan monitoring power PLN di shelter Indosat ini, CoS yang diukur adalah waktu lamanya node UMUX tersebut dalam keadaan state “DOWN” dalam satuan menit. Pengumpulan data gangguan dilihat dari “Laporan Harian Operasional Local Network” dan rekapitulasi “Laporan Mingguan Operasional Local Network”. CoS per site dihitung dan direkap setiap seminggu sekali. Oleh karena itu ditetapkan dalam seminggu ada 10080 menit sebagai pembagi untuk menghitung berapa persen CoS yang dicapai tiap site selama seminggu.
48
1 jam = 60 menit 1 hari = 24 jam 1 minggu = 7 hari = 24 jam x 7 hari = 168 jam 1 minggu = 168 jam x 60 menit = 10080 menit
3.4 Kebutuhan Sistem Kebutuhan sistem untuk menyelesaikan proyek akhir ini, maka dibutuhkan beberapa perangkat lunak dan perangkat keras yang akan digunakan untuk dapat memenuhi kebutuhan dan mencapai tujuan yang diinginkan. Perangkat keras yang dibutuhkan antara lain sebagai berikut:
49
Tabel 3.1 Spesifikasi hardware pada server Nagios
PERANGKAT NO
KERAS /
UNIT
KETERANGAN
LUNAK Processor Intel Core 2 Duo 1
PC Server
1
RAM : DDR3 2GB HDD : 320GB
2
Sistem operasi
1
Ubuntu
3
Kabel UTP
3
Cat 5
4
Nagios
1
Sebagai tools monitoring system Sebagai mail transfer
5
Postfix
1
agent untuk notifikasi email Sebagai web server
6
Apache
1
untuk web interface nagios Sebagai source power AC
Kabel power 7
untuk router wifi 1
atau extender
sehingga diletakkan tidak jauh dari UMUX Sebagai yang merutekan Server Nagios
8
Router
1 ke cloud network UMUX
50
Tabel 3.2 Spesifikasi Wifi Router TP Link WR741ND HARDWARE FEATURES Interface
4 10/100Mbps LAN PORTS 1 10/100Mbps WAN PORT
Button
Quick Setup Security Button (WPS Compatible) Reset Button Power On/Off Button
External Power Supply
9VDC / 0.6A
Wireless Standards
IEEE 802.11n*, IEEE 802.11g, IEEE 802.11b
Antenna
5dBi Detachable Omni Directional (RP-SMA)
Dimensions ( W x D x H )
6.9 x 4.6 x 1.3 in. (174 x 118 x 33 mm)
WIRELESS FEATURES Frequency
2.4-2.4835GHz
Signal Rate
11n: Up to 150Mbps(dynamic) 11g: Up to 54Mbps(dynamic) 11b: Up to 11Mbps(dynamic)
EIRP
<20dBm(EIRP)
Reception Sensitivity
130M: -68dBm@10% PER 108M: -68dBm@10% PER 54M: -68dBm@10% PER 11M: -85dBm@8% PER 6M: -88dBm@10% PER 1M: -90dBm@8% PER
Wireless Functions
Enable/Disable Wireless Radio, WDS Bridge, WMM, Wireless Statistics
Wireless Security
64/128/152-bit WEP / WPA / WPA2,WPA-PSK / WPA2PSK
SOFTWARE FEATURES WAN Type
Dynamic IP/Static IP/PPPoE/ PPTP(Dual Access)/L2TP(Dual Access)/BigPond
DHCP
Server, Client, DHCP Client List, Address Reservation
Quality of Service
WMM, Bandwidth Control
Port Forwarding
Virtual Server,Port Triggering, UPnP, DMZ
Dynamic DNS
DynDns, Comexe, NO-IP
VPN Pass-Through
PPTP, L2TP, IPSec (ESP Head)
Access Control
Parental Control, Local Management Control, Host List, Access Schedule, Rule Management
51
3.5 Analisa Data CoS Sebelum Dilakukan Monitoring Power PLN Adapun data CoS yang tertera disini diambil dari Resume CoS Divisi Local Network 6 bulan terakhir pada bulan Juli – Desember 2011 untuk dibandingkan dengan 6 bulan kemudian di bulan Januari – Juni 2012, dimana pada periode tersebut telah dilakukan monitoring power PLN menggunakan wifi router di site – site yang dikelola oleh TO Jabotabek maupun oleh Divisi Local Network. Berikut adalah gambaran dari pengumpulan atau proses filing dari log – log gangguan baik laporan harian maupun laporan mingguan:
Gambar 3.5 Diagram alir administrasi log & report Penulis mengambil sample dari 5 site yang sering terjadi gangguan power PLN dan site – site yang lokasinya jauh agar terlihat perbedaan CoS setelah dan
52
sebelum dilakukan pemasangan router wifi. 5 sample site – site tersebut antara lain adalah site Kebon Singkong ( Sentul ), Sarloji, Lippo Cikarang, Cileungsi, dan BNI 46. Ada 3 parameter yang biasa dihitung CoS-nya oleh Divisi Local Network yaitu CoS power, CoS Metro Ethernet, dan CoS TDM. Dalam hal ini penulis mengambil parameter CoS power untuk dianalisa. Berikut penjelasan masing – masing CoS: a. CoS Power CoS power terdiri dari gangguan – gangguan yang disebabkan oleh masalah power seperti pemadaman bergilir oleh PLN, MCB 3 phasa shelter yang trib, serta masalah pada rectifier yang mengakibatkan perangkat UMUX tidak tercatu arus DC b. CoS Metro Ethernet CoS Metro Ethernet terdiri dari gangguan – gangguan yang disebabkan oleh masalah blackout Metro Ethernet dikarenakan hanya memiliki 1 kaki sehingga tidak ada link proteksi, masalah pada port – port Metro Ethernet, dan perangkat Metro Ethernet yang hang dikarenakan suhu panas di shelter. c. CoS TDM CoS TDM terdiri dari gangguan – gangguan yang disebabkan oleh masalah crossconnect pada UMUX, masalah crossconnect pada backbone UMUX d level SDH, dan card cobux pada UMUX restart.
53
Perangkat – perangkat telekomunikasi yang ada di shelter Indosat rata – rata hampir semua menggunakan rectifier. Rectifier yang digunakan di site – site Indosat adalah rectifier Westindo. Rata – rata rectifier Westindo mampu membackup catuan ke perangkat selama 2 jam tanpa catuan arus AC dari PLN. Dalam analisa CoS power ini, perhitungan waktu pada saat gangguan terjadi hingga gangguan diketahui oleh Operasional Local Network sampai eskalasi ke tim terkait sudah ditentukan standartnya. Sehingga gangguan yang sedang berlangsung tidak terlalu lama terjadi, dimana ini juga akan mempengaruhi KPI (Key Performance Indicator) dari Operasional Local Network. Tabel 3.3 Tabel KPI CoS Power Divisi Local Network KPI Div. Local Network Excellent
99,90%
Good
99,60 % - 99,89 %
Poor
< 99,60 %
Berikut adalah diagram problem handling atau penanganan gangguan yang sudah distandarisasi oleh Divisi Local Network:
54
Gambar 3.6 Diagram alir penanganan gangguan
55
Tabel 3.4 Sampel CoS bulan Juli – Desember 2011
SITE Kebon Singkong (Sentul) Sarloji Lippo Cikarang Cileungsi BNI 46 TOTAL MENIT AVERAGE CoS
DOWN WEEK DURATION (MINUTES) 26 240 35 255 26 276 27 247 29 250 32 125 33 109 41 150 1652
CoS / WEEK (%) 97,62 97,47 97,26 97,55 97,52 98,76 98,92 98,51 97,95
Data diatas diambil dari pengamatan 5 site yang sering mengalami gangguan power. Data diambil dari 6 bulan terakhir yaitu pada bulan Juli – Desember 2011 untuk dibandingkan dengan 6 bulan kemudian di tahun 2012 yaitu pada bulan Januari – Juni 2012. Penulis sengaja mengambil sample 6 bulan terakhir di tahun 2011 dikarenakan apabila mengambil sample CoS 1 tahun di tahun 2011 maka data belum bisa dibandingkan dengan data yang ada di tahun 2012 yang masih berjalan 9 bulan. Seperti yang sudah dibahas diatas bahwa total menit dalam seminggu ada 10080 menit. Maka rumus untuk menghitung CoS / minggu dari satu sampel site adalah sebagai berikut:
56
CoS wn =
Contoh:
CoS minggu ke 26 site Kebon Singkong Total menit available per 1 minggu = 10080 menit Down Duration
= 240 menit
= 97,62 %
CoS w26 =
Setelah didapatkan prosentase CoS tiap minggunya maka perlu dihitung juga rata – rata CoS untuk mengetahui seberapa persen CoS yang dicapai 5 sampel site tersebut. Maka rumus untuk menghitung rata – rata CoS adalah sebagai berikut:
∑
Contoh: ∑
97,95%
57
Tabel 3.5 Total CoS dari 3 parameter yang diukur RFO LN
KATEGORI POWER METRO ETHERNET TDM Total
DURASI (menit) 1652
FREKUENSI 8
1220 9095 11967
6 19
Untuk menghitung prosentase CoS power terhadap semua parameter CoS yang diukur, maka durasi atau menit dari power dijumlahkan dengan durasi parameter dari Metro Ethernet dan TDM sehingga didapatkan total durasi CoS Divisi Local Network yang akan dijadikan pembagi dalam mencari prosentase CoS resume power. Rumus yang digunakan adalah:
Contoh :
14% 10% POWER METRO ETHERNET
76%
TDM
Gambar 3.7 Presentase CoS Resume Dari data yang dianalisa diatas diketahui bahwa masalah power PLN di shelter Indosat mempunyai prosentase yang besar didalam CoS Divisi Local Network, artinya perlu dilakukan improvement dengan memperbesar CoS. Salah
58
satunya adalah dengan melakukan monitoring power PLN dengan menggunakan wifi router yang dimonitor lewat Nagios, sehingga ketika power PLN di shelter dalam keadaan down, notifikasi awal langsung muncul sebelum notifikasi node UMUX down muncul sehingga bisa memperkecil durasi gangguan yang terjadi dan agar tim di lapanga bisa lebih cepat bertindak sebelum gangguan muncul lebih lama.
59