TESIS – TE092099
Oleh : Sri Wulandari
Saat ini kemajuan dalam penerapan teknologi informasi di lingkungan Pemerintah Kota Surabaya telah menuju ambang critical mission, dimana hampir seluruh aspek kegiatan birokrasi, administrasi, serta layanan masyarakat menggunakan aplikasi /sistem informasi secara penuh. Beberapa contoh penerapan aplikasi/SIM : musyawarah rencana pembangunan (MUSRENBANG) perencanaan kegiatan (e-Project) perencanaan anggaran (e-Budgeting) pengadaan barang dan jasa (e-Procurement) pengelolaan lelang dan swakelola (e-Delivery) penyerapan anggaran (e-Controlling) pemantauan kinerja SKPD (ePerformance)
Bagaimana membuat sistem manajemen ketersediaan untuk jaringan komputer berdasarkan framework ITIL. Apakah dengan penerapan sistem manajemen tersebut dapat secara signifikan mengurangi downtime.
Data yang digunakan dalam penelitian ini adalah data insiden (history) yang terjadi pada periode Januari 2011 sampai dengan Desember 2011 di lokasi jaringan berbasis Wireless/Radio Pemerintah Kota Surabaya.
Membuat rancangan sistem manajemen ketersediaan yang mampu meningkatkan ketersediaan layanan jaringan komputer.
Meningkatkan ketersediaan layanan jaringan komputer. Mengurangi downtime pada layanan jaringan komputer. Mengurangi frekuensi kegagalan pada jaringan komputer.
Mulai
Pengumpulan Informasi
Monitoring, mengukur dan menganalisa report dan review ketersediaan layanan & komponen
Reactive Activities
ITIL v3 Merencanakan dan mendesain sistem manajemen ketersediaan
Kesimpulan
Selesai
Proactive Activities
Untuk membantu menguraikan masalah tersebut digunakan kerangka kerja tata kelola TI yaitu ITIL (Information Technology of Infrastructure Library) khususnya penerapan proses ‘Availability Management’ untuk kegiatan layanan jaringan di Pemerintah Kota Surabaya.
ITIL Availability Management bertujuan untuk menetapkan, menganalisa, merencanakan, m engukur dan meningkatkan ketersediaan layanan TI. Availability Management bertanggung jawab untuk memastikan keseluruhan TI (infrastruktur, prosesproses, kebijakan-kebijakan) sesuai dengan target yang ditetapkan.
‘Reactive Activities’, aspek reaktif dari pengelolaan ketersediaan layanan melibatkan aktifitas pemantauan, pengukuran, analisa dan manajemen keseluruhan kejadian, insiden masalah terkait hilangnya ketersediaan. Aktifitasaktifitas tersebut pada prinsipnya terkait dengan operasional roles. ‘Proactive Activities’, melibatkan aktifitas perencanaan, desain dan usaha-usaha peningkatan ketersediaan. Aktifitas tersebut pada prinsipnya terkait dengan perencanaan dan desain.
Availability dipengaruhi oleh 3 faktor, yaitu : Frekuensi dari downtime Durasi dari downtime Dampak (scope of impact) Availability dapat dihitung dengan menggunakan rumus : AV (%) = (AST – DT / AST) x 100% dengan : AST = Agreed Service Time DT = Down Time
Proses awal dalam manajemen ketersediaan adalah reactive activities meliputi : - Monitoring - Pengukuran - Menganalisa & memanajemen semua kejadian, termasuk insiden maupun permasalahan terkait ketidak-ketersediaan
De vice
Location
Switch
Total Poll Time (minute s ) 131032,66
Time UnPe rce nt available Available (minute s ) 2743,56 97,91
BW-JT LS-BW SK-BW PK-BW
BW LS SK PK
131032,73 131035,35 131034,29 131036,19
2913,60 3615,49 6245,48 6527,67
97,78 97,24 95,23 95,02
GB-DC BJ-DC
GB BJ
131035,56 131035,25
2975,55 37776,06
97,73 71,17
SL-BM LP-BM GA-RK
SL LP GA
131036,38 131026,91 131035,72
4476,49 37397,35 9237,58
96,58 71,46 92,95
PMK-BT KR-BT SW-BT AR-BT
PMK KR SW AR
131035,09 131035,03 131034,87 131036,42
4835,62 4875,59 4885,67 5556,84
96,31 96,28 96,27 95,76
SM-JT TS-SM GT-SM SP-SM
SM TS GT SP
131034,88 131035,89 131035,83 131035,56
6586,69 6437,14 6797,22 7397,09
94,97 95,09 94,81 94,35
TGL-SW DK-SW DP-SW DS-SW
TGL DK DP DS
131026,93 131036,38 131037,20 131026,01
6988,02 9147,82 15190,50 31654,53
94,67 93,02 88,41 75,84
KP-JB WY-JB KOP-DH
KP WY KOP
131035,63 131035,78 131036,35
12848,48 18890,63 13479,29
90,19 85,58 89,71
MR-JT MR BLK-MR BLK KJR-BLK KJR
131032,37 131035,46 131037,01
9525,67 39187,80 61145,96
92,73 70,09 53,34
Availability 95,00% 90,00%
90,66%
85,00% 80,00% 75,00%
76,09%
70,00% 65,00% Jan-Jun
Jul-Des
MTBF (Mean Time Between Failure) 50,00 45,00 40,00
43,24
35,00 30,00 25,00 20,00 15,00 10,00 5,00
7,94
0,00 Jan-Jun
Jul-Des
MTTR (Mean Time To Recovery/Repair) 3,00 2,50 2,00
2,41 1,93
1,50 1,00 0,50 0,00 Jan-Jun
Jul-Des
Sering terjadinya downtime pada jaringan MAN akan menimbulkan dampak dan implikasi sebagai berikut :
Timbulnya ketidaknyamanan/ketidakpuasan pengguna dalam hal ini SKPD yang melayani masyarakat secara langsung. Masyarakat pun menjadi tidak puas dan merasa dirugikan dari segi material dan non-material atas waktu yang terbuang. Kerugian finansial bagi pemerintah kota, bila terdapat layanan yang berhubungan dengan pembayaran pajak atau retribusi. Reputasi buruk atas kinerja pemerintah kota.
Berdasarkan data insiden, yang menjadi penyebab utama terjadinya downtime adalah : Catu daya listrik mati, Perangkat (swicth, router, wireless/radio) tidak bekerja sebagaimana mestinya (malfunction), disebabkan oleh: a. Ketidak-stabilan atau lonjakan tegangan listrik b. Beban traffic yang tinggi (overload) c. Induksi petir d. Hujan disertai angin kencang. Maintenance atau perubahan konfigurasi perangkat jaringan yang terkait.
Identifikasi Fungsi Bisnis Vital (VBF) Rancangan Ketersediaan Solusi khusus dengan redundansi penuh Analisa Kegagalan Perangkat Tunggal (SPof) Component Failure Impact Analysis (CFIA) Fault Tree Analysis (FTA) Pemodelan (Modelling) Analisis Risiko dan Manajemen Risiko
PRIORITAS
LAYANAN
1
KTP On-line
2
Koneksi Internet
3
Sistem Informasi
4
CCTV
5
VoIP
6
Video Conference
Redesain Topologi Jaringan Re-konfigurasi Peralatan Penggunaan VPN untuk Redudansi
Salah satu penyebab terjadinya penurunan kinerja adalah IP gateway yang terletak di luar jaringan LAN SKPD, yaitu berada pada core layer.
Hal ini menyebabkan banyaknya paket yang tidak seharusnya memasuki jaringan layer distribusi dan core, sehingga kinerja jaringan secara keseluruhan sering mengalami masalah, dan dilakukan restart peralatan.
Ada 2 komponen utama yang saat ini masih tercatat dalam kategori Single Point of Failure (SpoF), atau dalam kata lain komponen tersebut tidak ada peralatan yang membackup atau memiliki kemampuan fail-over, yaitu Switch Utama dan Fortigate (perangkat IPS/Intrusion Prevention System). Dengan menerapkan re-desain konfigurasi perangkat dan topologi, fungsi keduanya akan segera dapat digantikan bila terjadi kegagalan. Pada switch utama akan tersedia switch pendamping yang berfungsi untuk redundansi, sedangkan ketergantungan akan perangkat Fortigate akan semakin menurun dengan dipasangnya router pada masing-masing LAN.
Sistem Manajemen Ketersediaan dengan framework ITIL secara umum dapat meningkatkan ketersediaan jaringan komputer Pemerintah Kota, ini dibuktikan bahwa dari sistem manajemen yang dibuat, baru sebagian yang telah dilaksanakan oleh Dinas Kominfo, namun hasilnya telah memberikan kontribusi pada ketersediaan yang cukup signifikan. Hal tersebut ditandai dengan meningkatnya prosentase ketersediaan jaringan selama semester pertama sebesar 76,09% menjadi 90,06% di semester kedua. Mengenai naik-turunnya nilai MTTR, bisa dijelaskan bahwa sampai saat ini tidak semua komponen memiliki peralatan redudansi disamping proses pendokumentasian mengenai desain, topologi, peralatan, dan konfigurasi peralatan jaringan yang masih terus dilakukan. Sehingga ketika terjadi insiden, waktu yang dibutuhkan cukup lama. Hal ini terlihat pada analisa pengamatan selama 6 bulan pertama, waktu rata-rata perbaikan/pemulihan sebesar 2,41 jam, lebih lama dibandingkan waktu rata-rata perbaikan/pemulihan 6 bulan terakhir yaitu 1,93 jam. Sedangkan untuk lonjakan nilai MTBF (Mean Time Betwen Failure) pada akhir penelitian dipengaruhi pada implementasi koneksi redundansi (VPN) yang menjadi koneksi utama (primary) menggantikan koneksi wireless/radio yang dijadikan sebagai koneksi cadangan (secondary). Permasalahan catu daya listrik, dan kondisi cuaca memberikan andil terbesar terjadinya downtime.
1. Perlu pembenahan dokumentasi mengenai desain, topologi, peralatan dan konfigurasi peralatan yang lengkap dan sistematis, dan didukung penanganan insiden dengan service desk yang memadai untuk mempercepat penyelesaian masalah bila terjadi downtime. Lebih baik lagi apabila ditambahkan sistem informasi manajemen ketersediaan untuk memberikan kemudahan dan kecepatan dalam menganalisa insiden pada jaringan. 2. Terkait permasalahan sumber daya listrik, karena terkait lintas sektoral dan dinas perlu adanya koordinasi menyeluruh terhadap penanganan sistem kelistrikan di seluruh kantor Pemerintah Kota. 3. Pada perangkat yang masih dalam daftar SPoF, yaitu Switch Utama dan Fortigate ditinjau dari dampak yang ditimbulkan bila terjadi kegagalan, maka harus segera disiapkan peralatan pengganti/cadangannya. Khusus untuk switch utama mengingat perannya sebagai jantung jaringan komputer MAN, perlu kiranya diadakan peralatan dengan kemampuan fail over secara otomatis. Sedangkan untuk penanganan masalah malware, perlu dilakukan kajian mengenai penggunaan IPS yang didukung/dikombinasikan dengan kebijakan penggunaan antivirus atau internet security di lingkungan Pemerintah Kota.