BSM Sebagai Service Monitoring di Telco (Riswan- Februari 2010)
Pendekatan Bottom UP Secara konvensional, process monitoring infrastruktur IT dilakukan dengan menggunakan pendekatan bottom up, dimana process monitoring akan berawal dari infrastruktur IT yang hirarkinya paling bawah, dikirim dan dikorelasi di hirarki yang lebih tinggi, dan demikian seterusnya. Setiap infratruktur IT terkecil akan terhubung dengan monitoring tool sesuai dengan domainnya (application manager, system manager, dan network manager). Monitoring tool ini akan menerima semua event yang berasal dari infrastruktur IT yang dimonitornya dan kemudian meneruskan event tersebut ke Manager of Manager.
Gambar 1. Pendekatan bottom up Manager of Manager akan menerima semua event dari domain manager tool yang ada dibawahnya, dan kemudian mengkorelasikan semua event tersebut sehingga akan dihasilkan root cause event yang merupakan summary dari beberapa event yang diidentifikasikan disebabkan oleh problem yang sama. Dengan menggunakan Manager of Manager kita mendapatkan beberapa keuntungan seperti : -
Single view monitoring, dimana process monitoring semua infrastruktur IT dilakukan dengan menggunakan satu tool yang terintegarasi dengan semua tool domain manager. Hal ini juga dapat mengurangi jumlah resource yang dibutuhkan dalam process monitoring infrastruktur IT yang ada.
-
Jumlah event/alarm yang muncul dilayar monitoring akan berkurang drastis karena adanya process korelasi alarm yang akan menggabungkan beberapa alarm yang sama, berulangulang, ataupun alarm yang berasal dari infrastruktur IT yang berbeda tapi disebabkan oleh problem yang sama.
-
Root cause suatu problem akan lebih mudah untuk diketahui, karena ada process root case analysis yang akan mengkorelasikan beberapa alarm (walaupun berasal dari domain yang MobileIndonesia.net | Sharing Knowledge, Sharing Information
1
berbeda) yang diidentifikasikan disebabkan oleh problem yang sama. Dengan demikian waktu yang dibutuhkan untuk memperbaiki suatu problem akan semakin cepat. Dibalik kelebihan-kelebihannya tersebut, pendekatan bottom up seperti ini sebenarnya sangat infrastructure centric, karena fokus utama semua process monitoring yang dilakukan adalah event/alarm dan problem yang menyebabkan event/alarm tersebut muncul. Pendekatan infrastruture centric seperti ini akan mendorong kita untuk lebih terkosentrasi pada hal-hal yang bersifat teknis saja, dan hal ini sebenarnya memiliki beberapa kelemahan, seperti : -
Objek utama dalam process monitoring yang dilakukan adalah alarm problem yang terjadi pada infrastruktur IT, bukan kondisi servis yang berjalan di atas infrastruktur IT tersebut. Karena kemunculan suatu alarm/event tidak selalu berkorelasi dengan penurunan service, maka dengan pendekatan bottom up ini kita tidak dapat mengetahui gambaran kualitas servis IT kita dengan valid.
-
Tidak ada mapping antara infrastruktur IT dan service yang dibangun dengan infrastruktur IT tersebut , hal ini akan mempersulit kita mengetahui dampak langsung suatu fault/event terhadap servis yang kita deliver ke pelanggan.
-
Dalam kondisi resource yang terbatas dan dengan jumlah alarm/event yang sangat banyak, pendekatan bottom up akan menimbulkan kesulitan dalam menentukan prioritas untuk melakukan problem solving. Hal ini karena alarm problem hanya dibedakan oleh severity yang sifatnya teknis, tidak terkait dengan nilai bisnis yang berhubungan dengan problem tersebut. Sehingga sangat mungkin terjadi kita akan salah menentukan prioritas problem mana yang harus diselesaikan terlebih dahulu. Akibatnya kita tidak mampu meminimalkan kerugian perusahaan yang diakibatkan oleh problem-problem yang terjadi.
-
Selain itu, pendekatan bottom up ini hanya melibatkan event-event problem atau degradasi performansi dari infrastruktur IT, dan tidak melibatkan process yang dilakukan dalam mendeliver servis. Sehingga keterkaitan antara process yang dilakukan untuk mendeliver suatu aplikasi dan infrastruktur IT lainnya dengan servis yang menggunakan infrastruktur itu kurang dapat terlihat.
Peran IT Bagi Bisnis Makin Strategis Seiring dengan pesatnya perkembangan teknologi telekomunikasi, peranan IT dalam jaringan dan servis suatu operator telekomunikasi juga menjadi semakin penting. Saat ini, dalam sebuah perusahaan telkomunikasi, peran IT tidak lagi hanya terkait dengan hal-hal yang sifatnya support seperti desktob management, printer, ataupun jaringan LAN internal. Tapi, infrastruktur IT sudah menjadi bagian dari core network sebuah jaringan telekomunikasi dimana baik tidaknya kondisi infrastruktur IT akan langsung berpengaruh terhadap performansi jaringan telekomunikasi dan kualitas servis yang dideliver ke pelanggan. IT juga tidak hanya menyediakan aplikasi-aplikasi sifatnya untuk support kebutuhan internal perusahaan, tetapi juga menyediakan aplikasi-aplikasi yang terhubung langsung dengan jaringan telekomunikasi, diakses langsung oleh pelanggan, dan menjadi bagian dari revenue generator. Dengan makin pentingnya peranan infrastruktur IT bagi bisnis, maka process monitoring dan maintenance semua infrastruktur IT juga menjadi lebih penting. Kalau dahulu down-nya sebuah server di IT mungkin tidak akan mengakibatkan revenue lost bagi operator telekomunikasi. Tapi saat MobileIndonesia.net | Sharing Knowledge, Sharing Information
2
ini, sebuah outage di server IT akan mengakibatkan beberapa aplikasi yang merupakan revenue generator juga menjadi tidak dapat diakses oleh pelanggan dan hal ini akan mengakibatkan potensi revenue lost yang sangat besar. Kalau dahulu keterlambatan delivery sebuah aplikasi di IT tidak akan berpengaruh pada revenue perusahaan telekomunikasi, maka sekarang keterlambatan delivery sebuah aplikasi di IT sangat mungkin akan mengakibatkan delivery service ke pelanggan juga tertunda dan akhirnya akan mengakibatkan perusahaan kehilangan moment berharga yang akan mengakibatkan potensi kehilangan reveneu dalam jumlah yang tidak sedikit. Kalau dulu keterlambatan dalam menangani suatu problem di jaringan IT mungkin tidak akan berpengaruhi pada jaringan telekomunikasi, maka saat ini tidaklah demikian. Sekarang, keterlambatan penanganan gangguan pada jaringan IT akan langsung berpengaruh pada jaringan telekomunikasi operator dan efeknya akan dapat langsung dirasakan pelanggan.
BSM Sebagai Salah Satu Solusi Dengan makin strategis dan besarnya kontribusi IT dalam bisnis Telkomunikasi saat ini, maka proses monitoring dan maintenance infrastruktur IT juga harus menjadi lebih penting. Artinya, process monitoring dan maintenance infrastruktur IT harus dilakukan dengan cara-cara yang lebih baik dari sebelumnya. Sehingga kualitas layanan yang dihasilkan oleh infrastruktur IT menjadi lebih baik dan hal ini akan berdampak langsung kepada makin baiknya kualitas jaringan dan service telekomunikasi yang dirasakan pelanggan. Di sisi lain, makin tingginya keterkaitan IT dengan jaringan telekomunikasi sebuah perusahaan telekomunikasi akan menyebabkan infrastruktur IT menjadi lebih kompleks (jaringan IT menjadi lebih kompleks, dan aplikasi-aplikasi IT juga menjadi lebih kompleks). Tingkat kompleksitas yang bertambah ini akan menyebabkan meningkatnya effort yang harus dilakukan dalam process monitoring dan maintenance-nya. Agar infrastruktur yang makin kompleks ini tetap dapat dimonitor dan dimaintain dengan baik atau bahkan lebih menjadi baik, maka dibutuhkan cara-cara dan tool yang lebih baik juga dibandingkan cara dan tool yang digunakan sebelumnya. Karena alasan-alasan di atas, maka saat ini kita tidak cukup hanya menggunakan pendekatan bottom-up yang berorientasi pada infrastruktur IT secara pisik dan problem yang ada pada infrastruktur IT tersebut. Tapi, kita harus menggunakan pendekatan yang lebih berorientasi kepada servis dan kualitas service yang berjalan di atas infrastruktur IT kita. Salah satu metode yang dapat digunakan untuk tujuan di atas adalah BSM (Business Service Management).
MobileIndonesia.net | Sharing Knowledge, Sharing Information
3
Gambar 2. Diagram fungsi BSM secara umum BSM adalah salah satu metode dan juga tool yang dapat kita gunakan untuk menselaraskan fungsi infrastruktur IT yang kita miliki dengan tujuan bisnis perusahaan. BSM tidak menghilangkan infrastruktur dan cara-cara yang digunakan dalam metode bottom up sebelumnya, tetapi melengkapi dan merubah orientasi utama objek yang dimonitor. Dalam BSM, objek utama process monitoring bukan lagi pada alarm atau pun problem yang ada pada infrastruktur IT kita, tapi kualitas dan kondisi service yang berjalan di atas infrastruktur IT tersebut. Tidak peduli ada problem atau pun tidak pada infrastruktur IT kita, yang penting kualitas service yang menggunakan infrastruktur IT tersebut tetap dalam kondisi baik. Jadi, dalam BSM tidak akan ada alarm problem, melainkan alarm service. Dan bila alarm service ini dibreak down lagi maka akan dapat diketahui problem apa yang menyebabkan alarm service tersebut muncul (problem apa yang menyebabkan suatu degradasi service). Karena berorientasi pada service, severity alarm service pada BSM juga akan ditentukan berdasarkan tingkat kepentingan dan nilai suatu service pada bisnis perusahaan. Artinya, prioritas penanganan terhadap suatu degradasi service akan dilakukan berdasarkan nilai service tersebut bagi bisnis perusahaan. Service-service yang berhubungan langsung dengan core bisnis perusahaan akan mempunyai priority yang lebih tinggi dibandingkan dengan service-service yang tidak berhubungan langsung dengan core bisnis perusahaan. Prioritisasi ini bertujuan agar kita dapat me-restore degradasi kualitas servis berdasarkan kontibusi dan nilai servis tersebut terhadap bisnis perusahaan sehingga kita dapat meminimalkan kerugian perusahaan yang disebabkan oleh degradasi kualitas service yang terjadi. Dari gambar diagram fungsi BSM yang ada pada gambar 2 terlihat bahwa BSM akan memetakan semua infrastruktur IT dengan semua service IT yang menggunakan infrastruktur IT tersebut. Proses mapping ini adalah bagian terpenting dari BSM, dimana dari mapping ini akan dapat dilihat keterkaitan dan kontribusi suatu infrastruktur IT terhadap suatu service IT tertentu. Biasanya, MobileIndonesia.net | Sharing Knowledge, Sharing Information
4
process mapping ini dilakukan dengan membuat service tree. Gambar di bawah ini menunjukan sebuah contoh service tree.
Gambar 3. Contoh Service Tree pada service reporting Service tree ini akan digunakan sebagai dasar dalam melakukan proses korelasi semua event yang berasal dari semua infrastruktur IT dan akhirnya akan diketahui servis-servis mana saja yang terpengaruh oleh event-event tersebut dan sejauh mana degradasi service yang disebabkan oleh event tersebut serta berapa besar kerugian perusahaan yang disebabkan oleh event tersebut. Selain memetakan semua infrastruktur IT yang digunakan oleh service-service IT yang menggunakan infrastruktur IT tersebut, BSM juga memetakan proses yang dilakukan dalam mendeliver ataupun memaintain service IT. Sama halnya dengan mapping infrastruktur, mapping proses ini akan memetakan semua proces IT yang ada dengan service yang dihasilkan oleh IT. Sehingga apabila ada proces yang delay ataupun terhenti, kita akan dapat mengetahui dampaknya terhadap service yang kita deliver ke pelanggan dan juga berapa besar potensi kerugian yang disebabkan oleh proses yang delay ataupun terhenti tersebut. Sehingga akan memudahkan kita memonitor seluruh proces, menentukan treatment, serta langkah-langkah yang akan dilakukan untuk masing-masing proces sehingga kerugian perusahaan akibat proces yang delay ataupun terhenti tersebut dapat diminimalkan. Terakhir, walaupun konsep BSM ini cukup baik. Tapi dalam implementasinya kita harus memperhatikan banyak hal, sehingga konsep yang baik ini juga akan menghasilkan hasil yang baik. Salah satu hal yang perlu kita perhatikan sebelum memutuskan untuk mengimplementasikan BSM adalah source data, apakah source data kita sudah lengkap? Ingat, BSM hanyalah sebuah correlation engine besar yang akan memetakan fungsi infrastruktur dan proses di IT dengan service-service yang terkait dengan infrastruktur dan proces tersebut. Sedangkan data tentang kondisi infrastruktur IT dan proses yang digunakan dalam proses korelasi dan mapping tersebut ada pada tool manager nya masing-masing, sebagai source data bagi BSM. Artinya, bila source data ini tidak lengkap dan MobileIndonesia.net | Sharing Knowledge, Sharing Information
5
tidak valid, maka kita juga akan mendapatkan mapping service yang kurang lengkap. Sehingga nantinya status service yang dihasilkan dan termonitor di BSM menjadi kurang valid. Selain itu, kita juga harus mampu mengkonversi nilai dari semua servis yang ada menjadi satuan yang sama, misalnya saja rupiah per detik. Hal ini perlu dilakukan karena tidak semua service yang kita deliver merupakan service revenue generator, tapi service itu penting atau bahkan sangat penting bagi bisnis perusahaan. Dengan menggunakan satuan nilai servis yang sama, maka kita akan mendapatkan tingkat prioritas service yang benar-benar sesuai dengan lingkungan bisnis perusahaan, sehingga prioritasi penanganan problem yang nantinya dilakukan benar-benar dapat meminimalkan kerugian yang disebabkan oleh degradasi service yang terjadi. []
MobileIndonesia.net | Sharing Knowledge, Sharing Information
6