BAB IV HASIL PENGUKURAN
4.1 Deskripsi Masalah Pada tahapan awal penulis melakukan diskusi dengan pimpinan organisasidan semua perangkat divisi TI untuk melihat hal–hal apa saja yang menjadi konsentrasi dalam menjalankan operasional TI. Dari hasil diskusi dapat disimpulkan bahwa pengaruh insiden dan masalah menjadi yang utama dalam layanan IT kepada semua pengguna. Penulis menggunakan data yang ada sejak Maret 2013 hingga Mei 2013 yang meliputi penanganan insiden dan penanganan masalah untuk semua bagian, yaitu: system development, technicalsupport dan administrasi. Menurut Taylor (2007) manajemen insiden adalah semua kejadian yangbukan bagian dari operasional standar layanan dan yang menyebabkan atau dapat menyebabkan sebuah gangguan, penurunan kualitas dari layanan tersebut. Sama halnya dengan yang disampaikan Walker (2001) manajemen problem adalah fungsi bisnis yang terdiri dari orang, proses dan alat-alat terorganisir dan disewa untuk menyelesaikan masalah pelanggan/pengguna. Berdasarkan kedua definisi tersebut dan hasil pengamatan data sertakondisi lapangan maka dapat disimpulkan bahwa faktor faktor penyebab insiden dan penyebab masalahdapat dikelompokan sebagai berikut: 49
50
1. Force major: bencana alam, huru hara, gempa dan kebakaran gedung. Misalnya
terjadi
kebakaran
di
area
kantor
yang
menyebabkan
peralatankantor termasuk perangkat TI rusak. 2. Penyebab dari pihak ketiga. Misalnya jaringan terputus akibat adapekerjaan sipil dari kontraktor luar atau tertabrak oleh alat berat yangmelintas. 3. Software. Misalnya perangkat komputer terkena virus, ketidak stabilanpenggunaan software bajakan atau kelalaian user dalam penggunaan. 4. Hardware. Misalnya kerusakan perangkat karena dimakan usia, perbaikanperangkat keras yang tidak sesuai dengan aturan yang diperkenankan. 5. User/pengguna. Misalnya pemakaian hardware yang tidak sesuai denganaturan, kelalaian user dalam mengoperasikan apliaksi. 6. Staff TI. Misalnya
kesalahan
dalam
pembuatan
aplikasi,
kelalaian
dalampenanganan gangguan. Dalam menjalankan operasional divisi TI tidak terlepas dari SLA (ServiceLevel Agreement) atau kesepakatan tingkat layanan yang telah ada antara divisi TIsebagai penyedia jasa dan pengguna layanan TI sebagai pengguna jasa. Item padaSLA ditentukan oleh divisi TI dan berdasarkan rapat tinjauan manajemen yangdiadakan untuk setiap semester maka ditentukanlah target yang
51
harus dipenuhiberdasarkan kebijakan yang diambil oleh manajemen PT Telkomsel. Berikut SLA dari divisi IT Operation PT Telkomsel. Tabel 4.1: SLA Divisi IT Operation PT Telkomsel No 1
SLA Kejadian server down
2
Kejadian Emaildown
3
Kejadian internet/ 0 kasus/ bulan wireless down Perbaikan hardware lebih 0 kasus/ bulan 3 hari Ide perbaikan/ continuous Maksimum 1 ide per improvement 6 bulan Pelaksanaan backup data Setiap hari dan aplikasi Penanganan bugs dan Maksimum 3 0 kasus/ bulan gangguan aplikasi lebih kasus/ bulan dari 3 hari. (Sumber IT Operation PT Telkomsel, 2013)
4 5 6 7
Target Awal Maksimum 1 kasus/ bulan Maksimum 1 kasus/ bulan Maksimum 1 kasus/ bulan Maksimum 3 kasus/ bulan Maksimum 1 ide per 4 bulan Setiap hari
Target Sekarang 0 kasus/ bulan 0 kasus/ bulan
SLA yang dimiliki divisi TI sudah digunakan sejak 4 tahun yang lalu (targetawal) dan telah melalui beberapa kali perubahan penentuan target (target sekarang) berdasarkan rapat tinjauan manajemen. Berikut adalah penjelasan utuk masing – masing SLA di PT Telkomsel berdasarkan tabel 4.1: 1. Kejadian server down dengan target 0 kasus setiap bulannya. SLA yangdiukur adalah kejadian server down untuk setiap bulannya. Dalam hal inidivisi TI harus menjaga performa semua server untuk mencegah dan menghindari adanya server down. 2. Kejadian email down dengan target 0 kasus setiap bulannya. SLA yangdiukur adalah kejadian email down atau email server down untuk setiapbulannya. Dalam hal ini divisi TI harus menjaga performa email dan
52
email server untuk mencegah dan menghindari adanya gangguan email atauemail server down. 3. Kejadian
internet
atau
wireless
down
dengan
target
0
kasus
setiapbulannya. SLA yang diukur adalah kejadian internet atau wireless downuntuk setiap bulannya. Dalam hal ini divisi TI harus menjaga performakoneksi internet dan perangkat wireless untuk mencegah dan menghindariadanya gangguan koneksi internet atau gangguan koneksi wireless. 4. Perbaikan hardware lebih dari 3 hari dengan target 0 kasus setiapbulannya.
SLA
yang
diukur
adalah
kejadian
penanganan
perbaikanhardware yang lebih dari 3 hari kerja untuk setiap bulannya. Dalam hal inidivisi TI harus menjaga kinerja penanganan gangguan hardware untukdapat menyelesaikan setiap kasusnya dalam kurun waktu kurang dari 3hari. 5. Adanya ide perbaikan dari divisi TI dengan target 1 ide perbaikan untuksetiap 6 bulannya. SLA yang diukur adalah seberapa banyak ideperbaikan yang dihasilkan oleh divisi TI untuk setiap 6 bulannya. Dalamhal ini divisi TI harus menjaga kinerja dalam membuat ide–ide perbaikanyang secara konsisten untuk setiap bulannya. Ide perbaikan adalah sebuahperwujudan dari tindakan continous improvement dari divisi TI. 6. Pelaksanaan backup data dan aplikasi untuk setiap harinya. SLA yangdiukur adalah pelaksanaan backup untuk semua data dan aplikasi yangdilakukan setiap harinya. Dalam hal ini divisi TI harus secara
53
konsistendan teratur melakukan proses backup yang bertujuan untuk menjagaavailability data dan aplikasi terhadap resiko kehilangan data atau kejadianforce major. 7. Penanganan bugs dan gangguan aplikasi lebih dari 3 hari dengan target 0kasus
untuk
setiap
bulannya.
SLA
yang
diukur
adalah
kejadianpenanganan gangguan bugs dan gangguan aplikasi maupun database yangdilakukan lebih dari 3 hari kerja dalam kurun waktu 1 bulan. Dalam hal inidivisi TI harus menjaga kinerja dari personil yang bertanggung jawab ataspenyelesaian gangguan bugs, gangguan aplikasi dan gangguan database.Hal ini penting dilakukan untuk menjaga produktivitas dari semua bagianyang terkait dan menggunakan layanan TI. Dengan berpedoman pada SLA yang ada pada divisi IT Operation PT Telkomsel, maka akan dilakukan pengukuran tingkat kematangan dan pengukuran kinerja manajeman insiden dan manajemen masalah. Tujuan daripengukuran yang akan dilakukan adalah untuk mengetahui sejauh mana hubungan dan pengaruh tingkat kematangan manajemen insiden dan manajemen masalah terhadap kinerja dan pencapaian penanganan insinden dan masalah.
4.2 Pengukuran Tingkat Kematangan Sebelum Improvement Pengukuran tingkat kematangan pada divisi IT Operation PT Telkomsel dilakukan 2 kali menggunakan pengukuran deskriptif (studi pustaka) dan pengukuran kuantitatifdengan matrik kuisioner ITSM. Studi pustaka yang dilakukan adalah sebagai bahan acuan dalam melakukan analisa deskriptif dengan dasar masing – masing tingkat kematangan.
54
4. 2. 1. Pengukuran Deskriptif Pengukuran deskriptif ini dilakukan dengan cara melakukan pemetaan ataskriteria dari masing – masing level kepada kondisi di divisi TI. Berikut pengukuran tingkat kematangan di PT Telkomsel yangdilakukan dengan metode deskriptif (tabel 4.2). Tabel 4.2: Pengukuran Tingkat Kematangan No
Tingkat Kematangan
Kriteria
Hasil Pengukuran Deskriptif
1
Initial
Perquisite and Management Intent
2
Managed
Process Capability and Internal Integration
1. IT Operation PT Telkomsel Sudah memiliki aktifitas manajemen masalah, misalnya menentukan permasalahan, menganalisa permasalahan, penyelesaian masalah 2. IT Operation PT Telkomsel menugaskan kepada seseorang atau area fungsional untuk bertanggung jawab terhadap sebuah manajemen masalah 3. Helpdesk PT Telkomsel bertanggung jawab sebagai first-line support terhadap sebuah masalah yang ditujukan ke divisi IT 4. Potensi permasalahan sudah diidentifikasi dan dikenali terlebih dahulu dengan adanya SOP. 1. Manfaat dan tujuan dari manajemen masalah sudah disebarkan kedalam organisasi melalui training dan sosialisasi 2. IT Operation PT Telkomsel memiliki SOP dan sistem helpdeskyang mengatur registrasi permasalan danpemecahannya. 3. IT Operation PT Telkomsel berkomitmen mengurangi jumlahpermasalahan dan mengurangi waktuyang dibutuhkan untuk menyelesaikanpermasalahan tersebut. 4. Manajemen berkomitmen untuk proaktivdalam mencegah terjadinya masalahdengan selalu mendukung ide
55
3
Defined
Product and Quality Control
1.
2.
3.
4.
5. 6.
7.
8. 4
Quality Managed
Management Information and External Integration
1. 2.
3. 4.
5. 5
Optimizing Customer
Optimizing Customer
1.
perbaikandari IT. Tanggung jawab terhadap berbagaimacam aktivitas manajemen masalah di IT Operation PT Telkomsel sudah dikoordinasikan dan dilakukanpenunjukan. Terdapat SOP dan prosedur penangananmasalah untuk beberapa permasalahanyang dianggap kritis. IT Operation PT Telkomsel memiliki prosedur untuk melakukanpenyelidikan dan penyelesaian masalah User di IT Operation PT Telkomsel mempunyai panduan dalammenyampaikan permasalahan danpertolongan pertama terhadap masalah. Penyelidikan permasalahan yang komplekmasih dilakukan secara adhoc. Masalah akan terselesaikan setelah usermelakukan testing dan menyetujuipenutupan kasus IT Operation PT Telkomsel memiliki aplikasi Helpdesk untukmelakukan penelurusan penyelesaianmasalah Efektifitas dari area penyelesaian masalahbelum dimonitor dan dianalisa Semua record permasalahan tersimpan didalam aplikasi Helpdesk Manajemen masalah bertanggung jawabatas terselesaikannya sebuahpermasalahan dengan penunjukan PIC. Solusi yang diajukan tidak ditinjau dantidak harus ada persetujuan oleh pihak ketiga. Catatan permasalahan sudah dilakukanperubahan seiring dengan progresspenyelesaian masalah melalui aplikasihelpdesk Review terhadap catatan permasalahanbelum dilakukan. Belum ada standar laporan yang dihasilkan secara rutin untuk memantau kegiatanpenanganan masalah.
(sumber peneliti)
56
4. 2. 2. Pengukuran Kuantitatif Pengukuran
kuantitatif
menggunakan
Matrik
ITSM
menurut
Dugmore,Macfarlane dan Jenny (2006) dimana merupakan dasar dari ITIL, ISO dan
framework
lainnya
(Appendix
B).
Pengukuran
dilakukan
dengan
menggunakan matrik kuisioner untuk melihat kondisi divisi IT Operation PT Telkomsel dari sudut pandang menajemen insiden dan manajemen masalah Tabel 4.3: Pengukuran Tingkat Kematangan Sebelum Improvement Level 1: Pre-requisites 1. Are incident records maintained for all reported incidents?
Y
2
2. Are incidents currently assessed and classified by the Service Desk prior to referring them to a specialist?
Y
1
3. Is there an incident manager responsible for managing and escalating incidents?
Y
1
PASS
4
Y
2
5. Have management commitment, budget and resource been made available for incident management?
Y
2
6. Have Incident Management been made aw are of the business drivers and needs w hich w ill drive the priority for dealing w ith incidents?
Y
1
7. Has an education and training programme been conducted for the Service Desk and incident managers outlining their relationships and interfaces w ith each other and w ith problem, change and configuration management?
Y
1
Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 1 other answer 'Y'
PASS
6
Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 1 other answer 'Y'
Level 1.5: Management Intent 4. Is the business committed to reducing the impact of incidents by their timely resolution?
57
Level 2: Process Capability 8. Is an incident database maintained recording details for all reported incidents?
Y
4
Y
4
Y
4
Y
4
12. Does incident management provide the Service Desk or Customer/User w ith progress updates on the status of incidents?
Y
4
13. Is there a procedure for the closure of incidents?
Y
4
14. Does incident management provide the Service Desk w ith management information and recommendations for service improvement?
Y
1
15. Are incident managers empow ered to enforce agreed customer service levels w ith second line support and third party suppliers?
Y
1
16. Do incident managers co-ordinate problem management, support staff and IT services management w hen a major incident occurs?
Y
1
17. Has a study of the w orkload mix been conducted to determine the required staff levels, skill type and the associated costs of incident management?
Y
1
PASS
28
18. Does incident management match incidents against the problem and know n error database?
Y
2
19. Does incident management inform the Service Desk and problem management of w ork-arounds?
N
0
20. Are incidents w hich breach agreed service level targets identified and the incident resolution team informed of the breach?
Y
1
PASS
3
9. Are all incidents managed in conformance w ith the procedures documented in SLAs? 10. Is there a procedure for classifying incidents, w ith a detailed set of classification, prioritisation and impact codes? 11. Is there a procedure for assigning, monitoring and communicating the progress of incidents?
Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 1 other answer 'Y'
Level 2.5: Internal Integration
Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 1 other answer 'Y'
58
Level 3: Products 21. Are incident records maintained for all reported incidents (including resolution and/or w orkaround)?
N
0
22. Are requests for changes produced, if necessary, for incident resolution?
N
0
23. Are resolved and closed incident records updated and clearly communicated to the Service Desk, customers and other parties?
N
0
N
0
N
0
N
0
FAIL
0
N
0
N
0
29. Are the personnel responsible for incident management suitably trained?
N
0
30. Does the organisation set and review either targets or objectives for incident management?
N
0
31. Are there suitable tools in use to support the Incident Management function?
Y
1
FAIL
1
N
0
N
0
N
0
N
0
FAIL
0
24. Are reports regularly produced for all the teams contributing to the incident resolution process, concerning incident status? 25. Is a w orkload analysis produced to help determine staffing levels? 26. Are management review s held to highlight escalated incident details? Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 1 other answer 'Y'
Level 3.5: Quality Control 27. Are the standards and other quality criteria applicable for the registration of incidents and for call handling made clear to the incident management team? 28. Are Service Level Agreements available and understood by incident management?
Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 1 other answer 'Y'
Level 4: Management Information 32. Do you provide management w ith information concerning trend analysis in incident occurrence and resolution? 33. Do you provide management w ith information concerning escalated incidents? 34. Do you provide management w ith information concerning percentage of Incidents handled w ithin agreed response time 35. Do you provide management w ith information concerning percentage of incidents closed by Service Desk w ithout reference to other levels of support Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 2 other answers 'Y'
59
Level 4.5: External Integration 36. Do you hold regular meetings w ith the Service Desk to discuss incidents raised, progressed, escalated and closed? 37. Have the interfaces betw een the Service Desk and incident management been defined and communicated?
N
0
N
0
N
0
N
0
N
0
41. Does incident management exchange information w ith Change Management regarding the details of possible changes to resolve particular incidents / problems?
N
0
42. Does incident management exchange information w ith Service Level Management concerning breaches in service level agreements and the service and support commitments they contain?
N
0
FAIL
0
N
0
N
0
N
0
N
0
N
0
FAIL
0
38. Does incident management exchange information w ith Problem Management concerning related problems and / or know n errors?
39. Does incident management exchange information w ith Configuration Management regarding ease of use of configuration records, configuration anomalies and the potential flagging of configuration item, e.g. as 'failed' (or equivalent)? 40. Does incident management receive information from Change Management regarding impending changes to services?
Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 2 other answers 'Y'
Level 5: Customer Interface 43. Do you check w ith the customer if the activities performed by Incident Management adequately support the business needs? 44. Do you check w ith the customer that they are happy w ith the services provided? 45. Are you actively monitoring trends in customer satisfaction? 46. Are you feeding customer survey information into the service improvement agenda? 47. Are you monitoring the customers value perception of the services provided to them? Minimum score to achieve this level: 'Y' for all mandatory ('M') questions
(Sumber The Office of Government Commerce, 2007) Dari hasil pengukuran kuantitatif pada tabel 4.3 diatas dapat dilihat bahwatingkat kematangan dari divisi IT Operation PT Telkomsel berada pada level 2. Kedua pengukuran baik itu pengukuran deskriptif maupun kuantitatif sama – sama menghasilkan tingkat kematangan managed.Divisi TI mempunyai cita – cita untuk meningkatkan tingkat kematangan dari managed (level 2) ke defined (level 3) dalam ruang lingkup manajemen insiden dan manajemen masalah (gambar 4.1).
60
Tingkat Kematangan
Insiden
Masalah
Level 3
Future
Future
Level 2
Current
Current
Level 5 Level 4
Level 1
Gambar 4.1: Hasil Pengukuran Tingkat Kematangan Sebelum Improvement (sumber peneliti) Untuk dapat meningkatan tingkat kematangan dari level 2 menjadi level 3ada beberapa area proses menurut CCMIProduct Team (2002) yang harus dilaksanakan oleh divisi IT Operation PT Telkomsel (tabel 4.4). Tabel 4.4: Area Proses Perbaikan Tingkat Kematangan No
Tingkat Kematangan
Area Proses
Aktifitas
1
Level 3
Requirements Development
2
Level 3
Technical Solution
Memaksimalkan penggunaan aplikasi helpdesk guna medukung aktivitas manajemen insiden dan manajemen masalah. Mengidentifikasi dan mendokumentasikan sistem dan prosedur perihal gangguan dan penanggulangannya.
3
Level 3
Product Integration
Mengitegrasikan fungsi helpdeskdengan ketersediaan solusi, prosespemberian solusi dan sistem pelaporanuntuk analisa.
4
Level 3
Verification
Mampu melakukan verifikasi untuksetiap insiden dan permasalahan yangditerima divisi TI melalui aplikasihelpdesk.
61
5
Level 3
Validation
Mampu melakukan validasi untuksetiap insiden dan permasalahan yangditerima divisi TI melalui aplikasihelpdesk.
6
Level 3
Organizational Process Focus
7
Level 3
Organizational Process Definition
Divisi TI tetap fokus kepada prosesorganisasi secara keseluruhan dalammenjalankan kegiatan operasionalnya. Mendefinisikan semua proses di divisiTI kedalam prosedur kerja.
8
Level 3
Organizational Training
Menyelenggarakan training yangbermanfaat bagi organisasi, baikinternal maupun eksternal di divisi TI.
9
Level 3
Integrated Project Management
Semua proyek dan ide perbaikanberkelanjutan dikelola secara terintegrasi antara satu dan lainnya.
10
Level 3
11
Level 3
Mendefinisikan danmendokumentasikan semua resikosehingga dapat menunjang prosesmanajemen insiden dan manajemanmalasah. Setiap penyelesaian sebuah insidenatau Decision masalah yang kritikal akan menggunakan Analysis and Resolution sebuah metode analisa yangkomprehensif untuk pengambilan keputusan. (sumber Peneliti) Risk Management
4.3 Pengukuran Kinerja pada Manajemen Insiden dan Manajemen Masalah (Tahap I) Pengukuran dilakukan menggunakan matrik yang disusun berdasarkan matrik ITIL v3 (Taylor, 2007) dari manajemen insiden dan manajemen masalah (Appendix C). Survey dan wawancara dilakukan kepada segenap komponen divisi IT Operation PT Telkomsel dan semua unsur pendukungnya. Untuk mendapatkan informasi yang dibutuhkan digunakan matrik dengantujuan untuk melihat mengidentifikasi sejauh mana pengelolaan insiden
62
dan pengelolaan masalah dalam operasional divisi IT Operation PT Telkomsel guna mencapai SLA. Berikut adalah matrik manajemen insiden (tabel 4.5):
Tabel 4.5 Matrik Pengukuran Performa Manajemen Insiden ITIL v3
Goal
Purpose Issue Object Viewpoint
Questions Q1 Metrics
M1
Questions Q2 Metrics
M2
Meningkatkan performa penanganan insiden Mengetahui tingkat penanganan insiden Helpdesk divisi IT PT Telkomsel Helpdesk divisi IT PT Telkomsel Berapa Persentase insiden ditutup oleh helpdesk/technical support tanpa referensi ke level support Persentase insiden yang diselesaikan oleh 1st line Berapa insiden yang salah dalam penangan? Persentase insiden yang salah dalam penangganan
(sumber Peneliti)
Matrik 1 (M1). Persentase insiden yang diselesaikan oleh 1st line support 1. Deskripsi: Berapa jumlah dan persentase
insiden yang diselesaikan oleh 1st
linesupport. 2. Spesifikasi: (jumlah
insiden
terselesaiakan
oleh
1st
line
support/total
incidentMaret2013 s/d Mei 2013) x 100% 3. Justifikasi: Setiap TI staff memiliki log book menerima laporan request dari user yangtersimpan dalam aplikasi helpdesk. Selama person in charge
63
mampumenyelesaikan insiden, lalu user menerima penyelesaian yang diberikan,maka laporan insidenakan dinyatakan selesai. Nilai dibawah batasanbahaya menandakan bahwa perlu penanganan serius dan peningkatankualitas manajemen insiden. a. Nilai bahaya: dibawah 75% b. Nilai tercapai: 41,66% c. Rentang nilai: 0 – 100%
Matrik 2 (M2). Presentase insiden yang salah dalam penanganan. 1. Deskripsi: Jumlah dan persentase insiden yang salah dalam penanganan. 2. Spesifikasi: (Jumlah insiden yang salah dalam penanganan / total insiden Maret2013 s/d Mei 2013) x 100% 3. Justifikasi: Metrik ini digunakan untuk mengidentifikasi laporan atau insiden yangsalah
dalam
pendelegasian
kategori
insiden
maupun
salah
dalampenanganan. Semakin besar persentase maka semakin bahaya pula kondisipengelolaan manajemen insiden. a. Nilai bahaya: diatas30% b. Nilai tercapai: 33,33% c. Rentang nilai: 0 – 100
64
Tabel 4.6 Matrik Pengukuran Performa Manajemen masalah ITIL v3
Goal
Purpose Issue Object Viewpoint
Questions Q3 Metrics
M3
Meningkatkan performa penanganan masalah Mengetahui tingkat penanganan masalah Helpdesk divisi IT PT Telkomsel Helpdesk divisi IT PT Telkomsel Berapa jumlah dan persentase masalah yang melampaui target waktu penyelesaian? Jumlah penyelesaian masalah yang tidak sesuai target waktu (sumber Peneliti)
Matrik 3 (M3). Jumlah penyelesaian masalah yang tidak sesuai dengantarget waktu yang ditetapkan. 1. Deskripsi: Jumlah penyeleasian masalah yang tidak sesuai dengan batasan waktuyang telah disepakati dalam SLA. 2. Spesifikasi: Jumlah penyelesaian masalah yang tidak sesuai dengan target waktu SLA. 3. Justifikasi: Pengukuran menggambarkan seberapa serius masalah yang dihadapi, jikaproses penyelesaian masalah meliputi investigasi dan resolusi maka waktuyang dibutuhkan dapat digunakan sebagai sebuah standard waktupenyelesaian
untuk
masalah
tertentu.
Semakin
banyak
jumlahpenyelesaian masalah yang melebihi target maka semakin bahaya pulakondisi pengelolaan manajemen masalah. a. Nilai bahaya: diatas 50% b. Nilai tercapai: 80% c. Rentang nilai: 0 – 100%
65
Dalam penentuan nilai bahaya, nilai tercapai, dan rentang nilai saya bekerja sama dengan IT Service Level Management dalam penentuan matrik tersebut. Dari hasil pengukuran tahap I maka didapatkan hasil sebagai berikut (tabel 4.7):
Tabel 4.7 Hasil Pengukuran Kinerja Manajemen Insiden dan Manajemen Masalah Tahap I No
Metrik
Nilai terukur
Batas Nilai Bahaya
Keterangan
M1
persentase insiden yang diselesaikan oleh 1st line support
41,66%
<75%
Berbahaya
M2
persentase insiden yang salah dalam penanganan
33.33%
>30%
Berbahaya
M3
jumlah problem yang tidak sesuai target waktu
80%
>50%
Berbahaya
(sumber peneliti)
Pada tabel 4.7 diatas membahas tentang hasil pengukuran kinerja manajemen insiden dan manajemen masalah tahap I. Pada matrik M1 menjelaskan tentang persentase insiden yang diselesaikan oleh 1st line support dimana nilai terukur didapat 41,66% dimana seharusnya nilai untuk mencapai titik aman yaitu <75%, sehingga menghasilkan titik berbahaya pada M1. Untuk mencapai titik aman pada matrik M1 harus lebih dari 75%, karena jika dibawah 75% maka akan berada titik berbahaya. Lalu pada matrik M2 menjelaskan tentang persentase insiden yang salah dalam penanganan dimana nilai terukur didapat 33,33% dimana seharusnya nilai untuk mencapai titik aman yaitu >30%, sehingga didapatkan titik berbahaya pada M2.Untuk mencapai titik aman pada matrik M2 harus kurang dari 30%, karena jika diatas 30% maka akan berada titik berbahaya. Begitu pula pada matrik M3 dimana jumlah problem yang tidak sesuai target waktu dimana nilai terukur
66
didapat 80% dimana seharusnya nilai untuk mencapai titik aman yaitu >50%, sehingga menghasilkan titik berbahaya pada M3. Untuk mencapai titik aman pada matrik M3 harus kurang dari 50%, karena jika diatas 50% maka akan berada titik berbahaya. Selain pengukuran menggunakan desain matrik pada tabel 4.7 juga dilakukan pengukuran menggunakan matrik ITIL v3 tentang manajemen insiden dan manajemen masalah yang dapat dilihat pada appendix C.
4.4
Analisis Fishbone Berdasarkan hasil pengukuran kinerja dan pengamatan dilokasi kerja maka
didapatkan beberapa analisis yang dapat dilakukan terhadap proses yang terjadi pada divisi IT Operation PT Telkomsel yaitu: 1. Belum maksimalnya pemanfaatan aplikasi helpdesk sehingga tidak ada proses laporan mulai dari penerimaan laporan, eskalasi, penugasan dan reporting secara jelas. 2. Standard operating proceduree (SOP) penangganan insiden dan masalah yang ada belum efisien dan efektif. Kesalahan penugasan terjadi karena informasiinsiden
sangat
minim
atau
berbeda
dengan
kejadian
sesungguhnya, sehingga terjadi multi presepsi atas suatu kejadian. Semua staf TI seringkali menerima laporan gangguan dari pengguna atau user sehingga memakan waktu dan proses verifikasi yang cukup lama. 3. Tidak adanya sosialisasi SLA, hal ini penting untuk dilakukan agar semua staf divisi IT Operation benar-benar memahami layanan yang akan dinilai oleh manajemen dan pengguna sebagai dasar pengukuran
67
kinerja divisi TI. 4. Personil/SDM dari divisi masih minim dan beberapa diantara mereka memiliki latarbelakang pendidikan yang bukan TI. Selain itu tidak adanya training di internal TI menyebabkan pekerjaan ditangani berdasarkan kemampuan atau keahlian pribadi. 5. Lingkungan kerja sangat resisten terhadap adanya perubahan terutama yang bersifat kebijakan dari TI. Hal ini dikarenakan pada saat memulai bisnis perusahaan tidak melihat TI sebagai pendukung dasar dari proses operasional sehingga SDM yang direkrut masih memiliki kemampuan yang minim, serta semua pelaporan dibuat dalam bentuk manual. Kurangnya training, dan semua staf disibukkan dengan jadwal kerja yang padat
sehingga
pengembangan
diri
atau
pengetahuan
belum
berhasildijalankan oleh perusahaan. Secara umum berdasarkan pokok permasalahan maka hasil analisa faktor penyebab kurangnya kinerja dari divisi TI terhadap manajemen
insidendan
manajemen masalah dapat digambarkan menggunakan diagram tulang ikan untuk mengetahui akar dari permasalahan (gambar 4.2).
68
Gambar 4.2Fishbone Diagram (sumber peneliti)
Adapun kendala-kendala yang didapat dari proses sebelumnya dapat dikelompokkan menjadi empat kelompok, yaitu pada process, people, management, dan technology. Dari empat kelompok tersebut akan dianalisa permasalahanpermasalahan apa saja yang ada, sehingga menyebabkan terjadinya permasalahan pada helpdesk. Berikut adalah pembahasan dari setiap kategori yang ada: 1. Process
69
Aplikasi helpdesk yang dimiliki oleh Telkomsel kurangdimanfaatkan secara maksimal baik oleh user maupun staff TI. Laporanyang dimiliki aplikasi helpdesk masih belum dapat menampilkaninformasi untuk dilakukan analisa secara mendetail. 2. People a. Kemampuan SDM yang dimiliki oleh divisi IT Operation masih beragam dikarenakan perbedaan latar belakang pendidikan dan kurangnya training internal untuk meningkatkan kemampuan dan kinerja penanganan insiden dan masalah. b. Jumlah SDM yang dimiliki divisi IT Operation dirasa kurang untuk menangani semua insiden dan masalah yang terjadi sehingga dapat menyebabkan keterlambatan dalam penanganan. Hal ini disebabkan karena mininya tenaga kerja dan kesulitan untuk mencari tenaga kerja yang sesuai. 3. Management Standard Operation Procedure untuk penangananinsiden dan masalah tidak direview secara berkala dan masih belum tersosialisasikan untuk semua user di Telkomsel. 4. Technology Saat ini aplikasi masih belum efektif dikarenakan saat ini aplikasi masih harus dipelajari oleh para agent helpdesk untuk menangani insiden dan masalah, sehingga aplikasi yang digunakan belum secara maksimal digunakan.
70
Berikut adalah prosedur penanganan insiden dan penanganan masalahyang diilustrasikan dalam gambar 4.3.
Gambar 4.3Current Condition Prosedur Penanganan Insiden dan Masalah
(sumber divisi IT Operation) Penjelasan pada gambar 4.3 adalah sebagai berikut: 1.
Setiap ada insiden dan masalah yang tidak dapat diatasi oleh user makadilaporkan ke divisi IT Operation. User lebih banyak menggunakan fasilitas telepondaripada melakukan pengisian ke sistem helpdesk. Kesulitan
71
terjadi ketikadiluar jam kerja dimana tidak ada staff TI yang bertugas sehingga harusmenghubungi nomor telephone pribadi salah satu staff TI atau ketika staffhelpdesk tidak ada ditempat untuk menerima telephone. Hal ini rentankesalahan komunikasi atau pengertian akibat user melaporkan kejadiankepada staf TI yang mungkin bukan wewenang tugasnya. Permasalahanyang timbul kadang lupa untuk dicatat dan eskalasi sulit ditentukan. 2.
Staf
helpdesk
menerima
laporan
berupa
telephone
atau
dari
aplikasihelpdesk, untuk selanjutnya dilakukan verifikasi terhadap laporan yangdisampaikan oleh user. 3.
Staf
helpdesk
mencoba
memberikan
solusi dan pemecahan baik
secaraonline atau datang langsung ke lokasi user berada. Apabila masalahterselesaikan maka kasus ditutup dan dilakukan pencatatan baik di log book atau aplikasi helpdesk. 4.
Apabila insiden atau masalah tidak dapat diselesaikan oleh 1st layersupport yaitu staf helpdesk maka akan dipilah berdasarkan kategoriinsiden atau masalah. Kasus yang dikategorikan insiden maka diteruskankepada staf TI yang memang berkompeten dalam bidangnya, sedangkankasus yang dikategorikan masalah maka diteruskan kepada ITOperation DivisionHead.
5.
Staf
TI
yang
berkompeten
akan
memecahkan
masalah
dan
memberikansolusi kepada user baik secara online atau datang langsung ke lokasi userberada. Apabila masalah terselesaikan maka kasus ditutup dan dilakukanpencatatan baik di log book atau aplikasi helpdesk.
72
6.
IT Operation Division Head akan menangani masalah dengan berkoordinasi denganpihak – pihak yang terkait baik itu indifidu maupun lintas divisi. Analisapermasalahan
dan
tindakan
preventif
dilakukan
untuk
memecahkanmasalah dan mencegah masalah datang kembali. Apabila masalahterselesaikan maka kasus ditutup dan dilakukan pencatatan baik di logbook atau aplikasi helpdesk.
4.5
Perbaikan / Improvement Berdasarkan kondisi tingkat kematangan manajemen insiden danmanajemen
masarah
dan
kinerja
dapatdirekomendasikan
divisi
beberapa
IT langkah
Operation perbaikan
PT untuk
Telkomselmaka meningkatkan
tingkatkematangan pada divisi IT Operation PT Telkomselsebagai berikut: 1. Memaksimalkan dan menyempurnakan aplikasi helpdesk yang sudah ada. 2. Menyempurnakan prosedur penanganan insiden dan penanganan masalah. 3. Meningkatkan
tingkat
kematangan
manajemen
insiden
dan
manajemenmasalah. Rekomendasi yang diberikan bergantung kepada divisi IT Operation sendiri dimanasolusi mana yang harus diimplementasikan terlebih dahulu.
4. 5. 1. Memaksimalkan dan Menyempurnakan Aplikasi Helpdesk Divisi IT Operation PT Telkomsel sudah memiliki helpdesk untuk memudahkandalam pelaksanaan manajemen insiden dan manajemen masalah. Berikut beberapa kondisi yang dimiliki oleh aplikasi helpdesk oleh divisi IT Operation PT Telkomsel.
73
1. Aplikasi web berbasiskan web sehingga dapat diakses oleh semua staf TI,semua user dan dapat berjalan diatas berbagai platform operating system. 2. Memiliki fitur terintegrasi dengan layanan email sehingga notifikasi dapatsegera tersampaikan kepada pihak yang berwenang, baik itu atasan dariuser maupun staf TI yang bertanggung jawab. Penerapan
aplikasi
helpdesk
dapat
dimaksimalkan
berdasarkan
hasilanalisa dari diagram fishbone adalah dengan langkah – langkah sebagai berikut: 1. Menambahkan module pelaporan sehingga kepala divisi IT Operation ataumanajemen
mendapatkan
menentukanstrategi
kedepan
informasi menyangkut
yang
dibutuhkan
manajemen
untuk
insiden
dan
manajemen masalah. 2. Memberikan
pelatihan
kepada
user
dan
staf
TI
mengenai
pemanfaatanaplikasi helpdesk. User diberikan pelatihan dan himbauan untuk
lebihmemaksimalkan
penggunaan
aplikasi
helpdeskdibandingkanmenggunakan fasilitas telephone. Staf TI diberikan pelatihan mengenaipeningkatan kemampuan serta tugas dan tanggung jawab berkaitan dengan aplikasi helpdesk.
4.5.2 Penyempurnaan Prosedur Penanganan Insiden dan Masalah Berdasarkan procesedur penangan insiden dan penanganan masalah padatahapan sebelum improvement maka dapat dilakukan
74
perbaikan denganmemaksimalkan penggunaan aplikasi helpdesk seperti yang tergambar dalamgambar 4.4. Procedure Penanganan Insiden dan masalah divisi IT Operation User
Helpdesk Application
Incident or Problem
Add or modify case
IT Operation Team
Monitoring
No
Solution, case solved
Verification, category, & grouping, estimation time, possible solution,person in charge
Yes
Case close
Gambar 4.4: Prosedur Penanganan Insiden dan Penanganan Masalah (Sumber Peneliti)
4. 5. 3. Sebelas Area Perbaikan Tingkat Kematangan Berikut adalah 11 proses yang bisa dilakukan untuk meningkatkan tingkatkematangan pada divisi IT Operation PT Telkomsel dalam hal manajemen insiden dan manajemen masalah dari level 2 menuju level 3 seperti yang tertuang pada tabel 4.4. 1. Requirement development.
75
Tujuan
dari
area
proses
ini
adalah
untuk
menghasilkan
dan
menganalisispengguna, produk, dan komponen dari produk yang diinginkan (CMMIProduct team, 2002). Dalam hal ini divisi TI melakukan modifikasiaplikasi helpdesk yang sudah ada dengan tujuan untuk memaksimalkanpemanfaatan fungsi aplikasi tersebut dan meningkatkan proses manajemeninsiden dan manajemen masalah. Penyempurnaan aplikasi helpdesk yangharus dilakukan oleh divisi IT Operation PT Telkomsel adalah sebagai berikut: a. Menambahkan module pelaporan sehingga kepala divisi TI ataumanajemen
mendapatkan
informasi
yang
dibutuhkan
untukmenentukan strategi kedepan menyangkut manajemen insiden danmanajemen masalah. b. Mengiintegrasikan aplikasi heldesk kedalam aplikasi inventory stokbarang sparepart TI dan aplikasi pembelian barang. Hal inidilakukan guna meningkatkan mutu pelayanan TI dalam cakupanpemeliharaan hardware, dimana apabila ada kerusakan hardwareyang dialami oleh user dapat segera dilakukan penanganan denganmemberikan pinjaman hardware atau penggantian hardware.
2. Technical Solution. Tujuan dari area proses ini adalah untuk mendisain, membangun danmenerapkan kebutuhan penyelesaian (CMMI Product team, 2002). Pada area proses technical solution divisi IT Operation PT Telkomsel membuat dokumentasi teknis seperti:
76
a. Prosedur teknis installasi dan gangguan hardware. b. Prosedur teknis installasi dan gangguan software. c. Daftar dan solusi berupa FAQ (frequently answer question). d. Prosedur standard penanganan masing – masing server. e. Prosedur standard penanganan gangguan. f. Dokumentasi penanganan insiden atau masalah yang kritikal. Dengan adanya dokumentasi tersebut maka sangat membantu divisi IT Operation
PT
Telkomsel
dalam
melaksanakan
kegiatan
opererasionalnya,terutama dalam hal manajemen insiden dan manajemen masalah sehingga diharapkan dapat memenuhi SLA.
3. Product Integration Tujuan dari area proses ini adalah untuk merangkai produk mulai darikomponen produk, memastikan produk terintegrasi, fungsi dan produkyang dihasilkan (CMMI Product team, 2002). Area proses product integration sangat berhubungan langsung dengan areaproses requirement development. Dimana telah dijelaskan pada area prosestersebut divisi IT Operation PT Telkomsel menyempurnakan aplikasi helpdeskdengan malakukan integrasi dengan aplikasi inventory stok barang sparepart TI dan aplikasi pembelian barang. Integrasi yang dilakukan bertujuan untuk meningkatkan pelayanan mutu dan pencapaian SLA dalam hal manajemen isnsiden dan manajemen masalah ketersediaan hardware. Berikut gambaran area proses yang terintegrasi secara fungsi dan prosedur pelaksanaan (gambar 4.5).
77
Gambar 4.5: Produk Integrasi Helpdesk, Inventory dan Purchasing (Sumber Peneliti) Penjelasan dari gambar 4.5 adalah sebagai berikut: a.
User yang memiliki insiden atau masalah dengan hardwaremelakukan pelaporan melalui aplikasi helpdesk.
b.
Staf TI memutuskan ataupeminjaman
untuk
hardware
melakukan berdasarkan
penggantian analisa
hardware
yang
telah
dilakukanberdasarkan laporan user dan peninjauan langsung ke lokasi kerja.
78
c.
Peminjaman hardware dilakukan apabila user membutuhkankeberadaan hardware yang bersifat sementara. Sparepart yangdipinjamkan berasal persediaan hardware khusus untuk kegiatanmaintenance dan tidak mengambil dari stok inventory. Apabilamasalah terselesaikan maka kasus ditutup melalui aplikasihelpdesk.
d.
Penggantian hardware dilakukan apabila terjadi kerusakanhardware baik yang bisa diperbaiki atau yang sudah tidak bisadiperbaiki. Sparepart pengganti diambil dari inventory stok TIsehingga user dapat kembali melanjutkan pekerjaan tanpa adagangguan. Apabila masalah terselesaikan maka kasus ditutupmelalui aplikasi helpdesk.
e.
Permintaan
pembelian
sparepart
dilakukan
apabila
nilai
persediaansebuah hardware sudah mencapai nilai minimum stok. Hasil dariproses pembelian akan menambah nilai persedian stok.
4. Verification Tujuan
dari
area
proses
verification
adalah
untuk
memastikan
bahwaproduk kerja yang dipilih sesuai dengan kebutuhan pengguna/user (CMMI Product team, 2002). Verifikasi dalam hal penanganan insiden ataupenanganan masalah dilakukan melalui aplikasi helpdesk. Proses verifikasi dilakukan oleh divisi TI dan user dengan keterangan sebagai berikut: a. Verifikasi oleh divisi TI.
79
Verifikasi ini dilakukan pada saat divisi TI menerima adanyainsiden atau masalah melalui aplikasi helpdesk. Proses verifikasiyang dilakukan mencakup penggolongan kategori insiden ataumasalah, pemberian waktu perkiraan penyelesaian, pemberiansolusi secara tertulis melalui aplikasi helpdesk, dan penunjukanPIC yang tepat dari kasus yang akan ditangani. User dapatmengetahui dan memantau hasil verifikasi dari TI untuk kasusyang dia miliki sebelum solusi diberikan secara langsung. b. Verifikasi oleh user Verifikasi ini dilakukan pada saat user telah menerima danmendapatkan solusi dari divisi TI terhadap insiden atau masalahyang dihadapi melalui aplikasi helpdesk. Proses verifikasi yangdilakukan mencakup tanggapan user atas kinerja pemberian solusidari divisi TI dan tingkat kepuasa user terhadap solusi yangdiberikan. Divisi TI dapat mengetahui dan memantau hasilverifikasi dari user untuk kasus yang dia tangani sesudah solusitersebut diberikan secara langsung.
5. Validation Tujuan dari area proses validasi adalah untuk menunjukkan bahwa produkatau komponen produk telah terpenuhi (CMMI Product team, 2002).Penerapan validation pada divisiIT Operation PT Telkomsel meliputi monitoring proses penanganan gangguan dan pelaporan hasil penanganangangguan baik itu insiden maupun masalah, monitoring stok inventory property TI, monitoring status permintaan pembelian barang TI. Dalam aplikasi helpdesk juga terdapat proses validasi, misalnya pada saat
80
user mengisi aplikasi helpdesk atau melaporkan gangguan maka atasan dari user mendapatkan email tembusan mengenai gangguan yang dilaporkan.
6. Organizational Process Focus Tujuan
dari
area
proses
organizational
process
focus
adalah
untukmerencanakan dan melaksanakan proses perbaikan organisasi yangberdasarkan pada pemahaman menyeluruh tentang kekuatan dan kelemahan dari proses organisasi dan aset proses (CMMI Product team, 2002).
Dalam
hal
ini
kepala
divisi
TI
secara
intensif
dan
berkesinambungan melakukan proses monitoring, pengarahan dan pemberian motivasi kepada staf TI agar tetap fokus kepada pelaksanaan manajemen insiden dan manajemen masalah. Kelemahan dari divisi TI segera diatasi dengan beberapa langkah sebagai berikut: a.
Perbaikan
SOP
pencegahandan
dan
pembuatan
penanganan
insiden
dokumentasi serta
mengenai
pencegahan
dan
penangananmasalah. b.
Melakukan
training
internal
divisi
TI
untuk
meningkatkankemampuan dalam hal penanganan insiden dan penanganan masalah
7. Organizational Process Definition
81
Tujuan dari area proses organizational process definition adalah untukmembangun dan memelihara satu asset dapat digunakan sebagai assetproses
organisasi.
Dengan
adanya
asset
proses
organisasi
memungkinkankinerja proses yang konsisten diseluruh organisasi dan memberikan dasarkumulatif dan manfaat jangka panjang organisasi (CMMI
Product
team,2002).
Dalam
pelaksanaan
area
proses
organizational process definition,divisi TI secara konsisten menerapkan fungsi dan tugas dari masing-
masingsub divisi untuk memperkuat
peranan meraka dalam memberikannilai tambah bagi organisasi. Tentunya hal ini dengan adanya deskripsipekerjaan yang jelas untuk masing masing komponen, misalnya tugas daritim helpdesk, technical support dan logistic menjadi jelas dan tidaktumpang tindih.
8. Organizational Training Tujuan
dari
area
proses
organizational
training
adalah
untukmengembangkan keterampilan dan pengetahuan staf sehingga merekadapat melakukan peran mereka secara efektif dan efisien (CMMI Product team, 2002). Dalam pelaksanaan area proses organizational training, divisi TI melakukan pelatihan baik internal maupun eksternal. Training internal difokuskan untuk meningkatkan kemampuan dalam penyelesaian insiden dan penyelesaian masalah, sedangkan training eksternal bertujuan untuk meingkatkan kemampuan seiring perkembangan dunia teknologiinformasi.
82
9. Integrated Project Management Tujuan
dari
area
proses
ini
adalah
untuk
membangun
dan
mengelolaproyek dan keterlibatan stakeholder yang relevan menurut sebuah prosesyang terintegrasi dan didefinisikan sesuai dari standar proses organisasi tersebut (CMMI Product team, 2002). Dalam pelaksaan proses integratedproject management, divisi TI menghasilkan ide perbaikan yang berkelanjutan untuk setiap periode 6 bulan. Manajemen proyek yang melibatkan investasi TI akan melibatkan para stakeholder dan dilakukan mengikuti pola plan, do, check, action.
10. Risk Management Tujuan Manajemen Risiko adalah untuk mengidentifikasi potensi masalahsebelum terjadi, sehingga risiko penanganan kegiatan dapat direncanakanatau kegiatan untuk mengurangi dampak buruk pada pencapaian tujuan (CMMI Product team, 2002). Dalam pelaksanaan risk management, divisi TI membuat dokumentasi mengenai masalah yang kritikal beserta analisa pemecahan masalah dan pencegahannya. Dokumentasi manajemen resiko berasal dari semua insiden atau masalah yang pernah dihadapi serta bestpractice dari organisasi lain.
11. Decision Analysis and Resolution Tujuan
Analisis
Keputusan
dan
Resolusi
adalah
untuk
menganalisiskemungkinan keputusan menggunakan proses evaluasi formal terhadapkriteria yang ditetapkan (CMMI Product team, 2002).
83
Dengan adanyasistem pelaporan pada aplikasi helpdesk maka semua kegiatan penanganan insiden dan penanganan masalah dapat dianalisa sesuai dengan kebutuhan, misalnya analisa pengambilan keputusan terhadap sebuah gangguan dan analisa pemberian solusi terhadap insiden dan masalah.
4.6 Pengukuran
Tingkat
Kematangan
Sesudah
Improvement(Tahap II) Pengukuran tingkat kematangan tahap II dilakukan menggunakan matrikyang sama dengan pengukuran tingkat kematangan tahap I, dimana difokuskanuntuk manajemen insiden dan manajemen masalah. Tabel 4.8: Pengukuran Tingkat Kematangan Sesudah Improvement Level 1: Pre-requisites 1. Are incident records maintained for all reported incidents?
Y
2
2. Are incidents currently assessed and classified by the Service Desk prior to referring them to a specialist?
Y
1
3. Is there an incident manager responsible for managing and escalating incidents?
Y
1
PASS
4
Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 1 other answer 'Y'
84
Level 1.5: Management Intent 4. Is the business committed to reducing the impact of incidents by their timely resolution?
Y
2
5. Have management commitment, budget and resource been made available for incident management?
Y
2
6. Have Incident Management been made aw are of the business drivers and needs w hich w ill drive the priority for dealing w ith incidents?
Y
1
7. Has an education and training programme been conducted for the Service Desk and incident managers outlining their relationships and interfaces w ith each other and w ith problem, change and configuration management?
Y
1
Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 1 other answer 'Y'
PASS
6
85
Level 2: Process Capability 8. Is an incident database maintained recording details for all reported incidents?
Y
4
Y
4
Y
4
Y
4
12. Does incident management provide the Service Desk or Customer/User w ith progress updates on the status of incidents?
Y
4
13. Is there a procedure for the closure of incidents?
Y
4
14. Does incident management provide the Service Desk w ith management information and recommendations for service improvement?
Y
1
15. Are incident managers empow ered to enforce agreed customer service levels w ith second line support and third party suppliers?
Y
1
16. Do incident managers co-ordinate problem management, support staff and IT services management w hen a major incident occurs?
Y
1
17. Has a study of the w orkload mix been conducted to determine the required staff levels, skill type and the associated costs of incident management?
Y
1
PASS
28
18. Does incident management match incidents against the problem and know n error database?
Y
2
19. Does incident management inform the Service Desk and problem management of w ork-arounds?
N
0
20. Are incidents w hich breach agreed service level targets identified and the incident resolution team informed of the breach?
Y
1
PASS
3
9. Are all incidents managed in conformance w ith the procedures documented in SLAs? 10. Is there a procedure for classifying incidents, w ith a detailed set of classification, prioritisation and impact codes? 11. Is there a procedure for assigning, monitoring and communicating the progress of incidents?
Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 1 other answer 'Y'
Level 2.5: Internal Integration
Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 1 other answer 'Y'
86
Level 3: Products 21. Are incident records maintained for all reported incidents (including resolution and/or w orkaround)?
Y
3
22. Are requests for changes produced, if necessary, for incident resolution?
Y
3
23. Are resolved and closed incident records updated and clearly communicated to the Service Desk, customers and other parties?
Y
3
Y
1
Y
1
Y
1
PASS
12
Y
2
Y
2
29. Are the personnel responsible for incident management suitably trained?
Y
2
30. Does the organisation set and review either targets or objectives for incident management?
Y
1
31. Are there suitable tools in use to support the Incident Management function?
Y
1
PASS
8
N
0
N
0
N
0
N
0
FAIL
0
24. Are reports regularly produced for all the teams contributing to the incident resolution process, concerning incident status? 25. Is a w orkload analysis produced to help determine staffing levels? 26. Are management review s held to highlight escalated incident details? Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 1 other answer 'Y'
Level 3.5: Quality Control 27. Are the standards and other quality criteria applicable for the registration of incidents and for call handling made clear to the incident management team? 28. Are Service Level Agreements available and understood by incident management?
Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 1 other answer 'Y'
Level 4: Management Information 32. Do you provide management w ith information concerning trend analysis in incident occurrence and resolution? 33. Do you provide management w ith information concerning escalated incidents? 34. Do you provide management w ith information concerning percentage of Incidents handled w ithin agreed response time 35. Do you provide management w ith information concerning percentage of incidents closed by Service Desk w ithout reference to other levels of support Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 2 other answers 'Y'
87
Level 4.5: External Integration 36. Do you hold regular meetings w ith the Service Desk to discuss incidents raised, progressed, escalated and closed? 37. Have the interfaces betw een the Service Desk and incident management been defined and communicated?
N
0
N
0
N
0
N
0
N
0
41. Does incident management exchange information w ith Change Management regarding the details of possible changes to resolve particular incidents / problems?
N
0
42. Does incident management exchange information w ith Service Level Management concerning breaches in service level agreements and the service and support commitments they contain?
N
0
FAIL
0
N
0
N
0
N
0
N
0
N
0
FAIL
0
38. Does incident management exchange information w ith Problem Management concerning related problems and / or know n errors?
39. Does incident management exchange information w ith Configuration Management regarding ease of use of configuration records, configuration anomalies and the potential flagging of configuration item, e.g. as 'failed' (or equivalent)? 40. Does incident management receive information from Change Management regarding impending changes to services?
Minimum score to achieve this level: 'Y' for all mandatory ('M') questions + 2 other answers 'Y'
Level 5: Customer Interface 43. Do you check w ith the customer if the activities performed by Incident Management adequately support the business needs? 44. Do you check w ith the customer that they are happy w ith the services provided? 45. Are you actively monitoring trends in customer satisfaction? 46. Are you feeding customer survey information into the service improvement agenda? 47. Are you monitoring the customers value perception of the services provided to them? Minimum score to achieve this level: 'Y' for all mandatory ('M') questions
(Sumber The Office of Government Commerce, 2007) Dari hasil pengukuran tingkat kematangan pada tabel 4.8 dapat dilihatbahwa tingkat kematangan dari divisi IT Operation PT Telkomsel meningkat dari level2 ke level 3. Hal ini mengindikasikan bahwa sebagian besar improvement process yang diusulkan dapat diimplementasikan dan berjalan dengan baik.
88
4.7 Pengukuran Kinerja Pada Manajemen Insiden dan Masalah (Tahap II) Pengukuran kinerja pada manajemen insiden dan problem tahap 2dilakukan dengan menggunakan wawancara dan observasi kepada manajer TI ataupejabat yang pernah menjabat dan staf divisi TI yang mempunyai hubunganlangsung dengan manajemen insiden dan manajemen masalah. Matrik yangdigunakan sama seperti yang dilakukan pada tahap I yaitu matrik manajemeninsiden dan manajemen masalah. Dari hasil pengukuran tahap II atau post implementasi didapatkan kondisi sebagai berikut (tabel 4.9): Tabel 4.9: Hasil Pengukuran Kinerja Manajemen Insiden dan Manajemen Masalah Tahap II Nilai terukur
Batas Nilai Bahaya
Keterangan
85.71%
< 75%
Aman
persentase insiden yang salah dalam penanganan
14%
>30%
Aman
jumlah penyelesaian problem yang tidak sesuai target waktu
32%
> 50%
Aman
Metrik persentase insiden yang diselesaikan oleh 1st line support
(Sumber Peneliti) Pada tabel 4.9 diatas membahas tentang hasil pengukuran kinerja manajemen insiden dan manajemen masalah tahap II. Pada matrik M1 menjelaskan tentang persentase insiden yang diselesaikan oleh 1st line support dimana nilai terukur didapat 85.71% dimana seharusnya nilai untuk mencapai titik aman yaitu <75%, sehingga menghasilkan titik aman pada M1. Untuk mencapai titik aman
89
pada matrik M1 harus lebih dari 75%, karena jika dibawah 75% maka akan berada titik berbahaya. Lalu pada matrik M2 menjelaskan tentang persentase insiden yang salah dalam penanganan dimana nilai terukur didapat 14% dimana seharusnya nilai untuk mencapai titik aman yaitu >30%, sehingga didapatkan titik aman pada M2. Untuk mencapai titik aman pada matrik M2 harus kurang dari 30%, karena jika diatas 30% maka akan berada titik berbahaya. Begitu pula pada matrik M3 dimana jumlah problem yang tidak sesuai target waktu dimana nilai terukur didapat 32% dimana seharusnya nilai untuk mencapai titik aman yaitu >50%, sehingga menghasilkan titik aman pada M3. Untuk mencapai titik aman pada matrik M3 harus kurang dari 50%, karena jika diatas 50% maka akan berada titik berbahaya. Selain pengukuran manajemen insiden dan manajemen masalah tahap II,penulis tetap menggunakan matrik manajemen insiden dan problem ITIL V3 (appendix B) guna membandingkan hasil pengukuran tahap I (appendix C) dan didapatkan perbedaan sebagai berikut (tabel 4.10).
Tabel 4.10: Hasil Pengukuran Kinerja Manajemen Insiden dan Manajemen Masalah Tahap I (sebelum implementasi) dan Tahap II (sesudah implementasi) Matrik ITIL v3 No
Matrik Manajemen Insiden (Taylor, 2006)
Tahap I
Tahap II
Jumlah Persentase Jumlah
Persentase
1
Total jumlah Insiden (sebagai control), dihitung dari pembacaan log book dan aplikasi helpdesk yang ada di divisi TI.
12
14
2
Rincian Insiden dalam setiap tahapan (logged, process, closed).
N/A
N/A
3 4
Ukuran dari backlog kejadian saat itu. Jumlah dan persentase Insiden utama dari total jumlah insiden (poin 1) Rata‐rata waktu untuk menyelesaikan Insiden. Dihitung dari banyaknya waktu dalam menyelesaikan Insiden terhadap jumlah Insiden. Persentase Insiden yang ditangani berdasarkan waktu yang disepakati (sesuai yang ada di SLA, misal: berdasarkan dampak dan kode urgensi). Dihitung dari jumlah Insiden yang ditanggani sesuai waktu SLA terhadap total jumlah Insiden.
N/A 2
17%
N/A 7
50%
3 hari
1 hari
12%
33%
5
6
90
7 8
9
10
11
12 13 14 15
16
17
18 19 20 21 22 23
Jumlah Insiden yang dibuka kembali terhadap persentase total Insiden. Jumlah dan persentase Insiden yang salah penangganan. (Brooks, Metrics for IT Service Management, 2006). Dihitung dari jumlah Insiden yang salah penangganan terhadap total jumlah Insiden (poin 1). Jumlah dan persentase insiden yang salah kategori. Dihitung dari jumlah insiden yang salah dalam kategori terhadap total jumlah insiden (poin 1). Persentase Insiden ditutup oleh helpdesk/technical support tanpa referensi ke level support lainnya. Dihitung dari banyaknya Insiden yang berhasil diselesaikan oleh helpdesk terhadap total jumlah Insiden (poin 1). Jumlah dan persentase Insiden di proses per helpdesk/technical support staf. (Brooks, Metrics for IT Service Management, 2006). Dihitung dari jumlah Insiden yang diproses oleh helpdesk terhadap total jumlah Insiden (poin 1). Jumlah dan persentase Insiden berhasil di tangani tanpa datang ke lokasi (remote desktop). Jumlah insiden ditangani oleh masing‐masing insiden model.
N/A
N/A
4
33,33%
2
14%
3
25%
0
0%
80%
85%
5
41,66%
12
85,71%
N/A
N/A
N/A
N/A
Rincian Insiden berdasarkan waktu dalam sehari untuk melihat dan menemukan puncak waktu Insiden. Matrik Manajemen Masalah (Taylor,2006)
N/A
N/A
Jumlah total problem dicatat dalam periode tersebut (sebagai control mengukur). Didapat dari pembacaan log book selama periode pengukuran. Persentase problem diselesaikan dalam waktu target SLA (dan persentase yang tidak). Dihitung dari jumlah problem yang selesai sesuai target SLA terhadap jumlah total problem (poin 15). Jumlah dan persentase problem yang melampaui target waktu mereka menyelesaikannya.(Brooks,Metrics for IT Service Management, 2006) Dihitung dari jumlah problem yang selesai melampaui target waktu terhadap Jumlah total problem (poin 15). Backlog problem yang luar biasa dan tren (statis, mengurangi atau meningkat). Jumlah problem utama (dibuka dan ditutup dan backlog). Persentase problem utama yang direview berhasil. Jumlah KEDB Akurasi persentase KEDB (known error database) dari audit database. Persentase tinjauan problem utama yang selesai tepat waktu.
1560
1317
20%
50%
1248
80%
415
32%
1352
86,70%
1101
83,60%
155 N/A N/A N/A
9,94%
87 N/A N/A N/A
6,61%
416
27%
812
62%
(Sumber Peneliti)
Dari tabel 4.10 diatas dapat diberikan penjelasan sebagai berikut: 1. Total jumlah insiden. Adalah banyaknya inisiden selama periode case study yaitu sejak Maret2013 sampai dengan Mei 2013. Pada tahap I ada 12 insiden (3
91
serverdown, 5email down, 4internet down) dan pada tahap II ada 14insiden (4 server down, 5email down, 5internet down). 2. Rincian insiden dalam setiap tahapan. Sumber data yang Penulis dapatkan tidak menjelaskan secara rinciterhadap setiap tahapan dalam menangani insiden. Sehingga Penulis tidakdapat melakukan pengukuran. 3. Ukuran dari backlog kejadian saat itu. Penulis tidak dapat melakukan pengukuran dikarenakan backlog tidakmenjelaskan secara rinci pada setiap kejadian. 4. Total jumlah insiden utama. Insiden utama yang dimaksud adalah jumlah kejadian server down. Padatahap I ada sekali kejadian email server down. Sedangkan pada tahap IItidak ada kejadian insiden utama.Terjadi peningkatan insiden utama dari periode tahap I ke tahap II. Yangtermasuk insiden utama diisi adalah adanya kejadian yang disebabkan olehfaktor alam seperti gempa bumi, petir, kebakaran dan banjir. Selama periodetahap II, insiden utama yang terjadi yaitu: gempa bumi, banjir, dll. Penyebab insiden utama tidak dapat dihindari karena faktor alam sebagai penyebab terjadinya insiden. 5. Rata-rata waktu untuk menyelesaikan insiden. Dari pengukuran tahap I didapatkan rata – rata penyelesaian waktu insidenadalah 3 hari ( 4 hari untuk server down dan email down, serta 1 hari untukinternet down) sedangkan untuk tahap II ada 1 hari (1 hari untuk internetdown). Trend menurun terjadi karena adanya perawatan rutin hardwaredan backup server sesuai dengan SOP.
92
6. Persentase insiden yang ditangani berdasarkan waktu SLA. Pada pengukuran tahap I dan tahap II terjadi peningkatan nilai dari 12%menjadi 33%. Hal ini dikarenakan adanya perubahan SOP dalam setiappenangganan insiden sehingga respon di tim technical support menjadilebih cepat. 7. Jumlah insiden yang dibuka kembali. Berdasarkan informasi yang Penulis dapatkan tidak ada rekaman terhadapinsiden atau masalah yang dibuka kembali. Petugas Helpdesk tidakmelakukan pencatatan pada log book insiden maupun aplikasi helpdesk. 8. Persentase dan jumlah insiden yang salah dalam penangganan. Baik pada tahap I maupun tahap II semua insiden ditangani dengan benar.Dari hasil pengukuran tahap I dan tahap II terjadi perbaikan dimana nilaijumlah dan presentase mengalami penurunan dari 33% menjadi 14%.Tentunya ini adalah dampak dari sosialisasi dan training kepada setiap staftechnical support dalam menggelompokkan setiap adanya laporan gangguan,sehingga bagi staf yang akan menyelesaikan insiden tersebut telahmengetahui kondisi dan peralatan apa saja yang harus disiapkan. 9. Jumlah dan presentase insiden yang salah kategori. Terjadi penurunan pada tahap II seperti pada poin nomor 8 diatas, bahwapenangganan yang salah disebabkan karena salahnya kategori insiden atauproblem. Dengan adanya sosialisasi dan training maka jumlah tersebut dapatditekan atau dihilangkan.
93
10. Persentase insiden ditutup oleh helpdesk/technical support. Terjadi peningkatan persentasi dari 80% pada tahap I menjadi 85% padatahap II. Hal ini dikarenakan ada penambahan jumlah technical supportstaf dan tidak adanya insiden utama pada tahap II. 11. Jumlah dan persentase insiden diproses per helpdesk/technicalsupport staf. Semua insiden pada tahap I (12 insiden) dan tahap II (14 insiden) berhasildiproses oleh helpdesk/technical support staf, namun untuk kasusinsiden utama harus diteruskan ke level berikutnya.Begitu pula pada tahap II ini, peranan training dan sosialisasi sangat membantu kemampuan setiap staf dalam mengelompokkan kategori insiden sehingga staf technical support lini kedua dapat dengan cepat menyelesaikannya. 12. Jumlah dan persentase insiden ditanggani tanpa datang ke lokasi. Berdasarkan informasi yang Penulis dapatkan tidak ada rekaman terhadapinsiden atau masalah yang ditangani secara remote maupun dengan datang ke lokasi. Petugas helpdesk tidak melakukan pencatatan pada log bookinsiden maupun aplikasi helpdesk. 13. Jumlah insiden ditangani oleh masing-masing insiden model. Belum adanya insiden model yang didefinisikan oleh department TI dandivisi technical support sehingga tidak dapat diukur. 14. Rincian insiden berdasarkan waktu dalam sehari untuk melihat danmenemukan puncak waktu insiden.
94
Tidak adanya rekaman/catatan dalam spesifikasi waktu sehingga kejadianberdasarkan waktu belum bisa diukur. 15. Jumlah total problem dicatat dalam periode tersebut (sebagai kontrolmengukur). Pada tahap I total problem 1560 kejadian sementara pada tahap II terjadi penurunan problem menjadi 1317 kejadian. Penurunan ini terjadi sebagian besar karena adanya penambahan tim technical support dan tim helpdesk sehingga beberapa kejadian berhasil diselesaikan sebelum adanya gangguan/problem. 16. Persentase
problem
diselesaikan
dalam
waktu
target
SLA
(danpersentase yang tidak). Terjadi peningkatan cukup baik (tahap I 20% dan tahap II 50%). Hal ini banyak disebabkan karena penambahan penambahan jumlah staf technical support dan SOP yang lebih efektif setelah adanya implementasi. 17. Jumlah dan persentase problem yang melampaui target waktumereka menyelesaikan. Dari hasil tahap I (1248 kejadian) ke tahap II (415 kejadian) terjadi penurunan yang sangat besar karena adanya perubahan SOP yang lebih efektif (gambar 4.4) dalam menanggani gangguan. Sehingga tim technical support dapat dengan cepat menyelesaikan sesuai target waktu SLA. 18. Backlog problem yang luar biasa dan tren (statis, mengurangi ataumeningkat). Pada tahap I sebanyak 86.70% kejadian sedangkan pada tahap II sebanyak 83.60% kejadian. Penurunan tidak terlalu signifikan karena memang rata-
95
rata gangguan yang terjadi masih sama atas tren atau gangguan yang luar biasa. Belum adanya training bagi user/pengguna jasa TI menyebabkan gangguan trend dan luar biasa belum bisa dikurangi. Departemen TI melalui divisi technical support hanya melakukan informasi via telepon kepadauser/pengguna ketika kejadian saja. Sehingga jika ada kejadian yang sama di tempat yang berbeda tim technical support memberikan informasi penangganan yang bisa dilakukan oleh user. 19. Jumlah problem utama. Dari banyaknya jumlah problem pada tahap II (1317) maka ada 87 yang termasuk kategori problem utama. Terjadi penurunan yang jumlah problem utama dari tahap I (155 kejadian) menjadi tahap II (87 kejadian).Problem utama yang sering terjadi adalah laporan kerusakan hardware, dimana printer menjadi masalah utama yang harus dapat diatasi untuk melancarkan kinerja pemakai jasa TI 20. Persentase problem utama yang direview berhasil. Berdasarkan informasi yang Penulis dapatkan tidak ada rekaman mengenaiproblem utama yang direview kembali. Petugas Helpdesk tidak melakukanpencatatan pada log book masalah maupun aplikasi helpdesk, namun secara prinsip divisi TI memiliki spare hardware untuk keadaan darurat sehingga tidak akan mengganggu pencapaian SLA. 21. Jumlah KEDB. Baik
pada
tahap
I
maupun
tahap
II
tidak
dapat
dilakukan
pengukurankarena tidak adanya rekaman/catatan di divisi TI mengenai Known ErrorDatabase.
96
22. Akurasi persentase KEDB. Begitupula
pada
pengurukan
akurasi
persentase
KEDB
tidak
dapatdilakukan pengukuran akibat tidak adanya rekaman/catatan. 23. Persentase tinjauan problem utama yang selesai tepat waktu. Terjadi peningkatan dari tahap I 27% ke tahap II 62% dimana dariproblem utama tersebut sebagian besar dapat diselesaikan sesuai target waktu SLA. Tentunya ini dipengaruhi dengan adanya perbaikan SOP danpenambahan jumlah staf technical support atau staf helpdesk. Dari penjelasan diatas dapat diperhatikan bahwa dengan adanya perbaikandari sisi implementasi aplikasi helpdesk dan penyempurnaan prosedur terhadap penangganan insiden dan penanganan masalah mengakibatkan perubahan yang cukup baik seperti pada poin-poin sebagai berikut (tabel 4.10): Tabel 4.11: Hasil Pencapaian SLA Setelah Perubahan Prosedur Penangganan Insiden danPenanganan Masalah Metrik Manajemen request dan Insiden (Taylor;2006,P.102) persentase insiden yang ditangani berdasarkan SLA
Tahap I
Persentase 12%
persentase problem yang diselesaikan dalam waktu target 20% SLA (Sumber Peneliti)
Tahap II Persentase
33% 50%
Pada tabel 4.11 diatasmenjelaskan bahwa pada IT Operation sudah bisa meningkatkan persentase penanganan insiden dan masalah yang ditangani berdasarkan waktu SLA. Dimana dalam penanganan insiden dan masalah ini akan berdampak pada customer IT Operation itu sendiri. Para customer itu sendiri akan
97
optimis bahwa kedepannya divisi IT Operation akan dapat lebih baik dalam penanganan insiden dan masalah. Dilihat dari adanya kenaikan jumlah persentase insiden yang ditangani dalam SLA pada tahap I berjumlah 12% dimana ada kenaikan pada tahap II menjadi 33%. Lalu pada jumlah persentase masalah yang ditangani dalam SLA pada tahap I berjumlah 20% dimana ada kenaikan pada tahap II menjadi 50%. Pada penulisan tesis ini PT Telkomsel terus berupaya dalam peningkatan kualitas proses dalam tingkat kematangan agar proses pada IT Operation bisa lebih baik.
4.8 Diskusi Tahapan akhir dari tesis ini adalah diskusi dengan semua komponen daridivisi TI. Diskusi dilakukan dengan terbuka guna menjadikan divisi TI mampu meningkatkan pencapaian SLA dalam hal penanganan insiden dan penanganan masalah, serta mendekatkan PT Telkomsel kepada standarisasi kualitas pelayanan TI dan perbaikan berkelanjutan di divisi TI. Pembahasan diskusi meliputi beberapa hal sebagai berikut: 1. Penyempurnaan aplikasi helpdesk yang realtime dan terintegrasi sesuaidengan
usulan
bahwapenyempurnaan dandiimplementasikan.
penulis. pada Dari
Dari aplikasi
hasil
diskusi
helpdesk
penyempurnaan
disampaikan
telah
dilakukan
yang
dilakukan
didapatkanbeberapa hal penting yang mendukung ke arah peningkatan kinerjamanajemen insiden dan manajemen masalah, diantaranya: a. Penambahan module rekap atau pelaporan sehingga kepala divisiTI atau
manajemen
mendapatkan
informasi
yang
dibutuhkan
98
untukmenentukan strategi kedepan menyangkut manajemen insiden danmanajemen
masalah.
Evaluasi
dapat
dilakukan
terharap
performamasing masing individu di TI untuk mengetahui kendala danmasalah
yang
dihadapi
dantanggungjawabnya.
dalam
melaksanakan
tugas
yang
dapat
Permasalahan
diselesaikanberimbas kepada peningkatan pencapaian SLA dari divisi TI. b. Pemberian pelatihan kepada user dan staf TI mengenaipemanfaatan aplikasi helpdesk secara intensif. User diberikanpelatihan dan himbauan untuk lebih memaksimalkan penggunaanaplikasi helpdesk dibandingkan menggunakan fasilitas telephone.Staf TI diberikan pelatihan mengenai peningkatan kemampuanserta tugas dan tanggung jawab berkaitan dengan penyelesaiankasus melalui aplikasi helpdesk. Dengan adanya peningkatankualitas pelayanan dari divisi TI dan kesediaan user untukmemanfaatkan fasilitas helpdesk maka standard pelayanan dankualitas divisi IT Operation PT Telkomsel dapat meningkat danmenghasilkan perbaikan berkelanjutan. 2. Perbaikan
Standart
Operating
Procedure
(SOP)
ternyata
sangat
membantustaf technical support dan anggota divisi IT Operation yang lain dalam meningkatkanSLA. Berikut hal-hal yang dilakukan oleh IT Operationdalam menjalankanSOP, yaitu: a. Menambah jumlah staf technical support dari sebelumnya 3 orangmenjadi 5 orang staf.
99
b. Pengadaan
hardware
usermengalami
untuk
kerusakan
spare hardware
maupun
backup
sehingga
apabila
tidak
akan
menggangukinerja user dan pecapaian SLA divisi TI. c. Semua laporan insiden atau masalah harus melalui tim helpdesk(lini depan) guna pencatatan secara sistem atau manual. Dampakadanya centralisasi pelaporan ini adalah petugas helpdesk bekerjasecara lebih teratur guna pencapaian SLA. 3.
Peningkatan
sumberdaya
TI
melalui
pelatihan
dan
sharing
knowledge.Meskipun hal ini tidak direkomendasikan dari tahapan improvementnamun berdasarkan hasil analisis deskriptif (fishbone diagram) adalahsalah satu penyebab permasalahan SDM/personil dan lingkungan kerjaadalah tidak adanya training di internal organisasi.