BUSINESS CONTINUITY PLAN & DISASTER RECOVERY PLAN Sumber: 2002 CISA Review Manual, Information Systems Audit & Control Association, Bab 5 DRP/BCP: tujuannya agar bisnis bisa tetap beroperasi meskipun ada gangguan dan selamatnya sistem informasi terhadap bencana. BCP : proses (otomatis maupun manual) yang dirancang untuk mengurangi ancaman terhadap fungsi-fungsi penting organisasi, sehinggan menjamin kontinuitas layanan bagi operasi yang penting. DRP : saat BC action sedang berlangsung, maka juga dimulailah langkah-langkah untuk ‘penyelamatan’ (recovery) terhadap fasilitas IT dan sistem informasi. Dapat juga dikatakan bahwa DRP merupakan bagian / subset dari BCP. Bencana / Disaster Bencana bisa 1 jam – berhari-hari, dan bisa memaksa menggunakan fasilitas IT alternatif dengan menggunakan data backup off-site. Contoh bencana alam: • gempa • banjiiiiiirrr! • topan • kebakaran. Contoh bencana lainnya: • masalah aliran listrik (mis: putus) • tidak adanya saluran telekomunikasi • tidak adanya transportasi Tapi ada pula ancaman yang tidak dianggap bencana tetapi tetap dianggap sebagai “high-risk” misalnya virus dan denial of service (DoS). Ancaman tsb harus diperhitungkan dalam pembuatan BCP. Guna mengantisipasi kasus terburuk, BCP harus mempertimbangkan strategi shortterm dan strategi long-term. Misalnya untuk short term harus ada fasilitas IT alternatif, sedangkan long-term strategi misalnya menyiapkan fasilitas IT yang permanen.
Business Impact Analysis (BIA) Dilakukan sebelum membuat BPC/DRP. Hal-hal yang harus ditanyakan antara lain:
1
1. Information resource apa yang penting bagi organisasi? Business process apa yang kalau tidak berjalan akan memberikan dampak negatif yang fatal bagi perusahaan? Setiap proses harus diperhatikan criticality-nya, dengan indikasi antara lain: • proses yang berkaitan dengan nyawa seseorang • proses yang akan menyebabkan kerugian finansial yang luar biasa • proses yang harus mematuhi aturan yang berlaku (misalnya: sektor keuangan, atau Air Traffic Control) 2. Cost of recovery vs Impact of distruption cost of disruption impact cost ($)
Break even strategy
cost of recovery time 3. Melakukan risk analysis (ingat soal SLE, ALE, ARO, dsb?). Kadang-kadang juga dilakukan pendekatan kualitatif, seperti dengan membuat peringkat. Contoh: Klasifikasi Critical Vital Sensitive Noncritical
Deskripsi Fungsi-fungsi ini tidak bisa bekerja kecuali digantikan dengan fungsi serupa. Tidak bisa digantikan dengan metode manual. Bisa dilakukan secara manual pada rentang waktu yang pendek sekali. Sebaiknya bisa direstore dalam waktu 5 hari atau kurang. Bisa dilakukan secara manual dalam waktu yang relatif lama, namun meskipun dilakukan secara manual pasti tetap sulit melakukannya dan membutuhkan staf lebih banyak Bisa diinterupsi sampai waktu yang lama, dengan sedikit beban / tidak ada beban biaya bagi perusahaan.
Selection of Recovery Strategies Rumusnya: 1. Tentukan cara/strategi untuk melakukan recovery fasilitas IT 2. Tentukan aktifitas bisnis apa saja yang harus dilakukan selama fasilitas IT sedang di-recover Asuransi: perencanaannya sendiri tidak bisa diasuransikan tetapi kalau ada kecelakaan baru bisa diasuransikan. Namun dengan adanya rencana yang memadai, maka biaya premi asuransinya biasanya lebih kecil. 2
Untuk mainframe atau fasilitas jaringan yang besar, ada beberapa kemungkinan strategi: • duplicate information processing facilities • hot sites: fully operational offsite data processing facility equipped with hardwar & software in event of a disaster. Ini penting untuk aplikasi yang critical. Namun biayanya sangat mahal. • warm sites: fasilitas alternatif yang memiliki sarana yang lebih sedikit. Misalnya ada listrik, jaringan, telepon, meja-meja, printer, tetapi tanpa komputer yang mahal. Kadang-kadang ada komputer, tetapi less processing power. • cold sites: fasilitas yang memiliki prasarana penunjang untuk operasi komputer, misalnya ruangan yang memiliki listrik dan AC. Tapi belum ada komputernya, namun siap dipasangi komputer. • perjanjian dengan perusahaan lain: Strategi telekomunikasi antara lain: • network redundancy • alternative routing • long haul network diversity • protection of local loop • voice recovery Strategi business continuity antara lain: • tidak melakukan apa-apa sampai recovery facility sudah ‘on’. • melakukan prosedur manual • memfokuskan diri pada proses yang penting saja: customer, products, dsb. • menggunakan PC untuk data capture (pencatatan saja) dengan pengolahan minimal. Pengolahan baru dilakukan setelah recovery facility sudah bekerja. Saat membangun BCP, harus melibatkan seluruh perusahaan, tidak hanya bagian IT saja. Kalau tidak ada BCP lapisan perusahaan, maka BCP dari sistem informasi harus menyertakan bagian lain yang terkait dengan BCP. Hal lain yang harus dipertimbangkan dalam membuat BCP: 1. staf-staf yang diperlukan untuk menjalankan fungsi bisnis yang penting saat terjadi bencana 2. konfigurasi gedung, meja, kursi, telepon, dsb.
Komponen BCP Yang harus disepakati dalam BCP adalah: • tujuan dari setiap tahap recovery • fasilitas alternatif • penanggung jawab • sumber daya yang akan disediakan • prioritas dan jadual aktifitas 3
Komponen BCP mencakup: 1. Siapa penanggung jawab utama 2. Backup dari supplies yang dibutuhkan 3. Pengorganisasian dan penanggung jawab setiap aktifitas 4. jaringan komputer 5. asuransi Key Decision Making Personel Berisi daftar orang yang harus menginisiasi dan melaksanakan kegiatan recovery. Biasanya berupa daftar nomor telepon. Daftar itu sepatutnya mencakup: • siapa yang harus di-contact terlebih dahulu • emergency telephone numbers, termasuk ketua tim • telepon vendor-vendor, termasuk supplier • telepon dari recovery facility • telepon penyelenggara jasa telekomunikasi • telepon dari orang yang menyimpan backup data • telepon asuransi • telepon orang-orang kontrakan (jika yang melakukan recovery bukan orang operasional), terutama jika alternate facility ada di daerah lain. Backup of Required Supplies Harus ada pula persediaan kertas-kertas (berlogo perusahaan) dan formulir-formulir perusahaan agar siap untuk dipakai. Organization & Assignment of Responsibilities Ada tim-tim yang bertugas melakukan fungsi tertentu dalam BCP, dan dipimpin seorang team leader. Tim-tim itu antara lain (selengkapnya lihat buku): 1. Emergency action team: Tugas utamanya adalah seperti “pemadam kebakaran”, dan bertugas untuk menyelamatkan jiwa 2. Damage assessment team: - harus bisa mengkalkulasi dampak bencana - bisa memperkirakan kapan lokasi bisa kembali normal 3. Emergency management team: - Berkewajiban mengkoordinasikan aktifitas tim-tim lainnya - melakukan decision making: apakah akan menjalankan DRP atau tidak - termasuk menangani masalah hukum dan public relations 4. Off site strorage team Packing dan shipping dari media dan records ke offsite facility 5. Software team: Restore operation system 4
6. Applications team: Pergi ke recovery site dan menginstall kembali aplikasi komputer 7. Emergency operations team: Shift operators & shift supervisors yang harus menjalankan recovery site (alternate facility) 8. Salvage team - Melakukan analisis lebih mendalam terhadap dampak bencana. - Menentukan apakah akan memperbaiki lokasi yang kena bencana, atau melakukan proses relokasi. - mengisi form klaim asuransi 9. Relocation team Mengembalikan dari recovery site ke lokasi awal atau ke lokasi baru yang permanen. Telecommunication Networks Beberapa strategi DRP untuk telekomunikasi 1. Redundancy: - extra capacity - extra gateway (lihat di bawah) 2. Alternative routing: Menggunakan media komunikasi alternatif, misalnya kalau dulu antar cabang pakai VSAT, maka dicoba alternatifnya pakai POTS (plain old telephone system). Jaringan fiber optic memiliki 2 jalur routing 3. Diverse routing Menggunakan duplicate cable, dan menjamin bahwa kabel-kabel tersebut memiliki jalur/path yang berbeda. Hal ini disebabkan kalau kabel-kabel itu berada pada satu jalur yang sama persis, maka akan kena jenis ancaman yang sama. 4. Long haul network diversity Sebuah recovery facility (offsite alternate facility) banyak yang memiliki banyak jalur ke luar ke beberapa penyelenggara jasa telekomunikasi. Hal ini untuk menjamin tersedianya jasa telekomunikasi kalau yang satu crash. 5. Last mile circuit protection Menggunakan banyak metoda akses komunikasi keluar, kalau ada bencana di off-site facility 6. Voice recovery: supaya bisa telpon-telponan!
5