Katasztrófaelhárítás Gönczy László
[email protected]
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék
Követelmények COBIT, ITIL o IT folyamat keretrendszerek o Incidens kezelés, válzotáskezelés, …
Basel II o EU pénzügyi szervezetek stabilitása o Előírások a folyamatokra, kockázatkezelésre
Sarbanes Oxley o Cél: vállalati pénzügyi mutatók átláthatóvá tétele (USA) o (sikere kérdéses…) o Mindig hatályos dokumentumok álljanak rendelkezésre Nincs explicit követelmény katasztrófa-elhárításra, de megkerülhetetlen
PSZÁF o Magyar pénzügyi szervezetek o IT felülvizsgálat is
Milyen tervek léteznek? Disaster Recovery Plan Business Continuity Plan Business Contingency Plan Nem teljesen egységes szakirodalom o Függ országtól, szakterülettől, stb.
A tervek nagy része táblázat o Beszállítók o Tevékenységek listája (checklist) …
Mi a katasztrófa? NEM csak valamilyen hirtelen bekövetkező természeti csapás… „Fennakadás a rendszer működésében, mely visszafordíthatatlan, elviselhetetlen károkat okoz” „Intézmény vagy cég érdekeinek sérelme” „Megfelelő szolgáltatás meghiúsulása”
Terminológia (angol alapfogalmak) Charter, Plan, Recovery Procedures PPRT – People, Process, Resources, Technology Classification: Type, Scope, Duration, Impact Declaration: Legal and Financial Implications Likelihood, Frequency, MTBF RTO: Recovery Time Objective Hot, Warm, and Cold Recovery On-Site versus Off-Site, (and Escrow) Failover versus Recovery
DRP részei Rendszer leírása o Hivatkozásokkal rendszertérképre, üzleti folyamatokra, erőforrás táblázatokra, alkalmazottak, beszállítók, partnerek elérhetőségére, … o Elvárt rendelkezésre állás meghatározásával
Katasztrófák leírása Megelőző intézkedések Katasztrófa idején elvégzendő tevékenységek Helyreállítás Javítási javaslatok Karbantartásra, tesztelésre vonatkozó előírások
Egy lehetséges metodika Üzleti folyamatokból indulunk ki Meghatározzuk a szükséges informatikai szolgáltatásokat Meghatározzuk az ezekhez szükséges informatikai erőforrásokat o Eddig „top-down”
Felírjuk az esetleges katasztrófákat Meghatározzuk az erőforrásokra és ezen keresztül a szolgáltatásokra gyakorolt hatást Megnézzük, mi minősül kritikus eseménynek o Valóban katasztrófa o Idáig „bottom-up”
A folyamatok meghatározása 1. Milyen üzleti folyamatok vannak a cégnél? o Pl. számlázás, online rendelésfelvétel, könyvelés, ügyfelek regisztrációja, adóbevallás elkészítése, új szerződések elkészítése, …
2. Mi a folyamatok kiesésének következménye? o Adott szempontból • Felhasználók, ügyfelek, pénzügyi, jogi o Adott időtartamokra (1 nap - 1 hét - 1 hónap) o Adott súlyossággal (pl. skála 1-5) o „Worst case” elv (pl. adóbevallás esetén)
3. Melyek lesznek a kritikus folyamatok? o Hatás súlyossága meghalad egy értéket
Üzleti elemzés o MKB: 270 üzleti folyamat
Az informatikai szolgáltatások meghatározása Milyen technológiai folyamatok vannak? o Levélküldés, fájlok elérése, archívum, szkennelt dokumentumok elérése, faxküldés, belső kommunikációs rendszer, vállalati portál, könyvelő rendszer, felhasználónyilvántartás, …
A komponensek rövid leírása o Mi a célja a működésnek? • Pl. „a korábbi szerződések gyors elérése”
IT határozza meg
Üzleti szolgáltatások – IT kapcsolat A kritikus üzleti folyamatok milyen informatikai erőforrásokat használnak? o Ezzel szűkítjük a kört, de a cél nem az abszolút biztonság (ami nem érhető el), hanem az előírt biztonság
Üzlet és IT részleg közösen Egy üzleti folyamat több informatikai szolgáltatást is használhat → Ezek lesznek a kritikus IT szolgáltatások Maximum engedélyezett kiesés o Az üzleti folyamatok által tolerálható minimum o Pl. Számlázás használja (1 hét kiesés tolerálható) o Ügyfélregisztráció használja (1 hónap tolerálható)
Példa: üzlet – IT kapcsolat Folyamat\ IT szolgáltatás
Email
Webportál
Fax
Helpdesk
X
X
X
Bérszámfejtés
X
Számlázás
X
Számlázási rendszer
X X
IT erőforrások meghatározása Szolgáltatásokból kiindulva o Hardver • Pl. XXX szerver o Szoftver • Windows 2003 SR2 szerver • Képfeldogozó alkalmazás o Egyéb • Pl. Kábelek
„Melléktermék”: elavult, felesleges erőforrások o Rendszer térképpel összevetve o „Mire használjuk ezt a 10 éves Sun Solaris szervert?”
Humán és egyéb erőforrások Szerepkörök megnevezése o Szükséges vizsgákkal • Pl. „CISCO Certified” hálózati mérnök
Aktuális alkalmazottak o o o o
Elérhetőséggel Munkaidő adataival Ld. Szerepkör alapú rendszermenedzsment Pl. IBM Tivoli Identity Manager
Elérhető külső support o Pl. XXX cég biztosít CISCO mérnököt
Tartalék erőforrások Hardver erőforrások o Pl. switch, szalagos egység, szervergép
(Szerver) szoftver erőforrások o Pl. tartalék Windows 2003 szerver feltelepítve
Alkalmazások hideg tartalékai o Pl. képfeldolgozó alkalmazás a Windows2003 szerveren
Különbségek: o Hely: fizikailag elkülönítve (pl. szerverszoba) o Lehetséges, hogy nem lesz elég (pl. Windows 2003 szerver), kiderül az analízis során
Rendszertérkép felírása A rendszer komponensei függőségekkel Egy-egy komponens egy IT szolgáltatás Szerverek megnevezve
Példa
Interfészek felírása Az egyes komponensek hogyan kapcsolódnak egymáshoz Pl. tárolt eljárások, adatbázis táblák, konverter programok, batch programok, reportok, Webszolgáltatások Mire van szükségünk, hogy a külön-külön helyreállított komponensek együttesen is működjenek
IT erőforrásigény A kritikus üzleti folyamatokat kiszolgáló IT alkalmazások igényei Az előbb leírt erőforrásokra
Példa (erőforrások leírása) IT szolgáltatás\ erőforrás
Switch
Router
Windows szerver
Exchange szerver
Email
X
X
X
X
Számlázási rendszer
X
X
Hibafa elemzés Komponensek hibája o Egyszerűség kedvéért egy SRU kiesése
„VAGY” kapuk „ÉS” kapuk
Példa
Katasztrófák felírása Eddig: rendszer leírása Innentől: környezetet is figyelembe vesszük Fajták szerint Természeti katasztrófák o Tűz, villám, stb.
Műszaki katasztrófák o Áramkorlátozás, vírusok, épület klímája kikapcsol, stb.
Humán katasztrófák o Szándékos rongálás, sztrájk, stb.
Katasztrófák hatása az erőforrásokra Adott katasztrófa milyen erőforrásokra hat „Worst case” elv o Minden leég az adott épületrészben
Azonos hatású katasztrófákat a továbbiakban együttesen kezeljük o Pl. épület leégése = földrengés (hatás)
Helyreállítás lépései Azonnali reakciók Környezeti helyreállítás Funkcionális helyreállítás Áttelepülés Normalizáció
Riasztási lánc definiálása
Helyreállításhoz szükséges lépések Példa: Exchange szerver helyreállítása Előfeltétel: működőképes Windows szerver o Pl. tartalék a másik telephelyen
Előfeltétel2: felhasználói adatok elérhetőek o Pl. tartalék Domain Controller
Tartalék Exchange szerver beüzemelése Autentikáció a tartalék Domain Controllerrel Felhasználói accountok létrehozása Adatok visszatöltése
Az előbbi lépések kiegészítése Végrehajtási idő o Pl. várhatóan legalább 2 óra
Végrehajtáshoz szükséges személyzet o Pl. 1 operátor, 1 MS### vizsgával rendelkező mérnök
Egyéb szükséges adatok o Pl. szalagos mentés
Helyreállítás korlátai o Pl. utolsó X nap levelei elveszhetnek
Megfelelünk-e a követelményeknek? Lehetséges-e o o o o
az adott rendszerkonfigurációban az összes katasztrófa esetén az összes (kritikus) erőforrás helyreállítása a maximálisan tolerált kiesési idő alatt?
Ha nem o Mit kell módosítani a rendszeren? • Konfiguráción? • Alkalmazásokon? o Mennyi idő/pénz kell ehhez? • Milyen egyéb (szervezeti) változások kellenek?
Ha igen:
?
DRP-vel kapcsolatos teendők Betanítás o Mit kell tudnia a „normál” személyzetnek? o Humán tartalékok felkészítése
Tesztelés o Végrehajthatóak-e a forgatókönyvek?
Karbantartás o Rendszeres időközönként • Pl. évente be kell újra adni o Adott események/változások hatására o A normál „változás menedzsment” része
Példa DRP (más metodika) Section 1 Introduction Section 2 Document Control Section 3 Recovery Phase 1 Vigilance, Identification, Categorization and Declaration Section 3 Recovery Phase 2 Initial Recovery – Partial Capacity Section 3 Recovery Phase 3 Full Recovery – Full or Required Capacity Section 3 Recovery Phase 4 Stand Down – Return to Normal Operations, Deactivation of Recovery Section 3 Recovery Phase 5 After Action Review and Plan Revision Section 4 References and Resources Section 5 Directory of Appendices Section 5-1 Appendix 1 Staff Contact List – and Kris-Cross Calling Tree Section 5-2 Appendix 2 Vendor Contacts Section 5-3 Appendix 3 Communication Plan Section 5-4 Appendix 4 Platform Specifications and Vendor Re-Order Forms Section 5-5a Appendix 5a Platform Description – Install and Configuration Section 5-5b Appendix 5b 2K3 Server – Install and Configuration Section 5-5c Appendix 5c DB Server – Install and Configuration Section 5-5d Appendix 5d Web Server – Install and Configuration Section 5-5e Appendix 5e Rpt Server – Install and Configuration Section 5-5f Appendix 5f Application – Install and Configuration Section 5-6 Appendix 6 Back Up and Restore Schema Section 5-7 Appendix 7 Network Schema
BCP feladata Üzletmenet folytonosságának garantálása Amivel több, mint DRP: üzleti szinten kínál alternatívát Pl. ne vigyük fel a rendeléseket a rendszerbe, gyűjtsük papíron o Előny: • Kifele kevesebb kiesési idő • Csökkentett módú működés biztosítható o Hátrány: • Szinkronizáció szükséges a visszaállításkor • Erőforrásigény
Milyen károkat próbál csökkenteni? Üzleti folyamat hibái Ellenőrizetlen folyamatok Ügyfélszolgálat leállása Cég jó hírnevének csorbulása Bevételkiesés Nem csak informatikai szempontok…
Informatikai támogatás Kapcsolat rendszermenedzsment eszközökkel o o o o o
Asset management: eszközök kezelése IT systems management (monitoring): rendszerállapot Business activity monitoring Configuration database: konfiguráció leírás Provisioning: feladatok és erőforrások összerendelése
Források Katasztrófa-elhárítás munkafolyamatokban. BME tanulmány. The Disaster Recovery Handbook: A Step-by-Step Plan to Ensure Business Continuity and Protect Vital Operations, Facilities, and Assets (Hardcover) by Michael Wallace, Lawrence Webber. ISBN: 0814472400 http://biztostu.hu/ Business Continuity and Disaster Recovery. Pres. Of Mike Wade, Southern Polytechnic State University Az informatikai biztonság irányításának követelményrendszere. Információs Társadalom Koordinációs Tárcaközi Bizottság ajánlása, 2004.