Adatvesztések megelőzése hosszú idejű áramkimaradás esetén
Írta: Ted Ives
10. tanulmány
1. változat
Összefoglaló A számítógépes technológiák fejlődése ellenére a személyi számítógépek és a szerverek leállásainak elsődleges okai továbbra is az áramkimaradások. A számítógépes rendszerek szünetmentes tápegységekkel (Uninterruptible Power Supply, UPS) való védelme az átfogó megoldásnak csak egy részét képezi, a hosszabb idejű áramkimaradások után bekövetkező adatvesztések megelőzéséhez tápfelügyeleti szoftverre is szükség van. A továbbiakban különféle szoftverkonfigurációkat fogunk tárgyalni, valamint a gyakorlatban is bevált, a rendelkezésre
állás
javítására
alkalmazható
megoldásokat
ismertetünk.
2004 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2004-1
2
Háttér Egy kiterjedt áramkimaradás, mely bármely pillanatban beüthet, megakadályozhatja a védelem nélküli számítógépeket a megfelelő leállási eljárás végrehajtásában. A személyi számítógépekre és szerverekre írt operációs rendszereket nem készítik fel a tápellátás hirtelen megszakadására, más szóval a „durva” leállásra. A gépek ehelyett olyan beépített folyamatokkal rendelkeznek, amelyek gondoskodnak a leállásra való felkészülésről, így a memória tartalmának mentéséről, az alkalmazások és a szolgáltatások stb. leállításáról. Az utóbbi módszer szerinti leállást „szép” leállásnak is nevezhetjük. A durva leállások sokszor az adatok elvesztését vagy megsérülését okozzák, és utánuk az áramellátás visszaállását követően a normál üzemi állapot helyreállítása is több ideig tart. Egy szünetmentes tápegység alkalmas arra, hogy megvédje a rendszert a káros áramellátási problémáktól, valamint lehetővé teszi, hogy a munka a rövidebb áramkimaradások idején is folytatódjon, tehát növeli a szerver rendelkezésre állását. Hosszabb kimaradás esetén – hosszabbnak nevezünk minden olyan áramkimaradást, amelynek időtartama meghaladja az UPS áthidalási idejét –, ha a rendszer rendelkezik az UPS-sel együttműködő leállító szoftverrel, akkor az UPS-sel végzett kommunikáció alapján felügyelet nélkül is szép leállást tud végrehajtani, még mielőtt a szünetmentes tápegység akkumulátora lemerülne.
Bevezetés Hosszabb idejű áramkimaradás számos okból történhet, kezdve a helyi transzformátor villámcsapás miatti meghibásodásától egészen a regionális hálózat leállásáig. A durva leállások káros hatásaitól megfelelő lépésekkel kell védeni a számítógépes rendszereket és az általuk tárolt adatokat. Hosszú idejű leállás esetén az adatvesztés egyik fő oka az adatokkal éppen dolgozó alkalmazások vagy az operációs rendszer futásának rendellenes megszakadása. A káros hatások a dokumentumokra, a létfontosságú fájlrendszeradatszerkezetekre (például a fájlallokációs táblákra) és a dinamikus alkalmazásadatokra egyaránt kiterjedhetnek, és miattuk sok esetben a normál áramellátás helyreállása után is – például, mert az operációs rendszernek és az alkalmazásoknak újra kell építeniük a megsérült adattáblákat – hosszú ideig tart az üzembe állítás. További fontos elem a számítógépek merevlemeze. Bár a merevlemez iparág szereplői az elmúlt évtizedben kétségkívül komoly fejlesztéseket hajtottak végre a fejroncsolások megelőzésére (ilyenkor a merevlemez nem megfelelően leparkolt író/olvasó feje megrongálja a lemez felületét), a merevlemezes technológia egy másik fejlesztése éppen az adatok megsérülésének valószínűségét növeli. A teljesítmény növelésére a merevlemez-vezérlők sokszor gyorsítótár megoldásokat alkalmaznak, vagyis az adatokat átmeneti memóriában tárolják, tényleges lemezre írásukat csak később végzik el. Áramkimaradás esetén a gyorsítótárban lévő információk elvesznek, ami fájlok vagy adatok megsérüléséhez vezet.
2004 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2004-1
3
Nem kell sokáig keresgélnünk az üzleti vagy kormányzati publikációk között ahhoz, hogy elfogadjuk, a műszaki fejlesztések ellenére az áramkimaradások miatti adatvesztések az IT iparban széles körben okoznak problémákat. Ezeket emeltük ki az alábbi idézetekben: „Egyetlen pillanatnyi kihagyás is katasztrofális hatással lehet az áramellátásra érzékeny felhasználók, például az internetes szolgáltatók, az adatközpontok, a mobil távközlési hálózatok, az online kereskedők, a chipgyártók és az orvosi kutatóközpontok tevékenységére. Ezeknél a felhasználóknál az áramkimaradás megsérült adatokat, kiégett áramköröket, megrongálódott rendszerelemeket, sérült fájlokat és elvesztett ügyfeleket hagyhat maga után.” - „Electrical Power Interruption Cost Estimates for Individual Industries, Sectors, and U.S. Economy” 2002. február, Amerikai Energiaügyi Minisztérium, Energiatechnológiák Irodája „Az áramkimaradások utáni rendszerindítások sikertelenségét általában a fájlok sérülése vagy a merevlemez megrongálódása okozza - az utolsó ismert jó konfiguráció egyik hiba helyreállítására sem képes.” - „MCSE Microsoft® Windows® XP Professional Readiness Review” 70-270 vizsga, 70-270.04.03.002 szakasz, 2001. november 28. „A teljes kimaradásoknál a hálózati és számítógépes berendezések áramellátása teljes mértékben kiesik…ezek a hibák rendszer- és hálózat-összeomlásokat, a személyi számítógépek lefagyását, valamint a szerverek és a munkaállomások értékes adatainak megsérülését vagy elvesztését okozhatják.” - „Power Protection Basics”, 2002 március, Contingency Planning Management Magazine „Áramkimaradás esetén maga a rendszer és adatai egyaránt megsérülhetnek....egy szünetmentes tápegységgel ilyen esetben meg lehet védeni a rendszert. Egy UPS általában...ideiglenes áramellátást biztosít arra az időre, amíg a rendszer szép leállást hajt végre.” - Special Publication 800-34 Contingency Planning Guide for Information Technology Systems, National Institute of Standards and Technology, 2002. június
2004 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2004-1
4
Az UPS-szoftverek ajánlott konfigurációi 1. konfiguráció: Egyetlen számítógép védelme egyetlen szünetmentes tápegységgel Ennél a konfigurációnál minden számítógép saját UPS-sel rendelkezik, és a két egység soros vagy USB kábelen keresztül kommunikál egymással. A számítógépre UPS-szoftvert telepítünk, amelynek feladata a szép, felügyelet nélküli leállás biztosítása hosszabb idejű áramkimaradás esetén. Ebben az esetben az UPS-t a hozzá csatlakozó számítógép helyileg felügyeli. Ez a legegyszerűbb konfiguráció, szervereknél és munkaállomásként üzemelő számítógépeknél egyaránt széles körben elterjedt.
1. ábra – Egyetlen számítógép védelme egyetlen szünetmentes tápegységgel
Az UPS szoftvert futtató kiszolgáló
Felügyeleti konzol
UPS Tápellátás Kommunikáció soros vagy USB porton keresztül
2. konfiguráció: Kettő vagy három számítógép védelme egyetlen szünetmentes tápegységgel Ebben a konfigurációban több számítógépet csatlakoztatunk egy nagyobb méretű, általában legalább 1500 VA kapacitású UPS-hez. Az egyik számítógép közvetlenül az UPS soros portjához csatlakozik, a másik kettő pedig az UPS-be telepített, további két soros portot biztosító bővítőkártyához. Ebben az esetben mindhárom számítógép módot kap a szép leállásra, ám az UPS kezelése a hozzá közvetlenül csatlakozó számítógépen keresztül történik. Megjegyezzük, hogy az USB szabvány csak egy rendszerrel folytatott kommunikációra alkalmas, ezért USB-kapcsolatokat ilyen konfigurációban nem lehet használni. Bár ez a séma – továbbláncolással – akár 24 számítógépre is kiterjeszthető, az APC a további kábelezés szükségessége miatt ezt nem ajánlja.
2004 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2004-1
5
2. ábra – Kettő vagy három számítógép védelme egyetlen szünetmentes tápegységgel Az UPS szoftvert futtató kiszolgálók
Felület kiterjeszto Felügyeleti konzol Beépített bovítohellyel rendelkezo UPS Tápellátás Kommunikáció soros vagy USB porton keresztül
3. konfiguráció: Három vagy több számítógép védelme egyetlen szünetmentes tápegységgel Egyre népszerűbb megoldás az UPS-ek Ethernet hálózat feletti közvetlen kezelése. Ilyenkor egy valós idejű operációs rendszert futtató, hardveres figyelővel rendelkező hálózati felügyeleti kártyát telepítenek az UPSbe, amivel megszűnik a kiszolgáló alapú felügyelet szükségessége. Erre a konfigurációra és megközelítésre példa az APC InfraStruXure architektúrája. Ez esetben a számítógépekre telepített szoftvernek csupán a leállítási funkciókat kell magába foglalnia, a felügyeleti képességeket maga az UPS biztosítja.
3. ábra – Három vagy több számítógép védelme egyetlen szünetmentes tápegységgel Az UPS szoftvert futtató kiszolgálók
Felügyeleti konzol
Hálózati felügyeleti kártya
Beépített bovítohellyel rendelkezo UPS Tápellátás Hálózat
2004 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2004-1
6
Az operációs rendszerek különféle leállítási módjai A korszerű operációs rendszerek, például a Microsoft Windows® egyre fejlettebb tápfelügyeleti képességekkel rendelkeznek, és újfajta leállítási módszereket is támogatnak. Bár ezeket a megoldásokat elsősorban a hordozható gépek használóinak az igényei szerint fejlesztették, az UPS-szoftverrel a megfelelő módszert alkalmazva csökkenthetjük a hosszú ideig tartó áramkimaradások utáni helyreállítások időtartamát.
Leállítás Ez a hagyományos megoldás, melynél a számítógép operációs rendszere egy leállítási parancsot kap az UPS-szoftvertől, aminek hatására a kilépés előtt az összes folyamatot leállítja. Például Windows® alapú rendszereknél ennek az eljárásnak a végrehajtása abba az állapotba visz, amikor a számítógép képernyőjén a „Most már biztonságosan kikapcsolhatja a számítógépet” felirat jelenik meg.
Leállítás és kikapcsolás Hasonló a fenti módszerhez, ám a folyamat végén az operációs rendszer kikapcsolásra, azaz áramfelvétellel nem járó állapotba váltásra utasítja a számítógépet. A fent másodikként említett konfigurációban különösen jól alkalmazható, hiszen a számítógépek egyikének kikapcsolásával meghosszabbítható a többi számítógép futásideje. (A módszert terhelésleválasztásnak is nevezik.) A leállítás utáni kikapcsolás végrehajtásához az esetek egy részében módosítani kell a BIOS vonatkozó beállítását.
Hibernálás A hibernálási eljárás (a Microsoft újabb Windows® operációs rendszerei is támogatják) ugyancsak hasonlít a fenti módszerekre, ám további fontos lépéseket is tartalmaz. 1.
Először elmenti a számítógép munkaasztalának állapotát, ide értve az összes megnyitott fájlt is. Ehhez a RAM teljes tartalmát egyetlen nagyméretű fájlba, a merevlemezre írja.
2.
Ezután a rendszer leáll és kikapcsol.
3.
Amikor az áramellátás helyreáll, és az operációs rendszer betöltése megkezdődik, a gép visszatölti a RAM-tartalmat a merevlemezről.
4.
A munkaasztal és a megnyitott fájlok pontosan úgy jelennek meg, amilyen állapotban a hibernálás megkezdése előtt voltak.
A másik két eljárással szemben a hibernálás fontos előnye, hogy mind a folyamatban lévő munkát, mind a rendszer leállítás előtti állapotát megőrzi. Éppen ezért az APC minden ügyfelének azt javasolja, hogy UPS-szoftverében ezt a leállítási módszert válassza ki.
2004 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2004-1
7
Készenléti állapot Amikor egy számítógép készenléti állapotba vált, akkor nem kapcsol ki teljesen, hanem alacsony energiafogyasztású állapotba áll, ami bizonyos rendszerelemek (monitor, I/O chipek stb.) kikapcsolásával jár. Többek közt a DRAM frissítése fennmarad, és amikor a számítógép kikerül a készenléti állapotból, akkor általában rendkívül gyorsan visszaáll a korábbi állapotba. Ha egy számítógépen a készenléti módba váltást választjuk, akkor ellenőrizzük, hogy az UPS hosszabb idejű kimaradás esetén képes-e a számítógép felébresztésére és szép leállítására. Ellenkező esetben a számítógép egészen addig készenlétben marad, amíg az UPS teljesen le nem merül, és végül a rendszer áramellátása megszakad, vagyis durva leállás történik.
Bevált módszerek √ Vásároljunk hosszú futásidejű szünetmentes tápegységet és/vagy generátort A váltakozó áramú energiaellátás megbízhatóságáról rendelkezésre álló szabványos adatok mennyisége korlátozott. Az Amerikai Egyesült Államokban azonban végeztek két jelentős felmérést e témában, az egyiket az AT&T Bell Labs, a másikat az IBM vezette. Ezek mellett az American Power Conversion is rendelkezik bizonyos adatokkal, köszönhetően annak a körülbelül nyolcmillió UPS rendszernek, amelynek egy része képes az áramellátási zavarok naplózására. Az Amerikai Egyesült Államokban végzett felmérések adatai igazolják az APC tapasztalatait, és a következő alapvető tényekre mutatnak rá: Egy átlagos telephelyen az egy évben előforduló, az IT rendszer működésének megzavarásához elegendően hosszú áramkimaradások száma körülbelül 15. •
A kimaradások 90 százaléka öt percnél rövidebb. (Vagyis tíz százaléka öt percnél hosszabb.)
•
A kimaradások 99 százaléka egy óránál rövidebb. (Vagyis egy százaléka egy óránál hosszabb.)
•
Az éves szintű, összesített kimaradási időtartam körülbelül 100 perc.
Az adatok az Amerikai Egyesült Államokban telephelyenként változnak, és földrajzi területtől is függők. Például Florida államban egy nagyságrenddel több a kimaradás. Az épületekre egyedileg jellemző problémák akár három nagyságrenddel is befolyásolhatják a kimaradások mennyiségét. Az adatok feltételezhetően Japánra és Nyugat-Európára is érvényesek. Mivel a kimaradások 10 százaléka öt percnél hosszabb, valamint egy százaléka egy óránál is tovább tart, a hosszú futásidejű szünetmentes tápegységek és/vagy generátorok vásárlása erősen megfontolandó, amennyiben a leállások költsége magas.
2004 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2004-1
8
√ A hálózati berendezéseket is védjük szünetmentes tápegységekkel Az alkalmazások csak addig érhetők el, amíg a futtatásukra használt hálózat is rendelkezésre áll. A hubok, switch-ek és routerek áramvédelme alapvető, sokszor mégis figyelmen kívül hagyott tényező az alkalmazások rendelkezésre állásának biztosításakor. Emellett, ha a számítógépek a harmadik konfigurációban látott UPS-szoftvert futtatnak, akkor a kommunikáció biztosításához a hálózatnak az áramkimaradás ideje alatt is üzemben kell maradnia. Ha a hálózat védelem nélkül marad, akkor a számítógépek szép leállítása is lehetetlenné válhat.
√ Vegyük figyelembe a szerverek által a leálláshoz igényelt, egyedi időket Az operációs rendszer helyes leállításához szükséges idő minden rendszernél más és más. Vannak például olyan nagy számú fiókot kezelő e-mail szerverek, amelyek leállítása akár 20 percig is eltarthat. Minden esetben győződjünk meg arról, hogy az UPS-szoftver beállításai megfelelnek a számítógép egyedi igényeinek.
Összegzés Ha a védett számítógépen nem fut megfelelő leállító szoftver, akkor az UPS alkalmazása nem eredményez többet, mint az elkerülhetetlen leállás késleltetését. Bármelyik konfigurációt, gyakorlati megoldást vagy UPSszoftvert választják is, az APC minden esetben azt javasolja ügyfeleinek, hogy ne hagyják figyelmen kívül ezt a tényezőt – a szoftverek telepítése és konfigurálása minimális erőfeszítést igényel, ami hosszabb, az UPS futási idejét meghaladó áramkimaradás esetén sokszorosan térül meg.
2004 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2004-1
9
Hivatkozások Monitoring of Computer Installations for power line disturbances, Allen and Segall, IBM, IEEE PES téli konferencia, 1974. 1969-1970-ben, 38 havi megfigyeléssel és adatgyűjtéssel végzett tanulmány
The Quality of US Commercial AC Power, Goldstein and Speranza, ATT Bell Labs, Intellec konferencia, 1982 1977 és 1979 között végzett, 24 amerikai telephelyre kiterjedő tanulmány Power Quality Site Surveys: Facts, Fiction, and Fallacies, Martzloff, IEEE Transactions on Industry Applications, 24. évfolyam, 6. szám
Néhány szó a szerzőről: Ted Ives a west kingstoni APC eszközkezelési termékvonalának igazgatója. Ő felel az APC hálózati felügyeleti kártyáiért és a PowerChute szoftvertermékekért.
2004 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2004-1
10