Hatékony MTBF összehasonlítások végzése az adatközponti infrastruktúrák számára Írta Wendy Torell és Victor Avelar
112. tanulmány
Összefoglalás A meghibásodások közötti átlagosan eltelt időt (Mean Time Between Failure – MTBF) gyakran
javasolják
a
döntések
kulcsfontosságú
szempontjaként
alkalmazni,
ha adatközponti infrastrukturális rendszereket hasonlítunk össze. A gyártók gyakran félrevezető értékeket adnak meg, ami lehetetlenné teszi a felhasználók számára az érdemi összehasonlítást. Ha a számok mögötti változók és feltételezések nem ismertek vagy félreértelmezettek, a rossz döntések elkerülhetetlenek. Tanulmányunkban ismertetjük hogyan lehet a feltételezések tisztázásával az MTBF értékéket – mint a számos tényező egyikét
–
hatékonyan
használni
a
szükséges
rendszerek
meghatározásában
és kiválasztásában.
©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
2
Bevezetés Egy adatközpont esetében a meghibásodások elkerülése mindig az elsődleges szempont. Amikor néhány percnyi leállás is kedvezőtlenül befolyásolhatja egy vállalkozás piaci értékét, akkor alapkövetelmény a hálózati környezetet fenntartó fizikai infrastruktúra megbízhatósága. Hogyan bizonyosodhatunk meg arról, hogy megbízható megoldást alkalmazunk? Az MTBF a megbízhatóságok összehasonlításának legáltalánosabb eszköze. A kitűzött üzleti megbízhatóságot az MTBF pontos ismerete nélkül nemigen lehet elérni. Az MTBF legfőbb alapelveit a 78-as számú APC tanulmány ismerteti, melynek címe: „A meghibásodások között átlagosan eltelt idő: Magyarázat és Szabványok” Persze, az MTBF értékeinek nincs sok értelme, ha a meghibásodás definíciója nem egyértelmű, vagy a feltevéseknek nincs köze a valósághoz, vagy esetleg félreértelmezik azokat. Ez a tanulmány bemutatja, hogyan használandó az MTBF, emellett tárgyalja az MTBF meghatározási és kiválasztási eszközként való használatának korlátait. Gondoskodtunk egy iránymutatásként szolgáló ellenőrző listáról, mely biztosítja a különböző rendszerek közti összehasonlítás igazságosságát és használhatóságát.
Az összehasonlító MTBF-analízis valósághű megközelítése A 78-as számú tanulmány több módszert is ismertet az MTBF becslésére. Ennyiféle lehetséges módszer mellett, lehetetlennek tűnhet, hogy két olyan rendszert találjunk, amelyek azonos módszert alkalmaznak. Ám mégiscsak van egy, amely a legtöbb szervezet különféle folyamatainak esetében is közös. A helyszíni adatgyűjtés módszere valódi helyszíni meghibásodásokat használ fel, így pontosabb értéket ad a meghibásodások arányáról, mint a szimulációk. Ezek az adatok nem biztos, hogy elérhetőek alacsony számban gyártott vagy újonnan megjelent termékek esetén, de olyan termékeknél, melyeket megfelelő számban telepítették már, célszerű ezeket használni. Így tehát, ez a legésszerűbb és a valóságot leginkább tükröző kiindulási pont a különböző rendszerek összehasonlításához. Vegyük figyelembe, hogy ez a módszer – mint sok másik is – a meghibásodási arány állandóságának feltételezésén alapul, mint ahogyan azt a 78-as számú tanulmány is tárgyalja. E tanulmány bemutatja a módszer alkalmazásának lépéseit, valamint lépésenként felsorolja és megmagyarázza azokat a változókat, amelyek kihatnak a végeredményre. Ha az összehasonlítandó rendszerek között eltérés van bármely létfontosságú feltevésben vagy változóban, akkor mindenképpen fel kell mérni azoknak az MTBF becslésekre vonatkozó esetleges kihatásait. Az 1. ábra a helyszíni adatgyűjtés folyamatának időbeli alakulását szemlélteti Az időtengelyen látható elem mindegyikére magyarázatot találunk az utána következő eljárási lépésekben.
©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
3
1. ábra – Helyszíni adatgyűjtési folyamat
Folytonos MTBF elemzés
A termék gyártása Legyártott termékek száma
t1
A termékek forgalmazása
A termékek raktározása
t3
t4
A hibás termékeket visszaviszik
A hibás termékek bevizsgálása Az MTBF kiszámítása
Kézhezvételi A bevizsgálás késleltetése késleltetés
Kirakat
A raktárból forgalomba kerülés késleltetése
t2
A termékeket a vásárlók használják
t5
t6
t7
A termék életútja Az MTBF folyamat idődiagramja
1. lépés: A sorozat méretének meghatározása és becslése Az éves meghibásodási arányszám (annual failure rate – AFR) és végső soron a termékhez tartozó MTBF meghatározásának első lépése, megállapítani az egyes elemezendő terméksorozatokat. Egy adott termékmodell, vagy egy teljes termékcsalád képezze a számítások alapját? Hány nap vagy hónap gyártott termékeit vegyük bele a mintába? Hol kezdődjön és végződjön ez a termelési időszak? Fontos, hogy a sorozatba választott termék(ek) típusra kellően hasonlóak legyenek, és mennyiségük elegendő legyen a kinyert adatok statisztikai érvényességének szavatolásához.
2. lépés: Az adatgyűjtéshez használt mintavételi idő meghatározása Az eljárás második lépése meghatározni a sorozat hibaadatainak gyűjtéséhez használandó mintavételi időt. Az adatokat gyakran a termék használóitól a gyártóhoz beérkező hibabejelentések alapján gyűjtik. A sorozat utolsó elemének gyártási dátuma és a mintavételi szakasz kezdete közti időtartam megfelelő mértéke a termék, a földrajzi elhelyezkedés, az elosztási folyamat és a nyilvántartási hely függvényében más-más lehet. Például ha az egységek két hónapot töltenek a gyártelep raktárában és két hónapot az elosztási folyamatban, akkor a mintavételezési szakasz megkezdése előtti minimális időtartam négy hónap, a sorozat gyártásának befejezésétől számítva. Az olyan termékek esetén amelyek disztribútorokon, viszonteladókon vagy kiskereskedőkön haladnak keresztül, ez a négy hónap a kérdéses változók életszerű becslésének számít. Itt két fontos tényező van: (1) elegendő idő a sorozat utolsó elemének gyártása és a mintavételezési szakasz kezdete közt, és (2) megfelelően nagy adatmennyiség begyűjtése, hogy alapozhassunk az eredményekre.
©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
4
Ha nem hagyunk elegendő időt a sorozat gyártásának befejezése és a mintavételi szakasz megkezdése között, akkor a mintavételezési szakasz elkezdődhet még mielőtt a sorozatban lévő termékek mindegyikét üzembe helyeznék. Ilyen esetekben két dolog történhet: Először is, mivel az üzembe nem helyezett eszközök nem hibásodhatnak meg, könnyen alulbecsülhetjük a meghibásodási arányt. A másik hatás pedig az, hogy a mintavételezési szakasz hajlamossá válik nagyszámú telepítésből vagy beállításból fakadó hibát magába foglalni. Olyan új termékek esetén, melyek meghibásodási arányának görbéje a klasszikus „kád” alakot veheti fel – minthogy nagyszámú telepítést foglal magába -, ez a meghibásodási arány felülbecslését okozza. Habár tudjuk, hogy ezen ellentétes hatások mindegyike nagyon erőteljes, nem vehetjük úgy, hogy kiegyenlítik egymást. A másik fontos, megfontolandó tényező a mintavételi idővel kapcsolatban, a mintavételezési ablak nagysága. Hány napi hibaadat összegyűjtése elegendő? A mintavételezési ablakot elég szélesre kell választani ahhoz, hogy a statisztikai „zajt” kiszűrhessük a mintából. Az elfogadható pontosság eléréséhez szükséges időtartam a (mintavételezendő) sorozat méretétől függ. Nagyon nagy mennyiségben értékesített termék esetén ez például egy hónap, míg kisebb volumenű termékek esetén néhány hónap lehet.
3. lépés: A hiba definiálása Mielőtt egy hiba előfordulásait össze lehetne számolni, pontosan definiálni kell mi is a hiba, hogy konzisztens mérési folyamatot biztosíthassunk. Képzeljük el mi lenne, ha minden szakember a gyárba beérkező „hibás” termékeket tekintené a meghibásodás számításának alapjaként. Az egyik szakember esetleg csak a végzetesen sérült termékeket, míg a másik az összes bármilyen tekintetben hibásat – beleértve a végzetesen sérülteket is – belevenné a hibaszámba. E két szélsőséges megközelítés mellett semmi esély egy adott termék meghibásodási arányának pontos megállapítására. Nem is említve a termék folyamatirányítására gyakorolt hatását. Következésképpen, elengedhetetlen hogy a gyártók a hiba egyértelmű definíciójával rendelkezzenek, mielőtt bármilyen terméket vizsgálnának. Néha az egyes eseményekhez tartozó MTBF értékek megállapítása végett a gyártók a hiba többféle meghatározását adják. Az UPS készülékek gyártói például igyekeznek mérni mind a kritikus terhelés alatt összeomló termékekhez, mind a kevésbé kritikus meghibásodásokhoz – ahol a terhelés mellett a működés továbbra is biztosítva marad – tartozó MTBF értékeket.
4. lépés: A termék befogadása, vizsgálata és javítása Elegendő időt kell hagyni a mintavételezési szakasz és az AFR számítása között, hogy időt hagyjunk a hibásnak jelzett termékek beérkezésére, vizsgálatára és javítására. A vizsgálat meghatározza a hiba jellegét, míg a javítás igazolja a diagnózist. Kisebb méretű termékek esetén azokat általában visszaküldik a gyártóhoz, ami kézhezvételi késleltetést eredményez (vagyis bizonyos idő telik el még az egység megérkezik). Miután az egység megérkezik a gyártóhoz, azt vizsgálni és javítani szükséges, ami egy másik késleltetést, az úgynevezett diagnosztikai késleltetést eredményezi. Nagyobb méretű termékek esetén a vizsgálatokat és javításokat általában a vásárló telephelyén végzik, így nincs, vagy kicsi a késleltetés. Mindkét esetben szükséges a termékek vizsgálatát és javítását még az AFR számítása előtt elvégezni. Nagy volumenű termékek esetén lehetséges hogy a diagnosztikai késleltetés végéig nem fejeződik be az összes egység javítása. Ezekben az esetekben néha azzal a feltételezéssel élnek, hogy a javítatlan egységek olyan arányban hibásak, mint a már kijavítottak. A vizsgálandó termékek előállítási mennyiségétől és típusától függően, a kézhezvételi és a diagnosztikai késleltetés hetekkel kitolhatja a mintavételi szakasz végét, ahol az AFR értékét majd számítani lehet. ©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
5
5. lépés: Az éves meghibásodási arány számítása Az éves meghibásodási arány számítását adott termék egy naptári évre várt meghibásodási számának szemléltetésére végzik. Az első lépés ezen érték kiszámításában, „évesíteni” a meghibásodási adatokat. Ez a mintavételi szakaszban észlelt hibaszám és az évenkénti mintavételi szakaszszám összeszorzásával végezhető el. A második lépés meghatározni a hibaarányt a teljes gyártási sorozatra. Az évesített meghibásodási számot a gyártási sorozatban előállított egységek számával elosztva kaphatjuk ezt meg. Az 1. egyenlet alább látható:
AFR =
Hibaszám a mintavételi szakaszban × (évi 52 hét Mintavételi szakasz hossza hetekben ) Egységek száma a sorozatban
1. egyenlet
Ez az egyenlet a következő 2 feltételezéssel él: (1) a termékek az év 365 napjában napi 24 órában üzemelnek; és (2) a sorozatban lévő minden termék ugyanakkor kezdi működését. Vagyis – még ha használható is lenne e képlet bármilyen termék esetén – célszerűbb olyan termékekre alkalmazni, amelyek folyamatosan üzemelnek. Azokban a rendszerekben, ahol a termékeket időszakosan használják, az AFR számítása pontosabb a 2. egyenlet használatával. Egy példa ilyen típusú termékre a generátoros készenléti vészáramforrás-rendszer.
AFR =
Hibaszám a mintavételi szakaszban × (52 hét évente Mintavételi szakasz hossza hetekben ) 2. egyenlet A sorozat összegzett mûködési éveinek száma
Ennek a képletnek a használatával az AFR csak azt az időt veszi figyelembe, amit az egységek tényleges működéssel töltenek. Az 1. egyenlet és a 2. egyenlet gyakorlatilag ugyanaz, de különböző feltételezési készleteket használnak. A következő feltételezett példa szemlélteti, milyen jelentős lehet az eltérés, ha egy nem folyamatosan üzemelő terméket vizsgálunk: 10,000 gépkocsi van a mintasorozatban. 2 hónapig (mintavételi szakasz) gyűjtjük a sorozat meghibásodási adatait. Egy átlagos gépkocsi 400 órát üzemel évente. A 2 hónap alatt 10 gépkocsi hibásodik meg. Az 1. egyenlet használatával A meghibásodási ráta 10 hiba x (52 hét évente / 8 hét mintavételi idő) / 10,000 egység a populációban = 0.0065 or 0.65% A 2. egyenlet használatával Feltételezve, hogy minden terméket azonos időpontban helyezték üzembe*, a populáció működési ideje 10,000 x 400 óra évente = 4 millió összesített autó óra, vagy 4 millió / 8760 óra évente = 457 autó év. A meghibásodási ráta 10 hiba x (52 hét évente / 8 hét mintavételi idő) / 457 összesített autó év = 0.14 vagy 14% *Megjegyzés: Azért tettük ezt a feltételezést, hogy egyszerüsítsük a példát. Valójában a termékeket egy bizonyos időszak alatt adták el, ami miatt a működési idő értelemszerűen rövidebb. A rövidebb működési idő magasabb AFR.t eredményez. Ha a fenti összehasonlítást folyamatosan üzemelő termékre végeztük volna el, a két AFR ábra megegyezne. Még ha ki is hagynánk az összes egység egyidejű üzemkezdetére vonatkozó feltwételezést, az AFR értékek akkor is elég közel lennének egymáshoz. Következésképpen annak megállapítása, hogy a termék folyamatosan működik-e vagy sem, kritikus a megfelelő vizsgálat elvégzéséhez. ©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
6
6. lépés: Az AFR átalakítása MTBF értékké Az AFR átalakítása (órákban mért) MTFB értékké az összes lépés közül a legkönnyebb, de talán a leggyakrabban félreértelmezett. Az AFR MTBF értékké konvertálása, csak állandó meghibásodási arány feltételezése mellett lehet érvényes. A képlet alább látható (3. egyenlet):
MTBF =
Évenkénti órák száma 8760 = AFR AFR
3. egyenlet
Példa MTBF számítására az AFR mérési folyamat használatával A következő – kitalált – példa segít szemléltetni a teljes folyamatot:
1. lépés: A teljes sorozatot „X” márkajelzésű 15kVA-es UPS rendszernek tesszük fel, melyeket a 2003-as év 36. és a 47. hete között (szeptember 1 és november 21. között) gyártottak, egy 12 hetes termelési ablakban. A sorozat 2.000 egységet tartalmaz. 2. lépés: A mintavételi ablak kezdetét 2004. február 2-ára, végét 2004. július 16-ára tesszük (ez egy 24 hetes ablak). Ez 10 hetet tételez fel a termék leltározási és elosztási késleltetésére. 3. lépés: A hibákat kritikus fogyasztó kiesésként definiáljuk, amelyet bármi okozhat, beleértve az emberi tényezőt is. 4. lépés: A mintavételi szakaszban húsz hibát jeleztek. Ezek közül kilencet soroltak a kritikus kiesések közé, a maradék tizenegy nem volt kritikus. Tehát - a 3. lépésben megadott hibadefiníció alapján - kilenc hibát veszünk figyelembe a következő számításban. A hibás termékeket megkaptuk, megvizsgáltuk és javítottuk, az AFR számítását megelőzően. 5. lépés: Az AFR kiszámítása a következőképpen történik:
AFR =
9 hiba × (évi 52 hét mintavételi szakasz 24 hete ) = 0.00975 = 0.975% a sorozat 2000 egysége
6. lépés: Az MTFB kiszámítása a következő:
MTBF =
8760 8760 = = 898,462 óra AFR 0.00975
©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
7
Az AFR befolyásoló tényezői Az MTBF értékeket sokszor a gyártók adják meg, anélkül hogy bármiféle igazoló adattal alátámasztanák azokat. Ahogyan azt már említettük, amikor több rendszer MTBF (vagy AFR) ábráiról beszélünk, fontos hogy megértsük az elemzések során használt alapvető feltevéseket és változókat, de legfőképp azt, ahogyan a meghibásodásokat definiálják. Ha az összehasonlítást ezek megértése nélkül végezzük, megnő a veszélye annak, hogy az összehasonlítás igazságtalan lesz és az eltérések 500%-osak, vagy még nagyobbak is lehetnek. Ez végül felesleges üzleti költségekhez és akár váratlan leállásokhoz is vezethet. Általánosságban, két vagy több rendszer MTBF értékeit soha ne hasonlítsunk össze úgy, hogy nem definiáljuk pontosan a változókat, feltevéseket és a meghibásodásokat. Még ha két MTBF érték azonosnak is tűnik, mindig fennáll a veszélye annak, hogy az összehasonlítás elfogult lesz. Ezért fontos az MTBF eredmények mögé látni és kielemezni, megérteni miből tevődnek össze ezek az értékek. A továbbiakban, ismertetjük az összes változót és a végeredményre gyakorolt esetleges hatásaikat. Egy hasznos eszközt, nevezetesen egy ellenőrző listát találunk a függelékben, melynek segítségével két vagy több rendszerre is összehasonlíthatjuk ezeket, a változókat. Amint készen vagyunk vele, az ellenőrző listát felül kell vizsgálnunk, hogy azonosítsuk azokat a változókat, amelyek különböznek a rendszerekben. Azáltal, hogy kritikus hozzáállással kielemezzük e különbségeket és az MTBF értékekre gyakorolt hatásaikat, lehetővé válik egy igazságos összehasonlítás elkészítése, kulcsfontosságú adalékként szolgálva ezzel az adott termék specifikálásához vagy a vásárlási döntéshez.
A termék funkciója, alkalmazása és korlátai Mielőtt összehasonlítanánk két vagy több MTBF értéket, fontos igazolni, hogy az összehasonlítandó termékek egyenértékűek. Az összehasonlítandó termékek funkciójukban, képességeikben és felhasználhatóságukban hasonlóak kell, hogy legyenek. Ha az összehasonlítandó termék egy UPS lenne, a termék funkciója a csatlakoztatott fogyasztók szükség szerinti áramellátása lenne. E terméknek alkalmazása az adatközponti környezetben előálló kritikus IT fogyasztók támogatása lehet. Különböző alkalmazás esetén egy igazságos MTBF összehasonlítás nem lehetséges. Például, irreális lenne egy ipari használatra tervezett UPS-t összehasonlítani egy olyannal, amelyet IT használatra terveztek. Ami még fontosabb, az az, hogy az MTBF értékek összehasonlításában szereplő rendszerek határai egyenértékűek kell, hogy legyenek. Ha különbözőképpen van meghatározva a rendszerekben az, hogy mi számít bele a rendszerbe és mi nem, akkor az igazságtalan összehasonlítás elkerülhetetlen. Vegyünk egy külső akkumulátorokkal rendelkező UPS rendszert. Egyes gyártók úgy dönthetnek, hogy kihagynak ezen, külső akkumulátorokból származó mindenféle meghibásodást a számításból, mivel ezek „külsők", azaz nem tartoznak a rendszerhez. Más forgalmazók viszont amellett dönthetnek, hogy számításba veszik ezeket a meghibásodásokat, mivel az akkumulátorok fontos alkotórészek a rendszer működésében. A 2. ábra ezt a példát szemlélteti. Más részegységek, melyek inkonzisztens határokat eredményezhetnek: bemeneti- és kimeneti áramköri megszakítók, párhuzamos rendszerek, biztosítók és vezérlőrendszerek. A vásárlók feladata megkérdezni a gyártókat arról, hogy milyen összetevőket és alrendszereket vettek bele az MTBF számításba és nem biztosra venni azt, hogy minden gyártó ugyanúgy definiálja ezeket.
©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
8
2. ábra – Egy UPS rendszer „határainak" összehasonlítása
Állandó meghibásodási arány feltételezése Annak érdekében, hogy az AFR és MTBF számítások megfeleljenek a helyszíni adatgyűjtés
módszerének, a megvizsgálandó termékeknek állandó meghibásodási arányt kell feltételezniük. Fontos mérlegelni, hogy ez a feltételezés ésszerű-e az összehasonlítandó termék esetében. Ez egy általánosan elfogadott feltevés elektronikus rendszerek vagy alkotóelemek esetében. Vajon a termékek ebbe a kategóriába tartoznak? Ha nem, a kiszámított értékek nem fogják tükrözni a várható meghibásodásokat, ami kevés esélyt ad egy igazságos összehasonlításnak.
Populáció méret Amint világossá válik, hogy a termékek és alkalmazásaik hasonlóak, fontos megnézni a helyszíni adatgyűjtés folyamatát. A populáció méretének definiálása (az alkotó egységek száma) itt az első fontos változó. Ha a populációban definiált termékek mennyisége túl kicsi, az MTBF-ből származó becslés valószínűleg használhatatlan lesz. Ezért, amikor az MTBF értékeket összehasonlítjuk, fontos megbizonyosodni arról, hogy mindegyik megfelelő populációméreten alapszik. Bár az összehasonlítandó termékek termelési aránya különbözhet, fontos szemügyre venni az egységek számát a populációban. Ha egy termék termelési aránya kisebb, a termelési időkeret, mely alatt a terméket előállítják, nagyobb kell, hogy legyen annak érdekében, hogy a megfelelő mennyiséget elérje. Például, az „A” gyártó 1000 egységet termel egy hónapban, míg a „B” gyártó 50-et egy ugyan olyan termékből. A „B” gyártónak több hónapnyi előállított terméket kellene tartalmaznia a populációján belül, hogy az eredményei statisztikailag érvényesek legyenek, míg az „A” gyártónak egy hónap is elég lenne.
©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
9
A sorozat utolsó elemének gyártási dátuma és a mintavételi szakasz kezdete közti időtartam Amennyiben nem hagyunk elegendő időt a sorozattartomány vége és a mintavételi szakasz kezdete közt, az AFR és MTBF értékek megállapítása hibás lehet. Minden összehasonlítandó rendszer gyártójának elegendő időt kell biztosítania a populációik számára, hogy keresztülmenjenek a leltározáson és eloszláson, mielőtt elkezdődne a meghibásodásokkal kapcsolatos adatok begyűjtése. Például, ha egy bizonyos termék általában egy hónapig leltárban van és ezután egy hónapig tart amíg az áru eljut a felhasználóhoz, minimum 2 hónapnyi időt kell adni, mielőtt a meghibásodásokat felmérnék. Ez az „összvárakozási idő” minden terméktípusonként változik. Mivel a termékek fajtájának hasonlónak kell lennie, hogy összehasonlítsuk őket, a populáció és mintavételi szakaszok is hasonló hosszúságúak kell, hogy legyenek. Ha egyértelmű, hogy egy gyártónak nem volt elegendő várakozási ideje vagy egyáltalán nem volt várakozási idő, a rendszerre vonatkoztatott AFR valószínűleg alacsonyabb lesz, mint a valóságban és óvatosnak kell lennünk az értékek összehasonlításánál.
Adat-mintavételi szakasz Mint ahogyan azt már a folyamat második lépésénél említettük, fontos, hogy a megfelelő adat-mintavételi szakaszt válasszuk. Amennyiben az összehasonlítandó rendszerek egyforma hosszúságú a mintaablaka, hasonló termékekkel és / vagy eladási mennyiségekkel rendelkezik, akkor az igazságos összehasonlításnak nincs akadálya. Azonban a helyzet nem mindig ez. Amikor az adatvételi szakasz hosszúsága rendszerenként változik, fontos mindegyiket, egyenként kiértékelni, hogy megállapítsuk hű képet ad-e az idővel esetleg előforduló meghibásodások arányáról. Minél kevesebbet gyártottak az adott termékből, annál szélesebb kell, hogy legyen az ablak. Nem lenne elegendő például, egy havi 10 egységet előállító gyártó számára mindössze egy havi hibaadatot begyűjteni. Mivel a volumen kicsi, kevés esély lenne rá, hogy abban a bizonyos egy hónapban jelentett meghibásodások előrevetítenék a meghibásodási arányt az elkövetkező hónapokra.
A meghibásodás definiálása Ha két összehasonlítandó termék definíciója különböző lenne, az elemzésnek annyi értelme lenne, mintha az almákat a narancsokkal akarnánk összehasonlítani. Ezért, egy érvényes MTBF összehasonlítás egy fontos feladata, hogy minden összehasonlítandó termék esetében kiderítse miből tevődik össze egy meghibásodás. Tehát mi az, amit egy gyártó MTBF számítási hibának kell, hogy vegyen?
•
Hasznos az felhasználók helytelen kezelése által okozott meghibásodások számlálása? Lehetnek a tervezők által figyelmen kívül hagyott emberi tényezők, amelyek miatt a felhasználók hajlamosak lehetnek a termék helytelen használatára.
•
Az áramellátás-védelmi iparban, a legelterjedtebb „definíciója” egy UPS hibának a „fogyasztók kiesése” hiba. Ez azt jelenti, hogy a fogyasztóknak szolgáltatott energia elhagyta a megengedett tartományt és a terhelés leállását okozta. Mindemellett, hasznos számon tartani a gyártó szerviz technikusa által okozott meghibásodások számát? Lehetséges, hogy maga a termék megnöveli egy már amúgy is kockázatos folyamat meghibásodásának valószínűségét?
©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
10
•
Ha egy számítógépen elromlik egy jelzőfény, az vajon meghibásodásnak számít, még akkor is, ha ez semmilyen formában nem befolyásolja a számítógép működését?
•
Egy elhasználódó jellegű alkatrész, például egy elem idő előtti kifáradása meghibásodásnak számít?
•
A szállítás közben keletkezett hibákat meghibásodásnak vesszük? Forrásuk a hibásan tervezett csomagolás is lehet.
•
A visszatérő hibákat is számolják? Más szóval, azokat a meghibásodásokat, amelyek ugyanannál a rendszernél és felhasználónál jelentkeznek, ugyanazzal a hiba meghatározással csak egyszer, vagy többször is számolják?
•
A telepítések közben okozott meghibásodások is meghibásodásnak számítanak? A gyártó technikusa is okozhatja a meghibásodást.
•
A meghibásodásokat akkor is figyelembe vesszük, ha az ügyfél nem vásárolta meg az ajánlott karbantartási szolgáltatást vagy felügyeleti rendszert?
•
Ha egy földrengés folytán az épület megrongálódik és a rendszer meghibásodik, az meghibásodásnak számít vagy letudjuk egy „Isten akaratával”.
•
A rendszer egyes elemeinek meghibásodásait kihagyják? Az UPS rendszerek esetében ezek az akkumulátorok vagy by-pass kapcsolók lehetnek.
•
Ha egy egymás után bekövetkező hibasor merül fel, ami a további rendszerek leállását okozza, minden rendszer hibásnak minődül vagy csak az első?
•
Kihagyjuk-e a rendszer hibáját a sorozatból, ha az valamilyen tekintetben „egyedi”?
Az MTBF kiszámításához használatos pontos definíció az iparban többféle következtetést vesz figyelembe. A fenti lista csak egy párat tartalmaz ezek közül. Mivel ilyen sok kivételt teszünk abban, hogy mi számít hibának és mi nem, az MTBF értékek sokkal megbízhatóbbnak ábrázolják a rendszert, mint amilyennek azt az ügyfél tapasztalja majd. Annak érdekében, hogy a partnereknek és az ügyfeleknek AFR és MTBF értékekkel tudjunk szolgálni, az MTBF értékek összehasonlításánál egy félreérthetetlen hibadefinícióra van szükség. Íme három lényegre törő definíció: 0-s típus
A terméknek olyan szerkezeti hibája vagy meghibásodása van, amely megakadályozza annak üzembe helyezését.
1-es típus A terméknek, mint egységnek megszűnik a tőle elvárt funkció teljesítésére való képessége. 1 2-es típus Az egyes összetevők bármelyikének megszűnik a saját funkciójának ellátására vonatkozó képessége, ami azonban nem jelenti feltétlenül a teljes termék működésképtelenné válását. 2
1 2
IEC-50 IEC-50
©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
11
Amellett, hogy tudjuk melyik definíció(ka)t választotta egy-egy gyártó, feltétlenül tudnunk kell azt is, hogy az emberi tényező okozta meghibásodásokat tartalmazza-e. Azokban az esetekben, amikor az ember által okozott hibák is szerepelnek az MTBF számításokban, sokkal nagyobb kihívás az MTBF számok összehasonlítása. Ez azért van így, mert sok módja van annak, hogy egy emberi hiba meghibásodáshoz vezessen, ami arra ösztönzi a gyártókat, hogy néhány ilyen emberi hiba okozta meghibásodást kiszűrjön. Ha az összes gyártó nem az azonos jellegű meghibásodásokat szűri ki, akkor a rendszer-összehasonlítás kérdésessé válik. Ennek szemléltetésére, tekintsük át újra a fentiekben említett „X” márka példáját. Az 1. ábra úgy hasonlítja össze az MTBF értékeit, hogy különböző, létező meghibásodási definíciókat vesz figyelembe. Az „A” rendszer az „X” márka, ahol a meghibásodásokat kritikus meghibásodásoknak (1. számú definíció) definiálják, amely magába foglalja a fogyói cikkek emberi hibáit és meghibásodásait. A „B” rendszer ugyanaz az „X” márkájú termék, ahol a meghibásodásokat szintén az 1. számú definíció definiálja, de ez nem foglalja magába az emberi hiba által okozott károkat, az átfedéses kapcsolódási hibákat és a fogyasztói cikkek meghibásodásait. Az MTBF képlet természeténél fogva ha egyetlen meghibásodást is tapasztal, mely különbözik a mintavételi szakasz közben, jelentős hatást gyakorolhat az MTBF eredményére. Ebben a példában a meghibásodások definícióját könnyű félreértelmezni, ami sokszor meg is történik, és ahogyan ez a példa is szemlélteti, rávilágíthat az igazságos és igazságtalan összehasonlítás közti különbségre. Bővebb információért az eszközről, amit ebben a példában az értékek kiszámításához használtak, írjon az
[email protected] címre.
©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
12
1. táblázat – Példa az MTBF értékek összehasonlítására a hiba különböző definíciói mellett A rendszer A vizsgált A vizsgált A vizsgált Az MTBF időszakban időszakban időszakban bekövetkezett kiszámításakor bekövetkezett bekövetkezett figyelembe kell „új” visszatérő meghibásodások venni? meghibásodások meghibásodások száma száma száma
MTBF összehasonlítás
B rendszer
Hibák típusai
A vizsgált A vizsgált A vizsgált időszakban időszakban Az MTBF időszakban bekövetkezett kiszámításakor bekövetkezett bekövetkezett visszatérő „új” figyelembe kell meghibásodáso meghibásodáso meghibásodáso venni? k száma k száma k száma
0-s típusú hiba: A terméknek olyan szerkezeti hibája vagy meghibásodása van, amely megakadályozza annak üzembe helyezését 0 0 0
0
FALSE
0
FALSE
0
FALSE
A szállítás közbeni sérülések által okozott hiba
FALSE
0
0
„Szakképzett” beszerelés közben bekövetkező hiba
TRUE
0
0
"Nem minősített" installáció alatt bekövetkezett hiba
FALSE
0
0
TRUE
0
0
FALSE
1
1
FALSE
1
1 0
I. típusú hiba = A terméknek, mint egésznek, megszűnik a képessége funkciójának ellátására 0
TRUE
1
1
TRUE
1
1
TRUE
0
0
TRUE
A hibát 3. fél technikusa okozta (a már működő rendszerben)
FALSE
0
FALSE
1
0
1
0
A "jelentett hibák" normál működés körébe tartoznak Hiba sorozat (vagyis egy másik hasonló rendszer okozta a hibát) A hibát egy APC vagy APC által minősíett szerviz technikus okozta (a már működő rendszerben)
1
0
1
TRUE
A hibát a felhasználó okozta nem üzemszerű alkalmazás vagy téves használat miatt
2
0
2
TRUE
Fogyó eszköz, mint pl. az akkumlátorok okozta hiba
FALSE
2
0
2
Olyan alkatrész vagy firmware hiba, amelyet már javítottak (mérnöki csere utasításra)
TRUE
1
0
1
* Alkatrész vagy firmware hiba
TRUE
3
0
3
FALSE
2
2
FALSE
1
1
FALSE
1
1 1
1
0
1
FALSE
3
0
3
TRUE
II. típusú hiba = A termék egy részének megszűnik a képessége funkciójának ellátására, de a termék mint egész nem vesztette el képességét funkciójának ellátására 2
2
FALSE
Normális működés közben bekövetkező „jelentett hiba” Hiba sorozat (vagyis egy másik hasonló rendszer okozta a hibát) A hibát egy APC vagy APC által minősíett szerviz technikus okozta (a már működő rendszerben)
1
1
FALSE
1
1
FALSE
1
1
FALSE
A hibát 3. fél technikusa okozta (a már működő rendszerben)
FALSE
1
FALSE
1
0
1
1
0
1
FALSE
A hibát a felhasználó okozta nem üzemszerű alkalmazás vagy téves használat miatt
2
0
2
FALSE
Fogyó eszköz, mint pl. az akkumlátorok okozta hiba
FALSE
2
0
2
Olyan alkatrész vagy firmware hiba, amelyet már javítottak (mérnöki csere utasításra)
FALSE
1
0
1
* Alkatrész vagy firmware hiba
FALSE
2
0
2
1
0
1
FALSE
2
0
2
FALSE
Az összesített hibák részei az ismétlődő hibák? 9
FALSE
Az ismétlődő hibák ugyan annál a felhasználónál, ugyan annak a rendszernek azonos típusú hibái Az MTBF számításhoz figyelembe vett összesített hibaszám a vizsgált periódusban
FALSE
Az összesített hibák részei az ismétlődő hibák? 4
©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
13
MTBF számítás
A rendszer
B rendszer
B rendszer az A rendszer hiba meghatározása szerint
Az MTBF számításhoz figyelembe vett összesített hibaszám a vizsgált periódusban
9
4
9
A vizsgált periódus hossza hetekben
24
24
24
Az egyedek száma a populációban
2000
2000
2000
AFR = [Hibák a vizsgált periódusban x (52 hét évente / hetek száma a vizsgált periódusban)] / Egyedek száma a populációban
0.975%
0.433%
0.975%
MTBF = 8760 / AFR
898,462
2,021,538
898,462
B rendszerről azt állítják, hogy 125%-kal magasabb az MTBF értéke, mint az A rendszeré. Az összehasonlítás nem érvényes, mivel különböző hiba meghatározásokon alapul. Valójában a B rendszer MTBF értéke 0%-kal nagyobb, mint az A rendszeré
Az ehhez hasonló inkonzisztenciák csökkentése érdekében az APC javasol egy bevált módszert annak meghatározására, hogy mi számít és mi nem számít bele az MTBF értékekbe. Ez a módszer azon célkitűzés alapján jött létre, hogy minden elfogadható hibát bemutasson a gyártó a vásárlóknak. E hibáknak minden olyan dolgot reprezentálniuk kell, amelyek a gyártó hatáskörébe tartoznak. Például, ha a gyártó szerviz technikusa a hiba okozója, akkor ennek tükröződnie kell az MTBF értékében, mivel ez ebben az esetben a gyártó felelőssége. Másrészről viszont, ha a vásárló úgy dönt, hogy egy nem meghatalmazott külső technikust bérel fel, és a hibát ez a külső személy okozza, akkor az MTBF értékeinek ezt nem kell jeleznie, hiszen nem tartozik a gyártó felelősségi körébe. A függelékben szereplő ellenőrzőlista rögzíti mely definíciók részei ennek a már bevált módszernek. Amikor csak lehet, a hiba e bevált módszer szerinti definícióját érdemes a különböző gyártók termékeinek összehasonlítására használni. Ha egy gyártó ezen meghatározásoknak csak egy részét tudja biztosítani, akkor szükséges lenne ugyanezen részadatokat beszerezni az összehasonlításban szereplő másik gyártótól is. Ismételve magunkat, ez a konzisztencia szükséges ahhoz, hogy igazságos legyen az összehasonlítás. Annak ellenére, hogy ez „igazságos" összehasonlítást eredményezhet, nem ábrázolja jól a valóságot. A hibák minél kisebb részhalmazát mellékeli a forgalmazó, annál messzebb kerül az MTBF értéke a valóságtól.
A mintavételi szakasz vége és az AFR számítási dátuma közötti idő Ha egy forgalmazó minden, a mintavételi szakaszban hibásnak jelzett termékeket megkapna, megvizsgálna és javítana, akkor már azonnal számíthatná is az AFR értékét. Ez valóban lehetséges olyan kisebb példányszámú termékek esetében, amelyeket az ügyfeleknél diagnosztizálnak és javítanak. Jóllehet, nem ez a helyzet nagyobb mennyiségben értékesített termékekkel, melyeket visszaküldenek a gyártóhoz. Hasonló terméktípusok MTBF alapú összehasonlításánál a mintavételi szakaszok vége és az AFR számítások dátuma közti késleltetéseknek közel azonosaknak célszerű lenniük. Például tételezzük fel, hogy az „A” gyártó egy hónappal, a „B” gyártó pedig négy hónappal a mintavételi időszak vége után számítja ki az AFR-t. Ha az összehasonlítandó termék nagy mennyiségben értékesített, az „A” gyártó valószínűleg egy sokkal kedvezőbb AFR értékkel állhat elő. Ez azért van, mert a „meghibásodott” termékeik közül néhány (melyeket csak ezután kapnak kézhez, diagnosztizálnak és javítanak meg) nem szerepel az AFR számításában. ©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
14
Egyetlen eset van, amikor ez a időintervallumbeli eltérés a rendszerek közt nem valószínű, hogy az összehasonlítás érvénytelen eredményét okozná (amennyiben minden más azonos). Ez a körülmény akkor fordulhat elő, ha az összes gyártó azt tételezi fel, hogy a még javítatlan egységek között ugyanolyan arányban vannak hibásak, mint az előzőleg javítottak közt, valamint a legtöbb visszaküldött termék már megérkezett, diagnosztizálták és meg is javították őket.
Az adatgyűjtés és elemzés dokumentált folyamata Annak érdekében, hogy bízhassunk egy MTBF összehasonlítás eredményében, fontos megértenünk azt a folyamatot, amit minden egyes gyártó alkalmaz az adatok gyűjtésénél és elemzésénél. Az egyértelműen meghatározott és dokumentált folyamat létfontosságú a szigorú feltételeknek eleget tevő minőségbiztosítási program lefolytatásához. Ez segít biztosítani a konzisztenciát és a pontosságot az elemzés lépései alatt. Lejjebb a folyamati problémákra láthatunk három példát, amelyekre oda kell figyelni. Amikor adottak ezek vagy más problémák, célszerű tüzetesen megvizsgálni az MTBF becsült értékére gyakorolt hatásaikat (majd végső soron az összehasonlítást).
•
A gyártó nem képes pontosan nyomon követni az egész világból beérkező adatokat, mert a világ különböző részein, más és más követési és tároló rendszereket használnak a meghibásodási és javítási adatok rögzítéséhez. A hiányzó vagy helytelen adatok hibákat eredményezhetnek a nemzetközileg forgalmazott egységek AFR becslésnél.
•
A gyártó nem rendelkezik egyértelműen definiált folyamatokkal a visszaküldött termékek kategorizálására. Ha használatlan és felbontatlan termékeket küldenek vissza hitelbe, ezeket úgy kategorizálják, mintha meghibásodás miatt küldték volna vissza és az így kapott AFR megnövekszik.
•
A gyártó követőrendszere nagyrészt kézi irányítású. Az emberek által irányított folyamatok számának növekedése adat-, majd végül AFR számítási hibák hosszú sorát vonhatja maga után. Általában minél inkább automatizált a folyamat, annál pontosabbak az eredmények. Egy példa az automatizálásra, a sorozatszámok beolvastatása, a rendszerbe történő kézi számbevitel helyett.
A számításokhoz használandó AFR-képlet A terméktől függően, a gyártók által használt AFR-képlet (1. vagy 2. egyenlet) használhatatlanná teheti az MTBF értékek összehasonlítását. Az olyan termékek összehasonlítása melyek folyamatosan üzemelnek (miután üzembe helyezték őket) történhet bármelyik képlet segítségével, de olyan termékek összevetésére melyek csak időszakosan üzemelnek, csak a 2. egyenlet használható, egyébként az összehasonlítás érvénytelen. A 2. táblázat szemlélteti milyen körülmények közt lehet érvényes egy összehasonlítás.
©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
15
2. táblázat – AFR egyenletek összehasonlító táblázata Termék működésének jellege Folyamatosan üzemelő termékek összehasonlítása például „A” és „B” UPS összevetése (mindkettő kritikus fogyasztókat támogat) Szakaszosan üzemelő termékek összehasonlítása például „A” és „B” laptop összehasonlítása
1. AFR egyenletet használva
2. AFR egyenletet használva
Érvényes az összehasonlítás
Érvényes az összehasonlítás
Érvénytelen az összehasonlítás
Érvényes az összehasonlítás
Az évenkénti órák száma Csak állandó meghibásodási arány feltételezése mellett lehet érvényes az AFR értékek MTBF értékekké való alakítása. Így, a 3. egyenlet ugyan használható, de fontos meggyőződni arról, hogy az összehasonlításban szereplő összes rendszer ugyanazt az évenkénti óraszámot alkalmazza. Néhány gyártó például az évi 8.000-es, még néhány a – helyes – 8.760-as értéket veszi alapul.
Egyéb döntéshozatali szempontok az MTBF mellett Míg az MTBF a döntések meghozatalának hasznos eszköze lehet, ha egy termék pontos meghatározásáról és kiválasztásáról van szó (amikor a módszerek, változók és becslések ugyanazok az összes összehasonlítandó rendszernél), soha ne ez legyen az egyetlen szempont. Sok más kritérium van, amit érdemes figyelembe venni, ha több gyártó termékei között válogatunk. Például, mennyire robosztusak a gyártó átfogó minőségellenőrzési folyamatai? Milyen volumenben és milyen környezetben termelnek? Rendelkeznek ISO9000 tanúsítvánnyal? Ezek rámutatnak a minőség és megbízhatóság optimalizálását célzó folyamatok szabványosságára. Milyen mértékben elégítik ki az egyes termékek a felhasználók igényeit? Ide tartozhatnak olyan tényezők, mint a termék rugalmassága és variálhatósága, a meghibásodás után való gyors helyreállás képessége (MTTR) és a termék birtoklási összköltsége (a birtoklási összköltség fontosságának tárgyalását lásd a 6-os számú, „Az adatközpont és hálózati terem infrastruktúra üzemeltetőjét terhelő költségek meghatározása” című APC tanulmányban). Más összehasonlítási megoldás lehet például az is, hogy megtekintjük az ügyfél-referenciákat vagy a termékek különböző értékeléseit. Végül, a szóban forgó két vagy több rendszer egy harmadik – külső – fél általi kiértékelés biztosítja, hogy optimális termékspecifikáció és a vásárlási döntés szülessen meg.
©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
16
Összegzés Több termék összehasonlításánál az MTBF gyakran kulcsfontosságú kritérium. Ennek ellenére óvatosnak kell lennünk, amikor ezeket, az értékeket összevetjük. Először is, az MTBF értékek becslésének módszere azonos kell, hogy legyen. Emellett, a helyszíni adatok gyűjtése és elemzése során számos változó és feltevés használatos és ezek mindegyike nagymértékben befolyásolhatja a végeredményt. Ha ezek a változók és becslések nem egyeznek meg, az igazságos összehasonlítás lehetetlenné válik. A valóság az, hogy ezek a változók és becslések gyakran eltérőek. A függelékben található ellenőrző lista segíthet annak eldöntésében, hogy ez-e a helyzet. Emellett, az interneten megtalálható MTBF-kalkulátor segíthet a kritikus változók MTBF értékekre gyakorolt hatásának számszerűsítésében. A tanulmányunkban ismertetett alapok segítségével a különböző MTBF értékeket most már igazságosabban összehasonlíthatjuk. Amikor hasonló becsléseket és változókat használunk, és a hiba-definíciók is ugyanazok, akkor az összehasonlítás eredményében jó eséllyel bízhatunk.
Néhány szó a szerzőkről: Wendy Torell a rendelkezésre állás témakörével foglalkozó mérnök az APC W. kingstoni, Rhode Island-i központjában. Feladatai közé tartozik a rendelkezésre állás tudományos és tervezési szemszögből való megközelítésének egyeztetése az ügyfelekkel, ami alapján ők optimalizálni tudják adatközpontjaikat. Diplomáját gépészmérnökként szerezte a schenectady-i, New York állambeli Union Főiskolán. Wendy ASQ Certified Reliability Engineer képesítéssel rendelkezik. Victor Avelar az APC rendelkezésre állás témakörével foglalkozó mérnöke. Rendelkezésre állási tanácsadással és az ügyfelek elektromos rendszereinek és adatközpontjainak elemzésével foglalkozik. Victor 1995-ben szerezte gépészmérnöki diplomáját a Rensselaer Politechnikai Intézetben, valamint az ASHRAE és az American Society for Quality tagja. ©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
17
Függelék – MTBF hibadefiníció ellenőrzőlista A meghibásodás definiálása
Az APC bevált módszere
„A” gyártó
„B” gyártó
Ellenőrizze az összes, a gyártók által az MTBF számításához használt hibadefiníciót 0-s típus: A terméknek olyan szerkezeti hibája vagy meghibásodása van, amely megakadályozza annak üzembe helyezését
A szállítás közbeni sérülések által okozott hiba „Szakképzett” beszerelés közben bekövetkező hiba „Szakképzetlen” beszerelés közben bekövetkező hiba 1-es típus: A terméknek, mint egységnek megszűnik a tőle elvárt funkció teljesítésére való képessége
Normális működés közben bekövetkező „jelentett hiba” Két példa ezekre a hibadefiníciókra: (1) A UPS áramkimaradáskor akkumulátoraira kapcsol, azokat teljesen lemeríti, így a terheléseket nem tudja ellátni. (2) A szokatlan időjárási körülmények miatt a légkondicionáló egység nem tudja lehűteni a rendszert, ezért kritikus szerverek állnak le.
Kaszkád hiba (például: egy másik „hasonló” rendszer hibája okozta ennek a rendszernek a hibáját) Egy példa erre a hibadefinícióra: Két UPS rendszer van párhuzamosan egy közös kimenetre kapcsolva. Az egyik UPS rendszer kondenzátora átüt, a hiba átterjed a kimenetre, és megszakítja a terhelések áramellátását.
Az APC által foglalkoztatott vagy elismert szerviztechnikus által (a rendszer üzembe helyezése után) okozott hiba Külső szerviztechnikus által (a rendszer üzembe helyezése után) okozott hiba A vevő által okozott, a nem rendeltetésszerű használatból adódó hiba
√
√
Két példa ezekre a hibadefiníciókra: (1) A vásárló a „Kikapcsolás” gomb helyett a „Teszt” gombot nyomja meg, ezáltal megszűnik a fogyasztók áramellátása; (2) a vásárló egy csőkulccsal eltöri a hidegvizet szállító csövet, ez a légkondicionáló leállását okozza.
Az elhasználódó jellegű alkatrészek – mint például az akkumulátorok – hibái Az elhasználódó jellegű alkatrészek azok, amelyek a rendszer élettartama alatt többször elhasználódhatnak, és cserére szorulhatnak. Az elhasználódó jellegű alkatrész hibájáról beszélünk, ha képtelen ellátni feladatát, még az élettartama lejárta előtt. További példák: (1) Nagy rendszerek elektrolitikus kondenzátorai; (2) Lég-, olaj-, és egyéb szűrők; (3) A légkondicionáló hűtőfolyadéka
Időközben kijavított hardver vagy firmware hiba (mérnöki rendelkezés a változtatásról) Ez a hibadefiníció magában foglalja az összes eddig nem számolt 1-es típusú hardver vagy firmware hibát, amelyet időközben egy ECO, vagy bármely más dokumentált javítás során kiküszöböltek.
Hardverelem vagy a firmware hibája Ez a hibadefiníció magában foglalja az összes eddig nem számolt 1-es típusú hardver vagy firmware hibát, amelyet még nem javítottak ki.
√
√
√
2-es típus: Az egyes összetevők bármelyikének megszűnik a saját funkciójának ellátására vonatkozó képessége, ami azonban nem jelenti feltétlenül a teljes termék működésképtelenné válását
Normális működés közben bekövetkező „jelentett hiba” Kaszkád hiba (például: egy másik „hasonló” rendszer hibája okozta ennek a rendszernek a hibáját) Az APC által foglalkoztatott vagy elismert szerviztechnikus által (a rendszer üzembe helyezése után) okozott hiba Külső szerviztechnikus által (a rendszer üzembe helyezése után) okozott hiba A vevő által okozott, a nem rendeltetésszerű használatból adódó hiba Az elhasználódó jellegű alkatrészek – mint például az akkumulátorok – hibái Időközben kijavított hardver vagy firmware hiba (mérnöki rendelkezés a változtatásról) Hardverelem vagy a firmware hibája
√ √
√ √ √
©2009 American Power Conversion. Minden jog fenntartva. A tanulmány sem egészében, sem részlegesen nem használható fel, nem reprodukálható, nem másolható, nem továbbítható és nem tárolható adatlekérdező rendszerekben a szerzői jog tulajdonosának írásos engedélye nélkül. www.apc.com Rev 2005-0
18