Markov-analyse
KHBO, Hobufonds SAFESYS ing. Alexander Dekeyser ing. Kurt Lintermans
Kurt Lintermans
Markov-analyse - toegepast op koffiemachine Een dankwoord aan Geert Dekoninck , de samenwerking was zeer bepalend voor de correcte analyse. Inleiding Verschil met andere afhankelijkheidsanalyse-technieken als RBD, FTA : • • •
Bij Markov kunnen complexe onderhoudsstrategieën in rekening worden gebracht. Bij Markov kunnen failure/restoration gebeurtenissen grafisch gemodelleerd worden. Bij Markov zijn failure-ratio /restoration-ratio constant in functie van de tijd.
Enkele begrippen uit de Markov-analyse theorie. In het boek « Coding & Information Theory van Richard W. Haimming » wordt Markov-processing beschreven. Hieruit halen we het volgende: • • • • •
P (U/Q) is de kans op gebeurtenis U als zich de gebeurtenis Q heeft voorgedaan. Bij een j-de orde Markov proces is P(Si/Si1, Si2,…, Sij) de conditionele kans dat gebeurtenis Si zich voordoet als gebeurtenissen Si1, Si2, …, Sij zich in die volgorde voordoen. Zero memory source: gebruikt elk symbool, onafhankelijk van wat er aan voorafging. J-memory source : gebruikt de j-vorige symbolen en dit beantwoord aan een j-de orde Markovproces. Een systeem bevindt zich in een state. Voor een one-memory-source zijn er q states, voor elk symbool Si.
vb. 1 Weersvoorspelling: « Morgen zal het zoals vandaag zijn », is een voorbeeld van een one-memory source. vb. 2
y
n +1
= 2 y n − y n −1 is een two-memory source ; de volgende waarde yn+1wordt gebruikt op basis van
de twee vorige yn en yn-1. Een transition graph wordt gebruikt om een Markov-proces te illustreren. Elke lijn stelt een transitie voor van een state naar een andere state, de probability ( kans ) is vermeld op de transition line. Ontwikkelen van state-transition diagrams •
Afspraak bij het opstellen van het diagram : rechts de failed state en links de functional state, via pijlvoorstelling ziet men de mogelijke transities.
restored
unit A state 0
λ
μ
failed
unit A state 1
figuur1: state-transition voorstelling van een enkele unit
Kurt Lintermans
Het systeem - koffiemachine
Principiële werking. Water wordt in het reservoir gegoten. Na aanzetten van de spanning via de schakelaar (Powerswitch) zullen de verwarmingselementen VWE1 en VWE2 opwarmen,op voorwaarde dat de fuse functioneert en dit zal zo zijn indien er geen fouten in het verwarmcircuit zijn en de spanning nominaalverloop heeft. De eerste verhit het water en geleidt de ontstane damp via de dampgeleider naar het filterhuis waarin een hoeveelheid gemalen koffiebonen geschept is in een filter. Na filtratie wordt het ontstane koffiemengsel opgevangen in een koffiekan. Het tweede verwarmingselement houdt de koffie op een constante temperatuur. Als beveiliging is er een THermische Veiligheid opgenomen in het eerste verwarmingselement om te verhinderen dat men lucht zou verhitten bij H2O- niveau INDicatie = 0. Een THErmostaat is aanwezig om de koffie op de juiste temperatuur te houden
Kurt Lintermans
Opstellen state-transition diagramma km-systeem
figuur 2: state-transition diagram van het compleet systeem Opmerkingen : • •
De gefaalde failure modus INC KP is een samenstelling van verschillende modi die afzonderlijk zouden kunnen opgesplitst worden. INC KP wordt als een unit voorgesteld, de gefaalde koffieproductie.
Met :
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
KM -> Begin - Koffiemachine werkt foutloos H2O - IND THE VWE1 PS Fuse VWE2 THV Koffiekan Filterhuis met koffie Dampgeleider ~U=220V INC KP -> Einde - Koffiemachine heeft gefaald in productie
Kurt Lintermans
Redenering Pijlen Vanuit de state correct werkende koffiemachine trekt men een pijl naar elke samenstellende component , waarmee een failure rate is geassocieerd en omgekeerd vanuit de falende component is met de terugkerende pijl een repair rate geassocieerd ,als er een is (resp. λi en μi met i=1..11). Nu heeft men ook een aantal van die samenstellende componenten die onderling met elkaar verbonden zijn via pijlen. 1. 2. 3. 4.
H2O – IND <-> THV <-> VWE1 THE <-> VWE2 PS -> U220V U220V < -> Fuse
Toelichting 1. Dit volgt uit de werking,nl. als het niveau van het water op nul wordt gedetecteerd dan moet normaal gezien de THV activeren en VWE1 uitschakelen . Als H2O – IND defect is ,bvb. het water is niet meer vloeibaar aanwezig in het reservoir en toch blijft de H2O – IND een ander niveau dan zero aanduiden,dan kan de correcte werking van THV worden beïnvloed,hiermee wordt een nieuwe failure rate geassocieerd,de failure rate die het aantal failures per operating time voorstelt van de THV op voorwaarde dat de H2O – IND defect is. Omgekeerd is er ook een repair rate ,een herstellen van THV in deze omstandigheid van een falend H2O – IND.( λa en μa ). Verder kan ook VWE1 defect raken doordat zowel H2O – IND als THV gefaald zijn. Fouten: * H2O in maar IND op ∅ ⇒ blijft gewoon werken (geen gevaar voor THV en VWE1). * geen H2O aanwezig en IND niet op ∅ ⇒ blijft werken en beschadigd VWE(1) (en/of) THV 2. De koffiemachine werkt goed, plotseling faalt de thermostaat, deze thermostaat kan vervangen worden, dus is het restorable. Bij niet tijdige vervanging kan ook het verwarmingselement (VWE2) falen. VWE2 kan eveneens vervangen worden, indien vervangen dan keert men terug naar toestand waarin de thermostaat defect is en indien niet komen we terecht in de toestand INC KP. ( λc en μc ). 3. De powerswitch raakt defect alhoewel spanning aanwezig is! Dan maakt het geen verschil uit of men U220V kan ‘herstellen’ opdat de PS weer zou werken ( enkel λf ). 4. De fuse kan door een overspanning of kortsluiting in het verwarmcircuit defect zijn geraakt . Afspraak : de symboliek wordt aangepast ter vereenvoudiging van het uitschrijven der differentiaalvergelijkingen; OPM 1. PKM (t) <-> f Koffiemachine algehele correcte werking systeem 2. PH2O – IND (t) <-> g De kans dat het item (of de unit) H2O-ind heeft gefaald 3. PTHV (t) <-> h (t) <-> i 4. PVWE1 5. PTHE (t) <-> j 6. PVWE2 (t) <-> k 7. PPS (t) <-> l 8. PU220V (t) <-> m 9. Pfuse (t) <-> n (t) <-> o 10.Pkoffiekan 11.Pfhuis met koffie (t) <-> p 12.Pdampgeleider (t) <-> q 13.PINC KP (t) <-> r Incorrecte koffieproductie De symbolen worden als volgt weergegeven: λ als l en μ als m Bijvoorbeeld λ3 wordt l3 en μB wordt mB.
Kurt Lintermans
Vergelijkingenstelsel: (Method for availability).
df = − f (l1 + l 2 + l 3 + l 4 + l 5 + l 6 + l 7 + l 8 + l 9 + l10 + l11) + ( m1.g + m2.m + m3.l + dt m4.n + m5.h + m6.i + m7.q + m8. p + m9.o + m10.k + m11. j ) dg = l1. f + mA.h − g ( m1 + lA) dt dh = lA.g + l 5. f + mB.i − h( mA + m5 + lB ) dt di = l 6. f + lB.h − i (m6 + mB) dt dj = l11. f + mC.k − j ( m11 + lC ) dt dk = lC. j + l10. f − k (mC + m10 + lD) dt dl = l 3. f − l (lF + m3) dt dm = lF .l + l 2. f + mL.n − m(lL. + m2. + lG ) dt dn = l 4. f + lL.m − n(m4 + mL. + l 4) dt do = l 9. f − o( m9 + li ) dt dp = l8. f − p( m8 + lJ ) dt dq = l 7. f − q ( m7 + lK ) dt dr = − r (lE + lD + lG + lH + li + lJ + lK ) dt Voor het oplossen van het stelsel kunnen de kanswaarden berekend worden door te stellen dat op tijdstip t=0 het systeem in de state KM (productie OK) is. PKM PH2O – IND PTHE PVWE1 PPS Pfuse PVWE2 PTHV Pkoffiekan Pfilterhuis met koffie Pdampgeleider PU220V PINC KP
(t=0) (t=0) (t=0) (t=0) (t=0) (t=0) (t=0) (t=0) (t=0) (t=0) (t=0) (t=0) (t=0)
=1 =0 =0 =0 =0 =0 =0 =0 =0 =0 =0 =0 =0
De availability of beschikbaarheid A(t) wordt dan berekend als A(t) = PKM (t)+ PH2O – IND(t)+ PTHE(t)+…+ PINC KP (t)
Kurt Lintermans
Het vergelijkingen-stelsel herleidt zich tot:
df = − f (l1 + l 2 + l3 + l 4 + l 5 + l 6 + l 7 + l8 + l 9 + l10 + l11) + (m1.g + m2.m + m3.l + dt m4.n + m5.h + m6.i + m7.q + m8. p + m9.o + m10.k + m11. j ) dg = l1. f dt dh = l 5. f dt di = l 6. f dt dj = l11. f dt dk = l10. f dt dl = l3. f dt dm = l 2. f dt dn = l 4. f dt do = l 9. f dt dp = l8. f dt dq = l 7. f dt De waarden van de failure rates en de repair rates zijn de volgende: λ1=1E-06 ( 0.000006) λ2=3E-06 λ3=1E-08 λ4=1E-09 λ5=1E-07 λ6=5E-08 λ7=2E-09 λ8=2E-06 λ9=5E-08 λ10= 5E-08 λ11=1E-07
μ1=120 μ2=3 μ3=6 μ4=6 μ5=1 μ6=0.5 μ7=6 μ8=48 μ9=24 μ10=0.5 μ11=1
λA=1E-06 λB=2E-03 λC=2E-03 λD=1 λE=1 λF=2E-01 λG=1 λH=1 λI=1 λJ=1 λK=1 λL=2E-03
μA=0.5 μB=0.25 μC=0.25
μL=3
De failure rates hebben de volgende betekenis: Voor een λ1=1E-06 is er een kans van optreden van 1 op een miljoen dat er tijdens de werking van het systeem een faling optreedt van de H20 Indicator. Als deze kans zich heeft voorgedaan,maw een defecte H20 Indicator is feitelijk,dan is er een kans van 1 op een miljoen dat er tijdens de verdere (foutieve) werking van het systeem ook nog eens een faling optreedt van de thermische veiligheid,wegens ( λA=1E-06).
Kurt Lintermans
De repair rate wordt gekenmerkt door het aantal herstellingen die er kunnen gedaan worden nadat er een fout is opgetreden en de herstelprocedure moet worden uitgevoerd. Bvb. tijdens het procédé van koffiezetten vertoont de dampgeleider een barst waardoor de waterdamp ontsnapt,het verwijderen van de defecte en vervangen door een nieuw kan gemiddeld zes keer gebeuren tijdens gemiddelde proces. Vooraleer de resultaten worden bekendgemaakt van de availability-rekenanalyse gaan we eerst verder met de betrouwbaarheidsanalyse. Vergelijkingenstelsel (Method for reliability) Een betrouwbaar systeem bevindt zich in een non-failed state, de restoration- transition van de state i+1 naar state i wordt de absorbing state. De state i+1 is de failed state en de state i is de functioning state. Het stelsel verkrijgen we door vanuit het availability DV-stelsel alles verder dan de KM-state als absorbing te beschouwen. Het differentiaal-vergelijkingenstelsel wordt :
dPkm (t ) = − ( λ1 Pkm (t ) + λ2 Pkm (t ) + ... + λ111 Pkm (t )) + ( µ1 PH 2O IND (t ) + µ 2 PU 220V (t ) + .... + µ11 PTHE (t )) dt d d
d
PH 2O
IND
(t )
dt
= λ1 PKM (t )
PU 220V IND (t ) = λ 2 PKM (t ) dt Pp s dt
= λ 3 PKM (t )
dn = λ 4. f dt
( PKM(t) Ù f , symboliek-aanpassing zie pagina 4 )
dh = λ 5. f dt
do = λ9 . f dt
di = λ 6. f dt
dk = λ10 . f dt
dq = λ 7. f dt
dj = λ11 . f dt
dp = λ 8. f dt
Kurt Lintermans
Om dit differentiaalvergelijkingenstelsel op te lossen, kunnen de kansen PKM(t),…PTHE(t) berekend worden door aan te nemen dat op tijdstip t=0 het systeem in state KM_PROD = OK is ⇒ PKM(0) = 1, PU220V(0)= ↵, …, PTHE (0) = 0↵ Uitwerking Vooraleer werd besloten om de DV-stelsels uit te rekenen heb ik overleg gepleegd met Geert Dekoninck omtrent de theorie,deze is nogal complex en in de desbetreffende norm IEC 1165 “Application of Markov techniques” staat bitter weinig vermeld over het toepassen ,men is haast verplicht om bijkomende bronnen te raadplegen. Hier ziet u wat wij besproken hebben.
Uw KENMERK GD/gd/20001201
Oostende, 2000-12-01
Markovdiagramma koffiemachine Er zitten een paar redeneringsfouten bij het opstellen van het toestandsdiagramma (STD). 1.
In het STD moet elke ‘place’ exact 1 toestand voorstellen. Dit is in jouw document niet het geval: zo stelt bijvoorbeeld VWE2 2 toestanden voor . (een eerste waarbij VWE2 gefaald is, en een tweede waarbij VWE2 en THE gefaald zijn). Een zelfde redenering geldt voor THV, VWE1, U220V, FUSE
Ok,dus een ‘place’ of ‘unit’ mag slechts twee mogelijke states hebben,werkend en gefaald. En ik zie dan niet in waarom VWE2 geen rechtstreekse pijl mag krijgen vanuit de volledig functionele toestand van het systeem. Zie in de norm IEC1165 op pagina 19 het voorbeeld waar dit wordt toegepast,er wordt een directe pijl getrokken naar state 2 vanuit de volledig functionele toestand in state 0 ,terwijl een ander pad loopt via state1. Ze schrijven hierbij “ in many cases,a direct catastrophic failure path from state 0 to state 2 has to be considered,and an arrow λ3 is written to represent it.This may represent the life of human beings,state0 is healthy state,state1 is ill state and state2 is death,a person can die without being ill first” In mijn voorbeeld ga ik er vanuit dat in het eerste geval , alhoewel de thermostaat gefaald heeft,er toch nog koffieproductie kan gebeuren zij het op een incorrecte manier,we bevinden ons dus in een failed state,het kan nu ook zijn dat doordat de thermostaat de temperatuur niet correct meer regelt,het verwarmingselement(2) ook faalt en we eveneens een failed state krijgen ,in beide gevallen hebben we dus in feite de toestand “ INC KP “ en dit werd dus door mij foutief beredeneerd,ik had ook voor THE een pijl moeten trekken naar INC KP. Maar hier treedt nog een bijkomende fout op;het type van herstel is afhankelijk van wat er in het verleden is opgetreden qua fout en dit druist in tegen de principes van de Markov-theorie (memoryless–property ) waar ik geen rekening mee hield. Analoge redenering voor voor thv, vwe1, u220v en de fuse.
Kurt Lintermans
2.
Als je vindt dat je systeem nog correct werkt als enkel de THE gefaald is,moet je vanuit THE ook pijlen trekken naar de andere toestanden. Het STD veronderstelt immers onafhankelijkheid van alle gebeurtenissen. Zo zou vanuit THE een pijl moeten vertrekken naar THV, VWE1, U220V enz. Een zelfde redenering geldt voor H2OIND, THV, VWE1, U220V, PS, enz. (en eigenlijk voor alle andere toestanden die verschillen van de gefaalde).
Nee het systeem werkt niet meer correct maar in een degraded state,waarvoor dus een pijl zou moeten getrokken worden naar de unit ‘INC KP’. Maar THE heeft enkel één mogelijke degraded state als gevolg ,zijnde VWE2 , waarom moeten daar dan de andere elementen in betrokken worden? Maar dit is waarschijnlijk waar ik verkeerd redeneer,aangezien ik stel dat foutieve state VWE2 een gevolg is van foutieve state THE en dus wél afhankelijk is. Analoge redenering voor voor H2O-ind, thv, vwe1, u220v ,ps , fuse ,enz.. 3.
Wat verstaat men exact onder de toestand E/INCKP? Is dit een gefaald systeem (dit betekent volgens mij een systeem dat niet volgens de specs functioneert, en dus minstens 1 defect niet-redundant onderdeel heeft)? Zo ja,dan is bijvoorbeeld THE ook element van INCKP.
”INC KP” is een combinatie van gefaalde states ,zoals temperatuur niet op gewenste niveau,verlies van water,verlies van koffie,THE moet inderdaad tot INC KP behoren. 4.
Als men common cause oorzaken wil voorstellen (zoals een falende thermostaat die de uitvalsgraad van VWE2 verhoogt), teken dan direct de pijl naar de (unieke) eindtoestand met bijbehorende λ voor die situatie.
Met de falende status zijnde zowel falende thermostaat én falende VWE2. 5.
Ik zou het volgende STD opstellen om de beschikbaarheid A(t) te bepalen:
Dit geeft het volgende stelsel vergelijkingen :
Kurt Lintermans
Figuur : STD systeem KM
µ PW (t ) PW (t + ∆t ) 1 − λ P (t + ∆t ) = λ 1 − µ PF (t ) F Met λ = Som(λi) en μ = Som(μi). Dit is gemakkelijk op te lossen als:
PW (t ) =
µ λ + e −( λ + µ )t λ+µ λ+µ
Om de betrouwbaarheid R(t) te bepalen stel je gewoon μ=0. _________________________________________________ Jouw voorstel van STD is eigenlijk wat ik eerst had uitgedacht ,hetzelfde lineair systeem. Als er iets defect raakt , dan krijgen we als eerste transition state een failed state . Bij herstel keren we gewoon terug naar de functionele werking. Maar men ziet dan wel een aantal situaties over het hoofd , gedegradeerde states van het systeem ,bvb. het geval waarbij de thermostaat het laat afweten . Als oplossing zou men een aparte failed state F2 kunnen beschouwen voor het geval met de thermostaat , eveneens voor de andere gevallen ,gebroken koffiekan F3 ,gebroken dampgeleider F3 enz. Voor common-cause failures kunnen eveneens aparte failed states genoteerd worden, bvb. het geval waarbij zowel THE en VWE1 gefaald zijn F4. Verder ,als we de waarschijnlijkheid willen nagaan dat ons systeem beschikbaar is m.b.v. de vgl.
PW (t ) =
µ λ + e −( λ + µ )t λ+µ λ+µ
dan reduceert PW(t) voor steady-state operation tot de eerste term,wat we terugvinden in de RBD-methode als oplossing voor de availability-analyse. Voor reliability μ=0 stellen , stemt de oplossing voor totale betrouwbaarheid van het systeem eveneens exact overeen met dat gevonden bij de RBD-analyse , op voorwaarde dat λ <> 0 voor PW( ∞). Besluit Na enig denkwerk en overleg reduceert het schema van het systeem toch zoals in allereerste instantie werd aangenomen. Als resultaat voor de beschikbaarheid en betrouwbaarheid van het systeem vinden we dezelfde resultaten terug als bij de RBD-methode. Er wordt dus nogmaals bewezen dat het systeem erg goed scoort voor A(t) en R(t). De kracht van een Markov-analyse werd hier echter niet benut , bij een redunant systeem of als prioriteiten gelden bij herstelgebeurtenissen blijkt pas het nut bij het toepassen van deze methode.
Kurt Lintermans