TECHNICKÁ UNIVERZITA V LIBERCI Fakulta mechatroniky, informatiky a mezioborových studií
Základní pojmy diagnostiky a statistických metod vyhodnocení
Učební text Ivan Jaksch
Liberec
2012
Materiál vznikl v rámci projektu ESF (CZ.1.07/2.2.00/07.0247) Reflexe požadavků průmyslu na výuku v oblasti automatického řízení a měření, KTERÝ JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM A STÁTNÍM ROZPOČTEM ČESKÉ REPUBLIKY
Základní pojmy diagnostiky a metod vyhodnocení Základní pojmy
1. Základní pojmy diagnostiky Diagnostika a diagnóza jsou odvozená slova od „dia-gnosis“, což v řeckém jazyce znamená „skrze poznání“. Diagnostické prostředky tvoří pro generovaní a vyhodnocování testů soubor technických zařízení a pracovních postupů pro analýzy a vyhodnocení stavu diagnostikovaného objektu. Pracovní postupy jsou různé diagnostické algoritmy včetně programového vybavení Diagnostický systém je systém tvořený diagnostickými prostředky, diagnostickým objektem a obsluhou. V lékařské diagnostice jsou důležité monitorovací systémy, kdy je pacient trvale připojen k monitorovacímu systému. Algoritmy diagnostikování se dělí na nezávislé tzv. kombinační a závislé – sekvenční. Při nezávislých testech je sled jednotlivých kroků testu nezávislý na výsledcích předcházejících kroků testu. Závislý algoritmus testu realizuje kroky testu v závislosti na výsledcích předcházejících kroků. Závislý test je mnohem méně časově náročný.
2. Funkční bloky lékařských elektronických diagnostických přístrojů Principiální schéma diagnostického systému je vidět na obr. 1. Snímačem jsou snímány odpovídající biosignály. Snímač převádí odpovídající biosignály na vhodnou elektrickou formu. Výstupní signály z elektrod jsou většinou na nízkých analogových úrovních. Je nutné jejich zesílení, filtrace digitalizace. To je provedeno v blocích zesilovače a analogově digitálního A/D převodníku. Při zpracování biosignálů se používá často složité matematické zpracování, číslicové fitrace aj., které jsou implementovány v signálových procesorech, mikroprocesorech, PC a dalších zařízeních. PC tvoří většinou řídící jednotku.
Obr. 1. Blokové schéma diagnostického přístroje
2
Základní pojmy diagnostiky a metod vyhodnocení Statistické metody
3. Základy statistických metod vyhodnocení 3.1 Pravděpodobnost, časové hodnocení Kritériem k hodnocení spolehlivosti je pravděpodobnostní charakter přístupu. Z této vlastnosti plyne, že spolehlivost systémů je určována nebo ovlivňována náhodnými jevy a činiteli. Proto ukazatele spolehlivosti mají náhodný charakter. Používaným aparátem je teorie pravděpodobnosti a matematická statistika. Dále budou popsány pouze ukazatele bezporuchovosti, které jsou nejvýznamnějšími parametry spolehlivosti. Zaveďme proměnnou ξ - doba do poruchy (náhodný okamžik vzniku poruchy), jejím definičním oborem je teoreticky <0,∞), prakticky se uvažuje <0,T>, kde ξ = t, t 0, ) resp. <0,T>, kde T je doba technického života objektu. Pravděpodobnost poruchy P(t) =F(t)= Pr(ξ t) v intervalu <0,T>
0 F(t)< 1
Pravděpodobnost bezporuchového provozu R(t) = 1- F(t) Hustota pravděpodobnosti poruch p(t) = dF(t) / dt Intenzita poruch λ(t) = p(t)/ R(t), (f(t)/ R(t)) Pozn: F(t) i P(t) jsou užívány. P(t) více v diagnostice, F(t) je obecnější. Současně musí platit že součet pravděpodobností bezporuchového chodu a pravděpodobnosti poruchy musí být roven jedné (100%) F(t)+R(t) = 1
3.2 Pravděpodobnost jako obecná, náhodná veličina Pravděpodobnost je kvantitativní měřítko naděje výskytu děje. Definice. (Klasická definice pravděpodobnosti): Nechť elementární jevy jsou všechny stejně pravděpodobné. Pak pravděpodobnost jevu A je podíl počtu příznivých jevů ke počtu všech elementárních jevů. Distribuční funkce F(x) , P(x) náhodné veličiny X, neklesající F(x)= P(X<x) Hustota pravděpodobnosti f(x) (p(x)) je derivací distribuční funkce f(x)= p(x) = dF(x)/dx
3
Základní pojmy diagnostiky a metod vyhodnocení Statistické metody
3.3 Měření distribuční funkce analogového procesu
Obr.2 Princip měření distribuční funkce z jedné realizace ergodického náhodného procesu
Měníme hodnotu x a odečítáme podle vztahu F ( x)
1 n ti Tm i1
3.4 Měření hustoty pravděpodobnosti analogového procesu
Obr.3 Princip měření hustoty pravděpodobnosti z jedné realizace ergodického náhodného procesu. Posunujeme okno Δx a odhad vypočteme dle vztahu
f ( xo )
t i
i
x .TM
U číslicových signálů je známý pojem histogram udávající hustotu pravděpodobnosti ve sloupcích
4
Základní pojmy diagnostiky a metod vyhodnocení Rozdělení náhodných veličin
4. Rozdělení náhodných veličin 4.1 Normální –Gausovo f ( x)
1 ( x )2 exp 2 2 2
a) různé střední hodnoty
různé rozptyly (plošší - větší rozptyl)
4.2 Rovnoměrné rozdělení f(x)= 1/(b-a) v intervalu
=0 mimo
5
Základní pojmy diagnostiky a metod vyhodnocení Rozdělení náhodných veličin
4.3 Exponenciální rozdělení (proměnnou čas) Pravděpodobnost poruchy P(t) = F(t)= 1− e-λt Hustota pravděpodobnosti poruch
Intenzita poruch λ(t) = f(t)/ R(t) =
5. Podmíněná pravděpodobnost: P(A/B) Pravděpodobnost jevu A podmíněná jevem B je relativní četnost jevu A, počítaná pouze z případů, kdy nastal jev B.
Bayesův princip Bayesovské metody jsou ve statistice hojně používané. Ve stručnosti lze bayesovský přístup charakterizovat tak, že při odhadování nějaké pravděpodobnosti či při testování hypotéz vezmeme v potaz nejen data získaná právě provedeným pozorováním, ale i tzv. informace apriorní, tj. informace známe již před pokusem (ať už jde o informace získané nějakým dřívějším pozorováním, či o pouhou domněnku, odhad).
P(A) je dřívější pravděpodobnost nebo okrajová pravděpodobnost jevu A. To je “předchozí” v pocitu, že to nevezme v úvahu informace o B. P(A|B) je podmíněná pravděpodobnost A, daná jevem B(za předpokladu výskytu jevu B) To je také nazýváno pozdější pravděpodobností, protože to je odvozena nebo závisí na specifikované hodnotě B. P(B|A) je podmíněná pravděpodobnost jevu B daná jevem A.
6
Základní pojmy diagnostiky a metod vyhodnocení Podmíněná pravděpodobnost
P(B) je předchozí nebo okrajová pravděpodobnost B, a chová se jako konstanta normalizování. Definice pro k výskytů jevu B
Příklad: rakovina prsu
Na základě dlouhodobých četností předpokládejme, že pravděpodobnost toho, že klientka určité kliniky má rakovinu prsu, je p(R) = 0,01. Dále předpokládejme, že vstupní test má falešný pozitivní poměr roven p(pos/-R)=0,2 (tzn. 20% žen, které nemají rakovinu, budou chybně klasifikovány kladně), a falešný negativní poměr 0,1. Odtud vyplývá, že pravděpodobnost pozitivního výsledku testu za podmínky, že daná žena trpí rakovinou p(pos/R) je 0.9. Nyní předpokládejme, že jsme v roli ženy, která byla na této klinice testována s pozitivním výsledkem. Jaká je pravděpodobnost, že skutečně trpíme rakovinou prsu? - p(R/Pos) K výpočtu této pravděpodobnosti použijeme, jak již bylo zmíněno, Bayesova vzorce:
Rozdíl mezi 4% a 80 či 90% není rozhodně malý, zvláště pokud by důsledkem byla zbytečná léčba zdravého člověka, resp. ponechání neléčené rakoviny. Přesto je rozhodování u problémů podobné povahy v běžném životě často činěno jen intuitivně, bez „papíru a tužky“ – a tedy většinou chybně.
Pozn: Při výpočtu dvou základních parametrů časových řad tj. střední hodnoty a střední kvadratické odchylky σ resp. rozptylu σ2 je nutno použít dvou cyklů. V prvním se počítá střední hodnota a ve druhém rozptyl. Je však možno použít i pouze jeden cykl: Výpočet střední hodnoty a rozptylu (střední kvadratické odchylky) v jednom cyklu.
7
Základní pojmy diagnostiky a metod vyhodnocení
Poděkování: Tento text vznikl za podpory projektu ESF CZ.1.07/2.2.00/07.0247 Reflexe požadavků průmyslu na výuku v oblasti automatického řízení a měření.
8