´ UCEN ˇ ´I TECHNICKE ´ V BRNE ˇ VYSOKE BRNO UNIVERSITY OF TECHNOLOGY
ˇ YRSTV ´ ´I FAKULTA STROJN´IHO INZEN ´ USTAV MATEMATIKY FACULTY OF MECHANICAL ENGINEERING INSTITUTE OF MATHEMATICS
´ ANALYZA ´ ˇ STATISTICKA ROC KRIVEK STATISTICAL ANALYSIS OF ROC CURVES
´ PRACE ´ DIPLOMOVA MASTER’S THESIS ´ AUTOR PRACE AUTHOR
´ Bc. DAVID KUTALEK
´ VEDOUC´I PRACE SUPERVISOR
´ doc. RNDr. JAROSLAV MICHALEK CSc.
BRNO 2010
Abstrakt ROC kˇrivka (z anglick´eho Receiver Operating Characteristic curve) je zobrazen´ı dvou r˚ uzn´ ych distribuˇcn´ıch funkc´ı F0 a F1 , kde na osy se vyn´aˇs´ı hodnoty 1 − F0 (c) a 1 − F1 (c). Parametr c je re´aln´e ˇc´ıslo. Takto sestrojen´a kˇrivka se v posledn´ı dobˇe ˇcasto vyuˇz´ıv´a k posouzen´ı kvality diskriminaˇcn´ıho pravidla pro zaˇrazen´ı objektu do jedn´e ze dvou tˇr´ıd. Jako krit´erium pak slouˇz´ı velikost plochy pod ROC kˇrivkou. V re´aln´ ych u ´loh´ach se pak uplatˇ nuj´ı metody bodov´ ych a intervalov´ ych odhad˚ u ROC kˇrivek a testov´an´ı statistick´ ych hypot´ez o ROC kˇrivk´ach. Summary The ROC (Receiver Operating Characteristic) curve is a projection of two different cumulative distribution functions F0 and F1 . On axis are values 1 − F0 (c) and 1 − F1 (c). The c-parameter is a real number. This curve is useful to check quality of discriminant rule which classify an object to one of two classes. The criterion is a size of an area under the curve. To solve real problems we use point and interval estimation of ROC curves and statistical hypothesis tests about ROC curves. Kl´ıˇ cov´ a slova ROC kˇrivka, klasifikace objektu, plocha pod kˇrivkou, bodov´ y odhad, intervalov´ y odhad, test statistick´e hypot´ezy. Keywords ROC curve, object classification, area under curve, point estimation, interval estimation, statistical hypothesis test.
´ KUTALEK, D. Statistick´a anal´yza ROC kˇrivek. Brno: Vysok´e uˇcen´ı technick´e v Brnˇe, Fakulta strojn´ıho inˇzen´ yrstv´ı, 2010. 53 s. Vedouc´ı diplomov´e pr´ace doc. RNDr. Jaroslav Mich´alek, CSc.
Prohlaˇsuji, ˇze jsem diplomovou pr´aci Statistick´a anal´yza ROC kˇrivek. vypracoval samostatnˇe pod veden´ım doc. RNDr. Jaroslava Mich´alka CSc. s pouˇzit´ım materi´al˚ u uveden´ ych v seznamu literatury. David Kut´alek
Dˇekuji doc. RNDr. Jaroslavu Mich´alkovi CSc. za veden´ı m´e diplomov´e pr´ace. David Kut´alek
Obsah ´ 1 Uvod
3
2 Z´ akladn´ı pojmy 2.1 Teorie odhadu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Fisherova m´ıra informace . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Princip maxim´aln´ı vˇerohodnosti . . . . . . . . . . . . . . . . . . . . . . . .
4 5 6 6
3 Teoretick´ a konstrukce ROC kˇ rivky 8 3.1 Senzitivita a specificita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3.2 ROC kˇrivka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 3.3 Vlastnosti a parametry ROC kˇrivek . . . . . . . . . . . . . . . . . . . . . . 10 4 Bodov´ e odhady ROC kˇ rivky 4.1 Empirick´a ROC kˇrivka . . . . . . . . . . . . . . . . . . . . . . 4.2 Po ˇc´astech line´arn´ı ROC kˇrivka . . . . . . . . . . . . . . . . . 4.3 J´adrov´ y odhad senzitivity a specificity . . . . . . . . . . . . . 4.4 Binorm´aln´ı model . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Nejlepˇs´ı nestrann´ y odhad senzitivity a specificity binorm´aln´ıho
. . . . . . . . . . . . . . . . . . . . modelu
. . . . .
. . . . .
15 15 15 16 17 18
5 Intervalov´ e odhady 20 5.1 Pointwise confidence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 5.2 Simult´ann´ı sdruˇzen´a oblast . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 6 Plocha pod ROC kˇ rivkou - AUC 23 6.1 Lichobˇeˇzn´ıkov´e pravidlo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 6.2 Plocha a parci´aln´ı plocha pod kˇrivkou binorm´aln´ıho modelu . . . . . . . . 23 6.3 Testy hypot´ez o AUC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 7 Volba optim´ aln´ı klasifikaˇ cn´ı meze
25
8 Srovn´ an´ı dvou ROC kˇ rivek 28 8.1 Testy odliˇsnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 8.2 Test ekvivalence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 9 Ordin´ aln´ı data 30 9.1 Empirick´a ROC kˇrivka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 9.2 Parametric´ y model aproximace hladkou kˇrivkou . . . . . . . . . . . . . . . 30 10 Simulaˇ cn´ı studie 32 10.1 Bodov´e odhady ROC kˇrivky . . . . . . . . . . . . . . . . . . . . . . . . . . 32 10.2 Intervalov´e odhady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 10.3 Youden index a optim´aln´ı c . . . . . . . . . . . . . . . . . . . . . . . . . . 37 11 Z´ avˇ er
41
12 Seznam pouˇ zit´ ych zkratek a symbol˚ u
45
13 Seznam pˇ r´ıloh
47 1
14 pˇ r´ılohy
49
2
1
´ Uvod
ROC kˇrivky (z anglick´eho RECEIVER OPERATING CHARACTERISTIC CURVE ) pouˇz´ıv´ame pˇri rozˇrazen´ı objekt˚ u do dvou tˇr´ıd, pˇriˇcemˇz v´ıme, ˇze dan´ y objekt patˇr´ı pr´avˇe do jedn´e z nich. Plocha pod kˇrivkou pak ud´av´a kvalitu rozhodovac´ıho krit´eria. Poprv´e byly vyuˇzity k vojensk´ ym u ´ˇcel˚ um. Bˇehem II. svˇetov´e v´alky slouˇzily pˇri anal´ yze radarov´ ych sign´al˚ u, kdy bylo tˇreba rozliˇsit vlastn´ı vzduˇsn´e s´ıly a nepˇr´ıtele. Odtud vzniklo oznaˇcen´ı ROC. Od pades´at´ ych let pak nach´az´ı uplatnˇen´ı v medic´ınˇe pˇri vyhodnocen´ı testov´an´ı nov´ ych l´ek˚ u a v diagnostice. Dnes se optimalizace klasifikace pomoc´ı ROC kˇrivek pouˇz´ıv´a v ˇradˇe obor˚ u. Znaˇcnˇe rychle se rozv´ıjej´ı metody umoˇzn ˇuj´ıc´ı prov´adˇet statistickou anal´ yzu re´aln´ ych populac´ı pomoc´ı ROC kˇrivek. V mnoh´ ych situac´ıch chyb´ı srovn´an´ı jednotliv´ ych metod, popis jejich statistick´ ych vlastnost´ı a mnohdy nen´ı k dispozici odpov´ıdaj´ıc´ı program´atorsk´e z´azem´ı pro v´ ypoˇcet odhad˚ u a pro proveden´ı pˇr´ısluˇsn´ ych statistick´ ych test˚ u. C´ılem t´eto pr´ace bude popsat statistick´e metody pro stanoven´ı bodov´eho a intervalov´eho odhadu ROC kˇrivky v dan´em bodˇe, metody pro odhad plochy pod ROC kˇrivkou a odhad optim´aln´ı diagnostick´e klasifikaˇcn´ı meze. D´ale budou pops´any statistick´e testy pro testov´an´ı hypot´ez o vlastnostech dan´e ROC kˇrivky a testy pro srovn´an´ı dvou ROC kˇrivek. V´ ystupem t´eto pr´ace bude tak´e poˇc´ıtaˇcov´a implementace jednotliv´ ych metod v prostˇred´ı MATLAB.
3
2
Z´ akladn´ı pojmy
V t´eto kapitole budou uvedeny z´akladn´ı pojmy, oznaˇcen´ı a poznatky z teorie odhadu a testov´an´ı statistick´ ych hypot´ez a to v souladu s [1]. Tyto budou d´ale vyuˇzity pro popis vlastnost´ı ROC kˇrivek a k jejich vz´ajemn´emu srovn´an´ı. Oznaˇcme ω v´ ysledek n´ahodn´eho pokusu nebo dˇeje, tento naz´ yv´ame element´arn´ı jev. Mnoˇzinu vˇsech element´arn´ıch jev˚ u znaˇc´ıme Ω a naz´ yv´ame ji prostor element´arn´ıch jev˚ u. Mˇejme syst´em podmnoˇzin Ω tvoˇr´ıc´ı σ-algebru A. Pak tyto podmnoˇziny naz´ yv´ame n´ahodn´e jevy. Jednotliv´ ym mnoˇzin´am patˇr´ıc´ım do A pak pˇripisujeme pravdˇepodobnostn´ı m´ıru P . Trojice (Ω, A, P ) se naz´ yv´a pravdˇepodobnostn´ı prostor. Definice 2.1. Necht’ (Ω, A, P ) je pravdˇepodobnostn´ı prostor. D´ale necht’ R je mnoˇzina re´aln´ ych ˇc´ısel a B syst´em jej´ıch borelovsk´ ych mnoˇzin. Mˇeˇritelnou funkci X : (Ω, A) → (R, B) nazveme n´ahodnou veliˇcinou. Definice 2.2. Oznaˇcme Q(B) pravdˇepodobnost, ˇze n´ahodn´a veliˇcina X n´aleˇz´ı do mnoˇziny B z B (tedy Q(B) = P {X ∈ B}, B ∈ B). M´ıra Q se naz´ yv´a indukovan´a m´ıra nebo tak´e rozdˇelen´ı pravdˇepodobnosti n´ahodn´e veliˇciny X. Zvol´ıme-li konkr´etnˇe B = (−∞, x), dost´av´ame Q(B) = P {X < x} = F (x). Funkce F (x) se naz´ yv´a distribuˇcn´ı funkce. Existuje-li takov´a funkce f (x), ˇze Zx F (x) =
f (t)dt, −∞
pak se jedn´a o spojit´e rozdˇelen´ı pravdˇepodobnosti s hustotou f . Definice 2.3. Mˇeˇriteln´e zobrazen´ı X : (Ω, A) → (Rn , Bn ), kde Rn je n-rozmˇern´ y euklidovsk´ y prostor a Bn syst´em jeho borelovsk´ ych podmnoˇzin, naz´ yv´ame n´ahodn´y vektor. (Jin´ ymi slovy jde o vektor n´ahodn´ ych veliˇcin X = (X1 , . . . , Xn )0 definovan´ ych na t´emˇze pravdˇepodobnostn´ım prostoru.) Definice 2.4. N´ahodn´e veliˇciny X1 , . . . , Xn se naz´ yvaj´ı nez´avisl´e, plat´ı-li pro libovoln´e borelovsk´e mnoˇziny vztah ! n n \ Y P {ω : Xk (ω) ∈ Bk } = P {ω : Xk (ω) ∈ Bk }. k=1
k=1
Pozn´amka. Vol´ıme-li konkr´etn´ı borelovsk´e mnoˇziny Bk = (−∞, xk ), pak X1 , . . . , Xn jsou nez´avisl´e, pr´avˇe tehdy, pokud sdruˇzen´a distribuˇcn´ı funkce F je rovna souˇcinu margin´aln´ıch distribuˇcn´ıch funkc´ı Fi , i = 1, . . . , n. F (x1 , . . . , xn ) = P (X1 < x1 , . . . , Xn < xn ) = = P (X1 < x1 ) · · · P (Xn < xn ) = F1 (x1 ) · · · Fn (xn ). 4
Definice 2.5. Uspoˇra´dan´a n-tice nez´avisl´ ych, stejnˇe rozdˇelen´ ych n´ahodn´ ych veliˇcin X1 , . . . , Xn se naz´ yv´a n´ahodn´y v´ybˇer o rozsahu n. Plat´ı-li X1 ≤ X2 ≤ · · · ≤ Xn nazveme tento n´ahodn´ y v´ ybˇer uspoˇr´adan´y a znaˇc´ıme jej X(1) , . . . , X(n) .
2.1
Teorie odhadu
Pˇredpokl´adejme, ˇze n´ahodn´ y vektor X = (X1 , . . . , Xn )0 m´a hustotu f (x, θ) vzhledem k σ-koneˇcn´e m´ıˇre µ. Parametr θ = (θ1 , . . . , θm )0 je nezn´am´ y. C´ılem je z´ıskat na z´akladˇe vektoru X co nejlepˇs´ı odhad vektoru θ. Hled´ame-li mˇeˇriteln´e zobrazen´ı g : (Rn , Bn ) → (Rm , Bm ) takov´e, ˇze n´ahodn´ y vektor T = g(X) co moˇzn´a nejl´epe aproximuje hodnotu θ, pak se jedn´a o bodov´y odhad parametru θ. Jestliˇze hled´ame interval nebo jinou vhodnou mnoˇzinu do kter´e s dostateˇcnˇe velkou pravdˇepodobnost´ı θ n´aleˇz´ı, dost´av´ame intervalov´y odhad. ˇ Definice 2.6. Rekneme, ˇze odhad T parametru θ je 1. nestrann´y, plat´ı-li ET = θ pro kaˇzd´e θ ∈ Θ. 2. vych´ylen´y, jestliˇze ET = θ + b(θ) a funkce b nen´ı identicky rovna nule, b(θ) se naz´ yv´a vych´ylen´ı odhadu T . 3. nejlepˇs´ı nestrann´y, je-li rozptyl nestrann´eho odhadu T nejmenˇs´ı z rozptyl˚ u vˇsech nestrann´ ych odhad˚ u t´ehoˇz parametru θ. Definice 2.7. Necht’ X1 , . . . , Xn je n´ahodn´ y v´ ybˇer z rozdˇelen´ı Q, z´avisl´eho na jednoˇ rozmˇern´em parametru θ. Rekneme, ˇze odhad Tn = gn (X1 , . . . , Xn ) je konsistentn´ı, jestliˇze Tn → θ podle pravdˇepodobnosti pˇri n → ∞. Vˇ eta 2.8. Necht’ stˇredn´ı hodnota ETn2 < ∞ pro kaˇzd´e pˇrirozen´e n. Jestliˇze stˇredn´ı hodnota ETn → θ a rozptyl varTn → 0, pak Tn je konsistentn´ı odhad parametru θ. D˚ ukaz: Pro kaˇzd´e ε > 0 plat´ı P (|Tn − θ| > ε) = P (|Tn − ETn + ETn − θ| > ε) ≤ ≤ P |Tn − ETn | > 2ε ∨ |ETn − θ| > 2ε ≤ ≤ P |Tn − ETn | > 2ε + P |ETn − θ| > 2ε . Jestliˇze ETn → θ, pak pro n → ∞: P |ETn − θ| > 2ε → 0. ˇ Podle Cebysevovy nerovnosti ε varTn P |Tn − ETn | > ≤ . ε 2 2
2
Za pˇredpokladu varTn → 0 pro n → ∞ i tato pravdˇepodobnost konverguje k nule. Dok´azali jsme tedy, ˇze P (|Tn − θ| > ε) → 0. 2
5
2.2
Fisherova m´ıra informace
Nyn´ı zavedeme Fisherovu m´ıru informace o parametru θ obsaˇzenou v n´ahodn´em vektoru X. Definice 2.9. Necht’ n´ahodn´ y vektor X = (X1 , . . . , Xn )0 m´a hustotu f (x, θ) vzhledem k nˇejak´e σ-koneˇcn´e m´ıˇre µ. Pˇredpokl´adejme, ˇze plat´ı: • Ω je nepr´azdn´a, otevˇren´a mnoˇzina. • Mnoˇzina M = {x : f (x, θ) > 0} nez´avis´ı na θ. • Pro skoro vˇsechna x ∈ M (vzhledem k µ) existuje koneˇcn´a parci´aln´ı derivace fi0 (x, θ) =
∂f (x, θ) . ∂θ
• Pro vˇsechna θ ∈ Ω plat´ı Z
f 0 (x, θ)dµ(x) = 0
M
. • Integr´al
Z Jn (θ) =
f 0 (x, θ) f (x, θ)dµ(x) f (x, θ)
M
je koneˇcn´ y a kladn´ y. Pak se syst´em hustot {f (x, θ), θ ∈ Ω} naz´ yv´a regul´arn´ı a J n (θ) se naz´ yv´a Fisherova m´ıra informace.
2.3
Princip maxim´ aln´ı vˇ erohodnosti
Necht’ n´ahodn´ y vektor X = (X1 , . . . , Xn )0 m´a hustotu f (x, θ), kde θ ∈ ω. Pˇri pevn´e hodnotˇe x se funkce f (x, θ) naz´ yv´a vˇerohodnostn´ı funkce. Budeme uvaˇzovat pˇr´ıpad, kdy X1 , . . . , Xn je n´ahodn´ y v´ ybˇer. Hodnotu θˆ parametru θ, maximalizuj´ıc´ı vˇerohodnostn´ı funkci f (x, θ), pak nazveme maxim´alnˇe vˇerohodn´y odhad parametru θ. Mˇejme funkci L(x, θ) = ln f (x, θ). Tato funkce se pro pevn´a x naz´ yv´a logaritmick´ a vˇerohodnostn´ı funkce. Kasick´ y postup hled´an´ı maxima L pomoc´ı jej´ı derivace vede k nalezen´ı maxim´alnˇe vˇerohodn´eho odhadu, kter´ y konverguje ke skuteˇcn´e hodnotˇe parametru θ. A to s pravdˇepodobnost´ı bl´ıˇz´ıc´ı se k jedn´e. D˚ ukaz viz. [1]. Necht’ θ0 je skuteˇcn´a hodnota parametru θ. Hled´ame tedy koˇren θˆn = θˆn (X) vˇerohodnostn´ı rovnice ∂L(X, θ) =0 ∂θ takov´ y, ˇze |θˆn − θ0 | < , pro kaˇzd´e > 0. Vˇ eta 2.10. Necht’ f (x, θ), θ ∈ Θ je regul´arn´ı syst´em hustot s Fisherovou m´ırou informace J(θ). Necht’ jsou splnˇeny n´asleduj´ıc´ı pˇredpoklady: 6
(p1) Θ je parametrick´ y prostor, kter´ y obsahuje takov´ y nepr´azdn´ y otevˇren´ y interval ω, ˇze θ0 ∈ ω (p2) X = (X1 , . . . , Xn )0 , kde Xi jsou nez´avisl´e stejnˇe rozdˇelen´e n´ahodn´e veliˇciny s hustotou f (x, θ) vzhledem k nˇejak´e σ-koneˇcn´e m´ıˇre µ. (p3) M = {x : f (x, θ) > 0} nez´avis´ı na θ. (p4) Necht’ θ1 , θ2 ∈ Ω. Pak f (x, θ1 ) = f (x, θ2 ) skoro vˇsude pr´avˇe tehdy, kdyˇz θ1 = θ2 . (p5) Pro vˇsechna θ ∈ ω a skoro vˇsechna x ∈ M existuje derivace f 000 (x, θ) =
∂ 3 f (x, θ) ∂θ3
. (p6) Pro vˇsechna θ ∈ ω plat´ı: Z
f 00 (x, θ)dµ(x) = 0.
M
(p7) Existuje takov´a nez´aporn´a mˇeˇriteln´a funkce H(x), ˇze stˇredn´ı hodnota Eθ0 H(X) < ∞ a pˇritom pro skoro vˇsechna x ∈ M a pro vˇsechna θ takov´a, ˇze |θ − θ0 | < pro dostateˇcnˇe mal´e > 0 plat´ı: 3 ∂ ln f (x, θ) ≤ H(x). ∂θ3 Pak plat´ı n´asleduj´ıc´ı tvrzen´ı: (i) Jestliˇze n → ∞, pak 1 √ L0 (θ0 ) * N [0, J(θ)] n (ii) Existuje-li dostateˇcnˇe velk´e n a pro kaˇzdou hodnotu X takov´ y koˇren θˆn vˇerohodnostn´ı ˆ rovnice, ˇze θn je konsistentn´ım odhadem parametru θ0 , pak √ 1 ˆ n(θn − θ0 ) * N 0, . J(θ) Na z´akladˇe poznatk˚ u o maxim´alnˇe vˇerohodn´ ych odhadech lze pak prov´adˇet asymptotick´e testy statistick´ ych hypot´ez. Vˇ eta 2.11. Necht’ jsou splnˇeny vˇsechny pˇredpoklady vˇety 2.10. Oznaˇcme [L0 (θ0 )]2 LM (θ0 ) = , nJ(θ0 ) L0 (θ0 ) ULM = p . nJ(θ0 ) Pak ULM m´a asymptoticky rozdˇelen´ı N(0,1) a LM m´a asymptoticky χ2 rozdˇelen´ı pravdˇepodobnosti s jedn´ım stupnˇem volnosti. 7
3
Teoretick´ a konstrukce ROC kˇ rivky
V tomho odd´ılu budou uvedeny z´akladn´ı poznatky z teorie vyuˇzit´ı ROC kˇrivek pˇri klasifikaci objekt˚ u, vlastnosti ROC kˇrivek a pˇr´ıklady jejich konstrukce pro norm´aln´ı a nˇekter´a dalˇs´ı rozdˇelen´ı pravdˇepodobnosti.
3.1
Senzitivita a specificita
Uvaˇzujme diagnostick´ y test, kter´ y m´a urˇcit zda sledovan´ y objekt m´a urˇcitou vlastnost D. Pˇredpokl´adejme, ˇze kaˇzd´ y objekt n´aleˇz´ı pr´avˇe do jedn´e ze dvou skupin π1 , π0 . Jestliˇze m´a danou vlastnost (D = 1), pak n´aleˇz´ı do skupiny π1 . Naopak pokud tuto vlastnost nem´a (D = 0), n´aleˇz´ı do skupiny π0 . D je n´ahodn´a veliˇcina s alternativn´ım rozdˇelen´ım pravdˇepodobnosti. Oznaˇcme n´ahodnou veliˇcinu T , v´ ysledek testu. Klasifikaci objektu (odhad pˇr´ısluˇsnosti k dan´e skupinˇe) provedeme na z´akladˇe srovn´an´ı v´ ysledku testu T s danou mez´ı c. Je-li T ≥ c klasifikujeme objekt jako prvek skupiny π1 a ˇrekneme, ˇze klasifikace je pozitivn´ı. Je-li T < c klasifikujeme objekt jako prvek skupiny π0 a ˇrekneme, ˇze klasifikace je negativn´ı. Oznaˇcen´ı mezn´ı hodnoty c vych´az´ı z anglick´eho v´ yrazu(cut-off point). Definice 3.12. Pro danou hodnotu klasifikaˇcn´ı meze c definujeme senzitivitu testu jako podm´ınˇenou pravdˇepodobnost, ˇze v´ ysledek testu T objektu ze skupiny π1 je vˇetˇs´ı nebo roven c. Se(c) = P (T ≥ c|D = 1) = 1 − P (T < c|D = 1). (3.1) Dost´av´ame tedy pravdˇepodobnost spr´avnˇe urˇcen´e pozitivn´ı klasifikace. Mˇejme nyn´ı n´ahodnou veliˇcinu T1 , v´ ysledek testu ve skupinˇe π1 , s distribuˇcn´ı funkc´ı F1 a hustotou f1 . Pak z´ısk´av´ame ekvivalentn´ı vyj´adˇren´ı senzitivity ve tvaru: Se(c) = 1 − P (T < c|D = 1) = 1 − P (T1 < c) = 1 − F1 (c).
(3.2)
Definice 3.13. Pro danou hodnotu klasifikaˇcn´ı meze c definujeme specificitu testu jako podm´ınˇenou pravdˇepodobnost, ˇze v´ ysledek testu T objektu ze skupiny π0 je menˇs´ı neˇz c. Sp(c) = P (T < c|D = 0). (3.3) Tedy pravdˇepodobnost spr´avnˇe urˇcen´e negativn´ı klasifikace. Nyn´ı oznaˇcme n´ahodnou veliˇcinu T0 , v´ ysledek testu ve skupinˇe π0 . Pak z´ısk´av´ame ekvivalentn´ı vyj´adˇren´ı specificity pomoc´ı distribuˇcn´ı funkce F0 n´ahodn´e veliˇciny T0 : Sp(c) = P (T < c|D = 0) = P (T0 < c) = F0 (c).
(3.4)
Senzitivita a specificita jsou z´akladn´ımi vlastnostmi testu. Jejich doplˇ nky pak ud´avaj´ı pravdˇepodobnosti chybn´e klasifikace. Zvol´ıme-li chybnˇe negativn´ı klasifikaci, dopouˇst´ıme se chyby prvn´ıho druhu a to s pravdˇepodobnost´ı 1 − Se. Zvol´ıme-li chybnˇe pozitivn´ı klasifikaci, dopouˇst´ıme se chyby druh´eho druhu a to s pravdˇepodobnost´ı 1 − Sp.
8
3.2
ROC kˇ rivka
V n´asleduj´ıc´ım textu se dost´av´ame k zaveden´ı pojmu ROC kˇrivky. Provedeme teoretickou konstrukci kˇrivky jako funkce distribuˇcn´ıch funkc´ı F1 a F0 . Na pˇr´ıkladech pak uk´aˇzeme vlastnosti ROC kˇrivek a geometrick´ y v´ yznam senzitivity a specificity. Definice 3.14. ROC kˇrivku definujeme jako mnoˇzinu bod˚ u dan´ ych souˇradnicemi [1 − Sp(c), Se(c)],
c ∈ (−∞, ∞).
(3.5)
Jestliˇze podle vztah˚ u (2.2) a (2.4) F1 (c) = 1 − Se(c), F0 (c) = Sp(c),
(3.6)
pak za pˇredpokladu existence inverzn´ı distribuˇcn´ı funkce F0−1 lze ROC kˇrivku vyj´adˇrit vz´avislosti na parametru t. Poloˇz´ıme t = 1 − Sp(c) = 1 − F0 (c),
pak c = F0−1 (1 − t),
Se(c) = 1 − F1 (c).
Dost´av´ame tedy ekvivalentn´ı vztah: ROC(t) = 1 − F1 (F0−1 (1 − t)),
pro t ∈ (0, 1).
(3.7)
Pˇ r´ıklad 3.15. Mˇejme pˇr´ıpad, kdy n´ahodn´a veliˇcina T0 m´a norm´aln´ı rozdˇelen´ı pravdˇepodobnosti s nulovou stˇredn´ı hodnotou a rozptylem rovn´ ym jedn´e - N (0, 1) a T1 m´a rozdˇelen´ı N (2, 1.5). Na obr´azku 1 je pro hustoty f0 a f1 zn´azornˇena senzitivita a specificita testu pˇri klasifikaci s mezn´ı hodnotou c.
Obr´azek 1: Senzitivita a specificita pro klasifikaˇcn´ı mez c.
9
3.3
Vlastnosti a parametry ROC kˇ rivek
Z tvaru z´ıskan´e ROC kˇrivky lze odhadnout rozliˇsovac´ı schopnost zkouman´eho testu. Jestliˇze kˇrivka nejprve prudce roste a pot´e je t´emˇeˇr konstantn´ı, pomˇer chybnˇe klasifikovan´ ych objekt˚ u bude mal´ y. Bude-li se kˇrivka bl´ıˇzit diagon´ale pomˇer chyb poroste. Pokud se hustoty f0 a f1 shoduj´ı, kˇrivka je totoˇzn´a s diagon´alou. Pravdˇepodobnosti spr´avn´e a chybn´e klasifikace se rovnaj´ı - obr´azek 2a. V ide´aln´ım pˇr´ıpadˇe, kdy test je schopen spr´avnˇe rozˇradit vˇsechny objekty, kˇrivka proch´az´ı bodem [1, 1] - obr´azek 2b. Pokud nastane pˇr´ıpad, kdy ˇz´adn´ y objekt nebyl zaˇrazen spr´avnˇe - obr´azek 2c, lze jej pˇrevr´acen´ım testovac´ıho kriteria pˇrev´est opˇet na ide´aln´ı stav.
Obr´azek 2: Extr´emn´ı pˇr´ıpady ROC kˇrivek. Vˇ eta 3.16. ROC kˇrivka je invariantn´ı vzhledem k monot´onn´ı rostouc´ı transformaci T0 ,T1 . D˚ ukaz: Necht’ h je monot´onn´ı rostouc´ı transformace takov´a, ˇze h : x0 → u, tj. u = h(x0 ), h : x1 → v, tj. v = h(x1 ). Oznaˇcme F0h (x0 ) = F0 (h−1 (x0 )) = P (T0 ≤ h−1 (x0 )), F1h (x1 ) = F1 (h−1 (x1 )) = P (T1 ≤ h−1 (x1 )), −1 ROCh (t) = 1 − 1 − F1h (F0h (1 − t)).
D´ale plat´ı −1 F0h (x0 ) = h(F0−1 (x0 )), −1 F1h (x1 ) = h(F1−1 (x1 )).
Je tˇreba dok´azat ROC(t) = ROCh (t).
10
Pak po dosazen´ı dost´av´ame −1 −1 ROCh (t) = 1 − F1h (F0h (1 − t)) = 1 − F1 (h−1 (F0h (1 − t))) =
= 1 − F1 (h−1 (h(F0−1 (1 − t)))) = 1 − F1 (F0−1 (1 − t)) = ROC(t). T´ımto je dan´a vlastnost dok´az´ana. 2 Vˇ eta 3.17. Je-li n´ahodn´a veliˇcina T1 stochasticky vˇetˇs´ı neˇz n´ahodn´a veliˇcina T0 , tedy kdyˇz F0 (c) ≥ F1 (c) pro vˇsechna c ∈ (−∞, ∞), pak ROC kˇrivka leˇz´ı nad diagon´alou v jednotkov´em ˇctverci. D˚ ukaz: Je-li F0 (x0 ) ≥ F1 (x1 ), pak za pˇredpokladu existence inverzn´ıch funkc´ı F0−1 (x0 ) ≤ F1−1 (x1 ). Potom pro t ∈ (0, 1) ROC(t) = 1 − F1 (F0−1 (1 − t)) ≥ 1 − F1 (F1−1 (1 − t)) = 1 − (1 − t) = t. Tedy ROC(t) ≥ t a kˇrivka leˇz´ı nad diagon´alou v jednotkov´em ˇctverci. 2 Vˇ eta 3.18. Kdyˇz hustoty f0 , f1 maj´ı monot´onn´ı vˇerohodnostn´ı pomˇer (tj. kdyˇz existuje statistika S takov´a, ˇze pod´ıl hustot f0 /f1 je neklesaj´ıc´ı funkc´ı statistiky S), pak ROC kˇrivka je konk´avn´ı. D˚ ukaz: V tomto bodˇe je tˇreba dok´azat, ˇze za dan´ ych pˇredpoklad˚ u je ROC kˇrivka konk´avn´ı. Tedy derivace ROC kˇrivky je klesaj´ıc´ı funkc´ı. Pˇredpokl´adejme existenci inverzn´ıch distribuˇcn´ıch funkc´ı a potˇrebn´ ych derivac´ı. Vypoˇcteme tedy ∂ROC(t) ∂(1 − F1 (F0−1 (1 − t))) ∂(F1 (F0−1 (1 − t))) ∂F0−1 (1 − t) = =− . ∂t ∂t ∂t ∂F0−1 (1 − t) ˇ Clen
∂(F1 (F0−1 (1 − t))) = f1 (F0−1 (1 − t)). ∂F0−1 (1 − t)
Oznaˇcme u = (1 − t), pak dost´av´ame ∂u = −1 tedy ∂u = −∂t. ∂t Pak plat´ı ∂F0−1 (1 − t) ∂F0−1 (u) =− . ∂t ∂u Necht’ w = F0−1 (u) ⇒ u = F0 (w), pak −
∂F0−1 (u) ∂w 1 1 =− = − ∂F0 (w) = − ⇒ ∂u ∂F0 (w) f0 (w) ∂w
11
∂F0−1 (1 − t) 1 ⇒− = . −1 ∂t f0 (F0 (1 − t)) Dosazen´ım z´ısk´av´ame vztah f1 (F0−1 (1 − t)) ∂ROC(t) = . ∂t f0 (F0−1 (1 − t)) Pro 0 < t1 < t2 < 1 plat´ı 1 − t1 > 1 − t2 , protoˇze F0−1 je rostouc´ı funkce F0−1 (1 − t1 ) > F0−1 (1 − t2 ). Maj´ı-li f0 a F1 neklesaj´ıc´ı vˇerohodnostn´ı pomˇer, tedy pro x1 < x2 f1 (x1 ) f1 (x2 ) ≤ , f0 (x1 ) f0 (x2 ) dost´av´ame
f1 (F0−1 (1 − t2 )) f1 (F0−1 (1 − t1 )) ≥ . f0 (F0−1 (1 − t1 )) f0 (F0−1 (1 − t2 ))
T´ım je tvrzen´ı dok´az´ano. 2 Vˇ eta 3.19. Plocha pod kˇrivkou je rovna pravdˇepodobnosti P (T0 < T1 ). Tedy Z1 AU C =
ROC(t)dt = P (T0 < T1 ).
(3.8)
0
D˚ ukaz: Z1
Z1 [1 −
ROC(t)dt = 0
F1 (F0−1 (1
0
Z∞
− t))]dt =
−∞
=
Z∞ Z∞ [1 − F1 (x0 )]f0 (x0 )dx0 =
=
substituce F0−1 (1 − t) = x0 1 − t = F0 (x0 ) t = 1 − F0 (x0 ) dt = −f0 (x0 )dx0
f1 (x1 )f0 (x0 )dx0 dx1 = P (T0 < T1 ). −∞ x0
2 Velikost plochy pod ROC kˇrivkou (zkratka AU C z anglick´eho area under curve) je jedn´ım z´akladn´ıch mˇeˇr´ıtek kvality diagnostick´eho testu. Protoˇze kˇrivka leˇz´ı v jednotkov´em ˇctverci, m˚ uˇze AU C obecnˇe nab´ yvat hodnot od 0 do 1. Splˇ nuje-li kˇrivka pˇredpoklad vˇety 3.17, leˇz´ı nad diagon´alou a nab´ yv´a tedy hodnot od 0, 5 do 1. Detailn´ımu popisu plochy pod ROC kˇrivkou bude vˇenov´ana kapitola 6. Tento parametr je vhodn´e vyuˇz´ıt tak´e ke srovn´an´ı nˇekolika test˚ u, v´ıce v kapitole 8.
12
Pˇ r´ıklad 3.20. Na obr´azku 3 jsou vykresleny pˇr´ıklady ROC kˇrivek, kdy n´ahodn´e veliˇciny T0 a T1 maj´ı a) norm´aln´ı, b) logaritmick´e norm´aln´ı, c) exponenci´aln´ı, d) beta rozdˇelen´ı pravdˇepodobnosti. (V popisu parametr˚ u T0 ≈T0 a T1 ≈T1.)
Obr´azek 3: Pˇr´ıklady ROC kˇrivek. Pˇ r´ıklad 3.21. Mˇejme pˇr´ıklad diagnostick´eho testu v medic´ınˇe. Bylo testov´ano 200 osob, pˇriˇcemˇz 120 z nich bylo nemocn´ ych (D = 1) a 80 zdrav´ ych (D = 0). V´ ysledky byly zaznamen´any do n´asleduj´ıc´ı tabulky.
13
Zdravotn´ı stav D=1 D=0 V´ ysledek
Nemocn´ y
92
9
testu
Zdrav´ y
28
71
Tabulka 1: Tabulka ˇcetnost´ı Tedy u 92 osob ze 120 test nemoc spr´avnˇe diagnostikoval, 9 oznaˇcil za nemocn´e, pˇrestoˇze byli zdrav´ı, u 71 zdrav´ ych pacient˚ u nemoc vylouˇcil a u 28 nemoc neodhalil, ikdyˇz pacient nemocn´ y byl. Nyn´ı do t´eˇze tabulky zaznamen´ame relativn´ı ˇcetnosti. Zdravotn´ı stav D=1 D=0 V´ ysledek
Nemocn´ y
0, 767
0, 113
testu
Zdrav´ y
0, 233
0, 887
Tabulka 2: Tabulka relativn´ıch ˇcetnost´ı Tento test tedy spr´avnˇe rozeznal nemoc u 76,7% nemocn´ ych pacient˚ u a vylouˇcil u 88,7% zdrav´ ych. Z´ıskali jsme tedy odhad senzitivity a specificity pouˇzit´eho testu ve tvaru pozorovan´ ych relativn´ıch ˇcetnost´ı.
14
4
Bodov´ e odhady ROC kˇ rivky
V n´asleduj´ıc´ı ˇca´sti budou pops´any statistick´e metody pro stanoven´ı hodnoty ROC kˇrivky v dan´em bodˇe. Pˇri neparametrick´em pˇr´ıstupu p˚ ujde o konstrukci empirick´e ROC kˇrivky, po ˇc´astech line´arn´ı kˇrivky a metodu zaloˇzenou na j´adrov´ ych odhadech distribuˇcn´ıch funkc´ı. D´ale pak zavedeme binorm´aln´ı model a provedeme odhad jeho parametr˚ u.
4.1
Empirick´ a ROC kˇ rivka
Jako prvn´ı neparametrick´ y bodov´ y odhad ROC kˇrivky uvedeme metodu zaloˇzenou na nestrann´em odhadu distribuˇcn´ı funkce v´ ybˇerovou distribuˇcn´ı funkc´ı. Definice 4.22. Necht’ X1 , . . . , Xn je n´ahodn´ y v´ ybˇer z rozdˇelen´ı o dostribuˇcn´ı funkci F (x). Necht’ IA je indik´ator jevu A, tj. IA = 1 jestliˇze jev A nastane, jinak IA = 0. Pak definujeme v´ ybˇerovou distribuˇcn´ı funkci vztahem: n
1X I[Xi ≤x] . Fbe (x) = n i=1
(4.9)
Oznaˇcme T01 , . . . , T0n n´ahodn´ y v´ ybˇer z rozdˇelen´ı o distribuˇcn´ı funkci F0 a T11 , . . . , T1m n´ahodn´ y v´ ybˇer z rozdˇelen´ı o dostribuˇcn´ı funkci F1 , Fbe0 , Fbe1 odhady distribuˇcn´ıch func´ı F0 , F1 dan´e vztahem 4.9. Pak parametrick´e zobrazen´ı [1 − Fbe0 , 1 − Fbe1 ] naz´ yv´ame empirick´ a ROC kˇrivka.
4.2
Po ˇ c´ astech line´ arn´ı ROC kˇ rivka
Dalˇs´ı moˇznost´ı zaloˇzenou na neparametrick´em odhadu F0 a F1 je konstrukce po ˇc´astech line´arn´ı ROC kˇrivky. Definice 4.23. X(1) , . . . , X(m) je uspoˇr´adan´ y n´ahodn´ y v´ ybˇer z rozdˇelen´ı o distribuˇcn´ı ’ funkci F(x).Necht stˇredy interval˚ u (X(i) , X(i+1) ) jsou ci =
c0 =
X(i+1) + X(i) pro i = 1, . . . , m − 1, 2
3X(1) − X(2) 3X(m) − X(m−1) , cm = . 2 2
D´ale necht’ fl (x) = (m(ci+1 − ci ))−1 ,
x ∈ hci , ci+1 ),
i = 1, . . . , m − 1,
jinak f (x) = 0. Pak po ˇca´stech line´arn´ı odhad distribuˇcn´ı funkce F (x) je definov´an vztahem Zx Fbl (x) = fl (t)dt. (4.10) −∞
Oznaˇcme nyn´ı T0(1) , . . . , T0(n) uspoˇra´d´an´ y n´ahodn´ y v´ ybˇer z rozdˇelen´ı o distribuˇcn´ı funkci F0 a T1(1) , . . . , T1(m) uspoˇra´dan´ y n´ahodn´ y v´ ybˇer z rozdˇelen´ı o dostribuˇcn´ı funkci F1 , Fbl0 , Fbl1 odhady distribuˇcn´ıch func´ı F0 , F1 dan´e vztahem 4.10. Pak parametrick´e zobrazen´ı [1 − Fbl0 , 1 − Fbl1 ] naz´ yv´ame po ˇc´astech line´arn´ı ROC kˇrivka. 15
4.3
J´ adrov´ y odhad senzitivity a specificity
V´ yhodou t´eto metody proti pˇredchoz´ım je, ˇze z´ısk´ame aproximaci ROC kˇrivky hladkou kˇrivkou. Pro vyj´adˇren´ı vyuˇzijeme j´adrov´ y odhad distribuˇcn´ı funkce autor˚ u Zhou, Hall, Shapiro, pops´an´ y v [11]. Definice 4.24. Necht’ funkce k : R → R splˇ nuje n´asleduj´ıc´ı podm´ınky: 1. nosiˇc supp(k) = h−1, 1i, tedy k(x) = 0, ∀x ∈ / h−1, 1i , 2. k je lipschitzovsky spojit´a na h−1, 1i , tj. |k(x) − k(y)| ≤ L|x − y|, L > 0, ∀x, y ∈ h−1, 1i , 3. integr´al
Z∞ k(x)dx = 1. −∞
Pak k nazveme j´adrovou funkc´ı zkr´acenˇe j´adrem. V´ yznamn´ ym faktorem ovlivˇ nuj´ıc´ım chov´an´ı j´adrov´ ych odhad˚ u je ˇs´ıˇrka vyhlazovac´ıho ok´enka h > 0. Transformac´ı 1 x kh = k h h pak dojde ke zmˇenˇe nosiˇce j´adra na interval h−h, hi. Necht’ X1 , . . . , Xn je n´ahodn´ y v´ ybˇer z rozdˇelen´ı o hustotˇe f (x). J´adrov´ y odhad t´eto hustoty je pak d´an vztahem: n
1 X fbk = k nh i=1
x − Xi h
s uˇz´ıtm j´adra s dvojn´asobnou v´ahou " 2 #2 x − Xi 15 x − Xi k = 1− , h 16 h
x ∈ (Xi − h, Xi + h),
kde k = 0 jinde a ˇs´ıˇrkou vyhlazovac´ıho okna √ h = 0, 9 min(SD, IQR/1, 34)/ 5 n, kde SD je smˇerodatn´a odchylka a IQR rozd´ıl 0,75-kvantilu a 0,25-kvantilu. Odhad distribuˇcn´ı funkce je pak definov´an jako: Fbk (t) =
n Z X
t
i=1 −∞
1 k nh
x − Xi h
dx.
Pˇri numerick´em v´ ypoˇctu nab´ yv´a integr´al ve vztahu pro v´ ypoˇcet Fbk (t) n´asleduj´ıc´ıch hodnot: je-li t > Xi + h, pak je integ´al roven nule, je-li c < Xi − h, pak je integ´al roven 1/n, je-li Xi − h < t < Xi + h, pak je integ´al roven kde v = (t − Xi )/h. 16
1 (8 16n
− 15v + 10v 3 − 3v 5 ),
V´ ysledn´a podoba kˇrivky je pak d´ana jako [1 − Fbk0 , 1 − Fbk1 ], kde Fbk0 , Fbk1 jsou j´adrov´e odhady distribun´ıch funkc´ı n´ahodn´ ych veliˇcin T0 , T1 .
4.4
Binorm´ aln´ı model
V t´eto ˇca´sti se budeme zab´ yvat situac´ı, kdy obˇe distribuˇcn´ı funkce maj´ı norm´aln´ı rozdˇelen´ı, takzvan´ ym binorm´aln´ım modelem. C´ılem bude nal´ezt odhad jeho parametr˚ u. Necht’ F0 (x) a F1 (x) definovan´e vztahy 3.6 jsou distribuˇcn´ı funkce norm´aln´ıho rozdˇelen´ı pravdˇepodobnosti. F0 (x) ∼ N (µ0 , σ02 ), F1 (x) ∼ N (µ1 , σ12 ) M˚ uˇzeme tedy poloˇzit ROC(t) = 1 − 1−Φ
F1 (F0−1 (1
− t)) = 1 − Φ
µ0 + σ0 Φ−1 (1 − t) − µ1 σ1
=1−Φ
F0−1 (1 − t) − µ1 σ1
=
σ0 −1 µ1 − µ0 Φ (1 − t) − σ1 σ1
.
kde Φ je distribuˇcn´ı funkce standadizovan´eho norm´aln´ıho rozdˇelen´ı. 0 a b = σσ01 . Dost´av´ame Oznaˇcme a = µ1σ−µ 1 ROC(t) = 1 − Φ(b Φ−1 (1 − t) − a), t ∈ h0, 1i .
(4.11)
Nyn´ı je potˇreba odhad nezn´am´ ych parametr˚ u a a b. Pokud jsou p˚ uvodn´ı data skuteˇcnˇe binorm´aln´ı je moˇzn´e pouˇz´ıt pro tento u ´ˇcel v´ ybˇerov´ y pr˚ umˇer a v´ ybˇerov´ y rozptyl n
1X Xi , µ b=X = n i=1 n
1 X σ b =S = (Xi − X)2 . n − 1 i=1 2
2
Odhad parametr˚ u je tedy d´an vztahy: X 1 − X 0 b S0 , b= . S1 S1 Pˇred pouˇzit´ım tohoto odhadu je potˇreba nejprve otestovat, zda jde o norm´aln´ı rozdˇelen´ı pravdˇepodobnosti. Pokud tomu tak nen´ı provedeme vhodnou transformaci dat (za pˇredpokladu ˇze takov´a transformace existuje). Jedna z moˇzn´ ych metod vyuˇz´ıv´a Box-Cox transformaci danou (yλ −1) λ λ 6= 0 t(y) = . ln(y) λ=0 b a=
Odhad parametru λ lze nal´ezt metodou maxim´aln´ı vˇerohodnosti nebo napˇr´ıklad pˇripouˇzit´ım software Matlab.
17
4.5
Nejlepˇ s´ı nestrann´ y odhad senzitivity a specificity binorm´ aln´ıho modelu
Tato metoda vyuˇz´ıv´a Kolmogorov˚ uv nejlepˇs´ı nestrann´ y odhad distribuˇcn´ı funkce vyj´adˇren´ y vztahy: 0 pro Q(x) ≤ −1 1 − 1 βQ2 (x) 1 , m − 1 pro − 1 < Q(x) ≤ 0 2 2 2 2 , FbK (x) = 1 1 1 m 2 (x) + β , − 1 pro 0 < Q(x) ≤ 1 Q 2 2 2 2 1 pro Q(x) > 1 kde Q(x) =
x−X √ m (m − 1)S
a funkce 1 βa (p, q) = β(p, q)
Za
tp−1 (1 − t)q−1 dt
0
je normovan´a ne´ upln´a beta funkce parametr˚ u a ∈ h0, 1i , p ≥ 0, q ≥ 0. D˚ ukaz ˇze jde o nejlepˇs´ı nestrann´ y odhad je uveden v [6]. Odhah senzitivity pak opˇet z´ısk´ame ve tvaru (1 − FbK1 (c)) a specificitu testu odhadneme pomoc´ı FbK0 (c). Pˇ r´ıklad 4.25. U pacient˚ u s poranˇen´ım hlavy byla 24 hodin po u ´razu mˇeˇrena hodnota isoenzymu CK-BB (creatine kinase-BB). Z 59 pacient˚ u se 19 plnˇe zotavilo a u zb´ yvaj´ıc´ıch 40 osob zanechal u ´raz trval´e n´asledky. Na z´akladˇe tohoto mˇeˇren´ı m´a b´ yt sestaven test, schopn´ y predikovat podle hladiny CK-BB n´asledn´ y v´ yvoj zotaven´ı. Oznaˇcme T0 hodnoty CK-BB u pacient˚ u, kteˇr´ı se plnˇe zotavili a T1 hladiny isoenzymu ve skupinˇe pacient˚ u s trval´ ymi n´asledky. Z´ıskan´e hodnoty jsou uvedeny v tabulce 3. Odhady ROC kˇrivky jsou vykresleny na obr´azku 4.
Bez 136 281 200 220 100 17 126 253 40 46
Hodnota CK-BB u pacient˚ u trval´ ych n´asledk˚ u S trval´ ymi n´asledky 286 140 1087 230 183 23 1256 700 16 800 146 253 740 126 153 96 283 90 303 193 60 73 1370 543 913 27 230 463 60 509 100 576 671 80 490 70 156 356 323 1560 6 120 216 443 523 76 303 353 206 Tabulka 3: Hodnoty CK-BB
18
Obr´azek 4: Odhady ROC kˇrivky. 19
Obr´azek 5: Srovn´an´ı jednotliv´ ych metod odhadu ROC kˇrivky. Na lev´em grafu obr´azku 5 pak vid´ıme porovn´an´ı j´adrov´eho odhadu (zelen´a), binorm´aln´ıho modelu (modˇre) a odhadu zaloˇzen´eho na nejlepˇs´ım nestrann´em odhadu Se a Sp (ˇcervenˇe). V prav´e ˇca´sti je pak srovn´an´ı empirick´e (modr´a) a po ˇc´astech line´arn´ı ROC kˇrivky (ˇcerven´a).
5
Intervalov´ e odhady
V t´eto ˇc´asti se budeme zab´ yvat urˇcen´ım hranic, mezi kter´ ymi se ROC kˇrivka s danou pravdˇepodobnost´ı nach´az´ı.
5.1
Pointwise confidence
M´ame tedy bodov´ y odhad binorm´aln´ıho mobelu ROC kˇrivky ROC(t) = 1 − Φ(bb Φ−1 (1 − t) − b a), d´ale lze urˇcit 100(1 − α)% interval spolehlivosti pro senzitivitu, kter´ y je d´an vztahem q −1 −1 b b a) , (5.12) 1 − Φ b Φ (1 − t) − b a ± z1−α/2 V ar(b Φ (1 − t) − b zde z1−α/2 = Φ−1 (1 − α/2), V ar(bb Φ−1 (1 − t) − b a) = V ar(bb)(Φ−1 (1 − t))2 + V ar(b a) − 2(Φ−1 (1 − t))Cov(b a, bb)). Z´ısk´av´ame 100(1 − α)% asymptotick´y interval spolehlivosti. Rozptyly b a a bb a kovarianci b a, bb odhadneme n1 (b a2 + 2) + 2n0bb2 Vd ar(b a) = , 2n0 n1 20
(n1 + n0 )bb2 , Vd ar(bb) = 2n0 n1 abb d a, bb) = b . Cov(b 2n0 Pozn´amka. Alternativn´ı konstrukc´ı lze z´ıskat takzvan´e simult´ann´ı intervaly spolehlivosti (simultaneous confidence bands) zaloˇzen´e na Working-Hotelling modelu popsan´e v [4]. q 1−Φ b a − bb Φ−1 (1 − t) ± kα
kde k =
V ar(b a − bb Φ−1 (1 − t)) ,
p −2 ln(α).
Pˇ r´ıklad 5.26. Odhad binorm´aln´ıho modelu pro data z pˇr´ıkladu 4.25 dopln´ıme o asymptotick´ y odhad 95% intervalu spolehlivosti senzitivity. Kostrukce podle podle vztahu 5.12 je vykreslena modˇre na obr´azku 6 vlevo a je n´aslednˇe srovn´ana s alternativn´ı konstrukc´ı simult´ann´ıho intervalu spolehlivosti (zelenˇe) v prav´em grafu obr´azku 6.
Obr´azek 6: 95% intervaly spolehlivosti senzitivity testu CK-BB.
5.2
Simult´ ann´ı sdruˇ zen´ a oblast
V pˇredchoz´ıch dvou pˇr´ıpadech byl postup zaloˇzen na v´ ypoˇctu intervalu spolehlivosti pro senzitivitu v dan´em bodˇe. Nyn´ı uplatn´ıme odliˇsn´ y pˇr´ıstup. Pro senzitivitu a nez´avisle pro specificitu urˇc´ıme intervaly spolehlivosti s vyuˇzit´ım Kolmogorovova-Smirnovova jednov´ ybˇerov´eho testu. V bobˇe [1 − F0 , 1 − F1 ] je obd´eln´ıkov´a oblast spolehlivosti d´ana [1 − F0 ± d, 1 − F1 ± e], kde d, e jsou pˇr´ısluˇsn´e kritick´e hodnoty K-S testu pro (1 − α) z tabulky 10 v pˇr´ıloze 2. Dan´ y bod se pak v tomto obd´eln´ıku nach´az´ı s pravdˇepodobnost´ı (1 − α)2 . Doln´ı hranici 21
oblasti spohlevosti tvoˇr´ı spojnice prav´ ych doln´ıch roh˚ u jednotliv´ ych obd´eln´ık˚ u. Spojnice lev´ ych horn´ıch roh˚ u vymezuje horn´ı hranici.
Obr´azek 7: JSR [4] Pˇ r´ıklad 5.27. Pouˇzijeme opˇet data z pˇr´ıkladu 4.25 a pro po ˇca´stech line´arn´ı odhad ROC kˇrivky zkonstruujeme sdruˇzenou oblast spolehlivosti.
Obr´azek 8: Simult´ann´ı sdruˇzen´a oblast spolehlivosti testu CK-BB.
22
6 6.1
Plocha pod ROC kˇ rivkou - AUC Lichobˇ eˇ zn´ıkov´ e pravidlo
Plocha pod kˇrivkou m˚ uˇze b´ yt pˇr´ımo odhadnuta souˇctem obsah˚ u lichobˇeˇzn´ık˚ u dan´ ych body empirick´e ROC kˇrivky. [ AU C=
n0 X n1 1 X Ψ(T1i , T0j ), n0 n1 i=1 j=1
kde Ψ je funkc´ı dvou promˇenn´ ych: 1 T1i > T0j 1 T1i = T0j Ψ(T1i , T0j ) = 2 0 T1i > T0j
6.2
Plocha a parci´ aln´ı plocha pod kˇ rivkou binorm´ aln´ıho modelu
Nyn´ı se opˇet zamˇeˇr´ıme na binorm´aln´ı model. Parci´aln´ı plochou pod ROC kˇrivkou se rozum´ı plocha pod kˇrivkou mezi dvˇemi dan´ ymi hodnotami Sp respektive 1 − Sp (dva body na vodorovn´e ose). Tedy Zc2 Φ(bv − a)φ(v)dv,
AU C(e1 ≤1−Sp(c)≤e2 ) = c1
kde c1 = Φ−1 (e1 ), c2 = Φ−1 (e2 ), v2 1 φ(v) = √ e− 2 . 2π Je tedy zˇrejm´e, ˇze maxim´aln´ı hodnotou bude plocha obd´eln´ıka
AU C(e1 ≤1−Sp(c)≤e2 ) ≤ AU Cmax(e1 ,e2 ) = (e2 − e1 ) × 1. Naopak minim´aln´ı hodnota je plocha lichobˇeˇzn´ıka omezen´eho diagon´alou 1 AU C(e1 ≤1−Sp(c)≤e2 ) ≥ AU Cmin(e1 ,e2 ) = (e2 − e1 )(e2 + e1 ). 2 Oznaˇcme n´ahodnou veliˇcinu Y = T0 − T1 , kde T0 m´a norm´aln´ı rozdˇelen´ı pravdˇepodobnosti s parametry (µ0 , σ02 ) a T1 m´a norm´aln´ı rozdˇelen´ı pravdˇepodobnosti s parametry (µ1 , σ12 ). Pak Y = T0 − T1 ∼ N (µ0 − µ1 , σ02 + σ12 ) ,
23
U=
T0 − T1 − (µ0 − µ1 ) p ∼ N (0, 1). σ02 + σ12
Obr´azek 9: Maxim´aln´ı a minim´aln´ı parci´aln´ı plocha pod ROC kˇrivkou [11]. Podle vˇety 3.19 vyj´adˇr´ıme plochu pod ROC kˇrivkou
AU C = P (T0 − T1 ≤ 0) = P Po dosazen´ı a =
µ1 −µ0 σ1
ab=
σ0 σ1
µ1 − µ0 T0 − T1 − (µ0 − µ1 ) p ≤p 2 2 2 σ0 + σ1 σ0 + σ12
! =Φ
µ − µ0 p1 σ02 + σ12
! .
dost´av´ame AU C = Φ
a √ 1 + b2
24
.
(6.13)
6.3
Testy hypot´ ez o AUC
Jak bylo jiˇz uvedeno v´ yˇse, pokud je graf ROC kˇrivky totoˇzn´ y s diagon´alou, velikost polchy pod kˇrivkou (pˇr´ımkou) je rovna jedn´e polovinˇe a zkouman´ y diagnostick´ y test m´a nulovou klasifikaˇcn´ı schopnost. Poloˇz´ıme tedy nulovou hypot´ezu 1 H0 : AU C = , 2 proti alternativˇe 1 Ha : AU C 6= . 2 Testovac´ı statistikou bude [ AU C − 0.5 Z=q , d [ V ar(AU C) tato m´a pˇribliˇznˇe(approximetely) normovan´e norm´aln´ı rozdˇelen´ı. D´ale je moˇzn´e testovat hypot´ezu, ˇze parci´aln´ı AUC na dan´em intervalu nab´ yv´a sv´eho maxima H0 : AU C(e1 ≤F P R≤e2 ) = AU Cmin , proti alternativˇe Ha : AU C(e1 ≤F P R≤e2 ) 6= AU Cmin . Zde bude testovac´ı statistikou [ AU C (e1 ≤F P R≤e2 ) − AU Cmin Z= r . d [ V ar AU C (e1 ≤F P R≤e2 )
7
Volba optim´ aln´ı klasifikaˇ cn´ı meze
V t´eto sekci se budeme zab´ yvat probl´emem urˇcen´ı optim´aln´ı meze pro klasifikaci objektu, tj. takov´eho c, pro kter´e jsou chyby v klasifikaci minim´aln´ı. Jak je vidˇet na obr´azku 10 s rostouc´ı senzitivitou kles´a specificita testu a naopak. Jestliˇze sniˇzujeme chybu prvn´ıho druhu, roste chyba druh´eho druhu a pokud sniˇzujeme chybu druh´eho druhu roste naopak chyba prvn´ıho druhu. Mˇejme optimalizaˇcn´ı u ´lohu ve smyslu minimalizace souˇctu chyby prvn´ıho a druh´eho druhu. V naˇsem pˇr´ıpadˇe tedy z(c) = 1 − Se(c) + 1 − Sp(c) z → min . Tuto lze pˇrev´est na ekvivalentn´ı tvar z(c) = Se(c) + Sp(c) − 2 z → max . 25
Obr´azek 10: Senzitivita a specificita Jestliˇze od fukce z odeˇcteme jedniˇcku, pak maximum t´eto funkce naz´ yv´ame Youden index (J), J = max {Se(c) + Sp(c) − 1} c
Mˇejme parametrick´e vyj´adˇren´ı ROC kˇrivky ve tvaru [1 − Sp(c), Se(c)], c ∈ (−∞, ∞). Grafem kˇrivky [1 − Sp(c), 1 − Sp(c)], c ∈ (−∞, ∞) je diagon´ala v jednotkov´em ˇctverci. Vzd´alenost bodu ROC kˇrivky od diagon´aly pro dan´e c je pak d´ana vztahem p (Se(c) − 1 + Sp(c))2 = Se(c) + Sp(c) + 1 Graficky je tedy moˇzn´e Youden index interpretovat jako nejvˇetˇs´ı vertik´aln´ı vzd´alenost mezi kˇrivkou a diagon´alou.
Obr´azek 11: Youden index, optim´aln´ı klasifikaˇcn´ı mez 26
ˇ sen´ı v´ Pozn´amka. Reˇ yˇse uveden´eho probl´emu je tedy bod kˇrivky, ve kter´em je smˇernice teˇcny rovna jedn´e. V praxi se ale setk´av´ame s pˇr´ıpady, kdy chyby prvn´ıho a druh´eho druhu nemaj´ı stejnou v´ahu. Pak ˇreˇs´ıme u ´lohu z(c) = k1 (1 − Se(c)) + k2 (1 − Sp(c)) z → min, ˇ sen´ım tohoto probl´emu je pak bod, ve kter´em kde, k1 , k2 jsou v´ahy jednotliv´ ych chyb. Reˇ je smˇernice teˇcny rovna k2 /k1 . Pˇ r´ıklad 7.28. Rozˇs´ıˇr´ıme pˇr´ıklad 4.25 o urˇcen´ı optim´aln´ı klasifikaˇcn´ı meze. Pro v´ ypoˇcet odhadu Youden indexu vyuˇzijeme metody bodov´ ych odhad˚ u senzitivity a specificity z kapitoly 4. V´ ysledn´e hodnoty jsou uvedeny v tabulce 4 Metoda odhadu ROC Empirick´a ROC kˇrivka Po ˇca´stech line´arn´ı ROC kˇrivka J´adrov´ y odhad ROC kˇrivky Odhad binorm´aln´ıho modelu ROC kˇrivky Nejlepˇs´ı nestrann´ y odhad Se a Sp
J c 0.53 286 0.53 286 0.486 304.3 0.514 201.3 0.513 207.2
Tabulka 4: Optim´aln´ı klasifikaˇcn´ı mez CK-BB Velk´ y rozd´ıl mezi v´ ysledky neparametrick´ ych a parametrick´ ych metod je v tomto pˇr´ıpadˇe zavinˇen ˇspatnou schopnost´ı prvn´ıch tˇr´ı metod aproximovat ROC kˇrivku v poˇc´ateˇcn´ı ˇca´sti, kdy kˇrivka rychle roste.
27
8
Srovn´ an´ı dvou ROC kˇ rivek
Oznaˇc´ıme-li m´ıru pˇresnosti dan´eho diagnostick´eho testu ϑ, pak tuto m´ıru m˚ uˇzeme pouˇz´ıt jako krit´erium pˇri srovn´an´ı dvou test˚ u. Tedy testujeme nulovou hypot´ezu H0 : ϑ1 = ϑ2 , proti Ha : ϑ1 6= ϑ2 . Opˇet pouˇzijeme statistiku ϑb1 − ϑb2 . Z=q b b V ar(ϑ1 − ϑ2 )
8.1
Testy odliˇ snosti
Pro pˇr´ım´e srovn´an´ı dvou ROC kˇrivek uvaˇzujeme n´asleduj´ıc´ı tvrzen´ı: 1. Dvˇe kˇrivky jsou shodn´e. Binorm´aln´ı model je plnˇe pops´an parametry a a b. Maj´ı-li se dvˇe ROC kˇrivky shodovat, mus´ı se i jejich parametry rovnat. Poloˇz´ıme tedy nulovou hypot´ezu H0 : a1 = a2 a b1 = b2 , proti alternativˇe Ha : a1 6= a2 nebo b1 6= b2 . Pro tento test vyuˇzijeme statistiku [Metz, Wang, Kronman] X2 =
a12 ) − 2b a12bb12 Cov(b a12 , bb12 ) b a12 V ar(bb12 ) + bb212 V ar(b , V ar(b a12 )V ar(bb12 ) − Cov(b a12 , bb12 )2
kde a12 = a1 − a2 a b12 = b1 − b2 jsou rozd´ıly parametr˚ u srovn´avan´ ych kˇrivek. Pro v´ ypoˇcet jednotliv´ ych rozptyl˚ u a kovarianc´ı lze vyuˇz´ıt vztahy uveden´e v´ yˇse v ˇca´sti 4.1. Tato statistika m´a asymptoticky chi-kvadr´at rozdˇelen´ı pravdˇepodobnosti s dvˇema stupni volnosti. 2. Dvˇe kˇrivky se shoduj´ı v partikul´arn´ım bodˇe. Opaˇcn´ y pˇr´ıstup je postaven na srovn´an´ı kˇrivek v jednotliv´ ych bodech. Pro tento u ´ˇcel zav´ad´ıme difrenci D(Ze ) takto: D(Ze ) = (b1 Ze − a1 ) − (b2 Ze − a2 ) = b12 Ze − a12 . Tato odpov´ıd´a rozd´ılu hodnot v bodˇe, kdy 1 − Sp(c) = e. Jako nulovou hypot´ezu pak poloˇz´ıme H0 : D(Ze ) = 0, proti Ha : D(Ze ) 6= 0. Testovac´ı statistika b e) D(Z Z=q b e )] V ar[D(Z pak m´a normovan´e norm´aln´ı rozdˇelen´ı pravdˇepodobnosti. 28
8.2
Test ekvivalence
Narozd´ıl od pˇredeˇsl´ ych test˚ u, nyn´ı posoud´ıme moˇznost v´ yskytu statisticky v´ yznamn´eho rozd´ılu mezi dvˇema diagnostick´ ymi testy, proti hypot´eze, ˇze tyto testy jsou ekvivalentn´ı. Pak je tedy testov´ana nulov´a hypot´eza H0 : (ϑ1 − ϑ2 ) ≤ ∆L
nebo(ϑ1 − ϑ2 ) ≥ ∆U ,
proti alternativn´ı hypot´eze (ekvivalence) Ha : ∆L < (ϑ1 − ϑ2 ) < ∆U , kde ∆L je stanoven´a doln´ı mez a ∆U horn´ı mez. Re´alnˇe jde o u ´lohu skl´adaj´ıc´ı se ze dvou test˚ u ∆U − (ϑb1 − ϑb2 ) (ϑb1 − ϑb2 ) − ∆L a Z2 = q . Z1 = q b b b b V ar(ϑ1 − ϑ2 ) V ar(ϑ1 − ϑ2 ) Nulovou hypot´ezu zam´ıt´ame, jestliˇze obˇe statistiky Z1 i Z2 jsou vˇetˇs´ı neˇz pˇr´ısluˇsn´e kritick´e hodnoty na hladinˇe α. Pokud je prvn´ı test alespoˇ n tak dobr´ y jako druh´ y (ϑ1 ≥ ϑ2 ), pak dost´av´ame nulovou hypot´ezu H0 : (ϑ1 − ϑ2 ) ≥ ∆M a alternativu Ha : (ϑ1 − ϑ2 ) < ∆M , kde ∆M je nejmenˇs´ı moˇzn´ y rozd´ıl pˇresnost´ı, kter´ y jeˇstˇe neznamen´a ekvivalenci. Testovac´ı statistika ϑb1 + ∆M − ϑb2 ZN I = q V ar(ϑb1 − ϑb2 ) m´a asymptoticky normovan´e norm´aln´ı rozdˇelen´ı pravdˇepodobnosti.
29
9
Ordin´ aln´ı data
V t´eto ˇc´asti se budeme zab´ yvat pˇr´ıpadem, kdy v´ ysledek zkouman´eho dagnostick´eho testu m˚ uˇze nab´ yvat pouze koneˇcn´eho poˇctu uspoˇra´dan´ ych hodnot (napˇr´ıklad 1 = velmi ˇspatn´ y, 2 = ˇspatn´ y, 3 = dobr´ y, 4 = velmi dobr´ y). Vysok´e hodnoty pak znaˇc´ı pozitivn´ı klasifikaci, n´ızk´e naopak negativn´ı.
9.1
Empirick´ a ROC kˇ rivka
Necht’ v´ ysledek testu T nab´ yv´a hodnot 1, . . . , K. Pro kaˇzdou ordin´aln´ı hodnotu testu T , definujeme senzitivitu jako K 1 X c sj Se(i) = P (T ≥ i|D = 1) = n1 j=i
a hodnotu 1 − Sp(c) c = P (T ≥ i|D = 0) = 1 − Sp(i)
K 1 X rj , n0 j=i
kde jednotliv´e parametry jsou d´any tabulkou
Re´aln´ y stav (D) D=1 D=0 Celkem
V´ ysledek testu (T ) 1 ... K s1 . . . s K r1 . . . rK m1 . . . mK
Celkem n1 n0 N
Tabulka 5: Test s ordin´an´ımi daty Tedy sj je poˇcet jedinc˚ u s pozitivn´ım sledovan´ ym znakem a v´ ysledkem testu T = j. Naopak rj je poˇcet jedinc˚ u se stejn´ ym v´ ysledkem testu, ale negativn´ım sledovan´ ym znakem. c c Empirick´a ROC kˇrivka pro ordin´aln´ı data je pak d´ana vykreslen´ım p´ar˚ u [1−Sp(i), Se(i)], pro i = 1 . . . K, spojen´ ych lomenou ˇcarou.
9.2
Parametric´ y model aproximace hladkou kˇ rivkou
Empirick´a kˇrivka odhadnut´a z 2 × K hodnot je pomˇernˇe nepˇresn´a a d´av´a pouze hrubou pˇredstavu o vlastnostech pˇr´ısluˇsn´eho testu. Proto se snaˇz´ıme naj´ıt vhodnou aproximaci. Pˇredpokl´adejme ˇze, data ordin´aln´ıho typu vznikla z dat p˚ uvodnˇe spojit´ ych. Obecnˇe ∗ je tedy v´ ysledek u pozitivn´ıch jedinc´ u n´ahodn´a veliˇcina T1 s distribuˇcn´ı funkc´ı F1 . Ve ∗ skupinˇe negativn´ıch pak T0 s distribuˇcn´ı funkc´ı F0 . Je-li c klasifikaˇcn´ı mez, ROC kˇrivku pak z´ısk´ame v parametrick´em tvaru [1 − F0 (c), 1 − F1 (c)], 30
−∞ < c < ∞
Ti∗ ≤ c˜1 c˜j−1 < Ti∗ ≤ c˜j Ti∗ > c˜K−1
→ Ti = 1 → Ti = j, j = 2, 3, . . . , K − 1 → Ti = K
Pro ordin´aln´ı data pˇredpokl´ad´ame K −1 nezn´am´ ych klasifikaˇcn´ıch mez´ı c˜1 , c˜2 , . . . , c˜K−1 takov´ ych, ˇze pro i = 0, 1 Vˇetˇsinou pˇredpokl´ad´ame, ˇze F1 i F0 jsou distribuˇcn´ı funkce norm´aln´ıho rozdˇelen´ı. Tedy ˇze Ti∗ jsou n´ahodn´e veliˇciny s norm´aln´ım rozdˇelen´ım pravdˇepodobnosi nebo existuje monot´onn´ı transformace dat na toto rozdˇelen´ı. Pak T1∗ ∼ N (µ1 , σ10 ),
T0∗ ∼ N (µ0 , σ02 ).
D´ale pak postupujeme jako pˇri odhadu binorm´aln´ıho modelu spojit´ ych n´ahodn´ ych veliˇcin. V´ıce napˇr´ıklad v [8]
31
10
Simulaˇ cn´ı studie
V tomto u ´seku budou na simulovan´ ych datech srovn´any jednotliv´e v´ yˇse popsan´e metody.
10.1
Bodov´ e odhady ROC kˇ rivky
Z dat vygenerovan´ ych v programu Matlab provedeme konstrukci a n´asledn´e srovn´an´ı empirick´e ROC kˇrivky (EM), po ˇc´astech line´arn´ı ROC kˇrivky (PL), odhadu zaloˇzen´eho na j´adrov´ ych odhadech distribuˇcn´ıch funkc´ı (JO), binorm´aln´ıho modelu (B) a ROC kˇrivky pro nejlepˇs´ı nestrann´ y odhad senzitivity a specificity (K). Pro binorm´aln´ı model s parametry F0 ∼ N (0, 1), F1 ∼ N (1, 1), byly vygenerov´any v´ ybˇery o celkov´em rozsahu (n = n0 + n1 = 20, 40, 100, 200, 800) a to v pomˇeru n0 = n1 , n0 = 3n1 a n1 = 3n0 . Pro kaˇzd´ y stav bylo spuˇstˇeno 500 simulac´ı. Pro srovn´an´ı teoretick´e kˇrivky s jej´ım odhadem byla mˇeˇrena vzd´alenost bodu [1 − F0 (ci ), 1 − F1 (ci )] od c0 (ci ), 1 − Fb(ci )] jeho odhadu [1 − F q c0 (ci ) − F0 (ci ))2 + (F c1 (ci ) − F1 (ci ))2 vi = (F pro vˇsechna generovan´a ci , i = 1 . . . , n. Z tˇechto hodnot pro kaˇzd´ y bodov´ y odhad ROC kˇrivky vypoˇcteme smˇerodatnou chybu RM SE v u n u1 X v2. RM SE = t n i=1 i Takto pro kaˇzdou jednotlivou metodu bodov´eho odhadu ROC kˇrivky vznikne soubor 500 hodnot RMSE. V tabulce 6 jsou pak uvedeny v´ ybˇerov´e pr˚ umˇery a smˇerodatn´e odchylky RMSE. Pr˚ ubˇeh simulac´ı pro n = 20, 100, 800 E, PL, JO a B proti teoretick´e ROC kˇrivce (ˇcervenˇe) je vykreslen na obr´azc´ıch 12 a 13. Hodnoty B a K byly v tomto pˇr´ıpadˇe t´emˇeˇr identick´e, proto simulaˇcn´ı studie ROC kˇrivek zaloˇzen´a na nejlepˇs´ım nestrann´em odhadu senzitivity a specificity nen´ı zobrazena.
32
33
Po ˇca´stech line´arn´ı ROC kˇrivka J´adrov´ y odhad ROC kˇrivky Odhad binorm´aln´ıho modelu ROC kˇrivky Nejlepˇs´ı nestrann´ y odhad Se a Sp ROC kˇrivky
Empirick´a ROC kˇrivka
Metoda
Tabulka 6: Simulaˇcn´ı studie pro F0 ∼ N (0, 1) a F1 ∼ N (1, 1)
n0 = n1 3n0 = n1 n0 = 3n1 n0 = n1 3n0 = n1 n0 = 3n1 n0 = n1 3n0 = n1 n0 = 3n1 n0 = n1 3n0 = n1 n0 = 3n1 n0 = n1 3n0 = n1 n0 = 3n1
n = 20 n = 40 n = 100 n = 200 n = 800 RMSE std RMSE std RMSE std RMSE std RMSE std 0.1686 0.0525 0.1164 0.0334 0.0730 0.0219 0.0522 0.0156 0.0259 0.0080 0.1893 0.0555 0.1325 0.0390 0.0809 0.0255 0.0592 0.0200 0.0291 0.0091 0.1936 0.0557 0.1327 0.0402 0.0843 0.0261 0.0593 0.0177 0.0292 0.0087 0.1548 0.0495 0.1105 0.0321 0.0712 0.0216 0.0516 0.0156 0.0258 0.0080 0.1692 0.0540 0.1232 0.0378 0.0775 0.0256 0.0577 0.0200 0.0289 0.0090 0.1722 0.0557 0.1226 0.0403 0.0810 0.0261 0.0578 0.0177 0.0291 0.0087 0.1475 0.0539 0.1041 0.0346 0.0667 0.0229 0.0485 0.0164 0.0244 0.0083 0.1632 0.0586 0.1182 0.0410 0.0730 0.0270 0.0544 0.0210 0.0274 0.0095 0.1664 0.0600 0.1178 0.0435 0.0770 0.0274 0.0546 0.0186 0.0276 0.0090 0.1318 0.0579 0.0877 0.0367 0.0556 0.0238 0.0403 0.0172 0.0198 0.0087 0.1451 0.0629 0.1020 0.0434 0.0603 0.0279 0.0444 0.0210 0.0222 0.0104 0.1465 0.0656 0.1020 0.0459 0.0638 0.0293 0.0459 0.0194 0.0223 0.0100 0.1327 0.0578 0.0880 0.0367 0.0557 0.0238 0.0404 0.0172 0.0198 0.0087 0.1481 0.0625 0.1028 0.0435 0.0605 0.0279 0.0444 0.0210 0.0222 0.0104 0.1495 0.0651 0.1028 0.0460 0.0639 0.0293 0.0460 0.0195 0.0223 0.0100
Obr´azek 12: Simulace: empirick´e a poc´astech line´arn´ı ROC kˇrivky.
34
Obr´azek 13: Simulace: j´adrov´e odhady a odhady binorm´aln´ıho modelu ROC kˇrivky.
35
Na ob´azku 14 vid´ıme srovn´an´ı metod konstrukce bodov´eho odhad˚ u ROC kˇrivky pomoc´ı pr˚ umˇern´e hodnoty RMSE (graf v horn´ı ˇca´sti) a smˇerodatn´ ych odchylek RMSE (doln´ı graf).
Obr´azek 14: Simulace: srovn´an´ı bodov´ ych odhad˚ u ROC kˇrivky. D´ale byly stejn´ ym postupem provedeny simulace pro binorm´aln´ı model s parametry F0 ∼ N (0, 1), F1 ∼ N (3, 1) a model kdy F0 a F1 mˇely exponenci´aln´ı rozdˇelen´ı pravdˇepodobnosti s parametry F0 ∼ exp(0.5), F1 ∼ exp(1). V´ ysledky jsou zaznamem´any v tabulk´ach 11 a 12 v pˇr´ıloze 3. Ve vˇsech pˇr´ıpadech z pr˚ ubˇeh˚ u simulac´ı pozorujeme, ˇze pro mal´e rozsahy odhady ROC kˇrivky pokr´ yvaj´ı vˇetˇsinu polchy jednotkov´eho ˇctverce. Nejvyˇsˇs´ı pˇresnost vykazuje odhad binorm´aln´ıho modelu. Nejlepˇs´ı nestrann´ y odhad Se a Sp d´av´a podobn´e v´ ydledky, ale v´ ypoˇcetn´ı n´aroˇcnost t´eto metody je vyˇsˇs´ı. J´adrov´ y odhad v popsan´em tvaru nedok´aˇze 36
s dostateˇcnou pˇresnost´ı aproximovat ROC kˇrivku v ˇca´sti u ´vodn´ıho rychl´eho r˚ ustu. To m˚ uˇze zp˚ usobovat probl´em v n´asledn´em hodnocen´ı ROC kˇrivky nebo pˇri odhadu optim´aln´ı klasifikaˇcn´ı meze. Empirick´a a po ˇc´astech line´arn´ı ROC kˇrivka, hlavnˇe pro mal´a n, d´av´a pouze hrubou pˇredstavu o tvaru kˇrivky a je vhodn´e ji doplnit nˇekter´ ym dalˇs´ım odhadem.
10.2
Intervalov´ e odhady
V t´eto ˇc´asti bude provedena simulaˇcn´ı studie metod intervalov´ ych odhad˚ u ROC kˇrivek posan´ ych v kapitole 5. Pro binorm´aln´ı model s parametry F0 ∼ N (0, 1), F1 ∼ N (1, 1), byly vygenerov´any v´ ybˇery o rozsahu n = n0 = n1 = 10, 20, 50, 100, 400. Pro kaˇzd´ y stav bylo spuˇstˇeno 100 simulac´ı. U jednotliv´ ych metod pak byl sledov´an poˇcet pˇr´ıpad˚ u, ve kter´ ych teoretick´a kˇrivka zasahovala mimo odhadnut´e hranice. Do tabulky 7 byly zaznamen´any pozorovan´e spolehlivosti (AI - asymptotick´e intervaly spolehlivosti, SI - simult´ann´ı intervaly spolehlivosti, JSR - simult´ann´ı sdruˇzen´e oblasti spolehlivosti).
Metoda AI SI JSR
n 10 20 50 100 400 81% 76% 82% 90% 88% 86% 81% 86% 94% 93% 100% 100% 100% 100% 100%
Tabulka 7: Pozorovan´a spolehivost intervalov´ ych odhad˚ u
Obr´azek 15: Pr˚ ubˇeh simulac´ı AI pro n=20 vlevo a n=100 vpravo. Pˇri pouˇzit´ı prvn´ıch dvou metod, nebyla ani v jednom pˇr´ıpadˇe dosaˇzena spolehlivost 95%. Naopak u tˇret´ı metody teoretick´a kˇrivka leˇzela vˇzdy v odhadnut´e oblasti viz. obr´azek 17. V tomto pˇr´ıpadˇe jsou ale hranice nejˇsirˇs´ı.
10.3
Youden index a optim´ aln´ı c
V t´eto ˇc´asti bude pomoc´ı metod bodov´ ych odhad˚ u senzitivity a specificity odhadnut youden index a pˇr´ısluˇsn´a hodnota optim´aln´ı klasifikaˇcn´ı meze. Pr˚ ubˇeh simulac´ı je shodn´ y jako pˇri simulac´ıch bodov´ ych odhad˚ u ROC kˇrivek pro binorm´aln´ı model s parametry F0 ∼ N (0, 1), F1 ∼ N (1, 1). Teoretick´a hodnota youden indexu J = 0, 383 a optim´aln´ı klasifikaˇcn´ı meze c = 0, 5. 37
Obr´azek 16: Pr˚ ubˇeh simulac´ı SI pro n=20 vlevo a n=100 vpravo.
Obr´azek 17: Pr˚ ubˇeh simulac´ı JSR pro n=20 vlevo a n=100 vpravo.
Metoda EM PL JO B K
n = 20 J RMSE 0,54 0,230 0,48 0,196 0,46 0,184 0,41 0,171 0,41 0,170
n = 40 J RMSE 0,49 0,169 0,45 0,140 0,43 0,131 0,39 0,1192 0,39 0,119
n = 100 J RMSE 0,45 0,105 0,43 0,0958 0,40 0,087 0,39 0,077 0,39 0,0769
n = 200 J RMSE 0,43 0,074 0,42 0,069 0,40 0,060 0,39 0,054 0,39 0,054
n = 800 J RMSE 0,40 0,0353 0,40 0,034 0,39 0,031 0,38 0,027 0,38 0,026
Tabulka 8: Youden index pro F0 ∼ N (0, 1) a F1 ∼ N (1, 1)
Metoda EM PL JO B K
n = 20 c RMSE 0,29 0,600 0,7 0,705 0,53 0,545 0,51 0,395 0,50 0,439
n = 40 c RMSE 0,38 0,489 0,57 0,524 0,49 0,469 0,50 0,259 0,50 0,273
n = 100 c RMSE 0,44 0,377 0,52 0,359 0,48 0,347 0,49 0,153 0,49 0,157
n = 200 c RMSE 0,46 0,296 0,51 0,2916 0,50 0,276 0,49 0,100 0,49 0,102
Tabulka 9: Optim´aln´ı c a RMSE 38
n = 800 c RMSE 0,49 0,172 0,51 0,178 0,51 0,160 0,50 0,054 0,50 0,054
Obr´azek 18: Odhad Youden indexu a jeho RMSE
39
I v pˇr´ıpadˇe hled´an´ı odhadu youden indexu se ukazuje jako nejvhodnˇejˇs´ı metoda odhad senzitivity a specificity jako distribuˇcn´ı funkce norm´aln´ıho rozdˇelen´ı pravdˇepodobnosti. Vˇsechny odhady s rostouc´ım rozsahem v´ ybˇeru klesaj´ı k teoretick´e hodnotˇe 0,383. Beremeli hodnotu J jako mˇeˇr´ıtko kvality testu, pak je tento odhad nadhodnocen´ y.
Obr´azek 19: Odhad optim´aln´ı klasifikaˇcn´ı meze a RMSE Odhad optim´aln´ı klasifikaˇcn´ı meze na z´akladˇe maximalizace youden indexu se u metod JO, B a K uk´azal jako pˇresn´ y i u mal´ ych rozsah˚ u.
40
11
Z´ avˇ er
V u ´vodn´ıch ˇc´astech byly uvedeny z´akladn´ı poznatky z teorie odhadu a testov´an´ı statitick´ ych hypot´ez. D´ale byla zavedena ROC kˇrivka jako funkce senzitivity a specificity zkouman´eho testu a na teoretick´ ych pˇr´ıkladech byly demonstrov´any jej´ı z´akladn´ı vlastnosti a parametry. Zde vid´ıme prvn´ı moˇznost posouzen´ı kvality testu z tvaru ROC kˇrivky. V ˇc´asti 4 byly pops´any metody bodov´ ych odhad˚ u ROC kˇrivky. Z neparametrick´ ych metod to byl odhad empirick´e a po ˇca´stech line´arn´ı ROC kˇrivky. Ze simulaˇcn´ıch studi´ı v kapitole 10 vypl´ yv´a, ˇze tyto metody poskytuj´ı pouze hrub´ y odhad, ˇcasto pomˇernˇe vzd´alen´ y od teoretick´e kˇrivky. Dalˇs´ım neparametrick´ ym odhadem ROC kˇrivky byla metoda zaloˇzen´a na j´adrov´ ych odhadech distribuˇcn´ıch funkc´ı. V´ yhodou t´eto metody je schopnost aproximovat ROC kˇrivku hladkou kˇrivkou, nev´ yhodou je pak nepˇr´ızniv´ y vliv hraniˇcn´ıho efektu. Parametrick´a metoda odhadu binorm´aln´ıho modelu a metoda nejlepˇs´ıho nestrann´eho odhadu senzitivity a specificity binorm´aln´ıho modelu pak na z´akladˇe srovn´an´ı simulaˇcn´ıch studi´ı vych´azej´ı jako nejpˇresnˇejˇs´ı. Nev´ yhodou metody nejlepˇs´ıho nestrann´e odhadu Se a Sp je jej´ı v´ ypoˇcetn´ı n´aroˇcnost. D´ale pak byly pops´any metody intervalov´ ych odhad˚ u ROC kˇrivek. Tak´e tyto byly srovn´any pomoc´ı simulovan´ ych dat. Pozorovan´a spolehlivost byla nejvyˇsˇs´ı u sdrˇzen´e simult´ann´ı oblasti, ale hranice t´eto oblasti jsou podstatnˇe ˇsirˇs´ı neˇz u ostatn´ıch metod. V n´asleduj´ıc´ıch kapitol´ach je pak pops´ana problematika v´ ypoˇctu plochy pod ROC kˇrivkou, kter´a ud´av´a kvalitu testovac´ıho krit´eria, volba optim´aln´ı klasifikaˇcn´ı meze. Kapitola 8 se zab´ yv´a testy statistick´ ych hypot´ez o ROC kˇrivk´ach, slouˇz´ıc´ıch k vz´ajemn´emu srovn´an´ı test˚ u. T´ema statistick´e anal´ yzy ROC kˇrivek je pomˇernˇe rozs´ahl´e. Tato pr´ace pˇrin´aˇs´ı popis z´akladn´ıch pouˇz´ıvan´ ych metod a jejich srovn´an´ı. D´ale je moˇzn´e se zab´ yvat hled´an´ım a u ´pravou jednotliv´ ych metod pro konkr´etn´ı praktick´e u ´lohy, nebo naopak pokraˇcovat v popisu nov´ ych metod na teoretick´e u ´rovni.
41
42
Reference ˇ J. Matematick´a statistika. SNTL/ALFA Praha, 1978. [1] ANDEL, [2] GREINER, M. - PFEIFFER, D. - SMITH, R.D.: Principles and practical application of the receiver-operating characteristic analysis for diagnostic tests. In Preventive Veterinary Medicine 45. p. 23-41, 2000 ´ [3] KUTALEK, D: Uˇzit´ı ROC kˇrivek ke klasifikaci objekt˚ u. [Bakal´aˇrsk´a pr´ace] Brno: Vysok´e uˇcen´ı technick´e v Brnˇe, Fakulta strojn´ıho inˇzen´ yrstv´ı, 2008. [4] MACSKASSY, A. - PROVOST F. Confidence Bands for ROC Curves: Methods and an Empirical Study. Proceedings of the First Workshop on ROC Analysis in AI. August 2004. ´ ´ V. A Comparison of the ROC curve estimators by si[5] MICHALEK, J. - VESELY, mulations. ´ ´ V. The ROC and ODC curve estimators in binomial [6] MICHALEK, J. - VESELY, model based on the best unbiased estimator of CDF. XXIII International Colloquium on the Acqusition Process Managemant. Universitz of Defence Brno 2005. [7] PAVL´IK, J. Aplikovan´a statistika. 1. vyd. Vysok´a ˇskola chemicko-technologick´a v Praze, Praha 2005, ISBN 80-7080-569-2. [8] PEPE, M.S.: The statistical evaluation of medical tests for classification and prediction. Oxford University Press, 2004 ˇ ´IK, M.:Vyuˇzit´ı ROC kˇrivek pˇri konstrukci klasifkaˇcn´ıch a regresn´ıch strom˚ [9] SEDLAC u [Disertaˇcn´ı pr´ace.] Brno: Masarykova univerzita, Pˇr´ırodovˇedeck´a fakulta, 2006. [10] SCHISTERMAN E.F. - PERKINS N.J. - LIU A., BONDELL H. Optimal Cut-point and Its Corresponding Youden Index to Discriminate Individuals Using Pooled Blood Samples, 2005. [11] ZHOU X.H., OBUCHOVSKI N.A., McCLISH D.K. Statistical methods in Diagnostic Medicine. John Wiley. 2002 [12] Receiver operating characteristic [online], posledn´ı revize 12.6.2010 [cit. 2010-14-06]. Dostupn´e z
43
44
12
Seznam pouˇ zit´ ych zkratek a symbol˚ u
AI
asymptotick´ y interval spolehlivosti
AUC
area under curve
B
odhad binorm´aln´ıho modelu ROC kˇrivky
EM
empirick´a ROC kˇrivka
J
Youden index
JO
j´adrov´ y odhad ROC kˇrivky
JSR
simult´ann´ı sdruˇzena oblast spolehlivosti
K
nejlepˇs´ı nestrann´ y odhad senzitivity a specificity binorm´aln´ıho modelu podle Kolmogorova
PL
po ˇca´stech line´arn´ı ROC kˇrivka
ROC
receiver operating characteristic
Se
senzitivita
SI
simult´ann´ı interval spolehlivosti
Sp
specificita
a
sloupcov´ y vektor re´aln´ ych ˇc´ısel
a0
transponovan´ y vektor
A0
transponovan´a matice
A−1
inverzn´ı matice
|A|
determinant matice
B
syst´em borelovsk´ ych mnoˇzin
EX
stˇredn´ı hodnota n´ahodn´e veliˇciny X
varX
rozptyl n´ahodn´e veliˇciny X
F −1
inverzn´ı distribuˇcn´ı funkce
Rm
re´aln´ y m-rozmˇern´ y prostor
P (a|b)
podm´ınˇen´a pravdˇepodobnost jevu a za podm´ınky b
Θ
parametrick´ y prostor
Ω
prostor element´arn´ıch jev˚ u
45
46
13
Seznam pˇ r´ıloh
1. CD s implementac´ı jednotliv´ ych algoritm˚ u v jazyce MATLAB. 2. Tabulka kritick´ ych hodnot pro jednov´ ybˇerov´ y K-S test. 3. Tabulky v´ ysledk˚ u simulaˇcm´ıch studi´ı.
47
48
14
pˇ r´ılohy
Tabulka 10: Kritick´e hodnoty pro jednov´ ybˇerov´ y Kolmogorov˚ uv-Smirnov˚ uv test
49
50
51
Po ˇca´stech line´arn´ı ROC kˇrivka J´adrov´ y odhad ROC kˇrivky Odhad binorm´aln´ıho modelu ROC kˇrivky Nejlepˇs´ı nestrann´ y odhad Se a Sp ROC kˇrivky
Empirick´a ROC kˇrivka
Metoda
Tabulka 11: Simulaˇcn´ı studie pro F0 ∼ N (0, 1) a F1 ∼ N (1, 1)
n0 = n1 3n0 = n1 n0 = 3n1 n0 = n1 3n0 = n1 n0 = 3n1 n0 = n1 3n0 = n1 n0 = 3n1 n0 = n1 3n0 = n1 n0 = 3n1 n0 = n1 3n0 = n1 n0 = 3n1
n = 20 n = 40 n = 100 n = 200 n = 800 RMSE std RMSE std RMSE std RMSE std RMSE std 0.1346 0.0419 0.0935 0.0279 0.0581 0.0172 0.0411 0.0115 0.0204 0.0059 0.1371 0.0437 0.0947 0.0275 0.0601 0.0176 0.0424 0.0124 0.0208 0.0058 0.1410 0.0439 0.0974 0.0285 0.0604 0.0172 0.0422 0.0115 0.0209 0.0056 0.1302 0.0402 0.0909 0.0269 0.0575 0.0170 0.0409 0.0115 0.0204 0.0059 0.1328 0.0403 0.0935 0.0267 0.0596 0.0173 0.0420 0.0121 0.0207 0.0058 0.1330 0.0406 0.0949 0.0275 0.0595 0.0173 0.0420 0.0116 0.0208 0.0057 0.1179 0.0432 0.0828 0.0281 0.0530 0.0179 0.0380 0.0120 0.0193 0.0062 0.1156 0.0395 0.0839 0.0273 0.0548 0.0181 0.0391 0.0127 0.0195 0.0061 0.1183 0.0421 0.0860 0.0282 0.0547 0.0177 0.0392 0.0122 0.0196 0.0059 0.1028 0.0467 0.0711 0.0307 0.0439 0.0189 0.0313 0.0130 0.0157 0.0065 0.1037 0.0425 0.0720 0.0301 0.0453 0.0194 0.0330 0.0138 0.0157 0.0068 0.1064 0.0443 0.0743 0.0310 0.0453 0.0188 0.0317 0.0131 0.0157 0.0064 0.1032 0.0466 0.0712 0.0307 0.0439 0.0189 0.0314 0.0130 0.0157 0.0065 0.1046 0.0421 0.0722 0.0300 0.0454 0.0194 0.0330 0.0138 0.0157 0.0068 0.1072 0.0440 0.0745 0.0310 0.0453 0.0188 0.0317 0.0131 0.0157 0.0064
52
53
Po ˇca´stech line´arn´ı ROC kˇrivka J´adrov´ y odhad ROC kˇrivky Odhad binorm´aln´ıho modelu ROC kˇrivky Nejlepˇs´ı nestrann´ y odhad Se a Sp ROC kˇrivky
Empirick´a ROC kˇrivka
Metoda
Tabulka 12: Simulaˇcn´ı studie pro F0 ∼ Exp(0.5) a F1 ∼ Exp(1)
n0 = n1 3n0 = n1 n0 = 3n1 n0 = n1 3n0 = n1 n0 = 3n1 n0 = n1 3n0 = n1 n0 = 3n1 n0 = n1 3n0 = n1 n0 = 3n1 n0 = n1 3n0 = n1 n0 = 3n1
n = 20 n = 40 n = 100 n = 200 n = 800 RMSE std RMSE std RMSE std RMSE std RMSE std 0.1707 0.0485 0.1189 0.0355 0.0733 0.0221 0.0525 0.0163 0.0256 0.0075 0.2014 0.0676 0.1405 0.0470 0.0866 0.0294 0.0621 0.0214 0.0307 0.0097 0.1867 0.0561 0.1273 0.0386 0.0807 0.0247 0.0567 0.0168 0.0285 0.0089 0.1572 0.0460 0.1123 0.0341 0.0713 0.0218 0.0518 0.0162 0.0255 0.0075 0.1757 0.0657 0.1283 0.0459 0.0830 0.0291 0.0608 0.0215 0.0305 0.0097 0.1680 0.0554 0.1187 0.0380 0.0776 0.0245 0.0554 0.0168 0.0283 0.0089 0.1476 0.0503 0.1043 0.0357 0.0665 0.0224 0.0490 0.0166 0.0251 0.0075 0.1688 0.0701 0.1206 0.0488 0.0770 0.0289 0.0569 0.0214 0.0297 0.0095 0.1612 0.0614 0.1132 0.0404 0.0736 0.0257 0.0526 0.0175 0.0275 0.0090 0.1376 0.0529 0.0926 0.0393 0.0570 0.0252 0.0410 0.0184 0.0214 0.0082 0.1658 0.0778 0.1120 0.0531 0.0695 0.0321 0.0488 0.0228 0.0256 0.0105 0.1515 0.0657 0.0989 0.0451 0.0636 0.0274 0.0450 0.0191 0.0233 0.0098 0.1382 0.0529 0.0928 0.0394 0.0570 0.0252 0.0410 0.0184 0.0213 0.0082 0.1687 0.0780 0.1127 0.0532 0.0696 0.0321 0.0488 0.0229 0.0256 0.0105 0.1535 0.0660 0.0992 0.0453 0.0636 0.0275 0.0450 0.0192 0.0233 0.0098