[Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 18.
JJ9
Információk a 2. ZH-ról és a vizsgáról • • • • • • • • • •
12. hét: gyakorló óra 13. hét: teszt 14. hét: a teszt megbeszélése, vizsgajegyek megajánlása. Minden csoport a szeminárium alatt írja a tesztet. Egyszerű választás, a ponthatárok ugyanazok, mint az előző ZH esetén. Megajánlott jegy a 2 db ZH átlaga (egyik sem lehet 1-es). A megajánlott jegyet nem köteles a hallgató elfogadni. Az utolsó gyakorlaton kell a hallgatónak eldönteni, hogy elfogadja-e a megajánlott vizsgajegyet vagy szóbeli vizsgát szeretne tenni. Mindenkinek fel kell vizsgaidőpontra iratkozni. Aki nem írta meg mindkét ZH-t, automatikusan szóbeli vizsgát tesz.
Regresszióanalízis. Legkisebb négyzetek elve.
Regresszióanalízis. Legkisebb négyzetek elve. - Relációanalízis: két vagy több mennyiség egymástól való függésének vizsgálata (pl.: hogyan változik egy vagy több változó értéke egy másik változó változásának függvényében) Két különböző eljárás használatos: (1) Regresszióanalízis -
Függvénysszerű kapcsolatot keres két (vagy több) változó között. Technikát szolgáltat az állandók meghatározásához adott megbízhatósági intervallummal. Kapott függvény: regressziós függvény (egyenlet) Említsünk a biofizika gyakorlatról példákat! (2) Korrelációanalízis
- A változók közötti kapcsolat szorosságát méri.
A regresszióanalízis körébe a következő problémák tartoznak (a regressziós függvény felállítása) (1) Ismert törvények (pl.: fizikai és kémiai) változói közötti kapcsolat egyenlet formájában fejezhető ki. Pl: Lambert-Beer törvény, kinetikai reakciók
(2) Előfordul, hogy nincs vagy nem ismert törvényszerű kapcsolat a változók között. Ebben az esetben is megkísérelhetünk egy függvényszerű kapcsolatot felállítani a változók között.
Amikor két változó között van szignifikáns regressziós kapcsolat, de nincs közvetlen oksági összefüggés: Frame, S., Moore, J., Peters, A. (1985) Maternal height and shoe size as predictors of pelvic disproportion: an assessment. Brit. J. Obstet. Gynaecol. 92, 1239-1245.
Az adatok analízise jól meghatározott eredményt ad, valós trend létezik az adatok között. A kapcsolat nyílvánvalóan nem oksági kapcsolat, a trend az orvosok számára egy kényelmes indikátor, amely esetenként valós problémát jelezhet.
Mi a regresszió? F. Galton (1812-1911): Megfigyelte, hogy a magas szülők gyermekeinek átlagos magassága kissé alacsonyabb, mint a szülőké, az alacsony szülők gyermekeinek átlagos testmagassága viszont kissé nagyobb, mint szüleiké, azaz a sokaság átlagának irányába történő visszatérési tendenciáról van szó. (regression to the mean = visszatérés az átleghoz) Lineáris regresszió: Két (vagy több) változó között lineáris kapcsolat van. Legyenek két egymástól nem független véletlen változó (X, Y) egymáshoz tartozó értékpárjai a következők:
Ha a független változót X -el, a függő változót Y -nal jelöljük, a lineáris kapcsolatra jellemző egyenlet a következő :
ahol a a tengelymetszet, b az egyenes meredeksége, E pedig egy véletlen változó, amelynek átlaga 0. E a hiba változó, amely Y -nak azt a részét reprezentálja, amely nem magyarázható meg X változásával.
A legkisebb négyzetek módszere (A populáció egy regressziós egyenesének becslése)
Számtalan regressziós egyenes illeszthető a pontokra. De melyik a legjobb?
A legkisebb négyzetek módszere az egyik legkedvezőbb eljárás az illesztésre, ha az egyenestől való véletlen eltérések minden X -re normális eloszlást mutatnak azonos varianciával.
Ha az egyenes a és b paramétereit a legkisebb négyzetek eljárás segítségével határoztuk meg, akkor a megfigyelt pontokra vonatkozó négyzetes eltérés kisebb, mint bármely más, a pontokra illesztett egyenes esetében.
Az egyenes egyenlete: Az a és b állandók megfelelő megválasztásával elérhető, hogy a véletlen eltérések négyzeteinek összege minimális legyen az egyenes körül:
A matematikai eljárás végeredményeként az egyenes meredeksége:
a tengelymetszete pedig:
Az Y változó X változóra vonatkozó regressziós egyenlet: - Y megadja y legvalószínűbb értékét egy adott x -re. - Az egyenes áthalad az x és y adatok átlagai által meghatározott ponton. - b a regressziós együttható, amely megadja, mennyivel változik y átlagosan, ha x értékét egységnyivel megváltoztatjuk. (Van biofizikai gyak példa?)
A b kifejezésében szereplő számlálót az X és Y változók közös varianciájának (covarianciájának) hívjuk, jelölése Cov(x,y). Pontos definíciója:
Szokás a következő szimbólum használata is:
Az előző kifejezések felhasználásával a regressziós koefficiens alakja:
Nemlineáris regressziós-függvények Például egyszerű termikus kémiai reakciónál a termikus reakció reakciósebessége a hőmérséklettől exponenciálisan függ:
ahol k a reakció sebességi állandója, k0 az u.n. akció konstans, E az aktivációs energia, R az egyetemes gázállandó, T pedig az abszolút hőmérséklet.
• • • •
hatványkitevős regresszió, exponenciális regresszió, parabolikus regresszió, hiperbolikus regresszió.
Változók közötti nemlineáris kapcsolatra példa lehet egy gyógyszer hatásának függése a gyógyszer dózisától, a baktériumok szaporodása az idő függvényében, terméshozamok függése a csapadék mennyiségétől.
Linearizálás módszere: a görbét alkalmas koordinatatranszformációval egyenesbe próbáljuk átalakítani. (A hiperbolikus, az exponenciális és a logaritmikus függvények könnyen linearizálhatók.)
Exponenciális regresszió: Példa: Egy időben lezajló kémiai reakció során a táblázatban foglalt eredményeket kapták, ahol ti jelenti a megfigyelés kezdetétől eltelt időt, yi pedig a kiinduló anyag mennyiségét.
Legyen egy reakció időbeli lefolyására alkalmas a összefüggés:
A vizsgált egyenlet linearizálását logaritmizálással érhetjük el:
Biofizika gyakorlat példa hasonló alakú függvényről?
Standard deviáció számítása Ahhoz, hogy kiszámítsuk a b regressziós együttható standard deviációját, hasonlítsuk össze a mérésekhez kapcsolódó yi adatok szóródását yátlag körül és a regressziós egyenes pontjainak (Yi) szóródását az yátlag körül:
Egy tetszőleges yi pontot kiválasztva az yátlag-tól való eltérése a teljes különbség: (yi -yátlag ). Az egyenes megfelelő pontjának az átlagtól való eltérése (Yi - yátlag) a regresszióval magyarázható eltérés, míg (yi - Yi) adja a regresszióval nem magyarázható eltérést. Egyenlet formájában:
Ha az eltéréseket valamennyi pontra kiterjesztjük, a négyzetre emeléseket elvégezzük, rendezzük az egyenletet, akkor a négyzetes eltérések összegére a következőt kapjuk:
A regressziós becslés standard hibáját a maradék négyzetösszeg, a regresszióval nem megmagyarázható variancia adja:
A szabadsági fokok száma ebben az esetben kettővel csökken (n – 2), mivel két adatot, a -t és b -t határoztuk meg a mintából. A b standard hibáját megkapjuk, ha a regressziós becslés standard hibáját függetlenítjük az x változó mértékegységének megválasztásától:
A regressziós egyenesben szereplő a tengelymetszet standard hibáját a következő összefüggés adja:
A regressziós együtthatóra vonatkozó hipotézisvizsgálat Bebizonyítható, hogy a regressziós együttható (b) normális eloszlású véletlen változó, így a b/se(b) véletlen változó egy (n-2) szabadsági fokú t-eloszlást követ. A populáció regressziós együtthatójára () vonatkozó nullhipotézis segítségével megvizsgálhatjuk, hogy a két változó kapcsolata valós összefüggést takar-e, vagy a kapcsolat csupán látszólagos. Nullhipotézis: a populáció regressziós együtthatójának nullától való eltérése véletlen hatásoknak tulajdonítható.
Alternatív hipotézis: a regressziós együttható a két változó közötti valós kapcsolatra utal. 1. t-TESZT A nullhipotézis eldöntésére vonatkozó teszt statisztika:
2. ANOVA Az yi adatok átlagtól való eltérésének négyzetét két négyzetösszegre tudtuk felbontani, hasonlóan, ahogy a varianciaanalízis tárgyalásánál láttuk:
A felbontásban szereplő két variancia összehasonlításával, amelyet az F-teszt segítségével végezhetünk el, megvizsgálható, hogy a regresszió valós összefüggést mutat-e.
Nullhipotézis: a két variancia azonos populációból származik, a regresszióval magyarázható és a maradék variancia legfeljebb véletlen hatások miatt különbözhet egymástól. Alternatív hipotézis: a két variancia eltérő populációból származik, a két változó kapcsolata reális összefüggést takar.
Probléma: Tizenkét önkéntes férfi donor különböző mennyiségű antikoaguláns drogot kapott. A kutatók szignifikáns összefüggést kerestek az antikoaguláns dózisa és a protrombin idő között.
A kapcsolódó regressziós egyenes:
A regressziós becslés standard hibája:
A regressziós együttható standard hibája:
Nullhipotézis: az antikoaguláns dózisa és a protrombin idő nincs kapcsolatban egymással. Ezzel egyenértékű megfogalmazás, hogy a populáció regressziós egyenesének együtthatója zérus:
Alternatív hipotézis: a protrombin idő lineárisan függ az antikoaguláns koncentrációjától, azaz a valódi regressziós egyenes együtthatója zérustól különböző:
t-próba:
A szabadsági fokok száma: f = (n – 2) = 10. P = 0.05 valószínűségi szint választása esetén b nullától való eltérését szignifikánsnak ítéljük. A populáció valódi regressziós egyenesének regressziós együtthatója tehát nullától szignifikánsan különbözik.
F-teszt:
f1 = 1 és f2 = 10 szabadsági fokú varianciák esetén az F statisztika táblázata: 4.96. A nullhipotézist a P = 0.05 valószínűségi szint mellett elutasítjuk, és az alternatív hipotézist fogadjuk el, azaz a két szórás nem származhat azonos populációból. Ez ismételten azt jelenti, hogy a két változó reális kapcsolatban áll egymással.
Logisztikus regresszió (dózis-válasz probléma) A betegségek gyógyszeres kezelésének alapvető problémája, hogy az azonos betegségben szenvedő páciensek hogyan reagálnak azonos gyógyszerrel történő kezelésre.
Az általánosan elfogadott gyakorlat, hogy a válasz – az esély logaritmusa - a választott dózistól függ.
ahol d az alkalmazott dózis, a és b állandók, Pr(Y = 1) azon páciensek aránya, akik a d dózisra pozitív választ (Y = 1) adtak. Pr(Y = 0) azon páciensek aránya, akik az adott dózisra nem reagáltak. Az egyenletet exponenciális alakban is felírhatjuk:
A felírt összefüggésekből könnyen meghatározhatjuk az effektív medián dózist (E50), az a dózis, amelyre a páciensek 50% -a pozitív választ ad. Mivel ebben az esetben Pr(Y = 1) = 0.5 és Pr(Y = 0) = 0.5, ezért a baloldal logaritmusa log(0.5/0.5) = 0, így
Probléma: Duncan és munkatársai (Anaesthesia 39. 426-428, 1984) 137 gyermeken (1-12 éves) végeztek megfigyeléseket. Trimeprazinnal történő előkezelés után, 2.0-2.8 mg/kg thiopentont adagoltak 0.5 mg/kg lépésekben minden páciensnek 10 másodperces intervallumban, és ezt követően a szempillareflexet figyelték 20 sec -en keresztül: Y = 1, ha volt válasz, Y = 0, ha nem volt válasz
A regresszióanalízis szerint az effektív medián dózis: E50 = 1.99 mg/kg, a thiopentonnal történő kezelés szignifikáns változást eredményezett P = 0.001 valószínűségi szint mellett.
Teszt a regresszió linearitásának ellenőrzésére Fiatal leányok - 8 és 20 év között - átlagos szisztolés vérnyomása nem lineáris relációt követ. Az yi - Yi különbségeket vizsgálva, nagyobb életkorban ezek mind negatív előjelűnek adódnak.
A linearitás ellenőrzésének egy gyors és egyszerű modellje egy hipotézisvizsgálaton alapul. A módszer a sorrendbe állított yi - Yi különbségek előjelsorozatának véletlenségét vizsgálja. Ha ez véletlen minta, akkor a lineáris közelítés célravezető.