Reiczigel Jenő, 2006
1
Egytényezős (egyszempontos) varianciaelemzés k független minta (k kezelés vagy k csoport), a célváltozó minden csoportban normális eloszlású, a szórások azonosak, az átlagok vagy különböznek, vagy nem (épp ezt akarjuk eldönteni). Nullhipotézis: nincs különbség az átlagok között, kezelések/csoportok a célváltozó átlagára nézve mind azonosak: H0: µ1 = µ2 = ... = µk .
a
Ellenhipotézis: nem minden átlag egyenlő, a kezelések/csoportok között különbség van (NB. ez sokféleképpen előfordulhat!), H1: nem minden µi egyenlő egymással. Ha k = 2, akkor a varianciaelemzés ekvivalens a kétmintás t-próbával. Feltételek ellenőrzése: normalitásvizsgálat (khi-négyzet próba, Kolmogorov-Szmirnov-próba), szórások egyenlősége (Bartlett-próba, Levene-próba)
Reiczigel Jenő, 2006
2
Variancia-tábla (szórásfelbontás) A célváltozó variabilitását (amelyet az átlagától való eltérésnégyzetösszeggel mérünk) komponensekre bontjuk az alábbi módon: Teljes = Kezelések közötti különbségnek + Véletlen variabilitás tulajdonítható variabilitás variabilitás csoportok közötti csoporton belüli (reziduális, hiba) és ha a kezelések közötti különbségeknek tulajdonítható variabilitás szignifikánsan nagyobb, mint az ugyanazon kezelést kapottak közötti véletlen (nem a kezeléssel kapcsolatos – de lehet más, zavaró hatásnak tulajdonítható!) variabilitás, akkor a nullhipotézist elvetjük. A tesztelés a varianciák hányadosát véve, F-próbával történik (a részleteket elhagyjuk).
Reiczigel Jenő, 2006
3
Csoportok páronkénti összehasonlítása Ha a varianciaelemzés szignifikáns különbségeket mutat ki a kezelések között, azaz a H0: µ1 = µ2 = ... = µk nullhipotézist elvetjük, akkor kíváncsiak lehetünk arra, hogy nevezetesen mely kezelések között van különbség (NB. a nullhipotézis elvetéséből nem következik, hogy mind különböznek egymástól!) Sok t-próba egyenként 5%-os szinten végezve nem korrekt megoldás, mert összességében nagyobb lesz az elsőfajú hiba valószínűsége. Több korrekt módszer létezik, különféle előnyökkel és hátrányokkal (Tukey, Scheffé, stb.). Ha a kezelések nem mind egyenértékűek, hanem van közöttük egy (általában a kontroll), amelyhez az összes többit hasonlítani akarjuk, akkor a Dunnett-tesztet kell használnunk. Ez is korrigált elsőfajú hibával dolgozik (α = 0.05 az összes összehasonlításra együtt).
Reiczigel Jenő, 2006
4
Többtényezős (többszempontos) varianciaelemzés Több tényező – az egyszerűség kedvéért most legyen csak kettő: 1. tényező: k1 kezelés (k1 csoport), 2. tényező: k2 kezelés (k2 csoport). A kezeléskombinációk száma k2 × k2 . Tegyük fel, hogy r ismétléssel dolgozunk, azaz minden kezeléskombinációt r megfigyelési egységen alkalmazunk (ez összesen k2 × k2 × r megfigyelési egység). Feltétel itt is, hogy a célváltozó minden kezeléskombináció esetén normális eloszlású, a szórások pedig azonosak legyenek.
Reiczigel Jenő, 2006
5
Itt többféle nullhipotézist tesztelhetünk (ugyanúgy, mint az egytényezős esetben, a négyzetösszeg felbontása után F-próbával): - H0(1): az 1. tényező szerinti k1 kezelési csoport a célváltozó átlagára nézve mind azonos, az átlagok között nincs különbség: H0(1): µ1(1) = µ2(1) = ... = µk1(1) - H0(2): a 2. tényező szerinti k2 kezelési csoport a célváltozó átlagára nézve mind azonos, az átlagok között nincs különbség: H0(1): µ1(2) = µ2(2) = ... = µk2(2) - H0(1××2): az 1. és a 2. tényező hatása additív, együttes hatásuk a külön-külön vett hatások egyszerű összege, nincs közöttük kölcsönhatás, interakció (H0(1×2) elvetése azt jelenti, hogy a két hatás nem additív, van közöttük interakció) Az interakció azt is jelenti, akkor az 1. tényező szerinti kezelések hatása a 2. tényező szerinti kezelési csoportokban nem azonos.
Reiczigel Jenő, 2006
Interakció megjelenése az átlagok grafikonján: x tengely: 1. faktor szintjei (pl. 4 tartás) y tengely: függő változó (pl. súlygyarapodás) vonalak: 2. faktor szintjei (pl. 3 takarmány)
kb. párhuzamosak a vonalak a vonalak nem párhuzamosak a 2. faktor szintjei közötti különbség nem függ az 1. faktor szintjétől
a 2. faktor szintjei közötti különbség az 1. faktor szintjétől függően változik
nincs interakció
van interakció
6
Reiczigel Jenő, 2006
7
Példa: seregélyek testtömege hogy függ az ivartól és az évszaktól? Ivar Hím Évszak
Tojó
Ősz
x1 = 57 g x2 = 53 g
Tavasz
x3 = 55 g x4 = 51g
átlagos testtömeg hím
hím
nő
ősz
hím nő
nő
tavasz
ősz
tavasz
ősz
tavasz
Melyik ábra tartozik a táblázathoz? Van-e interakció az ivar és az évszak között?
Reiczigel Jenő, 2006
8
Fix és random faktorok/modellek Egyes tényezőknek nem tudjuk, vagy nem akarjuk az összes lehetséges szintjét figyelembe venni, pl. a mérés időpontja (napszak, évszak), a mérést végző laboráns, többcentrumos vizsgálatban a vizsgálatot végző intézmény, stb. Ekkor nem az a fontos, hogy az éppen figyelembe vett szintek (időpontok, intézmények, személyek) között van-e és mekkora a különbség, hanem hogy ezek a különbségek összességében mennyivel járulnak hozzá a vizsgált változó varianciájához (hogy ezt a többlet-varianciát el tudjuk különíteni a véletlen hibától). Az ilyen tényezőt véletlen tényezőnek (random factor), az ilyen tényezőt tartalmazó modellt véletlen modellnek (random effect model) nevezzük, szemben a fix tényezővel (fix factor) és fix modellel (fixed effect model). A vegyes vagy kevert modellben (mixed model) mindkét fajta tényező szerepel.
Reiczigel Jenő, 2006
9
Véletlen blokkos elrendezés Cél: egy zavaró változó hatásának kiszűrése Elv: a zavaró változó szerinti rétegzés; a rétegeken belül mindegyik kezelésből ugyanannyi, randomizálva Példa: 3 kezelést hasonlítunk össze, a szükséges mintaelemszám kezelésenként 5 (összesen 15) egyed. Technikai okok miatt az összes mérést egy nap alatt kell elvégezni, ez reggeltől estig tart. Mivel a célváltozó értéke napszak szerint változik, blokkos elrendezést választunk 5 blokkal (reggeli, délelőtti, déli, délutáni, esti blokk), blokkonként 3 méréssel (minden kezelésből 1), a kezeléseket a blokkokon belül randomizálva.
Reiczigel Jenő, 2006
10
Teljes véletlen vs. blokkos elrendezés Teljes véletlen elrendezés (teljes randomizálás)
K1 K2 K1 K2 K1 K3 K1 K2 K2 K3 K1 K3 K3 K3 K2 reggel
este
ha nincs tudomásunk inhomogeneitásról Véletlen blokkos elrendezés (blokkon belüli randomizálás)
K1 K2 K3 K2 K3 K1 K1 K3 K2 K3 K2 K1 K2 K1 K3 reggel
este
ha tudomásunk van inhomogeneitásról
Reiczigel Jenő, 2006
11
Az elrendezés garantálja, hogy a kezelés hatása és a blokkhatás szétválasztható, az pedig, hogy a szórásfelbontásban a blokk-hatásnak tulajdonítható szórás el van különítve a véletlen hibától, erősebb tesztet eredményez. A kiértékeléshez használt statisztikai programot úgy kell paraméterezni, mintha 2 tényezős elrendezést használtunk volna, de a tényező hatása és a blokkhatás közötti interakciót kizárjuk és a blokkhatás szignifikanciáját nem vizsgáljuk. (Ha a program képes erre, a blokkot véletlen faktorként szokás definiálni.)
Reiczigel Jenő, 2006
12
Adatbevitel: kezelés sorszáma
blokk sorszáma
mért érték
1
1
25.4
2
1
20.1
3
1
19.6
2
2
21.3
3
2
18.5
1
2
22.7
...
...
...
Reiczigel Jenő, 2006
13
Latin négyzet elrendezés Cél: két zavaró változó hatásának kiszűrése Elv: mindkét zavaró változó szerinti rétegzés (!!!); a rétegeken belül mindegyik kezelésből ugyanannyi, randomizálva Ha k kezelést hasonlítunk össze, akkor mindkét zavaró változó szerint k réteget képezünk: kxk-as latin négyzet, benne összesen k2 egyed Ha a megkívánt pontossághoz szükséges mintaelemszám ennél nagyobb, akkor több kxk-as latin négyzetet szerkesztünk, így a mintaelemszám 2k2, 3k2, stb. lehet.
Reiczigel Jenő, 2006
14
Példa: tegyük fel, hogy az előző példában a célváltozót a napszak mellett a páciens testsúlya is befolyásolja. Mivel 3 kezelést hasonlítunk össze, 3x3-as latin négyzettel dolgozunk. A 9 pácienst testsúly szerint 3 csoportba osztjuk (S1, S2, S3), majd a napszak szerinti blokkokba minden testsúly szerinti csoportból kisorsolunk egyet-egyet. Ezzel belesorsoltuk őket egy 3x3-as táblázat celláiba. Ezután a cellákhoz kisorsoljuk a kezeléseket (K1, K2, K3) úgy, hogy minden sorban és minden oszlopban minden kezelés pontosan egyszer forduljon elő (ettől latin négyzet). súly S1 S2 S3 Például így: napsz. További latin négyzeteket kaphatunk a 8-11 K1 K3 K2 sorok (oszlopok) cserélgetésével. 11-14 K2 K1 K3 14-17
K3
K2
K1
Reiczigel Jenő, 2006
15
Látható, hogy a latin négyzet elrendezés akkor kivitelezhető könnyen, ha a zavaró változók folytonosak, mert ekkor könnyen hozhatunk létre belőlük épp a kezelések számával megegyező számú kategóriát. A kiértékeléshez használt statisztikai programot úgy kell paraméterezni, mintha 3 tényezős elrendezést használtunk volna. Itt is kizárjuk az interakciókat, és itt sem vizsgáljuk a sor-, illetve oszlophatás szignifikanciáját.
Reiczigel Jenő, 2006
16
Adatbevitel: napszak blokk 1 1 1 2 2 2 3 3 3
súly blokk 1 2 3 1 2 3 1 2 3
kezelés sorsz. 1 3 2 2 1 3 3 2 1
mért érték 25.0 20.1 19.6 21.3 22.5 22.7 21.8 18.9 21.8
Reiczigel Jenő, 2006
17
Több mérés ugyanazokon az egyedeken: „repeated measures” Az eddigi elrendezésekben minden megfigyelési egységen egyetlen mérést végeztünk. Többféle ok miatt (de leggyakrabban az egyedek közötti jelentős különbségek miatt) szükség lehet arra, hogy minden egyes egyeden több mérést végezzünk. Az ilyen kísérleteket ismételt méréses kísérletnek nevezzük.
Reiczigel Jenő, 2006
18
Példák:
a) méréseket végzünk az állat több testrészén, szervén (pl. vérvétel több helyről)
b) méréseket végzünk ugyanazon az állaton különféle körülmények között (pl. nyugalmi állapotban vagy terheléssel)
c) a kísérletben a megfigyelési egység egy több egyedből álló egység (pl. egy alom) és minden egyeden méréseket végzünk
d) méréseket végzünk ugyanazon az állaton sorban egymást követő időpontokban (az ilyen adatokat longitudinális adatoknak nevezik, fontos különbség az előzőkhöz képest, hogy itt az időpontoknak kötött sorrendje van)
Reiczigel Jenő, 2006
19
Általában az ilyen kísérletben is az egyedek két (esetleg több) csoportjával dolgozunk (pl. kezelt-kontroll) és az elsődleges cél ezek (between subject factors) összehasonlítása. Az a) és b) esetben emellett kíváncsiak lehetünk arra is, hogy az egyes testrészek, illetve állapotok között van-e különbség (within subject factors). A d)-nél általában a mért értékek időbeli lefutása érdekes, amit ún. válaszgörbék (response curves) formájában szoktak ábrázolni. Az a) b) c) esetekben a kiértékelésre vagy repeated measures ANOVA módszert vagy mixed modellt (random faktor az egyed!) szokás használni (egyenértékűek). A d) esetben ez ellenjavallt, ilyenkor ajánlatos inkább az egyedi adatsorokból különféle, a görbe lefutására jellemző, klinikailag releváns mutatókat (summary measures) számítani (a min/max ideje, értéke, a görbe alatti terület, stb.) majd ezekkel dolgozni tovább.
Reiczigel Jenő, 2006
20
Adatbevitel repeated measures ANOVA-hoz: kezelés
1. mért érték
2. mért érték
1
12.1
11.6
14.9
...
1
13.2
15.4
19.7
...
1
11.1
12.9
15.9
...
2
23.3
21.0
28.7
...
2
21.8
20.5
29.1
...
2
19.5
25.3
25.8
...
...
...
...
...
...
3. mért érték ...
Reiczigel Jenő, 2006
21
Adatbevitel mixed modellhez: kezelés
egyed
1
1
1
12.1
1
1
2
11.6
1
1
3
14.9
...
...
...
...
1
2
1
13.2
1
2
2
15.4
1
2
3
19.7
...
...
...
...
mérés sorsz. mért érték
Reiczigel Jenő, 2006
22
Crossover elrendezés Cél: a kimutatandó hatáshoz képest nagy egyedi variabilitás kiszűrése Elv: ugyanazt az alanyt valamennyi kezelésben részesítjük, és az így mért hatásokat hasonlítjuk össze (ismételt méréses vizsgálat!) Tipikus alkalmazási terület: krónikus betegségek (asztma, magas vérnyomás, cukorbetegség, reuma, stb.), amikor a kezeléstől gyógyulás nem várható, csak a tünetek enyhítése, az állapot javítása. Az első kezelés befejezése után az állapot lassan visszaáll a kezdetire, és a második kezelést is ki lehet próbálni. Alkalmazása nem előnyös, ha a kezelések túl hosszantartóak, mert ilyenkor a páciensek vizsgálat közbeni elmaradásának valószínűsége megnőhet.
Reiczigel Jenő, 2006
23
A legegyszerűbb elrendezésben két csoporttal dolgozunk, az egyik csoportban a kezeléseket AB, a másikban BA sorrendben alkalmazzuk („AB/BA design”). Az egyes kezelési periódusok között kellő szünetet (wash-out period) kell hagyni. A kiértékeléskor figyelembe vett hatások a következők: - a kezelés hatása (ezt akarjuk vizsgálni) - csoport-hatás (zavaró hatás, ellene randomizáció) - periódus-hatás (zavaró hatás) - carry-over hatás (zavaró hatás) Az AB/BA elrendezésben a zavaró hatások nem választhatók szét (confounding), ezért sokan kritizálták. Léteznek jobb (de bonyolultabb) elrendezések, több periódussal (pl. ABA/ABB).
Reiczigel Jenő, 2006
24
Adatbevitel: egyed
csoport
periódus
kezelés
mért érték
1
AB
1
A
13
1
AB
2
B
19
2
AB
1
A
14
2
AB
2
B
18
...
...
...
...
...
11
BA
2
A
15
11
BA
1
B
17
...
...
...
...
...
Reiczigel Jenő, 2006
25
Ekvivalencia-kísérletek Két kezelés, A és B (pl. egy új és a standard kezelés) hatásának egyenértékűségét szeretnénk bizonyítani. Jelölje X a hatás mérésére szolgáló számszerű változót (pl. vérnyomás, fájdalom-szkór, stb). Ha a hatások egyenlőséget választanánk nullhipotézisnek, akkor – még ha az eredmény a H0 megtartása lenne is – csak azok hinnének benne (továbbra is), akik már a kísérlet előtt sem kérdőjelezték meg. Az ekvivalenciát csak az bizonyíthatja a kétkedők számára is meggyőzően, ha az eredmények alapján mind a
H0’: B hatásosabb, mint A, mind pedig a
H0”: B kevésbé hatásos, mint A hipotézisek elvethetők.
Reiczigel Jenő, 2006
26
Itt persze a „hatásosabb”-at a klinikailag még releváns különbség figyelembe vételével szokták érteni. Például ha a hatások közötti 15%nál kisebb különbség orvosi szempontból már irreleváns, azaz a kezelések orvosilag egyenértékűnek tekinthetők, ha 0.85 µA < µB < 1.15 µA ahol µA és µB az X átlagértéke a két kezelés mellett, akkor a hipotézisek
H0’: 1.15µA ≤ µB ,
illetve
H0”: µB ≤ 0.85µA .
Megjegyzés: bár az ekvivalencia-tartományt leggyakrabban valóban relatív különbség – százalékos eltérés – formájában szokás definiálni, használhatnánk abszolút különbséget is. Ha az eredmények mindkét nullhipotézis elvetéséhez vezetnek, akkor a kísérlet statisztikailag (empirikusan) bizonyította a kezelések ekvivalenciáját. (Másik – ekvivalens – módszer: konfidencia-intervallum µA /µB -re)