Tartalom
Tartalomjegyzék 1. Mi a statisztika?
1
2. A statisztika alapfogalmai
3
3. Deskriptív statisztika 3.1. A deskriptív statisztikáról általában . . . . . . 3.2. Egyváltozós elemzés, kategoriális változó . . . . 3.3. Egyváltozós elemzés, folytonos változó . . . . . 3.4. Két kategoriális változó kapcsolata: asszociáció 3.5. Két folytonos változó kapcsolata: korreláció . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
5 . 5 . 6 . 8 . 11 . 11
4. Induktív statisztika 12 4.1. A mintavételi helyzet konzekvenciái . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 4.2. Becsléselmélet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 4.3. Hipotézisvizsgálat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 5. Klinikai vizsgálatok
19
1. Mi a statisztika? Mi a statisztika? • Hivatalosan: „A statisztika a valóság számszerűsíthető tényeinek szisztematikus összegyűjtésével és elemzésével foglalkozó tudományos módszer és gyakorlat” • Nemhivatalosan: – „A hazugságok három kategóriába sorolhatóak: kis hazugságok, gyalázatos hazugságok, és statisztikák” (Benjamin Disraeli-nek tulajdonítva) – „A statisztika a matematika azon ága, melynek feladata, hogy eszközt adjon a politikusok kezébe, mellyel tetszőleges állítás és annak ellentéte is tudományos alapon igazolható” (Általános iskolai matematika tanárom) Miért statisztika? • Akkor miért foglalkozzunk statisztikával? • Ennek ellenére? • Nem! Éppen ezért! Miért jó, ha értünk a statisztikához? • (Személyes vélemény jön) • 3 fő szempont: 1. Hogy ne tudjanak átverni minket 2. Hogy új ismereteket szerezzünk 3. Hogy feltevéseinket precízen vizsgáljuk
1
Feltevések precíz vizsgálata • Elsősorban az agrometriából indult a XX. század elején • Nagyon hamar kapcsolódott az orvoslás is • Ok: az orvostudomány empirikussá válása • Később ez a gondolat az evidence-based medicine-ben teljesedett ki • Például a gyógyszerkísérletek kapcsán hatalmas gyakorlati jelentősége van nüanszoknak is Új ismeretek szerzése • Adatok strukturálása, alkalmas megjelenítése, információtömörítés, lényegkiemelés • Hatalmas motivációt jelent a számítástechnikai (és orvosi) lehetőségek fejlődése miatt létrejövő egyre nagyobb és nagyobb adatbázisok léte Hogy ne tudjanak átverni minket • „A KSH szerint 2011-ben a magyar bruttó átlagkereset 213 ezer forint volt. Mégis, a másik táblázatból az derül ki, hogy az emberek 68%-a ennél kevesebbet keresett! Hogy a fenében lehetne akkor ez az átlag?! A KSH hazudik!” • „A HRT-kezelésben részesülő nők körében 1,8-szer kevesebb a szív-érrendszeri megbetegedés, mint az ilyet nem kapók között. A HRT-kezelés tehát jó hatással van a kardiovaszkuláris rendszerre.” • „A minap a suliból (munkahelyem) hazafelé tartva, a buszra vártam. Néhány diák a közelben beszélgetett. Az volt a téma, hogy milyen sokan hiányoznak az osztályból, mert betegek. Egyikük megjegyezte, hogy ő is azóta beteg, mióta megkapták az oltást.” Korreláció nem implikál kauzalitást • Tűzoltók példája: a tűzesetben esett kár és a kiküldött tűzoltók száma • HRT-s példa: HRT-kezelés megléte és a kardiovaszkuláris rizikó • Két dolog együttjárásából nem következik, hogy az egyik okozza a másikat!
A biostatisztika elhatárolása • „Valószínűségszámítás → Statisztika → Alkalmazott statisztikai ágak” – Biostatisztika, Pszichometria, Agrometria, Ökonometria stb. • vs. bioinformatika: inkább számítástechnikai kérdések, nagy adatbázisokon hatékony algoritmus megoldások • vs. biomatematika: inkább nem-statisztikai, elsősorban analízisbeli modellezési eszközök (pl. differenciál-egyenletek) használata
2
Milyen alapokra van szükség, hogy biostatisztikával foglalkozzak? • Valószínűségszámítás, lineáris algebra • Matematikai statisztika • Orvosi ismeretek Statisztikai programcsomagok • Mai biostatisztika elképzelhetetlen számítógépes támogatás nélkül • Pár közismert, biostatisztikára (is) használható program: SAS Gyógyszeripar kedveli, jól standardizált, rettenetesen drága SPSS Általános célú statisztikai programcsomag (eredetileg szociológusoknak), az alap dolgokat könnyű megcsinálni, a komplexebbeket cserében nagyon nehéz R Klasszikus „akadémiai” programcsomag, az alap dolgokat sem könnyű megcsinálni, a komplexebbeket cserében viszont lehet; ingyenes és nyílt forráskódú (!), http://www.r-project. org/ Ez az előadás. . . • Áttekintés a biostatisztika szempontjából legfontosabb statisztikai alapokról • Részletek nélkül, csak bevezető jelleggel (képlet, levezetés alig) • Összbenyomás a területről • Szemléletformálás • Klinikai vizsgálatok, mint a biostatisztika fontos adatforrása, alkalmazási területe
2. A statisztika alapfogalmai Pár demonstratív kérdés, amit szeretnénk megválaszolni • Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? • Egy új vérnyomáscsökkentő gyógyszer-jelölt nem okoz megnövekedett epilepszia-kockázatot? • Magasfeszültségű vezeték közelében tartózkodás növeli a rák-kockázatot? • Milyen tényezők hatnak adott rákban a túlélési időre? • Mennyi jelen kurzus hallgatóinak átlagos testtömege? • Mennyi az I. éves fiú egyetemisták átlagos testtömege? • Igaz-e, hogy az I. éves fiú egyetemisták átlagos testtömege 70 kg? • Van-e összefüggés tehenek takarmányozása és a tejhozamuk között? Pár definíció • Amire (akikre) a kérdésünk irányul: (cél)populáció, sokaság • Elemei: megfigyelési egységek • Amely jellemzőire kíváncsiak vagyunk: változó (vagy ismérv) • A változó értékének meghatározása egy adott sokasági elemre: megfigyelés • Nagyon ritkán tudjuk a sokaság valamennyi elemét megfigyelni (ez lenne a teljeskörű megfigyelés), technikai gondok, és. . . 3
Kicsit elidőzve a sokaság fogalmánál • „Mennyi jelen kurzus hallgatóinak átlagos testtömege?” → véges sokaság (N = 23) • De: „Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást?” – Mi itt a sokaság? – Ez végtelen sokaság! (Szokás fiktívnek is nevezni.) Mintavétel • Tehát: általában nem tudjuk az egész sokaságot megfigyelni → mintavételes helyzet • Amit meg tudunk figyelni: minta • (Illetve tervezett minta, nem biztos, hogy pont ezt figyeljük meg ténylegesen)
Sokaság Tényleges minta Tervezett minta
• Induktív statisztikánál foglalkozunk vele tovább Mérés, mérési skálák • A vizsgált tulajdonságot mérhetővé kell tenni – Operacionalizálás – Proxy változók • Mérési skálák (SS Stevens, 1946) 1. Nominális skála 2. Ordinális skála 3. Intervallum skála 4. Arányskála • Az első két típusba tartozót szokás kategoriális változónak (diszkrét, minőségi) is nevezni. . . • . . . az utóbbi kettőt pedig nagyon gyakran egyszerűen (valódi) skálán mért (folytonos, mennyiségi) változónak Adatok jellemzői • Keresztmetszeti • Idősoros • Panel (longitudinális)
4
Példa adatbázis • Baystate Medical Center (Springfield, Massachusetts, USA) Low Infant Birth Weight adatbázisa (1986) • R-ben: MASS könyvtár birthwt adatbázis
• Kis kivonat:
low 0 0 0 0 0 0
age 19 33 20 21 18 21
lwt 182 155 105 108 107 124
race 2 3 1 1 1 3
smoke 0 0 1 1 1 0
ptl 0 0 0 0 0 0
ht 0 0 0 0 0 0
ui 1 0 0 1 1 0
ftv 0 3 1 2 0 0
bwt 2523 2551 2557 2594 2600 2622
A példa adatbázis jellemzése • Keresztmetszeti • n = 189 elemű minta egy fiktív, végtelen sokaságból
• Változók:
Rövidítés low age lwt race smoke ptl ht ui ftv bwt
Tartalom Születési ttkg <2,5 kg? Anya életkora [év] Anya ttkg (UM) [kg] Rassz Anya dohányzik? Korábbi koraszül. száma Anya hypertonia? Irritábilis méh? Vizitek száma (1. trim.) Születési tömeg [g]
Mérési skála Nominális (bináris) Arányskála Arányskála Nominális Nominális (bináris) Ordinális Nominális (bináris) Nominális (bináris) Ordinális Arányskála
3. Deskriptív statisztika 3.1. A deskriptív statisztikáról általában Mi a deskriptív statisztika? • Röviden: nem törődünk a mintavételes helyzettel! • A minta az „univerzum”, úgy vesszük mintha csak a minta „lenne” • Tipikus feladat itt: információtömörítés, a mintában lévő információ legjobban emészthetővé tétele • Trade-off a tömörítésnél: Áttekinthetőség ↔ Hűség Az információtömörítés trade-off-ja • Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622, . . . , 2495, 2495, 2495 • Tömörítések – 2944,6 – 2944,6 ± 729,2 – 2944,6 (2977) ± 729,2 (1073) – 2944,6 (2977) [709 − 4990] ± 729,2 (1073)
5
• Mi a cél? → az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) • Az információtömörítés ugyan „adatvesztés”, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! • Egyensúlyozni kell a kettő között Exploratív adatelemzés • Grafikus technikák előnyei • Az emberi agy különösen jó az ilyen (vizuális) információk feldolgozásában • Ügyes vizualizáció sokat érhet! • „There is no excuse for failing to plot and look!” (JW Tukey) A deskriptív statisztika dimenziói • Eszköze szerint – Analitikus (mutatószám) – Grafikus (ábra) • Változók száma szerint – Egyváltozós – Többváltozós – (Sokváltozós) • A változók mérési skálája szerint – Kategoriális – Folytonos – (Vegyes)
3.2. Egyváltozós elemzés, kategoriális változó Példa ptl (korábbi koraszülések száma): low 0 0 0 0 0 0
age 19 33 20 21 18 21
lwt 182 155 105 108 107 124
race 2 3 1 1 1 3
smoke 0 0 1 1 1 0
ptl 0 0 0 0 0 0
ht 0 0 0 0 0 0
ui 1 0 0 1 1 0
ftv 0 3 1 2 0 0
Analitikus eszközök • Gyakorisági sor:
f f0 g g0
0 159 159 0,841 0,841
1 24 183 0,127 0,968
2 5 188 0,0265 0,995
• (Istenigazából semmilyen adatvesztést nem jelent most) • A kumulálásnak csak ordinális változónál van értelme! 6
3 1 189 0,00529 1
bwt 2523 2551 2557 2594 2600 2622
Grafikus eszközök: oszlopdiagram
100 0
50
Gyakoriság [darab]
150
Korábbi koraszülések
0
1
2
3
Korábbi koraszülések száma
Grafikus eszközök: tortadiagram Korábbi koraszülések
0
3 2
1
Korábbi koraszülések száma
Grafikus eszközök • Melyik jobb? Miért? (Van rá tudományos válasz!) • Az emberi szem sokkal jobban érzékeli a lineáris méreteket, mint a relatív területeket Analitikus eszközök • Módusz : a legnagyobb gyakoriságú ismérvérték • (Ordinálisnál elvileg mediánról is lehetne beszélni, inkább máshol vezetjük be) • Ezen kívül más mutatónak nincs sok értelme
7
3.3. Egyváltozós elemzés, folytonos változó Példa bwt (születési súly): low 0 0 0 0 0 0
age 19 33 20 21 18 21
lwt 182 155 105 108 107 124
race 2 3 1 1 1 3
smoke 0 0 1 1 1 0
ptl 0 0 0 0 0 0
ht 0 0 0 0 0 0
ui 1 0 0 1 1 0
ftv 0 3 1 2 0 0
bwt 2523 2551 2557 2594 2600 2622
Analitikus eszközök: osztályközös gyakorisági sor I. • Szokásos gyakorisági sor már nem készíthető (könnyen lehet, hogy minden számból csak 1 lesz!) • Megoldás az osztályközös gyakorisági sor: Ci0 500 1000 1500 2000 2500 3000 3500 4000 4500
Ci1 1000 1500 2000 2500 3000 3500 4000 4500 5000
fi0 1 5 19 59 97 142 180 187 189
fi 1 4 14 40 38 45 38 7 2
gi 0,00529 0,0212 0,0741 0,212 0,201 0,238 0,201 0,037 0,0106
gi0 0,00529 0,0265 0,100 0,3123 0,513 0,751 0,952 0,989 1,00
Analitikus eszközök: osztályközös gyakorisági sor II. De vigyázat, itt már van információvesztés! → kérdés, hogy hogyan vesszük fel az osztályközöket Grafikus eszközök: hisztogram
20 10 0
Gyakoriság
30
40
A születési súlyok hisztogramja
1000
2000
3000 Születési súly [g]
8
4000
5000
Grafikus eszközök: hisztogram • A számegyenest diszjunkt intervallumokra osztjuk, és megszámoljuk, hogy az egyes intervallumokba hány megfigyelési egység esik νi nhi • (Mintha az osztályközös gyakorisági sorból gyártanánk oszlopdiagramot csak rések nélkül) • A hisztogram hatalmas előnye, hogy hihetetlenül szemléletes: az eloszlás rengeteg fontos jellemzője „ránézésre leolvasható” • Hátránya, hogy érzékeny az intervallumok határainak megválasztására • (A hisztogram a háttéreloszlás sűrűségfüggvényét fogja becsülni) Grafikus eszközök: magfüggvényes becslő
3e−04 2e−04 0e+00
1e−04
Gyakoriság
4e−04
5e−04
A születési súlyok magfüggvényes suruségbecslése
0
1000
2000
3000
4000
5000
Születési súly [g]
Grafikus eszközök: magfüggvényes becslő • A mintapontokat koncentrált helyett valódi eloszlással helyettesíti • Kevésbé paraméterérzékeny (de azért ezen is kell paraméterezni) Analitikus eszközök: a centrális tendencia mutatói I. • Átlag, jele x: az a szám, mellyel valamennyi megfigyelési egységnél helyettesítve a változó tényleges értékét, az értékösszeg változatlan maradna, azaz Pn xi S x = = i=1 n n • Akkor van értelme, ha a változónál az összeg bír tárgyi értelemmel! (Ha a szorzat, akkor a mértani átlag adódik.) • Előnye, hogy közismert tartalmú, jól értelmezhető, hátránya, hogy nem robusztus (outlier-ekre érzékeny)
9
Analitikus eszközök: a centrális tendencia mutatói II. • Medián, jele M e: az a szám, melyre teljesül, hogy a megfigyelési egységek fele nála kisebb, fele nála nagyobb, tehát a „középső elem” (páratlan elemszámnál egyértelmű, párosnál legyen mondjuk a két középső átlaga) • Előnye, hogy robusztus, hátránya, hogy kevésbé közismert • p-kvantilis: a medián általánosítása, a minta p-ed része alatta, (1 − p)-ed része felette van • Nevezetes kvantilisek: kvartilisek (negyedelőpontok: Q1 , Q2 ≡ M e, Q3 ), decilisek (tizedelőpontok: D1 , D2 , . . . , D9 ), percentilisek (századolópontok: P1 , P2 , . . . , P100 ) Analitikus eszközök: a szóródás mutatói • Minimum, maximum: a minta legnagyobb és legkisebb eleme • Terjedelem, jele R: a maximum és a minimum különbsége • Szórás, jele σx : az átlagtól vett átlagos eltérés, négyzetes átlagot használva s Pn 2 i=1 (xi − x) σx = n • Előnye, hogy közismert tartalmú, hátránya, hogy nem robusztus (duplán nem) • Interkvartilis terjedelem, jele IQR: a felső és alsó kvartilis különbsége (IQR = Q3 − Q1 ) • Előnye, hogy robusztus Grafikus eszközök: boxplot A születési súlyok boxplot−ja
●
1000
2000
3000
4000
5000
Születési súly [g]
Grafikus eszközök: boxplot • Doboz Q1 -től Q3 -ig, benne megjelölve M e • Antennák vagy a minimumig és a maximumig nyúlnak ki, vagy a legtávolabbi elemig, ami nincs messzebb a M e-től mint az IQR α-szorosa (tipikusan α = 1,5) • Ez utóbbi egyszerű outlier-keresést is lehetővé tesz • Nagy előnye, hogy rendkívül kompakt, és robusztus is 10
3.4. Két kategoriális változó kapcsolata: asszociáció Példa • Két kategoriális változó kapcsolatát asszociációnak nevezzük • race (rassz) és ptl (korábbi koraszülések száma): low 0 0 0 0 0 0
age 19 33 20 21 18 21
lwt 182 155 105 108 107 124
race 2 3 1 1 1 3
smoke 0 0 1 1 1 0
ptl 0 0 0 0 0 0
ht 0 0 0 0 0 0
ui 1 0 0 1 1 0
ftv 0 3 1 2 0 0
bwt 2523 2551 2557 2594 2600 2622
Analitikus eszközök: kontingenciatábla • Ez is hordoz minden információt: 0 82 22 55
1 2 3
1 10 4 10
2 3 0 2
3 1 0 0
• Kapcsolat értelmezése: viszonyítás a függetlenséghez (mennyi információt jelent a sor szempontjából, ha tudjuk, hogy az alany melyik oszlopba tartozik? – és viszont) • Mutatók: χ2 , Cramer-V stb. stb.; nagyon számítanak a feltevések Grafikus eszközök: mozaikábra A rassz, és korábbi koraszülések mozaikábrája ptl 1
2 3
2
●●
3
race
1
0
●
3.5. Két folytonos változó kapcsolata: korreláció Példa • Két folytonos változó kapcsolatát korreláció nevezzük 11
• lwt (anyai testtömeg) és bwt (születési tömeg): low 0 0 0 0 0 0
age 19 33 20 21 18 21
lwt 182 155 105 108 107 124
race 2 3 1 1 1 3
smoke 0 0 1 1 1 0
ptl 0 0 0 0 0 0
ht 0 0 0 0 0 0
ui 1 0 0 1 1 0
ftv 0 3 1 2 0 0
bwt 2523 2551 2557 2594 2600 2622
Grafikus eszközök: szóródási diagram Ez minden információt hordoz:
5000
Az anya és az újszülött testtömegének szóródási diagramja ●
●
4000
● ● ●
● ●● ●
3000
●
●
● ● ●
●
● ●
●
●
● ● ● ● ● ●
●● ● ●
● ●
●
● ●●
●
●
●
●
● ●
● ●
● ●
●
●
● ●
●
●
●
●
●
● ●
●
●
● ●
●
●
●
●●
● ●
● ●● ●
●
● ● ● ●
●
● ●● ● ●● ●
●
●
● ●
●
● ●
●
● ● ●
●●● ●
●
●
● ● ● ●● ● ● ● ● ● ● ● ● ●●
●
●
●●
●● ● ●
●
●
● ● ●● ● ●
● ●
● ● ●
●
●
2000
Születési tömeg [g]
●
●
● ●
● ● ● ● ●
● ●
● ●
●
● ●
● ● ●
●
● ●
●
●
●
●
● ●
●
● ●
●
●
1000
● ● ●
●
100
150
200
250
Anya testtömege (UM) [font]
Analitikus eszközök: korrelációs együttható • Korrelációs együttható, jele r: a két változó közti sztochasztikus kapcsolat mérőszáma Pn 1 i=1 [(xi − x) (yi − y)] n rx,y = σx · σy • A kapcsolat irányát és szorosságát mutatja
4. Induktív statisztika 4.1. A mintavételi helyzet konzekvenciái Emlékeztetőül • Nagyon sok esetben technikai okokból, vagy elvileg is lehetetlen a teljes sokaság megfigyelése • Csak egy részét, a mintát ismerjük • És itt jön a kulcsprobléma: mi mégis a sokaságról akarunk nyilatkozni ! • Lehet egyáltalán? Hogyan? • Biztosat már nem tudunk mondani. . . de valószínűségi állítást igen! 12
Mintavételi ingadozás • Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1. a jellemző sokaságbeli értékétől 2. attól, hogy konkrétan hogy választottuk ki a mintát • Mi értelemszerűen az elsőre vagyunk kíváncsiak • . . . csakhogy a – kikerülhetetlen – második („pont milyen mintát vettünk”) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog • A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! • Hibázhatunk, de ennek természetéről tudunk nyilatkozni Mintavételi hiba • Figyelem, ennél a hibázásnál nem arról van szó, hogy „rosszul” veszünk mintát: például a legtökéletesebben véletlenszerű mintavételnél is előfordulhat, hogy egy 1000 fős sokaságból úgy becsüljük az átlagos testtömeget, hogy pont a 30 legkönnyebbet választjuk ki • De: ennek a valószínűsége extrém kicsi! 30 • (Egész pontosan 1/ 1000 ≈ 4 · 10−56 %) • Így értendő, hogy ez a hiba valószínűségszámítási úton, sztochasztikusan limitálható • Ezt nevezzük mintavételi hibának Nem-mintavételi hiba • Ez természetesen arra vonatkoznak, hogy mi a mintavételi ingadozásból adódó hiba • De nem csak ilyen van: alullefedés, túllefedés, kódolási hiba stb. és a legnagyobb baj: a minta megválasztása • Mi van, ha a minta nem véletlen részhalmaza a sokaságnak? (→ reprezentativitás kérdése) • Literary Digest esete • Különösen óvatosan a kényelmi mintával • Survey statisztika (külön szak!)
4.2. Becsléselmélet Pontbecslés • Feladat: valamely sokasági jellemző meghatározása minta alapján • Például sokaság átlaga/várhatóértéke minta alapján • Naiv tipp: mondjuk a minta átlagát becslésként! • Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre • Mi az, hogy „ jó” becslő? A két legfontosabb tulajdonság:
13
1. Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2. Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) • A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás Mintavételi eloszlás: egy állítás • Ha a sokaság X ∼ N µ, σ 2 eloszlást követ (tehát figyelem: ez egy ún. eloszlásával (és nem elemeivel!) adott sokaság; fiktív, végtelen sokaságnál tipikus), akkor a belőle vett n elemű minták átlaga, azaz a µ sokasági várhatóérték (mint sokasági jellemző) fenti becslőfüggvénye x ∼ N µ, σ 2 /n eloszlást fog követni • (Tehát feltételeztük, hogy azt a priori tudjuk, hogy normális eloszlású a sokaság, sőt, σ-t is ismertnek vesszük → csak a µ a kérdés) • Figyelem, a sokasági jellemző, amit becsülni szeretnénk, itt a µ maga; az tehát nem követ semmilyen eloszlást, egy – konstans – szám! (Csak mi nem ismerjük.) • Ez csak fae (független, azonos eloszlású) mintavételre igaz • Ez matematikai úton (valószínűségszámítási módszerekkel) belátható; hogy legyen pár képlet is, bármennyire is bevezetésről van szó, ezt megmutatjuk Bizonyítás I. • Legyen az n elemű mintánk X1 , X2 , . . . , Xn ∼ N µ, σ 2 fae (mivel fae, mindegyik ugyanolyan eloszlást követ) • Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) • Ezzel a becslőfüggvényünk: X =
Pn
i=1
Xi
n
• Valószínűségszámításból tudjuk, hogy 1. Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2. A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3. Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak Bizonyítás II. • A fenti háromból már következik, hogy
Pn
i=1
Xi ∼ N nµ, nσ 2
• Szintén valószínűségszámításból tudjuk, hogy 1. E (aX) = aEX 2. D2 (aX) = a2 D2 X • Amiből pedig már következik, hogy Pn X=
i=1
Xi
n
∼ N µ, σ 2 /n ,
ahogy állítottuk is • Íme egy – nagyon egyszerű – példa a matematikai statisztikára! 14
Intervallumbecslés • A fentiekkel egyetlen számot, „a” legjobb becslést adjuk vissza eredményként • Nem adunk számot arról, hogy ebben mekkora a bizonytalanság. . . • . . . pedig erről is tudunk nyilatkozni! („Kalkulálható bizonytalanság”) • Tipikus szemléltetés: konfidenciaintervallum (CI): mi az a tartomány, amire igaz, hogy ha sokszor megismételnék a mintavételt, és mindegyik mintából megszerkesztenénk a CI-t, akkor ezen CI-k várhatóan 95%-a tartalmazná az igazi (sokasági) értéket (95% megbízhatóság melletti CI) • Nagyobb megbízhatóság ↔ semmitmondóbb intervallum Példa I. • Például: tudjuk, hogy X ∼ N µ, σ 2 /n • Ebből következik, hogy
X−µ √ σ/ n
∼ N (0, 1)
• Azaz X −µ √ < z = Φ (z) − Φ (−z) = Φ (z) − [1 − Φ (z)] = P −z < σ/ n = 2Φ (z) − 1 • Emiatt, ha
α α 2Φ (z) − 1 = 1 − α ⇒ Φ (z) = 1 − ⇒ z = Φ−1 1 − =: z1− α2 , 2 2 i h akkor rögtön látható, hogy a µ − z1− α2 √σn , µ + z1− α2 √σn tartományba 1 − α valószínűséggel esik X („deduktív statisztika”)
Példa II. • Átrendezve „kapjuk” az induktív statisztikát: X −µ √ < z1− α2 = 1 − α ⇒ P −z1− α2 < σ/ n σ σ =1−α ⇒ P X − z1− α2 √ < µ < X + z1− α2 √ n n • Tipikusan: h α = 0,05, ekkor a 95%-os i konfidenciaintervallum immár egy konkrét mintára a fenti σ σ √ √ α α alapján: x − z1− 2 n , x + z1− 2 n • Vigyázat, csak mintavétel előtt vannak val. változók, utána („kis betűk”) már nem, ezért használtuk a megbízhatóság szót a valószínűség helyett – az állítás csak (képzelebeli) „ismételt mintavételi” értelemben igaz
4.3. Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai • Feladat: sokaságra vonatkozó állítás eldöntése minta alapján • Lényegében az intervallumbecslés ikertestvére, de hatalmas gyakorlati jelentősége miatt külön eszköztára van
15
• Alapeszköze a statisztikai próba (vagy teszt), mely a mintaelemek alapján kiszámol egy ún. tesztstatisztikát (próbafüggényt) • Vizsgált állításaink: nullhipotézis – ellenhipotézis • Egy tipikus példa: H0 : µ = µ0 H1 : µ 6= µ0 • Itt µ0 általunk megadott, ismert szám (pl. µ0 = 70 kg a példánkban) Próbafüggvény megszerkesztése • Itt jön a kulcs: a próbafüggvényt úgy kell megszerkeszteni, hogy H0 fennállása esetén ismert eloszlást kövessen (nulleloszlás) • Például (sokasági normalitás, ismert szórás): – X: nem jó, mert X ∼ N µ0 , σ 2 /n (most ugye H0 -t igaznak vesszük!) és ez függ µ0 -tól (σ-tól és n-től is, de az nem baj, mert azokat tudjuk most) – Próbálkozzunk máshogy, X − µ0 : technikailag jó, mert X − µ0 ∼ N 0, σ 2 /n , de nem túl praktikus, mert minden σ-hoz és n-hez külön táblázat kéne √ 0 : teljesen jó, minden paramétertől függetlenül N (0, 1) eloszlást követ, – Ennek fényében X−µ σ/ n ez lesz a jó próbafüggvény
Próbafüggvény megszerkesztése • Ez ún. pivot, eloszlása már nem függ ismeretlen paramétertől: Z :=
X − µ0 H0 √ ∼ N (0, 1) , σ/ n
azaz a próbafüggvény H0 fennállása esetén N (0, 1) eloszlást követ Döntés a hipotézisvizsgálatban I. • Hihető-e, hogy az empirikus (adott, konkrét mintából kapott) érték ebből az eloszlásból származik? • Biztos döntés nincs! De: hihető ez? Adott mintából számolt empirikus z a nulleloszláson 0,5
Nulleloszlás (Z eloszlása H_0 fennállása esetén) z_emp (Mintából számolt z)
0,45 0,4 0,35
f
0,3 0,25 0,2 0,15 0,1 0,05 0
-3
-2
-1
0 z
16
1
2
3
Döntés a hipotézisvizsgálatban II. És ez? Adott mintából számolt z a nulleloszláson 0,5
Nulleloszlás (Z eloszlása H_0 fennállása esetén) z_emp (Mintából számolt z)
0,45 0,4 0,35
f
0,3 0,25 0,2 0,15 0,1 0,05 0
-4
-3
-2
-1
0
1
2
3
4
z
Döntés a hipotézisvizsgálatban III. • Valahol „határt kell húznunk” → szó szerint is! • Azt mondjuk, hogy a nagyon kis valószínűségű területekre esést már nem hisszük el • Pedig az nem lehetetlen, sőt: az is tudható, hogy az oda esés (azaz a fenti logikával történő hibázás) valószínűsége épp ez a nagyon kis valószínűség • Tipikus, hogy a felső és alsó szélén is 2,5-2,5 % valószínűségű területet jelülünk ki (α = 5%, ez a szignifikanciaszint), határai: a ca alsó és a cf felső kritikus értékek (példában: ±1,96) p-érték • Vagy: Mennyi lenne az a szignifikanciaszint, ami mellett a mintából kapott (empirikus) tesztstatisztika-érték épp az elfogadás és az elutasítás határára kerülne? • (Ez nem más, mint az empirikus értéktől extrémebb helyeken vett integrálja a mintavételi eloszlásnak) • A neve: p-érték • Manapság (hogy a számításigény már nem probléma), ezt szokták megadni, mert nem binarizálja az eredményt • „Az olvasó is tud dönteni”: ha a választott szignifikanciaszint nagyobb, mint a p-érték, akkor elutasítunk, különben elfogadunk • Frekvencionista szemlélet! Példa I. • (Csak szemléltetésként, részletek nélkül) • Van-e különbség a dohányzó és a nem-dohányzó nők gyermekeinek születési tömege között? • A mintában 2772 g a dohányzóknál az átlag, 3056 g a nem-dohányzóknál; csakhogy a kérdés nem ez. . . • Ez egy sokaságra vonatkozó kérdés → próbát kell végeznünk! • Adott a dohányzó nők sokaságában az újszülöttek tömegének eloszlása, és ugyanez a nem-dohányzó nők sokaságában – operacionalizáljuk úgy a kérdést, hogy a várhatóértékük eltér-e egymástól • Erről kell minta alapján dönteni 17
Példa II. • Elég nagy minta, ún. kétmintás Welch-próba alkalmazható: p = 0,007 • Szokásos szignifikanciaszinteken elvethető a feltevés, hogy a dohányzó és a nem-dohányzó nők csoportjában azonos a születési súly: a születi súly kapcsolatban van azzal, hogy dohányzik-e a várandós anya • „A dohányzás csökkenti a születési súlyt!” – na ilyet viszont nem mondhatunk ! (Korreláció nem implikál kauzalitást!) Confounderek? • (Bár itt jó eséllyel tényleg kauzális kapcsolat van, de ezt csak más kísérleti elrendezéssel lehet szabatosan kimutatni) Próba hibái I. • Elvetjük H0 -t, pedig fennáll (elsőfajú hiba, α): pontosan szabályozható valószínűségű • Elfogadjuk H0 -t, pedig el lehetne vetni (másodfajú hiba, β): általánosságban nem ismert, függ a valóságtól • 1 − β: próba ereje („mennyire ismeri fel az eltérést, ha tényleg van”) • Mi két dologgal tudjuk befolyásolni a próba erejét, mindkettőhöz egy-egy tételmondat: 1. Választott próba: „mindig annyi előfeltevésre építő próbát használjunk, amennyit tudunk, se többet se kevesebbet” (több előfeltevésre építő próbák erősebbek ugyan, de ha szükséges előfeltevés nem teljesül, a próba nem lesz valid) 2. Mintanagyság: „kis hatáshoz nagy minta kell, nagy hatáshoz elég a kisebb minta is” Próba hibái II. • Bár néhol bevett szokás, de elvileg nem korrekt egy próba előfeltevését ugyanazon mintán egy másik próbával eldönteni („testing hypothesis suggested by data”) Szignifikanciavadászat I. Mivel minden tesztnek α elsőfajú hibája van, ezért (sajnos!) aki keres az talál!
18
Szignifikanciavadászat II. • Védekezés ellene: az orvosok nem viszik túlzásba. . . • A p-érték korrekciója: Bonferroni-, Holm-, Hochberg-, Hommel-eljárások • Ezek az ún. familywise α (az összes tesztben együtt mennyi az elsőfajú hiba; értsd: legalább egy tesztben hibásan elutasítunk) erős kontrollját jelentik • Alternatíva: például az FDR-eljárások • A microarray és hasonló adatok kiértékelése kapcsán nagyon megnőtt a jelentőségük
5. Klinikai vizsgálatok Empirikus adatgyűjtés nehézségei • Szolgáltatott információk: – Keresztmetszeti adatokból nem lehet időbeli viszonyokon alapuló következtetést levonni – Korreláció nem implikál kauzalitást – stb. • Nehézségek: – Technikai (szervezési, pénzügyi, stb.) – Időbeli – Bioetikai – stb. • Evidenciák hierarchiája (tipikusan trade-off a két fenti szempont között: az informatívabb, megbízhatóbb vizsgálat nehezebb) Klinikai vizsgálatok kategorizálása • Klinikai vizsgálat (clinical study) lehet 1. Experimentális (beavatkozásos), más szóval klinikai kísérlet 2. Obszervációs (megfigyeléses) Klinikai kísérletek fajtái • A fő kérdések: – Randomizálás – Kontrollálás – Vakosítás • A kettős vak RCT a „gold standard” egy kérdés megválaszolására – ugyanis nem érzékeny a ’korreláció nem implikál kauzalitást’ problémára! • Cserében a legösszetettebb, legdrágább stb. feladat a megvalósítása • Gyógyszerbevezetésnél különösen fontos a szerepe (elsősorban fázis-III)
19
Megfigyeléses vizsgálatok • Főbb típusok: 1. Kohorsz 2. Eset-kontroll 3. Keresztmetszeti 4. Ecological 5. (Esetismertetés, case series) • Ez a megbízhatóság sorrendje is • Közös gond: ki vannak téve a confounding-nak (különféle bias-ek) • Például: ABC-hipotézis (tudományos szempontok mellett a politika (és a média) megjelenése tette tanulságossá) A világ első dokumentált klinikai kísérlete • Leírás: 10 És mondá az udvarmesterek fejedelme Dánielnek: Félek én az én uramtól, a királytól, aki megrendelte a ti ételeteket és italotokat; minek lássa, hogy a ti orcátok hitványabb amaz ifjakénál, akik egykorúak veletek? és így bűnbe kevernétek az én fejemet a királynál. 11 És mondá Dániel a felügyelőnek, akire az udvarmesterek fejedelme bízta vala Dánielt, Ananiást, Misáelt és Azariást: 12 Tégy próbát, kérlek, a te szolgáiddal tíz napig, és adjanak nékünk zöldségféléket, hogy azt együnk, és vizet, hogy azt igyunk. 13 Azután mutassák meg néked a mi ábrázatunkat és amaz ifjak ábrázatát, akik a király ételével élnek, és aszerint cselekedjél majd a te szolgáiddal. 14 És engede nékik ebben a dologban, és próbát tőn velük tíz napig. 15 És tíz nap mulva szebbnek látszék az ő ábrázatuk, és testben kövérebbek valának mindazoknál az ifjaknál, akik a király ételével élnek vala. • Dokumentálás helye: Biblia, Dániel könyve, 1. fejezet (Károli Gáspár fordítása)
Mik ezzel a bajok? Nagyon jó, de felmerül azért pár kérdés is: • Dániel beszerezte a Regionális Bioetikai Bizottság engedélyét a kutatáshoz? • A résztvevők teljes írásos tájékozott beleegyezéssel vettek részt a kísérletben? • Regisztrálta Dániel a kutatást nemzetközi adatbázisban (pl. ClinicalTrials.gov-on)? • Nem világos a végpont meghatározása: a „szebbnek látszék az ő ábrázatuk” pontosan milyen módon került operacionalizálásra? Hiányzik a használt kvantitatív mérési eljárás kellő pontosságú megadása. • Nem derül ki, hogy a kísérleti alanyok randomizálásra kerültek-e, illetve milyen módszerrel. • Nem világos, hogy a vizsgálók, illetve az alanyok vakosítva voltak-e az ételek tekintetében. • Az eredményközlés elégtelen: hiányzik a végpontokon mért numerikus kimenet, és szignifikanciára vonatkozó statisztikai próba dokumentálása.
DE! DE! A fenti mégis fantasztikus: felmerült a gondolat (kb. i.e. 600-ban vagyunk!), hogy a kérdést
empirikus alapon kell megválaszolni! Tények alapján (nem szent iratok, sámánok, vakszerencse vagy tapasztalati sejtés alapján)! Pár hasznos link • A tárgy tanszéki honlapja: – https://www.iit.bme.hu/bevezet\%C3\%A9s-az-eg\%C3\%A9szs\%C3\%A9g\%C3\%BCgyi-m\ %C3\%A9rn\%C3\%B6ki-tudom\%C3\%A1nyokba • A tárgy lapja a saját honlapomon (véleményezés!): – http://www.medstat.hu/targyak/biostatea2012osz.html • Szakmai blogom (részben ide is kapcsolódó témákban): – http://vedooltas.blog.hu/2012/09/04/tartalomjegyzek_gyanant 20
Útravaló jótanácsok 1. És végül a legfontosabb: „Csak olyan statisztikának higyj, amit sajátkezűleg hamisítottál!” (Churchillnek tulajdonítva) 2. A korreláció nem implikál kauzalitást! 3. „Az anekdota többes száma nem az adat!” (Roger Brinner) 4. Döntést csak adatra alapozhatunk! 5. Mindig ellenőrizzük és gondoljuk végig az adatok származását! Köszönöm szépen a figyelmet!
[email protected]
21