ORVOSI STATISZTIKA Statisztika
Élettan
Anatómia Kémia …
Az orvosi statisztika helye
?
!
Az orvos döntéseket hoz! Mikor jó egy döntés?
Lehet kérdés?
Mennyire helyes egy döntés? Mekkora a tévedés lehetősége?
Egyéb példák
Példa: test hőmérséklet 36,7 °C
36,7 °C
RBC:
1.
36,9 °C
36,9 °C
36,6 °C
36,5 °C
Mérési pontatlanség.
2. Időbeli ingadozások!!! A megfigyelt értékek nem állandóak!
3. Biológiai változatosság!!! Mért érték: 37,0 °C. Egészséges vagy beteg?
4,5x1012 1/l (3,9-5 x1012 1/l) normál tartomány? Az új terápiás eljárás hatékonyabb mint a régi?
Hogyan igazolható egy lázcsillapító hatásossága?
Kérdések!
1
Hogyan válaszolható meg?
Változók
1. Dt < 0 A gyógyszer hatásos.
?
változó
tartomány
típus
magasság
~50 cm … ~250 cm
valós szám
fogak száma
0 .. 32
egész szám
vércsoport
A, B, AB, 0
betűk
a rák stádiumai
1…4
egész szám
A változó típusa numerikus
folytonos diszkrét nominális
kategóriális
ordinális
2. Dt >= 0
Következmény: A válasz nem egyszerű és nem mindig egyértelmű!
A gyógyszer nem hatásos: fluktuáció, a beteg jobban lesz, stb.
A gyógyszer nem hatásos.
(Nem csak a gyógyszer befolyásolhatja a test hőmérsékletet.)
A gyógyszer hatásos: fluktuáció, nem emelkedik tovább, stb.
Leíró statisztika!
A változó leírása
• Típusa • Lehetséges értékek • Az értékek előfordulása
Numerikus változók Név Definíció
Példa
folytonos
diszkrét
Végtelen sok érték lehetséges, egy adott tartományban
Véges számú lehetséges érték
Magasság, testhőmérséklet …
A fogak száma, a gyerekek száma…
2
Kategoriális változók
A lehetséges értékek megadása • Folytonos : megadjuk a lehetséges tartományt. » pl. magasság: ~60 cm - ~ 250 cm
Név Definíció Példa
Nominális
Ordinális
Nincs sorrend
Létezik természetes sorrend
nem, vércsoport …
A betegség súlyossága, a fájdalom nagysága…
Előfordulás Megfigyelés: Az értékek előfordulása nem azonos mértékű!
• Egyéb: felsoroljuk az értékeket, ha lehetséges » pl. vércsoport: A, B, AB, 0
Populáció Hány kísérletre van szükség?
Amennyi csak lehetséges. Kísérlet: mérés, megfigyelés, kikérdezés... Csak olyan esetekkel foglalkozunk, amelyekben a kísérlet megismételhető! Kimenetel: Egy kísérlet eredménye. (pl.: egy hallgató magassága)
Ideális eset: pl. az összes ember populáció
3
Minta
A minta kiválasztása
Egy kisebb, véges számú hányad a populációból.
n:
az elemek száma a mintában.
x:
a vizsgált mennyiség
xi:
egy elem a mintából
Előfordulás Gyakoriság (k): egy adott érték előfordulásának a száma. ki: az i-edik érték előfordulása.
n ki
Alapelv: véletlen minta.
Orvosi statisztika: ha nincs egyéb kizáró ok, akkor véletlen legyen a kiválasztás!
Gyakoriság eloszlás A gyakoriság a változó értékeinek a függvényében.
Vércsoport
0
A
B
AB
összes
gyakoriság
17
21
10
2
50
i
4
Megjelenítés
A megjelenítés csapdái
A vércsoport gyakorisági eloszlása 25
gyakoriság
20
15
oszlop diagramm
10
5
0 O
A
B
AB
O A B AB
kördiagramm
Relatív gyakoriság
Valószínűség (P)
A gyakoriság aránya a teljes elemszámhoz viszonyítva.
ki
n i
1 1 ki n 1 n i n
Gyakran százalékos formában adjuk meg:
ki 100% n
A valószínűség a relatív gyakoriság értéke, ha n tart a végtelenhez.
5
Valószínűség eloszlás
A valószínűség tulajdonságai P = 0 - sohasem fordul elő
0 P 1
P = 1 - mindig előfordul
példa: vércsoport
P 1
PA PB PAB P0 1
i
i
(ha, egymást kizáró események)
Megjelenítés
Valószínűség és relatív gyakoriság
Vércsoportok eloszlása Magyarországon
n véges!
Populáció
n
45% 40% 35%
százalék
Minta
50%
30% 25% 20% 15%
relatív gyakoriság
valószínűség
10% 5% 0%
O
A
5,5%
B
AB
12,9% 36,9%
A valószínűség nagyon gyakran nem ismert! A gyakorlatban a relatív valószínűséget használjuk helyette.
O A B AB
44,7%
6
Folytonos változó
Egy példa
Végtelen sok lehetséges érték!!!
1 2 3 4 5 6 7 8 9 10
Osztály: egy kis intervallum a teljes értéktartományon belül. Osztályszélesség: Az intervallum hossza. Gyakoriság: azon elemek száma, amelyek az adott intervallumba esnek.
Olyan, mintha diszkrét értékek lennének !
160 cm 181 cm 175 cm 163 cm 165 cm 179 cm 164 cm 185 cm 177 cm 168 cm
Megjelenítés
165-169
2
170-174
0
175-179
3
180-184
1
185-189
1
19 0
18 6
18 2
17 8
17 4
17 0
16 6
16 2
magasság (cm)
15 8
150 155 160 165 170 175 180 185 190
15 4
0
3
8 7 6 5 4 3 2 1 0
15 0
5
160-164
gyakorisági eloszlás (2 cm)
gyakoriság
gyakoriság
10
ki
Finomabb felosztás
gyakorisági eloszlás (5 cm) 15
osztály
magasság (cm)
7
Megjelenítés
Normális eloszlás Ha az osztályszélesség végtelenül kicsi és az elemszám végtelenül nagy!
5 4 3 2 1 0
normális eloszlás (m =170, s=8)
150 155 160 165 170 175 180 185 190
magasság (cm)
Valóban teljes leíráshoz akkor jutunk, ha az elemszám végtelen nagy!
valószínűség sűrűség
gyakoriság
gyakorisági eloszlás (1 cm)
0,06 0,05 0,04 0,03 0,02 0,01 0 150
155
160
165
170
175
180
185
190
magasság (cm)
Elméleti eloszlás
Elméleti leírás
Normális vagy Gauss-eloszlás x m 2
1 g ( x) e s 2
2s 2
m – várható érték s – elméleti szórás
probability density
Paraméterek:
Paraméterek:
0,05
m – várható érték, vagy elméleti átlag
0,04 0,03 0,02 0,01
s – elméleti szórás
0 150
155
160
165
170
Height (cm)
175
x m 2 2s 2
Normal distribution (m =170, s=8)
Normal distribution (m =170, s=8) 0,06
180
185
190
0,06
probability density
1 g ( x) e s 2
Normális vagy Gauss-eloszlás
0,05 0,04 0,03 0,02 0,01 0 150
155
160
165
170
175
180
185
190
Height (cm)
8
Tulajdonságai, a paraméterek jelentése
Sűrűségfüggvény, eloszlás függvény
• A --től a + -ig terjed,
Sűrűségfüggvény
Eloszlásfüggvény
• szimmetrikus, • A görbe alatti terület 1.
m: a görbe maximumához tartozó érték. s: az adatok átlagos eltérése a m-től.
A valószínűség jelentése
Elméleti szórás (m±s)
~ 68%
(m±2s) ~ 95% (m±3s) ~ 99,5%
P annak a valószínűsége, hogy az x érték az (a,b) intervallumba esik, ill. az adatok P%-a tartozik ehhez az intervallumhoz.
9
A m becslése
Normális eloszlás Elméleti eloszlás! A populáció egészére jellemző. A gyakorlatban általában nem ismerjük a paramétereit.
átlag: az elemekhez képest középen kell elhelyezkednie. Általában csak egy vagy több véletlen mintánk van a teljes populációból.
xi x 0
x
i
x
i
n
i
A s becslése s = Az adatok átlagos eltérése a m-től. s (tapasztalati szórás) = az elemek átlagos eltérése az átlagtól.
A (tapasztalati) szórás s
(x±s)
Qx xi x 0 2
i
Qx n 1 ~ 68%
(x±2s) ~ 95% (x±3s) ~ 99,5%
s: az elemek átlagos eltérése az átlagtól. n-1: a szabadsági
fok
Példa: 3 szám átlaga = 12. Melyik ez a három szám? Minta
1. szám
2. szám
3. szám
1.
8
15
36-(8+15) = 13
2.
3
14
36-(3+14) = 19
3.
10
21
36-(10+21) = 5
10
A minta és a populáció kapcsolata minta
n
A hét kérdése
populáció
átlag
m
s
s
Hogyan becsülhetjük meg a m és a s értékét?
11