ORVOSI STATISZTIKA Statisztika
Élettan Anatómia Kémia …
Az orvosi statisztika helye
?
!
Az orvos döntéseket hoz! Mikor jó egy döntés?
Lehet kérdés?
Mennyire helyes egy döntés? Mekkora a tévedés lehetősége?
Egyéb példák
Példa: test hőmérséklet 36,7 °C
36,7 °C
RBC:
1.
36,9 °C
36,9 °C
36,6 °C
36,5 °C
Mérési pontatlanség.
2. Időbeli ingadozások!!! A megfigyelt értékek nem állandóak!
3. Biológiai változatosság!!! Mért érték: 37,0 °C. Egészséges vagy beteg?
4,5x1012 1/l (3,9-5 x1012 1/l) normál tartomány? Az új terápiás eljárás hatékonyabb mint a régi?
Hogyan igazolható egy lázcsillapító hatásossága?
Kérdések!
1
Hogyan válaszolható meg?
Változók
1. Dt < 0 A gyógyszer hatásos.
?
változó
tartomány
típus
magasság
~50 cm … ~250 cm
valós szám
fogak száma
0 .. 32
egész szám
vércsoport
A, B, AB, 0
betűk
a rák stádiumai
1…4
egész szám
A változó típusa numerikus
folytonos diszkrét nominális
kategóriális
ordinális
2. Dt >= 0
Következmény: A válasz nem egyszerű és nem mindig egyértelmű!
A gyógyszer nem hatásos: fluktuáció, a beteg jobban lesz, stb.
A gyógyszer nem hatásos.
(Nem csak a gyógyszer befolyásolhatja a test hőmérsékletet.)
A gyógyszer hatásos: fluktuáció, nem emelkedik tovább, stb.
Leíró statisztika!
A változó leírása
• Típusa • Lehetséges értékek • Az értékek előfordulása
Numerikus változók Név Definíció
Példa
folytonos
diszkrét
Végtelen sok érték lehetséges, egy adott tartományban
Véges számú lehetséges érték
Magasság, testhőmérséklet …
A fogak száma, a gyerekek száma…
2
Kategoriális változók
A lehetséges értékek megadása • Folytonos : megadjuk a lehetséges tartományt. » pl. magasság: ~60 cm - ~ 250 cm
Név Definíció Példa
Nominális
Ordinális
Nincs sorrend
Létezik természetes sorrend
nem, vércsoport …
A betegség súlyossága, a fájdalom nagysága…
Előfordulás Megfigyelés: Az értékek előfordulása nem azonos mértékű!
• Egyéb: felsoroljuk az értékeket, ha lehetséges » pl. vércsoport: A, B, AB, 0
Populáció Hány kísérletre van szükség?
Amennyi csak lehetséges. Kísérlet: mérés, megfigyelés, kikérdezés... Csak olyan esetekkel foglalkozunk, amelyekben a kísérlet megismételhető! Kimenetel: Egy kísérlet eredménye. (pl.: egy hallgató magassága)
Ideális eset: pl. az összes ember populáció
3
Minta
A minta kiválasztása
Egy kisebb, véges számú hányad a populációból.
n:
az elemek száma a mintában.
x:
a vizsgált mennyiség
xi:
egy elem a mintából
Előfordulás Gyakoriság (k): egy adott érték előfordulásának a száma. ki: az i-edik érték előfordulása.
n ki
Alapelv: véletlen minta.
Orvosi statisztika: ha nincs egyéb kizáró ok, akkor véletlen legyen a kiválasztás!
Gyakoriság eloszlás A gyakoriság a változó értékeinek a függvényében.
Vércsoport
0
A
B
AB
összes
gyakoriság
17
21
10
2
50
i
4
Megjelenítés
Relatív gyakoriság
A vércsoport gyakorisági eloszlása 25
A gyakoriság aránya a teljes elemszámhoz viszonyítva.
gyakoriság
20
15
oszlop diagramm
10
5
ki
n i
0 O
A
B
1 1 ki n n 1 n i
AB
O A B AB
kördiagramm
Valószínűség (P)
Gyakran százalékos formában adjuk meg:
ki 100% n
Valószínűség eloszlás
A valószínűség a relatív gyakoriság értéke, ha n tart a végtelenhez.
5
A valószínűség tulajdonságai P = 0 - sohasem fordul elő
0 P 1
Valószínűség és relatív gyakoriság Populáció
Minta
P = 1 - mindig előfordul
n
n véges! relatív gyakoriság példa: vércsoport
P 1
PA PB PAB P0 1
i
i
valószínűség
A valószínűség nagyon gyakran nem ismert! A gyakorlatban a relatív valószínűséget használjuk helyette.
(ha, egymást kizáró események)
Folytonos változó
Megjelenítés
Végtelen sok lehetséges érték!!!
Vércsoportok eloszlása Magyarországon 50% 45%
Osztály: egy kis intervallum a teljes értéktartományon belül.
40%
százalék
35% 30% 25% 20% 15%
Osztályszélesség: Az intervallum hossza.
10% 5% 0%
O
A
5,5%
B
AB
12,9% 36,9%
44,7%
Gyakoriság: azon elemek száma, amelyek az adott intervallumba esnek.
O A B AB
Olyan, mintha diszkrét értékek lennének !
6
Egy példa 160 cm 181 cm 175 cm 163 cm 165 cm 179 cm 164 cm 185 cm 177 cm 168 cm
osztály
ki
160-164
3
165-169
2
170-174
0
175-179
3
180-184
1
185-189
1
gyakorisági eloszlás (5 cm) gyakoriság
1 2 3 4 5 6 7 8 9 10
Megjelenítés
15 10 5 0 150 155 160 165 170 175 180 185 190
magasság (cm)
Megjelenítés
Finomabb felosztás
gyakorisági eloszlás (1 cm)
gyakoriság
8 7 6 5 4 3 2 1 0
5 4 3 2 1 0 150 155 160 165 170 175 180 185 190
magasság (cm)
19 0
18 6
18 2
17 8
17 4
17 0
16 6
16 2
15 8
magasság (cm)
15 4
15 0
gyakoriság
gyakorisági eloszlás (2 cm)
Valóban teljes leíráshoz akkor jutunk, ha az elemszám végtelen nagy!
7
Normális eloszlás
Elméleti eloszlás
Ha az osztályszélesség végtelenül kicsi és az elemszám végtelenül nagy!
Normális vagy Gauss-eloszlás 1 g ( x) e s 2
0,06
x m 2 2s 2
0,05 Normal distribution (m =170, s=8)
0,04 0,03
Paraméterek:
0,02
m – várható érték
0,01
s – elméleti szórás
0 150
155
160
165
170
175
180
185
0,06
probability density
valószínűség sűrűség
normális eloszlás (m =170, s=8)
0,05 0,04 0,03 0,02 0,01 0
190
150
155
160
165
170
175
180
185
190
Height (cm)
magasság (cm)
Tulajdonságai, a paraméterek jelentése
Elméleti leírás Normális vagy Gauss-eloszlás 1 g ( x) e s 2
• A --től a + -ig terjed,
x m 2 2s 2
• szimmetrikus, • A görbe alatti terület 1.
Normal distribution (m =170, s=8)
Paraméterek:
s – elméleti szórás
probability density
m – várható érték, vagy elméleti átlag
0,06 0,05 0,04
m: a görbe maximumához tartozó érték.
0,03 0,02 0,01 0 150
155
160
165
170
175
180
185
190
s: az adatok átlagos eltérése a m-től.
Height (cm)
8
Sűrűségfüggvény, eloszlás függvény Sűrűségfüggvény
A valószínűség jelentése
Eloszlásfüggvény
integrálás
deriválás
P annak a valószínűsége, hogy az x érték az (a,b) intervallumba esik, ill. az adatok P%-a tartozik ehhez az intervallumhoz.
Elméleti szórás (m±s)
~ 68%
(m±2s) ~ 95%
Normális eloszlás Elméleti eloszlás! A populáció egészére jellemző. A gyakorlatban általában nem ismerjük a paramétereit.
(m±3s) ~ 99,5%
Általában csak egy vagy több véletlen mintánk van a teljes populációból!
9
A m becslése
A s becslése s = Az adatok átlagos eltérése a m-től. s (tapasztalati szórás) = az elemek átlagos eltérése az átlagtól.
átlag: az elemekhez képest középen kell elhelyezkednie.
x
i
x 0
x
x
A (tapasztalati) szórás
(x±s)
Qx n 1 ~ 68%
(x±2s) ~ 95% (x±3s) ~ 99,5%
i
A minta és a populáció kapcsolata
s: az elemek átlagos eltérése az átlagtól. n-1: a szabadsági
2
n
i
s
Qx xi x 0
i
i
fok
minta
n
populáció
átlag
m
s
s
Példa: 3 szám átlaga = 12. Melyik ez a három szám? Minta
1. szám
2. szám
3. szám
1.
8
15
36-(8+15) = 13
2.
3
14
36-(3+14) = 19
3.
10
21
36-(10+21) = 5
10
A m és az átlag A mérés megismétlése több mintán.
Minta
átlag
1
170
2
168
3
166
4
173
Az átlagok szintén ingadoznak a m körül!
Standard hiba
sx
s n
Az átlagok átlagos eltérése a mtől!
A m konfidencia intervalluma.
x sx ~ 68%
~68% annak a valószínűsége, hogy a m ebben a tartományban van. (~32% , hogy nem!)
A m becslése
Információ tartalom
Konfidencia intervallum
x sx ~ 68%
Pont becslés
Intervallum becslés
x 3sx ~ 99.5%
Egy egyszerű érték.
Egy tartomány és egy valószínűség, amely megadja a az esélyét, hogy a m a tartományba esik.
Átlag
x 2sx ~ 95%
x 100%
De: a konfidencia intervallum hossza függ a standard hiba nagyságától!
11
Normál tartomány Normális eloszlású változó
Egyéb típusú változó Egy olyan tartomány, amikor 95% a valószínűsége, hogy egy érték benne van.
De: 5% az esélye, hogy a tartományon kívülre esik!!!
12