05/03/2016
[Biomatematika 2] Orvosi biometria 2016.02.29.
A statisztika típusai • Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. – A középértéket jelemzi (medián, módus, átlag) – Az adatok változékonyságát jellemzi (variancia, standard deviáció) (standard: szokásos, átlagos) • Következtető statisztika: egy populáció tulajdonságaira következtet a minta elemzése segítségével. – becslés – hipotézis vizsgálat
1
05/03/2016
Becslés Populációra vonatkozó paraméter becslése (µ, σ2) a minta statisztika értékelésének ( ̅ , σ ) segítségével • Módszerek: – pontbecslés – intervallumbecslés
Pontbecslés • A minta segítségével egy érték meghatározása • Nem ad információt a becsült érték és az ismeretlen populációs paraméter közötti távolságról pl.: a minta átlag ̅ = 5 (a populáció ismeretlen átlagértékének pontbecslése (µ))
2
05/03/2016
Intervallumbecslés • Értékek egy tartományát mutatja (alsó határ, felső határ) a mintában lévő eredmények alapján • Információt ad a becsült érték és az ismeretlen populációs paraméter közötti távolságról (valószínűség) • pl.: a populáció ismeretlen átlaga 90%-os megbízhatóssággal 3 és 7 közé esik
Az intervallumbecslés és elemei • A minta statisztika (pontbecslés) • Konfidencia intervallum (alsó határ – felső határ) • segítségével meghatározzuk, hogy egy populációra vonatkozó paraméter milyen valószínűséggel esik bele a konfidencia intervallumba. konfidencia=bizalom
3
05/03/2016
Konfidencia intervallum • • •
•
− σ ≤ ≤ + σ jelzi, hogy mennyire volt pontos egy mérés Jelzi, hogy mennyire biztos egy becslés Jelzi, hogy az ismételt mérés során az eredmény mennyire kerül közel a az eredetileg becsült értékhez mennyire vagyunk biztosak a becsült populációs paramétert illetően
Konfidencia intervallum − σ ≤
≤
+ σ
A konfidencia intervallum meghatározásának lépései: • A vizsgálni kívánt populációs paraméter kiválasztása (µ) • Minta gyűjtése a populációból • A minta átlagának és szórás értékének kiszámolása ( ̅ , ̅ ) • Konfidencia szint megadása (Z) (90%, 95%, 99%) • A középérték standard hibája: ̅ = (a mintaeloszlás átlagának várható szórása (a mintaeloszlás varianciája) • A hibahatár kiszámolása: á = é é – kritikus érték (Za/2): Z érték, ami a konfidencia szint feléhez tartozik (pl. 0.9/2) • Konfidencia intervallum = minta statisztika ± hibahatár
−
! ≤ "
≤
+
! "
4
05/03/2016
A konfidencia intervallum szélességét befolyásoló tényezők az intervallum szélessége ̅ − 0
! "
– az adatok szóródása (σ)
− ó2, ̅
̅+0
! "
− 3
=
– A minta mérete (n) – konfidencia szint (megbízhatósági szint) : (1 - α) • Befolyásolja a Z értékét
Konfidencia szint (megbízhatósági szint) • Annak valószínűsége, hogy az ismeretlen populációs paraméter (pl. µ) a konfidencia intervallumba esik: (1 - α) ‒α (szignifikancia szint) annak valószínűsége, hogy az ismeretlen populációs paraméter nem esik a konfidencia intervallumba (pl. 0.05 azaz 5%)
5
05/03/2016
Konfidencia intervallum 0.45 ϕ(µ) 0.4 0.35 0.3 0.25 0.2
(1-α)/2
0.15 0.1
(1-α)/2 α/2
α/2
0.05 0 -4
-3
-2
-1
0
1
2
3
4
µ
0.4
φx
0.3
0.2
95% 0.1
2.5%
2.5%
0.0 -5
0
-Z(0.975) = -1.96
x
5
+Z(0.975) = 1.96
6
05/03/2016
Z-táblázat
Az átlaghoz (µ) tartozó konfidencia intervallum meghatározása ismert σ esetén • Alap feltevések – A populáció szórása ismert – A populációs paraméter normál eloszlású (ha nem normális eloszlású, akkor azzal közelíthető (n ≥ 30) • Konfidencia intervallum ̅ − 05
6
≤ 7 ≤ ̅ + 05
6
7
05/03/2016
A populációs átlaghoz (µ) tartozó konfidencia intervallum meghatározása ismert σ esetén A véletlenszerű mintavétel (n=50) átlaga ̅ = 75 . Állapítsuk meg a µ-re vonatkozó 95 %-os konfidencia intervallumot abban az esetben ha σ = 15.
̅ − 05 75 − 1.96
≤ 7 ≤ ̅ + 05
6
15
6
≤ 7 ≤ 75 + 1.96
50 >?. @A ≤
15 50
≤ >B. CD
Hipotézis vizsgálat • Döntéshozás (igazolása vminek) megállapítás érvényességéről
egy
feltételezés,
– pl. a nők (populáció) 25% -nak (paraméter: mennyiségi változó) van viszere • kategorikus változó (pl. viszeres vagy nem) • számszerűsíthető változó (pl. 120 Hgmm vagy nem)
• a döntés érvényességi határainak megbecslése • A hipotézisvizsgálat vonatkozhat két sokaság esetében – – – – –
a paramétereinek (átlag, szórás) egyenlőségére a véletlen változók eloszlásának azonosságára az eloszlások függetlenségére a változók közötti kapcsolatra a változók trendjére, arányára
8
05/03/2016
Hipotézis vizsgálat A véletlen szerepének vizsgálata.! • Null hipotézis (H0):
– a tapasztalt különbségek a véletlennek tulajdoníthatóak. – nincs különbség a vizsgált értékek között. – H0: µ = x
• Alternatív hipotézis (H1): a tapasztalt különbségek alternatív magyarázata (nem a véletlennek tulajdoníthatóak a különbségek). – a tapasztalt különbségek nem a véletlennek tulajdoníthatóak. – van különbség a vizsgált értékek között. • Egymintás vagy kétmintás próba • Kétoldalú (H1: µ ≠ x) vagy egyoldalú (H1: x > µ; H1: x < µ) próba
Statisztikai következtetés
H0 igaz
H0 hamis
elfogadom
jó döntés
másodfajú hiba (β) fals negatív eredmény
elvetem
elsőfajú hiba (α: szignifikancia szint) fals pozitív eredmény
jó döntés
9
05/03/2016
Előjel próba Két különböző aszpirin egyformán viselkedik e? • H0: két fajta aszpirin koncentrációja a vizeletben azonos, az esetleges különbség véletlen hatásoknak tulajdonítható – H0: μ1 = μ2 ; azaz μ1 –μ2=0
• H1: a két aszpirin készítmény nem egyforma, koncentrációjuk a vizeletben eltérő: – H1 : μ1 ≠ μ2 ; azaz μ1 - μ2 ≠ 0
Előjel próba sorszám aszpirin A (mg%)aszpirin B (mg%) különbség (mg%) előjel
előjel
n
+ előjelek száma
P
1
15
13
2
+
+
10
0
0.00
kumulatív P P (%) kumulatív P (%) 0.00
0.05
0.05
2
26
20
6
+
-
1
1
0.01
0.01
0.54
0.59
3
13
10
3
+
2
0.03
0.03
2.69
3.27
4
28
21
7
+
3
0.08
0.11
8.06
11.33
5
17
17
0
!
4
0.16
0.27
16.11
27.44
6
20
22
-2
-
5
0.23
0.50
22.56
50.00
7
7
5
2
+
6
0.23
0.73
22.56
72.56
8
36
30
6
+
7
0.16
0.89
16.11
88.67
9
12
7
5
+
8
0.08
0.97
8.06
96.73
10
18
11
7
+
9
0.03
0.99
2.69
99.41
11
21
16
5
+
10
0.01
1.00
0.54
99.95
12
17
11
6
+
11
0.00
1.00
0.05
100.00
átlag
19.2
15.3
3.9
szórás
7.8
7.2
2.9
A gyógyszert ugyanaz a beteg kapta 2 hét eltéréssel!
10
05/03/2016
Előjel próba Binomiális eloszlás: • Diszkrét (megszámlálható) valószínűségi változó (véletlentől függő számértékeket (értékek sokasága) felvevő változó; ξ, η, x). (pl. x = {0,1,2,3,4,5,6,7,8,9,10,11}) eloszlása • valószínűségi változó: a + előjel előfordulásának gyakorisága • Az elvégzet vizsgálat (kísérlet) száma (n=11) rögzített • Minden kísérlethez két kimenetel társítható: siker vagy kudarc (+ vagy -). • Minden kísérlet esetén a siker valószínűsége azonos (p=0.5) • Az elvégzett kísérletek függetlenek egymástól
Előjel próba sorszám aszpirin A (mg%)aszpirin B (mg%) különbség (mg%) előjel
előjel
n
+ előjelek száma
P
1
15
13
2
+
+
10
0
0.00
kumulatív P P (%) kumulatív P (%) 0.00
0.05
0.05
2
26
20
6
+
-
1
1
0.01
0.01
0.54
0.59
3
13
10
3
+
2
0.03
0.03
2.69
3.27
4
28
21
7
+
3
0.08
0.11
8.06
11.33
5
17
17
0
!
4
0.16
0.27
16.11
27.44
6
20
22
-2
-
5
0.23
0.50
22.56
50.00
7
7
5
2
+
6
0.23
0.73
22.56
72.56
8
36
30
6
+
7
0.16
0.89
16.11
88.67
9
12
7
5
+
8
0.08
0.97
8.06
96.73
10
18
11
7
+
9
0.03
0.99
2.69
99.41
11
21
16
5
+
10
0.01
1.00
0.54
99.95
12
17
11
6
+
11
0.00
1.00
0.05
100.00
átlag
19.2
15.3
3.9
szórás
7.8
7.2
2.9
11
05/03/2016
Előjel próba µ=np σ=√( G(1−G))
µ=11*0.5 = 5.5 σ=√(11∗0.5∗(1−0.5))=1.375
→ →
0.25
P(x=k)
0.20
0.15
0.10
0.05
0.00 0
1
2
3
4
5
6
7
8
9
10
11
x=k
Vége!
12