Statistika I (KMI/PSTAT) Cviˇcen´ı druh´e aneb Kvantily, distribuˇcn´ı funkce
Statistika I (KMI/PSTAT)
1/1
Co se dnes nauˇc´ıme
Po absolvov´an´ı t´eto hodiny byste mˇeli b´yt schopni: rozumˇet pojmu modus (mod´aln´ı hodnota), umˇet jej vypoˇc´ıtat a interpretovat, rozumˇet pojmu distribuˇcn´ı funkce, ch´apat v´yznam pojmu p% kvantil, umˇet jej vypoˇc´ıtat na z´akladˇe znalosti v´yˇctu dat, tabulky rozdˇelen´ı ˇcetnost´ı intervalov´eho rozdˇelen´ı ˇcetnost´ı a distribuˇcn´ı funkce rozumˇet pojm˚ um medi´an, horn´ı a doln´ı kvartil, decily, percentily atd., umˇet je vypoˇc´ıtat a interpretovat
Statistika I (KMI/PSTAT)
2/1
Modus Modus Modus veliˇ ciny X je hodnota znaku s nejvyˇsˇs´ı ˇ cetnost´ı, tj. nejˇ castˇ ejˇs´ı hodnota znaku. Modus ˆ veliˇ ciny X znaˇ c´ıme symbolem X.
Statistika I (KMI/PSTAT)
3/1
Modus Modus Modus veliˇ ciny X je hodnota znaku s nejvyˇsˇs´ı ˇ cetnost´ı, tj. nejˇ castˇ ejˇs´ı hodnota znaku. Modus ˆ veliˇ ciny X znaˇ c´ıme symbolem X.
Pˇr´ıklad 1 Kter´ a hodnota znaku je modem veliˇ ciny X s n´ asleduj´ıc´ım rozloˇzen´ım ˇ cetnost´ı? xi ni
v´ ybornˇ e 7
velmi dobˇre 8
dobˇre 20
dostateˇ cnˇ e 15
Statistika I (KMI/PSTAT)
nedostateˇ cnˇ e 10
P 60
3/1
Modus Modus Modus veliˇ ciny X je hodnota znaku s nejvyˇsˇs´ı ˇ cetnost´ı, tj. nejˇ castˇ ejˇs´ı hodnota znaku. Modus ˆ veliˇ ciny X znaˇ c´ıme symbolem X.
Pˇr´ıklad 1 Kter´ a hodnota znaku je modem veliˇ ciny X s n´ asleduj´ıc´ım rozloˇzen´ım ˇ cetnost´ı? xi ni
v´ ybornˇ e 7
velmi dobˇre 8
dobˇre 20
dostateˇ cnˇ e 15
nedostateˇ cnˇ e 10
P 60
ˆ = dobˇre“, X ” Interpretace: nejˇ castˇ ejˇs´ı hodnotou je hodnocen´ı dobˇre“. ”
Statistika I (KMI/PSTAT)
3/1
Modus Modus Modus veliˇ ciny X je hodnota znaku s nejvyˇsˇs´ı ˇ cetnost´ı, tj. nejˇ castˇ ejˇs´ı hodnota znaku. Modus ˆ veliˇ ciny X znaˇ c´ıme symbolem X.
Pˇr´ıklad 1 Kter´ a hodnota znaku je modem veliˇ ciny X s n´ asleduj´ıc´ım rozloˇzen´ım ˇ cetnost´ı? xi ni
v´ ybornˇ e 7
velmi dobˇre 8
dobˇre 20
dostateˇ cnˇ e 15
nedostateˇ cnˇ e 10
P 60
ˆ = dobˇre“, X ” Interpretace: nejˇ castˇ ejˇs´ı hodnotou je hodnocen´ı dobˇre“. ”
Pˇr´ıklad 2 Kter´ a hodnota znaku je modem veliˇ ciny X s n´ asleduj´ıc´ım rozloˇzen´ım ˇ cetnost´ı? xi pi
4 0.01
5 0.11
6 0.17
7 0.41
8 0.16
Statistika I (KMI/PSTAT)
9 0.12
10 0.02
P 1
3/1
Modus Modus Modus veliˇ ciny X je hodnota znaku s nejvyˇsˇs´ı ˇ cetnost´ı, tj. nejˇ castˇ ejˇs´ı hodnota znaku. Modus ˆ veliˇ ciny X znaˇ c´ıme symbolem X.
Pˇr´ıklad 1 Kter´ a hodnota znaku je modem veliˇ ciny X s n´ asleduj´ıc´ım rozloˇzen´ım ˇ cetnost´ı? xi ni
v´ ybornˇ e 7
velmi dobˇre 8
dobˇre 20
dostateˇ cnˇ e 15
nedostateˇ cnˇ e 10
P 60
ˆ = dobˇre“, X ” Interpretace: nejˇ castˇ ejˇs´ı hodnotou je hodnocen´ı dobˇre“. ”
Pˇr´ıklad 2 Kter´ a hodnota znaku je modem veliˇ ciny X s n´ asleduj´ıc´ım rozloˇzen´ım ˇ cetnost´ı? xi pi
4 0.01
5 0.11
6 0.17
7 0.41
8 0.16
9 0.12
10 0.02
P 1
ˆ = 7, X Interpretace: nejˇ castˇ ejˇs´ı hodnotou je ˇ c´ıslo 7. Statistika I (KMI/PSTAT)
3/1
Distribuˇcn´ı funkce Distribuˇcn´ı funkce Distribuˇ cn´ı funkce ud´ av´ a relativn´ı pod´ıl pozorov´ an´ı s hodnotou nejv´ yˇse x. Oznaˇ cujeme ji symbolem F (x).
Statistika I (KMI/PSTAT)
4/1
Distribuˇcn´ı funkce Distribuˇcn´ı funkce Distribuˇ cn´ı funkce ud´ av´ a relativn´ı pod´ıl pozorov´ an´ı s hodnotou nejv´ yˇse x. Oznaˇ cujeme ji symbolem F (x). souvislost s kumulovanou relativn´ı ˇ cetnost´ı, ale vyj´ adˇren´ a pro spojit´ e“ hodnoty x v ” rozmez´ı od −∞ do +∞ v´ yˇska skoku v grafu distribuˇ cn´ı funkce odpov´ıd´ a prost´ e relativn´ı ˇ cetnosti lze vyj´ adˇrit pouze pro kvantitativn´ı veliˇ ciny
Statistika I (KMI/PSTAT)
4/1
Distribuˇcn´ı funkce Pˇr´ıklad 3 Urˇ cete pˇredpis F (x) veliˇ ciny X s n´ asleduj´ıc´ım rozloˇzen´ım ˇ cetnost´ı. P xi 0 1 2 3 4 ni 7 8 15 12 8 50 pi 0.14 0.16 0.30 0.24 0.16 1 p∗i 0.14 0.30 0.60 0.84 1.00 #
Statistika I (KMI/PSTAT)
5/1
Distribuˇcn´ı funkce Pˇr´ıklad 3 Urˇ cete pˇredpis F (x) veliˇ ciny X s n´ asleduj´ıc´ım rozloˇzen´ım ˇ cetnost´ı. P xi 0 1 2 3 4 ni 7 8 15 12 8 50 pi 0.14 0.16 0.30 0.24 0.16 1 p∗i 0.14 0.30 0.60 0.84 1.00 #
F (x) = 0
...
x<0
= 0.14
...
0≤x<1
F (−5) = 0
= 0.30
...
1≤x<2
F (1) = 0.3
= 0.60
...
2≤x<3
F (2.5) = 0.6
= 0.84
...
3≤x<4
=1
...
4≤x
F (12) = 1
Pˇr´ıklad 4 Zapiˇste pˇredpis a namalujte graf F (x) veliˇ ciny X s n´ asleduj´ıc´ım rozloˇzen´ım ˇ cetnost´ı. P xi 4 5 6 7 8 ni 3 4 2 5 6 20 Statistika I (KMI/PSTAT)
5/1
Kvantily Pˇr´ıklad 5 Na obr´ azku je graf distribuˇ cn´ı funkce. Naleznˇ ete hodnoty F (−1), F (1), F (3.5), F (6). Vypoˇ ctˇ ete relativn´ı ˇ cetnost hodnoty znaku x = 3. Zjistˇ ete, pro jakou hodnotu x bude F (x) = 0.6 a interpretujte danou hodnotu.
Statistika I (KMI/PSTAT)
6/1
Kvantily Kvantil p% kvantil je hodnota znaku, kter´ a tvoˇr´ı hranici mezi 100 · p% hodnot, kter´ e jsou nejv´ yˇse rovny dan´ emu kvantilu a 100(1 − p)% hodnot kter´ e maj´ı hodnotu rovnu nejm´ enˇ e tomuto kvantilu. Kvantily poˇ c´ıt´ ame pouze pro kvantitativn´ı (ˇ c´ıseln´ e) veliˇ ciny. Znaˇ c´ıme je x ˜100p , kde p m˚ uˇze nab´ yvat hodnoty pouze v rozmez´ı 0 ≤ p ≤ 1.
Statistika I (KMI/PSTAT)
7/1
Kvantily Kvantil p% kvantil je hodnota znaku, kter´ a tvoˇr´ı hranici mezi 100 · p% hodnot, kter´ e jsou nejv´ yˇse rovny dan´ emu kvantilu a 100(1 − p)% hodnot kter´ e maj´ı hodnotu rovnu nejm´ enˇ e tomuto kvantilu. Kvantily poˇ c´ıt´ ame pouze pro kvantitativn´ı (ˇ c´ıseln´ e) veliˇ ciny. Znaˇ c´ıme je x ˜100p , kde p m˚ uˇze nab´ yvat hodnoty pouze v rozmez´ı 0 ≤ p ≤ 1. Napˇr. symbol x ˜60 ˇ cteme 60% kvantil a znamen´ aˇ c´ıslo (hranici, hodnotu), pro kterou je 60% ze vˇsech hodnot rovno nejv´ yˇse ˇ c´ıslu x ˜60 a zb´ yvaj´ıc´ıch 40% ze vˇsech hodnot je rovno nejm´ enˇ eˇ c´ıslu x ˜60 .
Statistika I (KMI/PSTAT)
7/1
Kvantily Kvantil p% kvantil je hodnota znaku, kter´ a tvoˇr´ı hranici mezi 100 · p% hodnot, kter´ e jsou nejv´ yˇse rovny dan´ emu kvantilu a 100(1 − p)% hodnot kter´ e maj´ı hodnotu rovnu nejm´ enˇ e tomuto kvantilu. Kvantily poˇ c´ıt´ ame pouze pro kvantitativn´ı (ˇ c´ıseln´ e) veliˇ ciny. Znaˇ c´ıme je x ˜100p , kde p m˚ uˇze nab´ yvat hodnoty pouze v rozmez´ı 0 ≤ p ≤ 1. Napˇr. symbol x ˜60 ˇ cteme 60% kvantil a znamen´ aˇ c´ıslo (hranici, hodnotu), pro kterou je 60% ze vˇsech hodnot rovno nejv´ yˇse ˇ c´ıslu x ˜60 a zb´ yvaj´ıc´ıch 40% ze vˇsech hodnot je rovno nejm´ enˇ eˇ c´ıslu x ˜60 .
Pˇr´ıklad 6 Mˇ eˇren´ım jsme zjistili hodnoty: 6, 7, 8, 2, 3, 5, 1, 2, 3, 7, 8, 6, 4, 3, 6, 5, 5, 3, 2, 4 Po uspoˇr´ ad´ an´ı (od nejmenˇs´ı hodnoty k nejvyˇsˇs´ı) 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 8, 8 Naleznˇ ete x ˜60 .
Statistika I (KMI/PSTAT)
7/1
Kvantily
Pˇr´ıklad 5 (pokraˇcov´an´ı) - v´ypoˇcet kvantilu pomoc´ı tabulky ˇcetnost´ı Je 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 8, 8 xi ni pi p∗i
1 1 0.05 0.05
2 3 0.15 0.20
3 4 0.20 0.40
4 2 0.1 0.5
5 3 0.15 0.65
6 3 0.15 0.80
7 2 0.1 0.90
8 2 0.1 1
P 20 1 #
Je y˜60 = 5, nebot’ p∗i poprv´ e pˇrekroˇ cila hodnotu 0.60 u hodnoty znaku 5. Interpretace: V dan´ em souboru m´ a 60 % u ´daj˚ u hodnotu nejv´ yˇse 5 a 40 % u ´daj˚ u hodnotu nejm´ enˇ e 5.
Statistika I (KMI/PSTAT)
8/1
Kvantily Pˇr´ıklad 5 (pokraˇcov´an´ı) - v´ypoˇcet kvantilu pomoc´ı F (x) Je 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 8, 8
Je y˜60 = 5, nebot’ F (x) poprv´ e pˇrekroˇ cila hodnotu 0.60 pro x = 5.
Statistika I (KMI/PSTAT)
9/1
Kvantily Oznaˇ cme poˇ cet hodnot n, hledan´ y kvantil p. Necht’ jsou vˇsechna data seˇrezena od nejmenˇs´ı hodnoty k nejvˇ etˇs´ı. Potom poˇrad´ı z prvku, kter´ y je hledan´ ym kvantilem, je celoˇ c´ıseln´ ym ˇreˇsen´ım soustavy nerovnic n · p < z < n · p + 1.
Pˇr´ıklad 6 - v´ypoˇcet kvantilu pomoc´ı vzorce Vypoˇ ctˇ ete 53% kvantil z hodnot 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 8, 8 Vypoˇ cteme poˇrad´ı prvku, kter´ y je 53% kvantilem. Je 20 · 0.53 < z < 20 · 0.53 + 1 10.6 < z < 11.6 z = 11 Hledan´ y 53% kvantil je 11. prvek v uspoˇr´ adan´ e ˇradˇ e hodnot, je tedy x ˜53 = 5.
Statistika I (KMI/PSTAT)
10 / 1
Kvantily
Pˇr´ıklad 6 (pokraˇcov´an´ı) - v´ypoˇcet kvantilu pomoc´ı vzorce Vypoˇ ctˇ ete 50% kvantil z hodnot 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 8, 8 Je 20 · 0.5
. . . soustava nem´ a celoˇ c´ıseln´ e ˇreˇsen´ı
V takov´ em pˇr´ıpadˇ e vol´ıme aritmetick´ y pr˚ umˇ er z 10. a 11. hodnoty. Je x10 = 4, x11 = 5. Potom x ˜50 = 4, 5.
Statistika I (KMI/PSTAT)
11 / 1
Kvantily
V´yznamn´e kvantily K popisu rozloˇzen´ı dat v souboru ˇ casto vyjadˇrujeme nˇ ekter´ e v´ yznamn´ e kvantily: doln´ı kvartil x ˜25 25% kvantil, hranice mezi ˇ ctvrtinou nejniˇzˇs´ıch hodnot a zbyl´ ymi vyˇsˇs´ımi hodnotami medi´ an x ˜ 50% kvantil, oddˇ eluje polovinu dat s niˇzˇs´ı hodnotou od poloviny dat s vyˇsˇs´ı hodnotou horn´ı kvartil x ˜75 75% kvantil, hranice mezi tˇremi ˇ ctvrtinami nejniˇzˇs´ıch hodnot a zbylou ˇ ctvrtinou vyˇsˇs´ıch hodnot
Statistika I (KMI/PSTAT)
12 / 1
Kvantily Pˇr´ıklad 7 Vypoˇ ctˇ ete 30 % kvantil, 47 % kvantil a medi´ an pro veliˇ cinu, jej´ıˇz hodnoty s pˇr´ısluˇsn´ ymi ˇ cetnostmi jsou uvedeny v tabulce: xi ni pi p∗i
2 2 0,1 0,1
5 2 0,1 0,2
6 3 0,15 0,35
7 1 0,05 0,4
9 2 0,1 0,5
Statistika I (KMI/PSTAT)
11 8 0,4 0,9
13 2 0,1 1
P 20 1 ∗
13 / 1
Kvantily Pˇr´ıklad 7 Vypoˇ ctˇ ete 30 % kvantil, 47 % kvantil a medi´ an pro veliˇ cinu, jej´ıˇz hodnoty s pˇr´ısluˇsn´ ymi ˇ cetnostmi jsou uvedeny v tabulce: xi ni pi p∗i
2 2 0,1 0,1
5 2 0,1 0,2
6 3 0,15 0,35
7 1 0,05 0,4
9 2 0,1 0,5
11 8 0,4 0,9
13 2 0,1 1
P 20 1 ∗
30% kvantil Pro x ˜30 je n = 20 a p = 0.3. 20 · 0.3 < z < 20 · 0.3 + 1 6
6+6 =6 2
Statistika I (KMI/PSTAT)
13 / 1
Kvantily Pˇr´ıklad 7 Vypoˇ ctˇ ete 30 % kvantil, 47 % kvantil a medi´ an pro veliˇ cinu, jej´ıˇz hodnoty s pˇr´ısluˇsn´ ymi ˇ cetnostmi jsou uvedeny v tabulce: xi ni pi p∗i
2 2 0,1 0,1
5 2 0,1 0,2
6 3 0,15 0,35
7 1 0,05 0,4
30% kvantil
47% kvantil
Pro x ˜30 je n = 20 a p = 0.3.
Pro x ˜47 je n = 20 a p = 0.47.
9 2 0,1 0,5
11 8 0,4 0,9
13 2 0,1 1
P 20 1 ∗
20 · 0.3 < z < 20 · 0.3 + 1 20 · 0.47 < z < 20 · 0.47 + 1 6
6+6 =6 2
9.4 < z < 10.4 z = 10,
a proto
x ˜43 = 9
Statistika I (KMI/PSTAT)
13 / 1
Kvantily Pˇr´ıklad 7 Vypoˇ ctˇ ete 30 % kvantil, 47 % kvantil a medi´ an pro veliˇ cinu, jej´ıˇz hodnoty s pˇr´ısluˇsn´ ymi ˇ cetnostmi jsou uvedeny v tabulce: xi ni pi p∗i
2 2 0,1 0,1
5 2 0,1 0,2
6 3 0,15 0,35
7 1 0,05 0,4
30% kvantil
47% kvantil
Pro x ˜30 je n = 20 a p = 0.3.
Pro x ˜47 je n = 20 a p = 0.47.
9 2 0,1 0,5
11 8 0,4 0,9
20 1 ∗
Pro x ˜ je n = 20 a p = 0.5
20 · 0.47 < z < 20 · 0.47 + 1
20 · 0.5 < z < 20 · 0.5 + 1
9.4 < z < 10.4
10 < z < 11
6
P
50% kvantil medi´an
20 · 0.3 < z < 20 · 0.3 + 1
x ˜30 =
13 2 0,1 1
z = 10,
a proto
x ˜43 = 9
Statistika I (KMI/PSTAT)
x ˜=
9 + 11 = 10 2 13 / 1
Kvantily
Pˇr´ıklad 8 Vypoˇ ctˇ ete a interpretujte doln´ı a horn´ı kvartil a medi´ an pro veliˇ cinu, jej´ıˇz hodnoty s pˇr´ısluˇsn´ ymi ˇ cetnostmi jsou uvedeny v tabulce: xi ni
100 2
110 5
120 9
130 9
140 13
150 8
160 4
Pˇr´ıklad 9 Vypoˇ ctˇ ete a interpretujte doln´ı a horn´ı kvartil a medi´ an pro veliˇ cinu, jej´ıˇz hodnoty s pˇr´ısluˇsn´ ymi ˇ cetnostmi jsou uvedeny v tabulce: xi pi
100 0.05
110 0.10
120 0.11
130 0.30
140 0.19
Statistika I (KMI/PSTAT)
150 0.15
160 0.10
14 / 1
Kvantily - intervalov´e rozdˇelen´ı ˇcetnost´ı
Kvantily - intervalov´e rozdˇelen´ı ˇcetnost´ı U intervalov´ eho rozdˇ elen´ı ˇ cetnost´ı lze k v´ ypoˇ ctu kvantilu pouˇz´ıt vzorec x ˜p =
zp − n 1 hp + ap , n2
kde zp = n · p + 0, 5 je poˇradov´ eˇ c´ıslo jednotky, jej´ıˇz hodnota bude hledan´ y kvantil, n je rozsah souboru, n1 je kumulativn´ı ˇ cetnost jednotek leˇz´ıc´ıch pˇred kvantilov´ ym intervalem, n2 je ˇ cetnost intervalu, v nˇ emˇz leˇz´ı hledan´ y kvantil, hp je d´ elka kvantilov´ eho intervalu, ap je hodnota, kter´ a tvoˇr´ı doln´ı hranici kvantilov´ eho intervalu.
Statistika I (KMI/PSTAT)
15 / 1
Kvantily - intervalov´e rozdˇelen´ı ˇcetnost´ı Pˇr´ıklad 10 Vypoˇ ctˇ ete vˇsechny kvartily pro veliˇ cinu s intervalov´ ym rozdˇ elen´ım ˇ cetnost´ı: interval mˇ es´ıˇ cn´ıch pˇr´ıjm˚ u – 12 000 12 001 – 13 000 13 001 – 14 000 14 001 – 15 000 15 001 – 16 000 16 001 – 17 000 17 001 – 18 000 18 001 – 19 000 19 001 – 20 000 20 001 – a v´ıce
poˇ cet pracovn´ık˚ u 8 11 16 21 25 22 19 18 7 3
Statistika I (KMI/PSTAT)
kumulovan´ e souˇ cty 8 19 35 56 81 103 122 140 147 150
16 / 1
Kvantily - intervalov´e rozdˇelen´ı ˇcetnost´ı Pˇr´ıklad 10 Vypoˇ ctˇ ete vˇsechny kvartily pro veliˇ cinu s intervalov´ ym rozdˇ elen´ım ˇ cetnost´ı: interval mˇ es´ıˇ cn´ıch pˇr´ıjm˚ u – 12 000 12 001 – 13 000 13 001 – 14 000 14 001 – 15 000 15 001 – 16 000 16 001 – 17 000 17 001 – 18 000 18 001 – 19 000 19 001 – 20 000 20 001 – a v´ıce
poˇ cet pracovn´ık˚ u 8 11 16 21 25 22 19 18 7 3
kumulovan´ e souˇ cty 8 19 35 56 81 103 122 140 147 150
Je z25 = 150 · 0.25 + 0.5 = 38. Doln´ı kvartil proto leˇz´ı v intervalu, kter´ y obsahuje prvek s poˇradov´ ym ˇ c´ıslem 38. Doln´ı kvartil leˇz´ı v intervalu 14 001 – 15 000 Kˇ c. Dosazen´ım do vzorce dostaneme 38 − 35 . x ˜25 = · 1 000 + 14 001 = 14 149. 21
Statistika I (KMI/PSTAT)
16 / 1
Kvantily - intervalov´e rozdˇelen´ı ˇcetnost´ı Pˇr´ıklad 10 Vypoˇ ctˇ ete vˇsechny kvartily pro veliˇ cinu s intervalov´ ym rozdˇ elen´ım ˇ cetnost´ı: interval mˇ es´ıˇ cn´ıch pˇr´ıjm˚ u – 12 000 12 001 – 13 000 13 001 – 14 000 14 001 – 15 000 15 001 – 16 000 16 001 – 17 000 17 001 – 18 000 18 001 – 19 000 19 001 – 20 000 20 001 – a v´ıce
poˇ cet pracovn´ık˚ u 8 11 16 21 25 22 19 18 7 3
kumulovan´ e souˇ cty 8 19 35 56 81 103 122 140 147 150
Je z25 = 150 · 0.25 + 0.5 = 38. Doln´ı kvartil proto leˇz´ı v intervalu, kter´ y obsahuje prvek s poˇradov´ ym ˇ c´ıslem 38. Doln´ı kvartil leˇz´ı v intervalu 14 001 – 15 000 Kˇ c. Dosazen´ım do vzorce dostaneme 38 − 35 . x ˜25 = · 1 000 + 14 001 = 14 149. 21 Dopoˇ c´ıtejte zb´ yvaj´ıc´ı kvartily. Statistika I (KMI/PSTAT)
16 / 1