Z´ aklady datov´ e anal´ yzy, modelov´ eho v´ yvoj´ aˇ rstv´ı a statistick´ eho uˇ cen´ı (Teorie statistiky a aplikace v programovac´ım jazyce Visual Basic for Applications)
Luk´aˇs Pastorek POZOR: Autor upozorˇ nuje, ˇze se jedn´a o rozpracovanou, neupravenou a nerecenzovanou verzi pomocn´eho studijn´ıho materi´alu, z ˇcehoˇz vypl´ yv´a v´ yskyt moˇzn´ ych chyb a dalˇs´ıch nedostatk˚ u v textu.
Tato publikace byla podpoˇrena grantem Fondu rozvoje vysok´ ych ˇskol Ministerˇ v roce 2013. stva ˇskolstv´ı, ml´ adeˇze a tˇelov´ ychovy CR Uˇcebn´ı materi´ al navazuje zejm´ena na neocenitelnou uˇcebnici L. Cyhelsk´eho: ´ Uvod do teorie statistiky z 80. let, ze kter´e byly pˇrevzaty, n´aslednˇe upraveny a doplnˇeny matematick´e vztahy a d˚ ukazy v ˇc´asti o kvantitativn´ı promˇenn´e a publikaci ˇ ´ H. Rezankov´ a a T. L¨ oster: Uvod do statistiky.
Obsah ˇ ast 1. Posloupnosti, sumy a produkty C´
1
Kapitola 1.
Posloupnost
2
Kapitola 2.
Suma
5
Kapitola 3.
Produkt
27
ˇ ast 2. Uvod ´ C´ do teorie popisn´ e statistiky
33
Kapitola 4.
´ Uvodn´ ı statistick´e definice
34
Kapitola 5.
Druhy statistick´ ych znak˚ u (promˇenn´ ych)
35
Kapitola 6.
Rozdˇelen´ı ˇcetnost´ı
37
Kapitola 7. Kvantily a momenty 1. Kvantily 2. Momenty
39 39 40
ˇ ast 3. Kvantitativn´ı promˇ C´ enn´ a
47
Kapitola 8. M´ıry polohy 1. Pr˚ umˇery 2. Aritmetick´ y pr˚ umˇer 3. Harmonick´ y pr˚ umˇer 4. Geometrick´ y pr˚ umˇer 5. Kvadratick´ y pr˚ umˇer 6. Aritmetick´ y stˇred 7. Modus 8. Medi´ an 9. Vztah mezi aritmetick´ ym pr˚ umˇerem, medi´anem a modem 10. Vztahy mezi pr˚ umˇery
48 48 48 55 59 63 66 66 66 67 67
Kapitola 9. M´ıry variability 1. Kvantilov´e m´ıry variability 2. Momentov´e M´ıry variability 3. Ostatn´ı m´ıry variability
70 70 74 85
Kapitola 10. M´ıry ˇsikmosti 1. Definice zeˇsikmen´ ych rozdˇelen´ı 2. N´ aroky na m´ıry ˇsikmosti
92 92 92 iii
iv
OBSAH
3. 4. 5.
Kvantilov´e m´ıry ˇsikmosti Momentov´ a m´ıra ˇsikmosti Ostatn´ı m´ıry ˇsikmosti
92 94 100
Kapitola 11. M´ıry ˇspiˇcatosti 1. N´ aroky na m´ıry ˇspiˇcatosti 2. Kvantilov´e m´ıry ˇspiˇcatosti 3. Momentov´ a m´ıra ˇspiˇcatosti 4. Ostatn´ı m´ıry ˇspiˇcatosti
101 101 101 102 108
ˇ ast 4. Ordin´ C´ aln´ı promˇ enn´ a
109
Kapitola 12.
110
M´ıry polohy
Kapitola 13. M´ıry variability 1. Variaˇcn´ı rozpˇet´ı 2. Mezikvartilov´e rozpˇet´ı 3. Ordin´ aln´ı rozptyl 4. Normalizovan´ y ordin´ aln´ı rozptyl
112 112 112 112 116
ˇ ast 5. Nomin´ C´ aln´ı promˇ enn´ a
121
Kapitola 14.
122
M´ıry polohy
Kapitola 15. M´ıry variability 1. N´ aroky na ukazatele 2. Wilcoxove m´ıry 3. Ostatn´ı ukazatele variability a koncentrace
123 123 123 131
ˇ ast 6. Struˇ C´ cn´ y pˇ rehled ukazatel˚ u s´ıly z´ avislosti mezi promˇ enn´ ymi 139 Kapitola 16. 1. 2. 3.
Mˇeˇren´ı s´ıly souvztaˇznosti mezi dvˇema kvantitativn´ımi promˇenn´ ymi Kovariance Pearson˚ uv korelaˇcn´ı koeficient Spearman˚ uv koeficient poˇradov´e korelace
140 140 141 142
Kapitola 17. Mˇeˇren´ı s´ıly asociace mezi dvˇema kvalitativn´ımi promˇenn´ ymi 1. Kontingenˇcn´ı tabulka 2. Pearson˚ uv Ch´ı-kvadr´ at (Empirick´a stˇredn´ı ˇctvercov´a kontingence) 3. Pearson˚ uv koeficient kontingence ˇ 4. Cuprov˚ uv koeficient kontingence 5. Cramer˚ uv koeficient kontingence
144 144 146 148 149 150
Kapitola 18. Mˇeˇren´ı s´ıly z´ avislosti kvantitativn´ı na kvalitativn´ı promˇenn´e 1. Jednofaktorov´ a anal´ yza rozptylu 2. Pomˇer determinace
152 152 153
ˇ ast 7. Uvod ´ C´ do teorie ˇ casov´ ych ˇ rad
155
Kapitola 19.
156
Z´ akladn´ı definice
OBSAH
v
Kapitola 20. Z´ akladn´ı charakteristiky ˇcasov´e ˇrady 1. Obecn´ au ´roveˇ n ˇcasov´e ˇrady 2. Absolutn´ı m´ıry dynamiky 3. Relativn´ı m´ıry dynamiky - ukazatele tempa r˚ ustu
158 158 160 161
´ Kapitola 21. Uvod do vyrovn´av´an´ı hodnot ˇcasov´e ˇrady 1. Prost´e klouzav´e pr˚ umˇery 2. Centrovan´e klouzav´e pr˚ umˇery
163 163 164
ˇ ast 8. Uvod ´ C´ do teorie hospod´ aˇ rsk´ ych index˚ u
167
Kapitola 22.
´ Uvodn´ ı definice
168
Kapitola 23.
Individu´ aln´ı jednoduch´e indexy
170
Kapitola 24. Individu´ aln´ı sloˇzen´e indexy 1. Sloˇzen´ y index celkov´e hodnoty 2. Sloˇzen´ y objemov´ y index 3. Index promˇenliv´eho sloˇzen´ı
171 171 172 172
Kapitola 25. Souhrn´e indexy - Indexy st´al´eho sloˇzen´ı a struktury 1. Objemov´e souhrn´e indexy - Indexy st´al´e struktury 2. Cenov´e souhrnn´e indexy - Indexy st´al´eho sloˇzen´ı
174 174 175
Literatura
177
ˇ ast 1 C´
Posloupnosti, sumy a produkty
KAPITOLA 1
Posloupnost Definice 0.1. Posloupnost´ı naz´ yv´ ame kaˇzd´e zobrazen´ı mnoˇziny vˇsech kladn´ ych cel´ ych ˇc´ısel N do mnoˇziny vˇsech re´ aln´ ych ˇc´ısel R (nekoneˇcn´a posloupnost) nebo zobrazen´ı nepr´azdn´e podmnoˇziny vˇsech kladn´ ych cel´ ych ˇc´ısel N do nepr´azdn´e podmnoˇziny vˇsech re´aln´ ych ˇc´ısel R (koneˇcn´ a posloupnost) [2]. Pozn´ amka: My se budeme zab´ yvat pouze koneˇcn´ ymi posloupnostmi, coˇz je d´ano neexistenc´ı nekoneˇcn´ ych posloupnost´ı (nekoneˇcnˇe velik´ ych datov´ ych soubor˚ u) v analytick´e nebo program´ atorsk´e praxi. Tud´ıˇz, pod posloupnost´ı budeme ch´apat sp´ıˇs re´alnou funkci jedn´e re´ aln´e promˇenn´e, jej´ımˇz definiˇcn´ım oborem je podmnoˇzina vˇsech kladn´ ych cel´ ych ˇc´ısel N.
Definice 0.2. Koneˇ cnou posloupnost v Definici 0.1 m˚ uˇzeme symbolicky zadefinovat n´asledovnˇe: (1)
n
A = {ai }i=m = am , am+1 , . . . , an ,
pˇriˇcemˇz plat´ı, ˇze (2)
∀i ∈ U ∃!ai ∈ R : i −→ ai ,
kde i je vˇseobecn´e oznaˇcen´ı pro pomocn´y index (vzor obrazu), kter´ y n´am umoˇzn ˇuje rozliˇsit ˇcleny posloupnosti, m je poˇc´ ateˇcn´ı index, m ∈ N n je koneˇcn´ y index, n ∈ N, m ≤ n U je mnoˇzina vˇsech index˚ u, pro kterou plat´ı U = {i|i = m, m + 1, . . . , n}, am je prvn´ı ˇclen posloupnosti, ai je i-t´ y ˇclen posloupnosti, oznaˇcuj´ıc´ı se jako obecn´ y ˇclen posloupnosti (obraz ), an je koneˇcn´ y ˇclen posloupnosti, A je mnoˇzina vˇsech ˇclen˚ u posloupnosti, pro kterou plat´ı A = {ai | (ai ∈ R) ∧ (i ∈ U )} Pozn´ amka: Souˇc´ ast´ı kaˇzd´eho zpracov´ an´ı a datov´e anal´ yzy v jak´emkoliv analytick´em programov´em bal´ıku je pˇriˇrazen´ı symbol˚ u jednotliv´ ym u ´daj˚ um. Programy nepracuj´ı s re´ aln´ ymi n´ azvy ale pouze s jejich pˇresn´ ym algoritmick´ ym oznaˇcen´ım. Takto se zabezpeˇc´ı jednoznaˇcn´ a identifikace a vylouˇc´ı se moˇznost jak´ekoliv z´amˇeny. Asociovan´e indexy m˚ uˇzeme ch´ apat jako unik´atn´ı kl´ıˇce, kter´e pˇrekl´adaj´ı bˇeˇzn´e oznaˇcen´ı v 2
1. POSLOUPNOST
3
lidsk´em jazyce do matematick´eho jazyka algoritm˚ u. T´ımto zp˚ usobem se transformuj´ı re´ aln´ a data na abstraktn´ı matematick´e konstrukty a otev´ır´a se moˇznost jejich exaktn´ıho matematick´eho a algoritmick´eho zpracov´an´ı. Pozn´ amka: Pro symbolick´e oznaˇcen´ı m˚ uˇzeme samozˇrejmˇe pouˇz´ıt i jin´ ych p´ısmen. Pozn´ amka: Nejv´ıce se setk´ ame se situac´ı, kdy bude m = 1, tud´ıˇz, n
{ai }i=1 = a1 , a2 , . . . , an .
(3)
Napˇr´ıklad, mˇejme soubor, kter´ y obsahuje informace o vl´adn´ıch v´ ydaj´ıch v jednotliv´ ych ˇclensk´ ych st´ atech EU, Islandu a Norska v roce 2010. St´aty a jejich v´ ydaje: ˇ a republika (65,724 mil. EUR), Slovensko (26,328 Nˇemecko (136,354 mil. EUR), Cesk´ mil. EUR), ... ´ Udaje a jejich oznaˇcen´ı mus´ı pˇrej´ıt d˚ ukladn´ ym pˇredefinov´an´ım v programu. Program hodnoty zadefinuje n´ asledovnˇe: St´ at → i Nˇemecko → i = 1 ˇ a republika → i = 2 Cesk´ Slovensko → i = 3 .. . Vl´ adn´ı v´ ydaje Vl´ adn´ı v´ ydaje Vl´ adn´ı v´ ydaje Vl´ adn´ı v´ ydaje .. .
v i-t´em st´ atˇe → xi v Nˇemecku → x1 = 136354 ˇ e republice → x2 = 65724 v Cesk´ na Slovensku → x3 = 26328
Pozn´ amka: ˇ Cleny posloupnosti nemus´ı b´ yt pouze samostatn´e hodnoty ale tak´e funkce, kter´e pracuj´ı s p˚ uvodn´ımi hodnotami a transformuj´ı je. ˇ´ıklad 1. Mˇejme datov´y soubor X, kter´y obsahuje hodnoty xi . Pr Hodnoty jsou zaps´ any v tomto poˇrad´ı X = (14500, 48000, 17000, 16000, 28000, 35000). n Vypiˇste vˇsechny ˇcleny posloupnosti {ai }i=3 , kdyˇz v´ıte, ˇze ai = xi + 5000. ˇ sen´ı: Reˇ X = {xi |i = 1, 2, . . . , n} x1 = 14500 x2 = 48000 x3 = 17000 x4 = 16000 x5 = 28000 x6 = 35000 n=6
4
1. POSLOUPNOST n
{ai }i=3 = 6
= {ai }i=3 = {a3 , a4 , a5 , a6 } = (4)
= {x3 + 5000, x4 + 5000, x5 + 5000, x6 + 5000} = = {17000 + 5000, 16000 + 5000, 28000 + 5000, 35000 + 5000} = = {22000, 21000, 33000, 40000} .
ˇ sen´ı ve VBA: Reˇ K´ od m˚ uˇze vypadat n´ asledovnˇe Sub Posloupnost() For i = 3 To 6 Cells(i, 2) = Cells(i, 1) + 5000 Next i End Sub
Nov´e hodnoty program vypsal do druh´eho sloupce do odpov´ıdaj´ıc´ıch ˇr´adk˚ u otevˇren´eho listu seˇsitu.
KAPITOLA 2
Suma Definice 0.3.
n Necht’ je d´ ana posloupnost uspoˇr´adan´ ych hodnot v datov´em souboru {at }m , kde m, n ∈ N, n ≥ m. Operaci, kter´a sˇc´ıt´a dan´e ˇcleny t´eto posloupnosti, oznaˇcujeme jako sumaci.
Pozn´ amka: Operaci sumace oznaˇcujeme velk´ ym ˇreck´ ym p´ısmenem Σ (Sigma), kter´e vol´ame i jako sumaˇcn´ı znak nebo sumaˇcni oper´ ator.
Definice 0.4. Pˇredchoz´ı definice m˚ uˇzeme symbolicky zapsat s pomoc´ı sumaˇcniho oper´atora ve tvaru n+c X
(5)
ai−c
i=m+c
( am + am+1 + . . . + an = 0
kdyˇz n ≥ m jinak
pˇriˇcemˇz plat´ı, ˇze (i − c) = t ⇔ ai−c = at ,
(6) 0
kde c je konstanta, c ∈ Z . Pozn´ amka: Symbol i naz´ yv´ ame sumaˇcn´ı index (sumaˇcn´ı index m˚ uˇze b´ yt oznaˇcen samozˇrejmˇe i jin´ ym p´ısmenem). Povˇetˇsinou se setk´ ame v t´eto uˇcebnici s pˇr´ıpady, kdy bude v definic´ıch konstanta c rovna nule, c = 0 a m = 1, tud´ıˇz, sumaˇcn´ı index i bude totoˇzn´ y s pomocn´ ym indexem v posloupnosti t. V naˇsem pˇr´ıpadˇe bude i = t ⇔ ai = at .
(7)
Z´ıskame tak m´enˇe komplikovan´ y a v´ıce zn´am´ y z´apis n X (8) ai = a1 + a2 + . . . + an . i=1
Tˇreba vˇsak podotknout, ˇze je to jenom jeden pˇr´ıpad, i kdyˇz nejrozˇs´ıˇrenˇejˇs´ı. V pˇr´ıpadˇe v´ yvoje model˚ u nemus´ı b´ yt sumace poˇc´ınaj´ıc´ı prvn´ım ˇclenem souboru vˇzdy ˇz´ adouc´ı. Z hlediska lepˇs´ıho osvojen´ı si statistick´ ych definic a vˇet, vˇsak z˚ ustaneme v n´ asleduj´ıc´ıch kapitol´ ach pˇri konceptu sumace od prvn´ıho ˇclenu v souboru. Pozn´ amka: Doln´ı symbol m pˇri sumaˇcn´ım znaku
P
znaˇc´ı, kter´ y ˇclen souboru budeme br´at
i=m+c
jako prvn´ı sˇc´ıtanec, jelikoˇz am+c−c = am . Kaˇzd´ y n´asleduj´ıc´ı sˇc´ıtanec (n´asleduj´ıc´ı 5
6
2. SUMA
ˇclen posloupnosti) m´ a index o jednotku vˇetˇs´ı, neˇz ˇclen pˇriˇcten´ y v pˇredchoz´ım kroku, n+c P , odkazuje na (am + am+1 + am+2 + . . . + an−2 + an−1 + an ). Horn´ı symbol n, ˇclena souboru, kter´eho pˇriˇcteme jako posledn´ıho (an+c−c = an ). Princip sumace, tud´ıˇz spoˇc´ıv´ a v iterativn´ım (opakovan´em) pˇriˇc´ıt´an´ı nov´ ych sˇc´ıtanc˚ u k pˇredchoz´ım v´ ysledk˚ um sˇc´ıt´ an´ı. Pozn´ amka: V pˇr´ıpadˇe, ˇze je horn´ı index menˇs´ı neˇz doln´ı index, v´ ysledek je tzv. pr´azdna suma rovn´ a nule. ˇ´ıklad 2. Na z´ Pr aklade dat z Pˇr´ıkladu 1 urˇcete 3 P a) xi ; b)
i=1 3 P
c)
i=1 3 P
xi + x4 ; xi − x1 .
i=1
ˇ sen´ı: Reˇ Postup je n´ asledovn´ y a) 3 X
(9)
xi = (a1 + a2 + a3 )
i=1
= (14500 + 48000 + 17000) = 79500; Sub Suma() Dim Suma As Single Suma = 0 For i = 1 To 3 Suma = Suma + Cells(i, 1) Next i MsgBox ("Suma:"& vbTab & Suma) End Sub b) 3 X
! xi
+ x4 = (x1 + x2 + x3 ) + x4 = x1 + x2 + x3 + x4 =
i=1
(10) =
4 X
xi = 14500 + 48000 + 17000 + 16000 = 95500.
i=1
Sub Suma() Dim Suma As Single Suma = 0 For i = 1 To 3 Suma = Suma + Cells(i, 1)
2. SUMA
7
Next i Suma = Suma + Cells(4, 1) MsgBox ("Suma:"& vbTab & Suma) End Sub c) 4 X
! xi
− x1 = (x1 + x2 + x3 + x4 ) − x1 = x2 + x3 + x4 =
i=1
(11) =
4 X
xi = 48000 + 17000 + 16000 = 81000.
i=2
Sub Suma() Dim Suma As Single Suma = 0 For i = 1 To 4 Suma = Suma + Cells(i, 1) Next i Suma = Suma - Cells(1, 1) MsgBox ("Suma:"& vbTab & Suma) End Sub
ta 0.1. Kdyˇz k < l < n, plat´ı Ve n X
(12)
ai −
i=k
l X i=k
ai =
n X
ai ,
i=l+1
D˚ ukaz. n X i=k
ai −
l X
ai =
i=k
= (ak + ak+1 + . . . + an ) − (ak + ak+1 + . . . + al ) = (13)
= (ak + ak+1 + . . . + al + . . . + an ) − (ak + ak+1 + . . . + al ) = = (ak + ak+1 + . . . + al + al+1 . . . + an ) − (ak + ak+1 + . . . + al ) = =al+1 + . . . + an =
n X
ai .
i=l+1
6 P i=1
ˇ´ıklad 3. Na z´ Pr aklade dat z Pˇr´ıkladu 1 urˇcete: 2 P xi − xi ; i=1
ˇ sen´ı: Reˇ 2 6 P P xi − xi = (x1 + x2 + x3 + x4 + x5 + x6 ) + (x1 + x2 ) = i=1
i=1
= (x3 + x4 + x5 + x6 ) =
6 P i=3
xi = 17000 + 16000 + 28000 + 35000 = 96000.
8
2. SUMA
Sub Suma() Dim Suma As Single Suma1 = Application.Sum(Range("A1:A6")) Suma2 = Application.Sum(Range("A1:A2")) Suma = Suma1 - Suma2 MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single Suma = Application.Sum(Range("A3:A6")) MsgBox ("Suma:"& vbTab & Suma) End Sub nebo jin´e spracov´ an´ı Sub Suma() Dim Suma As Single Suma = 0 For i = 1 To 6 Suma1 = Suma1 + Cells(i, 1) If i = 2 Then Suma2 = Suma1 ElseIf i <> 2 Then End If Next i Suma = Suma1 - Suma2 MsgBox ("Suma:"& vbTab & Suma) End Sub
ta 0.2. Kdyˇz k < l < n, plat´ı Ve n X
(14)
i=k
ai −
n X i=l
ai =
l−1 X
ai ,
i=k
D˚ ukaz. n n X X ai − ai = i=k
i=l
= (ak + ak+1 + . . . + an ) − (al + al+1 + . . . + an ) = (15) = (ak + ak+1 + . . . + al + al+1 + . . . + an ) − (al + al+1 + . . . + an ) = = (ak + ak+1 + . . . + al−1 + al + al+1 + . . . + an ) − (al + al+1 + . . . + an ) = =ak + . . . + al−1 =
l−1 X
ai .
i=k
2. SUMA
6 P
9
ˇ´ıklad 4. Na z´ Pr aklade dat z Pˇr´ıkladu 1 urˇcete: 6 P xi − xi ;
i=1
i=3
ˇ sen´ı: Reˇ 6 X i=1
xi −
6 X
xi =
i=3
= (x1 + x2 + x3 + x4 + x5 + x6 ) + (x3 + x4 + x5 + x6 ) =
(16)
= (x1 + x2 ) xi =
2 X
= 14500 + 48000 = 62500.
i=1
Sub Suma() Dim Suma As Single Suma1 = Application.Sum(Range("A1:A6")) Suma2 = Application.Sum(Range("A3:A6")) Suma = Suma1 - Suma2 MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single Suma = Application.Sum(Range("A1:A2")) MsgBox ("Suma:"& vbTab & Suma) End Sub
ta 0.3. Kdyˇz K je konstanta, plat´ı Ve n X
(17)
(Kai ) = K
i=1
n X
ai ,
i=1
D˚ ukaz. n X
(Kai ) =
i=1
=Ka1 + Ka2 + . . . + Kan =
(18)
=K (a1 + a2 + . . . + an ) = K
n X
ai .
i=1
ˇ´ıklad 5. Na z´ Pr aklade dat z Pˇr´ıkladu 1 urˇcete: a)
n P i=1
(Kxi )
10
2. SUMA
b)
n P
(Kxi )
i=3
ˇ sen´ı: Reˇ
n P
a)
(Kxi ) = K
i=1
6 P
(xi ) = K ∗ (x1 + x2 + x3 + x4 + x5 + x6 ) =
i=1
= 2 ∗ (14500 + 48000 + 17000 + 16000 + 28000 + 35000) = 2 ∗ 158500 = 317000 Sub Suma() Dim Suma As Single For i=1 to 6 Suma = Suma + 2* Cells(i, 1) Next i MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single Suma = 2 * Application.Sum(Range("A1:A6")) MsgBox ("Suma:"& vbTab & Suma) End Sub b)
n P
(Kxi ) = K
i=3
6 P
(xi ) = K ∗ (a3 + a4 + a5 + a6 ) =
i=3
= 2 ∗ (16000 + 28000 + 35000) = 2 ∗ 96000 = 192000. Sub Suma() Dim Suma As Single For i=3 to 6 Suma = Suma + 2* Cells(i, 1) Next i MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single Suma = 2 * Application.Sum(Range("A3:A6")) MsgBox ("Suma:"& vbTab & Suma) End Sub
ta 0.4. Plat´ı Ve
(19)
n X i=1
(ai + bi ) =
n X i=1
ai +
n X i=1
bi ,
2. SUMA
11
D˚ ukaz. n X
(ai + bi ) =
i=1
=a1 + b1 + a2 + b2 + . . . + an + bn = = (a1 + b1 ) + (a2 + b2 ) + . . . + (an + bn ) =
(20)
= (a1 + a2 + . . . + an ) + (b1 + b2 + . . . + bn ) = =
n X i=1
ai +
n X
bi .
i=1
4 P
ˇ´ıklad 6. Na z´ Pr aklade dat z Pˇr´ıkladu 1 urˇcete: (xi + xi+1 );
i=2
ˇ sen´ı: Reˇ 4 X i=2
(21)
(xi + xi+1 ) =
4 X
xi +
i=2
4 X
xi+1 =
i=2
= (x2 + x3 + x4 ) + (x3 + x4 + x5 ) = = (48000 + 17000 + 16000) + (17000 + 16000 + 28000) = =81000 + 61000 = 142000.
Sub Suma() Dim Suma As Single Suma = 0 For i = 2 To 4 Suma = Suma + ( Cells(i, 1)+ Cells(i+1, 1)) Next i MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single Suma1 = 0 Suma2 = 0 For i = 2 To 4 Suma1 = Suma1 + Cells(i, 1) Suma2 = Suma2 + Cells(i+1, 1) Next i Suma=Suma1+Suma2 MsgBox ("Suma:"& vbTab & Suma) End Sub
12
2. SUMA
ta 0.5. Kdyˇz n > m, plat´ı Ve m X
(22)
n X
ai +
i=1
ai =
i=m+1
n X
ai ,
i=1
D˚ ukaz. m X
n X
ai +
i=1
ai =
i=m+1
=a1 + a2 + . . . + am + am+1 + am+2 + . . . + an =
(23)
=a1 + a2 + . . . + an =
n X
ai .
i=1
4 P
ˇ´ıklad 7. Na z´ Pr aklade dat z Pˇr´ıkladu 1 urˇcete: 6 P xi + xi
i=2
i=5
ˇ sen´ı: Reˇ 4 X
(24)
i=2
xi +
6 X
xi =
i=5
= (x2 + x3 + x4 ) + (x5 + x6 ) = x2 + x3 + x4 + x5 + x6 = =48000 + 17000 + 16000 + 28000 + 35000 = 144000. Sub Suma() Dim Suma As Single Suma1 = Application.Sum(Range("A2:A4")) Suma2 = Application.Sum(Range("A5:A6")) Suma=Suma1+Suma2 MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single Suma = Application.Sum(Range("A2:A6")) MsgBox ("Suma:"& vbTab & Suma) End Sub
ta 0.6. Kdyˇz k < l < m < n, plat´ı Ve (25)
m X i=k
ai +
n X i=l
ai =
n X i=k
ai +
m X i=l
ai ,
2. SUMA
D˚ ukaz. m X
ai +
i=k
n X
13
ai =
i=l
= (ak + ak+1 + . . . + al + . . . + am ) + (al + al+1 + . . . + am + . . . + an ) = =ak + ak+1 + . . . + al + . . . + am + al + al+1 + . . . + am + . . . + an = (26)
=ak + ak+1 + . . . + al + . . . + am + (al + al+1 + . . . + am ) + . . . + an = =ak + ak+1 + . . . + al + . . . + am + . . . + an + (al + al+1 + . . . + am ) = =(ak + ak+1 + . . . + al + . . . + am + . . . + an ) + (al + al+1 + . . . + am ) = =(ak + ak+1 + . . . + an ) + (al + . . . + am ) =
n X i=k
ai +
m X
ai .
i=l
5 P
ˇ´ıklad 8. Na z´ Pr aklade dat z Pˇr´ıkladu 1 urˇcete: 6 P xi + xi
i=2
i=4
ˇ sen´ı: Reˇ 5 X
xi +
6 X
xi =
i=4
i=2
= (x2 + x3 + x4 + x5 ) + (x4 + x5 + x6 ) = (27)
= (x2 + x3 + x4 + x5 + x6 ) + (x4 + x5 ) = =
6 X i=2
xi +
5 X
xi =
i=4
= (48000 + 17000 + 16000 + 28000 + 35000) + (16000 + 28000) = =144000 + 44000 = 188000. Sub Suma() Dim Suma As Single Suma1 = Application.Sum(Range("A2:A5")) Suma2 = Application.Sum(Range("A4:A6")) Suma=Suma1+Suma2 MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single Suma1 = Application.Sum(Range("A2:A6")) Suma2 = Application.Sum(Range("A4:A5")) Suma=Suma1+Suma2 MsgBox ("Suma:"& vbTab & Suma)
14
2. SUMA
End Sub
ta 0.7. Kdyˇz k < m < l < n, plat´ı Ve m X
(28)
ai +
i=k
n X
ai =
i=l
n X
ai −
i=k
l−1 X
ai ,
i=m+1
D˚ ukaz. (29) m X
ai +
n X
i=k
ai =
i=l
= (ak + ak+1 + . . . + am ) + (al + al+1 + . . . + an ) = = (ak + ak+1 + . . . + am + al + . . . + an ) = = (ak + ak+1 + . . . + an ) − (ak + ak+1 + . . . + an ) + (ak + ak+1 + . . . + am + al + . . . + an ) = = (ak + ak+1 + . . . + am + . . . + al + . . . + an ) − (ak + ak+1 + . . . + am + . . . + al + . . . + an ) + (ak + ak+1 + . . . + am + al + . . . + an ) = = (ak + ak+1 + . . . + am + am+1 . . . + al−1 + al + . . . + an ) − (ak + ak+1 + . . . + am + am+1 . . . + al−1 + al + . . . + an ) + (ak + ak+1 + . . . + am + al + . . . + an ) = = (ak + ak+1 + . . . + am + am+1 . . . + al−1 + al + . . . + an ) − (am+1 . . . + al−1 ) = = (ak + ak+1 + . . . + an ) − (am+1 . . . + al−1 ) = =
n X
l−1 X
ai −
i=k
ai
i=m+1
2 P
ˇ´ıklad 9. Na z´ Pr aklade dat z Pˇr´ıkladu 1 urˇcete: 6 P xi + xi
i=1
i=5
ˇ sen´ı: Reˇ 2 X
xi +
i=1
(30)
=
6 X i=1
6 X
xi = (x1 + x2 ) + (x5 + x6 ) =
i=5
xi −
4 X
xi =
i=3
= (x1 + x2 + x3 + x4 + x5 + x6 ) − (x3 + x4 ) = = (x1 + x2 ) + (x5 + x6 ) = = (14500 + 48000 + 28000 + 35000) = 125500.
Sub Suma()
2. SUMA
15
Dim Suma As Single Suma1 = Application.Sum(Range("A1:A2")) Suma2 = Application.Sum(Range("A5:A6")) Suma=Suma1+Suma2 MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single Suma1 = Application.Sum(Range("A1:A6")) Suma2 = Application.Sum(Range("A3:A4")) Suma=Suma1-Suma2 MsgBox ("Suma:"& vbTab & Suma) End Sub
ta 0.8. Kdyˇz K je konstanta, plat´ı Ve n X
(31)
K = nK,
i=1
D˚ ukaz. n X
(32)
K = K + K + . . . + K = nK
i=1
5 P
ˇ´ıklad 10. Na z´ Pr aklade dat z Pˇr´ıkladu 1 urˇcete: 1000
i=1
ˇ sen´ı: Reˇ
(33)
5 X
1000 = 1000 + 1000 + 1000 + 1000 + 1000 = 5 ∗ 1000 = 5000.
i=1
Sub Suma() Dim Suma As Single Suma = 0 For i = 1 To 5 Suma = Suma + 1000 Next i MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma()
16
2. SUMA
Dim Suma As Single Suma = 5*1000 MsgBox ("Suma:"& vbTab & Suma) End Sub
ta 0.9. Kdyˇz K je konstanta, plat´ı Ve n X
(34)
K = (n − m + 1)K,
i=m
D˚ ukaz. n X
(35)
i=m
K=
n X
K−
i=1
m−1 X
K = nK − (m − 1)K = (n − m + 1)K
i=1
5 P
ˇ´ıklad 11. Na z´ Pr aklade dat z Pˇr´ıkladu 1 urˇcete: 1000
i=2
ˇ sen´ı: Reˇ 5 X
(36)
1000 = 1000 + 1000 + 1000 + 1000 =
i=2
=(5 − 2 + 1) ∗ 1000 = 4000. Sub Suma() Dim Suma As Single Suma = 0 For i = 2 To 5 Suma = Suma + 1000 Next i MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single Suma = (5-2+1)*1000 MsgBox ("Suma:"& vbTab & Suma) End Sub
ta 0.10. Kdyˇz c je libovoln´e cel´e ˇc´ıslo a n > m, plat´ı Ve (37)
n X i=m
ai =
n−m+c X j=c
aj+m−c ,
2. SUMA
D˚ ukaz. Mˇejme sumu posloupnosti
n P
17
ai . Chceme pˇretransformovat’ indexy v
i=m
uveden´e sumaci n´ asledovn´ ym zp˚ usobem: (1) Doln´ı index nov´e pˇretransformovan´e sumy oznaˇcuj´ıc´ı doln´ı hranici je roven j = c, kde c je libovolnˇe zvolen´e cel´e ˇc´ıslo. (2) Nov´ a suma posloupnosti mus´ı m´ıt identick´ y poˇcet sˇc´ıtac´ıch ˇclenu jako p˚ uvodn´ı suma. (3) Suma mus´ı sˇc´ıtat identick´e ˇcleny posloupnosti jako p˚ uvodn´ı suma. Aby mˇeli sumy stejn´ y poˇcet ˇclen˚ u, mus´ı platit mezi indexy p˚ uvodn´ı a nov´e sumy n´ asleduj´ıc´ı vztahy n − m = x − c,
(38)
x = n − m + c, x P kde x je nezn´ am´ y horn´ı index u nov´e sumy . Tud´ıˇz, indexy u nov´e sumy jsou
(39)
j=c
rovny
n−m+c P
.
j=c
Aby se nov´ a suma odvol´ avala na sˇc´ıtan´ı p˚ uvodn´ıch ˇclen˚ u posloupnosti mus´ı platit (40)
am + am+1 + . . . + an = ac+y + ac+1+y + . . . + an−m+c+y ,
kde y je nezn´ ame cel´e ˇc´ıslo. Z rovnice (40) vypl´ yv´a, ˇze y = m − c. Rovnice (40) se tedy d´ a pˇrepsat do tvaru n X
(41)
ai =
i=m
n−m+c X
aj+m−c ,
j=c
4 P
ˇ´ıklad 12. Na z´ Pr aklade dat z Pˇr´ıkladu 1 urˇcete: xi
i=2
ˇ sen´ı: Reˇ 4 X
(42)
i=2
(4−2+7)
xi =
X
xj+2−7 =
j=7
9 X
xj−5 =
j=7
=x(7−5) + x(8−5) + x(9−5) = x2 + x3 + x4 = =48000 + 17000 + 16000 = 81000.
Sub Suma() Dim Suma As Single Suma = Application.Sum(Range("A2:A4")) MsgBox ("Suma:"& vbTab & Suma) End Sub
18
2. SUMA
nebo Sub Suma() Dim Suma As Single Suma = 0 For i = 7 To 4-2+7 Suma = Suma + ( Cells(i+2-7, 1)) Next i MsgBox ("Suma:"& vbTab & Suma) End Sub
ta 0.11. Kdyˇz c je libovoln´e cel´e ˇc´ıslo a n > m, Vˇeta 0.10 se d´a zapsat i jako Ve n X
(43)
ai =
i=m
n+c X
ai−c ,
j=m+c
D˚ ukaz. Postupujeme analogicky jako pˇri d˚ ukazu Vˇety 0.10. ˇ´ıklad 13. Na z´ Pr aklade dat z Pˇr´ıkladu 1 pˇretransformujte sumaci
n P i=m
pˇredchoz´ı Vˇety, kdyˇz v´ıte, ˇze m = 2, n = 4 a c = 5. ˇ sen´ı: Reˇ 4 X
(44)
i=2
(4+5)
xi =
X
xj−5 =
9 X
xj−5 =
j=7
j=2+5
=x(7−5) + x(8−5) + x(9−5) = x2 + x3 + x4 = =48000 + 17000 + 16000 = 81000. Sub Suma() Dim Suma As Single Suma = Application.Sum(Range("A2:A4")) MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single Suma = 0 For i = 2+5 To 4+5 Suma = Suma + ( Cells(i-5, 1)) Next i MsgBox ("Suma:"& vbTab & Suma) End Sub
ta 0.12. Plat´ı Ve (45)
n X s X i=m j=r
aij =
s X n X j=r i=m
aij
xi podle
2. SUMA
19
D˚ ukaz.
n P s P
=
aij
=
(air
+
i=m j=r n P
ai(r+1)
+
...
+
ais )
=
amr + am(r+1) a(m+1)r + a(m+1)(r+1) .. .. . + . anr + an(r+1) s P amj +
+ +
... ...
+ +
+ +
... ...
+ +
ams + a(m+1)s + .. . + ans =
+
...
+
anj )
i=m
(46)
=
j=r s P
a(m+1)j
+
j=r
.. . + s P
anj
=
(amj
+
=
j=r s P
=
j=r s P n P
a(m+1)j
=
aij
j=r i=m
ˇ´ıklad 14. Mˇejme matici A ve tvaru 2×3 s hodnotami symbolicky oznaˇcen´ymi Pr jako aij , kde i je poˇradov´e ˇc´ıslo ˇr´ adku a j je poˇradov´e ˇc´ıslo sloupce, ve kter´em se prvek aij nach´ az´ı,
120 A= 200
(47)
Vypoˇc´ıtejte
2 P 3 P i=1 j=1
aij
360 170
720 . 360
20
2. SUMA
ˇ sen´ı: Reˇ 2 X 3 X
aij =
i=1 j=1
=
2 X
(ai1 + ai2 + ai3 ) =
i=1
= (120 + 200) + (360 + 170) + (720 + 360) =
(48)
=120 + 200 + 360 + 170 + 720 + 360 = =120 + 360 + 720 + 200 + 170 + 360 = = (120 + 360 + 720) + (200 + 170 + 360) = =
3 X
a1j + a2j = 1930.
j=1
Sub Suma() Dim Suma As Single For i = 1 To 2 For j = 1 To 3 Suma = Suma + Cells(i, j) Next j Next i MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single For j = 1 To 3 For i = 1 To 2 Suma = Suma + Cells(i, j) Next i Next j MsgBox ("Suma:"& vbTab & Suma) End Sub
ta 0.13. Plat´ı Ve n X
(49)
! ai
s X
i=m
bj =
j=r
n X s X
(ai bj )
i=m j=r
D˚ ukaz. (50)
n P
i=m
ai
s P j=r
! bj
=
2. SUMA
=
21
(am + am+1 + . . . + an ) (br + br+1 + . . . + bs )
=
=
a m br + am br+1 + . . . + am bs + am+1 br + am+1 br+1 + . . . + am+1 bs + .. .. .. . + . + ... + . + an br + an br+1 + . . . + an bs = ! n s n P P P ai [ai (br + br+1 + . . . + bs )] = bj = = i=m i=m j=r ! n s s n P P P P = ai bj = (ai bj ) i=m
j=r
i=m j=r
ˇ´ıklad 15. Mˇejme vektor v s prvkami ai a vektor u s prvkami bi , Pr (51) v = 120, 360, 720 , u = 200, 170, 360 .
(52) Vypoˇc´ıtejte
3 P 3 P
ai bj
i=1 j=1
ˇ sen´ı: Reˇ 3 X
ai
i=1
3 X
bj = (120 + 360 + 720) · (200 + 170 + 360) =
j=1
=120 · (200 + 170 + 360) + 360 · (200 + 170 + 360) + + 720 · (200 + 170 + 360) = =120 ·
3 X
bj + 360 ·
j=1
(53)
=
3 X
3 X
bj + 720 ·
j=1
120 · bj +
j=1
=
3 X
3 X
360 · bj +
j=1
3 X
bj =
j=1 3 X
720 · bj =
j=1
(120 · bj + 360 · bj + 720 · bj ) =
j=1
=
3 X
[(120 + 360 + 720) · bj ] =
j=1
=
3 X j=1
"
3 X
! ai
# bj =
i=1
Sub Suma() Dim Suma As Single For i = 1 To 3 Suma1 = Suma1 + Cells(1, i) Suma2 = Suma2 + Cells(2, i)
3 3 X X j=1
i=1
! ai bj
=
3 X 3 X j=1 i=1
ai bj = 876000.
22
2. SUMA
Next i Suma = Suma1 * Suma2 MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single For i = 1 To 3 For j = 1 To 3 Suma = Suma + Cells(1, i) * Cells(2, j) Next j Next i MsgBox ("Suma:"& vbTab & Suma) End Sub
ta 0.14. Plat´ı Ve n X
(54)
i=
i=m
1 (n − m + 1) (m + n) 2
D˚ ukaz. n X
(55)
i = m + (m + 1) + (n − 1) + . . . + n,
i=m
Poˇcet ˇclen˚ u pˇredchoz´ı sumace je n − m + 1. 2
n X
i=
i=m
= [m + (m + 1) + . . . + (n − 1) + n] + [m + (m + 1) + . . . + (n − 1) + n] = = [m + (m + 1) + . . . + (n − 1) + n] + [n + (n − 1) + . . . + (m + 1) + m] = (56)
=m + (m + 1) + . . . + (n − 1) + n+ n + (n − 1) + . . . + (m + 1) + m = =m + n + (m + 1) + (n − 1) + . . . + (n − 1) + (m + 1) + n + m = =(m + n) + (m + 1 + n − 1) + . . . + (n − 1 + m + 1) + (n + m) = =(m + n) + (m + n) + . . . + (m + n) + (m + n) = (n − m + 1)(m + n)
(57)
2
n X
i = (n − m + 1)(m + n)
i=m
(58)
n X i=m
i=
1 (n − m + 1)(m + n) 2
2. SUMA
6 P
23
ˇ´ıklad 16. Urˇcete: Pr i
i=2
ˇ sen´ı: Reˇ 6 X
(59)
i=
i=2
1 1 (6 − 2 + 1)(2 + 6) = ∗ 5 ∗ 8 = 20. 2 2
Sub Suma() Dim Suma As Single Suma = 0 For i = 2 To 6 Suma = Suma + i Next i MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single Suma = (1 / 2) * (6 - 2 + 1) * (2 + 6) MsgBox ("Suma:"& vbTab & Suma) End Sub
ta 0.15. Plat´ı Ve n X
(60)
i=
i=1
1 (n + 1) (n) 2
D˚ ukaz. Postupujeme analogicky jako pˇri d˚ ukazu Vˇety 0.14. 6 P
ˇ´ıklad 17. Urˇcete: Pr i
i=1
ˇ sen´ı: Reˇ
(61)
6 X i=1
i=
1 1 (6 + 1)(6) = ∗ 7 ∗ 6 = 21. 2 2
Sub Suma() Dim Suma As Single Suma = 0 For i = 1 To 6 Suma = Suma + i Next i MsgBox ("Suma:"& vbTab & Suma) End Sub
24
2. SUMA
nebo Sub Suma() Dim Suma As Single Suma = (1 / 2) * (6 + 1) * (6) MsgBox ("Suma:"& vbTab & Suma) End Sub
ta 0.16. Plat´ı Ve n X
!2 ai
=
i=m
=2
(62)
n X n X
n−1 X
n X
ai aj +
i=m j=i+1 n X
=2
ai aj =
i=m j=m
j−1 X
n X
(ai )2 =
i=m
ai aj +
n X
(ai )2
i=m
j=m+1 i=m
D˚ ukaz. n X
(63)
!2 ai
=
i=m
n X i=m
! ai
n X
! ai
=
i=m
= (am + am+1 + am+2 + . . . + an−2 + an−1 + an ) · · (am + am+1 + am+2 + . . . + an−2 + an−1 + an ) = (64) = am am + am am+1 am+1 am + am+1 am+1 am+2 am + am+2 am+1 .. .. . + . an−2 am + an−2 am+1 an−1 am + an−1 am+1 an am + an am+1
+ am am+2 + am+1 am+2 + am+2 am+2 .. + . + + +
an−2 am+2 an−1 am+2 an am+2
+...+ +...+ +...+ +...+ +...+ +...+ +...+
V´ yˇse uveden´ y sumaˇcn´ı rozvoj se d´a zkr´atit do z´apisu
am an−2 am+1 an−2 am+2 an−2 .. .
+ am an−1 + am+1 an−1 + am+2 an−1 .. + .
+ am an + am+1 an + am+2 an .. + .
an−2 an−2 an−1 an−2 an an−2
+ + +
+ + +
n P n P
an−2 an−1 an−1 an−1 an an−1
ai aj .
i=m j=m
Plat´ı, ˇze souˇciny ˇclen˚ u na diagon´ale se daj´ı zapsat s pomoc´ı sumaˇcn´ıho znaku jako (65) am am +am+1 am+1 +am+2 am+2 +. . .+an−2 an−2 +an−1 an−1 +an an =
n X
ai 2
i=m
Z´ aroveˇ n plat´ı, ˇze souˇciny pod touto diagon´alou jsou zrcadlov´ ym obrazem souˇcin˚ u nad diagon´ alou a naopak. Tud´ıˇz, kaˇzd´ y souˇcin se opakuje dva kr´at. Kdyˇz, vyjmeme pouze horn´ı polovinu tˇechto souˇcin˚ u,
an−2 an an−1 an an an
+ + + + + +
2. SUMA
25
(66) am am+1
+ am am+2 + am+1 am+2
+...+ +...+ +...+
am an−2 am+1 an−2 am+2 an−2 .. .
+ am an−1 + am+1 an−1 + am+2 an−1 .. + . +
an−2 an−1
+ + +
am an am+1 an am+2 an .. .
+ + + an−2 an + + an−1 an ,
v´ yraz se d´ a upravit s pouˇzit´ım sumaˇcn´ıch znak˚ u poˇc´ıtan´ ych pro kaˇzd´ y ˇr´adek napˇr´ıˇc sloupci na n X j=m+1
(67)
n X
am aj +
j=m+1+1 n X
n X
am+1 aj +
am+2 aj + . . . +
j=m+2+1 n X
an−2 aj +
an−1 aj =
n X
ai aj
i=m j=i+1
j=n−1+1
j=n−2+1
n−1 X
nebo na posloupnost sum poˇc´ıtan´ ych pro kaˇzd´ y sloupec napˇr´ıˇc ˇr´adky na m−1 X
ai am+1 +
m+2−1 X
n−2−1 X
n−1−1 X
ai an−2 +
i=m
i=m
i=m
(68)
ai am+2 + . . . +
ai an−1 +
i=m
n−1 X
ai an =
i=m
j−1 X n X
ai aj
i=m j=m+1
Kdyˇz vezmeme v potaz duplicitu souˇcin˚ u nad a pod diagon´alou, sumu z rovnice n−1 n P P (65), suma vˇsech souˇcin˚ u v maticov´em z´apisu (65) se mus´ı rovnat 2 ai aj + i=m j=i+1 n P
j−1 P
(ai )2 nebo 2
i=m
n P
ai aj +
i=m j=m+1
n P
(ai )2 .
i=m
ˇ´ıklad 18. Mˇejme vektor v s prvkami ai Pr v = 120, 360, 720 ,
(69) Vypoˇc´ıtejte
3 P
2 ai
i=1
ˇ sen´ı: Reˇ 3 X
!2 ai
i=1
(70)
=2
j−1 3 X X j=1+1 i=1
=2
3−1 X 3 X
ai aj +
i=1 j=i+1
ai aj +
3 X
+ + +
2
(ai ) =
i=1
3 X
(ai )2 =
i=1
=120 ∗ 360 + 120 ∗ 720 + 360 ∗ 720 + 1202 + 3602 + 7202 = 360 ∗ 120 + 720 ∗ 120 + 720 ∗ 360 + 1202 + 3602 + 7202 = 1440000
26
2. SUMA
Sub Suma() Dim Suma As Single For i = 1 To 3 Suma = Suma + Cells(1, i) Next i Suma = Suma^2 MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single For i = 1 To 3 - 1 For j = i + 1 To 3 Suma1 = Suma1 + Cells(1, i) * Cells(1, j) Next j Next i For i = 1 To 3 Suma2 = Suma2 + Cells(1, i) * Cells(1, i) Next i Suma = 2 * Suma1 + Suma2 MsgBox ("Suma:"& vbTab & Suma) End Sub nebo Sub Suma() Dim Suma As Single For j = 1+1 To 3 For i = 1 To j - 1 Suma1 = Suma1 + Cells(1, i) * Cells(1, j) Next i Next j For i = 1 To 3 Suma2 = Suma2 + Cells(1, i) * Cells(1, i) Next i Suma = 2*Suma1 + Suma2 MsgBox ("Suma:"& vbTab & Suma) End Sub
KAPITOLA 3
Produkt Definice 0.5.
n Necht’ je d´ ana stejn´ a posloupnost {at }m , kde m, n ∈ N, n ≥ m. Operaci, kter´a zn´ asob´ı dan´e ˇcleny t´eto posloupnosti, oznaˇcujeme jako produkt.
Pozn´ amka: Produkt oznaˇcujeme velk´ ym ˇreck´ ym p´ısmenem P i (P´ı), kter´e vol´ ame i jako multiplikaˇcn´ı znak nebo multiplikaˇcn´ı oper´ ator.
Definice 0.6. Produkt definujeme s pomoc´ı multiplikaˇcn´ıho oper´atora n´asledovnˇe: n+c Y
(71)
( ai−c =
i=m+c
am am+1 . . . an 1
kdyˇz n ≥ m jinak
Pozn´ amka: Symbol i naz´ yv´ ame multiplikaˇcn´ı index, kter´ y bude spoluurˇcovat vˇsechny ˇcleny posloupnosti, kter´e spolu zn´ asob´ıme. Doln´ı index m pˇri multiplikaˇcn´ım znaku, Q , znaˇc´ı, kter´ y ˇclen posloupnosti budeme br´at jako prvn´ı n´asobenec. Kaˇzd´eho i=m+c
n´ asleduj´ıc´ıho ˇclena posloupnosti budeme ch´apat jako n´asobitele, pˇriˇcemˇz bude m´ıt pomocn´ y index o jednotku vˇetˇs´ı, neˇz n´asobitel z pˇredchoz´ıho kroku, (am am+1 am+2 . . . an−2 an−1 an ). Kaˇzd´ y n´asleduj´ıc´ı n´asobitel opˇetovnˇe pˇren´asob´ı v´ ysledek n+c Q n´ asoben´ı z´ıskan´ y v pˇredchoz´ım kroku. Horn´ı index n, , odkazuje na ˇclena posloupnosti, kter´ y bude vystupovat jako posledn´ı n´asobitel. V pˇr´ıpadˇe, ˇze je horn´ı index menˇs´ı neˇz doln´ı index, v´ ysledek je tzv. pr´azdn´ y produkt rovn´ y jedn´e. Tak jako v pˇr´ıpadˇe sumace, se nejv´ıce setk´ame se situac´ı, kdy bude konstanta c rovna nule, c = 0 a m = 1, tud´ıˇz, multiplikaˇcn´ı index i bude totoˇzn´ y s pomocn´ ym indexem v posloupnosti. V naˇsem pˇr´ıpadˇe bude i = t ⇔ ai = at .
(72) Z´ıskame tak v´ıce zn´ am´ y z´ apis
n Y
(73)
ai = a1 a2 . . . an .
i=1
ˇ´ıklad 19. Urˇcete: Pr a)
3 Q
xi ;
i=1 27
28
3. PRODUKT
b)
3 Q
c)
i=1 4 Q
xi · x4 ; xi /x1 ;
i=1
ˇ sen´ı: Reˇ Postup je n´ asledovn´ y a) 3 Y
(74)
xi = (a1 a2 a3 ) ;
i=1
Sub Produkt() Dim Produkt As Single Produkt = 1 For i = 1 To 3 Produkt = Produkt * Cells(i, 1) Next i MsgBox ("Produkt:"& vbTab & Produkt) End Sub b) 3 Y
(75)
! · x4 = (x1 x2 x3 ) · x4 = x1 x2 x3 x4 =
xi
i=1
i=1
Sub Produkt() Dim Produkt As Single Produkt = 1 For i = 1 To 3 Produkt = Produkt * Cells(i, 1) Next i Produkt=Produkt* Cells(4, 1) MsgBox ("Produkt:"& vbTab & Produkt) End Sub c) 4 Q
(76)
4 Y
xi
i=1
x1
4
Y x1 x2 x3 x4 = = x2 x3 x4 = xi . x1 i=2
Sub Produkt() Dim Produkt As Single Produkt = 1 For i = 1 To 4 Produkt = Produkt * Cells(i, 1) Next i Produkt=Produkt/ Cells(1, 1)
xi ;
3. PRODUKT
29
MsgBox ("Produkt:"& vbTab & Produkt) End Sub
ta 0.17. Kdyˇz k < l < n, plat´ı Ve n Q i=k l Q
(77)
ai
n Y
= ai
ai ,
i=l+1
i=k
D˚ ukaz. n Q i=k l Q
(78)
ai = ai
ak ak+1 . . . an ak ak+1 . . . al . . . an = = ak ak+1 . . . al ak ak+1 . . . al
i=k
=
n Y ak ak+1 . . . al al+1 . . . an = al+1 . . . an = ai . ak ak+1 . . . al i=l+1
ta 0.18. Kdyˇz k < l < n, plat´ı Ve n Q i=k n Q
(79)
ai = ai
l−1 Y
ai ,
i=k
i=l
D˚ ukaz. n Q i=k n Q
(80)
ai = ai
ak ak+1 . . . an ak ak+1 . . . al . . . an = = al . . . an al . . . an
i=l
=
l−1 Y ak ak+1 . . . al−1 al . . . an = ak ak+1 . . . al−1 = ai . al . . . an i=k
ta 0.19. Plat´ı Ve n Y
(81)
i=k
ai bi =
n Y i=k
ai
n Y
bi ,
i=k
D˚ ukaz. (82)
n Y i=k
ai bi = (ak ak+1 . . . an ) (bk ak+1 . . . bn ) =
n Y i=k
ai
n Y
bi .
i=k
30
3. PRODUKT
ta 0.20. Plat´ı Ve n Q ai n Y ai i=k , = Q n bi i=k bi
(83)
i=k
D˚ ukaz. n Q ai n Y ai ak ak+1 . . . an i=k . = = Q n bi bk bk+1 . . . bn i=k bi
(84)
i=k
ta 0.21. Kdyˇz K je konstanta, plat´ı Ve n Y
(85)
n Y
Kai = K (n−k+1)
i=k
ai ,
i=k
D˚ ukaz. n Y
Kai = (Kak ) (Kak+1 ) . . . (Kan ) =
i=k
=KK . . . K . . . ak ak+1 . . . an =
(86)
=K (n−k+1)
n Y
ai .
i=k
ta 0.22. Kdyˇz K je konstanta, plat´ı speci´aln´ı pˇr´ıpad Ve n Y
(87)
Kai = K n
i=1
n Y
ai ,
i=k
D˚ ukaz. Postupujeme analogicky jako pˇri d˚ ukazu pˇredchoz´ı vˇety.
ta 0.23. Kdyˇz K je konstanta, plat´ı Ve n Y
(88)
!K ai
=
i=k
n Y
aK i ,
i=k
D˚ ukaz. n Y
(89)
!K ai
K
= (ak ak+1 . . . . .an )
=
i=k K K =aK k ak+1 . . . . .an =
n Y
aK i .
i=k
3. PRODUKT
31
ta 0.24. Kdyˇz k < m < n, plat´ı Ve m Y
(90)
n Y
ai
ai =
i=m+1
i=k
n Y
ai ,
i=k
D˚ ukaz. m Y i=k
n Y
ai
ai =
i=m+1
= (ak ak+1 . . . am ) (am+1 am+2 . . . an ) =
(91)
=ak ak+1 . . . an =
n Y
ai .
i=k
ta 0.25. Kdyˇz k < l < m < n, plat´ı Ve m Y
(92)
ai
i=k
n Y
ai =
i=l
n Y
ai
m Y
i=k
ai ,
i=l
D˚ ukaz. m Y i=k
ai
n Y
ai = (ak ak+1 . . . am ) (al al+1 . . . an ) =
i=l
= (ak ak+1 . . . am ) (al al+1 . . . am . . . an ) =
(93)
= (ak ak+1 . . . am . . . an ) (al al+1 . . . am ) =
n Y i=k
ai
m Y
ai .
i=l
ta 0.26. Kdyˇz k < m < l < n, plat´ı Ve m Y
(94)
i=k
ai
n Y
n Q
ai =
i=l
ai
i=k l−1 Q
, ai
i=m+1
D˚ ukaz. m Y i=k
ai
n Y
ai = (ak ak+1 . . . am ) (al al+1 . . . an ) =
i=l
= (ak ak+1 . . . am ) (al al+1 . . . an ) = (ak ak+1 . . . am . . . al . . . an ) · (ak ak+1 . . . am ) (al al+1 . . . an ) = (ak ak+1 . . . am . . . al . . . an ) (ak ak+1 . . . am am+1 . . . al−1 al . . . an ) = · (ak ak+1 . . . am ) (al al+1 . . . an ) = (ak ak+1 . . . am am+1 . . . al−1 al . . . an ) n Q ai (ak ak+1 . . . am am+1 . . . al−1 al . . . an ) i=k = = l−1 . Q (am+1 . . . al−1 ) ai
= (95)
i=m+1
32
3. PRODUKT
ˇ ast 2 C´
´ Uvod do teorie popisn´ e statistiky
KAPITOLA 4
´ Uvodn´ ı statistick´ e definice Definice 0.7. Statistick´y soubor je nepr´ azdn´a mnoˇzina objekt˚ u, u kter´ ych se sleduje minim´alnˇe jedna stejn´ a vlastnost. Definice 0.8. Statistick´ a jednotka je objekt statistick´eho souboru. Definice 0.9. Statistick´y znak (promˇenn´ a, veliˇcina) je sledovan´a vlastnost statistick´ ych jednotek. Definice 0.10. Datov´y soubor je matice typu n × m, (n, m ∈ N) oznaˇcovan´a jako x1 y1 . . . z1 x2 y2 . . . z2 .. .. .. , . . ... . xn
yn
...
zn
kde kaˇzd´ y i-ty ˇr´ adek (i-ty vektor typu 1 × m), 1 ≤ i ≤ n, je asociovan´ y pr´avˇe s jednou statistickou jednotkou ze statistick´eho souboru a kaˇzd´ y m-t´ y prvek vektor˚ u (sloupec hodnot matice), 1 ≤ j ≤ m, je asociovan´ y pr´avˇe s jedn´ım statistick´ ym znakem.
Definice 0.11. Datov´y soubor, kter´ y je ve tvaru n × 1, kde n je poˇcet statistick´ ych jednotek, oznaˇcujeme jako jednorozmˇern´ y datov´ y soubor. Pozn´ amka: V jednorozmˇern´em datov´em souboru jsou statistick´e jednotky charakterizov´any jedin´ ym statistick´ ym znakem.
Definice 0.12. Datov´y soubor, kter´ y je ve tvaru n × m, kde m > 1, se oznaˇcuje jako v´ıcerozmˇern´ y (mnohorozmˇern´ y, multidimenzion´aln´ı) datov´ y soubor. Pozn´ amka: Ve v´ıcerozmˇern´em datov´em statistick´em souboru jsou statistick´e jednotky charakterizov´ any v´ıce neˇz jedin´ ym statistick´ ym znakem. Pozn´ amka: Z matematick´eho hlediska m˚ uˇzeme statistick´e jednotky povaˇzovat za body ve v´ıcerozmˇern´em prostoru, kde polohu bodu v prostoru, definuje vektor, jehoˇz kaˇzd´ y prvek znaˇc´ı hodnotu v dan´em rozmˇeru (prvek vektoru = hodnota v jedn´e dimenzi = hodnota jedn´e sledovan´e vlastnosti). Sloupce datov´eho souboru jsou hodnoty jednotliv´ ych statistick´ ych znak˚ u a ˇr´adky jsou hodnoty jednotliv´e statistick´e jednotky. 34
KAPITOLA 5
Druhy statistick´ ych znak˚ u (promˇ enn´ ych) Definice 0.13. Statistick´e znaky rozdˇelujeme prim´arnˇe na kvantitativn´ı a kvalitativn´ı promˇenn´e. Kvalitativn´ı znaky dˇel´ıme d´ ale na ordin´aln´ı a nomin´aln´ı promˇenn´e. Pozn´ amka: Pouˇzijeme n´ ami upraven´e definice kvantitativn´ıho, ordin´aln´ıho a nomin´aln´ıho znaku p˚ uvodnˇe sestrojen´ ymi T. Vintrem.
Definice 0.14. Kvantitativn´ı znak je takov´ a promˇenn´a, jej´ıˇz hodnoty tvoˇr´ı mnoˇzinu, na kter´e jsou definov´ any relace “menˇs´ı”(<), “vˇetˇs´ı”(>), nebo “rovn´a se”(=) a operace rozd´ılu (−).
Definice 0.15. Kvalitativn´ı znak je takov´ a promˇenn´a, jej´ıˇz hodnoty tvoˇr´ı koneˇcnˇe spoˇcitatelnou mnoˇzinu, na kter´e nen´ı definov´ana operace rozd´ılu (−). Pozn´ amka: Hodnoty, kter´e m˚ uˇze nab´ yt kvalitativn´ı znak, oznaˇcujeme jako varianty, obmˇeny, tˇr´ıdy nebo kategorie znaku.
Definice 0.16. Ordin´ aln´ı znak je takov´ a promˇenn´a, jej´ıˇz hodnoty tvoˇr´ı mnoˇzinu, na kter´e jsou definov´ any jenom relace “menˇs´ı”(<), “vˇetˇs´ı”(>)nebo “rovn´a se”(=). Pozn´ amka: V pˇr´ıpadˇe ordin´ aln´ı promˇenn´e neum´ıme ˇr´ıct o jak velk´e rozd´ıly mezi hodnotami jde, nebo zda jsou tyto rozd´ıly mezi hodnotami konstantn´ı. Um´ıme vyˇrknout soud jenom o vˇetˇs´ı nebo menˇs´ı u ´rovni, stupni, nebo intenzitˇe zkouman´eho znaku.
Definice 0.17. Nomin´ aln´ı znak je takov´ a promˇenn´a, jej´ıˇz hodnoty tvoˇr´ı mnoˇzinu, na kter´e je definov´ ana v´ yhradnˇe relace “rovn´a se”(=). Pozn´ amka: V pˇr´ıpadˇe nomin´ aln´ı promˇenn´e nen´ı moˇzn´e hodnoty uspoˇr´adat ani podle velikosti. Pozn´ amka: Neˇc´ıseln´e varianty ordin´ aln´ıho, nebo nomin´aln´ıho znaku jsou pˇrevedeny na ˇc´ıseln´e obmˇeny podle pomocn´eho indexu, kter´ y je s touto neˇc´ıselnou variantou asociov´an.
Definice 0.18. Kvantitativn´ı znak m˚ uˇzeme rozdˇelit na diskr´etn´ı a spojitou promˇennou. 35
36
´ ˇ ´ 5. DRUHY STATISTICKYCH ZNAK˚ U (PROMENN YCH)
Definice 0.19. Diskr´etn´ı kvantitativn´ı promˇenn´ a m˚ uˇze nab´ yvat spoˇcetnˇe koneˇcnˇe, nebo spoˇcetnˇe nekoneˇcnˇe mnoha hodnot (hodnoty je moˇzn´e seˇradit do posloupnosti). Definice 0.20. Spojit´ a kvantitativn´ı promˇenn´ a m˚ uˇze nab´ yvat jak´ekoli hodnoty z koneˇcn´eho nebo nekoneˇcnˇe velk´eho intervalu. Pozn´ amka: S jin´ ym dˇelen´ım kvantitativn´ı promˇenn´e se setk´ame v ˇc´asti vˇenovan´e ˇcasov´ ym ˇrad´ am a hospod´ aˇrsk´ ym index˚ um.
Definice 0.21. Jednorozmˇern´y datov´y soubor, ve kter´em a) jsou v pˇr´ıpadˇe kvantitativn´ı promˇenn´e statistick´e jednotky seˇrazen´e vzestupnˇe podle velikosti hodnoty znaku xi , nebo b) jsou v pˇr´ıpadˇe ordin´ aln´ı promˇenn´e statistick´e jednotky seˇrazen´e vzestupnˇe podle intenzity varianty znaku xi , oznaˇcujeme jako uspoˇr´ adan´y datov´y soubor x i1 x i2 .. , . xin pˇriˇcemˇz pro kvantitativn´ı promˇennou plat´ı xi1 ≤ xi2 ≤ . . . ≤ xin .
KAPITOLA 6
Rozdˇ elen´ı ˇ cetnost´ı Definice 0.22. ˇ Cetnost souboru, n, je poˇcet statistick´ ych jednotek. Definice 0.23. Absolutn´ı ˇcetnost ni obmˇeny znaku xi v datov´em souboru je poˇcet statistick´ ych jednotek se sledovanou hodnotou znaku xi .
ta 0.27. Necht’ statistick´y znak xi nab´yv´a k variant hodnot. Pro celkovou ˇcetnost Ve statistick´ych jednotek n plat´ı (96)
k X
n=
ni .
i=1
D˚ ukaz. (97)
n=
k X
ni = n1 + n2 + . . . + nk = n.
i=1
Definice 0.24. Relativn´ı ˇcetnost pi obmˇeny znaku xi v datov´em souboru je poˇcet statistick´ ych jednotek se sledovanou hodnotou znaku xi k celkov´e ˇcetnosti souboru n. ni (98) pi = . n ta 0.28. Pro souˇcet relativn´ıch ˇcetnosti k variant znaku plat´ı Ve k X
(99)
pi = 1.
i=1
D˚ ukaz. (100)
k X i=1
pi =
k X ni i=1
n
k
=
1X 1 ni = n = 1. n i=1 n
Pozn´ amka: Relativn´ı ˇcetnost i-t´e statistick´e jednotky je pi =
ni n.
Definice 0.25. Absolutn´ı kumulativn´ı ˇcetnost Ni obmˇeny znaku xi v datov´em souboru je poˇcet statistick´ ych jednotek se sledovanou hodnotou znaku menˇs´ı nanejv´ yˇs rovnou hodnotˇe kvantitativn´ıho znaku xi nebo poˇcet statistick´ ych jednotek s kategori´ı znaku 37
ˇ ´I CETNOST ˇ ´I 6. ROZDELEN
38
s menˇs´ı intenzitou nanejv´ yˇs intenzitou rovnou intenzitˇe i-t´e kategorie ordin´aln´ıho znaku. i X (101) Ni = nj . j=1
ta 0.29. Necht’ k je poˇcet hodnot (kategori´ı) statistick´eho znaku x a ni jsou Ve absolutn´ı ˇcetnosti tˇechto hodnot nebo kategori´ı, pak plat´ı (102)
Nk = n.
D˚ ukaz. (103)
Nk =
k X
nj = n1 + n2 + . . . + nk = n.
j=1
Definice 0.26. Relativn´ı kumulativn´ı ˇcetnost Pi obmˇeny znaku xi v datov´em souboru je poˇcet statistick´ ych jednotek se sledovanou hodnotou znaku xi menˇs´ı nanejv´ yˇs rovnou hodnotˇe kvantitativn´ıho znaku xi nebo poˇcet statistick´ ych jednotek s kategori´ı znaku s menˇs´ı intenzitou nanejv´ yˇs intenzitou rovnou intenzitˇe i-t´e kategorie ordin´aln´ıho znaku k celkov´emu poˇctu statistick´ ych jednotek n. i P nj i i X X nj j=1 = k pj . = (104) Pi = P n j=1 j=1 ni i=1
ta 0.30. Necht’ k je poˇcet hodnot (kategori´ı) statistick´eho znaku x a pi jsou Ve relativn´ı ˇcetnosti tˇechto hodnot nebo kategori´ı, pak plat´ı (105)
Pk = 1.
D˚ ukaz. (106)
Pk =
k X j=1
pj =
k X nj j=1
n
k
=
1 1X nj = n = 1. n j=1 n
Definice 0.27. Jednorozmˇern´e rozdˇelen´ı ˇcetnost´ı je uspoˇr´adan´ı, ve kter´e je kaˇzd´e hodnotˇe (obmˇenˇe, kategorii) znaku pˇriˇrazena ˇcetnost v´ yskytu statistick´ ych jednotek s touto hodnotou (obmˇenou, kategorii) ve sledovan´em datov´em souboru. Pozn´ amka: Rozdˇelen´ı ˇcetnost´ı m˚ uˇze b´ yt rozdˇelen´ı absolutn´ıch nebo relativn´ıch ˇcetnost´ı hodnot znaku.
Definice 0.28. Histogram je graf, ve kter´em jsou na horizont´aln´ı ose um´ıstˇeny vzestupnˇe (zleva doprava) hodnoty (kategorie) statistick´eho znaku podle velikosti hodnoty nebo intenzity kategorie a na vertik´ aln´ı ose vzestupnˇe (zdola nahoru) jsou ˇcetnosti v´ yskytu jednotliv´ ych hodnot (kategori´ı) v datov´em souboru.
KAPITOLA 7
Kvantily a momenty 1. Kvantily
Definice 1.1. Kvantily jsou hodnoty, kter´e dˇel´ı uspoˇr´ adan´y datov´ y soubor na pˇribliˇznˇe stejnˇe ˇcetn´e ˇc´ asti.
Definice 1.2. Hodnota a se oznaˇcuje jako j- procentn´ı kvantil (˜ xj ) v pˇr´ıpadˇe, ˇze celkovˇe j-procent statistick´ ych jednotek m´ a hodnotu kvantitativn´ıho znaku menˇs´ı nanejv´ yˇs rovnou hodnotˇe a. Definice 1.3. Medi´ an x ˜50 je hodnota, kter´ a del´ı datov´ y soubor na dvˇe stejnˇe ˇcetn´e ˇc´asti.
Definice 1.4. Kvartily jsou hodnoty, kter´e del´ı datov´ y soubor na ˇctyˇri stejnˇe ˇcetn´e ˇc´asti. Pozn´ amka: Kvartily jsou tˇri – doln´ı kvartil je 25-procentn´ı kvantil (˜ x25 ), stˇredn´ı kvartil je 50procentn´ı kvantil (˜ x50 ) a je z´ aroveˇ n medi´an a horn´ı kvartil je 75-procentn´ı kvantil (˜ x75 ).
Definice 1.5. Decily jsou hodnoty, kter´e del´ı datov´ y soubor na deset stejnˇe ˇcetn´ ych ˇc´ast´ı. Pozn´ amka: Existuje devˇet decil˚ u (˜ x10 , x ˜20 , . . . , x ˜90 ).
Definice 1.6. Percentily jsou hodnoty, kter´e del´ı datov´ y soubor na sto stejnˇe ˇcetn´ ych ˇc´ast´ı. Pozn´ amka: Existuje 99 percentil˚ u (˜ x1 , x ˜2 , . . . , x ˜99 ). Pozn´ amka: Hodnoty kvantil˚ u nen´ı vhodn´e poˇc´ıtat v situac´ıch mal´eho poˇctu statistick´ ych jednotek. Vypov´ıdaj´ıc´ı schopnost kvantil˚ u je v tˇechto situac´ıch velmi n´ızk´a. M˚ uˇze se st´at, ˇze stejn´ a hodnota bude hodnotou doln´ıho i horn´ıho kvartilu, nebo jeˇzte extr´emnˇejˇs´ı kombinace. Pozn´ amka: U diskr´etn´ı promˇenn´e neexistuje jednotn´ı metodika pro vˇseobecn´ı kvantilov´ y v´ ypoˇcet, a proto je taky v´ ypoˇcet kvantil˚ u v r˚ uzn´ ych programov´ ych bal´ıc´ıch r˚ uzn´ ym zp˚ usobem implementov´ an. M˚ uˇze se tud´ıˇz st´at, ˇze v´am v r˚ uzn´ ych bal´ıc´ıch vestavˇen´e funkce vr´ at´ı r˚ uzn´e hodnoty kvantil˚ u pro tent´ yˇz soubor (tyto hodnoty by ale mˇeli b´ yt alespoˇ n podobn´e). 39
40
7. KVANTILY A MOMENTY
2. Momenty
Definice 2.1. Momenty charakterizuj´ı rozdˇelen´ı dan´eho statistick´eho znaku pomoc´ı matematick´ ych funkc´ı, kter´ ych vstupn´ımi promˇenn´ ymi jsou a) hodnoty vˇsech statistick´ ych jednotek v souboru u vybran´eho znaku nebo, b) vˇsechny obmˇeny tohoto znaku a jejich ˇcetnosti nebo, c) stˇredy tˇr´ıdn´ıch interval˚ u a ˇcetnosti statistick´ ych jednotek v jednotliv´ ych intervalov´ ych tˇr´ıd´ ach. 2.1. V´ ypoˇ cet moment˚ u z hodnot statistick´ ych jednotek. 2.1.1. Obecn´e momenty.
Definice 2.2. Necht’ m´ ame jednorozmˇern´ y statistick´ y soubor o rozsahu n, pak definujeme obecn´y moment u statistick´eho znaku x jako n P
(107)
k mx,l
(xi − k)
l
i=1
=
, n kde k je konstanta a mocnitel l vyjadˇruje stupeˇ n momentu m. Moment ˇcteme jako l-t´ y moment x kolem a.
Pozn´ amka: Konstanta k p˚ usob´ı jako v´ ypoˇcetn´ı kotva, od kter´e se poˇc´ıtaj´ı vzd´alenosti a tud´ıˇz se st´ av´ a poˇc´ atkem. Hodnota funkce obsahuje informaci pr´avˇe o vzd´alenosti od tohoto poˇc´ atku k. Pozn´ amka: l-t´y obecn´y moment kolem nuly z´ısk´ame, kdyˇz za konstantu k dosad´ıme nulu. n P
(108)
0 mx,l
=
(xi − 0)
n P
l
i=1
=
n
l
(xi )
i=1
n
.
Definice 2.3. Prvn´ı obecn´y moment kolem nuly definujeme podle vzorce n P
(109)
0 mx,1
=
xi
i=1
n
.
Pozn´ amka: Prvn´ı obecn´ y moment kolem nuly vol´ame aritmetick´y pr˚ umˇer, pˇriˇcemˇz jeho vlastnosti v´ıce rozebereme v Kapitole. Pozn´ amka: Obdobnˇe jako pˇredchoz´ı moment m˚ uˇzeme zapsat druh´ y, tˇret´ı a ˇctvrt´ y obecn´ y moment kolem nuly. n P
(110)
0 mx,2
=
xi 2
i=1
n
.
2. MOMENTY n P
(111)
0 mx,3
=
xi 3
i=1
0 mx,4
=
.
n n P
(112)
41
xi 4
i=1
.
n
2.1.2. Centr´ aln´ı momenty.
Definice 2.4. Centr´ aln´ı momenty oznaˇcujeme momenty, kter´e maj´ı za konstantu zvolen´ y aritmetick´ y pr˚ umˇer a definujeme je vˇseobecn´ ym vztahem n P x mx,l
(113)
(xi − x)
l
i=1
=
.
n
ta 2.1. Prvn´ı centr´aln´ı moment kolem pr˚ Ve umˇeru je vˇzdy roven nule. x mx,1
(114)
= 0.
D˚ ukaz. (115)
x mx,1
=
n X (xi − x)
n
i=1
n P
=
xi −
i=1
n P
n P
x
i=1
==
n
xi
i=1
nx =x−x=0 n
−
n
Definice 2.5. Druh´ y centr´ aln´ı moment kolem pr˚ umˇeru vol´ame rozptyl a oznaˇcujeme jako s2x . ta 2.2. Pro rozptyl plat´ı Ve (116)
x mx,2
= s2x =
n X i=1
n P
2
(xi − x) = n
i=1
x2i
n
P n
xi
i=1 − n
2 = x2 − x2 .
D˚ ukaz. x mx,2
=
s2x
=
n 2 X (xi − x)
n
i=1 n P
(117)
=
i=1
n n P x2i
i=1
n P
x2i −
n P
2xi x
i=1
+
n 2
n P
x2
i=1
n n P i=1
=
i=1
n P
x2i
n
− 2x
x2i
− 2xx + x = n n =x2 − x2 =0 mx,2 −0 m2x,1 . =
n X x2i − 2xi x + x2 = n i=1
2
2
− 2x + x =
xi
i=1
n n P i=1
+
2 =
nx2 n
x2i
n
− x2
42
7. KVANTILY A MOMENTY
Pozn´ amka: Rozptyl je rozd´ıl pr˚ umˇeru ˇctverc˚ u hodnot a ˇctverce aritmetick´eho pr˚ umˇeru. Tento odvozen´ y tvar oznaˇcujeme jako v´ ypoˇcetn´ı tvar rozptylu a obecn´ y vzorec pro druh´ y centr´ aln´ı moment povaˇzujeme za z´akladn´ı tvar rozptylu. Pozn´ amka: Obdobnˇe m˚ uˇzeme zapsat tˇret´ı a ˇctvrt´ y centr´aln´ı moment. n P x mx,3 n P
=
i=1
=
n n P
x3i
n P
3
(xi − x)
i=1
x3i − 3x2i x + 3xi x2 − x3
=
n n P
x2i
xi nx + 3x2 i=1 − = n n n n =x3 − 3xx2 + 3x2 x − x3 = x3 − 3xx2 + 2x3 =
(118)
=
i=1
− 3x
i=1
2
=0 mx,3 − 3 (0 mx,1 ) · (0 mx,2 ) + 2 (0 mx,1 ) .
n P x mx,4
(119)
n P
=
i=1
=
n n P
x4i
n P
4
(xi − x)
i=1
=
n n P
x3i
x4i − 4x3i x + 6x2i x2 − 4xi x3 + x4
x2i
n P
xi nx4 = i=1 − 4x i=1 + 6x2 i=1 − 4x3 i=1 + = n n n n n =x4 − 4xx3 + 6x2 x2 − 4x3 x + x4 = x4 − 4xx3 + 6x2 x2 − 3x4 = 2
4
=0 mx,4 − 4 (0 mx,1 ) · (0 mx,3 ) + 6 (0 mx,1 ) (0 mx,2 ) − 3 (0 mx,1 ) . Pozn´ amka: Jelikoˇz se poˇc´ıtaj´ı jenom rozd´ıly hodnot znaku od pr˚ umˇeru (konstanty), nedoch´az´ı ke ztr´ atˇe informace o mˇern´ y jednotce. Tud´ıˇz pr˚ umˇer, rozptyl a jin´e centr´aln´ı momenty jsou vyj´ adˇreny v stejn´ ych jednotk´ach jako p˚ uvodn´ı hodnoty. 2.1.3. Normovan´e momenty.
Definice 2.6. Normovan´e momenty jsou matematick´e funkce, kter´ ych vstupn´ımi promˇenn´ ymi jsou bezrozmˇern´e hodnoty vˇsech statistick´ ych jednotek v souboru u vybran´eho bezrozmˇern´eho znaku (smˇerodatn´e promˇenn´e). ta 2.3. Necht’ kaˇzdou hodnotu znaku xi pˇretransformujeme pomoc´ı vzorce ui = Ve xi −x sx
pak pro prv´y normovan´y moment kolem nuly plat´ı,
(120)
0 mu,l
= u = 0.
D˚ ukaz. n P
(121)
0 mu,l
=u=
n P
ui
i=1
n
=
i=1
xi −x sx
n
n P (xi − x) n X 1 1 i=1 = (xi − x) = = 0. nsx i=1 sx n
2. MOMENTY
43
ta 2.4. Plat´ı Ve n P
(122)
0 mu,l
=
(ui − 0)
n P
l
i=1
l
i=1
=
n
(ui − u)
=u mu,l .
n
D˚ ukaz. n P
(123)
(ui − 0)
i=1
(124)
(ui − 0)
i=1
n n P
l
l
(ui − 0)
i=1
=
n
l
(ui − u)
i=1
=
n n P
n P
l
n
Pozn´ amka: V d˚ usledku nulovosti pr˚ umˇeru vypoˇcten´eho z normovan´ ych hodnot, n´am pˇredchoz´ı vˇeta ˇr´ık´ a, ˇze obecn´e momenty normovan´eho znaku se rovnaj´ı centr´aln´ım moment˚ um tohoto znaku.
ta 2.5. Necht’ kaˇzdou hodnotu znaku xi pˇretransformujeme pomoc´ı vzorce ui = Ve xi −x sx
pak pro druh´y normovan´y moment kolem nuly (a pr˚ umˇeru) plat´ı,
(125)
x mu,2
= 1.
D˚ ukaz. P (126)
0 mu,2 =
i=1
u2i
P =
(ui − u)
2
i=1
=
n n n 2 1 2 1 X (xi − x) = 2 sx = 1. = 2 sx i=1 n sx
n P i=1
xi −x sx
2
n
=
Pozn´ amka: Z pˇredchoz´ıch vˇet rovnˇeˇz vypl´ yv´a, ˇze pˇr´ıpadˇe normalizace p˚ uvodn´ı promˇenn´e dle vzorce xis−x z´ ısk´ a me novou promˇ e nnou, kter´ a m´ a pr˚ u mˇ e r nula a rozptyl roven jedn´e. x
ta 2.6. Tˇret´ı a ˇctvrt´y moment normovan´eho statistick´eho znaku se naz´yvaj´ı Ve momentov´e M´ıry ˇsikmosti a ˇspiˇcatosti a vypoˇc´ıtaj´ı se dle vzorc˚ u
P (127)
P
=
=
i=1
(ui − u)
3
n P
xi −x sx
3
= i=1 = n n n n 3 1 1 X (xi − x) x mx,3 = 3 = (x mx,3 ) = . √ √ sx i=1 n m m m x x,2 x x,2 x x,2 x mx,2 0 mu,3
i=1
u3i
44
7. KVANTILY A MOMENTY
P (128)
(ui − u)
4
n P
xi −x sx
4
= i=1 = i=1 = n n n n 4 1 X (xi − x) 1 x mx,4 = 4 = 2 (x mx,4 ) = 2. sx i=1 n (x mx,2 ) (x mx,2 ) 0 mu,4
=
i=1
n P
nu4i
2.2. V´ ypoˇ cet moment˚ u z rozdˇ elen´ı ˇ cetnost´ı obmˇ en znaku.
ta 2.7. Necht’ m´ame hodnoty vˇsech statistick´ych jednotek znaku xh v jednoVe rozmˇern´em souboru X, a n je poˇcet statistick´ych jednotek v souboru. Z´ aroveˇ n, necht’ je zad´ ano rozdˇelen´ı ˇcetnost´ı vˇsech moˇzn´ych hodnot (variant, obmˇen) tohoto znaku, xj , kde j = 1, 2, . . . , k. Symbol k oznaˇcuje poˇcet vyskytuj´ıc´ıch se obmˇen znaku a nj oznaˇcuje absolutn´ı a pj relativn´ı ˇcetnost t´eto j-t´e obmˇeny. Pak, pro obecn´ı momenty kolem nuly plat´ı n P
(129)
0 mx,l
=
h=1
k P
xlh =
n
j=1
nj xlj
k P
= ni
k X
pj xlj
j=1
i=1
a pro obecn´ı momenty kolem pr˚ umˇeru plat´ı n P
(130)
0 mx,l
=
(xh − x)
h=1
n
k P
l
=
l
nj (xj − x)
j=1 k P
= ni
k X
l
pj (xj − x) .
j=1
i=1
D˚ ukaz. V u ´vodu d˚ ukazu se soustˇred´ıme jenom na rovnost ˇcitatel˚ u s abso1 y plat´ı n1 = P . lutn´ımi ˇcetnostmi, jelikoˇz pod´ıl n1 je konstanta, pro kter´ k ni
i=1
Kaˇzd´ a statistick´ a jednotka nab´ yv´a nˇekterou z obmˇen znaku xj . Pomocn´ı doln´ı index h sa pˇretransformuje z informace, o kterou poˇradovou jednotku v souboru sa jedn´ a, na informaci o poˇradov´em ˇc´ısle jednotky s j-tou obmˇenou (kolik´at´a hodnota s j-tou obmˇenou to je). Tud´ıˇz tuto transformaci m˚ uˇzeme zapsat jako h −→ ij ⇔ xh −→ xij .
(131)
Sumu hodnot statistick´ ych jednotek, kter´e nabyli prvn´ı obmˇenu znaku zap´ıˇseme jako (132)
n1 X
xi1 = x11 + x21 + . . . + xi1 + . . . + xn1 1 = n1 xi1 ,
i=1
sumu hodnot statistick´ ych jednotek, kter´e nabyli druhou obmˇenu znaku zap´ıˇseme jako (133)
n2 X i=1
xi2 = x12 + x22 + . . . + xi2 + . . . + xn2 2 = n2 xi2 ,
2. MOMENTY
45
sumu hodnot statistick´ ych jednotek, kter´e nabyli j-tu obmˇenu znaku zap´ıˇseme jako (134)
nj X
xij = x1j + x2j + . . . + xij + . . . + xnj j = nj xij ,
i=1
sumu hodnot statistick´ ych jednotek, kter´e nabyli posledn´ı k-tu obmˇenu znaku zap´ıˇseme jako (135)
nk X
xik = x1j + x2k + . . . + xik + . . . + xnk k = nk xik .
i=1
Pro sumu vˇsech tˇechto tˇr´ıd a hodnot statistick´ ych jednotek v kaˇzd´e tˇr´ıdˇe v souboru plat´ı, ˇze n X
(136)
xh =
nj k X X
xij =
j=1 i=1
h=1
k X
nj xj .
j=1
Analogicky m˚ uˇzeme pˇristupovat ke vˇsem obecn´ım moment˚ um kolem nuly a pr˚ umˇeru. V pˇr´ıpadˇe obecn´ıch moment˚ u kolem nuly je kaˇzd´a statistick´a jednotka s j-tou obmˇenou umocnˇena vzorcem xlij a suma tˇechto umocnˇen´ ych hodnot ve vybran´e n j P l j-t´e tˇr´ıdˇe se rovn´ a xij . V pˇr´ıpadˇe obecn´ıch moment˚ u kolem pr˚ umˇeru je umocnˇen i=1
kaˇzd´ y rozd´ıl kaˇzd´e statistick´e jednotky s j-tou obmˇenou od celkov´eho pr˚ umˇeru v nj P l l (xij − x) . souboru, (xij − x) a suma vybran´e j-t´e tˇr´ıdy je rovna i=1
Symbolem nj m˚ uˇzeme oznaˇcit poˇcet umocnˇen´ ych statistick´ ych jednotek s j-tou obmˇenou nebo poˇcet rozd´ıl˚ u kaˇzd´e statistick´e jednotky s j-tou obmˇenou od pr˚ umˇeru v souboru. N´ asledovn´e vztahy m˚ uˇzeme symbolicky zapsat n X
(137)
xlh =
n X
xlij =
j=1 i=1
h=1
(138)
nj k X X
nj k X X
l
(xh − x) =
k X j=1
l
(xij − x) =
j=1 i=1
h=1
nj xlj .
k X
l
nj (xij − x) .
j=1
Pro relativn´ı ˇcetnosti pak m˚ uˇzeme jednoduˇse zav´est n´asleduj´ıc´ı vztahy k P j=1 k P
(139)
l
nj (xij − x)
j=1
=
n
ni
=
i=1
=
k X nj
n
j=1 k P
(140)
k P
l
nj (xij − x)
j=1
l
(xij − x) =
= ni
l
pj (xij − x) .
j=1
nj xlij
k P
k X
k X nj j=1
n
xlij =
k X
pj xlij .
j=1
i=1
46
7. KVANTILY A MOMENTY
Pozn´ amka: Jelikoˇz pˇriˇrazen´ı hodnot statistick´ ych jednotek do interval˚ u v pˇr´ıpadˇe intervalov´eho rozdˇelen´ı ˇcetnost´ı m˚ uˇzeme ch´ apat rovnˇeˇz pˇres koncept obmˇen a ˇcetnost´ı, nebudeme v´ ypoˇctu moment˚ u z intervalov´ ych ˇcetnost´ı vˇenovat vˇetˇs´ı pozornost. Z´aroveˇ n je vˇsak nutn´e pˇripomenout, ˇze v pˇr´ıpadˇe interval˚ u, jsou ve v´ ypoˇctu vˇsechny statistick´e jednotky s hodnotami v intervale nahrazeny hodnotami stˇred˚ u v dan´em tˇr´ıdn´ım intervale.
ˇ ast 3 C´
Kvantitativn´ı promˇ enn´ a
KAPITOLA 8
M´ıry polohy Definice 0.7. M´ıra polohy je v jednorozmˇern´em souboru ˇc´ıslo, jeˇz a) b) c) d)
zastupuje jednotliv´e hodnoty uvaˇzovan´eho statistick´eho znaku, ud´ av´ a centr´ aln´ı polohu dan´eho rozdˇelen´ı, charakterizuje obecnou velikost zkouman´eho jevu, umoˇzn ˇuje jednoduch´e srovn´an´ı polohy dvou nebo v´ıce rozdˇelen´ı.
Pozn´ amka: M´ıry polohy vol´ ame taky m´ıry u ´rovnˇe nebo stˇredn´ı hodnoty. 1. Pr˚ umˇ ery
Definice 1.1. Pr˚ umˇer je statistika, pro kterou plat´ı: a) V situaci, kdyˇz jsou vˇsechny hodnoty znaku xi v souboru X rovn´e konstantˇe k, pr˚ umˇer x je roven t´eto konstantˇe. ∀xi ∈ X : xi = k ⇒ x = k.
(141)
b) Pr˚ umˇer m˚ uˇze nab´ yt hodnoty jenom v rozmez´ı mezi minim´aln´ı hodnotou xmin a maxim´ aln´ı hodnotou znaku, xmax , vˇcetnˇe tˇechto hodnot. x ∈ hxmin , xmax i .
(142)
c) Zvˇetˇsen´ı kter´ekoli hodnoty xi v souboru X, pˇri zachov´ani ostatn´ıch hodnot v p˚ uvodn´ı u ´rovni, z´ akonitˇe zp˚ usob´ı, ˇze nov´ y pr˚ umˇer nabude hodnoty vˇetˇs´ı neˇzli p˚ uvodn´ı pr˚ umˇer. d) Zmenˇsen´ı kter´ekoli hodnoty v souboru, pˇri zachov´ani ostatn´ıch hodnot v p˚ uvodn´ı u ´rovni z´ akonitˇe zp˚ usob´ı, ˇze nov´ y pr˚ umˇer nabude hodnoty menˇs´ı neˇzli p˚ uvodn´ı pr˚ umˇer. e) Pr˚ umˇer je funkc´ı vˇsech hodnot znaku ve v´ ybˇerov´em souboru. (143)
x = f (x1 , x2 , . . . , xn ) . f) Pr˚ umˇer nez´ avis´ı na poˇrad´ı hodnot znaku ve v´ ybˇerov´em souboru.
(144)
x = f (x1 , x2 , . . . , xi , . . . , xj , . . . , xn ) = f (x1 , x2 , . . . , xj , . . . , xi , . . . , xn ) . . 2. Aritmetick´ y pr˚ umˇ er
2.1. Obecn´ a definice. 48
´ PR˚ ˇ 2. ARITMETICKY UMER
49
Definice 2.1. Aritmetick´y pr˚ umˇer znaku vypoˇcten´ y ze vˇsech hodnot statistick´ ych jednotek xi v souboru i = 1, 2, . . . , n definujeme jako pod´ıl sumy hodnot tohoto vybran´eho znaku a poˇctu tˇechto hodnot v souboru. n P xi (145) x1 + x2 + . . . + xn i=1 x= = . n n Pozn´ amka: Z definice vypl´ yvaj´ı n´ asleduj´ıc´ı u ´pravy n X xi = xn, (146) i=1
(147)
x1 + x2 + . . . + xn = x + x + . . . + x.
(148)
(x1 + x2 + . . . + xn ) − (x + x + . . . + x) = 0.
(149)
(x1 − x) + (x2 − x) + . . . + (xn − x) = 0.
O aritmetick´em pr˚ umˇeru jako o hodnotˇe m˚ uˇzeme ˇr´ıct, ˇze se jedn´a o polohu, kter´ a kompenzuje odchylky hodnot souboru od sebe sama. Tud´ıˇz se nejedn´a o stˇredn´ı hodnotu v prav´em smyslu slova, ale o kompenzaˇcn´ı m´ıru, kter´a distribuuje celkovou sumu hodnot rovn´ ym d´ılem mezi vˇse ˇcleny (jednotky v souboru). Pozn´ amka: Obecn´ı definici aritmetick´eho pr˚ umˇeru oznaˇcujeme i jako prost´y aritmetick´y pr˚ umˇer. Pozn´ amka: Aritmetick´ y pr˚ umˇer je najpouˇz´ıvanejˇs´ı a nejuniverzalnejˇs´ı m´ıra polohy mezi vˇsemi druhy pr˚ umˇer˚ u a jin´ ych m´ır polohy. Nav´ıc m´a matematick´e vlastnosti, kter´e se uk´ azali kl´ıˇcov´e v oblasti inferenˇcn´ı statistick´e indukce. ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou identifik´atory statistick´ ych jednotek, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ u a hodnoty statistick´eho znaku jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Sub Prumer() Dim Prumer As Single 0 Definice promennych kvuli rezervaci pameti Dim Suma As Single Dim x i() As Single Dim n As Integer Dim i As Integer 0 Vypocet: n = Application.CountA(Columns(2)) - 1 0 nebo n = Application.CountA(Range("B:B")) - 1 ReDim x i(1 To n) Suma = 0 For i = 1 To n x i(i) = Cells(i + 1, 2)
8. M´IRY POLOHY
50
Suma = Suma + x i(i) Next i Prumer = Suma / n MsgBox ("Prumer:"& vbTab & Prumer) End Sub 2.2. V´ aˇ zen´ y aritmetick´ y pr˚ umˇ er.
ta 2.1. Necht’ m´ame zad´ano rozdˇelen´ı ˇcetnost´ı vˇsech moˇzn´ych hodnot (variVe ant, obmˇen) znaku xj v jednorozmˇern´em souboru X, kde j = 1, 2, . . . , k. Symbol k oznaˇcuje poˇcet obmˇen znaku xj a nj oznaˇcuje absolutn´ı a pj relativn´ı ˇcetnost t´eto j-t´e obmˇeny. Pak m˚ uˇzeme aritmetick´y pr˚ umˇer, vypoˇcten za tˇechto podm´ınek, oznaˇcovat za v´ aˇzen´ y aritmetick´ y pr˚ umˇer a zapsat jako k P
x= (150)
nj xj
j=1 k P j=1
= nj
n1 x1 + n2 x2 + . . . + nk xk = k P nj i=1
n1 x1 + n2 x2 + . . . + nk xk = = n n2 nk n1 x2 + . . . + xk = = x1 + n n n =p1 x1 + p2 x2 + . . . + pk xk .
D˚ ukaz. D˚ ukaz t´eto vlastnosti je obsaˇzen v d˚ ukazu vˇety 2.7 na stranˇe 44.
Pozn´ amka: V pˇr´ıpadˇe, ˇze je jak´ ykoli v´ aˇzen´ y pr˚ umˇer poˇc´ıt´an z absolutn´ıch ˇcetnost´ı vol´ame ho tak´e jako v´ aˇzen´y pr˚ umˇer poˇc´ıtan´y z absolutn´ıch ˇcetnost´ı a v pˇr´ıpadˇe v´ ypoˇctu s uˇzit´ım relativn´ıch ˇcetnost´ı jako v´ aˇzen´y pr˚ umˇer poˇc´ıtan´y z relativn´ıch ˇcetnost´ı. Pozn´ amka: Pod´ıly absolutn´ıch ˇcetnost´ı s celkovou ˇcetnost´ı nni a relativn´ı ˇcetnosti pi vystupuj´ı ve v´ ypoˇctu jako v´ ahy, kter´e pˇriˇrazujeme kaˇzd´e obmˇenˇe znaku xi . T´ımto zp˚ usobem se ve v´ ysledn´e hodnotˇe pr˚ umˇeru ˇc´ıselnˇe nejv´ıce projev´ı vliv silnˇe zastoupen´ ych obmˇen a jejich hodnot. ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou varianty statistick´eho znaku, kter´e znak m˚ uˇze nab´ yt, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ ua ˇcetnosti jednotliv´ ych obmˇen jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Sub Dim Dim Dim Dim Dim Dim
Prumer() Prumer As Single 0 Definice promennych kvuli rezervaci pameti Suma As Single n As Integer k As Integer i As Integer x i() As Single
´ PR˚ ˇ 2. ARITMETICKY UMER
51
Dim n i() As Single 0 Vypocet: n = Application.Sum(Columns(2)) k = Application.CountA(Columns(2)) - 1 ReDim x i(1 To k) ReDim n i(1 To k) Suma = 0 For i = 1 To k n i(i) = Cells(i + 1, 2) x i(i) = Cells(i + 1, 1) Suma = Suma + n i(i) * x i(i) Next i Prumer = Suma / n MsgBox ("Prumer:"& vbTab & Prumer) End Sub 2.3. V´ ypoˇ cet celkov´ eho pr˚ umˇ eru z pr˚ umˇ er˚ u d´ılˇ c´ıch soubor˚ u.
ta 2.2. Necht’ m´ame hodnoty vˇsech statistick´ych jednotek znaku xh v jednoVe rozmˇern´em souboru X, a n je poˇcet statistick´ych jednotek v souboru. Z´ aroveˇ n, necht’ je tento soubor rozdˇelen do k skupin (podsoubor˚ u). Symbol nj oznaˇcuje absolutn´ı a pj relativn´ı ˇcetnost hodnot v j-t´e skupinˇe (podsouboru). Pak pro celkov´y pr˚ umˇer plat´ı n P
x=
(151)
k P
xh
h=1
n
=
nj xj
j=1 k P
= nj
n X
pj xj .
h=1
j=1
D˚ ukaz. Kaˇzd´ a statistick´ a jednotka patˇr´ı do nˇekter´e z k skupin. Pomocn´ı doln´ı index h se pˇretransformuje z informace, o kterou poˇradovou jednotku v souboru sa jedn´ a, na informaci o poˇradov´em ˇc´ısle jednotky v j-t´e skupinˇe (kolik´at´a hodnota v j-t´e skupinˇe to je). Tud´ıˇz tuto transformaci m˚ uˇzeme zapsat jako h −→ ij ⇔ xh −→ xij .
(152)
Pro sumu hodnot, kter´e patˇr´ı do prvn´ı skupiny, plat´ı (153)
n1 X
xi1 = x11 + x21 + . . . + xi1 + . . . + xn1 1 ,
i=1
pro sumu hodnot, kter´e patˇr´ı do druh´e skupiny plat´ı (154)
n2 X
xi2 = x12 + x22 + . . . + xi2 + . . . + xn2 2 ,
i=1
pro sumu hodnot, kter´e patˇr´ı do j-t´e skupiny plat´ı (155)
nj X i=1
xij = x1j + x2j + . . . + xij + . . . + xnj j ,
8. M´IRY POLOHY
52
pro sumu hodnot, kter´e patˇr´ı do k-t´e skupiny plat´ı (156)
nk X
xik = x1j + x2k + . . . + xik + . . . + xnk k .
i=1
Pro sumu vˇsech tˇechto tˇr´ıd a hodnot statistick´ ych jednotek v kaˇzd´e tˇr´ıdˇe plat´ı, ˇze n X
(157)
xh =
nj k X X
xij .
j=1 i=1
h=1
Pro v´ ypoˇcet (d´ılˇc´ıho) pr˚ umˇeru v j-t´e skupinˇe plat´ı, ˇze nj P
(158)
xj =
xij
i=1
,
nj
tud´ıˇz se d´ a suma hodnot v j-t´e skupine vyj´adˇrit tak´e jako nj X
(159)
xij = nj xj ,
i=1
. Vztah v rovnici 157 se tedy d´ a vyj´adˇrit n X
(160)
xh =
nj k X X
xij =
k X
j=1 i=1
h=1
nj xj .
j=1
Pro celkov´ y pr˚ umˇer souboru plat´ı n P
x=
(161)
nj k P P
xh
h=1
n
=
j=1 i=1 k P
k P
xij =
nj xj
j=1
nj
j=1
k P
. nj
j=1
Pro relativn´ı ˇcetnosti pak m˚ uˇzeme jednoduˇse zav´est n´asleduj´ıc´ı vztahy k P
(162)
x=
k P
nj xj
j=1 k P
= nj
nj xj
j=1
n
=
k X nj j=1
n
xj =
k X
pj xj .
j=1
j=1
Pozn´ amka: Pˇredch´ azej´ıc´ı vˇeta n´ am ˇr´ık´ a, ˇze celkov´ y v´aˇzen´ y pr˚ umˇer je moˇzn´e vyj´adˇrit nejenom v pˇr´ıpadˇe hodnot znaku uspoˇr´adan´ ych v tabulce ˇcetnost´ı ale tak´e v pˇr´ıpadˇe existence libovoln´ ych d´ılˇc´ıch skupin, ze kter´ ych je celkov´ ych soubor sestaven. Tehdy je celkov´ y pr˚ umˇer v´ aˇzen´ ym pr˚ umˇerem z d´ılˇc´ıch pr˚ umˇer˚ u. V´ahy pˇriˇrazen´e jednotliv´ ym skupin´ am jsou ˇcetnosti hodnot, ze kter´ ych byli jednotliv´e d´ılˇc´ı pr˚ umˇery vypoˇcteny.
´ PR˚ ˇ 2. ARITMETICKY UMER
53
ta 2.3. Pr˚ Ve umˇer, kter´y se poˇc´ıt´ a za situace kdyˇz, je poˇcet skupin k rovn´y poˇctu hodnot n v cel´em souboru, vˇsechny absolutn´ı ˇcetnost´ı pˇriˇrazen´e k jednotliv´ym skupin´ am se rovnaj´ı ˇc´ıslu jedna, ∀nj : nj = 1 a d´ılˇc´ı skupinov´y pr˚ umˇer se rovn´ a jedin´e statistick´e jednotce, kter´ a d´ılˇc´ı soubor tvoˇr´ı, ∀xj : xj = x1j , se oznaˇcuje jako v´yˇse uveden´y prost´ y aritmetick´ y pr˚ umˇer a jeho pˇredpis je stejn´y jak´y obecn´ a definice aritmetick´eho pr˚ umˇeru. Tud´ıˇz v´ aˇzen´y pr˚ umˇer je jenom jin´ a u ´prava prost´eho pr˚ umˇeru, kdyˇz pˇredpokl´ ad´ ame nerovnomˇernou strukturu a rozdˇelen´ı obmˇen, nebo skupin hodnot. D˚ ukaz. k P
nj xj
j=1
x=
k P
=
k P
=
k P j=1
xij
k P
1
=
k P
nj
k P
= nj
= nj
j=1
k P
xj
j=1
nj xj
j=1
j=1 k P
= nj
k P
nj
1xj
j=1
nj
i=1
j=1
j=1
(163)
1 P
k P
n P
xj
j=1
n
=
xi
i=1
n
,
j=1
2.4. Dalˇ s´ı vlastnosti aritmetick´ eho pr˚ umˇ eru.
ta 2.4. Kdyˇz k je konstanta a n oznaˇcuje poˇcet hodnot statistick´ych jednotek Ve znaku xi v souboru, pak plat´ı n P xi + k i=1 (164) = x + k. n D˚ ukaz. n P xi + k x1 + k + x2 + k + . . . + xn + k i=1 = = n n x1 + x2 + . . . + xn + kn x1 + x2 + . . . + xn kn (165) = = + = n n n n P xi i=1 = + k = x + k. n Pozn´ amka: Vˇeta n´ am ˇr´ık´ a, ˇze pˇriˇcteme-li ke kaˇzd´e hodnotˇe v souboru stejnou konstantu, pr˚ umˇer se zmˇen´ı tak´e o tuto konstantu.
ta 2.5. Kdyˇz k je konstanta r˚ Ve uzn´ a od nuly a n oznaˇcuje poˇcet hodnot statistick´ych jednotek znaku xi v souboru, pak plat´ı n P kxi i=1 (166) = kx. n
8. M´IRY POLOHY
54
D˚ ukaz. n P
kxi
kx1 + kx2 + . . . + kxn = = n n k (x1 + x2 + . . . + xn ) (x1 + x2 + . . . + xn ) = =k n n n P xi =k i=1 = kx. n i=1
(167)
Pozn´ amka: Vˇeta n´ am ˇr´ık´ a, ˇze n´ asob´ıme-li kaˇzdou hodnotu v souboru stejnou konstantu k, pr˚ umˇer se zmˇen´ı k-n´ asobnˇe.
ta 2.6. Kdyˇz n oznaˇcuje poˇcet hodnot statistick´ych jednotek znaku xi v souboru, Ve pak plat´ı n X
(168)
(xi − x) = 0.
i=1
D˚ ukaz. D˚ ukaz byl zn´ azornˇen v pozn´amce o definici aritmetick´eho pr˚ umˇeru. Pozn´ amka: Suma odchylek hodnot od jejich pr˚ umˇeru je tud´ıˇz vˇzdy rovna nule.
ta 2.7. Kdyˇz k je konstanta a n oznaˇcuje poˇcet hodnot statistick´ych jednotek Ve znaku xi v souboru, pak plat´ı n P
(169)
k
i=1
n
= k.
D˚ ukaz. n P
(170)
k
i=1
n
=
nk = k. n
Pozn´ amka: Aritmetick´ y pr˚ umˇer konstanty se rovn´a t´eto konstantˇe.
ta 2.8. Kdyˇz c je konstanta r˚ Ve uzn´ a od nuly, a k oznaˇcuje poˇcet obmˇen znaku, xj , v souboru, pak plat´ı k P
(171)
k P
cnj xj
j=1 k P j=1
= cnj
nj xj
j=1 k P j=1
= x. nj
´ PR˚ ˇ 3. HARMONICKY UMER
55
D˚ ukaz. k P
(172)
cnj xj
j=1 k P
c
k P j=1
= cnj
c
j=1
k P
nj xj
k P
=
k P
nj
j=1
nj xj
j=1
= x. nj
j=1
Pozn´ amka: Pˇren´ asob´ıme-li kaˇzdou absolutn´ı, nebo relativn´ı ˇcetnost stejnou konstantou, pr˚ umˇer se nezmˇen´ı. M˚ uˇzeme tak poˇc´ıtat pr˚ umˇer bez znalosti origin´aln´ıch ˇcetnost´ı. Pomˇern´e zastoupen´ı hodnot vˇsak mus´ı z˚ ustat stejn´e. Pozn´ amka: Velmi d˚ uleˇzitou analytickou vlastnost´ı, kterou je nutn´e vz´ıt v potaz a kter´a vypl´ yv´a z definice aritmetick´eho pr˚ umˇeru je fakt, ˇze je poˇc´ıt´an ze vˇsech hodnot a kaˇzd´a hodnota m´ a stejnou jednotkovou v´ahu. Tud´ıˇz i extr´emnˇe n´ızk´e nebo vysok´e hodnoty znaku, byt’ jen ojedinel´e v souboru, m˚ uˇzou z´asadnˇe ovlivnit a vych´ ylit typickou stˇredn´ı hodnotu v souboru. Z tohoto d˚ uvodu se aritmetick´ y pr˚ umˇer poˇc´ıt´a soubˇeˇznˇe s medi´ anem, kter´ y tuto vlastnost nem´a. 3. Harmonick´ y pr˚ umˇ er 3.1. Obecn´ a definice.
Definice 3.1. Harmonick´y pr˚ umˇer vypoˇcten´ y ze vˇsech n hodnot statistick´ ych jednotek znaku xi v souboru, definujeme jako pod´ıl poˇctu hodnot a sumy pˇrevr´acen´ ych hodnot tohoto vybran´eho znaku.
(173)
n xH = P = n 1 i=1
xi
1 x1
+
1 x2
n + ··· +
1 xn
=
1 1 x1
+ x1 +···+ x1n 2 n
.
Pozn´ amka: Tak jako v pˇr´ıpadˇe aritmetick´eho pr˚ umˇeru, pro harmonick´y pr˚ umˇer plat´ı n´asledovn´ı u ´pravy, kter´e tvoˇr´ı podstatu tohoto pr˚ umˇeru n xH = 1 , (174) 1 + + · · · + x1n x1 x2 (175) (176)
(177)
(178)
1 1 1 n + + ··· + = , x1 x2 xn xH 1 1 1 1 1 1 + + ··· + = + + ··· + . x1 x2 xn xH xH xH 1 1 1 1 1 1 + + ··· + − + + ··· + = 0. x1 x2 xn xH xH xH 1 1 1 1 1 1 − + − + ··· + − = 0. x1 xH x2 xH xn xH
8. M´IRY POLOHY
56
Pozn´ amka: Obecn´ı definici harmonick´eho pr˚ umˇeru naz´ yv´ame rovnˇeˇz jako prost´y harmonick´y pr˚ umˇer. ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou identifik´atory statistick´ ych jednotek, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ u a hodnoty statistick´eho znaku jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Sub Prumer() Dim Prumer As Single 0 Definice promennych kvuli rezervaci pameti Dim Suma As Single Dim x i() As Single Dim n As Integer Dim i As Integer 0 Vypocet: n = Application.CountA(Columns(2)) - 1 0 nebo n = Application.CountA(Range("B:B")) - 1 ReDim x i(1 To n) Suma = 0 For i = 1 To n x i(i) = Cells(i + 1, 2) Suma = Suma + 1/x i(i) Next i Prumer = n / Suma MsgBox ("Prumer:"& vbTab & Prumer) End Sub 3.2. V´ aˇ zen´ y harmonick´ y pr˚ umˇ er.
ta 3.1. Necht’ m´ame zad´ano rozdˇelen´ı ˇcetnost´ı vˇsech moˇzn´ych hodnot (variVe ant, obmˇen) znaku xj v jednorozmˇern´em souboru X, kde j = 1, 2, . . . , k. Symbol k oznaˇcuje poˇcet obmˇen znaku xj a nj oznaˇcuje absolutn´ı a pj relativn´ı ˇcetnost t´eto j-t´e obmˇeny. Pak m˚ uˇzeme harmonick´y pr˚ umˇer, vypoˇcten za tˇechto podm´ınek, oznaˇcovat za v´ aˇzen´ y harmonick´ y pr˚ umˇer a zapsat jako k P
(179)
xH =
nj
j=1 k P j=1
= nj xj
1 k P j=1
pj xj
D˚ ukaz. Postup pˇri dokazovan´ı rovnosti mezi obecnou definic´ı (prost´ ym harmonick´ ym pr˚ umˇerem) a v´ aˇzen´ ym harmonick´ ym pr˚ umˇerem je analogick´ y k d˚ ukazu v´ ypoˇctu obecn´ıch moment˚ u kolem nuly s pouˇzit´ım ˇcetnost´ı (vˇeta 2.7 na stranˇe 44) s t´ ym rozd´ılem, ˇze m´ısto hodnot samotn´ ych, bychom za hodnoty statistick´ ych jednotek xi dosazovali jejich pˇrevr´acen´e hodnoty x1i . Jako n´asledek se d´a harmonick´ y pr˚ umˇer vyj´ adˇrit jako pˇrevr´acen´a hodnota aritmetick´eho pr˚ umˇeru poˇc´ıtan´eho
´ PR˚ ˇ 3. HARMONICKY UMER
57
z pˇrevr´ acen´ ych hodnot. k P
(180)
xH =
nj
j=1 k P
=
=
1 , xA
=
1 . xH
nj x1 j j=1
nj x1j
j=1
1 k P
k P
nj
j=1
k P
xA =
(181)
j=1
nj x1j
k P
1
= nj
k P
nj
j=1
j=1
k P j=1
nj x1
j
Mezi v´ aˇzen´ ymi harmonick´ ymi pr˚ umˇery poˇc´ıtan´ ymi z absolutn´ıch a relativn´ıch ˇcetnost´ı plat´ı u ´pravy k P
nj
j=1 k P
(182)
j=1
=
= nj xj
1 k P j=1
nj 1 n xj
n n = k = k P P nj 1 nj xj xj
j=1
=
j=1
1 k P j=1
pj x1j
=
1 k P j=1
=
nj x1
j
n
1 k P j=1
. pj xj
ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou varianty statistick´eho znaku, kter´e znak m˚ uˇze nab´ yt, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ ua ˇcetnosti jednotliv´ ych obmˇen jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Sub Prumer() Dim Prumer As Single 0 Definice promennych kvuli rezervaci pameti Dim Suma As Single Dim n As Integer Dim k As Integer Dim i As Integer Dim x i() As Single Dim n i() As Single 0 Vypocet: n = Application.Sum(Columns(2)) k = Application.CountA(Columns(2)) - 1 ReDim x i(1 To k) ReDim n i(1 To k) Suma = 0 For i = 1 To k n i(i) = Cells(i + 1, 2)
8. M´IRY POLOHY
58
x i(i) = Cells(i + 1, 1) Suma = Suma + ( n i(i) / x i(i) ) Next i Prumer = n / Suma MsgBox ("Prumer:"& vbTab & Prumer) End Sub 3.3. V´ ypoˇ cet celkov´ eho harmonick´ eho pr˚ umˇ eru z harmonick´ ych pr˚ umˇ er˚ u d´ılˇ c´ıch soubor˚ u.
ta 3.2. Necht’ m´ame hodnoty vˇsech statistick´ych jednotek znaku xh v jednoVe rozmˇern´em souboru X, a n je poˇcet statistick´ych jednotek v souboru. Z´ aroveˇ n, necht’ je tento soubor rozdˇelen do k skupin (podsoubor˚ u). Symbol nj oznaˇcuje absolutn´ı a pj relativn´ı ˇcetnost hodnot v j-t´e skupinˇe (podsouboru). Pak pro celkov´y harmonick´y pr˚ umˇer plat´ı k P
(183)
xH
n = P n h=1
nj
j=1
=
k P
1 xh
j=1
nj xj
1 . = P n pj h=1
xj
D˚ ukaz. Postup d˚ ukazu rovnosti by byl stejn´ y jako pˇri d˚ ukazu vˇety 2.2 na stranˇe 51 s t´ ym rozd´ılem, ˇze by byli pouˇzity pˇrevr´acen´e hodnoty statistick´ ych jednotek tak, jako v pˇredchoz´ım d˚ ukazu. 3.4. Dalˇ s´ı vlastnosti harmonick´ eho pr˚ umˇ eru.
ta 3.3. Kdyˇz k je konstanta a n oznaˇcuje poˇcet hodnot statistick´ych jednotek Ve znaku xi v souboru, pak plat´ı n = kxH n P (184) 1 i=1
kxi
D˚ ukaz. (185)
n = n P 1 i=1
kxi
1 k
n n P i=1
1 xi
n =kP n i=1
= kxH . 1 xi
Pozn´ amka: Pokud n´ asob´ıme kaˇzdou hodnotu stejnou konstantou k r˚ uznou od nuly, harmonick´ y pr˚ umˇer se zmˇen´ı k-n´ asobnˇe.
ta 3.4. Kdyˇz k je konstanta a n oznaˇcuje poˇcet hodnot statistick´ych jednotek Ve znaku xi v souboru, pak plat´ı (186)
n =k n P 1 i=1
k
´ PR˚ ˇ 4. GEOMETRICKY UMER
59
D˚ ukaz. n n kn = 1 = = k. n P n n 1 k
(187)
i=1
k
Pozn´ amka: Harmonick´ y pr˚ umˇer konstanty se rovn´a t´eto konstantˇe.
ta 3.5. Kdyˇz c je konstanta r˚ Ve uzn´ a od nuly, a k oznaˇcuje poˇcet obmˇen znaku, xj , v souboru, pak plat´ı k P
cnj
j=1
(188)
k P j=1
= xH . cnj xi
D˚ ukaz. k P
(189)
cnj
j=1 k P j=1
c c
k P j=1
k P
nj
j=1
= cnj xi
k P
= nj xi
nj
j=1 k P j=1
= xH . nj xi
Pozn´ amka: Pokud n´ asob´ıme kaˇzdou v´ ahu nj konstantou k r˚ uznou od nuly, harmonick´ y pr˚ umˇer se nezmˇen´ı. Pozn´ amka: Na rozd´ıl od aritmetick´eho pr˚ umˇeru, v pˇr´ıpadˇe harmonick´eho pr˚ umˇeru, neplat´ı vˇeta o pˇriˇcten´ı konstanty a n´ asledn´ı zmˇenˇe harmonick´eho pr˚ umˇeru o tuto konstantu. Pozn´ amka: Pouˇzit´ı harmonick´eho pr˚ umˇeru je zˇr´ıdkav´e. Setk´av´ame se s n´ım speci´alnˇe v teorii hospod´ aˇrsk´ ych index˚ u. 4. Geometrick´ y pr˚ umˇ er 4.1. Obecn´ a definice.
Definice 4.1. Geometrick´y pr˚ umˇer vypoˇcten´ y ze vˇsech n kladn´ych hodnot statistick´ ych jednotek znaku xi v souboru, definujeme jako odmocninu z produktu tˇechto hodnot
(190)
xG =
√ n
v u n uY n x 1 x 2 . . . xn = t xi . i=1
8. M´IRY POLOHY
60
Pozn´ amka: Podstata geometrick´eho pr˚ umˇeru spoˇc´ıv´a ve vztaz´ıch, ve kter´ ych se nemˇen´ı souˇcin hodnot. √ n x1 x2 . . . xn = xG , (191) (192)
x1 x2 . . . xn = xnG ,
(193)
x1 x2 . . . xn = xG xG . . . . .xG
a z´ aroveˇ n po zlogaritmov´ an´ı pˇrirozen´ ymi logaritmy z´ısk´ame u ´pravu, kter´a je analogick´ a k aritmetick´emu pr˚ umˇeru. Plat´ı totiˇz, ˇze po zlogaritmov´an´ı geometrick´eho pr˚ umˇeru z´ısk´ ame pod´ıl sum pˇrirozen´ ych logaritm˚ u hodnot a poˇctu hodnot v souboru, tud´ıˇz aritmetick´eho pr˚ umˇeru poˇc´ıtan´eho z logaritm˚ u hodnot. (194)
xG =
√ n
1
x1 x2 . . . xn = (x1 x2 . . . xn ) n , 1
(195)
ln xG = ln (x1 x2 . . . xn ) n , n P
(196)
ln xG =
ln x1 + ln x2 + . . . + ln xn = n
ln xi
i=1
n
.
ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou identifik´atory statistick´ ych jednotek, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ u a hodnoty statistick´eho znaku jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Sub Prumer() Dim Prumer As Single 0 Definice promennych kvuli rezervaci pameti Dim Produkt As Single Dim n As Integer Dim i As Integer Dim x i() As Single 0 Vypocet: n = Application.CountA(Columns(2)) - 1 0 nebo n = Application.CountA(Range("B:B")) - 1 ReDim x i(1 To n) Produkt = 1 For i = 1 To n x i(i) = Cells(i + 1, 2) Produkt = Produkt * x i(i) Next i Prumer = Produkt^(1 / n) MsgBox ("Prumer:"& vbTab & Prumer) End Sub
´ PR˚ ˇ 4. GEOMETRICKY UMER
61
4.2. V´ aˇ zen´ y geometrick´ y pr˚ umˇ er.
ta 4.1. Necht’ m´ame zad´ano rozdˇelen´ı ˇcetnost´ı vˇsech moˇzn´ych hodnot (variVe ant, obmˇen) znaku xj v jednorozmˇern´em souboru X, kde j = 1, 2, . . . , k. Symbol k oznaˇcuje poˇcet obmˇen znaku xj a nj oznaˇcuje absolutn´ı a pj relativn´ı ˇcetnost t´eto j-t´e obmˇeny. Pak m˚ uˇzeme geometrick´y pr˚ umˇer, vypoˇcten za tˇechto podm´ınek, oznaˇcovat za v´ aˇzen´ y geometrick´ y pr˚ umˇer a zapsat jako
(197)
xG =
q n
xn1 1 xn2 1 . . . xnk k
v u k k Y u Y nj p n = t xj = xj j . j=1
j=1
D˚ ukaz. Proces dokazov´ an´ı je analogick´ y jako v pˇr´ıpadˇe obecn´ıch moment˚ u poˇc´ıtan´ ych s pouˇzit´ım ˇcetnost´ı (vˇeta 2.7 na stranˇe 44). Rozd´ıl spoˇc´ıv´a v nahrazen´ı hodnot statistick´ ych jednotek xi u aritmetick´eho pr˚ umˇeru hodnotami logaritm˚ u tˇechto hodnot, ln xi . Mezi v´ aˇzen´ ymi geometrick´ ymi pr˚ umˇery poˇc´ıtan´ ymi z absolutn´ıch a relativn´ıch ˇcetnost´ı plat´ı u ´pravy v n1 u k k k k k nj Y Y Y Y u Y nj n n 1 p n t (198) xj j = xj j n = xjn = xj = xj j . j=1
j=1
j=1
j=1
j=1
ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou varianty statistick´eho znaku, kter´e znak m˚ uˇze nab´ yt, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ ua ˇcetnosti jednotliv´ ych obmˇen jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Sub Prumer() Dim Prumer As Single 0 Definice promennych kvuli rezervaci pameti Dim Produkt As Single Dim n As Integer Dim k As Integer Dim i As Integer Dim x i() As Single Dim n i() As Single 0 Vypocet: n = Application.Sum(Columns(2)) k = Application.CountA(Columns(2)) - 1 ReDim x i(1 To k) ReDim n i(1 To k) Produkt = 1 For i = 1 To k n i(i) = Cells(i + 1, 2) x i(i) = Cells(i + 1, 1) Produkt = Produkt * (x i(i)^n i(i)) Next i Prumer = Produkt^(1 / n)
8. M´IRY POLOHY
62
MsgBox ("Prumer:"& vbTab & Prumer) End Sub 4.3. V´ ypoˇ cet celkov´ eho geometrick´ eho pr˚ umˇ eru z geometrick´ ych pr˚ umˇ er˚ u d´ılˇ c´ıch soubor˚ u.
ta 4.2. Necht’ m´ame hodnoty vˇsech statistick´ych jednotek znaku xh v jednoVe rozmˇern´em souboru X, a n je poˇcet statistick´ych jednotek v souboru. Z´ aroveˇ n, necht’ je tento soubor rozdˇelen do k skupin (podsoubor˚ u). Symbol nj oznaˇcuje absolutn´ı a pj relativn´ı ˇcetnost hodnot v j-t´e skupinˇe (podsouboru). Pak pro celkov´y geometrick´y pr˚ umˇer plat´ı v u k k Y uY k nj pj P nt (199) xG = j=1 j xGj = xGj j=1
j=1
D˚ ukaz. Postup d˚ ukazu rovnosti by byl stejn´ y jako pˇri d˚ ukazu vˇety 2.2 na stranˇe 51 s t´ ym rozd´ılem, ˇze by byli pouˇzity logaritmy hodnot statistick´ ych jednotek, tak jako v pˇredchoz´ım pˇr´ıpadˇe. 4.4. Dalˇ s´ı vlastnosti geometrick´ eho pr˚ umˇ eru.
ta 4.3. Kdyˇz k je konstanta a n oznaˇcuje poˇcet hodnot statistick´ych jednotek Ve znaku xi v souboru, pak plat´ı v u n uY n t kxj = kxH
(200)
i=1
D˚ ukaz. (201)
v u n uY n t kxj =
v u n u Y n t kn kxj = kxH .
i=1
i=1
Pozn´ amka: Pokud n´ asob´ıme kaˇzdou hodnotu stejnou konstantou k r˚ uznou od nuly, geometrick´ y pr˚ umˇer se zmˇen´ı k-n´ asobnˇe.
ta 4.4. Kdyˇz k je konstanta a n oznaˇcuje poˇcet hodnot statistick´ych jednotek Ve znaku xi v souboru, pak plat´ı v u n uY n t k = k,
(202)
i=1
D˚ ukaz. (203)
v u n √ √ uY n n n t k = kk. . . . .k = k n = k. i=1
Pozn´ amka: Geometrick´ y pr˚ umˇer konstanty se rovn´a t´eto konstantˇe.
´ PR˚ ˇ 5. KVADRATICKY UMER
63
ta 4.5. Kdyˇz c je konstanta r˚ Ve uzn´ a od nuly, a k oznaˇcuje poˇcet obmˇen znaku, xj , v souboru, pak plat´ı v u k u Y cnj cnt j xj = xG . j=1 k P
(204)
j=1
D˚ ukaz.
v u k k Y u Y cnj k P cnt j xj = xj j=1 j=1 j=1 (205)
= xj j=1 k Y
nj k P nj j=1
cnj k P j=1
cnj
1 k P
j=1
k Y xj = j=1
k Y nj x = j j=1
nj
cnj c
k P j=1
nj
=
k Y n = xj j j=1
1 k P j=1
nj
=
v u k u Y nj nt = j=1 j xj = xG . k P
j=1
Pozn´ amka: D˚ uleˇzitou ˇcrtou geometrick´eho pr˚ umˇeru z˚ ust´av´a fakt, ˇze ho je moˇzn´e poˇc´ıtat jenom z kladn´ ych hodnot. V d˚ usledku t´eto skuteˇcnosti se s n´ım setk´av´ame pˇri mˇeˇren´ı dynamiky ˇcasov´ ych ˇrad a v teorii hospod´aˇrsk´ ych index˚ u. 5. Kvadratick´ y pr˚ umˇ er 5.1. Obecn´ a definice.
Definice 5.1. Kvadratick´y pr˚ umˇer vybran´eho znaku je vypoˇcten´ y jako odmocnina ze sumy druh´ ych mocnin hodnot vˇsech statistick´ ych jednotek souboru
(206)
r xK =
x21 + x22 + . . . + x2n = n
v n uP u x2i t i=1
n
.
Pozn´ amka: Rovnˇeˇz obecn´ı vzorec pro kvadratick´y pr˚ umˇer se oznaˇcuje jako prost´y. Pozn´ amka: Pˇri bliˇzˇs´ım zkoum´ an´ı odhal´ıme mechanizmus, kter´ y p˚ usob´ı uvnitˇr kvadratick´eho pr˚ umˇeru. Pˇredpis kvadratick´eho pr˚ umˇeru se d´a zapsat pomoc´ı n´asleduj´ıc´ıch uprav r x21 + x22 + . . . + x2n (207) xK = , n
8. M´IRY POLOHY
64
x21 + x22 + . . . + x2n , n
(208)
x2K =
(209)
nx2K = x21 + x22 + . . . + x2n .
(210)
x2K + x2K + . . . + x2K = x21 + x22 + . . . + x2n .
ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou identifik´atory statistick´ ych jednotek, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ u a hodnoty statistick´eho znaku jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Sub Prumer() Dim Prumer As Single 0 Definice promennych kvuli rezervaci pameti Dim Suma As Single Dim x i() As Single Dim n As Integer Dim i As Integer 0 Vypocet: n = Application.CountA(Columns(2)) - 1 0 nebo n = Application.CountA(Range("B:B")) - 1 ReDim x i(1 To n) Suma = 0 For i = 1 To n x i(i) = Cells(i + 1, 2) Suma = Suma + x i(i)^2 Next i Prumer = (Suma / n)^(1/2) MsgBox ("Prumer:"& vbTab & Prumer) End Sub 5.2. V´ aˇ zen´ y kvadratick´ y pr˚ umˇ er.
ta 5.1. Necht’ m´ame zad´ano rozdˇelen´ı ˇcetnost´ı vˇsech moˇzn´ych hodnot (variVe ant, obmˇen) znaku xj v jednorozmˇern´em souboru X, kde j = 1, 2, . . . , k. Symbol k oznaˇcuje poˇcet obmˇen znaku xj a nj oznaˇcuje absolutn´ı a pj relativn´ı ˇcetnost t´eto j-t´e obmˇeny. Pak m˚ uˇzeme geometrick´y pr˚ umˇer, vypoˇcten za tˇechto podm´ınek, oznaˇcovat za v´ aˇzen´ y kvadratick´ y pr˚ umˇer a zapsat jako
(211)
xK
v uP u k v u n x2 u k u j=1 j j uX u =u k =t pj x2j . t P j=1 nj j=1
D˚ ukaz. Proces dokazov´ an´ı je analogick´ y jako v pˇr´ıpadˇe obecn´ıch moment˚ u poˇc´ıtan´ ych s pouˇzit´ım ˇcetnost´ı (vˇeta 2.7 na stranˇe 44). Rozd´ıl spoˇc´ıv´a v nahrazen´ı hodnot statistick´ ych jednotek hodnotami x2i . Rovnˇeˇz d˚ ukaz mezi rovnost´ı v´aˇzen´eho
´ PR˚ ˇ 5. KVADRATICKY UMER
65
kvadratick´eho pr˚ umˇeru s pouˇzit´ım absolutn´ıch ˇcetnost´ı a relativn´ıch ˇcetnost´ı je stejn´ y jako v d˚ ukazu u v´ aˇzen´eho aritmetick´eho pr˚ umˇeru. ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou varianty statistick´eho znaku, kter´e znak m˚ uˇze nab´ yt, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ ua ˇcetnosti jednotliv´ ych obmˇen jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Sub Prumer() Dim Prumer As Single 0 Definice promennych kvuli rezervaci pameti Dim Suma As Single Dim n As Integer Dim k As Integer Dim i As Integer Dim x i() As Single Dim n i() As Single 0 Vypocet: n = Application.Sum(Columns(2)) k = Application.CountA(Columns(2)) - 1 ReDim x i(1 To k) ReDim n i(1 To k) Suma = 0 For i = 1 To k n i(i) = Cells(i + 1, 2) x i(i) = Cells(i + 1, 1) Suma = Suma + n i(i)*( x i(i) )^2 Next i Prumer = ( Suma / n )^ (1 / 2) MsgBox ("Prumer:"& vbTab & Prumer) End Sub 5.3. V´ ypoˇ cet celkov´ eho kvadratick´ eho pr˚ umˇ eru z kvadratick´ ych pr˚ umˇ er˚ u d´ılˇ c´ıch soubor˚ u.
ta 5.2. Necht’ m´ame hodnoty vˇsech statistick´ych jednotek znaku xh v jednoVe rozmˇern´em souboru X, a n je poˇcet statistick´ych jednotek v souboru. Z´ aroveˇ n, necht’ je tento soubor rozdˇelen do k skupin (podsoubor˚ u). Symbol nj oznaˇcuje absolutn´ı a pj relativn´ı ˇcetnost hodnot v j-t´e skupinˇe (podsouboru). Pak pro celkov´y kvadratick´y pr˚ umˇer plat´ı v uP u k 2 v u x n u k u j=1 j j uX u (212) =t xK = u k x2j pj . t P j=1 nj j=1
D˚ ukaz. Postup d˚ ukazu rovnosti by byl stejn´ y jako pˇri d˚ ukazu vˇety 2.2 na stranˇe 51 s t´ ym rozd´ılem, ˇze by byli pouˇzity druh´e mocniny hodnot statistick´ ych jednotek, tak jako v pˇredchoz´ım pˇr´ıpadˇe.
66
8. M´IRY POLOHY
Pozn´ amka: Kvadratick´ y pr˚ umˇer by se jevil zd´anlivˇe tˇeˇzko vyuˇziteln´ y koncept. Jeho znalost m´ a vˇsak velk´ y v´ yznam, jelikoˇz jeho vnitˇrn´ı matematick´ y princip je tak´e podstatou nejzn´ amˇejˇs´ı M´ıry variability - smˇerodatn´e odchylky, kterou si pop´ıˇseme v n´ asleduj´ıc´ıch kapitol´ ach. Pozn´ amka: Tˇreba podotknout, ˇze uveden´e pr˚ umˇery nejsou jedin´ ymi pˇr´ıpady pr˚ umˇer˚ u. Mohli bychom zav´est i jin´e jako napˇr. kubick´ y pr˚ umˇer. Vyuˇzit´ı je vˇsak zcela v´ yjimeˇcn´e. 6. Aritmetick´ y stˇ red
Definice 6.1. Aritmetick´y stˇred je definov´ an jako polovina ze souˇctu minim´aln´ı a maxim´aln´ı hodnoty znaku v souboru. (213)
AS =
xmin + xmin . 2
Pozn´ amka: Tato m´ıra polohy je ponˇekud povrchn´ı, nakolik u ´plnˇe ignoruje distribuci hodnot znaku. Pozn´ amka: Na aritmetick´ y stˇred m˚ uˇzeme nahl´ıˇzet t´eˇz jako na aritmetick´ y pr˚ umˇer minim´aln´ı a maxim´ aln´ı hodnoty v souboru. 7. Modus
Definice 7.1. Modus, x b, je hodnota, obmˇena znaku, nebo interval s nejvˇetˇs´ı ˇcetnost´ı v souboru. (214)
xM o = argmaxi (ni ) . 8. Medi´ an
Definice 8.1. Medi´ an, oznaˇcov´ an jako x e, je kvantilov´a m´ıra polohy odpov´ıdaj´ıc´ı 50-procentn´ımu. kvantilu. Pozn´ amka: V´ıce sme se t´eto m´ıˇre vˇenovali v Kapitole, kde je moˇzn´e naj´ıt i jeho matematickou definici spolu se vˇseobecnou definic´ı kvantil˚ u. Pozn´ amka: Medi´ an je velmi pouˇz´ıvanou a ˇz´adanou m´ırou polohy. Nejˇcastˇeji se s n´ım setk´av´ame v anal´ yzach v kombinaci s aritmetick´ ym pr˚ umˇerem jelikoˇz jedna i druh´a m´ıra m´a sv´a omezen´ı. Medi´ an na rozd´ıl od pr˚ umˇeru nen´ı citliv´y na extr´emnˇe n´ızk´e nebo vysok´e hodnoty. I kdyˇz se pˇri jeho v´ ypoˇctu bere v potaz existence tˇechto extr´emn´ıch hodnot v souboru, jejich samotn´ a hodnota nijak nep˚ usob´ı na hodnotu medi´anu. V´ ypoˇcet hodnoty medi´ anu se omezuje pouze na prostˇredn´ı hodnoty. Na druh´e stranˇe, nemus´ı b´ yt vˇzdy ˇz´ adan´e, abychom odignorovali extr´emn´ı hodnoty. Tyto hodnoty m˚ uˇzou n´est d˚ uleˇzitou informaci i kdyˇz v´ yskyt tˇechto hodnot nebo ˇrekneme ud´alost´ı m˚ uˇze b´ yt zˇr´ıdkav´ y. Z tohoto d˚ uvodu se kombinuje medi´an s aritmetick´ ym pr˚ umˇerem, kter´ y je funkc´ı vˇsech hodnot v souboru.
ˇ 10. VZTAHY MEZI PR˚ UMERY
67
Pozn´ amka: Medi´ an, ale tak´e modus rovnˇeˇz neobsahuj´ı vlastnosti, kter´e by n´am umoˇznili v´ ypoˇcet celkov´e stˇredn´ı hodnoty v pˇr´ıpadˇe d´ılˇc´ıch souboru a kompenzaˇcn´ı schopnost aritmetick´eho pr˚ umˇeru se uk´ aˇze kl´ıˇcov´a pr´avˇe v kapitole pojedn´avaj´ıc´ı o m´ır´ach variability (strana 70). 9. Vztah mezi aritmetick´ ym pr˚ umˇ erem, medi´ anem a modem
ta 9.1. V pˇr´ıpadˇe symetrick´eho rozdˇelen´ı jsou aritmetick´y pr˚ Ve umˇer, modus a medi´ an rovny stejn´e hodnotˇe znaku. D˚ ukaz. D˚ ukaz je zˇrejm´ y a vypl´ yv´a pˇr´ımo z definic tˇechto m´ır polohy.
Pozn´ amka: V pˇr´ıpadˇe asymetrick´eho kladnˇe seˇsikmen´eho rozdˇelen´ı plat´ı empirick´ y vztah (215)
x b<x e < x.
Pozn´ amka: V pˇr´ıpadˇe asymetrick´eho z´ apornˇe seˇsikmen´eho rozdˇelen´ı plat´ı empirick´ y vztah (216)
x b>x e > x.
Pozn´ amka: V pˇr´ıpadˇe m´ırnˇe asymetrick´eho rozdˇelen´ı byl na z´akladˇe empirick´ ych zkuˇsenost´ı odvozen vztah x−x b ≈ 3 (x − x e) .
(217)
N´ asleduj´ıc´ı vztah mˆ oˇze b´ yt pˇrepsan do podoby, kt´er´a n´am umoˇzn´ı odhadnout polohu kter´ekoli ze tˇr´ı mˇer polohy x≈
(218)
3 (e x−x b) , 2 2x + x b , 3
(219)
x b≈
(220)
x b ≈ 3e x − 2x. 10. Vztahy mezi pr˚ umˇ ery
ta 10.1. Kdyˇz se d´a vˇseobecn´a definice pr˚ Ve umˇeru popsat n´ asleduj´ıc´ı funkc´ı (221)
(d) x
=
d1 d
xd1 + xd2 + . . . + xn n
pak plat´ı, ˇze pˇri a) b) c) d)
d=-1 dostaneme harmonick´y pr˚ umˇer, d=0 dostaneme geometrick´y pr˚ umˇer, d=1 dostaneme aritmetick´y pr˚ umˇer, d=2 dostaneme kvadratick´y pr˚ umˇer.
P n
xdi
i=1 = n
d1 ,
8. M´IRY POLOHY
68
D˚ ukaz. Kdyˇz d=-1 plat´ı vztahy P n (222)
(−1) x
i=1 =
1
(−1) (−1) xi
n
P n i=1 = n
1 xi
−1 n = P = xH . n 1
i=1
xi
Kdyˇz d=0 plat´ı vztahy n P
(223)
lim ln x = lim
i→0
ln
i=1
n 1 d = lim P x ln xi = i→0 n n i xdi
n
d
i→0
n P
xd i
ln xi
i=1
n
= ln xG
i=1
Kdyˇz d=1 plat´ı vztahy P n (224)
1
(1) (1) xi
i=1 (1) x = n
n P
=
xi
i=1
n
.
Kdyˇz d=2 plat´ı vztahy P n (225)
(2) x
1
(2) (2) xi
i=1 = n
=
v n uP u x2i t i=1
n
.
ta 10.2. Plat´ı, ˇze Ve (226) (227)
(−1) x
≤(0) x ≤(1) x ≤(2) x,
xH ≤ xG ≤ xA ≤ xK .
D˚ ukaz. D˚ ukaz si uk´ aˇzeme na nejjednoduchˇs´ı situaci, kdyˇz m´a soubor jenom 2 r˚ uzn´e hodnoty x1 a x2 . Pomoc´ı matematick´e indukce, nebo Cauchyho-Swarzov´e nerovnosti by se vˇsak dala dok´azat platnost i pro v´ıce hodnot. Mus´ı platit’, ˇze r √ 2x1 x2 x1 + x2 x21 + x22 (228) ≤ x1 x2 ≤ ≤ . x1 + x2 2 2 Pr˚ umˇery se rovnaj´ı jenom v situaci, kdyˇz a = b. D˚ ukaz prvn´ı nerovnosti: √ 2x1 x2 (229) ≤ x1 x2 , x1 + x2 (230)
x21
4x21 x22 ≤ x1 x2 , + 2x1 x2 + x22
(231)
4x21 x22 ≤ x1 x2 x21 + 2x1 x2 + x22 ,
(232)
4x1 x2 ≤ x21 + 2x1 x2 + x22 ,
(233)
0 ≤ x21 − 2x1 x2 + x2 ,
ˇ 10. VZTAHY MEZI PR˚ UMERY
(234)
69
2
0 ≤ (x1 − x2 ) .
D˚ ukaz druh´e nerovnosti: (235)
√
x1 x2 ≤
x1 + x2 2
x21 + 2x1 x2 + x22 4
(236)
x1 x2 ≤
(237)
4x1 x2 ≤ x21 + 2x1 x2 + x22
(238)
0 ≤ x21 − 2x1 x2 + x22
(239)
0 ≤ (x1 − x2 ) .
2
D˚ ukaz tˇret´ı nerovnosti: (240)
x1 + x2 ≤ 2
r
x21 + x22 , 2
(241)
x2 + x22 x21 + 2x1 x2 + x22 ≤ 1 , 4 2
(242)
x21 + 2x1 x2 + x22 ≤ 2x21 + 2x22 ,
(243)
0 ≤ x21 − 2x1 x2 + x22 .
(244)
0 ≤ (x1 − x2 ) .
2
Jelikoˇz vˇsechny v´ yrazy jsou rovn´e nule jenom v situaci, kdyˇz jsou obˇe hodnoty stejn´e, naˇse nerovnost mus´ı b´ yt platn´a.
KAPITOLA 9
M´ıry variability Definice 0.1. M´ıry variability mˇeˇr´ı u ´roveˇ n odliˇsnost´ı mezi hodnotami statistick´ ych jednotek ve vybran´em znaku v souboru. Definice 0.2. M´ıry variability prim´ arnˇe slouˇz´ı ke zmˇeˇren´ı kvality (spolehlivosti) m´ır polohy jako typick´e hodnoty a ke srovn´ av´ an´ı s m´ırami u jin´ ych soubor˚ u. Pozn´ amka: R˚ uznˇe ˇsirok´ a symetrick´ a rozdˇelen´ı m˚ uˇzou m´ıt stejnou stˇredn´ı hodnotu a pˇrece vykazuj´ı v´ yraznou odliˇsnost. M´ıra polohy tud´ıˇz nen´ı ide´aln´ı sum´arn´ı ukazatel rozdˇelen´ı, jelikoˇz je limitov´ an svou matematickou konstrukc´ı. Pro vˇetˇs´ı objektivnost by mˇela b´ yt m´ıra poloha doplnˇena o ukazatel, kter´ y popisuje i jinou ˇcrtu rozdˇelen´ı. V tomto pˇr´ıpadˇe m´ıru variability. Pozn´ amka: ˇ ım maj´ı hodnoty statistick´ C´ ych jednotek u dan´eho znaku menˇs´ı variabilitu, t´ım spolehlivˇejˇs´ı jsou M´ıry polohy a naopak, ˇc´ım vˇetˇs´ı je variabilita hodnota, t´ım menˇs´ı je vypov´ıdaj´ıc´ı schopnost stˇredn´ı hodnoty.
Definice 0.3. M´ıry variability rozdˇelujeme na absolutn´ı a relativn´ı m´ıry.
Definice 0.4. Absolutn´ı M´ıry variability nejsou nijak hodnotovˇe omezeny a uchov´avaj´ı si informaci o jednotk´ ach, ve kter´ ych je dan´ y znak mˇeˇren.
Definice 0.5. Relativn´ı M´ıry variability jsou bezrozmˇern´a ˇc´ısla, kter´e vznikli, kdyˇz byli absolutn´ı M´ıry variability vztaˇzeny pod´ılem k nˇekter´e m´ıˇre polohy u sledovan´eho znaku. Pozn´ amka: Relativn´ı m´ıry vˇsak nem˚ uˇzeme konstruovat v pˇr´ıpadˇe, kdyˇz m˚ uˇze znak nab´ yt kromˇe kladn´ ych i z´ aporn´ı hodnoty (napˇr´ıklad teplota v Celsiov´ ych stupn´ıch). V d˚ usledku matematick´e konstrukce relativn´ıch m´ır se mus´ıme vyh´ ybat jejich pouˇzit´ı v pˇr´ıpadech, kdy je moˇzn´e, ˇze se stˇredn´ı hodnota bude rovnat nule. Pozn´ amka: Nejˇcastˇeji se setk´ av´ ame s m´ırami zaloˇzen´ ych na kvantilech, nebo momentech. 1. Kvantilov´ e m´ıry variability 1.1. Variaˇ cn´ı rozpˇ et´ı. 70
´ M´IRY VARIABILITY 1. KVANTILOVE
71
Definice 1.1. Variaˇcn´ı rozpˇet´ı je absolutn´ı m´ıra variability, kter´a je definov´ana jako rozd´ıl maxim´ aln´ı hodnoty, xmax a minim´aln´ı hodnoty, xmin v souboru R = xmax − xmin .
(245)
Pozn´ amka: Velkou nev´ yhodou t´eto m´ıry je jej´ı v´ yhradn´ı z´avislost na krajn´ıch hodnot´ach, co m˚ uˇze v´est k zkreslen´emu pohledu na vnitˇrn´ı rozdˇelen´ı hodnot speci´alnˇe kdyˇz jsou tyto extr´emn´ı hodnoty zcela n´ahodil´e a v´ yznamnˇe vzd´aleny od vˇetˇsiny hodnot. Pozn´ amka: Z t´eto absolutn´ı m´ıry udˇel´ ame relativn´ı m´ıru jednoduch´ ym pod´ılem bud’to s pr˚ umˇerem, R ), medi´ a nem, R = ), nebo jinou m´ ırou polohy. Tyto relativn´ ı m´ ıry n´am R= R x x e ˇr´ıkaj´ı kolikan´ asobnˇe pˇrevyˇsuje rozpˇet´ı hodnotu M´ıry polohy vybran´eho znaku. M´ıry m˚ uˇzou nab´ yt minim´ aln´ı hodnoty nula jenom v situaci, kdyˇz jsou vˇsechny hodnoty stejn´e, naopak ze samotn´e definice vypl´ yv´a, ˇze relativn´ı m´ıry nemaj´ı ˇz´adn´e fixn´ı maximum. ˇ sen´ı ve VBA: Reˇ Sub Prumer() Dim Prumer As Single 0 Definice promennych kvuli rezervaci pameti Dim n As Integer Dim i As Integer Dim x i() As Single Dim x Min As Single Dim x Max As Single Dim R As Single 0 Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x i(1 To n) For i = 1 To n x i(i) = Cells(i + 1, 2) Next i x Max = Application.Max(x i) x Min = Application.Min(x i) R = x Max - x Min MsgBox ("R:"& vbTab & R) End Sub 1.2. Kvantilov´ e rozpˇ et´ı.
Definice 1.2. Kvantilov´e rozpˇet´ı je absolutn´ı m´ıra variability, kter´a je definov´ana jako absolutn´ı hodnota rozd´ılu i-procentn´ıho kvantilu x ei a (1 − i)-procentn´ıho kvantilu x e1−i , (246)
IQR = |e xi − x e1−i | .
Pozn´ amka: Nejˇcastejˇs´ı formy kvantilov´eho rozpˇet´ı jsou a) kvartilov´e rozpˇet´ı (247)
IQR = |e x0,25 − x e0,75 | ,
9. M´IRY VARIABILITY
72
b) decilov´e rozpˇet´ı IQR = |e x0,1 − x e0,9 | ,
(248) c) percentilov´e rozpˇet´ı (249)
IQR = |e x0,01 − x e0,99 | .
Pozn´ amka: Velkou v´ yhodou kvantilov´eho rozpˇet´ı oproti variaˇcn´ımu rozpˇet´ı je jeho vˇetˇs´ı nez´avislost od nahodil´ ych extr´emn´ıch a krajn´ıch hodnot. Pozn´ amka: Relativn´ı kvantilov´e rozpˇet´ı bychom sestrojili stejn´ ym zp˚ usobem jako bylo naznaˇceno u variaˇcn´ıho rozpˇet´ı, tentokr´at bychom st´ahly tuto m´ıru sp´ıˇse k hodnotˇe medi´ anu, abychom zachovali kvantilov´ y charakter m´ıry. ˇ sen´ı ve VBA: Reˇ Sub IQR() Dim n As Integer 0 Definice promennych kvuli rezervaci pameti Dim i As Integer Dim x i() As Single Dim DownQ As Single Dim UpQ As Single Dim IQR As Single 0 Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x i(1 To n) For i = 1 To n x i(i) = Cells(i + 1, 2) Next i UpQ = Application.Quartile(x i, 3) DownQ = Application.Quartile(x i, 1) IQR = UpQ - DownQ MsgBox ("IQR:"& vbTab & IQR) End Sub 1.3. Kvantilov´ e odchylky.
Definice 1.3. Kvantilov´e odchylky jsou dalˇs´ı absolutn´ı M´ıry variability, kter´e jsou definov´any jako aritmetick´ y pr˚ umˇer rozd´ıl˚ u sousedn´ıch kvantil˚ u vybran´eho druhu, n−1 P x e n+1−i − x e n−i n+1 n+1 (250) Q = i=1 , n−1 kde n je poˇcet kvantil˚ u dan´eho druhu. Pozn´ amka: Nejˇcastˇeji se setk´ av´ ame jako s vybran´ ym druhem kvantil˚ u s kvartilmi (n = 3), decilmi (n = 9), nebo percentilmi (n = 99).
´ M´IRY VARIABILITY 1. KVANTILOVE
73
ta 1.1. Plat´ı zjednoduˇsen´y v´ypoˇcetn´ı tvar kvantilov´e odchylky Ve n−1 P
(251)
Q=
i=1
x e n+1−i − x e n−i n+1
n−1
n+1
=
n 1 x e n+1 −x e n+1
n−1
.
D˚ ukaz. Soustˇred´ıme sa pouze na d˚ ukaz ˇcitatel˚ u, jelikoˇz jmenovatel je stejn´ y (252) n−1 P e n−i x e n+1−i − x n 1 x e n+1 −x e n+1 n+1 n+1 Q = i=1 = = n−1 n−1 1 h x e n+1−1 − x = e n−1 + x e n+1−2 − x e n−2 + . . . n+1 n+1 n+1 n+1 n−1 i ... + x e n+1−n+2 − x e n−n+2 + x e n+1−n+1 − x e n−n+1 = n+1 n+1 n+1 n+1 i 1 h n 2 2 1 3 = −x e n+1 +x e n+1 −x e n+1 = x e n+1 −x e n−1 + x e n−1 − x e n−2 + . . . + x e n+1 n+1 n+1 n+1 n−1 x n 1 −x e n+1 e n+1 1 n 1 x e n+1 . −x e n+1 = n−1 n−1 Pozn´ amka: V´ ypoˇcetn´ı vzorec n´ am ˇr´ık´ a, ˇze tato m´ıra je v koneˇcn´em d˚ usledku z´avisl´a jenom na rozpˇet´ı mezi hodnotami dvou krajn´ıch, vz´ajemnˇe opaˇcn´ ych kvantil˚ u zvolen´eho druhu. Tyto kvantily maj´ı na rozd´ıl od ostatn´ıch kvantil˚ u dan´eho druhu jenom jednoho souseda. Pozn´ amka: Konkr´etn´ı vzorce pro jednotliv´e kvantily jsou n´asleduj´ıc´ı: a) Kvartilov´e odchylky (253)
(e x0,75 − x e0,50 ) + (e x0,50 − x e0,25 ) (e x0,75 − x e0,25 ) = . 2 2 b) Decilov´e odchylky Q=
(254) (e x0,90 − x e0,80 ) + (e x0,80 − x e0,70 ) + . . . + (e x0,30 − x e0,20 ) + (e x0,20 − x e0,10 ) = 8 (e x0,90 − x e0,10 ) = . 8 c) Percentilov´e odchylky (255) (e x0,99 − x e0,98 ) + (e x0,98 − x e0,97 ) + . . . + (e x0,03 − x e0,02 ) + (e x0,02 − x e0,01 ) Q= = 98 (e x0,99 − x e0,01 ) . = 98 Pozn´ amka: Vˇsechny kvantilov´e M´ıry variability jsou zaloˇzeny jenom na urˇcit´e ˇc´asti hodnot v souboru. V kontrastu s touto strategi´ı stoj´ı momentov´e m´ıry, kter´e jsou vypoˇcteny ze vˇsech hodnot bez rozd´ılu. Q=
9. M´IRY VARIABILITY
74
ˇ sen´ı ve VBA: Reˇ Sub Q() Dim n As Integer 0 Definice promennych kvuli rezervaci pameti Dim i As Integer Dim x i() As Single Dim DownQ As Single Dim MedQ As Single Dim UpQ As Single Dim Q As Single 0 Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x i(1 To n) For i = 1 To n x i(i) = Cells(i + 1, 2) Next i UpQ = Application.Quartile(x i, 3) MedQ = Application.Quartile(x i, 2) DownQ = Application.Quartile(x i, 1) Q = ((UpQ - MedQ) + (MedQ - DownQ)) / 2
2. Momentov´ e M´ıry variability 2.1. Rozptyl – Obecn´ a definice.
Definice 2.1. Necht’ xi je i-ta hodnota statistick´eho znaku ve v´ ybˇerov´em souboru s n statistick´ ymi jednotkami a x je aritmetick´ y pr˚ umˇer dan´eho znaku. Rozptyl je centr´aln´ı moment druh´eho stupnˇe, kter´ y je definov´an jako n P
(256)
s2x
=
2
(xi − x)
i=1
n
.
Pozn´ amka: Obecn´ a definice n´ am ˇr´ık´ a, ˇze rozptyl je aritmetick´ y pr˚ umˇer vypoˇcten´ y z druh´ ych mocnin vzd´ alenost´ı (ˇctverc˚ u vzd´alenost´ı) hodnot znaku od celkov´eho aritmetick´eho pr˚ umˇeru znaku. Rozptyl je tedy pr˚ umˇern´ y ˇctverec vzd´alenost´ı. Tˇreba pˇripomenout, ˇze plat´ı vˇeta 2.1(strana 41) a ˇze pˇri l = 1 se kladn´e a z´aporn´e vzd´alenosti od pr˚ umˇeru kompenzuj´ı. Pˇri sumaci tˇechto vzd´alenost´ı je pokaˇzd´e ˇcitatel a tud´ıˇz i cel´ y vzorec, roven nule. Druh´ a mocnina, l = 2, tento “probl´em” odstran´ı, jelikoˇz mocnˇen´ım na druhou obdrˇz´ıme jenom kladn´e hodnoty. Pozn´ amka: Druhou informaci, kterou m´ a vzorec zakomponov´an ve sv´e konstrukci a kter´a vypl´ yv´ a tak´e z mocniny druh´eho stupnˇe, je citlivost na extr´emn´ı hodnoty. Vzd´alenost kaˇzd´e hodnoty od pr˚ umˇeru je umocnˇen´a na ˇctverec t´eto vzd´alenosti. Extr´emn´ı hodnoty maj´ı velik´e vzd´ alenosti od pr˚ umˇeru (i kdyˇz je pr˚ umˇer ˇc´asteˇcnˇe v d˚ usledku tˇechto hodnot vych´ ylen), ˇc´ım pˇrevahu v celkov´em v´ ypoˇctu z´ısk´avaj´ı pr´avˇe ˇctverce extr´emn´ıch hodnot. V pˇr´ıpadˇe existence extr´emn´ıch hodnot m˚ uˇzeme obdrˇzet zkreslenou informaci o variabilitˇe vˇetˇsiny hodnot.
´ M´IRY VARIABILITY 2. MOMENTOVE
75
Pozn´ amka: Rozptyl je vˇzdy nez´ aporn´ a hodnota a je vyj´adˇren ve fyzick´ ych jednotk´ach ˇctvereˇcn´ıch. ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou identifik´atory statistick´ ych jednotek, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ u a hodnoty statistick´eho znaku jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Function Mean(n As Long, x i() As Single) Dim i As Integer 0 Vypocet: Suma = 0 For i = 1 To n Suma = Suma + x i(i) Next i Mean = Suma / n End Function Sub Var() Dim n As Long Dim i As Integer Dim x i() As Single Dim Var As Single 0 Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x i(1 To n) For i = 1 To n x i(i) = Cells(i + 1, 2) Next i Average = Mean(n, x i) Suma = 0 For i = 1 To n Suma = Suma + (x i(i) - Average)^2 Next i Var = Suma / n MsgBox ("Variance:"& vbTab & Var) End Sub ˇ sen´ı ve VBA: Reˇ V´ ypoˇcetn´ı tvar rozptylu Sub Var() Dim n As Long Dim i As Integer Dim x i() As Single Dim Var As Single ’Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x i(1 To n)
9. M´IRY VARIABILITY
76
For i = 1 To n x i(i) = Cells(i + 1, 2) Next i Suma1 = 0 Suma2 = 0 For i = 1 To n Suma1 = Suma1 + (x i(i))^2 Suma2 = Suma2 + x i(i) Next i Var = (Suma1 / n) - (Suma2 / n)^2 MsgBox ("Variance:"& vbTab & Var) End Sub
ta 2.1. Pro rozptyl tak´e plat´ı Ve
n P
(257)
s2x =
2
(xi − x)
i=1
n
=
n n 1 XX 2 (xi − xj ) . 2n2 i=1 j=1
Pozn´ amka: Rozptyl se d´ a tedy vypoˇc´ıtat tak´e bez znalosti aritmetick´eho pr˚ umˇeru znaku. Staˇc´ı na to vz´ ajemn´e vzd´ alenosti mezi hodnotami. Rozptyl m´a tedy nejenom v´ yznam pr˚ umˇern´eho ˇctverce odchylek hodnot od aritmetick´eho pr˚ umˇeru hodnot ale tak´e v´ yznam pr˚ umˇern´eho ˇctverce odchylek hodnot mezi sebou.
´ M´IRY VARIABILITY 2. MOMENTOVE
77
D˚ ukaz. Vyuˇzijeme v´ ypoˇcetn´ı tvar rozptylu z vˇety 2.2 (strana 2.2). (258) P 2 n n n P P 2 (xi − x) xi x2i i=1 2 2 s2x = i=1 = i=1 − n =x −x = n n 2x2 − 2x2 2 2 x2 + x2 − 2x2 x − x2 = = = 2 2 2 1 2 x2 − 2x2 + x2 1 2 x − 2x2 + x2 = x − 2xx + x2 = = = 2 2 2 n n P P 2 xj xj n n 2 X X 1 nx 1 j=1 j=1 = nx2 − 2x = − 2x + xj + x2j = 2 n n n 2n =
j=1
j=1
n n n n n n X X X X X 1 1 X 2 x − 2x xj + x2j = x2 − 2xxj + x2j = = 2n j=1 2n j=1 j=1 j=1 j=1 j=1 n n 1 X 2 1 X 2 2 = x − 2xxj + xj = x − 2xxj + x2j = 2n j=1 2n j=1 P P n n n n P P 2 2 x x x x n n i i i i nx2j 1 X 1 X i=1 i=1 2 i=1 i=1 = − 2 x + x = − 2 x + = j j j n 2n 2n j=1 n n n n j=1
n
P n
n P
x2i
1 X i=1 = 2n j=1 n
−2
n P
xi
i=1
n
xj +
i=1
x2j
n
n n n n X X 1 X X 2 = 2 xi − 2 xi xj + x2j 2n j=1 i=1 i=1 i=1
=
n
X1 = 1 2n n j=1 ! =
n X i=1
x2i
−2
n X
xi xj +
n X
i=1
! x2j
i=1
n n 1 XX 2 x − 2xi xj + x2j = 2n2 j=1 i=1 i
n n n n 1 XX 1 XX 2 2 (x − x ) = (xi − xj ) . i j 2n2 j=1 i=1 2n2 i=1 j=1
ˇ sen´ı ve VBA: Reˇ Sub Var() Dim n As Long Dim i As Integer Dim x i() As Single Dim Var As Single 0 Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x i(1 To n) For i = 1 To n
=
9. M´IRY VARIABILITY
78
x i(i) = Cells(i + 1, 2) Next i Suma = 0 For i = 1 To n For j = 1 To n Suma = Suma + (x i(i) - x i(j))^2 Next j Next i Var = Suma / (2 * n^2) MsgBox ("Variance:"& vbTab & Var) End Sub 2.2. V´ ypoˇ cet rozptylu z rozdˇ elen´ı ˇ cetnost´ı obmˇ en znaku.
ta 2.2. Necht’ m´ame zad´ano rozdˇelen´ı ˇcetnost´ı vˇsech moˇzn´ych hodnot (variVe ant, obmˇen) znaku xj v jednorozmˇern´em souboru, kde j = 1, 2, . . . , k. Symbol k oznaˇcuje poˇcet obmˇen znaku xj a nj oznaˇcuje absolutn´ı a pj relativn´ı ˇcetnost t´eto j-t´e obmˇeny. Pak m˚ uˇzeme prost´y tvar rozptylu zapsat s pouˇzit´ım ˇcetnost´ı jako n P
(259)
s2x =
k P
2
(xi − x)
i=1
=
n
2
nj (xj − x)
j=1 k P
= nj
k X
2
pj (xj − x) ,
j=1
j=1
nebo v´ypoˇcetn´ı tvar rozptylu zapsat s pouˇzit´ım ˇcetnost´ı jako P 2 n n n P P 2 x2i xi (xi − x) i=1 = i=1 − s2x = i=1 n = n n (260)
k P
=
j=1
nj x2j
k P j=1
nj
n P
2
nj xj k X − i=1k pj x2j − = P j=1 nj
n X
!2 pj xj
.
i=1
j=1
D˚ ukaz. D˚ ukaz tˇechto vlastnost´ı je obsaˇzen v d˚ ukazu vˇety 2.7 na stranˇe 44.
Pozn´ amka: Rozptyl je vˇzdy nez´ aporn´ a hodnota a je vyj´adˇren ve fyzick´ ych jednotk´ach ˇctvereˇcn´ıch. ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou varianty statistick´eho znaku, kter´e znak m˚ uˇze nab´ yt, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ ua ˇcetnosti jednotliv´ ych obmˇen jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Function Mean(k As Long, n i() As Single, x i() As Single) Dim i As Single Dim n As Single
´ M´IRY VARIABILITY 2. MOMENTOVE
79
0
Vypocet: Suma = 0 n = Application.Sum(n i) For i = 1 To k Suma = Suma + n i(i) * x i(i) Next i Mean = Suma / n End Function Sub Var() Dim k As Long Dim n As Integer Dim i As Integer Dim x i() As Single Dim n i() As Single Dim Var As Single Dim Average As Single 0 Vypocet: k = Application.CountA(Columns(2)) - 1 ReDim x i(1 To k) ReDim n i(1 To k) For i = 1 To k x i(i) = Cells(i + 1, 1) n i(i) = Cells(i + 1, 2) Next i Average = Mean(k, n i, x i) Suma = 0 For i = 1 To k Suma = Suma + n i(i) * (x i(i) - Average)^2 Next i n = Application.Sum(n i) Var = Suma / n MsgBox ("Variance:"& vbTab & Var) End Sub
2.3. V´ ypoˇ cet celkov´ eho rozptylu z rozptyl˚ u a pr˚ umˇ er˚ u d´ılˇ c´ıch soubor˚ u.
ta 2.3. Necht’ m´ame hodnoty vˇsech statistick´ych jednotek znaku xh v jednoVe rozmˇern´em souboru, kde n je poˇcet statistick´ych jednotek v souboru a x je aritmetick´y pr˚ umˇer znaku. Z´ aroveˇ n, necht’ je tento soubor rozdˇelen do k skupin (podsoubor˚ u). Symbol nj oznaˇcuje absolutn´ı a pj relativn´ı ˇcetnost hodnot v j-t´e skupinˇe (podsouboru). Kaˇzd´y j-ty podsoubor je charakterizov´ an skupinov´ym pr˚ umˇerem xj .
9. M´IRY VARIABILITY
80
Pak pro celkov´y rozptyl plat´ı n P
s2x
=
k P
=
(261)
2
(xh − x)
h=1
nj s2j
j=1
k P
+
k X
k P
nj
2
nj
j=1
pj s2j +
j=1
=s2j
nj (xj − x)
j=1
j=1
=
=
n k P
k X
2
pj (xj − x) =
j=1
+
sx2 j .
D˚ ukaz. Kaˇzd´ a statistick´ a jednotka patˇr´ı do nˇekter´e z k skupin. Pomocn´ı doln´ı index h sa pˇretransformuje z informace, o kterou poˇradovou jednotku v souboru se jedn´ a, na informaci o poˇradov´em ˇc´ısle jednotky v j-t´e skupinˇe (kolik´at´a hodnota v j-t´e skupinˇe to je). Symbolick´e oznaˇcen´ı hodnot xh se pˇretransformuje na oznaˇcen´ı xij , kter´e urˇcuje i-tou hodnotu v j-t´e skupinˇe. Pro rozptyl j-t´e skupiny proto plat´ı nj P
(262)
s2j
=
(xij − xj )
2
i=1
ni
Z uveden´eho vypl´ yv´ a, ˇze nj s2j =
(263)
nj X
2
(xij − xj ) .
i=1
Pro celkov´ y rozptyl plat´ı symbolick´ y z´apis nj k P P
s2x =
2
(xij − x)
j=1 i=1
n
k
nj
k
nj
=
=
1 XX 2 (xij − xj + xj − x) = n j=1 i=1
=
1 XX 2 [(xij − xj ) + (xj − x)] = n j=1 i=1
k nj i 1 XXh 2 2 (xij − xj ) − 2 (xij − xj ) (xj − x) + (xj − x) = n j=1 i=1 " nj # nj nj k X X 1X X 2 2 = (xij − xj ) − 2 (xij − xj ) (xj − x) + (xj − x) = n j=1 i=1 i=1 i=1 " nj # nj k X 1X X 2 2 = (xij − xj ) − 2 (xj − x) (xij − xj ) + nj (xj − x) = n j=1 i=1 i=1
=
´ M´IRY VARIABILITY 2. MOMENTOVE
(264)
(Uplatn´ıme vˇetu 2.1, takˇze
nj X
81
(xij − xj ) = 0)
i=1
" nj # k 1X X 2 2 = (xij − xj ) − 2 (xj − x) · 0 + nj (xj − x) = n j=1 i=1 " nj # k 1X X 2 2 = (xij − xj ) + nj (xj − x) = n j=1 i=1 " nj # k 1X X 2 2 = (xij − xj ) + nj (xj − x) = n j=1 i=1 nj k X k X X 1 2 2 = (xij − xj ) + nj (xj − x) = n j=1 i=1 j=1 nj k P P
=
k P
2
j=1 i=1
nj (xj − x)
j=1
+ n n (Uplatn´ıme vztah z rovnice 263) k P
=
(xij − xj )
j=1
k P
nj s2j n
+
nj (xj − x)
j=1
n
2
=
2
= s2j + s2xj .
Pozn´ amka: Tato vlastnost uv´ ad´ı, ˇze se d´a celkov´ y rozptyl rozloˇzit na dvˇe sloˇzky. Sloˇzku s2j oznaˇcujeme jako vnitroskupinov´ u variabilitu, nakolik mˇeˇr´ı pr˚ umˇern´ y “d´ılˇc´ı”rozptyl skupin a sloˇzku s2xj oznaˇcujeme jako meziskupinovou variabilitu, jelikoˇz je vypoˇcten´a jako rozptyl d´ılˇc´ıch pr˚ umˇer˚ u skupin od celkov´eho pr˚ umˇeru. Ze vztahu 316 v´ıme, ˇze definice rozptylu jako pr˚ umˇern´e ˇctvercov´e vzd´alenosti od pr˚ umˇeru se d´a pˇreformulovat na pr˚ umˇernou ˇctvercovou vzd´alenost mezi statistick´ ymi jednotkami. Tot´eˇz se d´a uplatnit i pro v´ ypoˇcet s uˇzit´ım skupinov´ ych pr˚ umˇer˚ u. Pozn´ amka: Celkov´ y pr˚ umˇer vypoˇc´ıt´ ame podle vztahu 2.2 (strana 51) jako v´aˇzen´ y aritmetick´ y pr˚ umˇer vypoˇcten´ y z pr˚ umˇer˚ u d´ılˇc´ıch skupin. ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou d´ılˇc´ı skupinov´e pr˚ umˇery znaku, ve druh´em sloupci jsou skupinov´e rozptyly a ve tˇret´ım jsou skupinov´e ˇcetnosti, pˇriˇcemˇz prvn´ı ˇr´adek ve vˇsech sloupc´ıch je rezervov´an n´azv˚ um sloupc˚ u, pak program m˚ uˇze vypadat n´asledovnˇe Function Mean(k As Long, n i() As Single, meanx i() As Single) Dim i As Single Dim n As Single 0 Vypocet: Suma = 0 n = Application.Sum(n i)
9. M´IRY VARIABILITY
82
For i = 1 To k Suma = Suma + n i(i) * meanx i(i) Next i Mean = Suma / n End Function Sub Var() Dim k As Long Dim n As Integer Dim i As Integer Dim meanx i() As Single Dim n i() As Single Dim S2 i() As Single Dim Average As Single Dim Var As Single 0 Vypocet: k = Application.CountA(Columns(1)) - 1 ReDim meanx i(1 To k) ReDim n i(1 To k) ReDim S2 i(1 To k) For i = 1 To k meanx i(i) = Cells(i + 1, 1) S2 i(i) = Cells(i + 1, 2) n i(i) = Cells(i + 1, 3) Next i Average = Mean(k, n i, meanx i) Suma1 = 0 Suma2 = 0 For i = 1 To k Suma1 = Suma1 + n i(i) * (meanx i(i) - Average)^2 Suma2 = Suma2 + n i(i) * S2(i) Next i n = Application.Sum(n i) Var = (Suma1 / n) + (Suma2 / n) MsgBox ("Variance:"& vbTab & Var) End Sub 2.4. Dalˇ s´ı vlastnosti rozptylu.
ta 2.4. Kdyˇz k je konstanta a n oznaˇcuje poˇcet hodnot statistick´ych jednotek Ve znaku xi v souboru, pak plat´ı s2(x+k) = s2x .
(265) D˚ ukaz. n P
(266)
s2(x+k) =
n P
2
[(xi + k) − (x + k)]
i=1
n
=
2
(xi − x)
i=1
n
= s2x .
´ M´IRY VARIABILITY 2. MOMENTOVE
83
Pozn´ amka: Kdyˇz ke kaˇzd´e hodnotˇe statick´e jednotky vybran´eho znaku pˇriˇcteme stejnou konstantu k, rozptyl se oproti p˚ uvodn´ımu rozptylu nijak nemˇen´ı. D˚ uvod spoˇc´ıv´a v zmˇenˇe celkov´eho pr˚ umˇeru o stejnou konstantu. T´ımto zp˚ usobem se posouvaj´ı nejen hodnoty ale souˇcasnˇe tak´e celkov´ y pr˚ umˇer vypoˇc´ıt´an z posunut´ ych hodnot. T´ım se zachov´ a p˚ uvodn´ı variabilita souboru.
ta 2.5. Kdyˇz k je konstanta a n oznaˇcuje poˇcet hodnot statistick´ych jednotek Ve znaku xi v souboru, pak plat´ı s2kx = k 2 s2x .
(267) D˚ ukaz. n P
(kxi − kx)
i=1
s2kx
= i=1
k2
=
n
n P
2
(xi − x)
i=1
=
n
2
[k (xi − x)]
i=1
=
= n i n h P 2 k 2 (xi − x)
(268)
n P
2
= k 2 s2x .
n
ta 2.6. Kdyˇz k je konstanta a vˇsechny statistick´y hodnoty xi jsou rovny t´eto Ve konstantˇe a n je jejich poˇcet, pak plat´ı s2k = 0.
(269) D˚ ukaz. n P
(270)
s2k
i=1
=
n P
2
(xi − x)
=
n
n P
2
(k − k)
i=1
=
n
02
i=1
=0
n
Pozn´ amka: Kdyˇz soubor tvoˇr´ı jenom statistick´e jednotky se stejnou hodnotou, rozptyl je nulov´ y. Tˇreba pˇripomenout, ˇze pr˚ umˇer vypoˇcten z konstant, je rovn´ y t´eto konstantˇe.
ta 2.7. Kdyˇz c je konstanta r˚ Ve uzn´ a od nuly, a k oznaˇcuje poˇcet obmˇen znaku, xj , v souboru, pak plat´ı k P
(271)
s2x =
k P
2
cnj (xi − x)
j=1 k P j=1
= cnj
nj (xi − x)
j=1 k P
2
= s2x . nj
j=1
D˚ ukaz. D˚ ukaz je stejn´ y jako d˚ ukaz vˇety 2.8 (strana 54)
ta 2.8. Kdyˇz k je libovoln´a konstanta a xi je i-ta hodnota statistick´eho znaku Ve ve v´ybˇerov´em souboru s n statistick´ymi jednotkami, pak P n n P 2 2 (xi − k) (x − x) i=1 i=1 i = (272) min = s2x , n n
9. M´IRY VARIABILITY
84
D˚ ukaz. Prv´ a derivace je rovna P n (xi −k)2
d i=1 (273)
n
2 =
n P
(k − xi )
n P
2
i=1
[(−1) (xi − k)]
i=1
=
dk n n Kdyˇz poloˇz´ıme tento v´ yraz nule, z´ısk´ame n P (xi − k) 2 (274) − i=1 = 0, n n X
(275)
2 =−
n P
(xi − k)
i=1
n
.
(xi − k) = 0,
i=1 n X
(276)
xi −
i=1
k = 0,
i=1
n X
(277)
n X
xi − nk = 0,
i=1 n X
(278)
xi = nk,
i=1 n P
(279)
k=
xi
i=1
n
.
Druh´ a derivace je rovna d − (280)
2
n P
(xi −k)
i=1
n
dk
=
2 n = 2. n
Pozn´ amka: ˇ Ctvercov´ a odchylka od aritmetick´eho pr˚ umˇeru je nejmenˇs´ı moˇzn´a odchylka v porovn´ an´ı s odchylkami od jin´ ych konstant. 2.5. Smˇ erodatn´ a odchylka.
Definice 2.2. Necht’ xi je i-ta hodnota statistick´eho znaku ve v´ ybˇerov´em souboru s n statistick´ ymi jednotkami a x je aritmetick´ y pr˚ umˇer dan´eho znaku, smˇerodatn´ a odchylka je definovan´ a jako v n uP 2 u (xi − x) t p i=1 (281) sx = s2x = . n
3. OSTATN´I M´IRY VARIABILITY
85
Pozn´ amka: Smˇerodatn´ a odchylka je odmocnina z hodnoty ˇctverce rozptylu. I kdyˇz je smˇerodatn´a odchylka z´ aporn´ a a souˇcasnˇe kladn´a hodnota (s v´ yjimkou nulov´eho rozptylu) uv´ad´ıme jenom jej´ı kladn´ı hodnotu. Pozn´ amka: Smˇerodatn´ a odchylka je kvadratick´ y pr˚ umˇer odchylek vzd´alenost´ı od pr˚ umˇeru. Pozn´ amka: Pro smˇerodatnou odchylku plat´ı stejn´e vlastnosti jako pro rozptyl (vˇsechny vztahy pˇri rozptyle d´ ame pod odmocninu) s v´ yjimkou n´asoben´ı vˇsech hodnot stejnou kon√ stantou. Tam se mˇen´ı smˇerodatn´a odchylka ne k 2 -n´asobnˇe ale k 2 -n´asobnˇe, tedy o n´ asobek k. Vˇsechny d˚ ukazy jsou analogick´e k d˚ ukaz˚ um pˇri rozptyle. 2.6. Variaˇ cn´ı koeficient.
Definice 2.3. umˇer statistick´eho znaku ve v´ ybˇerov´em Necht’ sx je smˇerodatn´ a odchylka a x je pr˚ souboru, variaˇcn´ı koeficient je definovan´ y jako sx (282) cx = . x Pozn´ amka: Variaˇcn´ı koeficient je relativn´ı m´ıra variability a vyjadˇruje pod´ıl smˇerodatn´e odchylky na hodnotˇe pr˚ umˇeru souboru. Pozn´ amka: Stejnˇe jako jin´e relativn´ı M´ıry variability, variaˇcn´ı koeficient nen´ı vhodn´ y pro vˇsechny druhy promˇenn´ ych. Z d˚ uvodu matematick´eho a souˇcasnˇe interpretaˇcn´ıho omezen´ı je tato m´ıra vhodn´ a pro promˇenn´e, kter´e nab´ yvaj´ı jenom kladn´e hodnoty. Pozn´ amka: Tato m´ıra se nechov´ a stejnˇe jako rozptyl a smˇerodatn´a odchylka, jelikoˇz jsou pˇri v´ ypoˇctu jejich vlastnosti dodateˇcn´e kombinovan´e se zmˇenami v pr˚ umˇeru.
ta 2.9. Kdyˇz k je konstanta pak plat´ı Ve (283)
c(x+k) =
s(x+k) sx = . x+k x+k
D˚ ukaz. D˚ ukaz je jednoduchou kombinac´ı vlastnost´ı aritmetick´eho pr˚ umˇeru a rozptylu, kter´e jiˇz byly dokazov´any.
ta 2.10. Kdyˇz k je konstanta pak plat´ı Ve (284)
c(kx) =
s(kx) ksx sx = = . kx kx x
D˚ ukaz. D˚ ukaz je jednoduchou kombinac´ı vlastnost´ı aritmetick´eho pr˚ umˇeru a rozptylu, kter´e jiˇz byly dokazov´any. 3. Ostatn´ı m´ıry variability 3.1. Pr˚ umˇ ern´ a absolutn´ı odchylka.
9. M´IRY VARIABILITY
86
Definice 3.1. Necht’ xi je i-ta hodnota statistick´eho znaku ve v´ ybˇerov´em souboru s n statistick´ ymi jednotkami, pak pr˚ umˇern´ u odchylku od pr˚ umˇeru definujeme jako n P |xi − x| i=1 (285) dx = n a pr˚ umˇern´ u odchylku od medi´ anu definujeme jako n P |xi − x e| i=1 dxe = (286) n Pozn´ amka: Pr˚ umˇern´ a odchylka od pr˚ umˇeru je ekvivalentem smˇerodatn´e odchylky. Aplikac´ı podobn´eho principu jako m´ a rozptyl, obch´az´ı omezen´ı nulovosti sumy odchylek od pr˚ umˇeru n X (xi − x) = 0, (287) i=1
(288)
n X
( (xi − x)
i=1
(289)
2
= 0 kdyˇz ∀xi : xi = 0 , > 0 jinak
( = 0 kdyˇz ∀xi : xi = 0 |xi − x| . > 0 jinak i=1
n X
Pˇredch´ azej´ıc´ı dvˇe sumace nab´ yvaj´ı hodnoty nula jenom v pˇr´ıpadˇe, ˇze vˇsechny hodnoty statistick´ ych jednotek znaku jsou nulov´e. Pozn´ amka: Pr˚ umˇern´e odchylky m˚ uˇzeme rovnˇeˇz poˇc´ıtat s pouˇzit´ım absolutn´ıch a relativn´ıch ˇcetnost´ı, tak jako rozptyl, nebo smˇerodatnou odchylku. Je jich tak´e moˇzno pouˇzit pˇri sestrojen´ı relativn´ıch pr˚ umˇern´ ych odchylek dxx a dxexe . ˇ sen´ı ve VBA: Reˇ Pr˚ umˇern´ a absolutn´ı odchylka od pr˚ umˇeru: Function Mean(x i() As Single) Dim i As Single ’Vypocet: Suma = 0 n = Application.CountA(x i) For i = 1 To n Suma = Suma + x i(i) Next i Mean = Suma / n End Function Sub MABSDEV() Dim n As Long Dim i As Integer Dim x i() As Single Dim MABSDEV As Single
3. OSTATN´I M´IRY VARIABILITY
87
Dim Average As Single ’Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x i(1 To n) For i = 1 To n x i(i) = Cells(i + 1, 2) Next i Average = Mean(x i) Suma = 0 For i = 1 To n Suma = Suma + Abs(x i(i) - Average) Next i MABSDEV = Suma / n MsgBox ("Mean Absolute Deviation:"& vbTab & MABSDEV) End Sub ˇ sen´ı ve VBA: Reˇ Pr˚ umˇern´ a absolutn´ı odchylka od medi´anu: Sub MABSDEV() Dim n As Long Dim i As Integer Dim x i() As Single Dim MABSDEV As Single ’Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x i(1 To n) For i = 1 To n x i(i) = Cells(i + 1, 2) Next i Suma = 0 For i = 1 To n Suma = Suma + Abs(x i(i) - Application.Quartile(x i, 2)) Next i MABSDEV = Suma / n MsgBox ("Mean Absolute Deviation:"& vbTab & MABSDEV) End Sub
ta 3.1. Kdyˇz k je libovoln´a konstanta a xi je i-ta hodnota statistick´eho znaku Ve ve v´ybˇerov´em souboru s n statistick´ymi jednotkami, pak P n n P |x − x e| |xi − k| i=1 i=1 i = (290) min . n n D˚ ukaz. Necht’ m´ ame n hodnot statistick´ ych jednotek vybran´eho znaku, x1 , x2 , . . . , xn , uspoˇr´ adan´ ych podle velikosti a k je libovoln´a konstanta. Uvaˇzujme prvn´ı pˇr´ıpad, kdyˇz poˇcet statistick´ ych jednotek je sud´e ˇc´ıslo, n = 2m a xm , x2m jsou prostˇredn´ı hodnoty.
9. M´IRY VARIABILITY
88
Plat´ı, ˇze |x1 − k| + |x2m − k| je minim´ aln´ı, kdyˇz x1 ≤ k ≤ x2m , |x2 − k| + |x2m−1 − k| je minim´aln´ı, kdyˇz x2 ≤ k ≤ x2m−1 , .. . |xm − k| + |xm+1 − k| je minim´aln´ı, kdyˇz xm ≤ k ≤ xm+1 . 2m P Tud´ıˇz suma |xi − k| rovnaj´ıc´ı se sumaˇcn´ımu rozvoji i=1
|x1 − k| + |x2 − k| + . . . + |xm − k| + |xm+1 − k| + . . . + |x2m−1 − k| + |x2m − k|, je minim´ aln´ı v situaci, kdyˇz xm ≤ k ≤ xm+1 , tedy kdyˇz k je medi´ an. Uvaˇzujme druh´ y pˇr´ıpad, kdyˇz poˇcet statistick´ ych jednotek je lich´e ˇc´ıslo, n = 2m+1 a xm+1 je prostˇredn´ı hodnoty. Plat´ı, ˇze |x1 − k| + |x2m+1 − k| je minim´aln´ı, kdyˇz x1 ≤ k ≤ x2m+1 , |x2 − k| + |x2m − k| je minim´ aln´ı, kdyˇz x2 ≤ k ≤ x2m , .. . |xm − k| + |xm+2 − k| je minim´aln´ı, kdyˇz xm ≤ k ≤ xm+2 . 2m+1 P Tud´ıˇz suma |xi − k| rovnaj´ıc´ı se sumaˇcn´ımu rozvoji i=1
|x1 − k| + |x2 − k| + . . . + |xm − k| + |xm+1 − k| + |xm+2 − k| + . . . + |x2m−1 − k| + |x2m − k|, je minim´ aln´ı v situaci, kdyˇz k = xm+1 , tedy kdyˇz k je opˇet medi´ an. Tedy, P n (291)
|xi − k|
i=1 min n
n P
=
i=1
|xi − x e| n
.
Pozn´ amka: Pr˚ umˇern´ a absolutn´ı odchylka je minim´aln´ı, kdyˇz se vzd´alenosti poˇc´ıtaj´ı od medi´anu. V situac´ıch, kdyˇz k 6= x e je tedy (292)
dk > dxe.
a rovnˇeˇz, kdyˇz x 6= x e je (293)
dx > dxe.
Pr˚ umˇern´ a absolutn´ı odchylka je rovnˇeˇz vˇetˇs´ı v pˇr´ıpadˇe v´ ypoˇctu odchylek od aritmetick´eho pr˚ umˇeru jako od odchylek od medi´anu (plat´ı pro pˇr´ıpad nerovnosti pr˚ umˇeru a medi´ anu).
ta 3.2. Kdyˇz x 6= xe, pro pr˚ Ve umˇern´e odchylky rovnˇeˇz plat´ı (294)
sx > dx > dxe.
3. OSTATN´I M´IRY VARIABILITY
89
D˚ ukaz. Plat´ı, ˇze v n uP 2 u (xi − x e) t
= i=1 . n n Z´ aroveˇ n plat´ı, ˇze kvadratick´ y pr˚ umˇer hodnot (v naˇsem pˇr´ıpadˇe odchylek) je vˇzdy vˇetˇs´ı hodnota neˇz aritmetick´ y pr˚ umˇer (vˇeta 10.2, strana 68). Proto, v n n n uP P P 2 u |xi − x e| |xi − x| |xi − x e| t i=1 i=1 i=1 (296) > > , n n n
(295)
sx =
i=1
v n uP 2 u |xi − x e| t
sx > dx > dxe.
(297)
Pozn´ amka: Nejvˇetˇs´ı nev´ yhodou pr˚ umˇern´e odchylky je, ˇze ji nen´ı moˇzn´e rozloˇzit na meziskupinovou a vnitroskupinovou sloˇzku variability a ˇze absolutn´ı hodnota nenab´ız´ı stejnˇe ˇsirokou paletu matematick´ ych vlastnost´ı, jako maj´ı rozptyl a smˇerodatn´a odchylka. 3.2. Stˇ redn´ı aritmetick´ a diference.
Definice 3.2. Necht’ xi a xj je i-ta a j-ta hodnota statistick´eho znaku ve v´ ybˇerov´em souboru s n statistick´ ymi jednotkami, pak stˇredn´ı aritmetickou diferenci definujeme jako n P n P
(298)
∆=
|xi − xj |
i=1 j=1
n (n − 1)
2 =
n−1 n P P
|xi − xj |
i=1 j=2
n (n − 1)
2 =
j−1 n P P
|xi − xj |
i=1 j=2
n (n − 1)
.
Pozn´ amka: Stˇredn´ı diference je aritmetick´ y pr˚ umˇer vˇsech moˇzn´ ych odchylek statistick´ ych jednotek, kde i 6= j. V pˇr´ıpadˇe, kdyˇz i = j, se jedn´a o nulovou odchylku hodnoty statistick´e jednotky od sebe sama. Celkov´ y poˇcet kombinac´ı je n2 , ale jelikoˇz toto ˇc´ıslo obsahuje i pˇr´ıpady, kdy i = j, kter´ ych je n, staˇc´ı je odpoˇc´ıtat z celkov´eho poˇctu, n2 − n = n (n − 1). D˚ ukaz rovnosti ˇcitatel˚ u, byl jiˇz nast´ınˇen v d˚ ukazu vˇety 0.16 (strana 24), kde jsme sledovali poˇcet kombinac´ı souˇcin˚ u. Proces d˚ ukazu je vˇsak analogick´ y. ˇ sen´ı ve VBA: Reˇ Sub MADIF() Dim n As Long Dim i As Integer Dim x i() As Single Dim MADIF As Single ’Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x i(1 To n) For i = 1 To n x i(i) = Cells(i + 1, 2) Next i Suma = 0
9. M´IRY VARIABILITY
90
For i = 1 To n For j = 1 To n Suma = Suma + Abs(x i(i) - x i(j)) Next j Next i MADIF = Suma / (n * (n - 1)) MsgBox ("Mean arithmetic difference:"& vbTab & MADIF) End Sub 3.3. Stˇ redn´ı kvadratick´ a diference.
Definice 3.3. Necht’ xi a xj je i-ta a j-ta hodnota statistick´eho znaku ve v´ ybˇerov´em souboru s n statistick´ ymi jednotkami, pak stˇredn´ı kvadratickou diferenci definujeme jako (299) v v v u j−1 u n−1 uP n P n n n u P P u P P 2 2 2 u (x − x ) 2 (x − x ) (xi − xj ) u2 u i j i j u t t t i=1 j=1 i=1 j=2 i=1 j=2 = = . ∆0 = n (n − 1) n (n − 1) n (n − 1) Pozn´ amka: Jedn´ a se tedy o kvadratick´ y pr˚ umˇer vˇsech moˇzn´ ych odchylek statistick´ ych jednotek, kde i 6= j, tak jako pˇri pˇredchoz´ı aritmetick´e diferenci. ˇ sen´ı ve VBA: Reˇ Sub MQDIF() Dim n As Long Dim i As Integer Dim x i() As Single Dim MQDIF As Single ’Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x i(1 To n) For i = 1 To n x i(i) = Cells(i + 1, 2) Next i Suma = 0 For i = 1 To n For j = 1 To n Suma = Suma + (x i(i) - x i(j))^2 Next j Next i MQDIF = (Suma / (n * (n - 1)))^(1/2) MsgBox ("Mean quadratic difference:"& vbTab & MQDIF) End Sub
ta 3.3. Kdyˇz sx je smˇerodatn´a odchylka vˇsech hodnot znaku a n je je jejich Ve poˇcet, plat´ı (300)
0
∆ = sx
r
2n . n−1
3. OSTATN´I M´IRY VARIABILITY
91
D˚ ukaz. V´ıme z vˇety 263 (strana 80), ˇze pro rozptyl plat´ı n P 2 (xi − x) n n 1 XX 2 i=1 (301) s2x = (xi − xj ) . = 2 n 2n i=1 j=1 tud´ıˇz
sx =
(302)
(303)
v n uP 2 u (xi − x) t i=1
v u n X n u 1 X 2 (xi − xj ) = =t 2 2n i=1 j=1
n v u n P n P 2 u r (xi − xj ) u t (n − 1) i=1 j=1 n−1 0 =∆ . = 2n n (n − 1) 2n r sx 2n 0 ∆ =q = sx . n −1 n−1 2n
3.4. Pravidlo ˇ sesti sigma.
Definice 3.4. Kdyˇz sx je smˇerodatn´ a odchylka vybran´eho znaku a xmin a xmax jsou minim´aln´ı a maxim´ aln´ı hodnota znaku souboru, pak se d´a variaˇcn´ı rozpˇet´ı znaku zapsat jako ˇsest kr´ at hodnota smˇerodatn´e odchylky. xmax − xmin (304) sx ≈ , 6 (305)
6sx ≈ xmax − xmin .
KAPITOLA 10
M´ıry ˇ sikmosti 1. Definice zeˇ sikmen´ ych rozdˇ elen´ı
Definice 1.1. Rozdˇelen´ı oznaˇcujeme jako kladnˇe zeˇsikmen´e, kdyˇz m´a polovina statistick´ ych jednotek souboru s menˇs´ı hodnotou znaku rovnˇeˇz menˇs´ı variabilitu neˇzli polovina vˇetˇs´ıch hodnot. Definice 1.2. Rozdˇelen´ı oznaˇcujeme jako z´ apornˇe zeˇsikmen´e, kdyˇz m´a polovina statistick´ ych jednotek souboru s menˇs´ı hodnotou znaku vˇetˇs´ı variabilitu neˇzli polovina vˇetˇs´ıch hodnot. Pozn´ amka: Statistick´ a ˇsikmost se v anglick´e literatuˇre oznaˇcuje jako “skewness”. 2. N´ aroky na m´ıry ˇ sikmosti
Definice 2.1. M´ıra ˇsikmosti m´ a obsahovat n´asleduj´ıc´ı vlastnosti: a) Pˇri soumˇern´em rozdˇelen´ı m´a m´ıra nab´ yvat hodnoty nula. b) Pˇri kladnˇe zeˇsikmen´em rozdˇelen´ı m´a m´ıra nab´ yvat kladn´ ych hodnot. c) Pˇri z´ apornˇe zeˇsikmen´em rozdˇelen´ı m´a m´ıra nab´ yvat z´aporn´ ych hodnot. d) Hodnota M´ıry ˇsikmosti m´a b´ yt bezrozmˇern´e ˇc´ıslo. 3. Kvantilov´ e m´ıry ˇ sikmosti 3.1. Kvantilov´ a m´ıra asymetrie zaloˇ zen´ a na variaˇ cn´ım rozpˇ et´ı.
Definice 3.1. Necht’ x e je medi´ an hodnot znaku, xmin a xmax jsou minim´aln´ı a maxim´aln´ı hodnota znaku, pak je kvantilov´ a m´ıra ˇsikmosti zaloˇzen´ a na celkov´em rozpˇet´ı definovan´a jako (e xmax − x e) − (e x−x emin ) . (306) τi = (e xmax − x e) + (e x−x emin ) ta 3.1. Pˇri symetrick´em rozdˇelen´ı je kvantilov´a m´ıra asymetrie rovna nule, Ve
maxim´ aln´ı hodnota v z´ apornˇe seˇsikmen´em rozdˇelen´ı je rovna m´ınus jedn´e a v kladnˇe zeˇsikmen´em rozdˇelen´ı nab´yv´ a m´ıra maximum v hodnotˇe plus jedna. D˚ ukaz. Symbolick´ a definice se d´a pˇrespat na tvar (xmax − x e) − (e x − xmin ) xmax + xmin − 2e x τi = = = (xmax − x e) + (e x − xmin ) xmax − xmin (307) xmax − xmin − 2 (e x − xmin ) x e − xmin = =1− 1 . xmax − xmin (x max − xmin ) 2 92
´ M´IRY ˇ 3. KVANTILOVE sIKMOSTI
93
a) Z poslednˇe uveden´e u ´pravy vypl´ yv´a, ˇze v pˇr´ıpadˇe symetrick´eho rozdˇelen´ı, min ) kdy je medi´ an x e hodnota uprostˇred variaˇcn´ıho rozpˇet´ı, x e = (xmax −x , 2 1 plat´ı, ˇze x e − xmin = 2 (xmax − xmin ). Celkov´a m´ıra je tedy nulov´a. b) V situac´ıch, kdyˇz je hodnota minima a medi´anu stejn´a hodnota, xmin = x e, je ˇcitatel x e − xmin nulov´ y a m´ıra asymetrie je rovna plus jedn´e. c) V situac´ıch, kdyˇz je hodnota maxima a medi´anu stejn´a hodnota, xmax = x e, je ˇcitatel roven v´ yrazu (xmax − xmin ) a tud´ıˇz je hodnota ˇcitatele dvojn´asobek jmenovatele, x e − xmin = (xmax − xmin ) = 2 21 (xmax − xmin ) a m´ıra je rovna m´ınus jedn´e. ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou identifik´atory statistick´ ych jednotek, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ u a hodnoty statistick´eho znaku jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Sub Skew() Dim n As Integer Dim i As Integer Dim x i() As Single Dim x Min As Single Dim MedQ As Single Dim x Max As Single Dim Skew As Single ’Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x i(1 To n) For i = 1 To n x i(i) = Cells(i + 1, 2) Next i x Min = Application.Min(x i) MedQ = Application.Quartile(x i, 2) x Max = Application.Max(x i) Skew = ((x Max - MedQ) - (MedQ - x Min)) / ((x Max - MedQ) + (MedQ - x Min)) MsgBox ("Skewness:"& vbTab & Skew) End Sub 3.2. Kvantilov´ a m´ıra asymetrie zaloˇ zen´ a na kvantilov´ em rozpˇ et´ı.
Definice 3.2. Necht’ x e je medi´ an hodnot znaku a x ei je (i × 100)-procentn´ı kvantil hodnot znaku, pak jsou kvantilov´e M´ıry ˇsikmosti definovan´e jako (e x1−i − x e) − (e x−x ei ) (308) τi = . (e x1−i − x e) + (e x−x ei ) Pozn´ amka: M´ıra m´ a stejn´e vlastnosti jako pˇredchoz´ı m´ıra zaloˇzen´a na celkov´em rozpˇet´ı. D˚ ukazy jsou analogick´e.
10. M´IRY ˇ sIKMOSTI
94
Pozn´ amka: V´ yhodou t´eto m´ıry je schopnost odfiltrovat krajn´ı hodnoty, kter´e m˚ uˇzou b´ yt nahodil´e, extr´emn´ı a zkresluj´ıc´ı. Pozn´ amka: Nejˇcastˇeji pouˇz´ıvan´ ymi kvantily jsou kvartily – Bowleyoho m´ıra asymetrie (309)
τB =
(e x0,75 − x e) − (e x−x e0,25 ) , (e x0,75 − x e) + (e x−x e0,25 )
a prvn´ı a des´ at´ y decil – Kellyho m´ıra asymetrie (310)
τB =
(e x0,9 − x e) − (e x−x e0,1 ) . (e x0,9 − x e) + (e x−x e0,1 )
ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou identifik´atory statistick´ ych jednotek, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ u a hodnoty statistick´eho znaku jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Sub Skew() Dim n As Integer Dim i As Integer Dim x i() As Single Dim DownQ As Single Dim MedQ As Single Dim UpQ As Single Dim Skew As Single ’Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x i(1 To n) For i = 1 To n x i(i) = Cells(i + 1, 2) Next i DownQ = Application.Quartile(x i, 1) MedQ = Application.Quartile(x i, 2) UpQ = Application.Quartile(x i, 3) Skew = ((UpQ - MedQ) - (MedQ - DownQ)) / ((UpQ - MedQ) + (MedQ - DownQ)) MsgBox ("Skewness:"& vbTab & Skew) End Sub
4. Momentov´ a m´ıra ˇ sikmosti 4.1. Momentov´ a m´ıra ˇ sikmosti – Obecn´ a definice.
Definice 4.1. Necht’ xi je i-ta hodnota vybran´eho znaku, n oznaˇcuje poˇcet hodnot, x je aritmetick´ y pr˚ umˇer a sx je smˇerodatn´a odchylka vypoˇc´ıtan´a z hodnot vybran´eho znaku. Momentov´ a m´ıra ˇsikmosti je definovan´a jako
´ M´IRA ˇ 4. MOMENTOVA sIKMOSTI
(311)
0 mu,3 =
95
n 3 1 X (xi − x) s3x i=1 n
Pozn´ amka: Momentov´ a m´ıra ˇsikmosti je pod´ılem tˇret´ıho centr´aln´ıho momentu a souˇcinu druh´eho centr´ aln´ıho momentu a jeho odmocniny. x mx,3 . (312) √ 0 mu,3 = x mx,2 x mx,2 Pozn´ amka: Ve v´ ypoˇctu momentov´e M´ıry ˇsikmosti se nejv´ıce prosazuj´ı hodnoty velmi vzd´alen´e od pr˚ umˇeru. Vzd´ alenosti se umocˇ nuj´ı tˇret´ı mocninou, ˇc´ımˇz se konstruuj´ı krychle vzd´ alenost´ı a nejvˇetˇs´ı krychle tvoˇr´ı pr´avˇe nejvzd´alenˇejˇs´ı hodnoty. Souˇcasnˇe, tˇret´ı mocnina uchov´ av´ a informaci o znam´enku, ˇc´ımˇz dovoluje kladn´ ym a z´aporn´ ym krychl´ım spolu “bojovat”a vz´ajemnˇe se vyrovn´avat. Dˇelen´ım sumy poˇctem hodnot z´ısk´ av´ ame pr˚ umˇernou krychli vzd´alenost´ı i s informac´ı o jak´ y typ ˇsikmosti se jedn´ a (kladnˇe nebo z´ apornˇe zeˇsikmen´e rozdˇelen´ı). Tato informace vˇsak nen´ı bezrozmˇern´ a (je ve fyzick´ ych jednotk´ach) a je ji tak nutn´e porovnat s tˇret´ı mocninou smˇerodatn´e odchylky, kter´ a je takt´eˇz krychl´ı pr˚ umˇern´e vzd´alenosti. Tyto vztahy jsou j´ adrem momentov´e M´ıry ˇsikmosti. ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou identifik´atory statistick´ ych jednotek, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ u a hodnoty statistick´eho znaku jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Function Mean(n As Long, x i() As Single) Dim i As Integer 0 Vypocet prumeru: Suma = 0 For i = 1 To n Suma = Suma + x i(i) Next i Mean = Suma / n End Function Function Var(n As Long, x i() As Single) Dim i As Integer 0 Vypocet rozptylu: Average = Mean(n, x i) Suma = 0 For i = 1 To n Suma = Suma + (x i(i) - Average)^2 Next i Var = Suma / n End Function Sub Skew()
10. M´IRY ˇ sIKMOSTI
96
Dim n As Long Dim i As Integer Dim x i() As Single Dim Average As Single Dim Variance As Single Dim Std As Single Dim Skew As Single 0 Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x i(1 To n) For i = 1 To n x i(i) = Cells(i + 1, 2) Next i Average = Mean(n, x i) Variance = Var(n, x i) Std = Variance^(1 / 2) Suma = 0 For i = 1 To n Suma = Suma + (x i(i) - Average)^3 Next i Skew = Suma / (n * (Std^3)) MsgBox ("Skewness:"& vbTab & Skew) End Sub 4.2. V´ ypoˇ cet momentov´ e m´ıry ˇ sikmosti z rozdˇ elen´ı ˇ cetnost´ı obmˇ en znaku.
ta 4.1. Necht’ m´ame zad´ano rozdˇelen´ı ˇcetnost´ı vˇsech moˇzn´ych hodnot (variVe ant, obmˇen) znaku xj v jednorozmˇern´em souboru, kde j = 1, 2, . . . , k. Symbol k oznaˇcuje poˇcet obmˇen znaku xj a nj oznaˇcuje absolutn´ı a pj relativn´ı ˇcetnost t´eto j-t´e obmˇeny. Symbol x oznaˇcuje aritmetick´y pr˚ umˇer a sx je smˇerodatn´ a odchylka vybran´eho znaku, pak m˚ uˇzeme prost´y tvar momentov´e m´ıry asymetrie zapsat s pouˇzit´ım ˇcetnost´ı jako
(313)
0 mu,3
1 = 3 sx
n X i=1
3
(xi − x) = n
k P
nj (xj − x)
j=1
s3x
k P
k P
3
= nj
3
pj (xj − x)
j=1
s3x
.
j=1
D˚ ukaz. D˚ ukaz obsahuj´ıc´ı i tento pˇr´ıpad byl pops´an v d˚ ukazu vˇety 2.7 na stranˇe 44. ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou varianty statistick´eho znaku, kter´e znak m˚ uˇze nab´ yt, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ ua ˇcetnosti jednotliv´ ych obmˇen jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Function Mean(k As Long, n i() As Single, x i() As Single) Dim i As Integer
´ M´IRA ˇ 4. MOMENTOVA sIKMOSTI 0
Vypocet prumeru: Suma = 0 For i = 1 To k Suma = Suma + n i(i) * x i(i) Next i n = Application.sum(n i) Mean = Suma / n End Function Function Var(k As Long, n i() As Single, x i() As Single) Dim i As Integer 0 Vypocet rozptylu: Average = Mean(k, n i, x i) Suma = 0 For i = 1 To k Suma = Suma + n i(i) * (x i(i) - Average)^2 Next i n = Application.sum(n i) Var = Suma / n End Function Sub Skew() Dim k As Long Dim n As Long Dim i As Integer Dim x i() As Single Dim n i() As Single Dim Average As Single Dim Variance As Single Dim Std As Single Dim Skew As Single 0 Vypocet: k = Application.CountA(Columns(1)) - 1 ReDim x i(1 To k) ReDim n i(1 To k) For i = 1 To k x i(i) = Cells(i + 1, 1) n i(i) = Cells(i + 1, 2) Next i Average = Mean(k, n i, x i) Variance = Var(k, n i, x i) Std = Variance^(1 / 2) Suma = 0 For i = 1 To k Suma = Suma + n i(i) * (x i(i) - Average)^3 Next i n = Application.Sum(n i) Skew = Suma / (n * (Std^3))
97
10. M´IRY ˇ sIKMOSTI
98
MsgBox ("Skewness:"& vbTab & Skew) End Sub 4.3. V´ ypoˇ cet celkov´ eˇ sikmosti z charakteristik d´ılˇ c´ıch soubor˚ u.
ta 4.2. Necht’ m´ame hodnoty vˇsech statistick´ych jednotek znaku xh v jednoVe rozmˇern´em souboru, kde n je poˇcet statistick´ych jednotek v souboru a x je aritmetick´y pr˚ umˇer a sx je smˇerodatn´ a odchylka znaku. Z´ aroveˇ n, necht’ je tento soubor rozdˇelen do k skupin (podsoubor˚ u). Symbol nj oznaˇcuje absolutn´ı a pj relativn´ı ˇcetnost hodnot v j-t´e skupinˇe (podsouboru). Kaˇzd´y j-ty podsoubor je charakterizov´ an skupinov´ym pr˚ umˇerem xj , smˇerodatnou odchylkou sj a m´ırou ˇsikmosti αj . Pak pro celkovou m´ıru ˇsikmosti plat´ı (z´ akladn´ı tvar) 0 mu,3
=
n 3 1 X (xh − x) = s3x n h=1
(v´ ypoˇcet s pouˇzit´ım absolutn´ıch ˇcetnost´ı) k P
(314)
=
j=1
s3x
k P
nj αj s3j k P
+3
j=1
k P
s3x
nj
k P
nj (xj − x) s2j
j=1
+
3
nj (xj − x)
j=1
s3x
nj
j=1
k P
= nj
j=1
(v´ ypoˇcet s pouˇzit´ım relativn´ıch ˇcetnost´ı) k P
=
j=1
k P
pj αj s3j s3x
+3
j=1
k P
pj (xj − x) s2j +
s3x
3
pj (xj − x)
j=1
s3x
.
D˚ ukaz. Kdyˇz ni je ˇcetnost j-t´e d´ılˇc´ı skupiny, pro jej´ı ˇsikmost plat´ı nj P 3 (xij − xj ) (315) αj = i=1 , nj s3j αj nj s3j
(316)
=
nj X
3
(xij − xj ) .
i=1
Tak, jako pˇri d˚ ukazu rozkladu celkov´eho rozptylu, pro celkovou m´ıru ˇsikmosti plat´ı 0 mu,3 =
=
k nj 3 1 X X (xij − x) = s3x j=1 i=1 n
k nj 3 1 X X (xij − xj + xj − x) = s3x j=1 i=1 n
k nj 3 1 X X [(xij − xj ) + (xj − x)] = s3x j=1 i=1 n " k nj 3 2 1 X X (xij − xj ) + 3 (xij − xj ) (xj − x) + = 3 sx j=1 i=1 n
=
´ M´IRA ˇ 4. MOMENTOVA sIKMOSTI 2
3
+3 (xij − xj ) (xj − x) + (xj − x) n
99
# =
k nj 1 XXh 3 2 = 3 (xij − xj ) + 3 (xij − xj ) (xj − x) + nsx j=1 i=1 i 2 3 +3 (xij − xj ) (xj − x) + (xj − x) = " nj nj k X 1 X X 3 2 = 3 (xij − xj ) + 3 (xj − x) (xij − xj ) + nsx j=1 i=1 i=1 # nj nj X X 2 3 +3 (xj − x) (xij − xj ) + (xj − x) = i=1
(317)
i=1
" nj nj k X 1 X X 3 2 (xij − xj ) + = 3 (xij − xj ) + 3 (xj − x) nsx j=1 i=1 i=1 # nj X 2 3 (xij − xj ) + nj (xj − x) = +3 (xj − x) i=1
(Uplatn´ıme vˇetu 2.1,
nj X
(xij − xj ) = 0)
i=1
" nj nj k X 1 X X 3 2 (xij − xj ) + 3 (xj − x) = 3 (xij − xj ) + nsx j=1 i=1 i=1 i 2 3 +3 (xj − x) · 0 + nj (xj − x) = (Uplatn´ıme vztah nj X
2
(xij − xj ) = s2j nj )
i=1
" nj # k 1 X X 3 3 2 (xij − xj ) + 3 (xj − x) sj nj + 0 + nj (xj − x) = = 3 nsx j=1 i=1 " nj # k 1 X X 3 3 2 = 3 (xij − xj ) + 3 (xj − x) sj nj + nj (xj − x) . nsx j=1 i=1 (Dosad´ıme vztah z rovnice 316 (strana 98 )) =
k i 1 Xh 3 3 2 α n s + 3 (x − x) s n + n (x − x) = j j j j j j j j ns3x j=1 k P
=
j=1
s3x
k P
nj αj s3j k P j=1
+3 nj
j=1
k P
nj (xj − x) s2j s3x
k P j=1
+ nj
3
nj (xj − x)
j=1
s3x
k P j=1
. nj
10. M´IRY ˇ sIKMOSTI
100
5. Ostatn´ı m´ıry ˇ sikmosti 5.1. Pearsonova m´ıra ˇ sikmosti.
Definice 5.1. Necht’ x je aritmetick´ y pr˚ umˇer, x b je modus a sx je smˇerodatn´a odchylka hodnot znaku, pak je Pearsonova m´ıra ˇsikmosti definov´ana jako x−x b (318) τ0 = . sx ta 5.1. Necht’ x je aritmetick´y pr˚ umˇer, x b je modus, x e je medi´ an a sx je smˇerodatn´ a Ve odchylka hodnot znaku, pak se d´ a tak´e Pearsonova m´ıra ˇsikmosti vyj´ adˇrit jako empirick´y vztah x−x b e) 3 (x − x (319) τ0 = ≈ . sx sx D˚ ukaz. Tato vlastnost vych´az´ı z rovnosti ˇcitatele s empirick´ ymi vztahy 217 (strana 67). 5.2. M´ıra ˇ sikmosti zaloˇ zen´ a v´ yhradnˇ e na ˇ cetnostech.
Definice 5.2. y pr˚ umˇer, n je poˇcet hodnot vybran´eho znaku, nlow je poˇcet Necht’ x je aritmetick´ statistick´ ych jednotek s hodnotou znaku menˇs´ı neˇz je aritmetick´ y pr˚ umˇer a nhigh je poˇcet statistick´ ych jednotek s hodnotou znaku vˇetˇs´ı neˇz je aritmetick´ y pr˚ umˇer, (320)
nlow = |Nlow | ; Nlow = {xi |xi > x} ,
(321)
nhigh = |Nlow | ; Nhigh = {xi |xi < x} ,
pak se d´ a m´ıra ˇsikmosti vyj´ adˇrit v´ yhradnˇe s pomoc´ı ˇcetnost´ı jako nlow − nhigh (322) τ 00 = . n Pozn´ amka: Pˇri symetrick´em rozdˇelen´ı je poˇcet podpr˚ umˇern´ ych a nadpr˚ umˇern´ ych hodnot stejn´ y, pˇriˇcemˇz aritmetick´ y pr˚ umˇer je uprostˇred. Tud´ıˇz, nlow = nhigh . V pˇr´ıpadˇe, ˇze je rozdˇelen´ı zeˇsikmen´e kladnˇe, m´a polovina menˇs´ıch hodnot menˇs´ı variabilitu, neˇzli polovina vˇetˇs´ıch hodnot. Tento fakt spˆosob´ı, ˇze vzd´alenejˇs´ı hodnoty vych´ yl´ı aritmetick´ y pr˚ umˇer smˇerem doprava, ˇc´ımˇz se poˇcet podpr˚ umˇer´ ych hodnot oproti situaci v symetrick´em rozdˇelen´ı zvˇetˇs´ı, nlow > nhigh . V pˇr´ıpadˇe z´apornˇe zeˇsikmen´eho rozdˇelen´ı, kdy je pr˚ umˇer vych´ ylen smˇerem k menˇs´ım hodnot´am je situace s poˇctem hodnot opaˇcn´ a, nlow < nhigh .
KAPITOLA 11
M´ıry ˇ spiˇ catosti Definice 0.3. M´ıry ˇspiˇcatosti jsou koeficienty, kter´e kvantifikuj´ı koncentraci hodnot kolem stˇredn´ı hodnoty vybran´eho znaku. Pozn´ amka: Statistick´ a ˇspiˇcatost se v anglick´e literatuˇre oznaˇcuje jako “kurtosis”. 1. N´ aroky na m´ıry ˇ spiˇ catosti
Definice 1.1. M´ıra ˇspiˇcatosti m´ a obsahovat n´asleduj´ıc´ı vlastnosti: a) Zvˇetˇsuj´ıc´ı se v´ yskyt hodnot vzhledem na zmenˇsuj´ıc´ı se vzd´alenost ke stˇredn´ı hodnotˇe se odr´aˇz´ı ve vyˇsˇs´ı hodnotˇe ukazatele. b) Ukazatel je bezrozmˇern´e ˇc´ıslo. 2. Kvantilov´ e m´ıry ˇ spiˇ catosti 2.1. Kvantilov´ a m´ıra ˇ spiˇ catosti zaloˇ zen´ a na variaˇ cn´ım rozpˇ et´ı.
Definice 2.1. Necht’ xmin a xmax jsou minim´aln´ı a maxim´aln´ı hodnota znaku, x e0,25 a x e0,75 jsou doln´ı a horn´ı kvantil, pak je kvantilov´ a m´ıra ˇspiˇcatosti zaloˇzen´ a na celkov´em rozpˇet´ı definovan´ a jako xmax − xmin . (323) κ= x e0,75 − x e0,25 Pozn´ amka: ˇ ım menˇs´ı je rozpˇet´ı mezi horn´ım a doln´ım kvartilem (ˇc´ım bl´ıˇze jsou hodnoty C´ kvantil˚ u), t´ ym vˇetˇs´ı je koncentrace hodnot kolem stˇredn´ı hodnoty a souˇcasnˇe vˇetˇs´ı je hodnota ˇspiˇcatosti. Pozn´ amka: Omezen´ı t´eto m´ıry spoˇc´ıv´ a v moˇzn´e nahodilosti, ojedinˇelosti a extr´emnosti krajn´ıch hodnot. ˇ sen´ı ve VBA: Reˇ Sub Kurt() Dim n As Integer Dim i As Integer Dim x i() As Single Dim x Min As Single Dim DownQ As Single Dim UpQ As Single 101
ˇ 11. M´IRY ˇ sPICATOSTI
102
Dim x Max As Single Dim Kurt As Single 0 Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x i(1 To n) For i = 1 To n x i(i) = Cells(i + 1, 2) Next i x Min = Application.Min(x i) DownQ = Application.Quartile(x i, 1) UpQ = Application.Quartile(x i, 3) x Max = Application.Max(x i) Kurt = (x Max - x Min) / (UpQ - DownQ) MsgBox ("Kurtosis:"& vbTab & Kurt) End Sub 2.2. Jin´ e kvantilov´ e m´ıry ˇ spiˇ catosti.
Definice 2.2. Necht’ xi je zvolen´ y (i × 100)-procentn´ı kvantil, x e0,25 a x e0,75 jsou doln´ı a horn´ı kvantil, pak se d´ a m´ıra ˇspiˇcatosti definovat jako (324)
κ=
x ei − x e1−i . x e0,75 − x e0,25
Pozn´ amka: Nejzn´ amˇejˇs´ı tvar t´eto m´ıry vyuˇz´ıv´a rozpˇet´ı percentil˚ u (325)
κ=
x e0,99 − x e0,01 . x e0,75 − x e0,25
Pozn´ amka: Nejvˇetˇs´ı nev´ yhodou kvantilov´ ych mˇer je neschopnost vypoˇr´adat se situac´ı, kdyˇz je doln´ı kvartil stejn´ a hodnota jako horn´ı kvartil. 3. Momentov´ a m´ıra ˇ spiˇ catosti
Definice 3.1. Necht’ xi je i-ta hodnota vybran´eho znaku, n oznaˇcuje poˇcet hodnot, x je aritmetick´ y pr˚ umˇer a sx je smˇerodatn´a odchylka vypoˇc´ıtan´a z hodnot vybran´eho znaku. Momentov´ a m´ıra ˇspiˇcatosti je definovan´a jako (326)
0 mu,4 =
n 4 1 X (xi − x) s4x i=1 n
Pozn´ amka: Momentov´ a m´ıra ˇspiˇcatosti je pod´ılem ˇctvrt´eho centr´aln´ıho momentu a druh´e mocniny druh´eho centr´ aln´ıho momentu x mx,4 (327) 0 mu,4 = 2. (x mx,2 )
´ M´IRA ˇ ˇ 3. MOMENTOVA sPICATOSTI
103
Pozn´ amka: Podobnˇe jako v pˇr´ıpadˇe ˇsikmosti, jsou v t´eto m´ıre nejvzd´alenˇejˇs´ı hodnoty od pr˚ umˇeru umocˇ nov´ any nejv´ıce (mocninou ˇctvrt´eho stupnˇe), ˇc´ımˇz zvˇetˇsuj´ı hodnotu ukazatele ˇspiˇcatosti. Na rozd´ıl od ˇsikmosti, v´ ypoˇcet nerozliˇsuje mezi kladn´ ymi a z´aporn´ ymi vzd´ alenostmi. Jelikoˇz je stupeˇ n mocnˇen´ı sud´e ˇc´ıslo bude i umocnˇen´a vzd´alenost pokaˇzd´e kladn´e ˇc´ıslo. Tento ukazatel stoj´ı na logice, ve kter´e jsou ˇspiˇcat´a rozdˇelen´ı ˇ ımˇz ˇspiˇcatˇejˇs´ı je rozdˇelen´ı, t´ charakterizov´ any “tlust´ ymi”chvosty rozdˇelen´ı. C´ ym vˇetˇs´ı je ˇcetnost krajn´ıch, nebo v´ıce vzd´alen´ ych hodnot (t´ ym prot´ahlejˇs´ı je rozdˇelen´ı). Toto tvrzen´ı ale nen´ı univerz´alnˇe platn´e, jelikoˇz existuj´ı i rozdˇelen´ı, kter´e tlust´e konce nemaj´ı a pˇrece je m˚ uˇzeme hodnotit jako velmi ˇspiˇcat´a. Tuto v´ ypoˇcetn´ı ˇcrtu je nutn´e vz´ıt v potaz. ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou identifik´atory statistick´ ych jednotek, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ u a hodnoty statistick´eho znaku jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Function Mean(n As Long, x i() As Single) Dim i As Integer 0 Vypocet prumeru: Suma = 0 For i = 1 To n Suma = Suma + x i(i) Next i Mean = Suma / n End Function Function Var(n As Long, x i() As Single) Dim i As Integer 0 Vypocet rozptylu: Average = Mean(n, x i) Suma = 0 For i = 1 To n Suma = Suma + (x i(i) - Average)^2 Next i Var = Suma / n End Function Sub Skew() Dim n As Long Dim i As Integer Dim x i() As Single Dim Average As Single Dim Variance As Single Dim Std As Single Dim Kurt As Single 0 Vypocet: n = Application.CountA(Columns(2)) - 1
ˇ 11. M´IRY ˇ sPICATOSTI
104
ReDim x i(1 To n) For i = 1 To n x i(i) = Cells(i + 1, 2) Next i Average = Mean(n, x i) Variance = Var(n, x i) Std = Variance^(1 / 2) Suma = 0 For i = 1 To n Suma = Suma + (x i(i) - Average)^4 Kurt = Suma / (n * (Std^4)) MsgBox ("Kurtosis:"& vbTab & Kurt) End Sub 3.1. V´ ypoˇ cet momentov´ e M´ıry ˇ spiˇ catosti z rozdˇ elen´ı ˇ cetnost´ı obmˇ en znaku.
ta 3.1. Necht’ m´ame zad´ano rozdˇelen´ı ˇcetnost´ı vˇsech moˇzn´ych hodnot (variVe ant, obmˇen) znaku xj v jednorozmˇern´em souboru, kde j = oznaˇcuje poˇcet obmˇen znaku xj a nj oznaˇcuje absolutn´ı a pj umˇer a sx je j-t´e obmˇeny. Symbol x oznaˇcuje aritmetick´y pr˚ vybran´eho znaku, pak m˚ uˇzeme prost´y tvar momentov´e m´ıry pouˇzit´ım ˇcetnost´ı jako
(328)
0 mu,3
n 4 1 X (xi − x) = 4 = sx i=1 n
k P
nj (xj − x)
j=1
s4x
k P
k P
4
= nj
1, 2, . . . , k. Symbol k relativn´ı ˇcetnost t´eto smˇerodatn´ a odchylka koncentrace zapsat s 4
pj (xj − x)
j=1
s4x
.
j=1
D˚ ukaz. D˚ ukaz obsahuj´ıc´ı i tento pˇr´ıpad byl pops´an v d˚ ukazu vˇety 2.7 na stranˇe 44. ˇ sen´ı ve VBA: Reˇ V pˇr´ıpadˇe, ˇze m´ ame data v Excelu ve tvaru, kde prvn´ı sloupec jsou varianty statistick´eho znaku, kter´e znak m˚ uˇze nab´ yt, prvn´ı ˇr´adek je rezervov´an n´azv˚ um sloupc˚ ua ˇcetnosti jednotliv´ ych obmˇen jsou ve druh´em sloupci poˇc´ınaje druh´ ym ˇr´adkem, pak program m˚ uˇze vypadat n´ asledovnˇe Function Mean(k As Long, n i() As Single, x i() As Single) Dim i As Integer 0 Vypocet prumeru: Suma = 0 For i = 1 To k Suma = Suma + n i(i) * x i(i) Next i n = Application.sum(n i) Mean = Suma / n End Function Function Var(k As Long, n i() As Single, x i() As Single)
´ M´IRA ˇ ˇ 3. MOMENTOVA sPICATOSTI
105
Dim i As Integer 0 Vypocet rozptylu: Average = Mean(k, n i, x i) Suma = 0 For i = 1 To k Suma = Suma + n i(i) * (x i(i) - Average)^2 Next i n = Application.sum(n i) Var = Suma / n End Function Sub Skew() Dim k As Long Dim n As Long Dim i As Integer Dim x i() As Single Dim n i() As Single Dim Average As Single Dim Variance As Single Dim Std As Single Dim Kurt As Single 0 Vypocet: k = Application.CountA(Columns(1)) - 1 ReDim x i(1 To k) ReDim n i(1 To k) For i = 1 To k x i(i) = Cells(i + 1, 1) n i(i) = Cells(i + 1, 2) Next i Average = Mean(k, n i, x i) Variance = Var(k, n i, x i) Std = Variance^(1 / 2) Suma = 0 For i = 1 To k Suma = Suma + n i(i) * (x i(i) - Average)^3 Next i n = Application.Sum(n i) Kurt = Suma / (n * (Std^3)) MsgBox ("Kurtosis:"& vbTab & Kurt) End Sub 3.2. V´ ypoˇ cet celkov´ eˇ spiˇ catosti z charakteristik d´ılˇ c´ıch soubor˚ u.
ta 3.2. Necht’ m´ame hodnoty vˇsech statistick´ych jednotek znaku xh v jednoVe rozmˇern´em souboru, kde n je poˇcet statistick´ych jednotek v souboru a x je aritmetick´y pr˚ umˇer a sx je smˇerodatn´ a odchylka znaku. Z´ aroveˇ n, necht’ je tento soubor rozdˇelen do k skupin (podsoubor˚ u). Symbol nj oznaˇcuje absolutn´ı a pj relativn´ı ˇcetnost hodnot v j-t´e skupinˇe (podsouboru). Kaˇzd´y j-ty podsoubor je charakterizov´ an skupinov´ym pr˚ umˇerem xj , smˇerodatnou odchylkou sj , m´ırou ˇsikmosti αj a
ˇ 11. M´IRY ˇ sPICATOSTI
106
m´ırou ˇspiˇcatosti βj . Pak pro celkovou m´ıru ˇspiˇcatosti plat´ı (329) (z´ akladn´ı tvar) 0 mu,4
=
n 4 1 X (xh − x) = s4x n h=1
(v´ ypoˇcet s pouˇzit´ım absolutn´ıch ˇcetnost´ı) k P
=
j=1
s4x
k P
nj βj s4j k P
+4
j=1
k P
s4x
nj
k P
nj (xj − x) αj s3j
j=1
+6
k P
2
j=1
nj (xj − x) s2j k P
s4x
nj
j=1
+
4
nj (xj − x)
j=1
s4x
nj
j=1
k P
= nj
j=1
(v´ ypoˇcet s pouˇzit´ım relativn´ıch ˇcetnost´ı) k P
=
j=1
k P
pj βj s4j s4x
+4
j=1
k P
pj (xj − x) αj s3j
j=1
+6
s4x
k P
2
pj (xj − x) s2j +
s4x
pj (xj − x)
j=1
s4x
4
.
D˚ ukaz. Kdyˇz ni je ˇcetnost j-t´e d´ılˇc´ı skupiny, pro jej´ı ˇspiˇcatost plat´ı nj P
(xij − xj )
4
i=1
(330)
βj =
(331)
βj nj s4j =
,
nj s4j nj X
4
(xij − xj ) .
i=1
Tak, jako pˇri d˚ ukazu rozkladu celkov´eho rozptylu, pro celkovou m´ıru ˇspiˇcatosti plat´ı 0 mu,4
=
=
k nj 4 1 X X (xij − x) = s4x j=1 i=1 n
k nj 4 1 X X (xij − xj + xj − x) = s4x j=1 i=1 n
k nj 4 1 X X [(xij − xj ) + (xj − x)] = s4x j=1 i=1 n " k nj 4 3 1 X X (xij − xj ) + 4 (xij − xj ) (xj − x) + = 4 sx j=1 i=1 n
=
2
2
3
4
+6 (xij − xj ) (xj − x) + 4 (xij − xj ) (xj − x) + (xj − x) n
# =
k nj 1 XXh 4 3 (xij − xj ) + 4 (xij − xj ) (xj − x) + ns4x j=1 i=1 2
2
3
4
6 (xij − xj ) (xj − x) + 4 (xij − xj ) (xj − x) + (xj − x)
i
=
´ M´IRA ˇ ˇ 3. MOMENTOVA sPICATOSTI
107
" nj nj k X 1 X X 4 3 = 4 (xij − xj ) + (xij − xj ) + 4 (xj − x) nsx j=1 i=1 i=1 2
+6 (xj − x)
nj X
2
3
(xij − xj ) + 4 (xj − x)
i=1
nj X
nj X
(xij − xj ) +
i=1
# 4
(xj − x)
=
i=1
" nj nj k X 1 X X 4 3 = 4 (xij − xj ) + 4 (xj − x) (xij − xj ) + nsx j=1 i=1 i=1 2
+6 (xj − x)
nj X
2
3
(xij − xj ) + 4 (xj − x)
i=1
(Uplatn´ıme vˇetu
nj X
# (xij − xj ) + nj (xj − x)
4
=
i=1 nj X
(xij − xj ) = 0)
i=1
" nj nj k X 1 X X 4 3 = 4 (xij − xj ) + 4 (xj − x) (xij − xj ) + nsx j=1 i=1 i=1 (332) 2
+6 (xj − x)
nj X
# 2
3
4
(xij − xj ) + 4 (xj − x) · 0 + nj (xj − x)
=
i=1
(Uplatn´ıme vztah, kter´ y byl vyuˇzit v d˚ ukazu vˇety 263 (strana 80) o rozkladu rozptylu, nj X
2
(xij − xj ) = s2j nj )
i=1
" nj nj k X 1 X X 4 3 = 4 (xij − xj ) + 4 (xj − x) (xij − xj ) + nsx j=1 i=1 i=1 i 2 2 4 +6 (xj − x) sj nj + 0 + nj (xj − x) = (Dosad´ıme vztah z rovnice 316,
nj X
3
(xij − xj ) = αj nj s3j )
i=1
" nj k 1 X X 4 = 4 (xij − xj ) + 4 (xj − x) αj nj s3j + nsx j=1 i=1 i 2 4 6 (xj − x) s2j nj + nj (xj − x) = (Dosad´ıme vztah z rovnice 331,
nj X
4
(xij − xj ) = βj nj s4j )
i=1 k i 1 Xh 2 4 = 4 βj nj s4j + 4 (xj − x) αj nj s3j + 6 (xj − x) s2j nj + nj (xj − x) = nsx j=1
ˇ 11. M´IRY ˇ sPICATOSTI
108 k P
=
j=1
s4x
k P
nj βj s4j k P j=1
+4 nj
j=1
k P
nj (xj − x) αj s3j s4x
k P
+6
j=1
nj
j=1
k P
2
nj (xj − x) s2j s4x
k P
+ nj
j=1
nj (xj − x)
j=1
s4x
k P
4
. nj
j=1
4. Ostatn´ı m´ıry ˇ spiˇ catosti 4.1. Koeficient ˇ spiˇ catosti – Exces.
Definice 4.1. Jelikoˇz momentov´ a m´ıra ˇspiˇcatosti nab´ yv´a pˇri norm´aln´ım rozdˇelen´ı hodnoty rovn´e ˇc´ıslu tˇri, ˇcasto se pouˇz´ıv´ a koeficient excesu ve tvaru n 4 1 X (xi − x) x mx,4 − 3 = − 3. (333) γ2 = 2 s4x i=1 n (x mx,2 ) Pozn´ amka: Tento tvar je rozd´ılem hodnoty ˇspiˇcatosti zkouman´eho rozdˇelen´ı a hodnoty ˇspiˇcatosti norm´ aln´ıho rozdˇelen´ı. V pˇr´ıpadˇe rozdˇelen´ı, kter´e je bl´ızk´e sv´ ym tvarem norm´aln´ımu rozdˇelen´ı, se tento upraven´ y koeficient ˇspiˇcatosti hodnotou pohybuje kolem nuly. 4.2. Lindebergova m´ıra excesu.
Definice 4.2. Necht’ n je poˇcet statistick´ ych jednotek, x je aritmetick´ y pr˚ umˇer zvolen´eho znaku, sx je jeho smˇerodatn´ a odchylka a nbetween je poˇcet hodnot, kter´e jsou v rozmez´ı plus a m´ınus polovina smˇerodatn´e odchylky od aritmetick´eho pr˚ umˇeru, n sx sx o (334) nbtwn = |Nbtwn | ; Nbtwn = xi | x − ≤ xi ≤ x + . 2 2 pak je Lindenbergova m´ıra definov´ana jako nbtwn (335) γ20 = 100 − 38, 29. n
ˇ ast 4 C´
Ordin´ aln´ı promˇ enn´ a
KAPITOLA 12
M´ıry polohy Definice 0.3. Necht’ m´ ame rozdˇelen´ı absolutn´ıch a relativn´ıch ˇcetnost´ı u ordin´aln´ı promˇenn´e x nab´ yvaj´ıc´ı k hodnot (kategori´ı) uspoˇr´adan´ ych podle d˚ uleˇzitosti nebo intenzity. Uspoˇr´ adan´e kategorie oznaˇc´ıme xi , kde pomocn´ y poˇradov´ y index i charakterizuje i-tou hodnotu (kategorii) v ˇrebˇr´ıˇcku nebo podle intenzity, ni definuje absolutn´ı ˇcetnost a pi definuje relativn´ı ˇcetnost i-t´e hodnoty (kategorie), Ni definuje absolutn´ı kumulativn´ı ˇcetnost a Pi definuje relativn´ı kumulativn´ı ˇcetnost i-t´e hodnoty ´ (kategorie). Uroveˇ n polohy u ordin´aln´ı promˇenn´e se nejˇcastˇeji definuje jako: a) mod´ aln´ı kategorie – xM o , b) medi´ anov´ a kategorie – xM e .
Definice 0.4. Mod´ aln´ı kategorie, xM o , se definuje jako kategorie s nejvˇetˇs´ı relativn´ı a absolutn´ı ˇcetnost´ı a je d´ ana vztahem (336)
xM o = argmaxi (ni ) .
Definice 0.5. Mod´ aln´ı absolutn´ı a relativn´ı ˇcetnost se definuj´ı cez mod´aln´ı kategorii xM o vztahy (337)
nM o = maxi (ni ) ,
a (338)
pM o = maxi (pi ) .
Definice 0.6. Rozdˇelen´ı ˇcetnost´ı oznaˇcujeme jako a) unimod´ aln´ı, kdyˇz obsahuje jenom jedinou hodnotu (kategorii), kter´a dosahuje nejvˇetˇs´ı ˇcetnosti, b) bimod´ aln´ı, kdyˇz obsahuje dvˇe hodnoty (kategorie), kter´e dosahuj´ı nejvˇetˇs´ı ˇcetnosti stejn´e u ´rovnˇe, c) multimod´ aln´ı, kdyˇz obsahuje v´ıce neˇz dvˇe hodnoty (kategorie), kter´e dosahuj´ı nejvˇetˇs´ı ˇcetnosti stejn´e u ´rovnˇe, d) rovnomˇern´e, kdyˇz vˇsechny hodnoty (kategorie) dosahuj´ı stejn´e ˇcetnosti. Definice 0.7. M´ a-li hodnota (kategorie) relativn´ı ˇcetnost vˇetˇs´ı neˇz 50%, tuto kategorii a jej´ı absolutn´ı a relativn´ı ˇcetnost oznaˇcujeme jako majoritn´ı. Definice 0.8. Medi´ anov´ a kategorie, xM e , je kategorie, pro kterou kumulativn´ı ˇcetnost plat´ı 110
12. M´IRY POLOHY
(339)
∃!xM e , 1 ≤ M e ≤ k : (PM e ≥ 0, 5) ∧ [(PM e−1 < 0, 5) ∨ (PM e = P1 )] .
111
KAPITOLA 13
M´ıry variability Definice 0.9. Ordin´ aln´ı promˇenn´ a dosahuje minim´aln´ı variabilitu v situaci, kdyˇz vˇsechny statistick´e jednotky nab´ yvaj´ı stejn´e hodnoty (kategorie).
Definice 0.10. Ordin´ aln´ı promˇenn´ a dosahuje maxim´aln´ı variabilitu v situaci, kdyˇz polovina statistick´ ych jednotek nab´ yv´ a hodnotu (kategorii) x1 a druh´a polovina kategorii xk . 1. Variaˇ cn´ı rozpˇ et´ı
Definice 1.1. Necht’ k je poˇcet hodnot (kategori´ı) u ordin´aln´ı promˇenn´e, pak R = k − 1.
(340)
2. Mezikvartilov´ e rozpˇ et´ı
Definice 2.1. Necht’ Pi je kumulativn´ı relativn´ı ˇcetnost pro i−tou kategorii ordin´aln´ı promˇenn´e, x e25 je poˇradov´e ˇc´ıslo kategorie, pro kterou kumulativn´ı ˇcetnost plat´ı (341)
∃!e x25 : (Pxe25 ≥ 0, 25) ∧ [(PM e−1 < 0, 25) ∨ (Pxe25 = P1 )] ,
ax e75 je poˇradov´e ˇc´ıslo kategorie, pro kterou kumulativn´ı ˇcetnost plat´ı (342)
∃!e x75 : (Pxe75 ≥ 0, 75) ∧ [(PM e−1 < 0, 75) ∨ (Pxe75 = P1 )] ,
pak variaˇcn´ı rozpˇet´ı je definov´ano jako RQ = x e75 − x e25 .
(343)
Pozn´ amka: Mezikvartilov´e rozpˇet´ı je tedy rozd´ıl poˇradov´ ych ˇc´ısel kategori´ı, kter´e jsou horn´ım a doln´ım kvartilem. 3. Ordin´ aln´ı rozptyl
Definice 3.1. Necht’ k je poˇcet hodnot (kategori´ı) u ordin´aln´ı promˇenn´e, Pi definuje relativn´ı i P 0 kumulativn´ı ˇcetnost, pˇriˇcemˇz Pi = pj a Pi inverzn´ı kumulativn´ı ˇcetnost i-t´e j=1
0
hodnoty (kategorie), pro kterou plat´ı Pi = 1 − Pi−1 , kde Pi−1 = (344)
Dorvar =
k h X
i 0 0 Pi (1 − Pi ) + Pi 1 − Pi .
i=1 112
i−1 P j=1
pj pak
´ ´I ROZPTYL 3. ORDINALN
113
Pozn´ amka: ˇ eji se setk´ Castˇ ame s v´ ypoˇcetn´ım tvarem ordin´aln´ıho rozptylu, kter´ y uv´ad´ıme ve vˇetˇe 3.1 (strana 114). Pro u ´ˇcely d˚ ukazu ekvivalence v´ ypoˇcetn´ıho tvaru se z´akladn´ı definic´ı si uvedeme dvˇe lemmy, kter´e n´am pom˚ uˇzou v pochopen´ı tohoto odvozen´ı.
ˇ sen´ı ve VBA: Reˇ Sub Dorvar() Dim n As Integer Dim k As Integer Dim i As Integer Dim p i() As Single Dim cp i() As Single Dim ccp i() As Single Dim Dorvar As Single Dim Suma0 As Single Dim Suma1 As Single 0 Vypocet: k = Application.CountA(Columns(2)) - 1 n = Application.Sum(Columns(2)) ReDim p i(1 To k) ReDim cp i(1 To k) ReDim ccp i(1 To k) Suma0 = 0 Suma1 = 0 For i = 1 To k p i(i) = Cells(i + 1, 2) / n Suma0 = Suma0 + p i(i) cp i(i) = Suma0 ccp i(i) = 1 - Suma0 + p i(i) Suma1 = Suma1 + cp i(i) * (1 - cp i(i)) + ccp i(i) * (1 - ccp i(i)) Next i Dorvar = Suma1 MsgBox ("Dorvar:"& vbTab & Dorvar) End Sub
Lemma 3.1. Kdyˇz k je poˇcet hodnot (kategori´ı) u ordin´aln´ı promˇenn´e, Pi definuje relativn´ı kumulativn´ı ˇcetnost i-t´e hodnoty (kategorie), pˇriˇcemˇz Pi =
j P j=1
(345)
k X i=1
[Pi (1 − Pi )] =
k−1 X i=1
[(1 − Pi ) (Pi )]
pi , pak plat´ı
13. M´IRY VARIABILITY
114
D˚ ukaz. Kdyˇz Pk =
k P
pj = 1, pak
j=1 k X
[Pi (1 − Pi )] =
i=1
(346)
=
"k−1 X
# Pi (1 − Pi ) + Pk (1 − Pk ) =
i=1
"k−1 X
# Pi (1 − Pi ) + 1 (1 − 1) =
"k−1 X
i=1
=
k−1 X
# Pi (1 − Pi ) + 0 =
i=1
[Pi (1 − Pi )] .
i=1
Lemma 3.2. Kdyˇz k je poˇcet hodnot (kategori´ı) u ordin´aln´ı promˇenn´e, Pi definuje relativn´ı kumulativn´ı ˇcetnost j-t´e hodnoty (kategorie), pˇriˇcemˇz Pi =
j P
pi , plat´ı
j=1 k X
(347)
Pi−1 =
i=1
k−1 X
Pi .
i=1
D˚ ukaz. k X
Pi−1 (1 − Pi−1 ) =
i=1
=
k X
k k X X 2 2 Pi−1 − Pi−1 = Pi−1 − Pi−1 =
i=1
i=1
i=1
2 2 2 = (P1−1 + P2−1 . . . + Pk−1 ) − P1−1 + P2−1 . . . + Pk−1 = 2 = (P0 + P1 . . . + Pk−1 ) − P02 + P12 . . . + Pk−1 = 0 1 k−1 X X X = pj + pj . . . + pj j=1
(348)
j=1
j=1
2 2 2 0 1 k−1 X X X − pj + pj . . . + pj = j=1
j=1
j=1
2 = (0 + P1 . . . + Pk−1 ) − 0 + P12 . . . + Pk−1 = 2 2 = (P1 . . . + Pk−1 ) − P1 . . . + Pk−1 = =
k−1 X i=1
=
k−1 X
Pi −
k−1 X
Pi2 =
i=1
k−1 X
Pi − Pi2 =
i=1
[Pi (1 − Pi )] .
i=1
´ ´I ROZPTYL 3. ORDINALN
115
ta 3.1. Kdyˇz k je poˇcet hodnot (kategori´ı) u ordin´aln´ı promˇenn´e, Pi definuje Ve relativn´ı kumulativn´ı ˇcetnost, Pi =
i P i=1
0
pi a Pi je inverzn´ı kumulativn´ı ˇcetnost i-t´e 0
hodnoty (kategorie), kterou definujeme vztahem Pi = 1 − Pi−1 , pak plat´ı
(349)
k h X
k−1 i X 0 0 =2 [Pi (1 − Pi )] . Pi (1 − Pi ) + Pi 1 − Pi i=1
i=1
D˚ ukaz. Kdyˇz plat´ı pˇredchoz´ı lemmy, pak k h i X 0 0 = Pi (1 − Pi ) + Pi 1 − Pi i=1
=
k X
[Pi (1 − Pi )] +
i=1
=
k X
i=1
[Pi (1 − Pi )] +
i=1
(350) =
k X
k−1 X
[Pi (1 − Pi )] +
[(1 − Pi−1 ) (1 − 1 + Pi−1 )] =
k X
[(1 − Pi−1 ) Pi−1 ] =
i=1
[Pi (1 − Pi )] +
k−1 X
k−1 X
[Pi (1 − Pi )] =
i=1
i=1
=2
k X i=1
i=1
=
k h i X 0 0 P i 1 − Pi =
[Pi (1 − Pi )] .
i=1
Pozn´ amka: Ordin´ aln´ı rozptyl nen´ı z hora omezen fixn´ı hodnotou ale pod´ılem ˇ sen´ı ve VBA: Reˇ Sub Dorvar() Dim n As Integer Dim k As Integer Dim i As Integer Dim p i() As Single Dim cp i() As Single Dim Dorvar As Single Dim Suma0 As Single Dim Suma1 As Single 0 Vypocet: k = Application.CountA(Columns(2)) - 1 n = Application.Sum(Columns(2)) ReDim p i(1 To k) ReDim cp i(1 To k) ReDim ccp i(1 To k) Suma0 = 0
k−1 2 .
13. M´IRY VARIABILITY
116
Suma1 = 0 For i = 1 To k p i(i) = Cells(i + 1, 2) / n Suma0 = Suma0 + p i(i) cp i(i) = Suma0 Suma1 = Suma1 + cp i(i) * (1 - cp i(i)) Next i Dorvar = 2 * Suma1 MsgBox ("Dorvar:"& vbTab & Dorvar) End Sub
ta 3.2. Kdyˇz k je poˇcet kategori´ı, relativn´ı ˇcetnost p1 = 0, 5 a pk = 0, 5 pak, Ve (351)
2
k−1 X
[Pi (1 − Pi )] =
i=1
k−1 . 2
D˚ ukaz. Kdyˇz plat´ı pˇredchoz´ı lemmy, pak 2
k−1 X
[Pi (1 − Pi )] =
i=1
(352)
=2 [P1 (1 − P1 )] + P2 (1 − P2 ) + . . . + Pk−1 (1 − Pk−1 )] = 1 1 1 1 1 1 =2 1− + 1− + ... + 1− = 2 2 2 2 2 2 k−1 1 11 1 = . 1− = 2 (k − 1) =2 (k − 1) 2 2 22 2 4. Normalizovan´ y ordin´ aln´ı rozptyl
Definice 4.1. Necht’ k je poˇcet hodnot (kategori´ı) u ordin´aln´ı promˇenn´e, Pi definuje relativn´ı i P kumulativn´ı ˇcetnost, pˇriˇcemˇz Pi = pj , pak j=1
(353)
N ormDorvar = 2
k−1 X
Pi (1 − Pi )
i=1
k−1 2
=4
k−1 X i=1
Pi (1 − Pi ) . k−1
Pozn´ amka: Normalizovan´y ordin´ aln´ı rozptyl je standardizovan´ y v mez´ıch nula a jedna d´ıky pod´ılu hodnoty ordin´ aln´ıho rozptylu a jeho maxim´aln´ı hodnoty.
Lemma 4.1. Necht’ k je poˇcet hodnot (kategori´ı) u ordin´aln´ı promˇenn´e a statistick´e jednotky jsou rozdˇeleny do l skupin. Relativn´ı ˇcetnost statistick´ych jednotek v j-t´e skupinˇe oznaˇc´ıme pj , Skupinovou kumulativn´ı relativn´ı ˇcetnost statistick´ych jednotek s i-tou hodnotou (kategori´ı) znaku v j-t´e skupinˇe oznaˇc´ıme Pi/j , pak pro celkovou kumulativn´ı relativn´ı ˇcetnost jednotek s i-tou hodnotou (kategori´ı) znaku
´ ORDINALN ´ ´I ROZPTYL 4. NORMALIZOVANY
117
ve vˇsech skupin´ ach plat´ı l X
Pi =
(354)
pj Pi/j
j=1
D˚ ukaz. V´ıme, ˇze nij je absolutn´ı ˇcetnost statistick´ ych jednotek s i-tou hodnotou znaku v j-t´e skupinˇe. Pro relativn´ı ˇcetnost v j-t´e skupinˇe statistick´ ych jednotek, pj plat´ı, ˇze k P
pj =
(355)
nij
i=1 k P l P
. nij
i=1 j=1
Souˇcasnˇe pro skupinovou kumulativn´ı relativn´ı ˇcetnost statistick´ ych jednotek s itou hodnotou znaku v j-t´e skupinˇe Pi/j plat´ı i P
Pi/j =
(356)
nij
m=1 k P
.
nij
i=1
Rovnˇeˇz pro celkovou kumulativn´ı relativn´ı ˇcetnost jednotek s i-tou hodnotou znaku ve vˇsech skupin´ ach, Pi , plat´ı, ˇze l i P P
(357)
Pi =
nij
j=1 m=1 k P l P
nij
i=1 j=1
Kumulativn´ı ˇcetnost Pi se tak d´a rozepsat jako l i P P
Pi =
nij
j=1 m=1 k P l P
=
j=1
nij
i=1 j=1
(358)
=
l X
i P
nij
m=1 k P l P
nij
nij l X m=1 = · 1 = k l P P j=1 nij
i=1 j=1
i P
k P
i=1 j=1
i=1
i P
i=1 j=1
k P
i P
i=1 j=1
i=1
nij X nij nij nij X l l l X m=1 i=1 i=1 m=1 = = pj Pi/j . k l k k P l k P P P P j=1 P j=1 j=1 nij nij nij nij
ta 4.1. Necht’ k je poˇcet hodnot (kategori´ı) u ordin´aln´ı promˇenn´e a statistick´e Ve jednotky jsou rozdˇeleny do l skupin. Relativn´ı ˇcetnost statistick´ych jednotek v j-t´e skupinˇe oznaˇc´ıme pj , Skupinovou kumulativn´ı relativn´ı ˇcetnost statistick´ych jednotek s i-tou hodnotou (kategori´ı) znaku v j-t´e skupinˇe oznaˇc´ıme Pi/j , a celkovou kumulativn´ı relativn´ı ˇcetnost jednotek s i-tou hodnotou (kategori´ı) znaku ve vˇsech skupin´ ach Pi . Pro normalizovan´y ordin´ aln´ı rozptyl plat´ı rozklad
13. M´IRY VARIABILITY
118
(359) 4
k−1 X i=1
h 2 i l k−1 l k−1 p P − P X X X X j i i/j p P 1 − P [Pi (1 − Pi )] j i/j i/j =4 +4 . k−1 k − 1 k−1 j=1 i=1 j=1 i=1
Pozn´ amka: Tento ponˇekud neintuitivn´ı z´ apis ˇr´ık´a, ˇze v pˇr´ıpadˇe existence nˇekolika podskupin statistick´ ych jednotek, je moˇzn´e rozloˇzit normalizovan´ y ordin´aln´ı rozptyl na dvˇe sloˇzky – vnitroskupinovou a meziskupinovou variabilitu – tak, jako v pˇr´ıpadˇe kvantitativn´ı promˇenn´e. D˚ ukaz t´eto vlastnosti struˇcnˇe nast´ınil Grilli a Rampichini [5]. N ormDorvarwithin
(360)
(361)
l k−1 X X pj Pi/j 1 − Pi/j , =4 k−1 j=1 i=1
N ormDorvarbetween = 4
h 2 i l k−1 X X pj Pi/j − Pi j=1 i=1
k−1
.
Odvozen´ı bude pˇredmˇetem n´ asleduj´ıc´ıho d˚ ukazu. D˚ ukaz. Kdyˇz v´ıme, ˇze Pi = pj Pi/j , pak k−1 X
k−1 4 X [Pi (1 − Pi )] = [Pi (1 − Pi )] = k−1 k − 1 i=1 i=1 l k−1 k−1 l 4 XX 4 X X pj Pi/j (1 − Pi ) = pj Pi/j (1 − Pi ) = = k − 1 i=1 k − 1 i=1 j=1 j=1
4
=
l k−1 4 X X pj Pi/j 1 − Pi/j + Pi/j − Pi = k − 1 j=1 i=1 "k−1 # l X X k−1 4 X pj Pi/j 1 − Pi/j + Pi/j Pi/j − Pi = = k − 1 j=1 i=1 i=1 l k−1 l k−1 X X 4 X X pj Pi/j 1 − Pi/j + pj Pi/j Pi/j − Pi = = k − 1 j=1 i=1 j=1 i=1 l k−1 l k−1 X X 2 X X = 2 pj Pi/j 1 − Pi/j + 2 pj Pi/j Pi/j − Pi = k−1 j=1 i=1 j=1 i=1 l k−1 X X 2 Dorvarwithin + 2 pj Pi/j Pi/j − Pi , = k−1 j=1 i=1
=
(362)
l k−1 l k−1 4 XX 4 X X pj Pi/j (1 − Pi ) = pj Pi/j (1 − Pi ) = k − 1 j=1 i=1 k − 1 j=1 i=1
´ ORDINALN ´ ´I ROZPTYL 4. NORMALIZOVANY
119
(363) l k−1 k−1 l X X XX 2 pj Pi/j Pi/j − Pi = 2 pj Pi/j Pi/j − Pi = j=1
=2
i=1
k−1 l XX
i=1 j=1
2 pj Pi/j − pj Pi/j Pi ] = 2
i=1 j=1
=2
k−1 X
=2
k−1 X
k−1 X
k−1 X
2 pj Pi/j
j=1
i=1
l X
2 pj Pi/j
k−1 l X X 2 − 2Pi2 + Pi2 = 2 − 2Pi2 + 1Pi2 = pj Pi/j i=1
2 pj Pi/j − 2Pi2 +
l X
pj Pi2 = 2
2 pj Pi/j − 2Pi
l X
l l X X 2 pj Pi/j − 2Pi Pi + pj Pi2 = j=1
j=1
pj Pi/j
l k−1 l l l X X X X X 2 + pj Pi2 = 2 pj Pi/j − 2pj Pi/j Pi + pj Pi2 =
j=1
j=1
pj Pij2 − 2pj Pij Pi + pj Pi2 = 2
i=1 k−1 l h XX
j=1
j=1
j=1
i 2 pj Pi/j − 2Pi/j Pi + Pi2 =
i=1 j=1
k−1 l h XX
pj Pi/j − Pi
i=1 j=1
2 i
=2
l X j=1
pj
k−1 Xh
Pi/j − Pi
2 i
= Dorvarbetween ,
i=1
k−1 X
2 [Pi (1 − Pi )] = (Dorvarwithin + Dorvarbetween ) = k − 1 k − 1 i=1 l k−1 l k−1 X X 2 2 X X pj Pi/j − Pi = = 2 pj Pi/j 1 − Pi/j + 2 k−1 j=1 i=1 j=1 i=1 l k−1 l k−1 X X 2 4 X X = pj Pi/j 1 − Pi/j + pj Pi/j − Pi = k − 1 j=1 i=1 j=1 i=1 4
(364)
k−1 X i=1
i=1 j=1
=2
j=1
j=1
j=1
k−1 l XX
j=1
j=1
i=1
=2
l X
j=1
l k−1 l X X X 2 − Pi pj Pi/j = 2 − Pi2 = pj Pi/j
j=1
i=1
=2
l X
i=1
=2
l X
j=1
j=1
l l X X 2 pj Pi/j − pj Pi/j Pi =
i=1
i=1
k−1 X
l k−1 X X Pi/j − Pi 2 Pi/j 1 − Pi/j +4 pj = k−1 k−1 j=1 i=1 j=1 i=1 h 2 i l k−1 l k−1 X X pj Pi/j 1 − Pi/j X X pj Pi/j − Pi =4 +4 k−1 k−1 j=1 i=1 j=1 i=1 =4
l X
pj
k−1 X
=N ormDorvarwithin + N ormDorvarbetween .
120
13. M´IRY VARIABILITY
ˇ sen´ı ve VBA: Reˇ Sub Dorvar() Dim n As Integer Dim k As Integer Dim l As Integer Dim i As Integer Dim j As Integer Dim p j() As Single Dim n j() As Single Dim cp i() As Single Dim cp ij() As Single Dim Dorvar As Single Dim Within As Single Dim Between As Single 0 Vypocet: k = Application.CountA(Columns(1)) - 1 l = Application.CountA(Rows(2)) n = Application.Sum(Range(Cells(2, 1), Cells(k + 1, l))) ReDim p j(1 To l) ReDim n j(1 To l) ReDim cp i(1 To k) ReDim cp ij(1 To k, 1 To l) For j = 1 To l p j(j) = Application.Sum(Range(Cells(2, j), Cells(k + 1, j))) / n n j(j) = Application.Sum(Range(Cells(2, j), Cells(k + 1, j))) For i = 1 To k cp i(i) = Application.Sum(Range(Cells(2, j), Cells(i + 1, l))) / n cp ij(i, j) = Application.Sum(Range(Cells(2, j), Cells(i + 1, j))) / n j(j) Next i Next j Within = 0 Between = 0 For j = 1 To l For i = 1 To k - 1 Within = Within + p j(j) * cp ij(i, j) * (1 - cp ij(i, j)) Between = Between + p j(j) * (cp ij(i, j) - cp i(i))^2 Next i Next j Dorvar = (4 / (k - 1)) * (Within + Between) MsgBox ("Dorvar:"& vbTab & Dorvar) End Sub
ˇ ast 5 C´
Nomin´ aln´ı promˇ enn´ a
KAPITOLA 14
M´ıry polohy Definice 0.2.
´ Uroveˇ n polohy nomin´ aln´ıho statistick´eho znaku se charakterizuje pomoc´ı mod´ aln´ı kategorie.
Pozn´ amka: Mod´ aln´ı kategorie, xM o , a mod´ aln´ı ˇcetnosti jsou definov´any stejnˇe jako v definici 0.4 na strane 110 v kapitole o ordin´aln´ı promˇenn´e. Pozn´ amka: Mod´ aln´ı ˇcetnosti jsou rovnˇeˇz z´ akladem mnoh´ ych m´ır variability u nomin´aln´ı promˇenn´e, jelikoˇz je m˚ uˇzeme ch´ apat tak´e jako m´ıry koncentrace.
122
KAPITOLA 15
M´ıry variability 1. N´ aroky na ukazatele
Definice 1.1. A. R. Wilcox definuje m´ıru variability u v´ıcekategori´aln´ı nomin´aln´ı promˇenn´e pˇres n´ asledovn´ı vlastnost´ı, kter´e mus´ı dan´a m´ıra variability obsahovat: a) maxim´ aln´ı a minim´ aln´ı hodnota m´ıry by nemˇela z´aviset na ˇcetnostech ani poˇctu kategori´ı, b) m´ıra dosahuje minim´ aln´ı hodnoty v pˇr´ıpade, kdyˇz vˇsechny statistick´e jednotky nab´yvaj´ı stejn´e hodnoty (kategorie), c) m´ıra dosahuje maxim´ aln´ı hodnoty v pˇr´ıpade, kdyˇz m´a nomin´aln´ı promˇenn´a rovnomˇern´e rozdˇelen´ı ˇcetnost´ı, d) m´ıra by mˇela b´ yt normalizov´ ana do rozpˇet´ı nula, v pˇr´ıpadˇe minim´aln´ı hodnoty a jedna, v pˇr´ıpadˇe maxim´aln´ı hodnoty. Pozn´ amka: Jednotkovou normalizaci v´ yrazu lze snadno dos´ahnout vydˇelen´ım dan´eho v´ yrazu jeho maxim´ aln´ı moˇzno hodnotou. 2. Wilcoxove m´ıry 2.1. ModVR.
Definice 2.1. Necht’ k je poˇcet hodnot (kategori´ı) u nomin´aln´ı promˇenn´e, ni je absolutn´ı ˇcetnost u i-te hodnoty (kategorie), nM o je mod´aln´ı ˇcetnost u mod´aln´ı hodnoty (kategorie) a n je poˇcet statistick´ ych jednotek, pak k P
(365)
M odV R = 1 −
i=1
(nM o −ni ) k−1
=1−
n
k X (nM o − ni ) i=1
n (k − 1)
.
Pozn´ amka: Ukazatel ModVR je normovan´ a pr˚ umˇern´a odchylka jednotliv´ ych ˇcetnost´ı od mod´aln´ı ˇcetnosti. ˇ sen´ı ve VBA: Reˇ Sub ModVR() Dim n As Integer Dim k As Integer Dim n Mo As Single Dim n i() As Single Dim Suma() As Single 123
15. M´IRY VARIABILITY
124
Dim SumaAll As Single Dim ModVR As Single 0 Vypocet: k = Application.CountA(Columns(2)) - 1 n Mo = Application.Max(Range(Cells(2, 2), Cells(k + 1, 2))) n = Application.Sum(Range(Cells(2, 2), Cells(k + 1, 2))) ReDim n i(1 To k) ReDim Suma(1 To k) SumaAll = 0 For i = 1 To k n i(i) = Cells(i + 1, 2) Suma(i) = (n Mo - n i(i)) / (n * (k - 1)) SumaAll = SumaAll + Suma(i) Next i ModVR = 1 - SumaAll MsgBox ("ModVR:"& vbTab & ModVR) End Sub
ta 2.1. pro v´ypoˇcetn´ı tvar plat´ı, Ve (366)
1−
k X (nM o − ni ) i=1
n (k − 1)
=1−
knM o − n . n (k − 1)
D˚ ukaz. Jelikoˇz, jmenovatel je konstanta, kter´a m˚ uˇze b´ yt vytknut´a pˇred su´ maci, m˚ uˇzeme se soustˇredit jenom d˚ ukaz rovnosti ˇcitatel˚ u. Upravami dost´avame
1−
k X (nM o − ni ) i=1
n (k − 1)
=
k
X 1 (nM o − ni ) = n (k − 1) i=1 " k # k X X 1 =1 − nM o − ni = n (k − 1) i=1 i=1
=1 − (367)
1 (knM o − n) = n (k − 1) knM o − n =1 − . n (k − 1) =1 −
Pozn´ amka: Splnˇen´ı podm´ınky normalize m´ıry do rozpˇet´ı nula a jedna je dosaˇzeno prostˇrednictv´ım k P dˇelen´ı v´ yrazem n (k − 1), kter´ y je maxim´aln´ı moˇznou hodnotou ˇcitatele (nM o − ni ). i=1
Kdyˇz n´ aslednˇe od jedniˇcky odeˇc´ıt´ame hodnotu tohoto pod´ılu, dos´ahneme stavu, ˇze m´ıra ModVR dosahuje hodnotu nula v pˇr´ıpadˇe nenulov´e ˇcetnosti v jedin´e kategorii.
2. WILCOXOVE M´IRY
Tehdy je nM o = n a
k P i=1
(nM o −ni ) k−1
je mod´ aln´ı kategorie nM o =
n k
a
125
= n. Naopak, v pˇr´ıpadˇe rovnomˇern´eho rozdˇelen´ı
k P i=1
(nM o −ni ) k−1
= 0. Aby jsme uk´azali platnost tˇechto
z´ avˇer˚ u, dok´ aˇzeme si tyto tvrzen´ı.
ta 2.2. Kdyˇz ∀ni : ni = nM o = nk , plat´ı Ve
k X (nM o − ni )
(368)
i=1
D˚ ukaz. Kdyˇz nM o =
k−1
= 0.
n k
k X (nM o − ni )
= k−1 k k n X 1 X n k − ni = − ni = = k−1 k − 1 i=1 k i=1 h n n i 1 n = − n1 + − n2 + . . . + − nk = k−1 k k k 1 n n n = − n1 + − n2 + . . . + − nk = k−1 k k k 1 n = k − (n1 + n2 + . . . + nk ) = k−1 k 1 = (n − n) = 0 k−1 . i=1
(369)
ta 2.3. Kdyˇz ∃!ni : ni = nM o = n, plat´ı Ve
(370)
k X (nM o − ni ) i=1
k−1
= n.
15. M´IRY VARIABILITY
126
D˚ ukaz. Kdyˇz nM o = n, k X (nM o − ni ) i=1
k−1
=
k
=
k
1 X 1 X (nM o − ni ) = (n − ni ) = k − 1 i=1 k − 1 i=1
1 [(n − n1 ) + (n − n2 ) + . . . + (n − nk )] = k−1 1 (n − n1 + n − n2 + . . . + n − nk ) = = k−1 1 = [kn − (n1 + n2 + . . . + nk )] = k−1 1 1 (kn − n) = [n (k − 1)] = k − 1 = k−1 n . =
(371)
2.2. RanVR.
Definice 2.2. Necht’, nM o je mod´ aln´ı ˇcetnost a nmin je minim´aln´ı ˇcetnost v rozdˇelen´ı ˇcetnost´ı, pak (372)
RanV R = 1 −
nM o − nmin nmin = . nM o nM o
Pozn´ amka: Ukazatel RanVR je analogick´a normovan´a m´ıra k ukazateli variaˇcn´ıho rozpˇet´ı v pˇr´ıpadˇe kvantitativn´ı promˇenn´e. ˇ sen´ı ve VBA: Reˇ Sub RanVR() Dim n Mo As Single Dim n min As Single Dim RanVR As Single 0 Vypocet: n Mo = Application.Max(Range(Cells(2, 2), Cells(k + 1, 2))) n min = Application.Min(Range(Cells(2, 2), Cells(k + 1, 2))) RanVR = n min / n Mo MsgBox ("RanVR:"& vbTab & RanVR) End Sub 2.3. AVDev.
Definice 2.3. Necht’ k je poˇcet hodnot (kategori´ı) u nomin´aln´ı promˇenn´e, ni je absolutn´ı ˇcetnost u i-te hodnoty (kategorie) a n je poˇcet statistick´ ych jednotek, pak
2. WILCOXOVE M´IRY
k n −n P | i k|
k
k
(373)
AV Dev =
i=1 2n(k−1) k2
=1−
k P i=1
127
ni − nk
2n (k − 1)
.
Pozn´ amka: Ukazatel AVDev je analogick´ a normovan´a m´ıra k ukazateli pr˚ umˇern´e odchylky v pˇr´ıpadˇe kvantitativn´ı promˇenn´e. Pozn´ amka: Tak, jako v pˇr´ıpadˇe ukazatele ModVR, i v t´eto m´ıˇre normalizujeme ˇcitatel dˇelen´ım jeho maxim´ aln´ı hodnotou, kter´a v pˇr´ıpadˇe nenulov´e ˇcetnosti v jedin´e kategorii, k n −n P | i k| = 2nk 2 (k − 1) a v pˇr´ıpadˇe rovnomˇern´eho ∃!ni : ni = n, je rovna v´ yrazu k i=1
rozdˇelen´ı, kdy vˇsechny kategorie maj´ı stejn´e zastoupen´ı ∀ni : ni =
n k,
0. ˇ sen´ı ve VBA: Reˇ Sub AVDev() Dim n As Integer Dim k As Integer Dim n i() As Single Dim Suma() As Single Dim SumaAll As Single Dim AVDev As Single 0 Vypocet: k = Application.CountA(Columns(2)) - 1 n = Application.Sum(Range(Cells(2, 2), Cells(k + 1, 2))) ReDim n i(1 To k) ReDim Suma(1 To k) SumaAll = 0 For i = 1 To k n i(i) = Cells(i + 1, 2) Suma(i) = Abs(n i(i) - (n / k)) SumaAll = SumaAll + Suma(i) Next i AVDev = 1 - (k * SumaAll / (2 * n * (k - 1))) MsgBox ("AVDev:"& vbTab & AVDev) End Sub
ta 2.4. Kdyˇz ∃!ni : ni = n, plat´ı Ve
(374)
k X ni − n k
i=1
k
=
2n (k − 1) . k2
je
k n −n P | i k| i=1
k
=
15. M´IRY VARIABILITY
128
D˚ ukaz. V d˚ usledku nulov´ ych ˇcetnost´ı u k − 1 kategori´ı a jedin´e kategorie s ˇcetnost´ı n, plat´ı k X ni − nk = k i=1 n i n 1h = (k − 1) 0 − + 1 n − = k k k 1h n n i = (k − 1) + n − = k k k 1 n kn − n = (k − 1) + = k k k (375) 1 n n (k − 1) = (k − 1) + = k k k i n n 1h = (k − 1) + (k − 1) = k k k 1 n = 2 (k − 1) = k k 2n (k − 1) = . k2 2.4. MNDif.
Definice 2.4. Necht’ k je poˇcet hodnot (kategori´ı) u nomin´aln´ı promˇenn´e, ni a nj jsou absolutn´ı ˇcetnosti u i-te a j-te hodnoty (kategorie), pˇriˇcemˇz i = 1, 2, . . . , n; j = 1, 2, . . . , n a n je poˇcet statistick´ ych jednotek, pak k−1 P
(376)
M N Dif = 1 −
k P
i=1 j=i+1 n k
|ni −nj | k(k−1)
=1−
k X |ni − nj | . n (k − 1) i=1 j=i+1
k−1 X
Pozn´ amka: Ukazatel MNDif je analogick´a normovan´a m´ıra k ukazateli stˇredn´ı diference v pˇr´ıpadˇe kvantitativn´ı promˇenn´e. Pozn´ amka: Pˇri nenulov´e ˇcetnosti v pˇr´ıpadˇe jedin´e kategorie, ∃!ni : ni = n, je v´ yraz
k−1 P
k P
i=1 j=i+1 n k
|ni −nj | k(k−1)
a v pˇr´ıpadˇe rovnomˇern´eho rozdˇelen´ı, kdy vˇsechny kategorie maj´ı stejnou ˇcetnost, k−1 k P P |ni −nj | ∀ni : ni = nk , je v´ yraz ıc k(k−1) = 0. Nav´ i=1 j=i+1
ˇ sen´ı ve VBA: Reˇ Sub MNDif() Dim n As Integer Dim k As Integer Dim n i() As Single Dim Suma As Single
=
2. WILCOXOVE M´IRY
129
Dim MNDif As Single 0 Vypocet: k = Application.CountA(Columns(2)) - 1 n = Application.Sum(Range(Cells(2, 2), Cells(k + 1, 2))) ReDim n i(1 To k) Suma = 0 For i = 1 To k n i(i) = Cells(i + 1, 2) Next i For i = 1 To k - 1 For j = i + 1 To k Suma = Suma + (Abs(n i(i) - n i(j)) / (n * (k - 1))) Next j Next i MNDif = 1 - Suma MsgBox ("MNDif:"& vbTab & MNDif) End Sub
ta 2.5. Kdyˇz ∃!ni : ni = n, plat´ı Ve k X |ni − nj | n = . k (k − 1) k i=1 j=i+1
k−1 X
(377)
D˚ ukaz. Jelikoˇz existuje jedin´a nenulov´a kategorie, mus´ı existovat k − 1 kategori´ı, s kter´ ymi m˚ uˇze tato kategorie vytvoˇrit nenulov´ y rozd´ıl, pˇriˇcemˇz rozd´ıly mezi ostatn´ımi p´ ary jsou nulov´e. Tud´ıˇz plat´ı (378)
k X |ni − nj | (k − 1) |n − 0| n (k − 1) n = = = . k (k − 1) k (k − 1) k (k − 1) k i=1 j=i+1
k−1 X
2.5. Varnc.
Definice 2.5. Necht’ k je poˇcet hodnot (kategori´ı) u nomin´aln´ı promˇenn´e, ni je absolutn´ı ˇcetnost u i-te hodnoty (kategorie) a n je poˇcet statistick´ ych jednotek, pak 2 k P (ni − nk )
k
k
(379)
V arnc = 1 −
i=1 n2 (k−1) k2
=1−
k P i=1 n2
ni −
n 2 k
(k − 1)
.
Pozn´ amka: Ukazatel Varnc je normovan´ a m´ıra analogick´a k rozptylu v pˇr´ıpadˇe kvantitativn´ı promˇenn´e. Pozn´ amka: Pˇri nenulov´e ˇcetnosti v pˇr´ıpadˇe jedin´e kategorie, ∃!ni : ni = n, je v´ yraz
2 k P (ni − nk )
i=1
k
=
15. M´IRY VARIABILITY
130 n2 (k−1) k2
a v pˇr´ıpadˇe rovnomˇern´eho rozdˇelen´ı, kdy vˇsechny kategorie maj´ı stejnou 2 k P (ni − nk ) ˇcetnost, ∀ni : ni = nk , je v´ yraz = 0. k i=1
ˇ sen´ı ve VBA: Reˇ Sub Varnc() Dim n As Integer Dim k As Integer Dim n i() As Single Dim Suma() As Single Dim SumaAll As Single Dim Varnc As Single 0 Vypocet: k = Application.CountA(Columns(2)) - 1 n = Application.Sum(Range(Cells(2, 2), Cells(k + 1, 2))) ReDim n i(1 To k) ReDim Suma(1 To k) SumaAll = 0 For i = 1 To k n i(i) = Cells(i + 1, 2) Suma(i) = (n i(i) - (n / k))^2 SumaAll = SumaAll + Suma(i) Next i Varnc = 1 - (k * SumaAll / ((n^2) * (k - 1))) MsgBox ("Varnc:"& vbTab & Varnc) End Sub
ta 2.6. Kdyˇz ∃!ni : ni = n, plat´ı Ve k X ni − k i=1
(380)
n 2 k
=
n2 (k − 1) . k2
D˚ ukaz. Jelikoˇz existuje jedin´a nenulov´a kategorie, mus´ı existovat jeden ˇctverec 2 2 rozd´ılu n − nk a k − 1 ˇctverc˚ u rozd´ıl˚ u 0 − nk . Tud´ıˇz plat´ı 2 2 2 k X ni − nk (k − 1) nk + n − nk = = k k i=1 2
(381)
2
2
2
2
n n 2 (k − 1) nk2 + n2 − 2 nk + nk2 2 (k − 1 + 1) + n − 2 k = = k = k k 2 2 2 2 2 n n +kn −2n + n2 − 2 nk n2 (1 + k − 2) k = k = = = k k k2 n2 (k − 1) = . k2
2.6. STDev.
3. OSTATN´I UKAZATELE VARIABILITY A KONCENTRACE
131
Definice 2.6. Necht’ k je poˇcet hodnot (kategori´ı) u nomin´aln´ı promˇenn´e, ni je absolutn´ı ˇcetnost u i-te hodnoty (kategorie) a n je poˇcet statistick´ ych jednotek, pak s (382)
ST Dev = 1 −
2 k P (ni − nk )
i=1
q
k
n2 (k−1) k2
v u P 2 u k uk ni − nk t i=1 =1− . n2 (k − 1)
Pozn´ amka: Ukazatel STDev je normovan´ a m´ıra pro nomin´aln´ı promˇennou analogick´a ke smˇerodatn´e odchylce v pˇr´ıpadˇe kvantitativn´ı promˇenn´e. ˇ sen´ı ve VBA: Reˇ Sub STDev() Dim n As Integer Dim k As Integer Dim n i() As Single Dim Suma() As Single Dim SumaAll As Single Dim STDev As Single 0 Vypocet: k = Application.CountA(Columns(2)) - 1 n = Application.Sum(Range(Cells(2, 2), Cells(k + 1, 2))) ReDim n i(1 To k) ReDim Suma(1 To k) SumaAll = 0 For i = 1 To k n i(i) = Cells(i + 1, 2) Suma(i) = (n i(i) - (n / k))^2 SumaAll = SumaAll + Suma(i) Next i STDev = 1 - (k * SumaAll / ((n^2) * (k - 1)))^(1/2) MsgBox ("STDev:"& vbTab & STDev) End Sub
ta 2.7. Kdyˇz ∃!ni : ni = n, plat´ı Ve
(383)
v r u k uX ni − n 2 n2 (k − 1) k t = . k k2 i=1
D˚ ukaz. D˚ ukaz je stejn´ y jako v pˇr´ıpadˇe d˚ ukazu vˇety 2.6 na stranˇe 130 s mal´ ym rozd´ılem, ˇze vˇsechny v´ yrazy jsou pod odmocninou. 3. Ostatn´ı ukazatele variability a koncentrace 3.1. Freemanov variaˇ cn´ı pomˇ er.
15. M´IRY VARIABILITY
132
Definice 3.1. Necht’ nM o je mod´ aln´ı ˇcetnost u mod´aln´ı hodnoty (kategorie) a n je poˇcet statistick´ ych jednotek, pak v =1−
(384)
nmo . n
Pozn´ amka: Freeman tuto m´ıru uv´ ad´ı jako ukazatel vhodnosti modu jakoˇzto M´ıry polohy pro ˇ ım vˇetˇs´ı hodnotu ukazatel nab´ rozdˇelen´ı dan´e kategori´ aln´ı promˇenn´e. C´ yva, t´ ym je mod´ aln´ı ˇcetnost mˇenˇe vypov´ıdaj´ıc´ı ukazatel. Na druhou stranu, tento ukazatel m˚ uˇzeme pouˇz´ıt rovnˇeˇz k mˇeˇren´ı variability, kde relativn´ı mod´aln´ı ˇcetnost, pM o = nM o ıra koncentrace. n , vystupuje jako m´ Pozn´ amka: Jelikoˇz mod´ aln´ı ˇcetnost nem˚ uˇze b´ yt nulov´a, variaˇcn´ı pomˇer nikdy nem˚ uˇze nab´ yt hodnoty jedna. Naopak v pˇr´ıpadˇe rovnomˇern´eho rozdˇelen´ı, kdyˇz je mod´aln´ı ˇcetnost n minim´ aln´ı, je zˇrejm´e, ˇze mod´ aln´ı relativn´ı ˇcetnost je rovna kk = k1 a variaˇcn´ı pomˇer se rovn´ a k−1 k . ˇ sen´ı ve VBA: Reˇ Sub v() Dim n As Integer Dim n Mo As Integer Dim k As Integer Dim v As Single 0 Vypocet: k = Application.CountA(Columns(2)) - 1 n = Application.Sum(Range(Cells(2, 2), Cells(k + 1, 2))) n Mo = Application.Max(Range(Cells(2, 2), Cells(k + 1, 2))) v = 1 - (n Mo / n) MsgBox ("v:"& vbTab & v) End Sub
ta 3.1. Kdyˇz ∀ni : ni = nM o = nk , plat´ı Ve v =1−
(385) D˚ ukaz. Kdyˇz nM o = (386)
nM o k−1 = n k
n k,
v =1−
n nM o 1 k−1 =1− k =1− = n n k k
Pozn´ amka: Kdyˇz znormalizujeme vzorec variaˇcn´ıho pomˇeru s ohledem na jeho maximum (pˇr´ıpad rovnomˇern´eho rozdˇelen´ı), pak z´ısk´ame u ´pravy, kter´e n´as pˇrivedou k n´avaznosti na ukazatel ModVR.
3. OSTATN´I UKAZATELE VARIABILITY A KONCENTRACE
133
ta 3.2. Kdyˇz k je poˇcet hodnot (kategori´ı) u nomin´aln´ı promˇenn´e, nM o je Ve mod´ aln´ı ˇcetnost u mod´ aln´ı hodnoty (kategorie) a n je poˇcet statistick´ych jednotek, pak plat´ı v
(387)
k−1 k
= M odV R.
D˚ ukaz. Kdyˇz k je poˇcet hodnot (kategori´ı) u nomin´aln´ı promˇenn´e, nM o je mod´ aln´ı ˇcetnost u mod´ aln´ı hodnoty (kategorie) a n je poˇcet statistick´ ych jednotek, v k−1 k
=
nM o n k−1 k
1−
=
n−nM o n k−1 k
=
k (n − nM o ) = n (k − 1)
kn − knM o + (n − n) kn − knM o = = n (k − 1) n (k − 1) kn − n − knM o + n kn − knM o + n − n = = = n (k − 1) n (k − 1) n (k − 1) − (knM o − n) knM o − n = =1− = M odV R. n (k − 1) n (k − 1) =
(388)
Pozn´ amka: Normovan´ y variaˇcn´ı pomˇer je tud´ıˇz Wilcoxov ukazatel ModVR. 3.2. Herfindahlov koeficient.
Definice 3.2. Necht’ k je poˇcet hodnot (kategori´ı) u nomin´aln´ı promˇenn´e, ni je absolutn´ı ˇcetnost u i-te hodnoty (kategorie) a n je poˇcet statistick´ ych jednotek, pak (389)
Hi =
k X n i 2 i=1
n
.
Pozn´ amka: Herfindhal vysvˇetluje svoji m´ıru jakoˇzto ekonomick´ y ukazatel konkurence mezi u ´ˇcastn´ıky trhu v dan´em odvˇetv´ı, kde ˇcetnosti zastupuj´ı velikost spoleˇcnosti. Tento koeficient vystupuje rovnˇeˇz v ekologii jako Simpson˚ uv koeficient, nebo HunterGaston˚ uv ukazatel v mikrobiologii (zdroj: en.wikipedia.org). Pozn´ amka: Pˇri hlubˇs´ı anal´ yze zjist´ıme, ˇze koeficient nemˇeˇr´ı variabilitu, ale sp´ıˇs je to dalˇs´ı zakladn´ı m´ıra koncentrace (spolu s mod´aln´ı ˇcetnost´ı), o kterou konstrukci se op´ıraj´ı jin´e M´ıry variability. Z´ aroveˇ n tˇreba pˇripomenout, ˇze koeficient v pˇr´ıpadˇe rovnomˇern´eho rozdˇelen´ı nab´ yv´ a hodnotu k1 . ˇ sen´ı ve VBA: Reˇ Sub Hi() Dim n As Integer Dim k As Integer Dim n i2() As Single Dim Suma As Single
15. M´IRY VARIABILITY
134
Dim Hi As Single 0 Vypocet: k = Application.CountA(Columns(2)) - 1 n = Application.Sum(Range(Cells(2, 2), Cells(k + 1, 2))) ReDim n i2(1 To k) Suma = 0 For i = 1 To k n i2(i) = (Cells(i + 1, 2) / n)^2 Suma = Suma + n i2(i) Next i Hi = Suma MsgBox ("Hi:"& vbTab & Hi) End Sub 3.3. Nomin´ aln´ı rozptyl.
Definice 3.3. Necht’ k je poˇcet hodnot (kategori´ı) u nomin´aln´ı promˇenn´e, ni je absolutn´ı ˇcetnost u i-te hodnoty (kategorie) a n je poˇcet statistick´ ych jednotek, pak
N omV ar = 1 −
(390)
k X ni 2
n
i=1
.
Pozn´ amka: Ukazatel se objevuje v r˚ uzn´ ych studijn´ıch oborech pod r˚ uzn´ ymi jm´enami. M˚ uˇzeme ho naj´ıt pod oznaˇcen´ım M1 u Gibbse jako ukazatel pr˚ umyslov´e diverzifikace, nebo u Giniho jako koeficient mutability, nebo jako Simpson˚ uv ukazatel diverzity atd. (zdroj: en.wikipedia.org) Pozn´ amka: Ukazatel m˚ uˇzeme ch´ apat jako procento dvojic statistick´ ych jednotek, kter´e nepatˇr´ı do stejn´e kategorie, jelikoˇz M1 = 1 −
k X n i 2 i=1
(391) =
k X ni i=1
n
−
n 2 i
n
n =
=
k X ni i=1
k X ni i=1
n
n 1−
−
k X n i 2 i=1
n
=
ni . n
Pozn´ amka: Z konstrukce vzorce vypl´ yv´ a, ˇze v pˇr´ıpadˇe, kdyˇz jsou kategorie stejnˇe zastoupeny, ukazatel nen´ı ohraniˇcen fixn´ı hodnotou ale nab´ yv´a hodnotu k−1 z je pˇredmˇetem k , coˇ n´ asleduj´ıc´ıho d˚ ukazu. V porovn´an´ı s Wilcoxov´ ymi m´ırami, nebudeme dokazovat maxim´ aln´ı hodnotu pro ˇc´ ast vzorce osvobozen´eho o rozd´ıl od jedniˇcky, ale v souladu s Gibbsov´ ym z´ apisem, pro vzorec jako celek. ˇ sen´ı ve VBA: Reˇ Sub NomVar() Dim n As Integer Dim k As Integer
3. OSTATN´I UKAZATELE VARIABILITY A KONCENTRACE
135
Dim n i2() As Single Dim Suma As Single Dim NomVar As Single 0 Vypocet: k = Application.CountA(Columns(2)) - 1 n = Application.Sum(Range(Cells(2, 2), Cells(k + 1, 2))) ReDim n i2(1 To k) Suma = 0 For i = 1 To k n i2(i) = (Cells(i + 1, 2) / n)^2 Suma = Suma + n i2(i) Next i NomVar = 1-Suma MsgBox ("NomVar:"& vbTab & NomVar) End Sub
ta 3.3. Kdyˇz ∀ni : ni = nM o = nk , plat´ı Ve 1−
(392)
k X n i 2 i=1
D˚ ukaz. Kdyˇz nM o =
1−
(393)
n k,
k X n i 2
n
=
k−1 k
plat´ı
=1−
k n 2 X k
=1−
k X n 2 = nk i=1
n n i=1 k k 2 X X 1 1 k−1 1 1 =1 − =1− =1−k 2 =1− = 2 k k k k k i=1 i=1 i=1
3.4. Normalizovan´ y nomin´ aln´ı rozptyl.
Definice 3.4. Necht’ k je poˇcet hodnot (kategori´ı) u nomin´aln´ı promˇenn´e, ni je absolutn´ı ˇcetnost u i-te hodnoty (kategorie) a n je poˇcet statistick´ ych jednotek, pak 1− (394)
N ormN omV ar =
k P i=1 k−1 k
ni 2 n
" # k X k n i 2 = 1− . k−1 n i=1
Pozn´ amka: Gibbs oznaˇcuje tento ukazatel jako ukazatel M2. Pozn´ amka: Ukazatel je ukazatel NomVar normovan´ y mezi minimum nula a maximum jedna, ˇc´ımˇz splnil Wilcoxov´e podm´ınky pro m´ıru variability.
15. M´IRY VARIABILITY
136
ˇ sen´ı ve VBA: Reˇ Sub NomVar() Dim n As Integer Dim k As Integer Dim n i2() As Single Dim Suma As Single Dim NomVar As Single 0 Vypocet: k = Application.CountA(Columns(2)) - 1 n = Application.Sum(Range(Cells(2, 2), Cells(k + 1, 2))) ReDim n i2(1 To k) Suma = 0 For i = 1 To k n i2(i) = (Cells(i + 1, 2) / n)^2 Suma = Suma + n i2(i) Next i NomVar = (k/(k-1))*(1-Suma) MsgBox ("NomVar:"& vbTab & NomVar) End Sub 3.5. Shannonova entropie.
Definice 3.5. Necht’ k je poˇcet hodnot (kategori´ı) u nomin´aln´ı promˇenn´e, ni je absolutn´ı ˇcetnost u i-te hodnoty (kategorie) a n je poˇcet statistick´ ych jednotek, pak
(395)
H=−
k X ni i=1
n
log2
n i
n
.
Pozn´ amka: T´ ato m´ıra byla p˚ uvodnˇe navrˇzena v teorii informace jakoˇzto m´ıra nejistoty a pozdˇeji nabyla v teorii chaosu v´ yznamu m´ıry neurˇcitosti (neuspoˇr´adanosti). Avˇsak jej´ı matematick´ a podstata sah´ a aˇz do oblasti statistick´e fyziky a termodynamiky. Ukazatel nab´ yv´ a maxima v situaci, kdyˇz jsou kategorie stejnˇe zastoupeny (maxim´aln´ı neuspoˇr´ adanost = maxim´ aln´ı heterogenita = tot´aln´ı nepˇredpov´ıdatelnost) a naopak nulu v situaci nenulov´e ˇcetnosti v jedin´e kategorii (´ upln´a uspoˇr´adanost = u ´pln´a homogenita = u ´pln´ a pˇredpov´ıdatelnost). Pozn´ amka: Entropii m˚ uˇzeme ch´ apat jako v´aˇzen´ y aritmetick´ y pr˚ umˇer, kde vahami jsou ˇcetnosti a hodnotami logaritmy relativn´ıch ˇcetnost´ı. Pozn´ amka: Ve vzorci m˚ uˇzeme rovnˇeˇz pouˇz´ıt pˇrirozen´ y z´aklad logaritmu. ˇ sen´ı ve VBA: Reˇ Sub H() Dim n As Integer Dim k As Integer Dim n in() As Single
3. OSTATN´I UKAZATELE VARIABILITY A KONCENTRACE
137
Dim Suma As Single Dim H As Single 0 Vypocet: k = Application.CountA(Columns(2)) - 1 n = Application.Sum(Range(Cells(2, 2), Cells(k + 1, 2))) ReDim n in(1 To k) Suma = 0 For i = 1 To k n in(i) = (Cells(i + 1, 2) / n) * (Log(Cells(i + 1, 2) / n) / Log(2#)) Suma = Suma + n in(i) Next i H = -Suma MsgBox ("H:"& vbTab & H) End Sub
ta 3.4. Kdyˇz ∀ni : ni = nM o = nk , plat´ı Ve −
(396)
k X ni i=1
D˚ ukaz. Kdyˇz nM o =
k X ni
n i
n
= log2 k.
plat´ı n i
k X
n k
n
=− log2 k n n n i=1 i=1 k X1 1 1 1 log2 = −k log2 = =− k k k k i=1 1 = − log2 = log2 k. k −
(397)
n k,
n
log2
n
log2
=
3.6. Normalizovan´ a entropie.
Definice 3.6. Necht’ k je poˇcet hodnot (kategori´ı) u nomin´aln´ı promˇenn´e, ni je absolutn´ı ˇcetnost u i-te hodnoty (kategorie) a n je poˇcet statistick´ ych jednotek, pak k n ni i X n log2 n (398) N ormH = − . log2 k i=1 Pozn´ amka: V normalizovan´e entropii je standardizace doc´ılena pomoc´ı pod´ılu Shanonove entropie a maxim´ aln´ı hodnoty Shanonove entropie v pˇr´ıpadˇe rovnomˇern´eho rozdˇelen´ı. Pozn´ amka: Uveden´e M´ıry variability nejsou jedin´ ymi m´ırami. Existuje velk´e mnoˇzstv´ı m´ır variability u nomin´ aln´ı promˇenn´e, kter´e jsou odvozeny od tˇechto z´akladn´ıch ukazatel˚ ua kter´e jsou mnohokr´ at ve vz´ ajemn´em vztahu, nebo se vz´ajemnˇe doplˇ nuj´ı a odkazuj´ı na sebe.
138
15. M´IRY VARIABILITY
ˇ sen´ı ve VBA: Reˇ Sub NormH() Dim n As Integer Dim k As Integer Dim n in() As Single Dim Suma As Single Dim NormH As Single 0 Vypocet: k = Application.CountA(Columns(2)) - 1 n = Application.Sum(Range(Cells(2, 2), Cells(k + 1, 2))) ReDim n in(1 To k) Suma = 0 For i = 1 To k n in(i) = (Cells(i + 1, 2) / n) * (Log(Cells(i + 1, 2) / n) / Log(2#)) Suma = Suma + n in(i)/(Log(k) / Log(2#)) Next i NormH = -Suma MsgBox ("NormH:"& vbTab & NormH) End Sub
ˇ ast 6 C´
Struˇ cn´ y pˇ rehled ukazatel˚ u s´ıly z´ avislosti mezi promˇ enn´ ymi
KAPITOLA 16
Mˇ eˇ ren´ı s´ıly souvztaˇ znosti mezi dvˇ ema kvantitativn´ımi promˇ enn´ ymi 1. Kovariance
Definice 1.1. Necht’ m´ ame dvourozmˇern´ y datov´ y soubor n statistick´ ych jednotek s hodnotami ym pr˚ umˇerem znaku xi s aritmetick´ ym pr˚ umˇerem x a hodnotami znaku yi s aritmetick´ y, pak kovariance je definov´ ana jako aritmetick´ y pr˚ umˇer ze souˇcin˚ u vzd´alenost´ı hodnot xi od pr˚ umˇeru x a hodnot yi od pr˚ umˇeru y n n n n P P P P xi yi xi [(xi − x) (yi − y)] yi = i=1 − i=1 i=1 . (399) sxy = syx = i=1 n n n n Pozn´ amka: Kovariance n´ am odhaduje pr˚ umˇern´ y obd´eln´ık vz´ajemn´e spjatosti, bez ohledu na poˇrad´ı statistick´ ych znak˚ u, kter´ y definuje pr˚ umˇernou ploˇsnou odch´ ylenost hodnot od stˇredn´ıch hodnot znak˚ u. Pozn´ amka: Jelikoˇz v´ ypoˇcet zachov´ av´ a p˚ uvodn´ı jednotkovost znak˚ u, nem˚ uˇzeme ˇr´ıct nic v´ıc, neˇzli to, jestli se jedn´ a o pozitivn´ı nebo negativn´ı z´avislost. Kdyˇz jsou kladn´ı odchylky jednoho znaku pˇrev´ aˇznˇe asociovan´e se z´aporn´ ymi odchylkami druh´eho znaku i koneˇcn´ a hodnota koeficientu bude z´aporn´a. Naopak, kdyˇz maj´ı hodnoty znaku totoˇzn´ y (kladn´ y, nebo z´ aporn´ı) v´ yvoj odchylek, koeficient nab´ yv´a kladn´ ych hodnot. Z kovariance bohuˇzel nem˚ uˇzeme vyˇc´ıst informaci o velikosti s´ıly z´avislosti a tak je nutn´ a jej´ı dalˇs´ı standardizace. Pozn´ amka: Tˇreba podotknout, ˇze kovariance a stejnˇe i Pearson˚ uv korelaˇcn´ı koeficient (popisovan´ y n´ıˇze) odhaduj´ı s´ılu line´ arn´ı z´avislosti. Z´avislosti, kter´e nemaj´ı pˇr´ımkov´ y pr˚ ubˇeh, tyto ukazatel nedok´ aˇz´ı dostateˇcnˇe zachytit. ˇ sen´ı ve VBA: Reˇ Sub Covariance() Dim n As Integer Dim xy() As Single Dim Sumax As Single Dim Sumay As Single Dim Sumaxy As Single Dim Covariance As Single 0 Vypocet: n = Application.CountA(Columns(2)) - 1 140
ˇ ´I KOEFICIENT 2. PEARSON˚ UV KORELACN
141
Sumax = Application.Sum(Range(Cells(2, 2), Cells(n + 1, 2))) Sumay = Application.Sum(Range(Cells(2, 3), Cells(n + 1, 3))) ReDim xy(1 To n) Sumaxy = 0 For i = 1 To n xy(i) = Cells(i + 1, 2) * Cells(i + 1, 3) Sumaxy = Sumaxy + xy(i) Next i Covariance = (Sumaxy / n) - ((Sumax / n) * (Sumay / n)) MsgBox ("Covariance:"& vbTab & Covariance) End Sub End Sub 2. Pearson˚ uv korelaˇ cn´ı koeficient
Definice 2.1. Necht’ m´ ame dvourozmˇern´ y datov´ y soubor n statistick´ ych jednotek s hodnotami statistick´ ych znak˚ u xi a yi , smˇerodatn´ ymi odchylkami tˇechto znak˚ u sx a sy a kovariance znak˚ u sxy , pak Pearson˚ uv korelaˇcn´ı koeficient je definov´an jako n P
[(xi −x)(yi −y)]
i=1
rxy = ryx
sxy n =v = P 2 v P 2 = uP uP sx sy n n n n u x2i u 2 xi yi u i=1 u yi t n − i=1n t i=1n − i=1n
(400) n
n P
xi yi −
n P
xi
n P
yi i=1 i=1 s n 2 n 2 . n n P P P P n x2i − n yi2 − xi yi i=1
=s
i=1
i=1
i=1
i=1
Pozn´ amka: Pearson˚ uv korelaˇcn´ı koeficient je normovanou verzi line´arn´ı kovariance, jelikoˇz je kovariance dˇelen´ a souˇcinem v´ ypoˇcetn´ıch tvar˚ u smˇerodatn´ ych odchylek. Koeficient nab´ yv´ a hodnoty nula v pˇr´ıpadˇe nez´avislosti mezi promˇenn´ ymi, kladn´ ych hodnot v pˇr´ıpadˇe pozitivn´ı pˇr´ım´e z´ avislosti a z´aporn´ ych hodnot v situaci nepˇr´ım´e z´avislosti. Hodnoty tohoto bezrozmˇern´eho ukazatele se tedy pohybuj´ı v intervale od m´ınus jedna po plus jedna. Pozn´ amka: Pearson˚ uv korelaˇcn´ı koeficient m˚ uˇzeme ch´apat jako ukazatel m´ıry spoleˇcn´eho faktora, kter´ y ovlivˇ nuje hodnoty obou znak˚ u. Pozn´ amka: Pearson˚ uv korelaˇcn´ı koeficient je rovnˇeˇz n´achyln´ y na extr´emn´ı hodnoty znak˚ u. ˇ sen´ı ve VBA: Reˇ Sub Correlation() Dim n As Integer Dim xy() As Single Dim x2() As Single
ˇ REN ˇ ´I S´ILY SOUVZTADNOSTI MEZI DVEMA ˇ ˇ ´ 14216. ME KVANTITATIVN´IMI PROMENN YMI
Dim y2() As Single Dim Sumax As Single Dim Sumay As Single Dim Sumax2 As Single Dim Sumay2 As Single Dim Sumaxy As Single Dim Correlation As Single 0 Vypocet: n = Application.CountA(Columns(2)) - 1 Sumax = Application.Sum(Range(Cells(2, 2), Cells(n + 1, 2))) Sumay = Application.Sum(Range(Cells(2, 3), Cells(n + 1, 3))) ReDim xy(1 To n) ReDim x2(1 To n) ReDim y2(1 To n) Sumaxy = 0 Sumax2 = 0 Sumay2 = 0 For i = 1 To n xy(i) = Cells(i + 1, 2) * Cells(i + 1, 3) Sumaxy = Sumaxy + xy(i) x2(i) = Cells(i + 1, 2)^2 Sumax2 = Sumax2 + x2(i) y2(i) = Cells(i + 1, 3)^2 Sumay2 = Sumay2 + y2(i) Next i Cov = n * Sumaxy - Sumax * Sumay Std1 = Sqr(n * Sumax2 - Sumax ^2) Std2 = Sqr(n * Sumay2 - Sumay ^2) Correlation = Cov / (Std1 * Std2) MsgBox ("Correlation:"& vbTab & Correlation) End Sub 3. Spearman˚ uv koeficient poˇ radov´ e korelace
Definice 3.1. Mˇejme dvourozmˇern´ y datov´ y soubor n statistick´ ych jednotek s hodnotami statistick´ ych znak˚ u xi a yi . Pro kaˇzd´ y statistick´ y znak sestroj´ıme poˇrad´ı hodnot podle velikosti a ke kaˇzd´e hodnotˇe pˇriˇrad´ıme poˇradov´e ˇc´ıslo, ix a iy , ix = 1, 2, . . . , n, iy = 1, 2, . . . , n. Spearman˚ uv koeficient poˇradov´e korelace je definov´an jako n n n n P P P P 2 6 (ix − iy ) n ix iy − ix iy i=1 i=1 i=1 i=1 (401) rix iy = s n 2 s n n 2 = 1 − n (n2 − 1) . n P P P P n i2x − n i2y − ix iy i=1
i=1
i=1
i=1
Pozn´ amka: Spearman˚ uv korelaˇcn´ı koeficient je konstrukc´ı t´emˇeˇr identick´ y ukazatel jako Pearson˚ uv koeficient s v´ yjimkou, ˇze nahrazuje jednotliv´e hodnoty poˇradov´ ymi indexy. Na hodnotu Pearsonovho koeficientu maj´ı extr´emn´ı hodnoty v´ yznamn´ y vliv, zat´ımco
ˇ ´ KORELACE 3. SPEARMAN˚ UV KOEFICIENT PORADOV E
143
u Spearmanovho koeficientu jsou vzd´alenosti nahrazeny vzd´alenosti mezi poˇradov´ ymi ˇc´ısly a tak je ztlumen vliv extr´emn´ıch hodnot, co pˇrid´av´a ukazateli na jeho robustnosti (odolnosti).
KAPITOLA 17
Mˇ eˇ ren´ı s´ıly asociace mezi dvˇ ema kvalitativn´ımi promˇ enn´ ymi Definice 0.2. Asociaci mezi kvalitativn´ımi promˇenn´ ymi oznaˇcujeme jako kontingence. 1. Kontingenˇ cn´ı tabulka
Definice 1.1. Mˇejme dvourozmˇern´e rozdˇelen´ı ˇcetnost´ı obmˇen xi a yj dvou kvalitativn´ıch statistick´ ych znak˚ u x a y, kde i = 1, 2, . . . , r a j = 1, 2, . . . , s (r > 1 ∧ s > 1). Kaˇzd´a kombinace obmˇen znak˚ u xi a yj je charakterizov´ana poˇctem statistick´ ych jednotek nij v souboru s obmˇenou xi u znaku x a obmˇenou yj u znaku y vyskytuj´ıc´ıch se souˇcasnˇe. Tyto ˇcetnosti oznaˇcujeme jako sdruˇzen´e. Kdyˇz uspoˇr´ad´ame obmˇeny znak˚ u a ˇcetnosti kombinac´ı tˇechto obmˇen u statistick´ ych jednotek do pˇrehledn´a tabulky, z´ısk´ ame tzv. kontingenˇcn´ı (kombinaˇcn´ı) tabulku.
Definice 1.2. Kontingenˇcn´ı tabulka je charakterizov´ana prvn´ım sloupcem, kter´ y obsahuje vertik´ aln´ı v´ yˇcet (od hora dol˚ u) vˇsech obmˇen znaku x a prvn´ım ˇr´adkem, kter´ y obsahuje horizont´ aln´ı v´ yˇcet (zleva doprava) vˇsech obmˇen znaku y. Buˇ nka v tabulce v lev´em horn´ım rohu z˚ ust´ av´ a pr´azdn´a a poˇc´atky tˇechto seznam˚ u obmˇen jsou posunuty o tuto buˇ nku. Kaˇzd´ a kombinace obmˇen xi a yj je charakterizov´ana sdruˇzenou ˇcetnost´ı v´ yskytu statistick´ ych jednotek nij s touto kombinac´ı obmˇen u znak˚ u, kterou zap´ıˇseme do buˇ nky v tabulce, kter´a odpov´ıd´a pr˚ useˇcn´ıku ˇr´adku, ve kter´em se vyskytuje zkouman´ a obmˇena xi a sloupce, ve kter´em se vyskytuje zkouman´a obmˇena yi . Kaˇzd´ a obmˇena je charakterizov´ana rovnˇeˇz celkovou ˇcetnost´ı statistick´ ych jednotek s touto obmˇenou, ni. nebo n.j . Tyto celkov´e ˇcetnosti jsou pro obmˇeny xi zaps´ any v odpov´ıdaj´ıc´ım ˇr´adku v buˇ nce dodateˇcnˇe vytvoˇren´eho sloupce na konci seznamu obmˇen yj a naopak celkov´e ˇcetnosti pro obmˇeny yj jsou zaps´any v odpov´ıdaj´ıc´ım sloupci v buˇ nce dodateˇcnˇe vytvoˇren´eho ˇr´adku na konci seznamu obmˇen xi . Tyto ˇcetnosti oznaˇcujeme jako margin´ aln´ı. V lev´em doln´ım rohu tabulky se vyskytuje celkov´ a ˇcetnost statistick´ ych jednotek v souboru (viz tabulku 1 na stranˇe 145). Pozn´ amka: Pro ni. plat´ı (402)
ni . =
s X
nij = ni1 + ni2 + . . . + nij + . . . + nis .
j=1 144
ˇ ´I TABULKA 1. KONTINGENCN
145
Tabulka 1. Kontingenˇcn´ı tabulka yj xi \
x1 x2 .. .
y1 n11 n21 .. .
y2 n12 n22 .. .
··· ··· ··· .. .
yj n1j n2j .. .
··· ··· ··· . ..
ys n1s n2s .. .
ni. n1 . n2 . .. .
xi .. .
ni1 .. .
ni2 .. .
··· . ..
nij .. .
nis .. .
ni . .. .
xr n.j
nr1 n.1
nr2 n.2
··· ···
nrj n.j
··· .. . ··· ···
nrs n.s
nr . n
Tedy, (403)
n1. =
s X
n1j = n11 + n12 + . . . + n1j + . . . + n1s ,
j=1
(404)
n2. =
s X
n2j = n21 + n22 + . . . + n2j + . . . + n2s ,
j=1
.. . (405)
nr. =
s X
nrj = nr1 + nr2 + . . . + nrj + . . . + nrs .
j=1
a pro n.j plat´ı (406)
n.j =
r X
nij = n1j + n2j + . . . + nij + . . . + nrj .
i=1
Tedy, (407)
n.1 =
r X
ni1 = n11 + n21 + . . . + ni1 + . . . + nr1 ,
i=1
(408)
n.2 =
r X
ni2 = n12 + n22 + . . . + ni2 + . . . + nr2 ,
i=1
.. . (409)
n.s =
r X
nis = n1s + n2s + . . . + nis + . . . + nrs .
i=1
a nakonec pro n plat´ı (410)
n=
r X s X i=1 j=1
nij =
r X i=1
ni. =
s X
n.j .
j=1
Pozn´ amka: Kontingenˇcn´ı tabulka nen´ı limitovana jenom na absolutn´ı ˇcetnosti ale m˚ uˇze obsahovat i jejich relativn´ı vyj´ adˇren´ı.
146
ˇ REN ˇ ´I S´ILY ASOCIACE MEZI DVEMA ˇ ˇ ´ 17. ME KVALITATIVN´IMI PROMENN YMI
Pozn´ amka: Sestrojen´ı kontingenˇcn´ı tabulky je z´akladn´ı pˇredpoklad pro v´ ypoˇcet n´asleduj´ıc´ıch ukazatel˚ u s´ıly z´ avislosti.
2. Pearson˚ uv Ch´ı-kvadr´ at (Empirick´ a stˇ redn´ı ˇ ctvercov´ a kontingence)
Definice 2.1. Necht’ m´ ame dvourozmˇernou kontingenˇcn´ı tabulku se sdruˇzen´ ymi absolutn´ımi ˇcetnostmi nij a margin´ alnymi absolutn´ımi ˇcetnostmi ni. a n.j . Pearson˚ uv Ch´ı-kvadr´ at je definov´ an jako (411)
2
χ =
ni. n.j 2 n . ni. n.j n
r X s X nij − i=1 j=1
ˇ sen´ı ve VBA: Reˇ Sub Chi() Dim n As Single Dim r As Single Dim s As Single Dim Exp() As Single Dim SDif() As Single Dim marg nr() As Single Dim marg ns() As Single Dim Chi As Single 0 Vypocet: r = Application.CountA(Columns(2)) - 1 s = Application.CountA(Rows(2)) - 1 n = Application.Sum(Range(Cells(2, 2), Cells(r + 1, s + 1))) ReDim marg nr(1 To r) ReDim marg ns(1 To s) ReDim Exp(1 To r, 1 To s) ReDim SDif(1 To r, 1 To s) For i = 2 To r + 1 marg nr(i - 1) = Application.Sum(Range(Cells(i, 2), Cells(i, s + 1))) Next i For j = 2 To s + 1 marg ns(j - 1) = Application.Sum(Range(Cells(2, 2), Cells(r + 1, j))) Next j For i = 1 To r For j = 1 To s Exp(i, j) = marg nr(i) * marg nr(j) / n SDif(i, j) = (Cells(i + 1, j + 1) - Exp(i, j))^2 / Exp(i, j) Next j Next i Chi = Application.Sum(SDif) MsgBox ("Chi-square:"& vbTab & Chi) End Sub
´ (EMPIRICKA ´ STREDN ˇ ´I CTVERCOV ˇ ´ KONTINGENCE)147 2. PEARSON˚ UV CH´I-KVADRAT A
Tabulka 2. Pˇr´ıklad u ´pln´e kontingence yj xi \
x1 x2 .. .
y1 n11 0 .. .
y2 0 n22 .. .
··· ··· ··· .. .
yj 0 0 .. .
··· ··· ··· . ..
ys 0 0 .. .
ni. n11 n22 .. .
0 .. .
0 .. .
0 .. .
··· . ..
nij .. .
0 .. .
nij .. .
xr n.j
0 n11
0 n22
··· ···
0 nij
··· .. . ··· ···
nrs nrs
nrs n
Tabulka 3. Pˇr´ıklad nulov´e kontingence yj xi \
x1 x2 .. .
y1 1 1 .. .
y2 1 1 .. .
··· ··· ··· .. .
yj 1 1 .. .
··· ··· ··· . ..
ys 1 1 .. .
ni. n1. n2. .. .
xi .. .
1 .. .
1 .. .
··· . ..
1 .. .
1 .. .
ni. .. .
xr n.j
1 n.1
1 n.2
··· ···
1 n.j
··· .. . ··· ···
1 n.s
nr. n
Pozn´ amka: Pearson˚ uv Ch´ı-kvadr´ at m´ a n´ avaznost na rozdˇelen´ı Ch´ı-kvadr´at, se kter´ ym se setk´av´ame v teorie pravdˇepodobnosti a matematick´e statistice. I kdyˇz se definov´an´ı pravdˇepodobnosti v t´eto uˇcebnici nevˇenujeme, je vhodn´e zm´ınit, ˇze v pˇr´ıpadˇe nez´avislosti mezi dvˇema obmˇenami dvou kvalitativn´ıch znak˚ u, se pravdˇepodobnost v´ yskytu t´eto kombinace n n n vypoˇc´ıt´ a jako nni. n.j = i.n2 .j . Teoretick´e sdruˇzen´e absolutn´ı ˇcetnosti v pˇr´ıpadˇe nez´ avislosti, kter´e mˇeli b´ yt m´ısto empirick´ ych nij , z´ısk´ame jako souˇcin pravdˇepodobnosti n n n n v´ yskytu a celkov´e ˇcetnosti souboru, i.n2 .j n = i.n .j . Z´ısk´ame tak informaci, kolik statistick´ ych jednotek z celkov´eho souboru, by mˇelo danou kombinaci v hypotetick´e situaci, ˇze obmˇeny znak˚ u spolu v˚ ubec nesouvis´ı. Tud´ıˇz tento ukazatel mˇeˇr´ı, jak velmi jsou empirick´e ˇcetnosti v kontingenˇcn´ı tabulce nij vzd´aleny od teoretick´ ych ˇcetnost´ı, tedy, jak velmi se naˇse situace liˇs´ı od situace nez´avislosti. Ch´ı-kvadr´at je sumou tˇechto efekt˚ u. D˚ uvodu mocnˇen´ı tohoto rozd´ılu se v´ıce nebudeme vˇenovat, jelikoˇz m´ a uˇz n´ avaznost na zm´ınˇen´ y rozdˇelen´ı Ch´ı-kvadr´at, se kter´ ym se setk´av´ame pozdˇeji v teorii matematick´e statistiky. Pozn´ amka: Tento ukazatel nab´ yv´ a maxima pˇri u ´pln´e spjatosti mezi jednotliv´ ymi variantami kvalitativn´ıch statistick´ ych znak˚ u, tedy u ´pln´e kontingenci (napˇr´ıklad pˇr´ıpad nenulov´ ych ˇcetnost´ı jenom na diagon´ale v ˇctvercov´e kontingenˇcn´ı tabulce). Ch´ı-kvadr´at nab´ yv´ a v pˇr´ıpadˇe u ´pln´e kontingence hodnotu n (m − 1), kde m = min (r, s), tedy menˇs´ı hodnotu z hodnot definuj´ıc´ıch poˇcet ˇr´adk˚ u a poˇcet sloupc˚ u.
148
ˇ REN ˇ ´I S´ILY ASOCIACE MEZI DVEMA ˇ ˇ ´ 17. ME KVALITATIVN´IMI PROMENN YMI
3. Pearson˚ uv koeficient kontingence
Definice 3.1. Mˇejme kontingenˇcn´ı tabulku obmˇen znak˚ u x a y, poˇcet obmˇen r znaku x, poˇcet obmˇen s znaku y, poˇcet statistick´ ych jednotek n a Pearson˚ uv Ch´ı-kvadr´at χ2 vypoˇc´ıt´ an z t´eto kontingenˇcn´ı tabulky, pak Pearson˚ uv koeficient kontingence je definov´ an jako v s u χ2 u χ2 . (412) C = t n χ2 = n + χ2 1+ n Pozn´ amka: Koeficient nab´ yv´ a hodnoty nula vq pˇr´ıpadˇe nez´avislosti. Pˇri u ´pln´e kontingenci m´a q (m−1) (m−1) maximum v hodnotˇe 1+(m−1) = ı jednotkov´e (m) , kde m = min (r, s). Limitn´ maximum nikdy nedos´ ahne. Pozn´ amka: Na Pearson˚ uv koeficient kontingence m˚ uˇzeme nahl´ıˇzet jako na koeficient pr˚ umˇern´e ˇctvercov´e kontingence. ˇ sen´ı ve VBA: Reˇ Sub C() Dim n As Single Dim r As Single Dim s As Single Dim Exp() As Single Dim SDif() As Single Dim marg nr() As Single Dim marg ns() As Single Dim C As Single 0 Vypocet: r = Application.CountA(Columns(2)) - 1 s = Application.CountA(Rows(2)) - 1 n = Application.Sum(Range(Cells(2, 2), Cells(r + 1, s + 1))) ReDim marg nr(1 To r) ReDim marg ns(1 To s) ReDim Exp(1 To r, 1 To s) ReDim SDif(1 To r, 1 To s) For i = 2 To r + 1 marg nr(i - 1) = Application.Sum(Range(Cells(i, 2), Cells(i, s + 1))) Next i For j = 2 To s + 1 marg ns(j - 1) = Application.Sum(Range(Cells(2, 2), Cells(r + 1, j))) Next j For i = 1 To r For j = 1 To s Exp(i, j) = marg nr(i) * marg nr(j) / n SDif(i, j) = (Cells(i + 1, j + 1) - Exp(i, j))^2 / Exp(i, j) Next j Next i
ˇ ˚ 4. CUPROV UV KOEFICIENT KONTINGENCE
149
Chi = Application.Sum(SDif) C=sqr(Chi/(Chi+n)) MsgBox ("C:"& vbTab & C) End Sub ˇ 4. Cuprov˚ uv koeficient kontingence
Definice 4.1. Mˇejme kontingenˇcn´ı tabulku obmˇen znak˚ u x a y, poˇcet obmˇen r znaku x, poˇcet obmˇen s znaku y, poˇcet statistick´ ych jednotek n a Pearson˚ uv Ch´ı-kvadr´at χ2 ˇ vypoˇc´ıt´ an z t´eto kontingenˇcn´ı tabulky. Cuprov˚ uv koeficient kontingence je definov´an jako (413)
χ2 . K= p n (r − 1) (s − 1)
Pozn´ amka: Pˇri nez´ avislosti znak˚ u nab´ yv´ a tento ukazatel hodnotu nula a v pˇr´ıpadˇe rostouc´ı z´ avislosti se bl´ıˇz´ı k hodnotˇe jedna. Toto maximum nab´ yv´a v situaci ˇctvercov´e kontingenˇcn´ı tabulky, kde r = s a u ´pln´e kontingenci. ˇ sen´ı ve VBA: Reˇ Sub K() Dim n As Single Dim r As Single Dim s As Single Dim Exp() As Single Dim SDif() As Single Dim marg nr() As Single Dim marg ns() As Single Dim C As Single 0 Vypocet: r = Application.CountA(Columns(2)) - 1 s = Application.CountA(Rows(2)) - 1 n = Application.Sum(Range(Cells(2, 2), Cells(r + 1, s + 1))) ReDim marg nr(1 To r) ReDim marg ns(1 To s) ReDim Exp(1 To r, 1 To s) ReDim SDif(1 To r, 1 To s) For i = 2 To r + 1 marg nr(i - 1) = Application.Sum(Range(Cells(i, 2), Cells(i, s + 1))) Next i For j = 2 To s + 1 marg ns(j - 1) = Application.Sum(Range(Cells(2, 2), Cells(r + 1, j))) Next j For i = 1 To r For j = 1 To s Exp(i, j) = marg nr(i) * marg nr(j) / n SDif(i, j) = (Cells(i + 1, j + 1) - Exp(i, j))^2 / Exp(i, j) Next j
150
ˇ REN ˇ ´I S´ILY ASOCIACE MEZI DVEMA ˇ ˇ ´ 17. ME KVALITATIVN´IMI PROMENN YMI
Next i Chi = Application.Sum(SDif) K=Chi/(n*sqr((r-1)*(s-1))) MsgBox ("K:"& vbTab & K) End Sub
5. Cramer˚ uv koeficient kontingence
Definice 5.1. Mˇejme kontingenˇcn´ı tabulku obmˇen znak˚ u x a y, poˇcet obmˇen r znaku x, poˇcet obmˇen s znaku y, m = min (r, s), poˇcet statistick´ ych jednotek n a Pearson˚ uv Ch´ı-kvadr´ at χ2 vypoˇc´ıt´ an z t´eto kontingenˇcn´ı tabulky, pak Cramer˚ uv koeficient kontingence je definov´ an jako s s χ2 χ2 n = . (414) V = (m − 1) n (m − 1) Pozn´ amka: Cramer˚ uv koeficient nab´ yv´ a maxima v hodnotˇe jedna v pˇr´ıpadˇe u ´pln´e kontingence. ˇ sen´ı ve VBA: Reˇ Sub C() Dim n As Single Dim r As Single Dim s As Single Dim Exp() As Single Dim SDif() As Single Dim marg nr() As Single Dim marg ns() As Single Dim C As Single 0 Vypocet: r = Application.CountA(Columns(2)) - 1 s = Application.CountA(Rows(2)) - 1 n = Application.Sum(Range(Cells(2, 2), Cells(r + 1, s + 1))) ReDim marg nr(1 To r) ReDim marg ns(1 To s) ReDim Exp(1 To r, 1 To s) ReDim SDif(1 To r, 1 To s) For i = 2 To r + 1 marg nr(i - 1) = Application.Sum(Range(Cells(i, 2), Cells(i, s + 1))) Next i For j = 2 To s + 1 marg ns(j - 1) = Application.Sum(Range(Cells(2, 2), Cells(r + 1, j))) Next j For i = 1 To r For j = 1 To s Exp(i, j) = marg nr(i) * marg nr(j) / n SDif(i, j) = (Cells(i + 1, j + 1) - Exp(i, j))^2 / Exp(i, j) Next j Next i
5. CRAMER˚ UV KOEFICIENT KONTINGENCE
Chi = Application.Sum(SDif) m = Application.Min(r, s) C=sqr(Chi/(n*(m+1))) MsgBox ("C:"& vbTab & C) End Sub
151
KAPITOLA 18
Mˇ eˇ ren´ı s´ıly z´ avislosti kvantitativn´ı na kvalitativn´ı promˇ enn´ e 1. Jednofaktorov´ a anal´ yza rozptylu
Definice 1.1. Necht’ m´ ame n statistick´ ych jednotek, pˇriˇcemˇz kaˇzd´a statistick´a jednotka je charakterizov´ ana pˇr´ısluˇsnost´ı k jedn´e z k skupin hodnot – variantou kvalitativn´ıho znaku xi a hodnotou kvantitativn´ı znaku yi . Jednofaktorov´a anal´ yza rozptylu rozkl´ad´a celkovou variabilitu hodnot kvantitativn´ıho znaku yi na souˇcet medziskupinov´eho a vnitroskupinov´eho souˇctu ˇctverc˚ u vzd´alenost´ı poˇc´ıtan´ ych s ohledem na d´ılˇc´ı pr˚ umˇery a celkov´ y pr˚ umˇer hodnot yi sum´arnˇe pro kaˇzdou variantu kvalitativn´ıho znaku xi . Pozn´ amka: Dˇr´ıve jsme si uk´ azali, ˇze pro rozklad rozptylu u kvantitativn´ı promˇenn´e x plat´ı vˇseobecn´ı vztah k P
s2x =
(415)
j=1
k P
nj s2j
j=1
+
k P
nj (xj − x) k P
nj
j=1
(416)
s2x =
. nj
j=1
Tento vztah se d´ a zapsat s pouˇzit´ım rovnice s2j = nj k P P
2
k P
2
(xij − xj )
j=1 i=1
+
n
nj P
2
(xij − xj )
i=1 2
nj (xj − x)
j=1
n
.
V´ıme taky, ˇze celkov´ y rozptyl se d´a zapsat ve tvaru nj k P P
(417)
s2x =
(xij − x)
j=1 i=1
2
.
n
Tudiˇz plat´ı, ˇze nj k P P
(418)
nj k P P
2
(xij − x)
j=1 i=1
n
=
k P
2
(xij − xj )
j=1 i=1
n
+
2
nj (xj − x)
j=1
n
.
Konstantu n m˚ uˇzeme z rovnice lehce odstranit. Kdyˇz v´ıme, ˇze k d´ılˇc´ıch skupin kvantitativn´ıho znaku v naˇsem pˇr´ıpadˇe pˇredstavuje k variant kvalitativn´ıho znaku 152
ˇ DETERMINACE 2. POMER
153
x a kvantitativn´ı hodnoty jsou oznaˇceny jako yi , m˚ uˇzeme vztah pˇrepsat do tvaru (419)
nj k X X j=1 i=1
(420) (421)
2
(yij − y) =
nj k X X
yij − y j
2
+
k X
nj y j − y
2
.
j=1
j=1 i=1
Sy = Sy,v + Sy,m . Sy =
nj k X X
2
(yij − y) .
j=1 i=1
(422)
Sy,v =
nj k X X
yij − y j
2
.
j=1 i=1
(423)
Sy,m =
k X
nj y j − y
2
.
j=1
2. Pomˇ er determinace
Definice 2.1. Pomˇer determinace oznaˇcovan´ y i jako R2 nebo η je definov´an jako Sy,m Sy − Sy,v Sy,v P2 = = =1− . (424) Sy Sy Sy Pozn´ amka: Pomˇer determinace objasˇ nuje, do jak´e m´ıry jsou hodnoty kvantitativn´ı promˇenn´e pˇredurˇceny (determinov´ any) pˇr´ısluˇsnost´ı statistick´ ych jednotek k jednotliv´ ym variant´ am kvalitativn´ıho znaku (do jak´e m´ıry ovlivˇ nuje kvalitativn´ı promˇenn´a hodnoty kvantitativn´ı promˇenn´e). Tuto myˇslenku realizuje pomoc´ı rozkladu rozptylu, pˇriˇcemˇz ˇc´ım vˇetˇs´ı je pod´ıl medziskupinov´eho souˇctu ˇctverc˚ u na celkov´em souˇctu ˇctverc˚ u, t´ ym vˇetˇs´ı je skupinov´a determinace a ovlivnˇen´ı u ´rovnˇe hodnot variantou (menˇs´ı prostor pro individu´ aln´ı kol´ıs´an´ı kolem d´ılˇc´ıch pr˚ umˇer˚ u). Naopak, ˇc´ım vˇetˇs´ı je vnitroskupinov´ y souˇcet ˇctverc˚ u, t´ ym m´enˇe vypov´ıdaj´ıc´ı jsou d´ılˇc´ı pr˚ umˇery a hodnoty yi jsou m´enˇe spjaty s variantami kvalitativn´ı promˇenn´e (vˇetˇs´ı prostor pro individu´ aln´ı kol´ıs´ an´ı kolem d´ılˇc´ıch pr˚ umˇer˚ u variant).
ˇ ast 7 C´
´ Uvod do teorie ˇ casov´ ych ˇ rad
KAPITOLA 19
Z´ akladn´ı definice Definice 0.2.
n ˇ Casov´ a ˇrada je posloupnost hodnot v datov´em souboru, {yt }m , kde m, n ∈ N, n > m, n > 2, pro kterou plat´ı: a) Posloupnost obsahuje hodnoty stejn´eho ukazatele (funkce), kter´e se vztahuj´ı ke stejn´emu jevu, nebo objektu v r˚ uzn´ ych ˇcasov´ ych okamˇzic´ıch nebo v r˚ uzn´ ych ˇcasov´ ych intervalech. b) m-t´ a hodnota v posloupnosti, ym , se vztahuje k ˇcasov´emu okamˇziku nebo ˇcasov´emu intervalu nejv´ıce vzd´alen´emu v minulosti ze vˇsech ˇcasov´ ych hodnot nebo interval˚ u.
Pozn´ amka: Hodnoty vybran´eho ukazatele v ˇcasov´e ˇradˇe jsou uspoˇr´ad´any v z´avislosti od ˇcasov´eho okamˇziku, intervalu nebo obdob´ı, ke kter´emu se vztahuj´ı, nebo kdy byly poˇr´ızeny shora dol˚ u. Obvykle ˇcasovou ˇradu pop´ıˇseme zp˚ usobem, kdy se nalevo od vertik´alnˇe zapsan´e ˇcasov´e ˇrady nach´ az´ı i dodateˇcnˇe vloˇzen´ y sloupec, kter´ y obsahuje konkr´etn´ı ˇcasov´e u ´daje, ke kter´ ym se hodnota vztahuje. Tyto ˇcasov´e hodnoty nejsou vˇe vˇetˇsinˇe pˇr´ıpad˚ u pro n´ asledn´ı v´ ypoˇcty pˇr´ımo nijak d˚ uleˇzit´e. V teorii ˇcasov´ ych ˇrad totiˇz pracujeme s hodnotami sledovan´e charakteristiky v ˇcase a nezkoum´ame veliˇcinou ˇcasu samotnou.
Definice 0.3. Extenzitn´ı ukazatel je veliˇcina, jej´ıˇz hodnotu je moˇzn´e sestavit z hodnot d´ılˇc´ıch ˇc´ ast´ı, nebo objekt˚ u, ke kter´e se veliˇcina vztahuje. Pozn´ amka: Extenzitn´ı ukazatel je vyj´ adˇren´ım napˇr. rozsahu, rozmˇeru, nebo velikosti jevu nebo objektu a proto se taky d´ a uplatnit pravidlo seˇcten´ı d´ılˇc´ıch ˇc´ast´ı.
Definice 0.4. Intenzitn´ı ukazatel je veliˇcina, jej´ıˇz hodnotu nen´ı moˇzn´e sestavit z hodnot d´ılˇc´ıch ˇc´ ast´ı, nebo objekt˚ u, ke kter´e se veliˇcina vztahuje, pouhou sumac´ı. Pozn´ amka: Intenzitn´ı ukazatel je vyj´ adˇren´ım napˇr. u ´rovnˇe, stupnˇe, s´ıly jevu nebo objektu, pro kter´e jednoduch´e shrnov´ an´ı z d´ılˇc´ıch ˇc´ast´ı neuplatˇ nujeme. Pozn´ amka: Intenzitn´ı ukazatel je moˇzn´e sestrojit i jako pod´ıl dvou nebo v´ıce extenzivn´ıch ukazatel˚ u, napˇr. pr˚ umˇern´ y poˇcet kilometr˚ u za hodinu (rychlost) = poˇcet kilometr˚ u/ poˇcet hodin.
Definice 0.5. Absolutn´ı ukazatel kvantifikuje jedinou skuteˇcnost (veliˇcinu) bez vztahu k jin´e skuteˇcnosti. 156
´ ´I DEFINICE 19. ZAKLADN
157
Definice 0.6. Relativn´ı (Pomˇerov´y) ukazatel je pomˇerem v´ıce skuteˇcnost´ı (veliˇcin). Pozn´ amka: Z definice absolutn´ıho ukazatele vypl´ yv´a, ˇze nen´ı nikdy bezrozmˇern´ y, zat´ımco relativn´ı ukazatel bezrozmˇern´ y b´ yt m˚ uˇze. V situaci, kdyˇz jsou v pomˇeru dvˇe stejn´e veliˇciny dojde k vykr´ acen´ı spoleˇcn´ ych mˇern´ ych jednotek. V situaci pod´ılu rozd´ıln´ ych veliˇcin si relativn´ı ukazatel ponech´av´a jednotkovost ve struktuˇre, ze kter´eho se poˇc´ıt´ a.
Definice 0.7. Okamˇzikov´y ukazatel vztahuje jednotliv´e hodnoty vˇzdy k jin´emu ˇcasov´emu okamˇziku (bodu na ˇcasov´e ose). Definice 0.8. Intervalov´y ukazatel vztahuje jednotliv´e hodnoty vˇzdy k jin´emu ˇcasov´emu intervalu, nebo obdob´ı, pˇriˇcemˇz d´elka tohoto intervalu m˚ uˇze ovlivˇ novat hodnotu ukazatel. Pozn´ amka: V pˇr´ıpadˇe intervalov´eho ukazatele nen´ı jedno, jestli mˇeˇr´ıme sledovan´ y ukazatel (napˇr. celkov´e v´ ydaje, nebo poˇcet n´avˇstˇev webov´e str´anky) za kvart´al, nebo roˇcnˇe. Hodnota pˇr´ımo z´ avis´ı na zvolen´e ˇcasov´e jednotce. V pˇr´ıpadˇe okamˇzikov´e ˇcasov´e ˇrady (napˇr. stav materi´ alu na sklade ke konci mˇes´ıce) se snaˇz´ıme zachytit funkˇcn´ı hodnotu v konkr´etn´ım ˇcasov´em okamˇziku ve vˇseobecnˇe spojit´em v´ yvoji hodnot sledovan´eho ukazatele.
Definice 0.9. ˇ Casov´ a ˇrada, kter´ a se sklad´ a z hodnot okamˇzikov´eho ukazatele, se oznaˇcuje jako okamˇzikov´ a ˇcasov´ a ˇrada. Definice 0.10.
ˇ Casov´ a ˇrada, kter´ a se sklad´ a z hodnot intervalov´eho ukazatele, se oznaˇcuje jako intervalov´ a ˇcasov´ a ˇrada.
Definice 0.11.
ˇ Casov´ a ˇrada, ve kter´e se jednotliv´e hodnoty ukazatele sestavuj´ı s periodou menˇs´ı neˇzli jednou roˇcnˇe, se oznaˇcuje jako kr´ atkodob´ a ˇcasov´a ˇrada.
Definice 0.12. ˇ Casov´ a ˇrada, ve kter´e se jednotliv´e hodnoty ukazatele sestavuj´ı s periodou delˇs´ı nebo rovnou jednomu roku se oznaˇcuje jako dlouhodob´ a ˇcasov´a ˇrada.
KAPITOLA 20
Z´ akladn´ı charakteristiky ˇ casov´ eˇ rady 1. Obecn´ au ´ roveˇ nˇ casov´ eˇ rady
Definice 1.1. Obecn´ au ´roveˇ n hodnot intervalov´e ˇcasov´e ˇrady absolutn´ıho ukazatele se charakterizuje pomoc´ı aritmetick´eho pr˚ umˇer˚ u. Definice 1.2. Obecn´ au ´roveˇ n hodnot okamˇzikov´e ˇcasov´e ˇrady absolutn´ıho ukazatele se charakterizuje pomoc´ı chronologick´eho pr˚ umˇer˚ u. 1.1. Prost´ y chronologick´ y pr˚ umˇ er.
Definice 1.3. Mˇejme ˇcasovou ˇradu n hodnot okamˇzikov´eho ukazatele yt , kter´e se vztahuj´ı k periodicky se opakuj´ıc´ım okamˇzik˚ um v ˇcase, pak obecnou u ´roveˇ n hodnot t´eto ˇcasov´e ˇrady vypoˇcteme podle vzorce prost´eho chronologick´eho pr˚ umˇeru y1 +y2 n−1 3 + y2 +y + . . . + yn−2 +y + yn−12+yn 2 2 2 xt = = n−1 (425) n−1 P y1 + yt + y2n y1 yn 2 + y + . . . + y + 2 n−1 t=2 2 2 = = . n−1 n−1 Pozn´ amka: Konstrukce chronologick´eho pr˚ umˇeru sest´av´a z d´ılˇc´ıch aritmetick´ ych pr˚ umˇer˚ u sousedn´ıch dvojic hodnot. T´ımto zp˚ usobem je zachov´ana ˇcasov´a kontinuita a je zjiˇstˇena stˇredn´ı hodnota pro cel´ y d´ılˇc´ı interval mezi sousedn´ımi, stejnˇe ˇcasovˇe vzd´alen´ ymi okamˇziky. Tyto stˇredn´ı hodnoty jsou n´aslednˇe opˇet zpr˚ umˇerov´any. ˇ sen´ı ve VBA: Reˇ Sub CHMean() Dim CHMean As Single Dim x t() As Single Dim n As Integer Dim t As Integer 0 Vypocet: n = Application.CountA(Columns(2)) - 1 ReDim x t(1 To n) For t = 1 To n - 1 x t(t) = (Cells(t + 1, 2) + Cells(t + 2, 2))/2 Next t CHMean = Application.Sum(x t) / (n - 1) 158
´ UROVE ´ ˇ CASOV ˇ ´ RADY ˇ 1. OBECNA N E
159
MsgBox ("CHMean:"& vbTab & CHMean) End Sub nebo Sub CHMean() Dim CHMean As Single ’Definice promennych kvuli rezervaci pameti Dim n As Integer Dim t As Integer Dim x 1 As Single Dim x n As Single Dim Suma As Single 0 Vypocet: n = Application.CountA(Columns(2)) - 1 x 1 = Cells(2, 2) / 2 x n = Cells(n + 1, 2) / 2 Suma = Application.Sum(Range(Cells(3, 2), Cells(n, 2))) CHMean = (x 1 + Suma + x n) / (n - 1) MsgBox ("CHMean:"& vbTab & CHMean) End Sub 1.2. V´ aˇ zen´ y chronologick´ y pr˚ umˇ er.
Definice 1.4. Mˇejme ˇcasovou ˇradu n hodnot okamˇzikov´eho ukazatele yt , kter´e se vztahuj´ı k neperiodicky se opakuj´ıc´ım okamˇzik˚ um v ˇcase v ˇcase, a dt je uplynul´ y ˇcas mezi dvˇema sousedn´ımi body (okamˇziky), pak obecnou u ´roveˇ n hodnot t´eto ˇcasov´e ˇrady vypoˇcteme podle vzorce v´ aˇzen´eho chronologick´eho pr˚ umˇeru +yn y1 +y2 y2 +y3 n−1 d1 + d2 + . . . + yn−2 +y dn−1 d2 + yn−1 2 2 2 d n−2 (426) x = . t d1 + d2 + . . . + dn−1 Pozn´ amka: V porovn´ an´ı s prost´ ym chronologick´ ym pr˚ umˇerem, ˇcasov´e diference dt pln´ı u ´lohu vah, jelikoˇz kaˇzd´ y d´ılˇc´ı ”mezipr˚ umˇer“ vypoˇcten ze dvou sousedn´ıch okamˇzikov´ ych hodnot zastupuje jinak dlouh´ y ˇcasov´ y u ´sek a tud´ıˇz mus´ı m´ıt ve v´ ypoˇctu i jinou v´ ahu. ˇ sen´ı ve VBA: Reˇ Sub CHMean() Dim CHMean As Single Dim x t() As Single Dim y t() As Single Dim d() As Single Dim n As Integer Dim i As Integer Dim t As Integer n = Application.CountA(Columns(2)) - 1 ReDim y t(1 To n)
´ ´I CHARAKTERISTIKY CASOV ˇ ´ RADY ˇ 20. ZAKLADN E
160
ReDim d(1 To n - 1) ReDim x t(1 To n - 1) For i = 1 + 1 To n + 1 y t(i - 1) = Cells(i, 2) Next i For i = 1 + 1 To n d(i - 1) = Cells(i, 3) Next i For t = 1 To n - 1 x t(t) = ((y t(t) + y t(t + 1)) / 2) * d(t) Next t CHMean = Application.Sum(x t) / Application.Sum(d) MsgBox ("CHMeana:"& vbTab & CHMean) End Sub
2. Absolutn´ı m´ıry dynamiky 2.1. Absolutn´ı diference – absolutn´ı pˇ r´ır˚ ustky.
Definice 2.1. Mˇejme ˇcasovou ˇradu n hodnot ukazatele yt , pak absolutn´ı diference, ∆t , kde t = 1, 2, . . . , n − 1, jsou ve tvaru ∆t = yt+1 − yt .
(427)
2.2. Pr˚ umˇ ern´ y absolutn´ı pˇ r´ır˚ ustek.
Definice 2.2. Mˇejme ˇcasovou ˇradu n hodnot ukazatele yt a ∆t jsou absolutn´ı diference, pak umˇeru pr˚ umˇern´ y absolutn´ı pˇr´ır˚ ustek, ∆t , je ve tvaru aritmetick´eho pr˚
(428)
∆t =
n−1 1 X ∆t . n − 1 t=1
ta 2.1. Pr˚ Ve umˇern´y absolutn´ı pˇr´ır˚ ustek, ∆t , se d´ a pˇrepsat do v´ypoˇcetn´ıho tvaru
(429)
∆t =
n−1 1 X yn − y1 ∆t = . n − 1 t=1 n−1
3. RELATIVN´I M´IRY DYNAMIKY - UKAZATELE TEMPA R˚ USTU
161
D˚ ukaz. (430) n−1 1 X ∆t = ∆t = n − 1 t=1 = = = = = =
(y2 − y1 ) + (y3 − y2 ) + (y4 − y3 ) + . . . + (yn−1 − yn−2 ) + (yn − yn−1 ) = n−1 y2 − y1 + y3 − y2 + y4 − y3 + . . . + yn−1 − yn−2 + yn − yn−1 = n−1 −y1 + y2 − y2 + y3 − y3 + . . . − yn−2 + yn−1 − yn−1 + yn = n−1 −y1 + (y2 − y2 ) + (y3 − y3 ) + . . . + (yn−1 − yn−1 ) + yn = n−1 −y1 + 0 + 0 + . . . + 0 + yn = n−1 yn − y1 . n−1 3. Relativn´ı m´ıry dynamiky - ukazatele tempa r˚ ustu
3.1. Relativn´ı pˇ r´ır˚ ustky.
Definice 3.1. Mˇejme ˇcasovou ˇradu n hodnot ukazatele yt a ∆t jsou absolutn´ı diference, pak 0 relativn´ı pˇr´ır˚ ustky, ∆t , kde t = 1, 2, . . . , n − 1, jsou ve tvaru 0 ∆t yt+1 − yt yt+1 (431) ∆t = = = − 1. yt yt yt 3.2. Pr˚ umˇ ern´ y relativn´ı pˇ r´ır˚ ustek. 3.3. Koeficienty r˚ ustu.
Definice 3.2. Mˇejme ˇcasovou ˇradu n hodnot ukazatele yt , pak koeficienty r˚ ustu, kt , kde t = 1, 2, . . . , n − 1 jsou ve tvaru yt+1 (432) kt = . yt 3.4. Pr˚ umˇ ern´ y koeficient r˚ ustu.
Definice 3.3. Mˇejme ˇcasovou ˇradu n hodnot ukazatele yt a kt jsou koeficienty r˚ ustu, pak pr˚ umˇern´ y koeficient r˚ ustu, k t , je ve tvaru geometrick´eho pr˚ umˇeru v un−1 uY n−1 (433) k = t k t
t
t=1
ta 3.1. Pr˚ Ve umˇern´y koeficient r˚ ustu, k t , se d´ a pˇrepsat do v´ypoˇcetn´ıho tvaru (434)
v un−1 uY n−1 kt = t kt = t=1
r n−1
yn y1
´ ´I CHARAKTERISTIKY CASOV ˇ ´ RADY ˇ 20. ZAKLADN E
162
D˚ ukaz. v un−1 uY n−1 kt = t kt =
r
y2 y3 y4 yn−1 yn ··· = y y y yn−2 yn−1 1 2 3 t=1 r r 1 11 1 yn yn = n−1 ··· = n−1 . y1 1 1 1 1 y1
(435)
n−1
ˇ ezov´ 3.5. Retˇ y index.
Definice 3.4. Mˇejme ˇcasovou ˇradu n hodnot ukazatele yt , pak ˇretˇezov´y index it/(t−1) , kde 2 ≤ t ≤ n, je ve tvaru yt . (436) it/(t−1) = yt−1 Pozn´ amka: Pˇri bliˇzˇs´ım pohledu zjist´ıme, ˇze ˇretˇezov´ y index m´a stejnou matematickou konstrukci jako koeficient r˚ ustu. Odliˇsuje se maxim´alnˇe sv´ ym oznaˇcen´ım. D˚ uvod je ten, ˇze ˇretˇezov´ y a bazick´ y index ˇcerp´a z hodnot ˇcasov´ ych ˇrad ale obsahovˇe je v´ıce spojen s teori´ı index˚ u, se kterou se setk´ame pozdˇeji. 3.6. Bazick´ y index.
Definice 3.5. Mˇejme ˇcasovou ˇradu n hodnot ukazatele yt , b je pomocn´ y poˇradov´ y index hodnoty, se kterou budeme srovn´ avat vˇsechny hodnoty ˇcasov´e ˇrady, pak bazick´y index it/(b) , kde 1 ≤ t ≤ n; 1 ≤ b ≤ n, je ve tvaru yt (437) it/(b) = . yb ta 3.2. Kdyˇz t < b plat´ı, Ve (438)
it/b =
yt yt−1 yb+1 ··· = it/(t−1) i(t−1)/(t−2) . . . i(b+1)/b . yt−1 yt−2 yb
D˚ ukaz. V d˚ ukazu pouˇzijeme stejn´ y princip jako v d˚ ukazu vˇety 3.1 (strana 161).
ta 3.3. Kdyˇz t < b > 2 plat´ı, Ve (439)
it/(b) =
D˚ ukaz. (440)
it/b =
yt = yb
it/(t−1) . ib/(t−1)
yt yt−1 yb yt−1
=
it/(t−1) . ib/(t−1)
Pozn´ amka: Bazick´e indexy se daj´ı sestrojit tak´e s pomoc´ı ˇretezov´ ych index˚ u.
KAPITOLA 21
´ Uvod do vyrovn´ av´ an´ı hodnot ˇ casov´ eˇ rady Pozn´ amka: Metod vyhlazovan´ı ˇcasov´e ˇrady vyuˇz´ıv´ame v situaci rozkol´ısan´e ˇcasov´e ˇrady, tedy ˇcasov´e ˇrady s vysokou variabilitou hodnot znaku. 1. Prost´ e klouzav´ e pr˚ umˇ ery
Definice 1.1. Mˇejme ˇcasovou ˇradu n hodnot ukazatele yt . Jestli chceme vyhladit ˇcasovou ˇradu po u ´sec´ıch m hodnot a konstanta m se d´a vyj´adˇrit ve tvaru m = 2c + 1, kde c je sud´e ˇc´ıslo, pouˇzijeme prost´ych klouzav´ych pr˚ umˇer˚ u y t , kde c < t ≤ n − c, ve tvaru c P
(441)
yt =
yt+i
i=−c
m
=
yt−c + yt−c+1 + . . . + yt+c−1 + yt+c . m
ˇ sen´ı ve VBA: Reˇ Sub MovAver() Dim n As Integer Dim i As Integer Dim j As Integer Dim y t() As Single Dim MovAver() As Single Dim x 1 As Single Dim x n As Single Dim Suma As Single n = Application.CountA(Columns(2)) - 1 ReDim MovAver(1 To n - 2 * c) ReDim y t(1 To n) For i = 1 + 1 To n + 1 y t(i - 1) = Cells(i, 2) Next i c = 2 For i = 1 To n - 2 * c Suma = 0 For j = 0 To 2 * c + 1 - 1 Suma = Suma + y t(i + j) Next j MovAver(i) = Suma / (2 * c + 1) Cells(1 + c + i, 3) = MovAver(i) Next i 163
164
´ ´ AN ´ ´I HODNOT CASOV ˇ ´ RADY ˇ 21. UVOD DO VYROVNAV E
End Sub
2. Centrovan´ e klouzav´ e pr˚ umˇ ery
Definice 2.1. Mˇejme ˇcasovou ˇradu n hodnot ukazatele yt . Jestli chceme vyhladit ˇcasovou ˇradu po u ´sec´ıch m hodnot a konstantu m se d´a vyj´adˇrit ve tvaru m = 2c, kde c je sud´e ˇc´ıslo, pouˇzijeme centrovan´ych klouzav´ych pr˚ umˇer˚ u y t , kde c < t ≤ n − c, ve tvaru c−1 c P yt+i P yt+i + m m (442) i=−c i=−c+1 yt = . 2 ˇ sen´ı ve VBA: Reˇ Sub MovAver() Dim n As Integer Dim i As Integer Dim j As Integer Dim y t() As Single Dim MovAver() As Single Dim Suma1 As Single Dim Suma2 As Single n = Application.CountA(Columns(2)) - 1 ReDim MovAver(1 To n - 2 * c) ReDim y t(1 To n) For i = 1 + 1 To n + 1 y t(i - 1) = Cells(i, 2) Next i c = 2 For i = 1 To n - 2 * c Suma1 = 0 Suma2 = 0 For j = 0 To 2 * c - 1 Suma1 = Suma1 + y t(i + j) Suma2 = Suma2 + y t(i + j + 1) Next j MovAver(i) = (Suma1 / (2 * c) + Suma2 / (2 * c)) / 2 Cells(1 + c + i, 3) = MovAver(i) Next i End Sub
ta 2.1. Z´akladn´ı tvar centrovan´eho klouzav´eho pr˚ a pˇrepsat do Ve umˇeru y t , se d´ v´ypoˇcetn´ıho tvaru (443)
yt−c 2
yt =
+
c−1 P i=−c+1
m
yt+i +
yt+c 2
.
´ KLOUZAVE ´ PR˚ ˇ 2. CENTROVANE UMERY
165
D˚ ukaz. c−1 P yt = = (444)
i=−c
yt+i m
+
c P
i=−c+1
yt+i m
2
=
yt−c +y−c+1 +...+yt+c−2 +yt+c−1 + m
2 t+c−1 +yt+c + yt−c+1 +yt−c+2 +...+y m
= 2 yt−c + 2y−c+1 + 2yt−c+2 + . . . + 2yt+c−2 + 2yt+c−1 + yt+c = = 2m c−1 P yt−c + yt+i + yt+c 2 2 i=−c+1 = . m
Pozn´ amka: Pˇri bliˇzˇs´ım pohledu na v´ ypoˇcetn´ı tvar zjist´ıme, ˇze centrovan´e klouzav´e pr˚ umˇery maj´ı stejnou matematickou konstrukci jako m´a chronologick´ y pr˚ umˇer, kter´ y d´av´a krajn´ım hodnot´ am poloviˇcn´ı v´ahu. ˇ sen´ı ve VBA: Reˇ Sub MovAver() Dim MovAver() As Single Dim n As Integer Dim t As Integer Dim x s As Single Dim x f As Single Dim c As Single Dim Suma As Single n = Application.CountA(Columns(2)) - 1 c = 2 ReDim MovAver(1 To n - 2 * c) For t = 3 To n - c x s = Cells(t - c + 1, 2) / 2 x f = Cells(t + c + 1, 2) / 2 Suma = Application.Sum(Range(Cells(t - c + 1 + 1, 2), Cells(t + c - 1 + 1, 2))) MovAver(t - c) = (x s + Suma + x f) / (2 * c) Cells(t + 1, 3) = MovAver(t - c) Next t End Sub
ˇ ast 8 C´
´ Uvod do teorie hospod´ aˇ rsk´ ych index˚ u
KAPITOLA 22
´ Uvodn´ ı definice Definice 0.2. Bˇeˇzn´e obdob´ı je ˇcasov´ y interval nebo okamˇzik, ke kter´emu se vztahuje hodnota ukazatele, o kter´e chceme zjistit, nakolik se liˇs´ı od hodnoty stejn´eho ukazatele v jin´em ˇcasov´em obdob´ı. Definice 0.3. Z´ akladn´ı obdob´ı je jin´e ˇcasov´e obdob´ı v definici bˇeˇzn´eho obdob´ı. Pozn´ amka: Symbolick´e oznaˇcen´ı pro hodnotu ukazatele v bˇeˇzn´em obdob´ı je symbol ukazatele s pomocn´ ym matematick´ ym indexem jedna ( )1 . Oznaˇcen´ı pro ukazatel v z´akladn´ım obdob´ı je pomocn´ı index nula ( )0 .
Definice 0.4. Statistick´y index je ukazatel vztahu hodnot dvou nebo v´ıce statistick´ ych znak˚ u. Definice 0.5. Hospod´ aˇrsk´y index je pomˇern´e ˇc´ıslo, kter´e ud´av´a, kolikr´at je hodnota ukazatele v bˇeˇzn´em obdob´ı vˇetˇs´ı neˇz hodnota v z´akladn´ım obdob´ı. Pozn´ amka: Teorie hospod´ aˇrsk´ ych index˚ u pouˇz´ıv´a vlastn´ı klasifikaci ukazatel˚ u, kter´a je odliˇsn´a od jin´ ych oblast´ı a rovnˇeˇz sv´e vlastn´ı symbolick´e oznaˇcen´ı, kter´e ˇcerp´a zejm´ena z ekonomie.
Definice 0.6. Teorie hospod´ aˇrsk´ ych index˚ u dˇel´ı ukazatele n´asledovnˇe: a) ukazatele mnoˇzstv´ı (objemov´e ukazatele), b) ukazatele u ´rovnˇe (cenov´e ukazatele), c) ukazatele celkov´e hodnoty.
Definice 0.7. Ukazatel mnoˇzstv´ı (objemov´ y ukazatel) je nepenˇeˇzn´ı extenzitn´a veliˇcina, ke kter´e je moˇzn´e pˇriˇradit penˇeˇzn´ı hodnotu. Ukazatel se symbolicky oznaˇcuje jako q. Definice 0.8. Ukazatel u ´rovnˇe (cenov´ y ukazatel) je intenzitn´ı veliˇcina, kter´a ud´av´a penˇeˇzn´ı hodnotu jednotky v ukazateli mnoˇzstv´ı. Ukazatel se symbolicky oznaˇcuje jako q. Definice 0.9. Ukazatel hodnoty je extenzitn´ı veliˇcina, kter´a se d´a sestrojit jako souˇcin ukazatele mnoˇzstv´ı a u ´rovnˇe. Ukazatel se symbolicky oznaˇcuje jako Q. 168
´ ´I DEFINICE 22. UVODN
Definice 0.10. Mezi ukazateli plat´ı jednoznaˇcn´e vztahy (445)
Q = pq.
Pozn´ amka: Kdyˇz tento vztah zkombinujeme se znalostmi obdob´ı, pak pro z´ akladn´ı obdob´ı plat´ı (446)
Q0 = p0 q0 ,
a pro bˇeˇzn´e obdob´ı plat´ı (447)
Q1 = p1 q1 .
169
KAPITOLA 23
Individu´ aln´ı jednoduch´ e indexy Definice 0.11. Necht’ Q0 je ukazatel celkov´e hodnoty v z´akladn´ım obdob´ı a Q1 celkov´e hodnoty v bˇeˇzn´em obdob´ı. Pak je individu´aln´ı jednoduch´ y index celkov´e hodnoty definovan´ y jako p1 q1 Q1 = . (448) IQ = Q0 p0 q0
Definice 0.12. Necht’ q0 je objemov´ y ukazatel v z´akladn´ım obdob´ı a q1 objemov´ y ukazatel v bˇeˇzn´em obdob´ı. Pak je individu´ aln´ı jednoduch´ y objemov´ y index definovan´ y jako (449)
Iq =
q1 = q0
Q1 p1 Q0 p0
.
Definice 0.13. Necht’ p0 je cenov´ y ukazatel v z´akladn´ım obdob´ı a p1 cenov´ y ukazatel v bˇeˇzn´em obdob´ı. Pak je individu´ aln´ı jednoduch´ y cenov´ y index definovan´ y jako (450)
Ip =
p1 = p0
Q1 q1 Q0 q0
.
ta 0.2. Plat´ı Ve (451)
IQ = Ip Iq .
D˚ ukaz. V´ıme, ˇze plat´ı (452)
Q0 = p0 q0 ,
(453)
Q1 = p1 q1 .
Pak mus´ı rovnˇeˇz platit (454) (455) (456)
Q1 p1 q1 = . Q0 p0 q0 Q1 p1 q1 = . Q0 p0 q0 IQ = Ip Iq .
170
KAPITOLA 24
Individu´ aln´ı sloˇ zen´ e indexy 1. Sloˇ zen´ y index celkov´ e hodnoty
Definice 1.1. Necht’ m´ ame n jednotek, ke kter´ ym se vztahuj´ı nesleduj´ıc´ı ukazatele. Qi0 je d´ılˇc´ı ukazatel celkov´e hodnoty v z´ akladn´ım obdob´ı asociovan´ y s i-tou jednotkou z´ajmu a Qi1 d´ılˇc´ı ukazatel celkov´e hodnoty v bˇeˇzn´em obdob´ı asociovan´ y s i-tou jednotkou z´ ajmu. Pak sloˇzen´y index celkov´e hodnoty je definovan´ y jako n n P P pi1 qi1 Qi1 i=1 = . (457) I(P Q) = i=1 n n P P Qi0 pi0 qi0 i=1
i=1
Pozn´ amka: Sloˇzen´e indexy se daj´ı zapsat i s pouˇzit´ım jednoduch´ ych index˚ u. Jelikoˇz plat´ı vˇseobecn´ı vztah Q1 (458) IQ = , Q0 mus´ı tento a dalˇs´ı vztahy z jednoduch´ ych index˚ u platit rovnˇeˇz pro konkr´etn´ı jednotky z´ ajmu Qi (459) IQi = 1 . Qi0 Proto rovnˇeˇz plat´ı po dosazen´ı jednou za Qi1 a po druh´e za Qi0 n n P P Qi1 IQi Qi0 i=1 i=1 P = P . (460) I( Q) = P n n Qi0 Qi0 i=1 n P
(461)
I(P Q) = i=1 n P
i=1
Qi1 Qi0
i=1
n P
Qi1 = i=1 . n P Qi1 i=1
IQ i
V prvn´ım pˇr´ıpadˇe se jedn´ a o v´aˇzen´ y aritmetick´ y pr˚ umˇer, kde v´ahy zastupuj´ı d´ılˇc´ı ukazatele celkov´e hodnoty v jednotk´ach z´ajmu v bˇeˇzn´em obdob´ı a jednoduch´ y index IQi zastupuje hodnoty symbolick´eho znaku v definici aritmetick´eho pr˚ umˇeru xi . V druh´em pˇr´ıpadˇe se jedn´ a o v´aˇzen´ y harmonick´ y pr˚ umˇer, kde v´ahy zastupuj´ı d´ılˇc´ı ukazatele celkov´e hodnoty v jednotk´ach z´ajmu v bˇeˇzn´em obdob´ı a jednoduch´ y index IQi zastupuje hodnoty symbolick´eho znaku v definici aritmetick´eho pr˚ umˇeru xi . 171
172
´ ´I SLODENE ´ INDEXY 24. INDIVIDUALN
2. Sloˇ zen´ y objemov´ y index
Definice 2.1. Necht’ m´ ame n jednotek, ke kter´ ym se vztahuj´ı nesleduj´ıc´ı ukazatele. qi0 je objemov´ y d´ılˇc´ı ukazatel v z´ akladn´ım obdob´ı asociovan´ y s i-tou jednotkou z´ajmu a qi1 objemov´ y d´ılˇc´ı ukazatel v bˇeˇzn´em obdob´ı asociovan´ y s i-tou jednotkou z´ajmu. Pak je sloˇzen´y objemov´y index definovan´ y jako n P
(462)
i=1 n P
I(P q) =
n P
qi1
i=1 n P
= qi0
i=1
i=1
Qi1 pi1
.
Qi0 pi0
Pozn´ amka: Tento index se d´ a rovnˇeˇz zapsat s pomoc´ı jednoduch´ ych index˚ u n P
(463)
I(P q) = i=1 n P
n P
qi1 = qi0
i=1
. qi0
i=1
n P
(464)
Iqi qi0
i=1 n P
I(P Q) = i=1 n P
Qi1 Qi0
n P
qi1 . = i=1 n P qi1
i=1
i=1
Iqi
3. Index promˇ enliv´ eho sloˇ zen´ı
Definice 3.1. umˇern´ y Necht’ m´ ame n jednotek, ke kter´ ym se vztahuj´ı nesleduj´ıc´ı ukazatele. p0 je pr˚ cenov´ y ukazatel na mˇernou jednotku veliˇciny objemov´eho ukazatele v z´akladn´ım obdob´ı a p1 je pr˚ umˇern´ y cenov´ y ukazatel na mˇernou jednotku veliˇciny objemov´eho ukazatele v bˇeˇzn´em obdob´ı. Pak index promˇenliv´eho sloˇzen´ı je definovan´ y jako n P
(465)
I(p) =
p1 = p0
n P
pi1 qi1
i=1 n P
i=1 n P
qi1
=
pi0 qi0
i=1 n P
i=1
i=1 n P
qi0
i=1 n P i=1 n P i=1
Qi1 qi1
. Qi0 qi0
Pozn´ amka: D˚ uvod, proˇc se sloˇzen´ y cenov´ y index naz´ yv´a jinak a proˇc je tak konstruov´an spoˇc´ıv´ a zejm´ena v jin´e povaze cenov´ ych ukazatel˚ u. Cenov´e ukazatele jsou vˇzdy ve vztahu k mˇern´e jednotce objemov´eho ukazatele. Tud´ıˇz nen´ı moˇzn´e pˇri sledov´an´ı celkov´e zmˇeny jednoduˇse shrnout d´ılˇc´ı hodnoty tohoto ukazatele v bˇeˇzn´em obdob´ı a z´ akladn´ım obdob´ı. Pˇri sledov´ani celkov´e zmˇeny t´eto veliˇciny pro v´ıce vˇecn´ ych jednotek z´ ajmu mus´ıme vz´ıt v u ´vahu pr´avˇe objemov´ y ukazatel, kter´ y stanovuje ”v´ yznamnost”dan´e vˇecn´e jednotky z´ajmu, coˇz ve sv´e podstatˇe implikuje pouˇzit´ı v´ aˇzen´eho pr˚ umˇeru. Tyto v´ ahy se mˇen´ı nejen mezi vˇecn´ ymi jednotkami z´ajmu ale rovnˇeˇz mezi obdob´ımi, z ˇcehoˇz plyne i samotn´ y n´azev.
ˇ ´ 3. INDEX PROMENLIV EHO SLODEN´I
173
Pozn´ amka: Tento index je kombinac´ı vlivu zmˇen d´ılˇc´ıch cenov´ ych ukazatel˚ u (struktury) ale rovnˇeˇz d´ılˇc´ıch objemov´ ych index˚ u (sloˇzen´ı).
ta 3.1. Plat´ı Ve (466)
I(P Q) = I(p) I(P q) .
D˚ ukaz. Plat´ı n P
I(P Q) = i=1 n P i=1 n P
(467)
Qi0
= i=1 n P
pi1 qi1
= i=1 n P
=
n P
Qi1
n P
pi1 qi1 pi0 qi0
i=1 n P
n P
i=1 n P
i=1 n P
q i0
pi1 qi1
· 1 = i=1 n P qi1
pi0 qi0 q i1 qi0 i=1 i=1 i=1 P n pi1 qi1 n i=1 P P n q q i i=1 1 i=1 i1 n = P n pi0 qi0 P qi 0 i=1 n i=1 P qi0
pi0 qi0 i=1 P n
P n i=1 n P
pi1 qi1
i=1 = n P
pi0 qi0
i=1
qi0
qi1
i=1 n P
i=1 n P
q i0
qi0 i=1 P n
i=1 n P
q i1
i=1 n P
i=1
qi1
n P
=
qi1 =
qi0
.
i=1
I(p) I(P q) .
i=1
KAPITOLA 25
Souhrn´ e indexy - Indexy st´ al´ eho sloˇ zen´ı a struktury 1. Objemov´ e souhrn´ e indexy - Indexy st´ al´ e struktury
Definice 1.1. Necht’ pi0 a qi0 je d´ılˇc´ı objemov´ y a cenov´ y ukazatel v z´akladn´ım obdob´ı asociovan´ ys i-tou jednotkou z´ ajmu a pi1 a qi1 je d´ılˇc´ı cenov´ y objemov´ y ukazatel v bˇeˇzn´em obdob´ı asociovan´ y s i-tou jednotkou z´ajmu, pak Laspeyres˚ uv objemov´y index je definov´an jako n P
pi0 qi1
i=1 n P
IqL
(468)
=
i=1 n P
n P
pi0
=
pi0 qi0
i=1 n P
i=1
i=1 n P
pi0 qi1 . pi0 qi0
i=1
pi0
Pozn´ amka: I tento index se d´ a vyj´ adˇrit s pomoc´ı jednoduch´ ych index˚ u n P
(469)
n P
pi0 qi1
IqL = i=1 n P
= pi0 qi0
i=1 n P
i=1
n P
pi0 qi0 IQi = pi0 qi0
Qi0 IQi
i=1 n P
i=1
. Qi0
i=1
V tomto pˇr´ıpadˇe tvoˇr´ı celkov´ y hodnotov´ y ukazatel v z´akladn´ım obdob´ı v´ahy pˇriˇrazovan´e k d´ılˇc´ım jednoduch´ ym indexem.
Definice 1.2. Necht’ pi0 a qi0 je d´ılˇc´ı objemov´ y a cenov´ y ukazatel v z´akladn´ım obdob´ı asociovan´ ys i-tou jednotkou z´ ajmu a pi1 a qi1 je d´ılˇc´ı cenov´ y objemov´ y ukazatel v bˇeˇzn´em obdob´ı asociovan´ y s i-tou jednotkou z´ ajmu, pak Pascheho objemov´y index je definov´an jako n P
pi1 qi1
i=1 n P
(470)
IqP =
i=1 n P
pi1
pi1 qi0
i=1 n P
i=1
pi1
. 174
n P
= i=1 n P i=1
pi1 qi1 . pi1 qi0
´ SOUHRNNE ´ INDEXY - INDEXY STAL ´ EHO ´ 2. CENOVE SLODEN´I
175
Pozn´ amka: S pomoc´ı jednoduch´ ych index˚ u se d´a ukazatel zapsat ve tvaru n P
IqP = i=1 n P
(471)
n P
pi1 qi1
i=1 = P n
pi1 qi0
i=1
i=1
pi1 qi1 q
pi1 IQi1
n P
Qi0 = i=1 . n P Qi0
i
i=1
IQ i
Lehce zjist´ıme, ˇze jde o v´ aˇzen´ y harmonick´ y pr˚ umˇer d´ılˇc´ıch jednoduch´ ych index˚ u.
Definice 1.3. Necht’ IqL je Laspeyres˚ uv objemov´ y index a IqP je Pascheho objemov´ y index, pak Fischer˚ uv objemov´y index je definov´an jako q (472) IqF = IqL IqP . Pozn´ amka: V souhrnn´ ych objemov´ ych indexech sledujeme jenom zmˇenu objemov´eho ukazatele jelikoˇz cenov´e v´ ahy z˚ ust´ avaj´ı fixn´ı a v´aˇzou se k nˇekter´emu obdob´ı. V´ yjimku tvoˇr´ı Fischer˚ uv index, kter´ y je geometrick´ ym pr˚ umˇerem tˇechto index˚ u.
2. Cenov´ e souhrnn´ e indexy - Indexy st´ al´ eho sloˇ zen´ı
Definice 2.1. Necht’ pi0 a qi0 je d´ılˇc´ı objemov´ y a cenov´ y ukazatel v z´akladn´ım obdob´ı asociovan´ ys i-tou jednotkou z´ ajmu a pi1 a qi1 je d´ılˇc´ı cenov´ y objemov´ y ukazatel v bˇeˇzn´em obdob´ı asociovan´ y s i-tou jednotkou z´ ajmu, pak Laspeyres˚ uv cenov´y index je definov´an jako n P
pi1 qi0
i=1 n P
IpL
(473)
=
i=1 n P
=
pi0 qi0
i=1 n P
i=1
n P
qi0
i=1 n P
pi1 qi0 . pi0 qi0
i=1
qi0
. Pozn´ amka: Vyj´ adˇren´ı s pomoc´ı jednoduch´ ych index˚ u je ve tvaru n P
(474)
IqL
=
i=1 n P i=1
n P
pi1 qi0 = pi0 qi0
n P
IQi pi0 qi0
i=1 n P i=1
= pi0 qi0
Qi0 IQi
i=1 n P
. Qi0
i=1
Vid´ıme, ˇze se tvar neliˇs´ı od pˇr´ıpadu Laspeyrova objemov´eho souhrnn´eho indexu.
Definice 2.2. Necht’ pi0 a qi0 je d´ılˇc´ı objemov´ y a cenov´ y ukazatel v z´akladn´ım obdob´ı asociovan´ ys i-tou jednotkou z´ ajmu a pi1 a qi1 je d´ılˇc´ı cenov´ y objemov´ y ukazatel v bˇeˇzn´em obdob´ı
´ INDEXY - INDEXY STAL ´ EHO ´ 25. SOUHRNE SLODEN´I A STRUKTURY
176
asociovan´ y s i-tou jednotkou z´ajmu, pak Pascheho cenov´y index je definov´an jako n P
pi1 qi1
i=1 n P
IpP
(475)
i=1 n P
=
n P
qi1
=
pi0 qi1
i=1 n P
i=1
.
qi1
i=1 n P
pi1 qi1 . pi0 qi1
i=1
Pozn´ amka: Vyj´ adˇren´ı s pomoc´ı jednoduch´ ych index˚ u je ve tvaru n n n P P P pi1 qi1 Qi0 pi1 qi1 i=1 i=1 i=1 P = P . = P (476) Ip = P n n n pi1 Qi0 pi0 qi1 q i 1 IQ IQ i=1
i=1
i
i=1
i
Tvar je shodn´ y se vzorcem Pascheho objemov´eho souhrnn´eho indexu.
Definice 2.3. y index, pak Fischer˚ uv uv cenov´ y index a IpP je Pascheho cenov´ Necht’ IpL je Laspeyres˚ cenov´y index je definov´ an jako q (477) IpF = IpL IpP . Pozn´ amka: V souhrnn´ ych cenov´ ych indexech sledujeme jenom zmˇenu cenov´eho ukazatele jelikoˇz objemov´e v´ ahy z˚ ust´ avaj´ı fixn´ı a v´aˇzou se k nˇekter´emu obdob´ı. V´ yjimku tvoˇr´ı Fischer˚ uv index, kter´ y je opˇet geometrick´ ym pr˚ umˇerem tˇechto index˚ u.
ta 2.1. Plat´ı Ve IpL IqP = IpP IqL = I(P Q) .
(478) D˚ ukaz. Plat´ı n P
(479)
IpL IqP
=
i=1 n P
pi1 qi0 pi0 qi0
i=1 n P
(480)
IpP IqL = i=1 n P i=1
n P i=1 n P
= pi1 qi0
i=1
pi1 qi1 pi0 qi1
n P i=1 n P i=1
n P
pi1 qi1
i=1 n P
pi1 qi1 = I(P Q) . pi0 qi0
i=1
pi0 qi1 pi0 qi0
n P
= i=1 n P
pi1 qi1 = I(P Q) . pi0 qi0
i=1
Literatura [1] [2] [3] [4] [5]
Andel, Jir´ı. Matematick´ a statistika: Vysokoˇsk. ucebnice. SNTL, 1978. Bartsch, Hans-Jochen. Matematick´ e vzorce. No. s 832. SNTL, 1987. ´ ´ , Lubom´ır. Uvod Cyhelsky do teorie statistiky. Statn´ı nakladatelstv´ı technick´ e literatury, 1981. ´ k. Statistika 1. SNTL/SVTL, Praha 1967. Cyhelsky, Nova Grilli, L., and C. Rampichini. Scomposizione della dispersione per variabili statistiche ordinali. Statistica 62.1 (2002): 111-116. [6] Freedman, Pisani. Purves. Statistics.(3rd ed.) Norton. 1997 ´ , and Jan Seger. Statistika pro ekonomy. Professio[7] Hindls, Richard, Stanislava Hronova nal publishing, 2004. [8] Kendall, Maurice George, and Stuart Alan. The advanced theory of statistics. Vols. II and III. 1961. [9] Kohn, Stanislav. Z´ aklady teorie statistick´ e metody. Nakl. St´ atn´ıho u ´radu statistick´ eho, 1929. ´ ´ , Hana a Loster, Tomas . Uvod [10] Rezankova do statistiky. Vysok´ a ˇskola ekonomick´ a v Praze. Fakulta informatiky a statistiky, Publisher Oeconomica, 2009. [11] Marasini, Donata a Quatto, Piero. Descriptive analysis of student ratings. Journal of Applied Quantitative Methods (2012). [12] Walkenbach, John. Excel 2013 Power Programming with VBA. Vol. 13. Wiley. com, 2013. [13] Wilcox, Allen R. Indices of qualitative variation. No. ORNL-TM–1919. Oak Ridge National Lab., Tenn., 1967. [14] Yule, G. Udny. An introduction to the theory of statistics. London, 1922.
177