Univerzita Karlova v Praze Matematicko-fyzikální fakulta
BAKALÁŘSKÁ PRÁCE
Adéla Drabinová Čebyševova nerovnost a její modifikace Katedra pravděpodobnosti a matematické statistiky
Vedoucí bakalářské práce: Studijní program: Studijní obor:
prof. RNDr. Jiří Anděl, DrSc. Matematika Obecná matematika
Praha 2013
Na tomto místě bych chtěla poděkovat panu prof. RNDr. Jiřímu Andělovi, DrSc. za ochotu, trpělivost a cenné rady při psaní této práce. Také děkuji mé rodině a přátelům za podporu během studia.
Prohlašuji, že jsem tuto bakalářskou práci vypracovala samostatně a výhradně s použitím citovaných pramenů, literatury a dalších odborných zdrojů. Beru na vědomí, že se na moji práci vztahují práva a povinnosti vyplývající ze zákona č. 121/2000 Sb., autorského zákona v platném znění, zejména skutečnost, že Univerzita Karlova v Praze má právo na uzavření licenční smlouvy o užití této práce jako školního díla podle § 60 odst. 1 autorského zákona.
V Praze dne 23. května 2013
Adéla Drabinová
Název práce: Čebyševova nerovnost a její modifikace Autor: Adéla Drabinová Katedra: Katedra pravděpodobnosti a matematické statistiky Vedoucí bakalářské práce: prof. RNDr. Jiří Anděl, DrSc., Katedra pravděpodobnosti a matematické statistiky Abstrakt: V předložené práci se zabýváme zlepšeními Čebyševovy nerovnosti. V první kapitole uvedeme nerovnosti pro náhodné veličiny s unimodálním rozdělením. Dokážeme Gaussovu a Camp-Meidellovu nerovnost a odvodíme VysochanskiiPetuninovu nerovnost. Popíšeme zvlášť nerovnosti pro veličiny, které mají modus 0 a pro veličiny, které mají modus nenulový. V druhé kapitole se zabýváme konstantami C(r), pro které jsou odhady pravděpodobnosti nejlepší. Zajímat nás bude hledání optimálního parametru r, případně jeho odhadu. Ve třetí kapitole uvedeme nerovnosti z první kapitoly pro konkrétní rozdělení, výpočet jejich konstant, aplikace a grafické zpracování výsledků. Klíčová slova: Čebyševova nerovnost, Gaussova nerovnost, unimodalita, CampMeidellova nerovnost, Vysochanskii-Petuninova nerovnost
Title: Chebyshev inequality and some its modifications Author: Adéla Drabinová Department: Department of Probability and Mathematical Statistics Supervisor: prof. RNDr. Jiří Anděl, DrSc., Department of Probability and Mathematical Statistics Abstract: In the presented thesis we describe some improvements of Chebyshev inequality. In the first chapter we introduce inequalities for random variables with unimodal distributions. We prove Gauss and Camp-Meidell inequality and we deduce Vysochanskii-Petunin inequality. We describe inequalities for variables with mode 0 and with unspecified mode. In the second chapter we consider constants C(r), for which the approximations are the best. We are interested in finding optimal parameter r or its approximation. In the third chapter we state inequalities from the first chapter for specific distributions, calculation of their constants, applications and graphic presentations of the results. Keywords: Chebyshev inequality, Gauss inequality, unimodality, Camp-Meidell inequality, Vysochanskii-Petunin inequality
Obsah Úvod
1
1 Unimodální rozdělení 1.1 Modus v nule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Obecný modus . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 6 8
2 Nejlepší odhady 3 Aplikace na rozdělení 3.1 Normální rozdělení . . . . . . . 3.2 Laplaceovo rozdělení . . . . . . 3.3 Logaritmicko-normální rozdělení 3.4 Geometrické rozdělení . . . . . 3.5 Exponenciální rozdělení . . . .
11
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
13 13 17 22 24 25
Závěr
28
Literatura
29
Seznam tabulek
30
Seznam obrázků
31
Úvod Nechť (Ω, A, P) je pravděpodobnostní prostor a nechť X je reálná náhodná veličina s konečnou střední hodnotou E X a nenulovým konečným rozptylem σ 2 . Nechť a > 0. Označíme-li F distribuční funkci této náhodné veličiny X, postupně dostáváme Z Z Z ∞ r r r r |x| dF (x) ≥ |x| dF (x) ≥ a dF (x) = ar P (|X| ≥ a) . E |X| = −∞
|x|≥a
|x|≥a
Tímto dostáváme zobecněnou Markovovu nerovnost ve tvaru P (|X| ≥ a) ≤
E |X|r . ar
(0.1)
Pro hodnotu r = 1 máme klasickou Markovovu nerovnost. Pokud zvolíme r = 2 a místo náhodné veličiny X uvažujeme X − E X, dostáváme nerovnost (0.1) ve tvaru σ2 (0.2) P (|X − E X| ≥ a) ≤ 2 . a Nechť k > 0. Po substituci a = kσ lze nerovnost (0.2) zapsat jako P (|X − E X| ≥ kσ) ≤
1 . k2
(0.3)
Nerovnost (0.3) se nazývá klasická Čebyševova nerovnost. Tyto nerovnosti jsou však užitečné pouze pro takové hodnoty a (respektive k), pro které je pravá strana menší než jedna. Nicméně tyto odhady bývají i tak velice slabé. Existují však modifikace, které tyto nerovnosti zpřesňují. V této práci se budeme zabývat zpřesněním Čebyševovy nerovnosti (0.3). V kapitole 1 uvedeme modifikace této nerovnosti za předpokladu unimodality náhodné veličiny X. V kapitole 2 se budeme zabývat hledáním nejlepšího odhadu pravděpodobnosti P(|X| > k). Výsledky obou kapitol aplikujeme na konkrétní rozdělení v kapitole 3.
1
Kapitola 1 Unimodální rozdělení V této kapitole se budeme věnovat nerovnostem pro náhodné veličiny s unimodálním rozdělením. Nejdříve uvedeme definici unimodálního rozdělení z [Sellke, Sellke, 1997]. Definice 1.1. Nechť X je náhodná veličina s distribuční funkcí F . Řekneme, že X má unimodální rozdělení, jehož modus je m, pokud F je konkávní na [m, ∞) a konvexní na (−∞, m]. Náhodnou veličinu s unimodálním rozdělením můžeme dle [Cramér, 1946, str. 179] definovat tímto způsobem. Definice 1.2. Nechť X je spojitá náhodná veličina. Potom bodu m, v němž hustota f náhodné veličiny X nabývá své maximální hodnoty, říkáme modus. Nechť X je diskrétní náhodná veličina, která nabývá hodnot x1 , x2 , . . . s pravděpodobností pi = P(X = xi ) pro i ∈ N, respektive pm = P(X = xm ) pro m ∈ N. Bod xm nazýváme modus, jestliže platí pm ≥ pi , pro každé i ≥ m a pm ≥ pi , pro každé i ≤ m. Pokud X má pouze jeden modus, potom nazýváme náhodnou veličinu X unimodální. Jestliže X je absolutně spojitá náhodná veličina s unimodálním rozdělením dle definice 1.1, pak je unimodální i podle definice 1.2. Jestliže X je absolutně spojitá náhodná veličina, pak má hustotu f . Nechť existuje derivace f 0 . Distribuční funkce F je na intervalu [m, ∞) konkávní. Tedy F 00 (x) ≤ 0. Z této skutečnosti a ze vztahu f (x) = F 0 (x) a jeho derivace f 0 (x) = F 00 (x) dostáme, že 0 ≥ F 00 (x) = f 0 (x) a tedy funkce f je na intervalu [m, ∞) nerostoucí. Na intervalu (−∞, m] je distribuční funkce F konvexní, tedy f 0 (x) = F 00 (x) ≥ 0 a tudíž je f na intervalu (−∞, m] neklesající. Tedy f nabývá své maximální hodnoty na intervalu (−∞, ∞) právě v bodě m. Nyní uvedeme větu z [Peajcariaac, Tong, str. 194, 1992], která je důležitá pro dokázání modifikací nerovnosti (0.3) pro náhodné veličiny s unimodálním rozdělením. Věta 1.1. Nechť G : (a, b) → R je rostoucí diferencovatelná funkce. Nechť f : I → R je nerostoucí funkce, kde I ⊂ R je interval a přitom a, b, G(a), G(b) ∈ I. Potom platí: Rb R G(b) 1. Je-li G(x) ≥ x, potom a f (x)G0 (x) dx ≥ G(a) f (x) dx. 2
2. Je-li G(x) ≤ x, potom
Rb a
f (x)G0 (x) dx ≤
R G(b) G(a)
f (x) dx.
Důkaz. Po substituci G(x) = y postupně dostáváme Z b Z b Z G(b) 0 f (x)G (x) dx = f (x) dG(x) = f (G−1 (y)) dy. a
a
G(a)
1. Je-li G(y) > y, potom G−1 (y) < y. Jelikož je funkce f nerostoucí, dostáváme R G(b) R G(b) f (G−1 (y)) ≥ f (y), a tedy G(a) f (G−1 (y)) dy ≥ G(a) f (y) dy. 2. Je-li G(y) < y, potom G−1 (y) > y. Jelikož je funkce f nerostoucí, dostáváme R G(b) R G(b) f (G−1 (y)) ≤ f (y), a tedy G(a) f (G−1 (y)) dy ≤ G(a) f (y) dy.
k
Důsledkem této věty je Gaussova nerovnost. Uvedeme ji ve znění z [Cramér, 1946, str. 183]. Důsledek 1.1. Nechť X je spojitá náhodná veličina s unimodálním rozdělením dle definice 1.2 s konečnou střední hodnotou µ a konečným nenulovým rozptylem σ 2 . Označme modus m a τ 2 = σ 2 + (m − µ)2 . Potom pro každé k > 0 platí 4 . 9k 2
P (|X − x0 | ≥ kτ ) ≤
(1.1)
Důkaz. Větu dokážeme pro speciální případ m = 0. Potom τ 2 = E X 2 − (E X)2 + (E X)2 = E X 2 . Po substituci a2 = k 2 E X 2 dostáváme nerovnost (1.1) ve tvaru P (|X| ≥ a) ≤
4 E X2 . 9 a2
Platí Z P (|X| ≥ a) =
∞
Z
Z
EX =
f (x) dx, −∞
a
2
−a
f (x) dx +
∞
Z
2
0
x2 f (x) dx.
x f (x) dx + −∞
0
Stačí tedy dokázat nerovnosti Z ∞ Z 4 ∞ 2 2 x f (x) dx, k f (x) dx ≤ 9 0 k
k
2
Z
−k
−∞
4 f (x) dx ≤ 9
Z
0
x2 f (x) dx.
−∞
Po substituci y = −x dostáváme nerovnost (1.3) ve tvaru Z ∞ Z 4 ∞ 2 2 k f (−y) dy ≤ y f (−y) dy. 9 0 k 3
(1.2)
(1.3)
Jelikož je f hustota X, pak se jedná o nezápornou funkci. A tedy postačí, když dokážeme nerovnost (1.2). Jelikož má X unimodální rozdělení dle definice 1.2, pak je na intervalu [0, ∞) 4x3 nerostoucí. Ve větě 1.1 položíme G(x) = 27k 2 + k. Pro kladná x je G(x) rostoucí. Dále 4x3 G(x) − x = +k−x 27k 2 můžeme zapsat ve tvaru 4 x− 27
3k 2 (3k 2 2 k
+ x)
.
Z tohoto tvaru vidíme, že G(x) − x ≥ 0, pokud k > 0 a x > −3k. Jelikož uvažujeme pouze kladná x, tak nerovnost G(x) ≥ x platí. Derivace funkce G(x) 2 . Nechť a = 0, b → ∞, potom i G(b) → ∞ a máme je G0 (x) = 4x 9k2 Z ∞ Z ∞ 4 0 f (x)G (x) dx = 2 f (x)x2 dx. 9k 0 0 Dle věty 1.1 dostáváme 4 9k 2
∞
Z
∞
Z
2
f (x)x dx ≥
f (x) dx. k
0
k Zobecněním nerovnosti (1.1) je Camp-Meidellova nerovnost. Důsledek 1.2. Nechť X je spojitá náhodná veličina s unimodálním rozdělením dle definice 1.2, která má modus nula. Nechť r > 0. Potom platí r r E |X|r P (|X| ≥ k) ≤ . (1.4) r+1 kr Důkaz. Jelikož má X unimodální rozdělení, pak hustota f je nezáporná nerostoucí funkce na intervalu [0, ∞). Platí Z P (|X| ≥ k) =
∞
Z f (x) dx +
Z
E |X| =
f (x) dx, −∞
k
r
−k
∞
Z
r
0
x f (x) dx +
|x|r f (x) dx.
−∞
0
Stačí tedy dokázat nerovnosti r Z Z ∞ r 1 ∞ r x f (x) dx ≥ f (x) dx, r + 1 kr 0 k 4
(1.5)
r r+1
r
1 kr
Z
0
Z
r
−k
|x| f (x) dx ≥ −∞
f (x) dx.
(1.6)
−∞
Po substituci y = −x dostáváme nerovnost (1.6) ve tvaru r Z Z ∞ r 1 ∞ r y f (−y) dy ≥ f (−y) dy. r + 1 kr 0 k Víme, že f je nezáporná funkce a tedy stačí dokázat nerovnost (1.5). Stejně jako v předchozím důkaze stačí, když vhodně zvolíme G(x) a použijeme větu 1.1. Pro r > 0 položíme rr xr+1 + k. (r + 1)r+1 k r r xr r Potom derivace této funkce je G0 (x) = r+1 . kr Nyní dokážeme, že G(x) ≥ x. Jelikož derivace r r x r 0 −1 [G(x) − x] = r + 1 kr G(x) =
je rovna 0 právě tehdy, když x = r+1 k a [G(x) − x]0 < 0 na intervalu (0, r+1 k) r r r+1 0 a [G(x) − x] > 0 na intervalu ( r k, ∞), tak funkce G(x) − x má v bodě r+1 k r minimum. Hodnota funkce G(x) − x v tomto bodě je rr (r + 1)r+1 k r
r+1 r
r+1
r+1 k r k r+1 1 r+1 = +k− k=k +1− = 0. r r r r
k r+1 + k −
Tedy platí, že G(x) ≥ x. Nechť a = 0, b → ∞, potom i G(b) → ∞ a máme r Z Z ∞ r 1 ∞ 0 f (x)xr dx. f (x)G (x) dx = r r + 1 k 0 0 Předpoklady věty 1.1 jsou splněny a dostáváme r Z Z ∞ r 1 ∞ r x f (x) dx ≥ f (x) dx. r + 1 kr 0 k
k Otázkou je, zda lze Čebyšev-Gauss-Camp-Meidellovy nerovnosti výrazně zpřesnit. V sekcích 1.1 a 1.2 ukážeme, že opravdu existují poměrně dobré aproximace pravděpodobnosti P (|X| > a) pro unimodální veličiny. V kapitole 2 navíc ukážeme odhady pravděpodobnosti P (|X| > a), které nejsou vázány na unimodalitu náhodné veličiny.
5
1.1
Modus v nule
V této sekci se zaměříme na náhodné veličiny s unimodálním rozdělením dle definice 1.2, jejichž modus je nula. Předtím, než pojednáme o nerovnostech pro náhodné veličiny s unimodálním rozdělením, které mají modus v nule, uvedeme některé definice a předpoklady z [Sellke, Sellke, 1997]. P01 Nechť R[a, b] je rovnoměrné rozdělení na intervalu [a, b]. P02 Nechť g je sudá reálná funkce neklesající na interavalu [0, ∞) a splňující podmínku g(0) = 0. Položme g(∞) = limx→∞ g(x). Nechť k je kladná pevně daná konstanta. Předpokládejme, že g(k−) > g(0+), kde g(k−) = limx→k− g(x). P03 Pro t ∈ R označme Rt ∼ R[0, t]. Pro 0 ≤ ω ≤ 1 definujeme t(ω) =
k . 1−ω
P04 Nechť C : [0, 1] → [0, ∞] je funkce definovaná předpisem C(ω) = E g(Rt(ω) ),
0 ≤ ω ≤ 1.
P05 Nechť L : [0, 1] → [0, ∞] je funkce definovaná předpisem L(ω) =
C(ω) , ω
0 ≤ ω ≤ 1.
P06 Označme ω ∗ největší číslo z intervalu [0, 1], ve kterém funkce L nabývá svého minima. Označme M = L(ω ∗ ). Věta 1.2. Nechť k > 0. Nechť jsou splněny předpoklady P1 až P6. Nechť X je náhodná veličina s unimodálním rozdělením, jejíž modus je 0. Jestliže P (|X| ≥ k) = ω, potom ωM pro ω ≤ ω ∗ , E g(X) ≥ C(ω) pro ω ≥ ω ∗ . Důkaz. Podrobný důkaz lze najít v [Sellke, Sellke, 1997].
k
Důsledek 1.3. Nechť k > 0. Nechť X je náhodná veličina s unimodálním rozdělením, jejíž modus je 0 a P(|X| ≥ k) = ω. Potom r 1 r+1 r pro ω ≤ , ωk r r+1 r (1.7) E |X| ≥ kr 1 pro ω ≥ . (r + 1)(1 − ω)r r+1
6
Důkaz. Volíme g(x) = |x|r , potom C(ω) =
kr , (r + 1)(1 − ω)r
L(ω) =
kr C(ω) = . ω (r + 1)(1 − ω)r ω
Derivace L0 (ω) =
k r −r(1 − ω)r−1 ω + (1 − ω)r r+1 (1 − ω)2r ω 2
1 . V tomto bodě funkce L(ω) nabývá na je rovna 0 právě tehdy když ω = r+1 1 intervalu [0, 1] svého maxima, a tedy ω ∗ = r+1 . Potom funkci M (k) můžeme vyjádřit ve tvaru r r+1 kr r ∗ . M (k) = L(ω ) = 1 r 1 = k r ) r+1 (r + 1)(1 − r+1
Nyní dosadíme do věty 1.2 a máme r r + 1 r ωM = ωk r r r E |X| ≥ r+1 C(ω) = k r r
1 , r+1 1 . pro ω ≥ ω ∗ = r+1
pro ω ≤ ω ∗ =
k Z důsledku 1.3 dostáváme modifikaci Camp-Meidellovy nerovnosti (1.4). Lze ji zapsat v následujícím tvaru. Důsledek 1.4. Nechť X je náhodná veličina s unimodálním rozdělením, jejíž modus je 0. Potom pro r > 0 platí r E |X|r rr r r pro k ≥ E |X|r , r+1 kr (r + 1)r−1 r1 P (|X| ≥ k) ≤ (1.8) kr rr r r 1 − pro k ≤ E |X| . (r + 1) E |X|r (r + 1)r−1 Důkaz. Z důsledku 1.3 máme, že je-li P(|X| ≥ k) = ω, pak platí vztah (1.7). Z tohoto vztahu vyjádříme ω a dostáváme r r E |X|r r E |X|r r 1 pro ω ≤ ≤ , kr r r+1 k r+1 r+1 r1 r1 ω≤ kr 1 kr 1 − pro ω ≤ ≤1− . (r + 1) E |X|r r+1 (r + 1) E |X|r Z mezí vyjádříme k r a dostáváme nerovnost (1.8).
k
Speciálním případem Camp-Meidellovy nerovnosti (1.8) je modifikace Gaussovy nerovnosti (1.1). 7
Důsledek 1.5. Nechť k > 0. Nechť X je náhodná veličina s unimodálním rozdělením, které má modus nula. Potom platí 4 E X2 4 pro k 2 ≥ E X 2 , 2 9k 3 12 P (|X| ≥ k) ≤ 2 k 4 1 − pro k 2 ≤ E X 2 . 2 3EX 3 Důkaz. V důsledku 1.3 volíme r = 2.
1.2
k
Obecný modus
V této části ukážeme nerovnosti pro náhodné veličiny s unimodálním rozdělením dle definice 1.2, kde modus nemusí být roven nule. P07 Nechť −k ≤ a ≤ 0. Definujme náhodnou veličinu Ya ∼ R[a, k] Rk 1 g(x) dx. P08 Nechť −k ≤ a ≤ 0. Definujme funkci Z(a) = E Ya = k−a a P09 Označme a∗ nejmenší bod z intervalu [−k, 0], v kterém funkce Z nabývá svého minima a tuto hodnotu označme N = Z(a∗ ). Věta 1.3. Nechť k > 0. Nechť jsou splněny předpoklady P2 a P7 až P9. Nechť X je náhodná veličina s unimodálním rozdělením. Jestliže P (|X| ≥ k) = ω, potom N , pro ω ≤ ωM M + N − g(k) E g(X) ≥ (1.9) N ωg(k) + (1 − ω)N pro ω ≥ . M + N − g(k) Důkaz. Podrobný důkaz lze najít v [Sellke, Sellke, 1997].
k
Důsledek 1.6. Nechť k > 0. Nechť je splněn předpoklad P7. Nechť X je náhodná veličina s unimodálním rozdělením a P(|X| ≥ k) = ω, potom E g(X) MN pro E g(X) ≤ , M M + N − g(k) P(|X| ≥ k) ≤ (1.10) E g(X) − N MN pro E g(X) ≥ . g(k) − N M + N − g(k) Důkaz. Pokud P (|X| ≥ k) = ω, pak dle věty 1.3 platí vztah (1.9). Stačí, pokud z tohoto vztahu vyjádříme ω. Tedy ω≤
E g(X) M
pro ω ≤
8
N . M + N − g(k)
To jest P(|X| ≥ k) ≤ E g(X) pro E g(X) ≤ M váme i druhou nerovnost.
MN . M +N −g(k)
Stejným způsobem dostá-
k
Důsledek 1.7. Nechť k > 0. Nechť X je náhodná veličina s unimodálním rozdělením. Potom 8 E X2 4 E X2 2 , , pro k ≥ 9k 2 3 (1.11) P(|X| ≥ k) ≤ 2 2 4 E X − 1 , pro k 2 ≤ 8 E X . 3k 2 3 3 Důkaz. V důsledku 1.6 volíme g(x) = x2 . Potom 1 Z(a) = k−a
Z
k
x2 dx =
a
a2 + ak + k 2 . 3
Funkce Z(a) nabývá svého minima v bodě a∗ = − k2 . Hodnota funkce Z(a) v tomto bodě je 2 k 2 + − k2 k + k4 k2 ∗ = . N = Z(a ) = 3 4 Z důsledku 1.3 pro r = 2 máme, že M = dostáváme nerovnost (1.11).
9k2 . 4
Dosazením do nerovnosti (1.10)
Nerovnost (1.11) se nazývá Vysochanskii–Petuninova. Dharmadhikari a Joag-dev ukázali zobecnění nerovnosti (1.11).
k
Věta 1.4. Nechť X je náhodná veličina s unimodálním rozdělením. Potom pro každé r > 0 a konstantu s > r + 1 splňující s(s − r − 1)r = rr platí r s r 1 r r P (|X| ≥ k) ≤ max E |X| , E |X| − . (r + 1)k (s − 1)k r s−1 Důkaz. Jednotlivé kroky důkazu jsou uvedeny v [Dharmadhikari, 1986].
k
Dosud jsme v textu předpokládali, že funkce g je sudá. Ale obdobné nerovnosti můžeme získat i pro funkce, které sudé nejsou. Nejdříve musíme předefinovat některé dřívější pojmy. P10 Nechť g je funkce neklesající na intervalu [0, ∞) a nerostoucí na intervalu (−∞, 0] a splňuje g(0) = 0. P11 Pro 0 ≤ ω ≤ 1 definujeme funkci C(ω) = min E g(Rt(ω) ), E g(−Rt(ω) ) . P12 Pro 0 ≤ ω ≤ 1 definujeme funkci L(ω) =
9
C(ω) . ω
P13 Označme ω ∗ největší číslo z intervalu [0, 1], v kterém funkce L nabývá svého minima. Tuto hodnotu označme M = L(ω ∗ ). P14 Nechť −k ≤ a ≤ 0. Definujeme funkce Z + (a) = E g(Ya ), Z − (a) = E g(−Ya ). P15 Označme a+ , respektive a− , bod z intervalu [−k, 0], v kterém funkce Z + , respektive funkce Z − , nabývá svého minima. Tuto hodnotu označíme jako M + = Z + (a+ ), respektive jako M − = Z − (a− ). Věta 1.5. Nechť platí předpoklady P7 a P10 až P15. Nechť k > 0. Nechť X je náhodná veličina s unimodálním rozdělením, splňující P(|X| ≥ k) = ω. Potom E g(X) ≤ min ωM, ωg(k) + (1 − ω)M + , ωg(−k) + (1 − ω)M − .
Důkaz. Podrobný důkaz lze najít v [Sellke, Sellke, 1997].
k
Důsledek 1.8. Nechť platí předpoklady P10 až P16. Nechť k > 0. Nechť X je náhodná veličina s unimodálním rozdělením. Potom E g(X) E g(X) − M + E g(X) − M − , , . P(|X| ≥ k) ≤ max M g(k) − M + g(−k) − M − Důkaz. Stejně jako v důsledcích 1.4 a 1.6 stačí, když ve větě 1.5 vyjádříme ω.
k
10
Kapitola 2 Nejlepší odhady Nechť X je reálná náhodná veličina s distribuční funkcí F . V této kapitole se budeme zabývat hledáním nejlepší možné konstanty C(F, r) pro dané nezáporné r takové, že pro každé kladné k platí P (|X| ≥ k) ≤ C(F, r)
E |X|r . kr
(2.1)
Takovou konstantu budeme značit C ∗ (F, r). Dále nás bude zajímat, jak takovou konstantu dobře odhadnout, a zda jsme schopni zvolit takové r, že se nám povede dobře aproximovat hodnotu P (|X| ≥ k). Uvedeme dvě věty z [DasGupta, 2000]. Věta 2.1. Nechť X je reálná náhodná veličina s distribuční funkcí F . Nechť r ≥ 0. Potom dostáváme: 1. Platí C ∗ (F, r) =
supx>0 {xr PF (|X| > x)} . EF |X|r
(2.2)
2. Jestliže náhodná veličina |X| má hustotu f , potom C ∗ (F, r) ≤
supx>0 {xr+1 f (x)} ˜ = C(F, r). r EF |X|r
3. Jestliže distribuční funkce F je symetrická a absolutně spojitá s charakteristickou funkcí ψ(t), potom Z ∞ 2 sin tx ∗ r C (F, r) = sup x (1 − ψ(t)) dt . (2.3) π EF |X|r x>0 t 0 Důkaz. 1. Zde je v podstatě zformulována definice konstanty C ∗ (F, r), tedy tato část nepotřebuje důkaz. 2. Důkaz je uveden v [DasGupta, 2000].
11
3. Jestliže je distribuční funkce F absolutně spojitá a symetrická (tj. F (−x) = 1−F (x)) a ψ(t) je její charakteristická funkce, pak dle [Cramér, 1946, str.94] platí Z ∞ 1 sin tx 1 ψ(t) dt. F (x) = + 2 2π −∞ t Navíc je-li F 0 (x) = f (x), potom −f (−x) = F 0 (−x) = −f (x) a pro charakteristickou funkci platí Z ∞ Z ∞ exp {it(−x)} f (−x) dx exp {i(−t)x} f (x) dx = ψ(−t) = −∞ −∞ Z −∞ Z ∞ =− exp {itx} f (x) dx = exp {itx} f (x) dx = ψ(t). ∞
−∞
Tedy charakteristická funkce ψ(t) je sudá. Potom platí Z 1 ∞ sin tx PF (|X| > x) = 2 (1 − F (x)) = 1 − ψ(t) dt. π −∞ t R∞ Zde použijeme fakt, že −∞ sinx x dx = π a dostáváme 1 1− π
Z
∞
−∞
Z Z 1 ∞ sin tx 1 ∞ sin tx sin tx ψ(t) dt = dt − ψ(t) dt t π −∞ t π −∞ t Z 2 ∞ sin tx = (1 − ψ(t)) dt. π 0 t
Tento výsledek dosadíme do výrazu (2.2) a dostáváme konstantu C ∗ (F, r) ve tvaru (2.3).
k Věta 2.2. Předpokládejme, že pro r0 > 0 je limx→∞ xr0 P (|X| > x) = 0. Nechť B(k, r) = C ∗ (r)
E |X|r . kr
Potom pro každé k > 0 platí inf B(k, r) = P (|X| > k) .
r>0
Důkaz. Podrobný důkaz lze nalézt v [DasGupta, 2000].
12
k
Kapitola 3 Aplikace na rozdělení V této kapitole se budeme zabývat konkrétními rozděleními a porovnáním odhadů z kapitoly 1 a kapitoly 2.
3.1
Normální rozdělení
Nechť X ∼ N (0, 1). Tedy X je náhodná veličina s normálním rozdělením se n 2o 1 x 2 střední hodnotou µ = 0 a rozptylem σ = 1. Hustota je g(x) = √2π exp − 2 . Klasická Čebyševova nerovnost (0.3) pro N (0, 1) je P (|X| ≥ x) ≤
1 . x2
Gaussova nerovnost (1.1) pro N (0, 1) je P (|X| ≥ x) ≤
4 . 9x2
Následuje graf, který porovnává skutečnou hodnotu P (|X| ≥ x) s Čebyševovým a Gaussovým odhadem. y 1.0 0.8
PHÈXÈ>xL
0.6
1 x2
0.4
4 9 x2
0.2 x 0
1
2
3
4
5
Obrázek 3.1: Pravděpodobnost P(|X| > x), Čebyševův a Gaussův odhad v N (0, 1) Čebyševův odhad x12 není příliš přesný. Gaussův odhad 9x42 je výrazně přesnější, ale i tady vidíme prostor ke zlepšení. ˜ Nyní se budeme zabývat konstantami C ∗ (r), C(r) a Camp-Meidellovou konr r stantou r+1 (dále pouze jako CM (r)). 13
Hustota náhodné veličiny |X| je 2 2 x f (x) = g(x) + g(−x) = √ exp − 2 2π
pro x > 0.
Pomocí programu Mathematica bylo vypočteno r 2 2 Γ r+1 2 √ E |X| = . π n 2o n 2o Charakteristická funkce N (0, 1) je ψ(t) = exp − t2 . Funkce xr+1 exp − x2 √ nabývá svého maxima na intervalu (0, ∞) v bodě x = r + 1. Proto 2 r+1 x r+1 r+1 sup x exp − = (r + 1) 2 exp − . 2 2 x>0 r
˜ Konstanty C(F, r) a C ∗ (F, r) můžeme upravit na tvar n n 2 oo √ r+1 √2 x exp − x2 π sup r+1 x>0 sup {x f (x)} 2π x>0 ˜ C(F, r) = = r r EF |X|r r2 2 Γ r+1 2 n n 2 oo r+1 x r+1 2 supx>0 x exp − 2 exp − r+1 2 r+1 2 2 = = , r−1 r+1 rΓ r2 2 Γ r+1 2 2 Z ∞ 2 sin tx r C (F, r) = sup x (1 − ψ(t)) dt π EF |X|r x>0 t 0 Z ∞ 2 1 sin tx t r = √ r −1 r+1 sup x 1 − exp − dt . t 2 π2 2 Γ 2 x>0 0 ∗
Uvedeme grafy, které porovnávají pravděpodobnost P(|X| > x) s odhady r P(|X| > k) ≤ C(F, r) E |X| pro konkrétní hodnoty r, kde C(F, r) jsou postupně kr ∗ ˜ konstanty C (r), C(r) a CM (r). y 1.0
PHÈXÈ>xL 0.8
CMH1L 0.6
E X¤ x
0.4
E X¤ CH1L x
0.2
C* H1L
E X¤ x
x 0
1
2
3
4
5
Obrázek 3.2: Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 1 Pro r = 1 je konstanta CM (1) blízko nejlepší konstantě C ∗ (1) a je dokonce ˜ menší, než konstanta C(1) (viz obrázek 3.2). Avšak ani konstanta C ∗ (1) nám nedává uspokojivou aproximaci skutečné hodnoty pravděpodobnosti. Pro r = 2 14
y 1.0
PHÈXÈ>xL 0.8
CMH2L 0.6
E X¤2 x2
0.4
E X¤2 CH2L x2
0.2
C* H2L
E X¤2 x2
x 0
1
2
3
4
5
Obrázek 3.3: Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 2 y 1.0
PHÈXÈ>xL 0.8
CMH3L 0.6
E X¤3 x3
0.4
E X¤3 CH3L x3
0.2
C* H3L
E X¤3 x3
x 0
1
2
3
4
5
Obrázek 3.4: Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 3 ˜ se konstanty CM (2) a C(2) vyrovnávají. Stejně jako pro r = 1 (viz obrázek 3.2) všechny odhady konvergují k pravděpodobnosti P(|X| > x) pomalu. ˜ Pro r = 3 je konstanta C(3) již menší, než konstanta CM (3) (viz obrázek ˜ 3.4). Pro r = 4 se konstanta C(4) přibližuje k nejlepší konstantě C ∗ (4). Obě konstanty se oddalují od CM (4) (viz obrázek 3.5). V obou případech můžeme sledovat značné zlepšení konvergence odhadů. y 1.0
PHÈXÈ>xL 0.8
CMH4L 0.6
E X¤4 x4
0.4
E X¤4 CH4L x4
0.2
C* H4L
E X¤4 x4
x 0
1
2
3
4
5
Obrázek 3.5: Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 4 ˜ Pro rostoucí r se konvergence odhadů zlepšuje. Konstanta C(r) se přibližuje ∗ ˜ k nejlepší konstantě C (r), kdežto rozdíl mezi konstantami C(r) a C ∗ (r) roste. Pro ilustraci uvádíme grafy pro hodnotu r = 6 (obrázek 3.6), r = 8 (obrázek 3.7) a r = 10 (obrázek 3.8) a graf, který porovnává rozdíly CM (r) − C ∗ (r) a ˜ C(r) − C ∗ (r) (obrázek 3.9).
15
y 1.0
PHÈXÈ>xL 0.8
CMH6L 0.6
E X¤6 x6
0.4
E X¤6 CH6L x6
0.2
C* H6L
E X¤6 x6
x 0
1
2
3
4
5
Obrázek 3.6: Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 6
y 1.0
PHÈXÈ>xL 0.8
CMH8L 0.6
E X¤8 x8
0.4
E X¤8 CH8L x8
0.2
C* H8L
E X¤8 x8
x 0
1
2
3
4
5
Obrázek 3.7: Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 8
y 1.0
PHÈXÈ>xL 0.8
CMH10L 0.6
E X¤10 x10
0.4
E X¤10 CH10L x10
0.2
C* H10L
E X¤10 x10
x 0
1
2
3
4
5
Obrázek 3.8: Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 10
y 0.30
à
0.25 0.20 æ
æ
æ
æ
æ
æ æ
æ
0.15 à æ
0.10
æ
à
CMHrL-C* HrL CHrL-C* HrL
à
æ
à
0.05
à
à
à
à
à
à
r 2
4
6
8
10
˜ Obrázek 3.9: Srovnání rozdílů CM (r) − C ∗ (r) a C(r) − C ∗ (r) v N (0, 1)
16
k r˜
1 1.887
2 4.978
3 9.994
4 5 16.999 25.999
Tabulka 3.1: Odhad optimální hodnoty r v N (0, 1) Pro nejlepší konstantu C ∗ (r) jsme nenašli exaktní vyjádření. Víme však, že ˜ konstanta C(r) se s rostoucím r k této konstantě přibližuje. Uvažujme místo ˜ konstanty C ∗ (r) konstantu C(r) a označme r+1 r r+1 r+1 2 r exp − r+1 22 Γ 2 2 E |X| 2 2 ˜ ˜ √ r B(k, r) = C(r) r = r+1 k πk rΓ 2 √ r+1 r+1 2(r + 1) 2 exp − 2 √ = . r πk r Derivace ˜ ˜ 0 (k, r) = ∂ B(k, r) = −(r + 1) B ∂r
r+1 2
√ 2(ln(k) − exp − r+1 2 √ r rk π
ln(r+1) 2
+ 1r )
je rovna 0 právě tehdy, když ln(r+1) − 1r = ln(k). Označme řešení této rovnice r˜. 2 2 Vidíme, že r˜ ≈ k + 1 (viz tabulka 3.1). Například pro k = 3 máme r˜ ≈ 32 +1 = 10. Na grafu srovnání pravděpodobnosti s konstantami C(r) (viz obrázek 3.8) není tento výsledek příliš viditelný. Proto uvedeme tento graf v jiném měřítku (viz obrázek 3.10). y 0.10
PHÈXÈ>xL
0.08
CMH10L
0.06
E X¤10 x10
0.04
E X¤10 CH10L x10
0.02
C* H10L
E X¤10 x10
x 2.2
2.4
2.6
2.8
3.0
3.2
3.4
Obrázek 3.10: Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 10 pro k blízko 3
3.2
Laplaceovo rozdělení
Nechť X je náhodná veličina s Laplaceovým rozdělením s parametrem λ > 0 a střední hodnotou X = 0 (dále budeme značit L(λ)). Hustota rozdělení L(λ) je n Eo |x| 1 g(x) = 2λ exp − λ a charakteristická funkce je ψ(t) = 1+λ12 t2 . Čebyševova nerovnost ve tvaru (0.2) pro L(1) je P (|X| ≥ x) ≤ 17
2 . x2
Gaussova nerovnost (1.1) pro L(1) je 8 . 9x2 Následuje graf, který porovnává skutečnou hodnotu P (|X| ≥ x) s Čebyševovým a Gaussovým odhadem. P (|X| ≥ x) ≤
y 1.0 0.8
PHÈXÈ>xL
0.6
2 x2
0.4
8 9 x2
0.2 x 0
2
4
6
8
10
Obrázek 3.11: Pravděpodobnost P(|X| > x), Čebyševův a Gaussův odhad v L(1) Čebyševův odhad x22 není příliš přesný. Gaussův odhad 9x82 stejně jako v případě normálního rozdělení (obrázek 3.11) Čebyševův odhad zlepšuje. Hustota náhodné veličiny |X| je 1 |x| f (x) = g(x) + g(−x) = exp − . λ λ r r Pro r-tý absolutní moment n o platí E |X| = λ Γ(1 + r). Funkce xr+1 exp − |x| nabývá svého maxima na intervalu (0, ∞) v bodě λ
x=
r+1 . λ
Proto r+1 r+1 r+1 |x| r+1 exp − 2 = sup x exp − . λ λ λ x>0
Pomocí programu Mathematica bylo vypočteno o n |x| Z ∞ √ πx exp − a sin tx 1 , x ∈ R, a > 0. 1− dt = t 1 + λ2 t2 2|x| 0 √ Tato funkce nabývá svého maxima na intervalu (0, ∞) v bodě x = r λ, a tedy n o |x| Z ∞ r+1 √ πx exp − a sin tx 1 sup xr dt = sup 1− t 1 + λ2 t2 2|x| x>0 x>0 0 r
exp {−r} πrr λ 2 = . 2 ˜ Tedy pro konstanty C(F, r) a C ∗ (F, r) platí r+1
n n oo supx>0 xr+1 λ1 exp − |x| λ
supx>0 {x f (x)} ˜ C(F, r) = = r EF |X|r rλr Γ(1 + r) n n oo supx>0 xr+1 exp − |x| (r + 1)r+1 exp − r+1 λ 2 λ = = , rλr+1 Γ(1 + r) rλ2(r+1) Γ(r + 1) 18
Z ∞ 2 sin tx r C (F, r) = (1 − ψ(t)) dt sup x π EF |X|r x>0 t 0 Z ∞ sin tx 1 2 r sup x 1− dt = πλr Γ (1 + r) x>0 t 1 + λ2 t2 0 exp {−r} rr = r . λ 2 Γ(r + 1) ∗
Uvedeme grafy, které porovnávají pravděpodobnost P(|X| > x) s odhady r P(|X| > k) ≤ C(F, r) E |X| pro konkrétní hodnoty r, kde C(F, r) jsou postupně r k ∗ ˜ konstanty C (r), C(r) a CM (r). y 1.0
PHÈXÈ>xL 0.8
CMH1L 0.6
E X¤ x
0.4
E X¤ CH1L x
0.2
C* H1L
E X¤ x
x 0
2
4
6
8
10
Obrázek 3.12: Pravděpodobnost P(|X| > x) a její odhady v L(1) pro r = 1
y 1.0
PHÈXÈ>xL 0.8
CMH2L 0.6
E X¤2 x2
0.4
E X¤2 CH2L x2
0.2
C* H2L
E X¤2 x2
x 0
2
4
6
8
10
Obrázek 3.13: Pravděpodobnost P(|X| > x) a její odhady v L(1) pro r = 2 ˜ vyrovnané. Aproximace je však pro Pro r = 1 jsou konstanty CM (1) a C(1) všechny konstanty, včetně nejlepší konstanty C ∗ (1), špatná (viz obrázek 3.12). ˜ Pro r = 2 je už konstanta C(2) menší než CM (2) a přibližuje se konstantě C ∗ (2). Konvergence odhadů je výrazně lepší než v případě r = 1 (viz obrázek 3.12 a obrázek 3.13). ˜ Pro r = 3 jsou si konstanty C ∗ (3) a C(3) blízké. S rostoucím r je konver˜ gence odhadů výraznější a konstanta C(r) se přibližuje nejlepší konstantě C ∗ (r). ˜ Konstanta CM (r) konverguje pomaleji než konstanty C ∗ (r) a C(r). Pro ilustraci uvádíme grafy pro hodnotu r = 4 (obrázek 3.15), r = 6 (obrázek 3.16), r = 8 (obrázek 3.17) a r = 10 (obrázek 3.18) a graf, který porovnává rozdíly CM (r)−C ∗ (r) ˜ a C(r) − C ∗ (r) (obrázek 3.19).
19
y 1.0
PHÈXÈ>xL 0.8
CMH3L 0.6
E X¤3 x3
0.4
E X¤3 CH3L x3
0.2
C* H3L
E X¤3 x3
x 0
2
4
6
8
10
Obrázek 3.14: Pravděpodobnost P(|X| > x) a její odhady v L(1) pro r = 3 y 1.0
PHÈXÈ>xL 0.8
CMH4L 0.6
E X¤4 x4
0.4
E X¤4 CH4L x4
0.2
C* H4L
E X¤4 x4
x 0
2
4
6
8
10
Obrázek 3.15: Pravděpodobnost P(|X| > x) a její odhady v L(1) pro r = 4 y 1.0
PHÈXÈ>xL 0.8
CMH6L 0.6
E X¤6 x6
0.4
E X¤6 CH6L x6
0.2
C* H6L
E X¤6 x6
x 0
2
4
6
8
10
Obrázek 3.16: Pravděpodobnost P(|X| > x) a její odhady v L(1) pro r = 6 y 1.0
PHÈXÈ>xL 0.8
CMH8L 0.6
E X¤8 x8
0.4
E X¤8 CH8L x8
0.2
C* H8L
E X¤8 x8
x 0
2
4
6
8
10
Obrázek 3.17: Pravděpodobnost P(|X| > x) a její odhady v L(1) pro r = 8 Dle věty 2.2 je r
E |X|r exp {−r} rr λr Γ(r + 1) exp {−r} rr λ 2 B(k, r) = C (r) r = r = . k kr kr λ 2 Γ(r + 1) ∗
20
y 1.0
PHÈXÈ>xL 0.8
CMH10L 0.6
E X¤10 x10
0.4
E X¤10 CH10L x10
0.2
C* H10L
E X¤10 x10
x 0
2
4
6
8
10
Obrázek 3.18: Pravděpodobnost P(|X| > x) a její odhady v L(1) pro r = 10 y 0.25 æ
æ
æ
æ
æ
æ
æ
0.20
æ à
æ
æ
0.15 æ à
0.10
CMHrL-C* HrL CHrL-C* HrL
à
0.05 à à
2
4
à
à
6
à
à 8
à
à r 10
˜ Obrázek 3.19: Srovnání rozdílů CM (r) − C ∗ (r) a C(r) − C ∗ (r) v L(1) Pro λ = 1 máme exp {−r} rr B(k, r) = . kr Derivace B 0 (k, r) =
∂B(k, r) exp {−r} rr (ln(r) − ln(k)) = ∂r kr
je rovna 0 právě tehdy, když r = k. Pro pevná k a pro r < k je B 0 (k, r) < 0 a pro r > k je B 0 (k, r) > 0. Tedy funkce B(k, r) nabývá své nejmenší hodnoty pro k = r. Podíváme-li se na předchozí grafy, tento výsledek je zde patrný (především viz obrázek 3.12 a obrázek 3.13). ˜ Uvažujme místo konstanty C ∗ (r) konstantu C(r). Potom r+1 r+1 r (r + 1) exp − λr Γ(r + 1) E |X| 2 λ ˜ r) = C(r) ˜ = B(k, kr rλ2(r+1) Γ(r + 1) kr (r + 1)r+1 exp − r+1 λ2 . = r+2 r rλ k Pro λ = 1 máme r+1 ˜ r) = (r + 1) exp {−r − 1} . B(k, rk r
Potom derivace ˜ r) (r + 1)r+1 exp {−r − 1} r − ln(k) + ln(r + 1) − ∂ B(k, B (k, r) = = ∂r kr r2 ˜0
21
1 r
k r˜
1 1.24
2 2.17
3 3.129
4 4.104
5 5.086
6 6.074
7 7.064
8 8.057
9 9.051
10 10.047
Tabulka 3.2: Odhad optimální hodnoty r v L(1) je rovna 0 právě tehdy, když ln(r + 1) − 1r = ln(k). Označme řešení této rovnice r˜. Vidíme, že r˜ dobře aproximuje optimální hodnotu r pro velká k (viz tabulka 3.2). r 10
æ æ æ
8 æ
æ æ
6
lnHr+1L -
1 r
= lnHkL
æ æ
4
r=k
æ æ
2 æ
k 2
4
6
8
10
Obrázek 3.20: Srovnání optimální hodnoty r a jejího odhadu r˜ v L(1)
3.3
Logaritmicko-normální rozdělení
Nechť X ∼ lnN (0, 1). Tedy X je náhodná veličina s logaritmicko-normálním 1 rozdělením se střední hodnotou µ = 0 a rozptylem σ 2 = 1. Modus X je m = exp{1} . o n o n 2 2 (ln x) . Potom r-tý moment je E X r = exp r2 . Hustota je g(x) = x√12π exp − 2 Markovova nerovnost (0.1) pro r = 2 pro lnN (0, 1) je P (|X| ≥ x) ≤
exp {2} . x2
Vysochanskii-Petuninova nerovnost (1.11) pro lnN (0, 1) je 4 exp {2} 8 exp {2} , pro k 2 ≥ , 2 9k 3 P(|X| ≥ x) ≤ 4 exp {2} − 1 , pro k 2 ≤ 8 exp {2} . 3k 2 3 3 Na obrázku 3.21 porovnáváme skutečnou hodnotu P (|X| ≥ x) s Markovovým a Vysochanskii-Petuninovým odhadem. Markovův odhad není příliš přesný. Vysochanskii-Petuninův odhad aproximuje skutečnou hodnotu pravděpodobnosti lépe, zejména pro k 2 ≥ 8 exp{2} . 3 Funkce (ln(x))2 r x exp − 2
22
y 1.0 0.8
PHÈXÈ>xL
0.6
exp 82< x2
0.4
4 exp 82< 9 x2
0.2
, x2 ³
8 exp 82< 4 exp 82< 3
3 x2
1
- 3 , x2 £
8 exp 82< 3
x 0
2
4
6
8
10
Obrázek 3.21: Pravděpodobnost P(|X| > x), Markovův a Vysochanskii-Petuninův odhad v lnN (0, 1) ˜ nabývá svého maxima v bodě x = exp {r}. Tedy můžeme vyjádřit konstantu C(r) v tomto tvaru 1 r+1 n o supx>0 x √ (ln(x))2 x 2π exp − supx>0 {xr+1 g(x)} 2 ˜ r2 = C(r) = r rEX r exp 2 n 2o exp r2 1 r2 √ = √ . = r exp 2 2π r 2π ˜ E Xr r pro konkrétní hodnoty r. Obrázek 3.22 porovnává odhady C(r) x PHÈXÈ>xL E X¤ CH1L x
y 1.0 0.8
E X¤2 CH2L x2
0.6
E X¤3 CH3L x3
0.4
E X¤4 CH4L x4
0.2 x 0
2
4
6
8
10
E X¤5 CH5L x5
Obrázek 3.22: Pravděpodobnost P(|X| > x), Markovův a Vysochanskii-Petuninův odhad v lnN (0, 1) Vidíme, že už pro r = 2 dostáváme dobrou aproximaci skutečné hodnoty pravděpodobnosti. S rostoucím r dostáváme celkem přesné odhady pro P(X > x) vysoká x. Označme n 2o exp r2 E Xr ˜ ˜ B(k, r) = C r = √ . k r 2πk r Potom derivace exp ˜ ˜ 0 (k, r) = ∂ B(k, r) = B ∂r
n 2o
23
r 2
(−r ln(k) + r2 − 1) √ r 2πk r
k r˜
1 1
2 1.405
3 1.69
4 1.91
5 2.088
6 2.238
7 2.368
8 2.482
9 2.584
10 2.676
Tabulka 3.3: Odhad optimální hodnoty r v lnN (1) √ ln(k)±
(ln(k))2 +4
je rovna 0 právě tehdy, když r = . Jelikož uvažujeme pouze kladná 2 √ 2 ln(k)+ (ln(k)) +4 r, potom označme r˜ = . Pro vysoké hodnoty k lze pravděpodob2 nost P(|X| > k) dobře aproximovat pomocí malých momentů (viz tabulka 3.3). Tento jev můžeme také dobře pozorovat na obrázku 3.22. Nejen, že dokážeme pomocí konstant C(r) dobře aproximovat skutečnou hodnotu pravděpodobnosti P (|X| > x), ale tyto odhady pro konkrétní rozdělení mohou mít nečekané aplikace.
3.4
Geometrické rozdělení
Pomocí odhadu pro geometrické rozdělení najdeme odhad Riemannovy zeta funkce ζ(r) =
∞ X 1 nr n=1
pro r > 1.
Nechť X ∼ Ge(p). Tedy X je náhodná veličina s geometrickým rozdělením s parametrem 0 < p < 1. Distribuční funkce je F (k) = 1−(1−p)k+1 , k = 0, 1, 2, . . . . Označme q = 1 − p. Potom platí P (X > k) = q k+1 . r . Funkce xr+1 q x+1 nabývá svého maxima na intervalu (0, ∞) v bodě x = − ln(q) Dle věty 1.2 pro X ∼ Ge(p) platí r r r r )+1 (− ln(q) r r − q − q [− ln(q) ]+1 r x+1 ln(q) ln(q) sup {x q } x>0 q k+1 ≤ = ≤ . kr kr kr A tedy po substituci α = ln(q) dostáváme 1 q k+1 ≥ = r r r kr q [− ln(q) ]+1 − ln(q)
exp {−α(k + 1)} . exp −α 1 + αr
r r α
Nyní aplikujeme sumu a dostáváme r P∞ ∞ r X α exp α α exp {−α(k + 1)} 1 r = ζ(r) = ≥ r k=1 . r r r k (exp {α} − 1)r exp −α 1 + α α k=1 Uvažujme α = r > 1, potom dostáváme odhad αα exp α αα exp {α} ζ(α) ≥ = . α (exp {α} − 1)α exp {α} − 1 Pro vysoká α dostáváme velice přesné aproximace funkce ζ(α) (viz obrázek 3.23).
24
æ
1.6 1.5 1.4
æ
1.3
ΖHΑL exp HΑL
à
1.2
æ
exp HΑL-1
à
1.1 à
1.0 2
æ à
æ à
4
æ à 6
æ à
æ à 8
æ à
æ à 10
Obrázek 3.23: Funkce ζ(α) a její odhad
3.5
Exponenciální rozdělení
Označme P množinu prvočísel. V této sekci najdeme pomocí odhadu pravděpodobnosti exponenciálního rozdělení horní odhad sumy exponenciál prvočísel X exp {−λp} . p∈P
Nechť X ∼ Exp(λ). Tedy X je náhodná veličina s exponenciálním rozdělením s kladným parametrem λ. Hustota je g(x) = λ exp {λx}. Potom r-tý moment je . Pro pravděpodobnost platí P(X > x) = exp {−λx}. E X r = Γ(r+1) λr r+1 Funkce x exp {−λx} nabývá svého maxima na intervalu (0, ∞) v bodě x = r+1 . Proto λ
sup x
r+1
exp {−λx) =
x>0
r+1 λ
r+1 exp {−(r + 1)} .
˜ Konstantu C(F, r) můžeme upravit na tvar r+1 supx>0 {xr+1 f (x)} ˜ C(F, r) = = λ r EF |X|r (r + 1)r+1 exp {−(r + 1)} . = rΓ(r + 1)
r+1
λr+1 exp {−(r + 1)} rΓ(r + 1)
Dle věty 2.1 platí r
˜ E |X| . P(|X| > x) ≤ C(r) xr Pro X ∼ Exp(λ) tedy máme (r + 1)r+1 exp {−(r + 1)} , λr rxr exp {−λx} rλr exp {r + 1} ≥ , (r + 1)r+1 exp {−λx} rλr exp {r + 1} ≤1− , (r + 1)r+1
exp {−λx} ≤ 1 xr 1 1− r x
25
1 ≤ 1 − x1r 1−
1 exp{−λx}rλr exp{r+1} (r+1)r+1
.
Nyní použijeme vztah z [Edwards, 1974, str.6] ∞ X Y 1 1 ζ(r) = = nr p∈P 1 − p1r n=1
pro r > 1.
Potom platí ζ(r) ≤
1−
p∈P
Y
≤
p∈P
≤1+
!
1
Y
rλr exp{r+1} (r+1)r+1 r
exp {−λp}
rλ exp {r + 1} 1+ exp {−λp} (r + 1)r+1
rλr exp {r + 1} X exp {−λp} . (r + 1)r+1 p∈P
A tedy dostáváme odhad X
exp {−λp} ≤
p∈P
(r + 1)r+1 (ζ(r) − 1). rλr exp {r + 1}
(3.1)
Odhad (3.1) porovnáme s odhadem z [Bach, 2007] X
f (p) ≈
p≤x,p∈P
X f (n) , ln(n) n≤x
kde je funkce f (p) = exp {−λp} a volíme x = 106 , tedy X exp {−λn} n≤x
ln(n)
.
(3.2)
y 0.6 0.5
Úp £ x expH-pL
0.4
Ún £ x
0.3
exp H-nL ln HnL
r+1
Hr+1L HΖHrL-1L r exp Hr+1L
0.2 r 1.5
2.0
2.5
Obrázek 3.24: Srovnání
3.0
P
3.5
p≤x,p∈P
4.0
4.5
exp {−λp} a odhadů 3.1 a 3.2 pro λ = 1
26
y 0.05
0.04
Úp £ x expH-2pL
0.03
Ún £ x
exp H-2 nL ln HnL r+1
Hr+1L HΖHrL-1L 2r r exp Hr+1L
0.02
r 2.5
3.0
3.5
Obrázek 3.25: Srovnání
4.0
4.5
P
5.0
p≤x,p∈P
5.5
6.0
exp {−λp} a odhadů 3.1 a 3.2 pro λ = 1
Pro P vhodnou konstantu r získáváme celkem dobré aproximace skutečné hodnoty exp {−λp}. Dokonce pro λ = 2 může být odhad (3.1) přesnější než p≤x,p∈P
odhad (3.2) (viz obrázek 3.25).
27
Závěr V kapitole 1 jsme se zabývali odhady pro náhodné veličiny s unimodálním rozdělením. Podrobně zde byla dokázána Gaussova nerovnost (1.1) a její zobecnění Camp-Meidellova nerovnost (1.4). Navíc jsme pomocí věty 1.2 z [Sellke, Sellke, 1997] dokázali modifikaci nerovnosti (1.4). Dále jsme uvedli nerovnosti z [Sellke, Sellke, 1997] pro náhodné velčiny, které nemají modus roven 0 a odvodili jsme VysochanskiiPetuninovu nerovnost (1.11). V kapitole 2 jsme uvedli věty z [DasGupta, 2000], které se týkají hledání nejlepší konstanty C ∗ (r) a optimálního parametru r tak, že platí E |X|r P(|X| > k) ≤ C (r) r . k ∗
V kapitole 3 jsme se věnovali aplikacím na konkrétní rozdělení. V sekcích 3.1, 3.2 a 3.3 jsme aplikovali věty z kapitoly 1 a 2 na normální, Laplaceovo a logaritmicko-normální rozdělení. Některé z výsledků byly publikovány v [DasGupta, 2000]. V těchto sekcích však lze nalézt podrobnější výpočty a exaktní tvar některých konstant. Navíc pro normální rozdělení jsme našli odhad optimální hodnoty parametru r. Na logaritmicko-normální, jakožto zástupce nesymetrického rozdělení s nenulovým modem, jsme aplikovali Vysochanskii-Petuninovu nerovnost (1.11) z kapitoly 1. Výsledky jsou zde podrobně zpracovány graficky. V sekcích 3.4 a 3.5 jsme se věnovali aplikacím odhadů pro geometrické a exP ponenciální rozdělení, funkci ζ(α) a sumě exponenciál prvočísel p∈P exp {−λp}, které jsou uvedeny v [DasGupta, 2000]. P Odhad funkce ζ(α) jsme graficky porovnali s její skutečnou hodnotou. Odhad p∈P exp {−λp} byl porovnán s odhady z [Bach, 2007]. V obou případech jsme dostali celkem přesné aproximace.
28
Literatura [Bach]
BACH, E.: Sums over primes. Proceedings of Conference on Algorithmic Number Theory 2007 46, str. 3–22, 2007.
[Cramér] CRAMÉR, H.: Mathematical Methods of Statistics. Princeton University Press, Princeton, 1946. [DasGupta] DASGUPTA, A.: Best constants in Chebyshev inequalities with various applications. Metrika 51, str. 185–200, 2000. [Dharmadhikari] DHARMADHIKARI, S. W. and JOAG-DEV, K.: The GaussTchebyshev inequality for unimodal distributions. Theory of Probability and its Applications 30, str. 867–871, 1986. [Edwards] EDWARDS, H. M.: Riemann’s Zeta Function. Academic Press, New York, 1974. [Peajcariaac, Tong] PEAJCARIAAC, J. E. and TONG, Y. L.: Convex Functions, Partial Orderings, and Statistical Applications. Academic Press, New York, 1992. [Sellke, Sellke] SELLKE, T. M. and SELLKE, S. H.: Chebyshev inequalities for unimodal distributions. The American Statistician 51, str. 34–40, 1997.
29
Seznam tabulek 3.1 3.2 3.3
Odhad optimální hodnoty r v N (0, 1) . . . . . . . . . . . . . . . . Odhad optimální hodnoty r v L(1) . . . . . . . . . . . . . . . . . Odhad optimální hodnoty r v lnN (1) . . . . . . . . . . . . . . . .
30
17 22 24
Seznam obrázků 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.11 3.12 3.13 3.14 3.15 3.16 3.17 3.18 3.19 3.20 3.21 3.22 3.23 3.24 3.25
Pravděpodobnost P(|X| > x), Čebyševův a Gaussův odhad v N (0, 1) Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 1 . . Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 2 . . Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 3 . . Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 4 . . Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 6 . . Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 8 . . Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 10 . ˜ Srovnání rozdílů CM (r) − C ∗ (r) a C(r) − C ∗ (r) v N (0, 1) . . . . Pravděpodobnost P(|X| > x) a její odhady v N (0, 1) pro r = 10 pro k blízko 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pravděpodobnost P(|X| > x), Čebyševův a Gaussův odhad v L(1) Pravděpodobnost P(|X| > x) a její odhady v L(1) pro r = 1 . . . Pravděpodobnost P(|X| > x) a její odhady v L(1) pro r = 2 . . . Pravděpodobnost P(|X| > x) a její odhady v L(1) pro r = 3 . . . Pravděpodobnost P(|X| > x) a její odhady v L(1) pro r = 4 . . . Pravděpodobnost P(|X| > x) a její odhady v L(1) pro r = 6 . . . Pravděpodobnost P(|X| > x) a její odhady v L(1) pro r = 8 . . . Pravděpodobnost P(|X| > x) a její odhady v L(1) pro r = 10 . . . ˜ Srovnání rozdílů CM (r) − C ∗ (r) a C(r) − C ∗ (r) v L(1) . . . . . . Srovnání optimální hodnoty r a jejího odhadu r˜ v L(1) . . . . . . Pravděpodobnost P(|X| > x), Markovův a Vysochanskii-Petuninův odhad v lnN (0, 1) . . . . . . . . . . . . . . . . . . . . . . . . . . . Pravděpodobnost P(|X| > x), Markovův a Vysochanskii-Petuninův odhad v lnN (0, 1) . . . . . . . . . . . . . . . . . . . . . . . . . . . Funkce ζ(α) P a její odhad . . . . . . . . . . . . . . . . . . . . . . . Srovnání Pp≤x,p∈P exp {−λp} a odhadů 3.1 a 3.2 pro λ = 1 . . . . Srovnání p≤x,p∈P exp {−λp} a odhadů 3.1 a 3.2 pro λ = 1 . . . .
31
13 14 15 15 15 16 16 16 16 17 18 19 19 20 20 20 20 21 21 22 23 23 25 26 27