AKM - 1.-2. CVIČENÍ Opakování maticové algebry •
Mějme matice A, B regulární, potom : ( AB)−1 = B −1A −1
•
( AT ) −1 = ( A −1 )T
•
( AT )T = A
•
( A + B)T = AT + BT
• • • • •
( AB)T = BT AT , kde A je řádu mxn a B nxk Čtvercová matice A je symetrická, pokud platí A=A T AI=IA=A A+0=0+A=A AB≠BA
Příklad 1.1: Mějme dvě čtvercové matice A a B.
1 4 1 2 A= ,B = 2 8 5 2 a) b) c) d) e)
Spočtěte součet a rozdíl matic. Spočtěte součin matic. Existují k maticím A a B matice inverzní? Spočtěte determinant. Určete transpozice matic.
Příklad 1.2: Mějme dvě matice A a B. 1 1 2 1 1 2 1 A= , B = 3 −1 2 1 . 3 5 2 2 2 5 3 Spočtěte součin matic A a B v přípustném pořadí. Zapište transpozici výsledné matice.
Příklad 1.3: Mějme matici Y
1 2 3 Y = 4 5 6 . 6 9 12 a) Jsou řádkové vektory matice Y lineárně nezávislé? b) Jakou hodnost má matice Y?
Příklad 1.4: Je matice A symetrická? 1 0 0 A = 0 1 1 . 1 0 1
Příklad 1.5: Nechť X je libovolná matice typu nxk. Je součin matic XTX nutně matice symetrická? Využijte některých pravidel výše.
Příklad 1.6: Mějme sloupcový vektor u = (u1 , u2 ,..., u5 )T . a) Jaký rozměr má matice u T u ? Zapište prvky této matice. b) Jaký rozměr má matice uu T ? Zapište prvky této matice.
Příklad 1.7: Mějme náhodný vektor y řádu nx1. Zapište E(y) a var(y).
Příklad 1.8: Mějme matici A 1 3 4 A= . 3 5 0 a) Chceme zjistit, jaký je průměr řádků matice A – toho můžeme dosáhnout násobením matice A vhodným řádkovým vektorem zleva. Najděte tedy takový vektor, aby byl výsledkem součinu řádkový vektor [2 4 2]. b) Chceme získat vážený součet sloupců matice A s vahami 0.3, 0.5, 0.2. c) Najděte matici C takovou, aby maticovým součinem CA vznikla matice, která odpovídá matici A s prohozenými řádky. d) Najděte matici C takovou, aby maticovým součinem AC vznikla matice, která odpovídá matici A s opačným pořadím sloupců.
Opakování statistiky
• • • • • • • •
E (c ) = c D (c ) = 0 E (cX ) = cE ( X ) D(cX ) = c 2 D( X ) E ( X + Y ) = E ( X ) + E (Y ) E ( X − Y ) = E ( X ) − E (Y ) Nezávislé náhodné veličiny X a Y: D( X ± Y ) = D( X ) + D(Y ) Závislé náhodné veličiny X a Y: D( X ± Y ) = D( X ) + D(Y ) ± 2cov( X , Y )
Příklad 1.9: Co jsou: a) Střední hodnota b) Medián c) Modus d) Rozptyl e) Kovariance f) Korelace g) Šikmost h) Špičatost
Příklad 1.10: Porovnejte rozptyl a špičatost následujících dvou rozdělení:
Příklad 1.11: a) b) c) d) e) a. b. c. d.
Jsou-li dvě náhodné veličiny negativně korelované, co nám to říká o jejich kovarianci? Jakých hodnot může nabývat kovariance dvou náhodných veličin? Jak je to s korelací? Víme-li, že cov(X,Y) = 0, jsou náhodné veličiny X a Y nutně nezávislé? Vysvětlete. Nechť jsou náhodné veličiny X a Y nezávislé. Je možné, že cov(X,Y) = 0,58? Která z následujících možností může nastat (jaký vztah je mezi kovariancí a korelací): corr(X,Y) = -1,56 corr(X,Y) = 0,28 a cov(X,Y) = 0 corr(X,Y) = 0,28 a cov(X,Y) = -0,5 corr(X,Y) = 0,28 a cov(X,Y) = 0,5.
Příklad 1.12: Když v televizních zprávách uslyšíte: „Průměrná měsíční mzda je 25 000 Kč“, vztahuje se termín průměrná mzda ke střední hodnotě, mediánu nebo modu? Jakou charakteristiku byste vy zvolili a proč? Jaké rozdělení mají mzdy v populaci?
Příklad 1.13: Rozdělení diskrétní náhodné veličiny X je dáno následující tabulkou.
a) Nakreslete graf distribuční funkce veličiny X (pozn.: F ( x) = P( X ≤ x) ). b) Spočtěte E(X). c) Spočtěte var(X).
Příklad 1.14: Jaká je střední hodnota z hodu šestistěnnou kostkou?
Příklad 1.15: Jsou dány dvě nezávislé náhodné veličiny X a Y, pro které platí: E(X) = 10, var(X) = 1 E(Y) = 5, var(Y) = 2.
Spočtěte: a) b) c) d) e)
E(4X) E(X+5) E(X+Y) E(4X-3Y) var(4X)
f) g) h) i) j)
var(X+5) var(X+Y) var(4X+3Y) var(X-Y) var(2X-Y+5).
Příklad 1.16: Následující tabulka udává sdružené rozdělení náhodných veličin X a Y.
Rozhodněte, zda jsou veličiny X a Y nezávislé. Dále spočtěte: a) E(X|Y=1) a E(Y|X=1) b) E(X) a E(Y) c) var(X) a var(Y)
Příklad 1.17: Házíme dvěma mincemi A a B (možné hodnoty kódujeme vždy jako 0 a 1), z výsledků hodláme spočítat náhodné veličiny X a Y následujícím způsobem: X = mince A , Y = mince A + mince B. a) Sestavte tabulku sdruženého pravděpodobnostního rozdělení veličin X a Y. b) Jsou veličiny X a Y nezávislé? Svoji odpověď zdůvodněte. c) Jsou veličiny X a Y pozitivně korelované, negativně korelované, nebo nekorelované? Svoji odpověď zdůvodněte. d) Určete P(Y = 2 | X = 1), P(Y = 2 | X = 0) a E(Y | X = 1). e) Jsou-li obecně dvě náhodné veličiny nekorelované, znamená to nutně, že jsou nezávislé? Svou odpověď zdůvodněte.
Příklad 1.18: a) Jakou byste očekávali korelaci mezi mzdami a vzděláním? b) Jakou relaci byste v průměru očekávali mezi mzdami lidí se základní a střední školou, tj. E(mzda|vzdělání = 9) ? E(mzda|vzdělání = 13). Naznačte vztah mezd a vzdělání proložením regresní přímkou. Dají se očekávat konstantní přírůstky průměrné mzdy s rostoucím vzděláním?
Příklad 1.19: Populační rozdělení výšky mužů (X) má střední hodnotu 180 cm a směrodatnou odchylku 4 cm. O rozdělení této náhodné veličiny nic jiného nevíme. Náhodně vybereme 10 jedinců a změříme hodnotu náhodné veličiny X každého z nich, tj, jejich výšku (získáme tak hodnoty 10
x1, x2, ... , x10). Z těchto získaných hodnot spočítáme prostý aritmetický průměr X =
∑x i =1
10
i
.
Jelikož vybíráme jedince náhodně, je i veličina X náhodná. a) Jaká je střední hodnota X a jaký je rozptyl? b) (Zákon velkých čísel) Namísto 10 lidí uvažujeme obecně n lidí. Co se stane s E( X ) a var( X ), jestliže n roste nade všechny meze?
Příklad 1.20: Uvažujme náhodný výběr (x1, x2, x3, x4) z populace, v níž má sledovaný znak X neznámou střední hodnotu (označme µ ) a neznámý rozptyl (označme σ 2 ). 4
a) Je výběrový průměr X =
∑x i =1
i
nestrannou odhadovou statistikou (nebo stručně 10 nestranným odhadem) populační střední hodnoty µ ? (Odhadová statistika parametru s je nestranná, je-li E(s) = µ ). b) Uvažujme namísto prostého aritmetického průměru vážený průměr podle předpisu: ω = 0,1x1 + 0, 2 x2 + 0,3x3 + 0, 4 x4 . Je ω nestranným odhadem µ ? c) Které z obou odhadových statistik z a) a b) byste věřili při odhadu µ více?
Příklad 1.21: V televizních novinách bylo uvedeno, že týdenní průměrná doba, kterou děti do 5 let věku stráví u televize je 22,6 hodin se směrodatnou odchylkou 6,1 hodin. Firma zaměřená na sociologické výzkumy však tvrdí, že je tento odhad značně podhodnocen a skutečná týdenní průměrná doba trávená dětmi do 5 let věku u televize je významně vyšší. Předpokládáme, že náhodná veličina X (průměrná týdenní doba strávená dětmi do 5 let věku u televize) má normální rozdělení. a) Formulujte nulovou a alternativní hypotézu. b) Firma provedla výzkum u 60 dětí (na základě prohlášení rodičů) a spočítala výběrový průměr 25,2 hodin. Rozhodla se provést test na 5% hladině významnosti – co znamená α = 0,05? c) Je tato hodnota statisticky významně vyšší než deklarovaná střední hodnota 22,6? d) Jak by se výsledek testu změnil (uvažujte stále α = 0,05), kdyby výběrový průměr činil ne 25,2, ale 23,4 hodin? e) Představte si, že populační rozptyl neznáte a odhadnete jej na základě výběrového rozptylu. Hodnota směrodatné odchylky pak vyšla 6,1 hodin. Jak se řešení problému změní?
Příklad 1.22: Diktátor nejmenované země využil referenda k legitimizaci své moci a tvrdí, že byl podpořen 60% voličů. OSN zveřejněným výsledkům příliš nedůvěřuje a najala vás, abyste ověřili pravdivost těchto výsledků. Poněkud omezený rozpočet vám umožňuje získat údaje o 400 náhodně vybraných voličích. Po sběru dat vyšlo najevo, že z výběrového vzorku 400 lidí hlasovalo pro diktátora přesně 200. Testujte na hladině významnosti α = 0,05 hypotézu o pravdivosti diktátorova tvrzení oproti jednostranné alternativě, že diktátor počet svých voličů nadhodnotil. a) Pro daný hlas zaveďte znak X, který nabývá hodnoty 1, pokud jedinec diktátora volil a hodnoty 0, pokud jej nevolil. Jaká je střední hodnota X v celé populaci? Jaký je rozptyl X? b) Formulujte vhodně statistické hypotézy, na základě kterých se pokusíte vyvrátit tvrzení diktátora. Zvažte a okomentujte, jak nejlépe postavit nulovou hypotézu a zda volit jednostrannou či oboustrannou alternativní hypotézu. c) Testujte Vámi definované hypotézy na hladině významnosti α = 0.05. Pokuste se vlastními slovy popsat, co vlastně znamená hladina významnosti 1%. d) Učiňte závěr.