Obsah 1
Úvodem
13
2 2.1 2.2 2.3 2.3.1 2.3.2 2.3.3 2.3.4 2.3.5 2.3.6 2.3.7 2.3.8 2.3.9 2.3.10 2.3.11 2.3.12 2.3.13 2.4
Dříve les než stromy Nejednoznačnost terminologie Volba metody analýzy dat Přehled vybraných vícerozměrných metod Metoda hlavních komponent Faktorová analýza Kanonická korelační analýza Regresní analýza Analýza rozptylu Analýza kovariance Diskriminační analýza Logistická regrese Analýza kategoriálních dat Shluková analýza Vícerozměrné škálování Korespondenční analýza a vizualizace dat Analýza conjoint Klasifikace vícerozměrných statistických metod
17 17 23 25 26 27 28 28 30 31 31 32 33 34 34 35 35 36
Literatura 3 3.1 3.2 3.3 3.4 3.4.1 3.4.2 3.4.3 3.5 3.6 3.7 3.8 3.9 Literatura
40 Operace s maticemi Maticový počet pro potřeby této knihy Vektory a matice Některé věty maticového počtu Rozšíření maticového počtu Ortogonální matice Idempotentní matice Charakteristická čísla a charakteristické vektory Lineární a kvadratické formy Pozitivně definitní a pozitivně semidefinitní matice Odmocninová matice Singulární rozklad Pravidla pro derivování funkcí vektorů a matic
41 41 42 47 51 51 53 54 57 58 59 60 61 62
5
OBSAH
4 4.1 4.2 4.3 4.4 4.5 4.6 4.6.1 4.6.2 4.6.3 4.6.4
Rozdělení náhodných veličin Náhodné jevy a jejich pravděpodobnosti Pravidla pro počítání s pravděpodobnostmi Rozdělení náhodných veličin Rozdělení náhodného vektoru Charakteristiky náhodného vektoru Další modely diskrétních a spojitých rozdělení Vícerozměrné rozšíření diskrétních rozdělení Vícerozměrné normální rozdělení Výběrová spojitá jednorozměrná rozdělení Výběrová vícerozměrná spojitá rozdělení
Literatura 5 5.1 5.2 5.3 5.4
110 Data Metody pořizování dat Datová matice Soubor objektů a jeho rozsah Proměnné v datové matici
Literatura 6 6.1 6.2 6.3 6.4 6.5 6.5.1 6.5.2 6.5.3 6.6 6.7 6.8
6
111 112 120 122 123 128
Bayesovské a klasické myšlení Oprávněná kritika statistických úsudků Pohled do historie Bayesovské a četnostní pojetí pravděpodobnosti Bayesův vzorec pro náhodné jevy a hypotézy Bodové odhady Klasický přístup k bodovým odhadům Bayesovský přístup k bodovým odhadům Hodnocení kvality bayesovského bodového odhadu Intervalové odhady Testování hypotéz Výpočetní aspekty bayesovské statistiky
Literatura 7 7.1 7.2 7.3 7.4 7.4.1 7.4.2 7.5 7.6 7.6.1
63 63 67 73 86 88 90 91 98 102 105
129 129 132 136 143 147 147 151 153 160 162 168 176
Ověřování kvality dat Důvody a nástroje zkoumání dat Chybějící údaje Intervalové a skupinové rozdělení četností Vyhledávání odlehlých pozorování Identifikace jednorozměrných odlehlých pozorování Identifikace vícerozměrných odlehlých pozorování Předpoklad normálního rozdělení Grafické posouzení normálního rozdělení Grafické posouzení jednorozměrného normálního rozdělení
179 179 183 185 187 190 194 199 201 201
OBSAH
7.6.2 7.7 7.7.1 7.7.2 7.7.3 7.7.4 7.7.5 7.7.6 7.7.7 7.8
Grafické posouzení vícerozměrného normálního rozdělení Ověřování typu rozdělení pomocí statistických testů Chí-kvadrát test dobré shody Výběrová distribuční funkce a Kolmogorovův test Testy vycházející z šikmosti a špičatosti rozdělení Shapirův a Wilkův test normality D’Agostinův test Test založený na studentizovaném rozpětí Andersonův-Darlingův test Transformace dat
Literatura 8 8.1 8.2 8.2.1 8.2.2 8.3 8.3.1 8.3.2 8.4 8.4.1 8.4.2
233 Závislost a vztah dvou proměnných Dvě kvantitativní proměnné Asociace a korelace Pearsonův korelační koeficient Regresní funkce s jednou vysvětlující proměnnou Jednofaktorová analýza rozptylu Vliv třídicího faktoru na úroveň kvantitativní proměnné Mnohonásobná porovnávání (simultánní úsudky) Dvě kategoriální proměnné Výběrové míry asociace Testy nezávislosti
Literatura 9 9.1 9.2 9.3 9.4 9.5 9.6 9.7
Literatura
235 235 237 239 243 255 257 263 267 269 276 281
Vektor středních hodnot Úsudky o středních hodnotách Úsudky o střední hodnotě normálního rozdělení Úsudky o vektoru středních hodnot normálního rozdělení Úsudky o složkách vektoru středních hodnot Úsudky o vektoru středních hodnot při velkých výběrech Intervaly a testy pro četnosti při velkých výběrech Test o lineární formě vektoru středních hodnot
Literatura 10 10.1 10.2 10.3 10.4 10.5 10.6
206 209 209 211 217 222 225 227 228 231
283 283 284 285 289 297 298 300 302
Dva vektory středních hodnot Úsudky při srovnání výběrů ze dvou populací Dva nezávislé jednorozměrné náhodné výběry Dva nezávislé vícerozměrné výběry Simultánní úsudky o shodě složek dvou vektorů Nestejné kovarianční matice Ověření shody středních hodnot při dvou závislých výběrech
303 303 303 308 314 315 316 320
7
OBSAH
11 11.1 11.2 11.3 11.4 11.5 11.6 11.7 11.8 11.9
Kovarianční a korelační matice Úsudky o kovarianční matici Testy shody rozptylů Test shody kovariančních matic Populační korelační koeficienty Induktivní úsudky o korelačních koeficientech Důsledky vztahů mezi korelačními koeficienty Ověření úplné nezávislosti proměnných Ověření nezávislosti mezi skupinami proměnných Robustní odhady jednoduchého korelačního koeficientu
Literatura 12 12.1 12.2 12.3 12.4 12.5 12.6
347 Metoda hlavních komponent Hlavní komponenty Cíle analýzy hlavních komponent Hlavní komponenty v populaci Hlavní komponenty ve výběru Geometrický význam hlavních komponent Shrnutí metody hlavních komponent
Literatura 13 13.1 13.2 13.3 13.4 13.5 13.6 13.7 13.8
Faktorová analýza Explorativní a konfirmativní faktorová analýza Historie a názory na faktorovou analýzu Model faktorové analýzy Nejednoznačnost faktorového modelu Odhad parametrů faktorového modelu Řešení faktorových rovnic a počet faktorů Jednoduchá struktura a rotace faktorů Odhad faktorového skóre
8
377 377 378 379 382 383 389 392 397 409
Kanonická korelační analýza Úvod do kanonické analýzy Kanonické veličiny ve statistických metodách Korelace dvou skupin proměnných Kanonická korelace v populaci Kanonická korelace ve výběru Vztahy mezi původními a kanonickými veličinami
Literatura 15 15.1 15.1.1
349 349 349 351 357 364 364 376
Literatura 14 14.1 14.2 14.3 14.4 14.5 14.6
321 321 325 328 333 335 341 342 343 344
411 411 412 414 415 417 419 427
Vícenásobná lineární regrese Statistické modelování závislosti Měření závislosti a regrese není totéž
429 429 430
OBSAH
15.1.2 15.2 15.2.1 15.2.2 15.2.3 15.3 15.3.1 15.3.2 15.3.3 15.3.4 15.3.5 15.4 15.4.1 15.4.2 15.4.3 15.5 15.5.1 15.5.2 15.5.3 15.5.4 15.5.5 15.5.6 15.5.7 15.5.8 15.5.9 15.5.10 15.6 15.6.1 15.6.2 15.6.3 15.6.4 15.6.5 15.6.6 15.7
Heuristický úvod a skrytá korelace Regrese a korelace Úkoly regresní a korelační analýzy Regresní modely a jejich klasifikace Vyrovnávací kritéria Lineární regresní model Klasický lineární regresní model Odhad parametrů regresní funkce Metoda maximální věrohodnosti v regresi Bodové odhady v lineárním regresním modelu Odhad lineární funkce regresních koeficientů Intervaly spolehlivosti a testy hypotéz v KLM Intervaly spolehlivosti v KLM Test obecné lineární hypotézy Testy hypotéz v KLM Hodnocení kvality regresního modelu Rozklady součtů čtverců Analýza reziduí a vlivná pozorování Projekční matice Různé typy reziduí a jejich vlastnosti Vlivná pozorování Vysvětlující proměnné a kvalita modelu Chybná specifikace proměnných Výběr vysvětlujících proměnných Kritéria výběru proměnných Metody výběru podmnožiny proměnných Nesplněné podmínky KLM Zobecněný lineární model Heteroskedasticita Autokorelace Náhodné vysvětlující proměnné Multikolinearita Transformace dat a modelu Nevýběrová informace ve formě přesných lineárních omezení
Literatura 16 16.1 16.2 16.2.1 16.2.2 16.2.3 16.2.4 16.3 16.3.1 16.3.2
434 438 442 444 448 453 457 460 463 465 469 478 479 485 488 497 498 504 505 507 511 513 514 516 518 521 525 527 530 539 548 549 558 560 566
Obecný lineární model Základní pojmy Analýza rozptylu ‒ jednorozměrné úlohy s více faktory Faktoriální plán Uspořádání do bloků, model bez interakce Hierarchický experiment Opakovaná měření Vícerozměrná analýza rozptylu Jeden faktor Faktoriální návrh, dva faktory
569 569 579 580 587 590 593 602 603 612 9
OBSAH
16.3.3 16.3.4 16.4 16.4.1 16.4.2 16.4.3 16.4.4 16.5 16.6 16.6.1 16.6.2 16.7 16.7.1 16.7.2 16.7.3 16.7.4 16.7.5 16.7.6 16.7.7 16.7.8 16.7.9 16.7.10
Longitudinální data Analýza rozptylu s využitím kanonických proměnných Analýza kovariance Jeden faktor, jedna doprovodná proměnná Předpoklady modelu Testované hypotézy Dva faktory, jedna doprovodná proměnná Vícerozměrná analýza kovariance Vícerozměrný regresní model Vícerozměrné testy v regresním modelu Simultánní intervaly v regresním modelu Odhad parametrů a testování hypotéz v GLM Odhadnutelné parametrické funkce Testy hypotéz v GLM Typ I součtu čtverců Typ II součtu čtverců Typ III součtu čtverců Typ IV součtu čtverců Typ V součtu čtverců Typ VI součtu čtverců Porovnání regresních přímek Konstrukce obecného lineárního modelu
Literatura 17 17.1 17.2 17.3 17.4
678 Diskriminační analýza Podstata a cíl diskriminační analýzy Diskriminace dvou vícerozměrných normálních rozdělení Diskriminace v případě tří a více skupin Kanonická diskriminační analýza
Literatura 18 18.1 18.2
Literatura
10
681 681 682 691 696 710
Logistická regrese Alternativní vysvětlovaná proměnná Kategoriální vysvětlovaná proměnná
Literatura 19 19.1 19.2 19.3 19.4 19.5
617 620 624 624 627 630 633 637 644 646 650 652 653 657 658 661 662 665 668 668 668 672
711 711 723 728
Kategoriální proměnné Vícerozměrná kontingenční tabulka Loglineární model Odhad parametrů loglineárního modelu Volba vhodného loglineárního modelu Loglineární a logitový model
729 729 731 736 738 742 744
OBSAH
20 20.1 20.2 20.3 20.3.1 20.3.2 20.3.3 20.3.4 20.4 20.4.1 20.4.2 20.4.3 20.4.4 20.5 20.5.1 20.5.2 20.5.3 20.6 20.6.1 20.6.2 20.6.3 20.7 20.7.1 20.7.2
Shluková analýza Cíle shlukové analýzy Klasifikace metod shlukové analýzy Míry podobnosti a vzdálenosti Hodnocení vztahu dvou objektů Hodnocení vztahu dvou proměnných Hodnocení vztahu dvou kategorií nominální proměnné Hodnocení vztahu dvou shluků Metody k-shlukování Algoritmy k-centroidů Algoritmy k-medoidů Algoritmy fuzzy k-shlukování Algoritmy založené na modelu Metody hierarchického shlukování Aglomerativní algoritmy Divizivní algoritmy Dvourozměrné shlukování Speciální metody shlukování Algoritmy pro shlukování velkých souborů Algoritmy pro shlukování s kategoriálními proměnnými Algoritmy založené na hustotě a mřížce Hodnocení vytvořených shluků Hodnocení výsledků disjunktního shlukování Hodnocení výsledků fuzzy shlukování
Literatura 21 21.1 21.2 21.2.1 21.2.2 21.3 21.4 21.4.1 21.4.2 21.5 21.5.1 21.5.2 21.6 21.6.1 21.6.2 Literatura
745 745 747 748 749 754 755 755 757 757 760 761 764 764 764 769 771 771 772 775 776 776 777 780 781
Vícerozměrné škálování Podstata metody Vstupní data pro vícerozměrné škálování Vzdálenost objektů Podobnost objektů Modely MDS Metrické MDS Klasické MDS Odvození souřadnic z měr nepodobnosti Nemetrické MDS Ztrátová funkce Výpočetní algoritmus Modely individuálních diferencí Vážený euklidovský model Zobecněný euklidovský model
783 783 783 784 784 785 785 785 787 790 791 793 799 799 802 804
11
OBSAH
22 22.1 22.2 22.3 22.4 22.5 22.6 22.7 22.8
Korespondenční analýza Podstata korespondenční analýzy Elementární analýza kontingenčních tabulek Jednoduchá korespondenční analýza Míry vzdálenosti Výpočetní algoritmus Korespondenční mapa Hodnocení a interpretace modelu Vícenásobná korespondenční analýza
Literatura 23 23.1 23.2 23.3 23.4 23.5 23.6 23.7 23.7.1 23.7.2
825 Analýza conjoint Základní pojmy a principy v analýze conjoint Tradiční conjoint Metoda částečného profilu Hybridní modely Metoda založená na výběru Modelování heterogenity pomocí bayesovských modelů Současné trendy v analýze conjoint Adaptivní metoda založená na výběru Metoda založená na volbě z nabídky (MBC)
Literatura 24 24.1 24.2 24.2.1 24.2.2 24.2.3 24.2.4 24.2.5 24.3 24.4
805 805 806 807 810 811 815 817 820
827 827 829 834 835 837 840 841 842 845 847
Vizualizace vícerozměrných dat Cíle vizualizace Metody vizualizace Paralelní osy Bertinovy (permutační) matice Metoda projekčního prohledávání Metoda RadViz Kohonenovy mapy Dynamická grafická analýza a grafický software Grafická analýza korelační matice
849 849 850 850 852 856 857 860 863 864
Literatura
866
Rejstřík
867
Summary
877
12