ROBUST 2016 Sborn ık abstrakt u

ROBUST 2016 Sborn´ık abstrakt˚ u

TICKÁ P

Á STAT

IS

S O

K

OLEČN

ST

*

ČE

S

ROBUST 2016 ˇ ´ Í PODEKOV AN

Organizátoˇri ROBUSTu 2016 by t´ımto chtˇeli podˇekovat vˇsem, kteˇr´ı pomohli pˇri pˇr´ıpravˇe a realizaci celé akce. ˇ ˇ ˇ Velmi d˚ uleˇzit´ a pro n´ as byla moráln´ı i vˇecn´ a podpora jak CMS JCMF a CStS, tak MFF UK a KPMS MFF UK. Neménˇe d˚ uleˇzit´ a byla finanˇcn´ı podpora ˇrady univerzit a sponsor˚ u, at’ jiˇz jmenovit´ ych tak anonymn´ıch, kter´ a pˇredevˇs´ım umoˇznila u ´ˇcast mnoha student˚ u, jakoˇz udˇelen´ı cen za nejlepˇs´ı vystoupen´ı student˚ u a/nebo doktorand˚ u. Nejd˚ uleˇzitˇejˇs´ı pro zdárn´ y pr˚ ubˇeh ROBUSTu vˇsak bylo u ´sil´ı vˇsech u ´ˇcastn´ık˚ u, které vˇenovali jak pˇr´ıpravˇe a prezentaci sv´ ych vystoupen´ı, tak vytvoˇren´ı skuteˇcnˇe robustn´ı atmosféry“. K pˇr´ıjemné pohodˇe téˇz pˇrispˇela velmi ” dobr´ a péˇce vˇsech pracovn´ık˚ u Sporthotelu Kurzovn´ı. Vˇsem dˇekuj´ı a na setk´ an´ı na jubilejn´ım dvacátém Robustu v zimˇe 2018 se tˇeˇs´ı JA & GD & DH.

Abstrakty ROBUST 2016

c ROBUST 2016

Antoch Jarom´ır O detekci zmˇen v panelových datech . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Bˇeláˇcek Jarom´ır Progn´ oza demografických struktur pacient˚ u ambulantnˇe oˇsetˇrovaných v zaˇr´ızen´ıch Agel . . . . . . . . . . . . . . . 1 Brzezina Miroslav Matematika v systémech pro urˇcov´ an´ı polohy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Burclová Katar´ına Met´ ody odhadovania kovarianˇcnej matice priestorového medi´ anu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Cézová Eliˇska Statistické vyhodnocov´ an´ı pr˚ umyslových dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Coufal David Vzorkovac´ı schémata v ˇc´ asticovém filtru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 ˇ Cern´ y Michal O jedné variantˇe line´ arn´ı EIV regrese s omezenými chybami . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 ˇ Coupek Petr Linear SDE’s with additive noise of Volterra type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Drabinová Adéla Detection of differential item functioning with non-linear regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Dufek Jaroslav Joint estimation of parameters of mortgage portfolio and the factor process . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Dvoˇrák Jiˇr´ı Metoda minim´ aln´ıho kontrastu pro nehomogenn´ı ˇcasoprostorové shlukové bodové procesy . . . . . . . . . . . . . 4 Fabi´ an Zdenˇek Skal´ arn´ı sk´ orov´ a funkce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Faˇcevicová Kamila Souˇradnicov´ a reprezentace kompoziˇcn´ıch tabulek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Fiˇserová Eva Regresn´ı analýza kompoziˇcn´ıch dat a jej´ı interpretace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Gajdoˇs Andrej Explicitný tvar momentov aproxim´ acie MSE pre EBLUP v regresných modeloch ˇcasových radov . . . . . . 5 Gardlo Alˇzbˇeta Imputace nulových hodnot v metabolomice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Genest Christian, Neˇslehová G. Johanna Dependence modeling through copulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Hlubinka Daniel Eliptické kvantily . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Hol´ y Vladim´ır Odhad integrované variance za pˇr´ıtomnosti mikrostrukturn´ıho ˇsumu pomoc´ı line´ arn´ı regrese . . . . . . . . . . 6 Hor´ aková Hana Detekce v´ıce zmˇen v sez´ onn´ım chov´ an´ı pr˚ utokových ˇrad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Houda Michal Chance constrained DEA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Hron Karel Moˇznosti jednorozmˇerné statistické analýzy kompoziˇcn´ıch dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Hr˚ uzová Klára Klasick´ a a robustn´ı ortogon´ aln´ı regrese mezi sloˇzkami kompozice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 ˇarka Hudecová S´ Testy dobré shody pro ˇcasové ˇrady s diskrétn´ımi veliˇcinami . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Huˇsková Marie, Hl´ avka Zdenˇek Statistical procedures based on empirical characteristic functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Chvosteková Martina ˇ Statistick´ a kalibr´ acia a toleranˇcné oblasti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Jakub´ık Jozef Výber regresorov v line´ arnych zmieˇsaných modeloch s malým poˇctom prediktorov . . . . . . . . . . . . . . . . . . . . . 9 Jan´ ak Josef Odhady parametr˚ u v rovnici stochastického oscil´ atoru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Jaruˇsková Daniela Nesimult´ ann´ı zmˇeny ve sloˇzk´ ach n´ ahodného vektoru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 ˇ ek Jirs´ ak Cenˇ Hled´ an´ı optim´ aln´ıho ˇr´ızen´ı systému o dvou komponent´ ach pomoc´ı metody simulovaného ˇz´ıh´ an´ı . . . . . . 10 i


c ROBUST 2016

Jurczyk Tom´ aˇs Robustifikace statistických a ekonometrických metod regrese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Jurczyk Tom´ aˇs Co se vyˇzaduje od modern´ıch statistických program˚ u ................................................ Kadlec Karel Ergodic Control for Lévy-driven linear stochastic equations in Hilbert spaces . . . . . . . . . . . . . . . . . . . . . . . . Kafková Silvie Credibility premium in motor insurance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kasanick´ y Ivan Bayesova veta a asimil´ acia d´ at . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kaspˇr´ıková Nikola Nˇekteré modern´ı pˇr´ıstupy k z´ısk´ av´ an´ı dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Katina Stanislav Analýza selh´ an´ı ortopedických implant´ at˚ u s vyuˇzit´ım analýzy pˇreˇzit´ı a j´ adrového vyhlazov´ an´ı . . . . . . . . Kislinger Jan Vyuˇzit´ı ˇr´ızených markovských ˇretˇezc˚ u pˇri optimalizaci cen j´ızdného ve vlaku . . . . . . . . . . . . . . . . . . . . . . . . Klaschka Jan Za exaktn´ı testy a konfidenˇcn´ı intervaly pro parametr binomického rozdˇelen´ı logiˇctˇejˇs´ı! . . . . . . . . . . . . . . Klebanov Lev Big outliers versus heavy tails: What to use? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Klicnarová Jana Principy invariance pro n´ ahodn´ a pole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Koneˇcná Kateˇrina Metoda maxim´ aln´ı vˇerohodnosti pro volbu vyhlazovac´ıch parametr˚ u j´ adrových odhad˚ u ............... Koˇ nasová Kateˇrina Varianty K-funkce pro stacion´ arn´ı bodové procesy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kopa Miloˇs, Dupaˇcová Jitka Robustness in stochastic programs with decision dependent randomness . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kopˇcová Veronika Testing in the growth curve model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Koˇsˇcová Michaela Parametrizované parci´ alne sum´ acie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kuruczová Daniela Neparametrick´ a funkcion´ alna regresia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lachout Petr Diferencovatelnost re´ alných funkc´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Maciak Mat´ uˇs Testing shape restrictions in LASSO regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Majdiˇs Mojm´ır Line´ arna kombin´ acia nez´ avislých n´ ahodných premenných s lognorm´ alnym rozdelen´ım . . . . . . . . . . . . . . . Martinková Patr´ıcia Flexibiln´ı odhady reliability hodnocen´ı v pˇrij´ımac´ım ˇr´ızen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mas´ ak Tom´ aˇs Sparse principal component analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nagy Statislav Hl’bka d´ at v konvexnej geometrii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Navr´ atil Radim Testy a odhady zaloˇzené na minimalizaci vzd´ alenosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nedela Roman Sharp bounds on average treatment effects in the presence of sample selection bias . . . . . . . . . . . . . . . . . . Novák Petr Diagnostické metody pro model zrychleného ˇcasu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pawlas Zbynˇek Testov´ an´ı nez´ avislosti v prostorových modelech s k´ otami . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Peˇsta Michal Mixed dynamic copulae for stochastic processes with application in insurance . . . . . . . . . . . . . . . . . . . . . . . Peˇstová Barbora Abrupt change in mean avoiding variance estimation and block bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . Petrová Barbora Multidimensional stochastic dominance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii

10 11 11 11 11 12 12 12 12 13 13 13 13 13 14 14 15 15 15 15 16 16 16 17 17 17 17 18 18 18


c ROBUST 2016

Picek Jan L-momenty s ruˇsivou regres´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pokora Ondˇrej Vyuˇzit´ı regrese a analýzy funkcion´ aln´ıch dat pro vyhodnocen´ı neurofyziologických z´ aznam˚ u .......... Práˇsková Zuzana Bootstrap pro z´ avisl´ a data a detekce zmˇen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rendlová Julie Analýza kategori´ aln´ıch dat – problém v´ıcen´ asobné volby v odpovˇedi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rosa Samuel Optimal designs for dose-escalation studies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˇarka Rusá S´ Bayesovsk´ a analýza tˇr´ıu ´rovˇ nového modelu mediace s ordin´ aln´ı odezvou . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Selingerová Iveta J´ adrové odhady jako alternativa (semi)parametrických model˚ u v analýze pˇreˇzit´ı . . . . . . . . . . . . . . . . . . . . . Sokol Ondˇrej Sloˇzitost výpoˇctu horn´ı meze rozptylu nad n´ ahodnými daty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sz˝ ucs Gábor Rekurentné triedy diskrétnych rozdelen´ı pravdepodobnosti a odhadovanie ich parametrov . . . . . . . . . . . . . ˇ coviˇc Daniel Sevˇ Riccati transformation method for solving Hamilton-Jacobi-Bellman equation . . . . . . . . . . . . . . . . . . . . . . . ˇ Simkov´ a Tereza Multivariate L-moment homogeneity test for spatially correlated data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˇ Sulc Zdenˇek Metodologie hodnocen´ı mˇer podobnosti pro kategori´ aln´ı data na velkém mnoˇzstv´ı datových soubor˚ u ... Talsk´ a Renata Kompoziˇcn´ı regrese s funcion´ aln´ı z´ avisle promˇennou . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Turˇciˇcová Marie Modelovan´ı kovariance v asimilaci dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vaˇ nkátová Krist´ yna Shlukov´ a analýza ve smˇes´ıch regresn´ıch model˚ u ..................................................... Veˇceˇra Jakub Estimation of parameters in a planar segment process model with a biological application . . . . . . . . . . . . Vencálek Ondˇrej Zobecnˇené line´ arn´ı modely nebo analýza kompoziˇcn´ıch dat? Podobnosti a rozd´ılnosti! . . . . . . . . . . . . . . . . Vinkler Mojm´ır Effect of denoising on brain atrophy measurements based on MRI for Alzheimer’s disease . . . . . . . . . . . ´ V´ıˇsek Jan Amos Are the bad leverage points the most difficult problem for estimating regression model? . . . . . . . . . . . . . . Volf Petr O analýze konkuruj´ıc´ıch si rizik s aplikac´ı na ˇcas prvn´ıho g´ olu v fotbalovém utk´ an´ı . . . . . . . . . . . . . . . . . . Witkovsk´ y Viktor Vybrané met´ ody ˇstatististickej inferencie zaloˇzené na numerickej inverzii charakteristickej funkcie . . . Yermolenko Xeniya Non-unbiased two-sample nonparametric tests. Numerical example. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zikmundová Markéta Procesy interaguj´ıc´ıch u ´seˇcek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

iii

18 19 19 19 19 20 20 20 21 21 21 22 22 22 23 23 23 24 24 26 26 27 27


c ROBUST 2016

Jarom´ır Antoch O detekci zmˇ en v panelov´ ych datech MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] Uvaˇzujme model

yi,t = x⊤ i,t β i + δ i I{t ≥ t0 } + ei,t ,

1 ≤ i ≤ N, 1 ≤ t ≤ T,

(1)

kde parametry modelu v i-tém panelu se zmˇen´ı v nezn´ amém ˇcase t0 z β i na βi + δ i . Hlavn´ım c´ılem pˇredn´ aˇsky bude seznámit posluchaˇce se zkuˇsenostmi s odhadován´ım pˇr´ıpadné zmˇeny v tomto modelu pˇri mˇen´ıc´ıch se vstupn´ıch parametrech pro statistiky zaloˇzené na procesu UN (t) =

XN

i=1

b −β b β i,t i,T

⊤

b −β b C i,t β i,t i,T ,

b je odhad β z´ıskan´ kde β y metodou nejmenˇs´ıch ˇctverc˚ u z prvn´ıch t pozorován´ı a C i,t je nˇekterá vhodn´ a váhová i,t matice. Podˇekov´ an´ı: Jedn´ a se o v´ ysledky spoleˇcné práce s M. Huˇskovou, J. Hanouskem a dalˇs´ımi. Práce byla podpoˇrena ˇ P403/15/09663S. grantem GACR Jarom´ır Bˇ el´ aˇ cek, Tom´ aˇ s Fiala, Martin Parma, Pavel Michna, Karel Lukeˇ s, Kateˇ rina Murtingerov´ a Progn´ oza demografick´ ych struktur pacient˚ u ambulantnˇ e oˇ setˇ rovan´ ych ve zdravotnick´ ych zaˇ r´ızen´ıch skupiny Agel ´ J.B. : Oddˇelen´ı BioStat pˇri UBI 1. LF UK Praha; VFN Praha ˇ T.F. : Katedra demografie FIS VSE M.P. : Odbor plánován´ı a controllingu AGEL, Prostˇejov ´ P.M., K.M. : AGEL Research a.s.; Ustav dˇejin medic´ıny a ciz´ıch jazyk˚ u, 1. LF UK Praha [email protected] Pˇredmˇetem naˇseho u ´sil´ı v r. 2015 bylo ovˇeˇrit potenci´ al a moˇznosti propojen´ı u ´ˇcelovˇe vytˇr´ıdˇen´ ych u ´ daj˚ u z DB pacient˚ u 13ti zdravotnick´ ych zaˇr´ızen´ı (ZZ) skupiny AGEL (nemocnice a polikliniky v kraji Moravskoslezském, ˇ C´ılem tohoto shrnut´ı je identifikovat Olomouckém a v Praze) s dostupn´ ymi u ´daji z demografick´ ych statistik CR. budouc´ı potˇrebu zdravotnické péˇce (podle nejv´ yznamnˇejˇs´ıch subkapitol ˇc´ıseln´ıku MKN10) v porovnán´ı s jej´ı spotˇrebou (monitorovanou v rámci speci´ aln´ıho ˇc´ıseln´ıku zdravotnick´ ych odbornost´ı). V rámci kaˇzdé dostupné ˇ roku, vˇeku, pohlav´ı, ambulantn´ıch nemocnice ˇci polikliniky byly vytˇr´ıdˇeny poˇcty pacient˚ u podle unikátn´ıho RC, ˇ U ´ pro ’ pracoviˇst a unikátn´ıch hlavn´ıch diagnóz. Aplikace projekˇcn´ıch koeficient˚ u z demografické prognózy CS roky 2018, 2023 a 2028 vede k z´ avˇer˚ um, ˇze demografické stárnut´ı obyvatelstva bude m´ıt zjevnˇe jeˇstˇe mnohem v´ yznamnˇejˇs´ı odezvu na u ´rovni odpov´ıdaj´ıc´ıch pohlavnˇe-vˇekov´ ych struktur ambulantnˇe oˇsetˇrovan´ ych pacient˚ u. Z v´ ysledk˚ u formáln´ıch anal´ yz vypl´ yvá, které skupiny Dg a paralelnˇe které skupiny zdravotnick´ ych odbornost´ı (na agregaˇcn´ı u ´rovni) by mˇely nést v budoucnu nejvˇetˇs´ı zat´ıˇzen´ı z pohledu tˇech nejv´ıce exponovan´ ych vˇekov´ ych skupin pacient˚ u. Podˇekov´ an´ı: Práce na tomto pˇr´ıspˇevku byly provedeny s podporou veden´ı spoleˇcnosti AGEL Research, a.s. Miroslav Brzezina Matematika v syst´ emech pro urˇ cov´ an´ı polohy PˇrF TUL, KAP, Studentská 2, 461 17 Liberec 1 [email protected] V pˇredn´ aˇsce pop´ıˇseme ˇradu zaj´ımav´ ych matematick´ ych problém˚ u spojen´ ych s problematikou urˇcován´ı polohy pomoc´ı pomoc´ı druˇzic. Bude uk´ azáno, na jak´ ych principech jsou tyto systémuy zaloˇzeny, jak je dosahováo velké pˇresnosti i to, jakou roli pˇri tom hraje speci´ aln´ı i obecná teoreie relativity. Katar´ına Burclov´ a, J´ an Somorˇ c´ık Met´ ody odhadovania kovarianˇ cnej matice priestorov´ eho medi´ anu Univerzita Komenského, Mlynsk´ a dolina, 842 48 Bratislava [email protected] Pr´ıspevok sa zaober´ a odhadovan´ım kovarianˇcnej matice priestorového mediánu, ktor´ y sl´ uˇzi ako robustn´ y odhad parametra polohy viacrozmern´ ych d´ at a je ˇcasto interpretovan´ y ako optim´ alna poloha skladu v pr´ıpade, ˇze máme 1


c ROBUST 2016

v priestore rozmiestnen´ ych niekol’ko predajn´ı, vid’ [2]. Simulaˇcne sme porovnali vhodné metódy na odhad jeho kovarianˇcnej matice - Bootstrap, Jackknife, Plug-In a metódu Boseho a Chaudhuriho [1]. Pre u ´ˇcely poslednej menovanej metódy sme najprv na z´ aklade simuláci´ı urˇcili optim´ alnu vol’bu ladiacej konˇstantny nevyhnutnej pre v´ ypoˇcet. Totiˇz v [1] nie je otázka optim´ alnej vol’by ladiaceho parametra rieˇsen´ a a ukázalo sa, ˇze pri rôznych hodnot´ ach tohto ladiaceho parametra vznikaj´ u rôzne kvalitné odhady.

Literat´ ura [1] Bose, A., Chaudhuri, P.: On the dispersion of multivariate median. Ann. Inst. Statist. Math. 45(3), 541–550 (1993) [2] Vardi, Y.,Zhang, C.-H.: The multivariate L1 -median and associated data depth. The Proceedings of the National Academy of Sciences USA (PNAS). 97(4), 1423–1426 (2000)

Eliˇ ska C´ ezov´ a Statistick´ e vyhodnocov´ an´ı pr˚ umyslov´ ych dat ˇ CVUT FS, Technická 4, 166 07 Praha 6 [email protected] Ve svém pˇr´ıspˇevku se soustˇred´ım pˇredevˇs´ım na popis praktického vyuˇzit´ı popisné statistiky ve stroj´ırenstv´ı pˇri anal´ yze krout´ıc´ıho momentu potˇrebného pro utaˇzen´ı a povolen´ı ˇsroubového spoje pro dva typy z´ avit˚ u s r˚ uznou povrchovou u ´pravou z´ avitu matice.

David Coufal Vzorkovac´ı sch´ emata v ˇ c´ asticov´ em filtru ´ ˇ Pod Vod´ Ustav informatiky AV CR, arenskou vˇeˇz´ı 2, 182 07 Praha 8 [email protected] ´ Uloha filtrace spoˇc´ıv´ a ve stanoven´ı optim´ aln´ıho odhadu nepozorovan´ ych stav˚ u n´ ahodného procesu na z´ akladˇe pozorovan´ ych dat. Matematicky se jedná o stanoven´ı podm´ınˇeného rozdˇelen´ı stavu procesu za podm´ınky dostupn´ ych ´ pozorován´ı. Toto podm´ınˇené rozdˇelen´ı se naz´ yvá filtraˇcn´ı rozdˇelen´ı. Uloha filtrace je ˇreˇsitelná analyticky pouze ve speci´ aln´ıch pˇr´ıpadech, napˇr. v pˇr´ıpadˇe lineárn´ıch Gaussovsk´ ych proces˚ u je ˇreˇsen´ım znám´ y Kalmán˚ uv filtr. Obecnˇe, ale tato u ´loha nen´ı v uzavˇreném tvaru ˇreˇsitelná a pouˇz´ıvaj´ı se aproximaˇcn´ı algoritmy. ˇ asticov´ C´ y filtr pˇredstavuje algoritmus, kter´ y sekvenˇcnˇe generuje aproximaci filtraˇcn´ıho rozdˇelen´ı ve formˇe empirické m´ıry, jej´ımˇz nosiˇcem je soubor vzork˚ u (ˇca´stic) o daném rozsahu. Generován´ı prob´ıhá iteraˇcnˇe, kdy je v kaˇzdém kroku generován nov´ y soubor ˇca´stic na z´ akladˇe pˇredchoz´ıho souboru a aktuáln´ıho pozorován´ı. Systém generován´ı vzork˚ u m˚ uˇze m´ıt r˚ uzné varianty. V pˇredn´ aˇsce se zamˇeˇr´ıme na tato r˚ uzná vzorkovac´ı schémata. Pop´ıˇseme, jak konkrétnˇe vypadaj´ı a zm´ın´ıme jejich vlastnosti s ohledem na konvergenci empirické m´ıry ke skuteˇcnému filtraˇcn´ımu rozdˇelen´ı se vzr˚ ustaj´ıc´ım poˇctem vzork˚ u. ˇ Michal Cern´ y, Milan Hlad´ık a Jarom´ır Antoch O jedn´ e variantˇ e line´ arn´ı EIV regrese s omezen´ ymi chybami ˇ ˇ M.C.: FIS VSE, KE, N´ am. W. Churchilla 4, 130 67 Praha 3 M.H.: MFF UK, KAM, Malostranské n´ am. 25, 118 00 Praha 1 J.A.: MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected], [email protected], [email protected] Regresn´ı model je zat´ıˇzen tzv. EIV-problémem (Errors-In-Variables), jestliˇze nam´ısto skuteˇcn´ ych regresor˚ u pozorujeme jen regresory zat´ıˇzené chybami. Omez´ıme se na lineárn´ı regresn´ı model, kde nam´ısto matice regresor˚ u (obecnˇe stochastické) pozorujeme jen matici regresor˚ u zat´ıˇzenou aditivn´ım stochastick´ ym ˇsumem (tzv. struktur´ aln´ı EIV model). Za jist´ ych tradiˇcn´ıch pˇredpoklad˚ u lze regresn´ı parametry dobˇre“ odhadovat pomoc´ı u ´ pln´ ych ” nejmenˇs´ıch ˇctverc˚ u (Total Least Squares, TLS). Tato metodologie je také známa jako Demingova regrese. My se soustˇred´ıme na jin´ y, netradiˇcn´ı tvar chyb: budeme pˇredpokládat, ˇze vˇsechny chybové distribuce maj´ı omezen´ y nosiˇc v intervalu (−γ, γ), kde γ > 0 (tzv. polomˇer chyb) je nezn´ am´ a konstanta. Dopln´ıme dalˇs´ı asymptotické pˇredpoklady a sestroj´ıme konsistentn´ı estimátor pro vektor regresn´ıch parametr˚ u i pro polomˇer chyb. Tento esˇ timátor vznikne tak, ˇze v TLS nahrad´ıme Frobeniovu normu Cebyˇ sevovou normou. Z hlediska v´ ypoˇcetn´ıho stoj´ı za zm´ınku, ˇze v´ ypoˇcet estimátoru se redukuje na ˇreˇsen´ı systému zobecnˇen´ ych lineárnˇe-frakcionáln´ıch program˚ u (generalized linear-fractional programming, GLFP), které lze efektivnˇe poˇc´ıtat pomoc´ı vnitˇrn´ıch bod˚ u (Interior Point Methods, IPM). V pˇr´ıspˇevku také ilustrujeme geometrii stoj´ıc´ı za konstrukc´ı estimátoru. 2


c ROBUST 2016

ˇ Petr Coupek Linear SEE’s with additive noise of Volterra type MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] In this talk, we consider the stochastic Cauchy problem (SCP) dXt = AXt dt + ΦdBt X0 = x where B is a general, infinite-dimensional Volterra noise. The noise is continuous and satisfies a certain covariance structure determined by a Volterra kernel K but it does not need to be a semimartingale or a Gaussian process (e.g. the Rosenblatt process). We provide sufficient conditions for the existence and continuity of the mild solution to (SCP) with special attention to the interplay between the kernel K and the diffusion coefficient Φ.

Ad´ ela Drabinov´ a, Patricia Martinkov´ a Detection of differential item functioning with non-linear regression Department of Probability and Mathematical Statistics, Faculty of Mathematics and Physics, Charles University in Prague, Sokolovsk´ a 83, 186 75, Praha 8; Institute of Computer Science, The Czech Academy of Sciences, Pod Vod´ arenskou vˇeˇz´ı 271/2, 182 07, Praha 8 [email protected]; [email protected] Detection of Differential Item Functioning (DIF) has been considered one of the most important topics in measurement. Procedure based on Logistic Regression is one of the most popular tools in study field, however, it does not take into account possibility of guessing, which is expectable especially in multiple-choice tests. In this work, we present an extension of Logistic regression procedure by including probability of guessing. This general method based on Non-Linear Regression (NLR) model is used for detection of uniform and non-uniform DIF in dichotomous items. NLR technique for DIF detection is compared to Logistic Regression procedure and methods based on three parameter Item Response Theory model (Lord’s and Raju’s statistics) in simulation study based on Graduate Management Admission Test. NLR method outperforms Logistic Regression procedure in power for case of uniform DIF detection and moreover by providing estimate of pseudo-guessing parameter. Proposed method also shows superiority in power at rejection rate lower than nominal value when compared to Lord’s and Raju’s methods. The proposed NLR method is accompanied by an R package difNLR and is implemented in an online Shiny application ShinyItemAnalysis. Acknowledgement: Research was supported by the Czech Science Foundation project GJ15-15856Y. ˇ ıd Jaroslav Dufek, Martin Sm´ Joint estimation of parameters of mortgage portfolio and the factor process ´ ˇ vii., Prague, The Czech Republic; UTIA ´ ˇ MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8; UTIA AV CR AV CR vii., Prague, The Czech Republic [email protected]; [email protected] In [1] a factor model for LGD (loss given default) and PD (probability of default) of mortgage portfolio based on KVM approach is proposed. The authors further fit an evolution of factors by a VECM model; however, they take the parameters of a portfolio as fixed instead of estimation. The present paper proposes a technique of a joint estimation of VECM and portfolio parameters in particular MLE function is defined; asymptotic properties are discussed. The present paper proposes a technique for joint estimation of the VECM and the portfolio parameters. In particular, MLE function is defined and its asymptotic properties are discussed. Finally, our technique is applied to US market data.

Literat´ ura ˇ ıd, M.: Dynamic Multi-Factor Credit Risk Model with Fat-Tailed Factors. Czech Journal [1] Gapko, P. and Sm´ of Economics and Finance, 62(2): 125–140, 2012.

3


c ROBUST 2016

Jiˇ r´ı Dvoˇ r´ ak Metoda minim´ aln´ıho kontrastu pro nehomogenn´ı ˇ casoprostorov´ e shlukov´ e bodov´ e procesy MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] Uvaˇzujeme problém odhadu parametr˚ u pro nehomogenn´ı ˇcasoprostorové shlukové bodové procesy, s c´ılem vyhnout se obvykl´ ym pˇredpoklad˚ um na ˇcasoprostorovou separabilitu funkce intenzity. Zamˇeˇr´ıme se na tˇr´ıdu shot-noise Coxov´ ych bodov´ ych proces˚ u splˇ nuj´ıc´ıch pˇredpoklad intenzitou pˇreváˇzené stacionarity druhého ˇrádu. K odhadu vyuˇzijeme metodu minim´ aln´ıho kontrastu na tzv. ˇcasoprostorovou K-funkci K(r, t) jako funkci dvou argument˚ u: prostorové vzd´ alenosti dvou ud´ alost´ı r a jejich ˇcasové prodlevy t. Rozebereme postup odhadu vyuˇz´ıvaj´ıc´ı celou plochu K(r, t) a také moˇznost zjednoduˇsen´ı postupu vyuˇzit´ım pouze nˇekter´ ych profil˚ u této plochy.

Zdenˇ ek Fabi´ an Skal´ arn´ı sk´ orov´ a funkce ´ AV CR, ˇ Pod vod´ UI arenskou vˇeˇz´ı 2, 182 07 Praha 8 [email protected] Skalárn´ı sk´ orová funkce rozdˇelen´ı F s hustotou f definovanou na celém R je funkce −f ′ (x)/f (x). Autor jiˇz nˇekolikráte na konferenc´ıch ROBUST referoval o tom, ˇze se mu tuto funkci s v´ yznamem relativn´ı vlivové funkce vzhledem k módu rozdˇelen´ı podaˇrilo zavést i pro ostatn´ı spojitá rozdˇelen´ı, definovaná na polopˇr´ımce nebo intervalu, s v´ yznamem relativn´ı vlivové funkce vzhledem k urˇcitému centru rozdˇelen´ı. V pˇr´ıspˇevku novou funkci znovu definuji, vyˇsetˇr´ım jednoznaˇcnost a upozorn´ım na moˇzné vyuˇzit´ı pro ˇreˇsen´ı statistick´ ych u ´ loh.

Kamila Faˇ cevicov´ a, Karel Hron Souˇ radnicov´ a reprezentace kompoziˇ cn´ıch tabulek PˇrF UPOL, KMAAM, 17. listopadu 12, 771 46 Olomouc [email protected] Pˇr´ıspˇevek je zamˇeˇren na anal´ yzu kompoziˇcn´ıch tabulek, které pˇredstavuj´ı pˇr´ımé zobecnˇen´ı D–sloˇzkov´ ych (vektorov´ ych) kompoziˇcn´ıch dat. Kompoziˇcn´ı tabulky mohou b´ yt nav´ıc ch´ apány jako spojitá alternativa kontingenˇcn´ıch tabulek, také totiˇz zachycuj´ı vztah mezi dvˇema faktory, zaloˇzen´ y na informaci o pomˇerech mezi prvky tabulky. Kv˚ uli této relativn´ı povaze se kompoziˇcn´ı tabulky (stejnˇe jako kompoziˇcn´ı data obecnˇe) ˇr´ıd´ı tzv. Aitchisonovou geometri´ı [1, 5]. Abychom tedy mohli pouˇz´ıt standardn´ı analytické metody, je potˇreba tento typ dat pˇrevést prostˇrednictv´ım ortonormáln´ıch souˇradnic do prostoru se standardn´ı euklidovskou metrikou. Vyj´ adˇren´ı v ortonormáln´ıch souˇradnic´ıch je bˇeˇznˇe provádˇeno prostˇrednictv´ım tzv. postupného binárn´ıho dˇelen´ı [2], takto z´ıskané souˇradnice (bilance) vˇsak nerespektuj´ı dvojrozmˇernou povahu dat obsaˇzen´ ych v kompoziˇcn´ıch tabulkách. Kv˚ uli zachován´ı informace o vztahu mezi faktory proto navrhujeme jejich doplnˇen´ı o souˇradnice, jejichˇz interpretace je u ´zce spjatá s pomˇery ˇsanc´ı mezi skupinami prvk˚ u [3]. Právˇe konstrukci tˇechto souˇradnic a jejich interpretaci je vˇenována hlavn´ı ˇca´st pˇr´ıspˇevku. Na pˇr´ıpadˇe ˇctyˇrpoln´ı tabulky je nav´ıc pops´ an vztah mezi navrhovan´ ymi souˇradnicemi a parametry log-lineárn´ıho modelu.

Literatura [1] Aitchison J (1986) The statistical analysis of compositional data. Chapman and Hall, London. [2] Egozcue JJ, Pawlowsky-Glahn V, Mateu-Figueras G, Barcel´ o-Vidal C (2003) Isometric logratio transformations for compositional data analysis. Math Geol 35:279–300. [3] Faˇcevicová K, Hron K, Todorov V, Templ M (2015) Compositional tables analysis in coordinates. Scandinavian Journal of Statistics. Pˇrijato k tisku. [4] Pawlowsky-Glahn V, Egozcue JJ, Tolosana-Delgado R (2015) Modeling and analysis of compositional data. Wiley, Chichester.

Eva Fiˇ serov´ a, Ivo M¨ uller, Karel Hron Regresn´ı anal´ yza kompoziˇ cn´ıch dat a jej´ı interpretace PˇrF UPOL, KMAAM, 17. listopadu 12, 771 46 Olomouc [email protected] 4


c ROBUST 2016

Kompoziˇcn´ı data (kompozice) pˇredstavuj´ı speci´ aln´ı typ mnohorozmˇern´ ych dat, kter´ a v sobˇe nesou pouze relativn´ı informaci. V´ ybˇerov´ y prostor kompoziˇcn´ıch dat je simplex, kter´ y spolu s tzv. Aitchisonou geometri´ı tvoˇr´ı euklidovsk´ y vektorov´ y prostor. Jelikoˇz vˇetˇsina standardn´ıch statistick´ ych metod je zaloˇzena na euklidovské geometrii v reálném prostoru, nelze kompoziˇcn´ı data pˇr´ımo zpracovávat. Je tˇreba nejprve zvolit reprezentaci kompoziˇcn´ıch dat v reálném prostoru pomoc´ı vhodn´ ych transformac´ı logaritm˚ u pod´ıl˚ u sloˇzek a aˇz poté aplikovat standardn´ı statistické metody. V pˇredn´ aˇsce se zamˇeˇr´ıme na problematiku regresn´ı anal´ yzy kompoziˇcn´ıch dat, kde mohou nastat tˇri z´ akladn´ı u ´lohy: regrese s kompoziˇcn´ı vysvˇetlovanou promˇennou, regrese s kompoziˇcn´ımi vysvˇetluj´ıc´ımi promˇenn´ ymi a regrese mezi sloˇzkami kompozice. C´ılem pˇr´ıspˇevku je ukázat nové ortogonáln´ı souˇradnice, které umoˇzn ˇuj´ı analogickou interpretaci regresn´ıch parametr˚ u tak, jak je známa u standardn´ı regrese.

Andrej Gajdoˇ s, Martina Hanˇ cov´ a Explicitn´ y tvar momentov aproxim´ acie MSE pre EBLUP v line´ arnych regresn´ ych modeloch ˇ casov´ ych radov ˇ Jesenn´ PF UPJS, a 5, 040 01 Koˇsice 1 [email protected] Jedn´ ym zo z´ akladn´ ych krokov empirickej predikcie ˇcasov´ ych radov pomocou najlepˇsieho lineárneho nevych´ yleného prediktora (tzv. EBLUP) je odhad jeho strednej ˇstvorcovej chyby (MSE), ktor´ y n´ am dovol’uje vyjadrit’ napr. intervaly spol’ahlivosti, ˇci testovat’ hypotézy. Vo vˇseobecnosti analytick´ y tvar zdokonaleného odhadu MSE pre EBLUP vhodn´ y pre teoretické ˇst´ udium, ale aj poˇc´ıtaˇcové simulácie, z´ avis´ı od momentov (aˇz ˇsiesteho rádu) koneˇcného pozorovania daného ˇcasového radu. Hlavn´ ym v´ ysledkom pr´ıspevku je explicitn´ y tvar dan´ ych momentov koneˇcného pozorovania z viacrozmerného norm´ alneho rozdelenia s nenulovou strednou hodnotou pre invariantn´ ych kvadratick´ ych odhadcov varianˇcn´ ych parametrov ˇcasového radu. Praktickou aplikáciou v´ ysledkov je ich pouˇzitie pre korekciu odhadu MSE v pr´ıpade, kde realizácie ˇcasového radu ved´ u k z´ aporn´ ym ˇstandardn´ ym odhadom (maximálna vierohodnost’ alebo dvojit´ a metóda najmenˇs´ıch ˇstvorcov) a kde je nutné pouˇzit’ nezáporné invariantné vych´ ylené odhady. Dôleˇzitost’ tejto aplikácie sme podporili simulaˇcnou ˇst´ udiou na reálnom ekonometrickom ˇcasovom rade modelovanom lineárnym regresn´ ym modelom, kde k spomenut´ ym z´ aporn´ ym odhadom doch´ adza v nezanedbatel’nom mnoˇzstve pr´ıpadov. Za pr´ınos pr´ıspevku povaˇzujeme aj spôsob, ak´ ym boli dané explicitné tvary momentov z´ıskané. Iˇslo o aparát viacrozmernej ˇstatistiky - vektorizácia, kroneckerov s´ uˇcin, komutaˇcné matice a vzt’ahy medzi nimi. Pod’akovanie: N´ aˇs v´ yskum je finanˇcne podporen´ y z grantov VEGA 1/0344/14 a VVGS 72616.

Alˇ zbˇ eta Gardlo, Matthias Templ, Karel Hron, Peter Filzmoser Imputace nulov´ ych hodnot v metabolomice AG, KH: PˇrF UPOL, KMAAM, 17. listopadu 12, 771 46 Olomouc ´ AG: LF UPOL, Ustav molekulárn´ı a translaˇcn´ı medic´ıny, Laboratoˇr metabolomiky, Olomouc MT, PF: Dept. of Statistics and Probability Theory, Vienna University of Technology, Austria [email protected] Soubor organick´ ych slouˇcenin, jejichˇz velikost je na u ´rovni molekul, které jsou obsaˇzeny v daném biologickém materiálu, se naz´ yvá metabolom. Jsou zde zahrnuty vˇsechny organické látky pˇrirozenˇe se vyskytuj´ıc´ı v metabolismu sledovaného ˇzivého organismu. Anal´ yza metabolomu za dan´ ych podm´ınek se naz´ yvá metabolomika. Pˇri kvantifikaci informac´ı z metabolomiky maj´ı v´ ysledky ˇcasto podobu dat nesouc´ıch pouze relativn´ı informaci. Vektor tˇechto dat má kladné sloˇzky, relevantn´ı informace je obsaˇzena v pod´ılech mezi nimi, pˇr´ıpadnou zmˇenou mˇeˇr´ıtka se tedy tato informace nemˇen´ı. Uveden´ a pozorován´ı oznaˇcujeme jako kompoziˇcn´ı data [1], jejich statistická anal´ yza by mˇela uvedené vlastnosti zohledˇ novat. Témeˇr ˇza´dná ze souˇcasn´ ych statistick´ ym metod nen´ı schopna zpracovat datové soubory, které obsahuj´ı artefakty mˇeˇren´ı jako jsou chybˇej´ıc´ı hodnoty nebo tzv. hodnoty pod detekˇcn´ım limitem. Speci´ alnˇe tento druh´ y typ nulov´ ych hodnot se typicky vyskytuje v pˇr´ırodn´ıch vˇedách jako je chemometrie (nebo specificky metabolomika) a je spojen´ y s vlastnostmi mˇeˇr´ıc´ıho pˇr´ıstroje, jehoˇz limitace vedou právˇe k v´ yskytu nulov´ ych hodnot. Tyto nulové hodnoty musej´ı b´ yt ˇrádnˇe nahrazeny pˇred vlastn´ı statistickou anal´ yzou, zaloˇzenou povˇetˇsinou na vyuˇzit´ı logaritm˚ u p˚ uvodn´ıch látek ˇci jejich pod´ıl˚ u. Druh´ y z uveden´ ych pˇr´ıpad˚ u se pak t´ yká právˇe kompoziˇcn´ıch dat. Pro pˇr´ıpad standardn´ıch mnohorozmˇern´ ych soubor˚ u jiˇz existuje komplexn´ı metodika imputace chybˇej´ıc´ıch hodnot [2], kterou m˚ uˇzeme také aplikovat také na vysoce-rozmˇerná data [3], tato metodika ovˇsem selháv´ a v pˇr´ıpadˇe kompoziˇcn´ıch dat. D´ıky jejich specifick´ ym vlastnostem mus´ı b´ yt nahrazena kaˇzdá hodnota s ohledem na jej´ı relativn´ı charakter, vyjádˇren´ y pomoc´ı pod´ıl˚ u s ostatn´ımi sloˇzkami kompozice [4]. Prezentovaná metodika je nav´ıc obohacena o pˇr´ıstup, kter´ y umoˇzn ˇuje imputaci nulov´ ych hodnot pro vysoce-rozmˇern´ a data. Teoretické aspekty jsou doplnˇeny o simulaˇcn´ı studii a re´ aln´ y datov´ y soubor z Laboratoˇre metabolomiky LF UP. 5


c ROBUST 2016

Literatura [1] Aitchison J. (1986). The Statistical Analysis of Compositional Data. Monographs on Statistics and Applied Probability. Chapman & Hall Ltd., London (UK). (Reprinted in 2003 with additional material by The Blackburn Press). [2] Little R.J.A., Rubin D.B. (2002). Statistical analysis with missing data. Wiley, Hoboken. [3] Walczak B., Massart D.L. (2001). Dealing with missing data. Part I. Chemometrics and Intelligent Laboratory Systems 58, 15–27. [4] Mart´ın-Fern´ andez J.A., Hron K., Templ M., Filzmoser P., Palarea-Albaladejo J. (2012). Model-based replacement of rounded zeros in compositional data: classical and robust approaches. Computational Statistics and Data Analysis, 56 (9), 2688–2704.

Christian Genest and Johanna Neˇ slehov´ a Dependence modeling through copulas [email protected], [email protected] Copulas are multivariate distributions whose margins are uniform on the interval (0, 1). They provide a handy tool for the modeling of dependence between variables whose distributions are heterogeneous or involve covariates. Due to their flexibility, copula models are quickly gaining popularity in hydrology, finance and insurance. The first part of this two-hour talk will provide an introduction to statistical inference for copula models and its implementation in the R Project for Statistical Computing. In particular, it will be shown how estimation and goodness-of-fit testing can be performed using rank-based methods. The second part will be devoted to selected recent advances in the area, including copula modeling in the presence of ties, as well as the modeling of extreme-value dependence and its estimation through constrained B-spline smoothing. Daniel Hlubinka Eliptick´ e kvantily MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] Pˇredstav´ıme koncept eliptick´ ych kvantil˚ u pro mnohorozmˇern´ a data, ukáˇzeme moˇzné rozˇs´ıˇren´ı pro regresn´ı model a pokus´ıme se nast´ınit pouˇzit´ı eliptick´ ych kvantil˚ u v anal´ yze dat. Vladim´ır Hol´ y, Petra Tomanov´ a Odhad integrovan´ e variance za pˇ r´ıtomnosti mikrostrukturn´ıho ˇ sumu pomoc´ı line´ arn´ı regrese ˇ v Praze, Katedra ekonometrie, n´ VSE am. Winstona Churchilla 1938/4, 130 67 Praha 3 [email protected] Pouˇzit´ı dat zaznamen´ avan´ ych o vysok´ ych frekvenc´ıch je pˇr´ınosné pro odhad integrované variance cen finanˇcn´ıch aktiv. Pˇri vysok´ ych frekvenc´ıch se ovˇsem objevuje mikrostrukturn´ı ˇsum, kter´ y m˚ uˇze znaˇcnˇe vych´ ylit realizovan´ y rozptyl - z´ akladn´ı odhad integrované variance. Navrhujeme alternativn´ı odhad, kter´ y je robustn´ı k mikrostrukturn´ımu ˇsumu. Odhad vyuˇz´ıv´ a lineárn´ı regresi, ve které realizovan´ y rozptyl poˇc´ıtan´ y pˇri r˚ uzn´ ych frekvenc´ıch vystupuje jako vysvˇetlovaná promˇenná a poˇcet pozorován´ı jako vysvˇetluj´ıc´ı promˇenná. Metodu lze vyuˇz´ıt i pro testován´ı pˇr´ıtomnosti ˇsumu v datech. Navrhovan´ y odhad se porovná s dalˇs´ımi metodami popsan´ ymi v literatuˇre na simulovan´ ych datech pro nˇekolik model˚ u mikrostrukturn´ıho ˇsumu. Podpoˇreno z grantu IGS F4/63/2016 Vysoké ˇskoly ekonomické v Praze. Hana Hor´ akov´ a Detekce v´ıce zmˇ en v sez´ onn´ım chov´ an´ı pr˚ utokov´ ych ˇ rad ˇ FSv CVUT, Katedra matematiky, Th´ akurova 7 , 166 29 Praha 6 [email protected] V naˇsich pˇredchoz´ıch pˇr´ıspˇevc´ıch jsme se zab´ yvali detekován´ım zmˇen v sez´ onn´ım chován´ı pr˚ utokov´ ych ˇrad. Roˇcn´ı chod byl pops´ an vektorem parametr˚ u, které odpov´ıdaly Fourierov´ ym koeficient˚ um v pˇr´ıpadˇe, ˇze jsme roˇcn´ı chod aproximovali lineárn´ı kombinac´ı sin˚ u a kosin˚ u, nebo koeficient˚ um v metodˇe hlavn´ıch komponent. Pro takto zvolené vektory jsme pouˇzili statistické metody pro detekci bodu zmˇeny. V tˇechto metod´ ach se pˇredpokládá, ˇze v ˇradˇe doˇslo maxim´ alnˇe k jedné zmˇenˇe (AMOC). Pokud v ˇradˇe doˇslo k v´ıce zmˇenám, s´ıla pouˇzit´ ych test˚ u se zmenˇsuje. Existuj´ı vˇsak i testy, které se pouˇz´ıvaj´ı v pˇr´ıpadˇe, ˇze oˇcekáv´ ame v ˇradˇe v´ıce zmˇen. Pˇr´ıspˇevek se zab´ yvá pouˇzit´ım tˇechto test˚ u pro detekci zmˇen sez´ onn´ıho chován´ı pr˚ utokov´ ych ˇrad. 6


c ROBUST 2016

Literatura [1] Antoch J.,Jaruˇsková D.: Testing for multiple change points. Computational Statistics 28, 2161-2184, 2013. [2] Jaruˇsková, D., Hor´ aková, H., Satrapa, L. Detection of non-stationarities of several small Czech rivers by statistical methods, Civil Engineering Journal 1, 2015, DOI: 10.14311/CEJ.2015.01.0005. ˇ Podˇekov´ an´ı: Pˇr´ıspˇevek vznikl za finanˇcn´ı podpory SGS CVUT SGS16/002/OHK1/1T/11.

Michal Houda Chance constrained DEA ˇ Braniˇsovsk´ ˇ e Budˇejovice EF JCU, a 1645/31a, 370 05 Cesk´ [email protected] We present a stochastic programming approach, namely that using joint probabilistic constraints, for a problem of evaluating the performance of decision-making units by data envelopment analysis (DEA). Inputs and outputs are considered random, described by their probability distributions. In such cases, the resulting optimization model can be formulated as chance constrained optimization problem; the constraints are required to be satisfied only up to a prescribed probability. We provide a deterministic reformulation of the set of feasible solutions based on this approach, report several properties of the model, computations challenges connected with the model and present a simple illustrative example.

Karel Hron Moˇ znosti jednorozmˇ ern´ e statistick´ e anal´ yzy kompoziˇ cn´ıch dat PˇrF UPOL, KMAAM, 17. listopadu 12, 771 46 Olomouc [email protected] Kompoziˇcn´ı data charakterizujeme jako mnohorozmˇern´ a pozorován´ı, jejichˇz sloˇzky pˇredstavuj´ı relativn´ı pˇr´ıspˇevky ˇca´st´ı na celku; jinak ˇreˇceno, veˇsker´ a relevantn´ı informace je obsaˇzena v pod´ılech mezi kompoziˇcn´ımi sloˇzkami [1, 5, 5]. Typicky si lze kompozice pˇredstavit jako proporcionáln´ı data, ovˇsem podm´ınka konstatn´ıho souˇctu sloˇzek (v tomto pˇr´ıpadˇe 1) v definici kompoziˇcn´ıch dat nehraje roli; rozhodnut´ı o tom, zda je datov´ y soubor kompoziˇcn´ı ˇci nikoli, souvis´ı právˇe s t´ım, zda je pro u ´ˇcely anal´ yzy relevantn´ı relativn´ı struktura promˇenn´ ych, ˇci sp´ıˇse jejich absolutn´ı hodnoty. V kladném pˇr´ıpadˇe pak kompoziˇcn´ı data indukuj´ı tzv. Aitchisonovu geometrii (s vlastnostmi euklidovského vektorového prostoru), která respektuje jejich specifické vlastnosti, zejména zˇrejmou invarianci na zmˇenu mˇeˇr´ıtka. Protoˇze vˇetˇsina standardn´ıch mnohorozmˇern´ ych statistick´ ych metod vyuˇz´ıv´ a (v´ıce ˇci ménˇe explicitnˇe) pˇredpokladu euklidovské geometrie v reálném prostoru, je potˇreba pˇred dalˇs´ım statistick´ ym zpracován´ım kompozice nejprve vyjádˇrit v interpretovateln´ ych ortonormáln´ıch souˇradnic´ıch vzhledem k Aitchisonovˇe geometrii [2]. Vzhledem k tomu, ˇze je takov´ ychto souˇradnic o jednu ménˇe neˇz je aktuáln´ı poˇcet sloˇzek v kompozici, nelze reprezentovat vˇsechny sloˇzky souˇcasnˇe v rámci jednoho souˇradnicového systému. Je ovˇsem moˇzné zkonstruovat takov´ y ortonormáln´ı souˇradnicov´ y systém, kter´ y v jediné souˇradnici zachyt´ı veˇskerou informaci o dané sloˇzce (ve smyslu agregace logaritm˚ u pod´ıl˚ u s touto sloˇzkou) [3, 6]. V rámci této z´ akladn´ı myˇslenky lze n´ aslednˇe zohlednit vliv chyb mˇeˇren´ı pomoc´ı vah sloˇzek, které se projev´ı v poruˇsen´ı exkluzivity jednorozmˇerného vyjádˇren´ı relativn´ı informace o dané kompoziˇcn´ı sloˇzce [4]. Teoretické u ´vahy budou doplnˇeny simulaˇcn´ı studi´ı a re´ aln´ ym pˇr´ıkladem z aplikac´ı.

Literatura [1] J. Aitchison (1986). The Statistical Analysis of Compositional Data. Chapman & Hall, London. [2] J. J. Egozcue, V. Pawlowsky-Glahn (2005). Groups of parts and their balances in compositional data analysis. Mathematical Geology, 37(7), 795–828. [3] P. Filzmoser, K. Hron, C. Reimann (2009). Univariate statistical analysis of environmental (compositional) data: Problems and possibilities. Science of the Total Environment, 407(23), 6100–6108. [4] P. Filzmoser, K. Hron (2015). Robust coordinates for compositional data using weighted balances. In: K. Nordhausen, S. Taskinen (eds.) Modern Nonparametric, Robust and Multivariate Methods. Springer, Heidelberg: 167–184. ˇ [5] K. Hron (2010). Elementy statistické anal´ yzy kompoziˇcn´ıch dat. Informaˇcn´ı Bulletin CStS, 21(3), 41–48. [6] J.M. McKinley, K. Hron, E. Grunsky, C. Reimann, P. de Caritat, P. Filzmoser, K.G. van den Boogaart, R. Tolosana-Delgado (2016). The single component geochemical map: Fact or fiction. Journal of Geochemical Exploration, 162, 16–28. [7] V. Pawlowsky-Glahn, J.J. Egozcue, R. Tolosana-Delgado (2015). Modeling and Analysis of Compositional Data. Wiley, Chichester. 7


c ROBUST 2016

Kl´ ara Hr˚ uzov´ a1 , Valentin Todorov2 , Karel Hron1 , Peter Filzmoser3 Klasick´ a a robustn´ı ortogon´ aln´ı regrese mezi sloˇ zkami kompozice KH, KH: PˇrF UPOL, KMAAM, 17. listopadu 12, 771 46 Olomouc VT: UNIDO, Vienna International Centre, Vienna, Austria PF: Dept. of Statistics and Probability Theory, Vienna University of Technology, Austria [email protected] Pˇri statistické anal´ yze kompoziˇcn´ıch dat [1] je tˇreba brát v u ´vahu jejich odliˇsné geometrické vlastnosti plynouc´ı z relativn´ıho charakteru kompozic, proto je nejprve potˇreba tato data pˇrevést do souˇradnic vzhledem k tzv. Aitchisonovˇe geometrii. Z´ akladn´ım problémem je, jaké souˇradnice zvolit - z´ aleˇz´ı pˇredevˇs´ım na zvolené metodˇe a na souvisej´ıc´ı interpretovatelnosti v´ ysledk˚ u [5]. Vhodn´ a volba souˇradnic se ukázala b´ yt d˚ uleˇzit´ a zejména v pˇr´ıpadˇe, kdy se zaj´ım´ ame o anal´ yzu vztahu mezi jednotliv´ ymi sloˇzkami kompozice. Takto se dostáv´ ame k regresn´ımu modelu, ve kterém jsou z´ avisle i nez´ avisle promˇenné zat´ıˇzeny chybou [3], proto je jejich vztah modelován pomoc´ı ortogonáln´ı regrese, zaloˇzené na vyuˇzit´ı metody hlavn´ıch komponent [4]. Vzhledem k tomu, ˇze reáln´ a data ˇcasto obsahuj´ı odlehlá pozorován´ı, kter´ a mohou v´ ysledky regresn´ı anal´ yzy znehodnotit, je kromˇe klasické ortogonáln´ı regrese aplikována i robustn´ı verze vyuˇz´ıvaj´ıc´ı MM-odhady [6]. Statistická inference v regresn´ım modelu (testován´ı hypotéz o parametrech a konfidenˇcn´ı intervaly) je realizována pomoc´ı neparametrického bootstrapu [2], v pˇr´ıpadˇe robustn´ı metody pak vyuˇzit´ım rychlého a robustn´ıho bootstrapu [7]. Teorie je pˇredstavena na datech t´ ykaj´ıc´ıch se hrubé pˇridané hodnoty.

Literatura [1] Aitchison J. (1986). The Statistical Analysis of Compositional Data. Chapman & Hall, London. [2] Fox, J. (2002). Bootstrapping Regression Models. Appendix to an R and S-PLUS Companion to Applied Regression. http://statweb.stanford.edu/ tibs/sta305files/FoxOnBootingRegInR.pdf [3] Fuller, WA. (1987). Measurement Error Models. Wiley, New York. [4] Hr˚ uzová K., Todorov V., Hron K., Filzmoser P. (2016). Classical and robust orthogonal regression between parts of compositional data. Statistics, DOI: 10.1080/02331888.2016.1162164. [5] V. Pawlowsky-Glahn, J.J. Egozcue, R. Tolosana-Delgado (2015). Modeling and Analysis of Compositional Data. Wiley, Chichester. [6] Rousseeuw P., Hubert M. (2013). High-breakdown estimators of multivariate location and scatter. In Becker C., Fried R., Kuhnt S. (eds.), Robustness and complex data structures, pp 49-66. Springer, Heidelberg. [7] Van Aelst S., Willems G. (2013). Fast and robust bootstrap for multivariate inference: The R package FRB. Journal of Statistical Software 53(3).

ˇarka Hudecov´ S´ a, Marie Huˇ skov´ a a Simon G. Meintanis Testy dobr´ e shody pro ˇ casov´ eˇ rady s diskr´ etn´ımi veliˇ cinami MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] Modely ˇcasov´ ych ˇrad diskrétn´ıch veliˇcin (tj. modely posloupnost´ı z´ avisl´ ych n´ ahodn´ ych veliˇcin s diskrétn´ım rozdˇelen´ım) nach´ azej´ı uplatnˇen´ı v mnoha rozliˇcn´ ych praktick´ ych situac´ıch. Mezi nejpouˇz´ıvanˇejˇs´ı patˇr´ı modely celoˇc´ıselné autoregrese (INAR) a modely celoˇc´ıselné autoregrese s podm´ınˇenou heteroskedasticitou (INARCH). V naˇsem pˇr´ıspˇevku se zab´ yváme testy dobré shody pro v´ yˇse uvedené modely a navrhujeme testovou statistiku zaloˇzenou na empirické vytvoˇruj´ıc´ı funkci. Marie Huˇ skov´ a, Zdenˇ ek Hl´ avka Statistical procedures based on empirical characteristic functions MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected]; [email protected] The empirical characteristic function (ECF) has been in use in statistical inference for more than forty years. It is known that there is a one-to-one relation between the distribution function (DF) and the characteristic function (CF). The talk will provide a partial overview of testing procedures based on the ECF within certain statistical models. Specifically our emphasis is on recent developments of ECF procedures for goodness-of-fit testing, the twosample and the k-sample problem, the change-point problem without and with nuisance parameters. We discuss theoretical results (theorems and some proofs), computational aspects, simulations, and possible applications including change-point testing for the martingale difference hypothesis. 8


c ROBUST 2016

Martina Chvostekov´ a ˇ Statistick´ a kalibr´ acia a toleranˇ cn´ e oblasti ´ UM SAV, D´ ubravsk´ a cesta 9, 841 04 Bratislava 4 [email protected] Vo viacer´ ych vedn´ ych discipl´ınach sa ˇcasto stret´ avame s u ´ lohou stanovenia intervalového odhadu pre vysvetl’uj´ ucu premenn´ u prisl´ uchaj´ ucu k pozorovanej hodnote vysvetl’ovanej premennej. Tak´ ato u ´ loha nastáva napr´ıklad v pr´ıpadoch, ked’ urˇcenie presnej hodnoty premennej pre subjekt je technicky (v lekárstve sa môˇze jednat’ aj o bolestiv´ y invaz´ıvny z´ akrok pre pacienta), finanˇcne, alebo aj ˇcasovo n´ aroˇcné, zatial’ ˇco nameranie inej premennej ˇ pre dan´ y subjekt, ktor´ a je lineárne z´ avisl´ a na hl’adanej premennej, je nenároˇcné. Statistick´ a kalibr´ acia rieˇsi u ´lohu urˇcenia intervalového odhadu pre vysvetl’uj´ ucu premenn´ u (kalibraˇcn´ y interval) prisl´ uchaj´ ucu k pozorovanej hodnote vysvetl’ovanej premennej na z´ aklade odhadnutého regresného modelu. Ak poˇzadujeme, aby predp´ısaná ˇcast’ skonˇstruovan´ ych kalibraˇcn´ ych intervalov odpovedaj´ uca k l’ubovol’nej postupnosti pozorovan´ ych hodnˆ ot vysvetl’ovanej premennej pokr´ yvala prisl´ uchaj´ ucu skutoˇcn´ u hodnotu vysvetl’uj´ ucej premennej, hovor´ıme o tzv. simult´ annych kalibraˇcn´ ych intervaloch (viacnásobne pouˇzitel’n´ ych konfidenˇcn´ ych intervaloch). V pr´ıspevku sa budeme zaoberat’ konˇstrukciou jednorozmern´ ych a viacrozmern´ ych simult´ annych kalibraˇcn´ ych intervalov v pr´ıpade nez´ avisl´ ych norm´ alne rozdelen´ ych pozorovan´ı, ktor´ a je u ´zko prepojená s problematikou konˇstrukcie simult´ annych toleranˇcn´ ych oblast´ı. Toleranˇcné oblasti pokr´ yvaj´ u predp´ısan´ u ˇcast’ rozdelenia s poˇzadovanou spol’ahlivost’ou, v pr´ıpade lineárnej regresie vˇsak nie s´ u ˇziadne urˇcené ako rovnomerne najuˇzˇsie. Navrhnuté s´ u pribliˇzné simult´ anne kalibraˇcné oblasti za predpokladu rozdelenia vysvetl’uj´ ucich premenn´ ych, ktor´ ych ˇstatistické vlastnosti s´ u simulaˇcne porovnané s vlastnost’ami kalibraˇcn´ ych oblast´ı skonˇstruovan´ ymi so známymi metódami. Pod’akovanie: Táto práca bola podporená Agent´ urou na podporu v´ yskumu a v´ yvoja APVV-15-0295.

Jozef Jakub´ık V´ yber regresorov v line´ arnych zmieˇ san´ ych modeloch s mal´ ym poˇ ctom prediktorov ´ UM SAV, D´ ubravsk´ a cesta 9, 841 04 Bratislava 4 [email protected] Uvaˇzujeme lineárny zmieˇsan´ y model (LMM) v tvare Y = Xβ + Zu + ε, kde Y je n × 1 vektor pozorovan´ı, X je n × p matica regresorov, β je p × 1 vektor nezn´ amych pevn´ ych efektov, Z je n × q matica prediktorov, u je q × 1 vektor nezn´ amych n´ ahodn´ ych efektov s rozdelen´ım N (0, D(θ)), kde θ reprezentuje vektor varianˇcn´ ych komponentov, ε je n × 1 vektor ch´ yb s rozdelen´ım N (0, R = σ 2 I) nezávisl´ y od u. Metódy na v´ yber regresorov v LMM odvodené penalizáciou vierohodnostnej funkcie LMM pomocou ℓ1 penalizácie ved´ u vo vˇseobecnosti na rieˇsenie nekonvexného problému, z ˇcoho vypl´ yvaj´ u limitácie na poˇcet regresorov. V reálnych problémoch je ale ˇcasto poˇziadavka na vysok´ y poˇcet regresorov. V ˇspecifickom pr´ıpade, ked’ je poˇcet prediktorov mal´ y, je ale postaˇcuj´ uce (ako ukáˇzeme) uvaˇzovat’ LMM ako lineárny regresn´ y model s efektami s rôznou ˇstrukt´ urou. To transformuje problém na konvexn´ y, ˇco v´ yrazne zniˇzuje v´ ypoˇctov´ u zloˇzitost’ problému. Predstav´ıme metódu na tom zaloˇzen´ u, ktor´ a d´ ava porovnatel’né v´ ysledky pre problémy (s menˇs´ım poˇctom regresorov) na ktoré sa daj´ u uplatnit’ doteraz známe metódy a z´ aroveˇ n dok´ aˇze rieˇsit’ problémy s väˇcˇs´ım poˇctom regresorov. Metódu oprieme o konzistenciu zabezpeˇcuj´ ucu spr´ avny v´ yber regresorov s rast´ ucim poˇctom pozorovan´ı ako aj o v´ ysledky viacer´ ych simulaˇcn´ ych ˇst´ udi´ı. Pod’akovanie: Táto práca bola podporená Agent´ urou na podporu v´ yskumu a v´ yvoja APVV-15-0295.

Josef Jan´ ak Odhady parametr˚ u v rovnici stochastick´ eho oscil´ atoru MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] 9


c ROBUST 2016

Uvaˇzujme n´ asleduj´ıc´ı vlnovou rovnici ∂u 1 ∂2u ˙ ξ), (t, ξ) = b∆u(t, ξ) − 2a (t, ξ) + Q 2 B(t, ∂t2 ∂t u(0, ξ) = u1 (ξ), ξ ∈ D, ∂u (0, ξ) = u2 (ξ), ξ ∈ D, ∂t u(t, ξ) = 0, (t, ξ) ∈ R+ × ∂D,

(t, ξ) ∈ R+ × D,

1

kde D ⊂ Rd je otevˇren´ a omezená mnoˇzina s hladkou hranic´ı, a > 0 a b > 0 jsou nezn´ amé parametry, Q 2 ˙ ξ) je formáln´ı ˇcasová derivace Brownova pohybu z´ je pozitivn´ı nukle´ arn´ı oper´ ator v L2 (D) a B(t, avislého na prostorové promˇenné. ∗ Na z´ akladˇe pozorován´ı trajektorie procesu X T = {Xt = (u(t, ·), ∂u r´ıd´ıme silnˇe konzis∂t (t, ·)) , 0 ≤ t ≤ T } poˇ tentn´ı odhady parametr˚ u a a b.

Daniela Jaruˇ skov´ a Nesimult´ ann´ı zmˇ eny ve sloˇ zk´ ach n´ ahodn´ eho vektoru ˇ FSv CVUT, KM, Th´ akurova 7 , 166 29 Praha 6 [email protected] V ˇcasov´ ych okamˇzic´ıch i = 1, . . . , n pozorujeme posloupnost nezávisl´ ych dvojrozmˇern´ ych vektor˚ u { X1 (i), X2 (i) } takov´ ych, ˇze korelaˇcn´ı koeficient corr X1 (i), X2 (i) = ρ je znám. Uvaˇzujeme dva statistické problémy. Za prvé je tˇreba rozhodnout, zda doˇslo ke zmˇenˇe ve stˇredn´ı hodnotˇe bud’ {X1 (i)} nebo {X2 (i)}, pˇr´ıpadnˇe obou posloupnost´ı, pˇriˇcemˇz vˇsak pˇredpokládáme, ˇze ke zmˇenˇe nemuselo nutnˇe doj´ıt ve stejn´ y ˇcasov´ y okamˇzik. Pokud dojdeme k z´ avˇeru, ˇze ke zmˇenˇe doˇslo, chceme ˇcasové okamˇziky, v kter´ ych ke zmˇenˇe doˇslo, odhadnout a naj´ıt jejich pˇribliˇzné (asymptotické) rozdˇelen´ı. ˇ ek Jirs´ Cenˇ ak Hled´ an´ı optim´ aln´ıho ˇ r´ızen´ı syst´ emu o dvou komponent´ ach pomoc´ı metody simulovan´ eho ˇ z´ıh´ an´ı FP TUL, KAP, Univerzitn´ı n´ amˇest´ı 1410/1, 461 17 Liberec [email protected] Pˇr´ıspˇevek se zab´ yvá optim´ aln´ım ˇr´ızen´ım dvojice spojitˇe zastarávaj´ıc´ıch komponent. Konkrétnˇe pouˇzit´ım algoritmu simulovaného ˇz´ıhán´ı na optimalizaci ˇr´ızen´ı systému. Obˇe komponenty maj´ı spoleˇcnˇe za u ´ kol dodat poˇzadovan´ y konstantn´ı v´ ykon. Komponenty zastarávaj´ı podle toho, jak jsou pouˇz´ıv´ any. Ve chv´ıli, kdy jsou obˇe komponenty natolik opotˇrebené, ˇze nezvl´ adnou dodat poˇzadovan´ y v´ ykon, jedna z nich (pˇr´ıpadnˇe obˇe) se vymˇen´ı za novou. Optimáln´ı je v tomto pˇr´ıpadˇe takové ˇr´ızen´ı systému, které na dlouhodobém horizontu minimalizuje poˇcet v´ ymˇen komponent za jednotku ˇcasu. Motivace poch´ az´ı z pr˚ umyslové aplikace optimalizace u ´drˇzby. Konkrétnˇe jde o skupinu komponent dod´ avaj´ıc´ı spoleˇcn´ y v´ ykon, jako jsou napˇr´ıklad ml´ yny na uhl´ı v tepelné elektr´ arnˇe, pˇr´ıpadnˇe filtry v u ´ pravnˇe pitné vody. Uvaˇzovan´ y model je zat´ım jednoduch´ y a slouˇz´ı jako z´ aklad k dalˇs´ımu zkoum´ an´ı problematiky.

Tom´ aˇ s Jurczyk Robustifikace statistick´ ych a ekonometrick´ ych metod regrese MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] Dva z problém˚ u, které se mohou vyskytnout bˇehem regresn´ı anal´ yzy, jsou multikolinearita regresor˚ u a pˇr´ıtomnost odlehl´ ych pozorován´ı. Tento pˇr´ıspˇevek se snaˇz´ı vyˇsetˇrit a vysvˇetlit chován´ı regresn´ıch metod v situac´ıch, kdy se v datech vyskytuj´ı oba tyto problémy z´ aroveˇ n. Ukazuje se, ˇze klasické robustn´ı metody mohou m´ıt v tˇechto pˇr´ıpadech problémy. Z tohoto d˚ uvovu byla navrˇzena nová metoda, kter´ a se tyto problémy snaˇz´ı ˇreˇsit. Budou odvozeny jej´ı vlastnosti, pop´ıˇseme jej´ı chovan´ı a vyuˇzit´ı jako diagnostického n´ astroje.

10


c ROBUST 2016

Tom´ aˇ s Jurczyk Co se vyˇ zaduje od modern´ıch statistick´ ych program˚ u Dell Computers, V Parku 2325/16, 148 00, Praha 4 [email protected] V této pˇredn´ aˇsce si pov´ıme o tom, ˇze ide´ aln´ı software pro anal´ yzu dat jiˇz d´ avno nen´ı jen o nutnosti m´ıt implementovány rozliˇcné analytické metody. Uk´ aˇzeme si pˇr´ımo na ukázce v softwaru, které vlastnosti by mˇel modern´ı software m´ıt, aby usnadnil a urychlil práci kolektivu pracovn´ık˚ u, kteˇr´ı potˇrebuj´ı s daty a modely pracovat, nebo tˇech, kteˇr´ı se na z´ akladˇe dat potˇrebuj´ı rychle rozhodovat. S t´ım souvis´ı také potˇreby velk´ ych instituc´ı (jako jsou napˇr´ıklad banky). Na z´ avˇer nakousneme, jak´ ym smˇerem se platformy pro analyzován´ı dat vyv´ıjej´ı a na co je aktuálnˇe kladen d˚ uraz ve v´ yvoji (IoT, In-database analytics, Collective intelligence, Edge analytics,. . . ).

Karel Kadlec Ergodic Control for L´ evy-driven linear stochastic equations in Hilbert spaces MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] In this contribution, controlled linear stochastic evolution equations driven by cylindrical Lévy processes are studied in the Hilbert space setting. The control operator may be unbounded which makes the results obtained in the abstract setting applicable to parabolic SPDEs with boundary or point control. The first part contains some preliminary technical results, notably a version of Itˆ o formula which is applicable to weak/mild solutions of controlled equations. In the second part, the ergodic control problem is solved: The feedback form of the optimal control and the formula for the optimal cost are found. As examples, various parabolic type controlled SPDEs are studied.

Silvie Kafkov´ a Credibility premium in motor insurance Comenius University, Mlynska dolina, 842 48 Bratislava, Slovakia [email protected] In 2005 a price war among insurance companies started in the Czech Republic. The number of contracts of motor insurance increased but the premium was reduced. Consequently, the motor insurance became unprofitable. In this paper, the problem of poor using of rating system in the vehicle insurance is solved. Mathematical approaches are used for it, namely Bayesian correction according to the credibility theory. A priori insurance premium depends on annual expected claim frequency, which is modelled by Poisson regression from observable risk factors. However, the existence of unobservable risk factors results in risk level heterogeneity within tariff groups. To remove heterogeneity we propose individual insurance premium calculation by Bayesian techniques of premium corrections. Then the fairer premium for drivers will be obtained and loss of this product will be eliminated.

Ivan Kasanick´ y Bayesova veta a asimil´ acia d´ at ´ ˇ UI AV CR, Pod Vod´ arenskou vˇeˇz´ı 2, 182 07 Praha 8 [email protected] Z´ akladn´ ym predpokladom zmysluplného pouˇzitia Bayesovej vety pre asimiláciu d´ at je splnenie podmienky Z 1

exp − x − y, R−1 (x − y) dµ (x) > 0 2 H

(2)

kde H je separabiln´ y Hilbertov priestor, µ je Gaussova miera na tomto priestore, R je l’ubovol’n´ y kovarianˇcn´ y operátor a y ∈ H. Splnenie tejto podmienky je oˇcividné v pr´ıpade, ˇze dimenzia stavového priestoru H je koneˇcná. V opaˇcnom pr´ıpade, ked’ dim (H) = ∞, nie je splnenie podmienky (2) vôbec jasné a ukáˇzeme si pr´ıklady, ked’ je vyˇsˇsie uveden´ y integrál rovn´ y nule. Navyˇse si uk´ aˇzeme, ˇze ak je operátor R kovarianciou nejakej meratel’nej n´ ahodnej veliˇciny definovanej na H, tak podmienka (2) nie je splnen´ a pre skoro vˇsetky y ∈ H. Na druhej strane si uk´ aˇzeme, ˇze ak prisput´ıme aby data boli iba slabá n´ ahodn´ a veliˇcina, tak podmienka (2) je splnen´ a pre vel’k´ u triedu kovarianˇcn´ ych operátorov R. 11


c ROBUST 2016

Nikola Kaspˇ r´ıkov´ a Nˇ ekter´ e modern´ı pˇ r´ıstupy k z´ısk´ av´ an´ı dat ˇ VSE v Praze, Katedra matematiky, n´ am. W. Churchilla 1938/4, 130 67 Praha 3 [email protected] D´ıky rozvoji webov´ ych sluˇzeb a dalˇs´ıch datov´ ych technologi´ı se podstatnˇe rozˇsiˇruj´ı moˇznosti anal´ yz. To klade n´ aroky na nˇekteré sloˇzky procesu anal´ yzy dat – vedle vlastn´ıho statistického modelován´ı je d˚ uleˇzité taky zvládnut´ı ˇcinnost´ı, jako jsou vyhled´ an´ı dat, z´ısk´ an´ı a pˇr´ıprava dat, vizualizace a (v souˇcasnosti uˇz skoro nezbytnˇe interaktivn´ı) prezentace v´ ysledk˚ u. Nˇekteré novˇejˇs´ı datové technologie, které se v posledn´ı dobˇe v praxi prosazuj´ı, krátce pˇredstav´ım a v duchu popul´ arn´ı Data Science se pokus´ıme jemnˇe nahlédnout do nedávné historie Robust˚ u.

Stanislav Katina, Iveta Selingerov´ a, Andrea Kraus, Ivana Horov´ a, Jiˇ r´ı Zelinka Anal´ yza selh´ an´ı ortopedick´ ych implant´ at˚ u s vyuˇ zit´ım anal´ yzy pˇ reˇ zit´ı a j´ adrov´ eho vyhlazov´ an´ı ´ PˇrF MU, UMS, Kotl´ aˇrsk´ a 2, 611 37 Brno [email protected] C´ılem naˇseho pˇr´ıspˇevku je pˇredstavit anal´ yzu datového souboru 46 859 operac´ı kyˇceln´ıho kloubu z´ıskaného ze Slovenského artroplastického registru (SAR). Tyto operace byly realizovány ve vˇsech 40 ortopedick´ ych a traumatologick´ ych klinikách ve Slovenské republice. Zaj´ımali jsme se pˇredevˇs´ım o dobu do prvn´ıho selhán´ı jednotliv´ ych implant´ at˚ u a faktory, které by tuto dobu mohly ovlivnit. Soubor obsahoval u ´daje od 1. ledna 2003 do 31. prosince 2014, maxim´ aln´ı doba sledován´ı pak byla 12 let. Z celkového poˇctu operac´ı doˇslo ve 1005 pˇr´ıpadech k selhán´ı implant´ atu a n´ asledné revizi. Vzhledem k pˇr´ıtomnosti cenzorovan´ ych dat jsme vyuˇzili metody anal´ yzy pˇreˇzit´ı, zejména pak rizikovou funkci, kter´ a vyjadˇruje okamˇzitou pravdˇepodobnost selhán´ı implant´ atu. Pˇri modelován´ı rizikové funkce jsme aplikovali metody j´ adrového vyhlazovan´ı. Kromˇe klasické rizikové funkce jsme se zamˇeˇrili také na podm´ınˇenou rizikovou funkci, kde sledovanou kovariátou byl vˇek. Data jsem stratifikovali podle diagnózy, typu fixace a pohlav´ı.

Jan Kislinger Vyuˇ zit´ı ˇ r´ızen´ ych markovsk´ ych ˇ retˇ ezc˚ u pˇ ri optimalizaci cen j´ızdn´ eho ve vlaku MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] Jedn´ a se o modifikaci známé u ´lohy Newsboy problem. V tomto pˇr´ıpadˇe je vˇsak mnoˇzstv´ı z´ asob (poˇcet sedadel ve vlaku) pevnˇe dané a rozhodovac´ı promˇennou jsou ceny j´ızdenek na jednotliv´ ych trasách. Jedn´ a se tedy o problém s endogenn´ı n´ ahodnost´ı, jelikoˇz popt´ avka po j´ızdenkách je ovlivnˇena jejich cenou. Dalˇs´ı vlastnost´ı tohoto modelu je fakt, ˇze existuje konkurence na stranˇe poptávky i v pˇr´ıpadˇe, ˇze cestuj´ıc´ı chtˇej´ı koupit j´ızdenky na jiné trasy. Skuteˇcná kapacita sedadel pro jednotlivé trasy je tedy n´ ahodn´ a a z´ avis´ı na poptávkách po j´ızdenkách na jiné trasy. Pˇredpokládáme, ˇze aktuáln´ı obsazenost vlaku (mnoˇzstv´ı prodan´ ych j´ızdenek) se ˇr´ıd´ı nehomogenn´ım marˇ ızen´ı markovského ˇretˇezce tak prob´ıhá skrze kovsk´ ym ˇretˇezcem. Intenzity pˇrechodu tak z´ avis´ı na zvolené cenˇe. R´ volbu ceny j´ızdného.

Jan Klaschka Za exaktn´ı testy a konfidenˇ cn´ı intervaly pro parametr binomick´ eho rozdˇ elen´ı logiˇ ctˇ ejˇ s´ı! ´ ˇ UI AV CR, Pod Vod´ arenskou vˇeˇz´ı 2, 182 07 Praha 8 [email protected] Od 50. let 20. stolet´ı byla navrˇzena ˇrada ménˇe konzervativn´ıch exaktn´ıch alternativ ke klasickému ClopperPearsonovu konfidenˇcn´ımu intervalu pro parametr binomického rozdˇelen´ı (interval Sterneho, Blyth-Still-Casell˚ uv, Blaker˚ uv, . . . ) a odpov´ıdaj´ıc´ıch test˚ u. Tyto alternativn´ı metody ovˇsem maj´ı mnohdy r˚ uzné neˇza´douc´ı vlastnosti a vyˇzaduj´ı u ´pravy, které by je uvedly do souladu se zdrav´ ym rozumem“. Pˇredn´ aˇska bude pojednávat o pˇeti ” typech nelogického chován´ı: (i) Nesouvislé konfidenˇcn´ı mnoˇziny. (ii) Konfidenˇcn´ı meze nemonotónn´ı vzhledem k hladinˇe spolehlivosti (non-nestedness). (iii) Rozpor mezi testem a konfidenˇcn´ım intervalem pˇri chybné volbˇe jejich typ˚ u. (iv) Rozpory, mezi testem a konfidenˇcn´ım intervalem zdánlivˇe (ale pouze zdánlivˇe) nevyhnutelné i pˇri spr´ avné volbˇe jejich typ˚ u. (v) Rozpory mezi inferencemi pˇri r˚ uznˇe velkém poˇctu pokus˚ u. Moˇznosti, jak tˇemto nelogiˇcnostem ˇcelit, proberu z metodologického i v´ ypoˇcetn´ıho hlediska. Mimo jiné struˇcnˇe shrnu pˇr´ıspˇevky z ROBUST˚ u 2010, 2012 a 2014 a budu referovat o novˇejˇs´ıch v´ ysledc´ıch spolupráce s kolegy Jen˝ o Reiczigelem (HU) a M˚ ansem Thulinem (SE). 12


c ROBUST 2016

Lev B. Klebanov Big outliers versus heavy tails: What to use? MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] The notions of outliers and tails are often used in different senses. Our aim in the talk is to analyze possible strong mathematical definitions of both that notions, study their connection between each other, and consider their possible use in applications.

Jana Klicnarov´ a Principy invariance pro n´ ahodn´ a pole ˇ Studentská 13, 370 05 Cesk´ ˇ e Budˇejovice EF JCU, klicnarov´ [email protected] V tomto pˇr´ıspˇevku se budeme vˇenovat centráln´ım limitn´ım vˇetám a princip˚ um invariance pro slabˇe z´ avislá n´ ahodn´ a pole. Nejprve si pˇripomene problematiku limitn´ıch vˇet pro n´ ahodn´ a pole vyuˇz´ıvaj´ıc´ıch aproximac´ı (pomoc´ı martingal˚ u ˇci m-závisl´ ych n´ ahodn´ ych pol´ı). Poté pˇredstav´ıme a porovnáme nˇekteré z´ akladn´ı v´ ysledky, kter´ ych bylo v této oblasti dosaˇzeno.

Kateˇ rina Koneˇ cn´ a, Ivana Horov´ a Metoda maxim´ aln´ı vˇ erohodnosti pro volbu vyhlazovac´ıch parametr˚ u j´ adrov´ ych odhad˚ u podm´ınˇ en´ e hustoty ´ PˇrF MU, UMS, Kotl´ aˇrsk´ a 2, 611 37 Brno [email protected]; [email protected] Technika jádrového vyhlazován´ı patˇr´ı mezi neparametrické metody a je vhodn´ ym n´ astrojem pro odhad podm´ınˇené hustoty. Jádrové odhady z´ avis´ı na volbˇe j´ adrové funkce, kter´ a hraje roli vah, a na ˇs´ıˇrce vyhlazovac´ıch parametr˚ u. Právˇe vyhlazovac´ı parametry maj´ı nejvˇetˇs´ı vliv na kvalitu v´ ysledného odhadu. Pˇri ˇspatné volbˇe ˇs´ıˇrky vyhlazovac´ıch parametr˚ u m˚ uˇze doj´ıt k pˇr´ıliˇsnému podhlazen´ı nebo naopak pˇrehlazen´ı odhadu. V tomto pˇr´ıspˇevku se budeme zab´ yvat metodami pro odhad ˇs´ıˇrky vyhlazovac´ıch parametr˚ u. Navrhovaná metoda maxim´ aln´ı vˇerohodnosti bude porovn´ ana s dobˇre známou metodou kˇr´ıˇzového ovˇeˇrován´ı pomoc´ı simulaˇcn´ı studie. Pouˇzit´ı obou metod bude rovnˇeˇz doplnˇeno o aplikaci na reálném datovém souboru.

Literatura [1] Bashtannyk, D. M., Hyndmann, R. J. (2001). Bandwidth Selection for Kernel Conditional Density Estimation. Computational Statistics & Data Analysis 36(3), 279–298 [2] Fan, J., Yim, T. H. (2004). A crossvalidation Method for Estimating Conditional Densities. Biometrika 91(4), 819–834 ˇ (grant GA15-06991S). Podˇekov´ an´ı: Tento pˇr´ıspˇevek byl podpoˇren Grantovou agenturou CR

Kateˇ rina Koˇ nasov´ a Varianty K-funkce pro stacion´ arn´ı bodov´ e procesy MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] K-funkce pˇredstavuje cenn´ y n´ astroj pro posuzováv´ı regularity nebo naopak tendence k vytváˇren´ı shluk˚ u u bodov´ ych proces˚ u, slouˇz´ıc´ıch k modelován´ı bodov´ ych vzor˚ u v rovinˇe nebo prostoru. Varianty této popisné charakteristiky vyuˇz´ıv´ ame pˇri smˇerové anal´ yze bodov´ ych proces˚ u. Na reáln´ ych i simulovan´ ych datech je zde ilustrováno pouˇzit´ı tzv. smˇerové K-funkce pˇri detekci dominantn´ıho smˇeru v bodov´ ych vzorech.

Miloˇ s Kopa, Jitka Dupaˇ cov´ a Robustness in stochastic programs with decision dependent randomness MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] 13


c ROBUST 2016

Results of stochastic optimization problems are often influenced by the model misspecification and simplifications, or by errors due to approximations, estimations, and incomplete information. The obtained optimal solutions, recommendations for a decision maker, should be then carefully analyzed. We shall deal with output analysis, robustness, and stress testing with respect to uncertainty or perturbations of input data for risk constrained portfolio optimization problems via the contamination technique and the worst-case analysis. We focus on problems with decision dependent random returns. Applying the contamination techniques we present lower and upper bonds for optimal value function for several different decision dependent randomness problems. Veronika Kopˇ cov´ a Testing in the growth curve model ˇ arik, Koˇsice, Slovakia University of Pavol Jozef Saf´ [email protected] In this work we consider the testing of intraclass structure of the covariance matrix in the growth curve model. This model is of the form Y = XBZ + ε, var(vec(ε)) = Σ ⊗ I, E(ε) = 0 where Y is matrix of observations. We solve the problem of testing hypothesis H0 : Σ = σ1 I + σ2 11’, B = 0 against H1 : Σ > 0, B 6= 0 using likelihood ratio test procedure.

Literature [1] Khatri, C. G. (1973). Testing some covariance structure under s growth curve model. Journal of multivariate analysis, Vol. 3, 102–116. [2] Kollo, T. and D. von Rosen (2005). Advanced multivariate statistics with matrices. Springer Netherlands, ISBN: 978-1-4020-3418-3 ˇ Acknowledgement The support of the grant VEGA MSSR 1/0344/14 and VVGS-PF-2016-72616 is kindly announced. Michaela Koˇ sˇ cov´ a, J´ an Maˇ cutek, Gejza Wimmer Parametrizovan´ e parci´ alne sum´ acie ˇ MK, JM: FMFI UK, KAMS, Mlynsk´ a dolina, 842 48 Bratislava ´ SAV, Stef´ ˇ anikova 49, 814 73 Bratislava GW: MU [email protected] Uvaˇzujme parci´ alnu sumáciu Px (a) =

∞ X

g(j)Pj∗ (a),

x = 0, 1, 2, . . . ,

(3)

j=x

kde {Pj∗ (a)}∞ etne rozdelenie pravdepodobnosti, ktoré naz´ yvame rodiˇc a {Pj (a)}∞ etne rozdej=0 je diskr´ j=0 je diskr´ ’ lenie pravdepodobnosti, d alej naz´ yvané potomok (pozri [1, 2]), obe definované na nezáporn´ ych cel´ ych ˇc´ıslach, a je parameter. Obmedz´ıme sa len na jednoparametrické diskrétne rozdelenia pravdepodobnosti. V [1] je uveden´ a nutná a postaˇcuj´ uca podmienka pre invarianciu vzhl’adom na parci´ alnu sumáciu (3), g(j) = 1 −

Pj∗ (a) ∗ (a) . Pj+1

(4)

T´ ato podmienka je splnen´ a práve vtedy, ked’ sa rodiˇc aplikáciou parci´ alnej sumácie (3) nezmen´ı, teda Px∗ = Px , x = 0, 1, 2, ... . Pre zdôraznenie u ´lohy parametra môˇzeme p´ısat’ g(x) = g(x, a). Teraz uvaˇzujme modifikáciu parci´ alnej sumácie (3) Px = c

∞ X

g(j, λ)Pj∗ (a),

x = 0, 1, 2, . . . ,

(5)

j=x

kde je zachovan´ y vzt’ah (4), avˇsak hodnota parametra a je nahradená inou hodnotou λ, c je vhodn´ a konˇstanta, ∞ taká, aby {Pj }j=0 bolo rozdelenie pravdepodobnosti (teda aby s´ uˇcet jednotliv´ ych pravdepodobnost´ı bol 1). ’ avis´ı od dvoch parametrov, λ a a, pre a 6= λ, alebo druh´ Rozdelenie {Pj }∞ y parameter λ je eliminovan´ y j=0 bud z´ ’ vd aka normovacej konˇstante c. Podl’a toho, ktor´ a z t´ ychto dvoch moˇznost´ı nastáva, je moˇzné kategorizovat’ vˇsetky jednoparametrické diskrétne rozdelenia pravdepodobnosti. Napr´ıklad, aplikáciou parci´ alnej sumácie (5) na Poissonovo rozdelenie (rodiˇc) vzniká potomok - nové rozdelenie s dvoma parametrami, takˇze Poissonovo rozdelenie zarad’ujeme medzi rozdelenia citlivé na zmenu parametra parci´ alnej sumácie. Naopak, napr´ıklad geometrické rozdelenie patr´ı medzi rozdelenia rezistentné voˇci zmene parametra parci´ alnej sumácie, teda medzi rozdelenia, ktoré po aplikácii parci´ alnej sumácie (5) zostávaj´ u nezmenené. 14


c ROBUST 2016

Literat´ ura [1] Maˇcutek, J. (2003). On two types of partial summation. Tatra Mountains Mathematical Publications, 26, 403–410. [2] Wimmer, G., Maˇcutek, J.(2012). New integrated view at partial-sums distributions. Tatra Mountains Mathematical Publications, 51, 183–190. Pod’akovanie: Podporené grantom VEGA 2/0047/15 (M. Koˇsˇcová, J. Maˇcutek, G. Wimmer) a grantom UK/138/ 2016 (M. Koˇsˇcová).

Daniela Kuruczov´ a, Jan Kol´ aˇ cek Neparametrick´ a funkcion´ alna regresia ´ PˇrF MU, UMS, Kotl´ aˇrsk´ a 2, 611 37 Brno [email protected] Tento pr´ıspevok predstavuje neparametrick´ u jadrov´ u regresiu pre funkcionálne d´ ata ako rozˇs´ırenie klasickej jadrovej regresie.S´ ustred´ıme sa hlavne na problematiku vol’by vyhladzovacieho parametra a testovanie metódy na re´ alnych d´ atach. ˇ GA15-06991S. Podˇekov´ an´ı: Tato práce byla podpoˇrena grantem GACR

Petr Lachout Diferencovatelnost re´ aln´ ych funkc´ı MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] Z´ akladn´ı u ´lohu v teorii optimalizace hraje diferencovatelnost reáln´ ych funkc´ı a jej´ı r˚ uzná zobecnˇen´ı; viz [1], [2], [3]. Pˇr´ıspˇevek zavede a pˇredstav´ı pojem diferencovatelnosti a druhé diferencovatelnosti funkce v´ıce promˇenn´ ych z pohledu teorie optimalizace. Dále je pokusem o upˇresnˇen´ı a jednotné zaveden´ı znaˇcen´ı.

Literatura [1] Bazara, M.S.; Sherali, H.D.; Shetty, C.M.: Nonlinear Programming. Theory and Algorithms. 2nd edition, Wiley, New York, 1993. [2] Rockafellar, T.: Convex Analysis., Springer-Verlag, Berlin, 1975. [3] Rockafellar, T.; Wets, R. J.-B.: Variational Analysis. Springer-Verlag, Berlin, 1998.

Mat´ uˇ s Maciak Testing shape restrictions in LASSO regression MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] The LASSO regularized regression approaches are suitable in situations where one needs to estimate the unknown model itself and, at the same time, choose relevant covariates from a much larger set of hypothetical regressors. We propose an effective estimation algorithm based on the L1 -norm regularization which is motivated by some machine learning ideas and techniques. Moreover, using some small modifications we are also able to incorporate various shape restrictions and change-points into the final model and taking and advantage of some recent postselection results we are also able to verify whether the imposed shape constraints (change-points respectively) are statistically relevant for the model or not. We propose a statistical test which can be used to derive a proper decision. We also investigate some finite sample properties via a simulation study and a real data example.

Mojm´ır Majdiˇ s Line´ arna kombin´ acia nez´ avisl´ ych n´ ahodn´ ych premenn´ ych s lognorm´ alnym rozdelen´ım ´ UM SAV, D´ ubravsk´ a cesta 9, 841 04 Bratislava [email protected] Lognorm´ alne rozdelenie a lineárna kombin´ acia takto rozdelen´ ych nezávisl´ ych n´ ahodn´ ych premenn´ ych maj´ u ˇsiroké vyuˇzitie v technike, pr´ırodn´ ych vedách alebo ekonómii. Napriek tomu stále ch´ ybaj´ u pouˇzitel’né bal´ıˇcky 15


c ROBUST 2016

v ˇstatistickom softvér (napr´ıklad R), ktoré dok´ aˇzu vypoˇc´ıtat’ kvantilov´ u funkciu (QF), hustotu (PDF) alebo distribuˇcn´ u funkciu rozdelenia (CDF) s vysokou presnost’ou. Uv´ adzame numerické v´ ypoˇcty t´ ychto funkci´ı s pouˇzit´ım numerického invertovania charakteristickej funkcie (CF). Najprv sa mus´ıme vysporiadat’ s problémami, ktoré vznikaj´ u pri samotnom v´ ypoˇcte hodnôt charakteristickej funkcie v numerick´ ych softvéroch - vel’a ˇstandardne uvádzan´ ych foriem CF je vo forme nekoneˇcného radu ktor´ y v t´ ychto softvéroch nekonverguje, pr´ıpadne konverguje pr´ıliˇs pomaly. Potom invertujeme charakteristick´ u funkciu na PDF (alebo CDF, QF) pouˇzit´ım algoritmu r´ ychlej Fourierovej transformácie (FFT). Nakoniec interpolujeme z´ıskan´ u hustotu a distribuˇcn´ u funkciu na poˇzadované body - najˇcastejˇsie na poˇzadované body kvantilovej funkcie. N´ aˇs algoritmus taktieˇz testujeme na niekol’k´ ych pr´ıkladoch na ilustráciu vyuˇzit´ ych metód a taktiet’ porovnávame v´ ysledky z´ıskané z t´ ychto pr´ıkladov so známymi v´ ysledkami (ak také existuj´ u). Pod’akovanie: Táto práca bola podporená Agent´ urou na podporu v´ yskumu a v´ yvoja APVV-15-0295.

Patr´ıcia Martinkov´ a Flexibiln´ı odhady reliability hodnocen´ı v pˇ rij´ımac´ım ˇ r´ızen´ı s vyuˇ zit´ım sm´ıˇ sen´ ych line´ arn´ıch model˚ u ´ AV CR, ˇ Pod Vod´ UI arenskou vˇeˇz´ı 2, 182 07 Praha 8 [email protected] Reliabilita, tedy spolehlivost hodnocen´ı bˇehem pˇrij´ımac´ıho ˇr´ızen´ı má velk´ y vliv na to, do jaké m´ıry je toto hodnocen´ı schopné predikovat kvalitu budouc´ıho studenta ˇci zamˇestnance. Instituci se tedy m˚ uˇze vyplatit zamˇeˇrit svou snahu na to, aby byla hodnocen´ı dostateˇcnˇe spolehlivá, napˇr. aby hodnocen´ı dvou r˚ uzn´ ych hodnotitel˚ u byla co nejv´ıce konzistentn´ı. V pˇr´ıspˇevku si uk´ aˇzeme, jak lze konzistenci hodnotitel˚ u (tzv. inter-rater reliabilitu) odhadovat v komplexn´ıch designech a jak lze testovat hypotézy o tom, zda je inter-rater reliabilita ovlivnˇena napˇr. typem uchazeˇce nebo zkuˇsenost´ı hodnotitele. ˇ GJ15-15856Y. Podˇekov´ an´ı: V´ yzkum je podporován grantem GA CR

Tom´ aˇ s Mas´ ak Sparse principal component analysis MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] Principal component analysis (PCA) is a well-known dimensionality reduction technique which, however, behaves poorly when the number of variables is comparable to, or larger than, the number of observations. Sparsity assumption is usually utilized in such setting, leading to sparse PCA, which is known to be NP-hard. In this contribution, we discuss a regression-based approach to sparse PCA and we present an iterative reweighted least squares (IRLS) algorithm for sparse PCA. An extensive simulation study is carried out to show that our IRLS algorithm has a superior performance over the original regression-based approach. Our method share many favorable properties with the regression-based approach and, moreover, it surpasses abilities of the regressionbased approach to correctly identify important variables, to explain variance in data and to produce estimates of principal components that are close to their population counterparts.

Stanislav Nagy H´lbka d´ at v konvexnej geometrii MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8; KU Leuven, Statistics Section, Celestijnenlaan 200b, 3001 Leuven, Belgium [email protected] Od poˇciatku 90. rokov sa polopriestorová h´lbka stala hojne diskutovan´ ym, ale tieˇz pomerne exotick´ ym a v rámci teórie izolovan´ ym, n´ astrojom neparametrickej anal´ yzy mnohorozmern´ ych d´ at. V prehl’adovom pr´ıspevku poodhal´ıme vzt’ahy medzi konceptom h´lbky d´ at pouˇz´ıvan´ ym v´ yluˇcne v ˇstatistike, a niektor´ ymi pojmami známymi v konvexnej a diferenci´ alnej geometrii. Uk´ aˇzeme, ˇze v obore konvexnej geometrie existuj´ u dˆ oleˇzité matematické v´ ysledky priamo aplikovatel’né na problémy vyvst´ avaj´ uce pri sk´ uman´ı teórie polopriestorovej h´lbky. S ich pomocou (ˇciastoˇcne) vyrieˇsime niektoré odol´ avaj´ uce problémy t´ ykaj´ uce sa h´lbky d´ at, a naznaˇc´ıme moˇznosti bud´ uceho v´ yskumu a nov´ ych aplikáci´ı tak pre h´lbku, ako aj pre afinne invariantn´ u geometriu.

16


c ROBUST 2016

Radim Navr´ atil Testy a odhady zaloˇ zen´ e na minimalizaci vzd´ alenosti ´ PˇrF MU, UMS, Kotl´ aˇrsk´ a 2, 611 37 Brno [email protected] Je známo, ˇze odhad metodou nejmenˇs´ıch ˇctverc˚ u v klasickém lineárn´ım regresn´ım modelu je velmi citliv´ y na poruˇsen´ı pˇredpoklad˚ u modelu, zejména normality chyb. Proto byla zavedena cel´ a ˇrada odhad˚ u, které tyto nedostatky dok´ azaly pˇrekonat. Velice zaj´ımavou tˇr´ıdu tˇechto odhad˚ u tvoˇr´ı tzv. R-odhady, které m´ısto p˚ uvodn´ıch pozorován´ı pracuj´ı pouze s jejich poˇrad´ımi. C´ılem toho pˇr´ıspˇevku bude tuto tˇr´ıdu rozˇs´ıˇrit o dalˇs´ı odhady zaloˇzené pouze na poˇrad´ıch na z´ akladˇe minimalizace jist´ ych vzd´ alenost´ı. Uk´ aˇzeme, ˇze v nˇekter´ ych situac´ıch maj´ı tyto odhady vˇetˇs´ı vydatnost neˇz klasické odhady. Zamˇeˇr´ıme se také na testován´ı hypotéz o regresn´ım parametru zaloˇzené na pˇredchoz´ıch odhadech.

Roman Nedela, Luk´ aˇ s Laff´ ers Sharp bounds on average treatment effects in the presence of sample selection bias and survey non-response using linear programming approach FPV UMB, KM, Tajovského 40, 974 01 Banská Bystrica [email protected];[email protected] This paper reformulates the problems of bounding average treatment effects under sample selection bias and survey non-response studied in [1] and [2] as linear programs. This allows researchers to conduct sensitivity analysis of identifying assumptions easily while the bounds remain sharp. We provide a mathematical formulation of the problems, replicate existing analytical results and extend them into sensitivity analysis.

Literature [1] Lee, David S. Training, wages, and sample selection: Estimating sharp bounds on treatment effects, The Review of Economic Studies 76.3 (2009): 1071-1102. [2] Behaghel, Luc, Crépon B., Gurgand M., Le Barbanchon T. Please Call Again: Correcting Nonresponse Bias in Treatment Effect Models, The Review of Economics and Statistics 97.5 (2015): 1070-1080.

Petr Nov´ ak Diagnostick´ e metody pro model zrychlen´ eho ˇ casu ˇ FIT CVUT, KAM, Th´ akurova 9, 160 00 Praha 6 [email protected] Regresn´ı model zrychleného ˇcasu umoˇzn ˇuje interpretovat z´ avislost doby pˇreˇzit´ı jedince na vysvˇetluj´ıc´ıch promˇenn´ ych za pˇr´ıtomnosti censorován´ı. V pˇr´ıspˇevku zkoum´ ame diagnostické metody pro tento model a rozˇsiˇrujeme moˇznosti testován´ı dobré shody modelu s daty. Vyuˇz´ıv´ ame jak postupy zaloˇzené na rezidu´ıch lineárn´ı regrese modifikovan´ ych pro censorovaná data, tak teorii ˇc´ıtac´ıch proces˚ u. Na pˇr´ıkladech zkoum´ ame vlastnosti popsan´ ych metod v r˚ uzn´ ych situac´ıch.

Zbynˇ ek Pawlas Testov´ an´ı nez´ avislosti v prostorov´ ych modelech s k´ otami MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] Prostorové bodové procesy pˇredstavuj´ı uˇziteˇcné modely pro anal´ yzu n´ ahodnˇe rozm´ıstˇen´ ych bod˚ u v prostoru. ˇ Tyto body odpov´ıdaj´ı polohám sledovan´ ych ud´ alost´ı. Casto máme k dispozici i dodateˇcnou informaci spojenou s kaˇzd´ ym bodem. Tu zahrnujeme do modelu v podobˇe tzv. kót a mluv´ıme o kótovan´ ych bodov´ ych procesech. Nejjednoduˇsˇs´ı situace nastáv´ a, kdyˇz jsou kóty nezávislé na polohách, pak m˚ uˇzeme obˇe sloˇzky modelovat zvláˇst’. D˚ uleˇzit´ ym u ´kolem je proto otestovat hypotézu nezávislosti poloh a kót na z´ akladˇe pozorovan´ ych dat. V pˇredn´ aˇsce pˇredstav´ıme nˇekteré vhodné postupy. Bodové procesy slouˇz´ı rovnˇeˇz jako z´ akladn´ı kámen pro budován´ı sloˇzitˇejˇs´ıch geometrick´ ych model˚ u jako jsou nˇekteré n´ ahodné uzavˇrené mnoˇziny. K mnoˇzinˇe pˇredstavuj´ıc´ı oblasti, ve kter´ ych se projevuje sledovaná ud´ alost, m˚ uˇze b´ yt také pˇridaná dodateˇcná informace v podobˇe kóty. Ta je v tomto pˇr´ıpadˇe n´ ahodnou funkc´ı na dané n´ ahodné mnoˇzinˇe. Opˇet n´ as m˚ uˇze zaj´ımat test nezávislosti tˇechto dvou n´ ahodn´ ych sloˇzek. 17


c ROBUST 2016

Michal Peˇ sta Mixed dynamic copulae for stochastic processes with application in insurance MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] The theoretical goal is to study mathematical properties of the mixed dynamic copulae, i.e., copulae having continuous as well as discrete margins and are time-varying. Moreover, we discuss their extensions for the conditional and hierarchical case. The practical aim is to apply the derived theory for loss reserving in non-life insurance. An insurance company puts sufficient provisions from the premium payments aside, so that it is able to settle all the claims (losses) that are caused by these insurance contracts. The main issue is how to determine or estimate these claims reserves, which should be held by the insurer so as to be able to meet all future claims arising from policies currently in force and policies written in the past.

Barbora Peˇ stov´ a Abrupt change in mean avoiding variance estimation and block bootstrap ´ AV CR, ˇ Pod Vod´ UI arenskou vˇeˇz´ı 2, 182 07 Praha 8 [email protected] We deal with sequences of weakly dependent observations that are naturally ordered in time. Their constant mean is possibly subject to change at most once at some unknown time point. The aim is to test whether such an unknown change has occurred or not. The change point methods presented here rely on ratio type statistics based on maxima of cumulative sums. These detection procedures for the abrupt change in mean are also robustified by considering a general score function. The main advantage of the proposed approach is that the variance of the observations neither has to be known nor estimated. The asymptotic distribution of the test statistic under the no change null hypothesis is derived and is free of any tuning parameters. Moreover, we prove the consistency of the test under the alternative. A block bootstrap method is developed in order to improve computational performance of the asymptotic methods. The validity of the bootstrap algorithm is shown. The results are illustrated through a simulation study.

Barbora Petrov´ a Multidimensional stochastic domin MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] Stochastic dominance is a form of stochastic ordering, which stems from decision theory when one gamble can be ranked as superior to another one for a broad class of decision makers whose utility functions, representing preferences, have very general form. There exists extensive theory concerning one dimensional stochastic dominance of different orders. However it is not obvious how to extend the concept to multiple dimension which is especially crucial when utilizing multidimensional non separable utility functions. One possible approach is to transform multidimensional random vector to one dimensional random variable and put equivalent stochastic dominance in multiple dimension to stochastic dominance of transformed vectors in one dimension. We suggest more general framework which does not require reduction of dimensions of random vectors in order to define stochastic dominance so as to be able to employ multidimensional non separable utility functions in the considerations. We seek for a generator of stochastic dominance of considered orders in terms of von Neumann – Morgenstern utility functions. Moreover, we develop necessary and sufficient conditions for one random vector to stochastically dominate another one, similarly as it is derived for one dimensional case. We focus on behavior of such defined conditions for a specific choices of utility functions or a specific choice of multivariate distribution of random vectors.

Jan Picek, Martin Schindler L-momenty s ruˇ sivou regres´ı FP TUL, KAP, Studentská 2, 461 17 Liberec 1 [email protected] L-moment je analogie obvyklého momentu a má podobnou interpretaci. Je definován jako lineárn´ı kombinace stˇredn´ıch hodnot poˇrádkov´ ych statistik. Hosking a Balakrishan (2015) ukázali, ˇze L-momenty jsou speci´ aln´ım 18


c ROBUST 2016

pˇr´ıpadem L-odhad˚ u. V pˇr´ıspˇevku navrhujeme zobecnˇen´ı L-moment˚ u v modelu lineárn´ı regrese zaloˇzené na regresn´ıch kvantilech jako speci´ aln´ı L-odhad. Vlastnosti rozˇs´ıˇren´ ych L-moment˚ u jsou ilustrovány na simulovan´ ych datech.

Ondˇ rej Pokora, Jan Kol´ aˇ cek Vyuˇ zit´ı regrese a anal´ yzy funkcion´ aln´ıch dat pro vyhodnocen´ı neurofyziologick´ ych z´ aznam˚ u ´ PˇrF MU, UMS, Kotl´ aˇrsk´ a 2, 611 37 Brno [email protected]; [email protected] Pˇr´ıspˇevek se zab´ yvá statistickou anal´ yzou neuronáln´ıch z´ aznam˚ u vyvolané sluchové aktivity u krys, kde je aktivita sluchov´ ych neuron˚ u sledována jako vyvolané potenci´ aly v závislosti na r˚ uzn´ ych zvuc´ıch, hlasitostech a podané látce. Data byla p˚ uvodnˇe zpracována s vyuˇzit´ım neline´ arn´ı regrese v z´ avislosti na hlasitosti zvuku, pˇriˇcemˇz odhadnuté parametry byly pro jednotlivé zvuky porovnány, [1]. V souˇcasnosti pro vyhodnocen´ı z´ aznam˚ u vyuˇz´ıv´ ame metody anal´ yzy funkcionáln´ıch dat, kdy jsou mˇeˇren´ı ch´ apána jako body na kˇrivkách. N´ astroji statistické anal´ yzy jsou zde jádrové vyhlazován´ı, funkcionáln´ı PCA, funkcionáln´ı regrese a klasifikace. V pˇr´ıspˇevku se zm´ın´ıme o obou pouˇzit´ ych pˇr´ıstupech a dosaˇzen´ ych v´ ysledc´ıch.

Literatura [1] Wan, I., Pokora, O., Chiu, T.W., Lansky, P. and Poon, P.W. (2015) Altered intensity coding in the salicylateoverdose animal model of tinnitus. BioSystems 136, 113–119. ˇ GA15-06991S. Podˇekov´ an´ı: Tato práce byla podpoˇrena grantem GACR

Zuzana Pr´ aˇ skov´ a Bootstrap pro z´ avisl´ a data a detekce zmˇ en MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] Je známo, ˇze pro z´ avisl´ a pozorován´ı nelze pˇr´ımo aplikovat klasick´ y bootstrap. V tomto pˇr´ıspˇevku budou uvedeny nˇekteré varianty metody bootstrap, které zohledˇ nuj´ı závislostn´ı strukturu dat. Pomoc´ı tˇechto metod potom budou aproximovány kritické hodnoty test˚ u pro detekci zmˇen v parametrech lineárn´ıch model˚ u, jejichˇz chybové ˇcleny nejsou nezávislé. Pˇrednosti a nedostatky jednotliv´ ych metod budou zkoum´ any numericky.

Julie Rendlov´ a Anal´ yza kategori´ aln´ıch dat – probl´ em v´ıcen´ asobn´ e volby v odpovˇ edi PˇrF UPOL, KMAAM, 17. listopadu 12, 771 46 Olomouc [email protected] Pˇr´ıspˇevek se zab´ yvá anal´ yzou kategori´ aln´ıch dat v pˇr´ıpadˇe moˇznosti v´ıcenásobné volby v odpovˇedi. Jeho c´ılem je seznámen´ı s potˇrebn´ ym teoretick´ ym z´ azem´ım a ukázka praktické aplikace zpracované v softwarovém prostˇred´ı statistického programu R, konkrétnˇe s vyuˇzit´ım bal´ıˇcku MRCV. Vysvˇetluj´ıc´ı i vysvˇetlované promˇenné se souhrnnˇe oznaˇcuj´ı zkratkou MRCV (multiple response categorical variables) a mohou nab´ yvat libovolnˇe mnoha kategori´ı naz´ yvan´ ych items, coˇz jsou binárn´ı promˇenné s hodnotami 0 a 1. Mezi items kaˇzdé MRCV pˇredpokládáme existenci vnitˇrn´ıch z´ avislost´ı. S daty pracujeme v podobˇe itemresponse tabulek, coˇz jsou kontingenˇcn´ı tabulky umoˇzn ˇuj´ıc´ı testován´ı simult´ ann´ı p´ arové margináln´ı nezávislosti. Teorie pro anal´ yzu uvedené problematiky vych´ az´ı z logaritmicko-lineárn´ıch model˚ u s pouˇzit´ım modifikované Pearsonovy statistiky a standardizovan´ ych rezidu´ı, Rao-Scottov´ ych korekc´ı a bootstrapov´ ych metod. V praktické ˇca´sti pˇr´ıspˇevku aplikujeme metody na typick´ y pˇr´ıklad studovaného typu dat, j´ımˇz jsou dotazn´ıky s moˇznost´ı v´ ybˇeru vˇsech relevantn´ıch odpovˇed´ı na zadanou otázku. Protoˇze pˇri práci s takov´ ymi dotazn´ıky neustále pˇrevl´ adá uˇz´ıv´ an´ı klasick´ ych logaritmicko-lineárn´ıch model˚ u, pokus´ıme se také vysvˇetlit, proˇc je tento pˇr´ıstup v daném pˇr´ıpadˇe nevhodn´ y.

Samuel Rosa, Radoslav Harman Optimal designs for dose-escalation studies ˇ Mlynsk´ FMFI UK, KAMS, a dolina 6284, 842 48 Bratislava 4 [email protected] 19


c ROBUST 2016

Consider an experiment, where a new drug is tested for the first time on human subjects. Such experiments are often performed as dose-escalation studies, where a set of increasing doses is pre-selected, individuals are grouped into cohorts and a dose is given to subjects in a cohort only if the preceding dose was already given to previous cohorts. If an adverse effect is observed, the experiment stops and thus no subjects are exposed to higher doses. We consider the model for dose-escalation studies formulated by [1]. Specifically, we assume that the response is affected both by the dose or placebo effects as well as by the cohort effects. We provide optimal approximate designs for selected optimality criteria (E-, M V - and LV -optimality) for estimating the effects of drug doses compared with placebo. In particular, we obtain the optimality of Senn designs and extended Senn designs with respect to multiple criteria.

Literature [1] Bailey, R. A. (2009): Designs for dose-escalation trials with quantitative responses, Statistics in Medicine 28, pp. 3721–3738 Acknowledgement: The research was supported by the UK/214/2016 grant of the Comenius University in Bratislava.

ˇarka Rus´ S´ a, Arnoˇ st Kom´ arek Bayesovsk´ a anal´ yza tˇ r´ı´ urovˇ nov´ eho modelu mediace s ordin´ aln´ı odezvou MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] Tato statistická anal´ yza zkoum´ a vliv person´ aln´ıho zajiˇstˇen´ı zdravotn´ıch sester (mˇeˇren jako pomˇer pacient˚ u na jednu sestru) a pracovn´ıho prostˇred´ı zdravotn´ıch sester na spokojenost pacient˚ u se zdravotn´ı péˇc´ı v nemocnic´ıch a moˇznou z´ avislost tohoto efektu na vzdˇelán´ı person´ alu. Anal´ yza dat z rozsáhlého evropského v´ yzkumu RN4CAST, jehoˇz v´ıce´ urovˇ novou strukturu jsme brali v u ´vahu, je zaloˇzena na bayesovském tˇr´ı´ urovˇ novém modelu mediace. Jako medi´ ator v tomto modelu figuruje m´ıra toho, kolik zdravotnické péˇce sestra nestihla vykonat. Pˇredpokládáme, ˇze ordin´ aln´ı odezva poch´ az´ı z nepozorovaného normáln´ıho rozdˇelen´ı s nezn´ am´ ymi mezemi pro jednotlivé hodnoty.

Iveta Selingerov´ a, Stanislav Katina, Ivana Horov´ a J´ adrov´ e odhady jako alternativa (semi)parametrick´ ych model˚ u v anal´ yze pˇ reˇ zit´ı ´ PˇrF MU, UMS, Kotl´ aˇrsk´ a 2, 611 37 Brno [email protected] Riziková funkce patˇr´ı k velmi uˇziteˇcn´ ym n´ astroj˚ um pˇri zpracován´ı dat v anal´ yze pˇreˇzit´ı. Vyjadˇruje okamˇzitou pravdˇepodobnost v´ yskytu ud´ alosti v n´ asleduj´ıc´ım ˇcasovém okamˇziku. V praxi toto riziko m˚ uˇze b´ yt ovlivnˇeno dalˇs´ımi charakteristikami, jako je pohlav´ı, vˇek, hladina n´ adorov´ ych marker˚ u apod. Pro modelován´ı této z´ avislosti se pouˇz´ıvaj´ı parametrické ˇci semiparametrické metody. Omezen´ım tˇechto metod je vˇsak poˇzadavek na splnˇen´ı urˇcit´ ych pˇredpoklad˚ u, jako je rozdˇelen´ı ˇcasu pˇreˇzit´ı, proporcionalita rizik ˇci exponenci´ aln´ı z´ avislost na kovariátˇe. V tomto ohledu jsou neparametrické metody v´ıce flexibiln´ı. Vzhledem k vlastnostem rizikové funkce jsou pro jej´ı odhad nejvhodnˇejˇs´ı vyhlazovac´ı techniky, mezi nˇeˇz patˇr´ı jádrové odhady. C´ılem pˇr´ıspˇevku je pˇredstavit r˚ uzné typy jádrov´ ych odhad˚ u rizikové funkce a zhodnotit v´ yhody a nev´ yhody jednotliv´ ych pˇr´ıstup˚ u za vyuˇzit´ı simulaˇcn´ı studie. V rámci studie jsme se zamˇeˇrili na r˚ uzné tvary rizikové funkce a na vliv zastoupen´ı cenzorovan´ ych pozorován´ı.

Ondˇ rej Sokol, Elena Kuchina Sloˇ zitost v´ ypoˇ ctu horn´ı meze rozptylu nad n´ ahodn´ ymi daty ˇ KE, N´ FIS VSE, am. W. Churchilla 4, 130 67 Praha 3 [email protected]; [email protected] Zab´ yváme se problematikou v´ ypoˇctu horn´ı meze v´ ybˇerového rozptylu v pˇr´ıpadˇe, kdy nejsou k dispozici pˇresná data, ale pouze intervaly, ve kter´ ych tato pˇresná data s jistotou leˇz´ı. Obecnˇe je nalezen´ı horn´ı meze v´ ybˇerového rozptylu ze znalosti pouze intervalov´ ych dat NP-obt´ıˇzná u ´ loha, ale pˇri splnˇen´ı urˇcit´ ych podm´ınek kladen´ ych na vstupn´ı data lze pouˇz´ıt nˇekter´ y z efektivn´ıch algoritm˚ u. V této práci je konkrétnˇe zkoum´ an Ferson˚ uv algoritmus pro v´ ypoˇcet horn´ı meze rozptylu intervalov´ ych dat z pohledu pr˚ umˇerné v´ ypoˇcetn´ı sloˇzitosti pˇri n´ ahodnˇe generovan´ ych datech z bˇeˇzn´ ych rozdˇelen´ı. Algoritmus pracuje obecnˇe v exponenci´ aln´ım ˇcase, kde exponenci´ aln´ı ˇca´st 20


c ROBUST 2016

sloˇzitosti z´ avis´ı na maxim´ aln´ım poˇctu z´ uˇzen´ ych interval˚ u, které maj´ı spoleˇcn´ y alespoˇ n jeden bod (z´ uˇzen´ ym intervalem je zde myˇslen interval, jehoˇz polomˇer je vydˇelen celkov´ ym poˇctem interval˚ u v mnoˇzinˇe dat). Na z´ akladˇe simulaˇcn´ıch experiment˚ u je zformulována hypotéza, ˇze za urˇcit´ ych podm´ınek stˇredn´ı hodnota maxim´ aln´ıho poˇctu pˇrekryt´ı z´ uˇzen´ ych interval˚ u roste logaritmicky s poˇctem interval˚ u. Sloˇzitost v´ ypoˇctu horn´ı meze rozptylu nad n´ ahodn´ ymi daty je pak tedy polynomiáln´ı. ˇ v Praze. Podˇekov´ an´ı: Pˇr´ıspˇevek vznikl s podporou projektu IGA F4/63/2016 Intern´ı grantové agentury VSE

G´ abor Sz˝ ucs Rekurentn´ e triedy diskr´ etnych rozdelen´ı pravdepodobnosti a odhadovanie ich parametrov ˇ FMFI UK, KAMS, Mlynsk´ a dolina 6284, 842 48 Bratislava 4 [email protected] Tento pr´ıspevok sa zaober´ a s rekurentn´ ymi triedami diskrétnych rozdelen´ı pravdepodobnosti. Zameriava sa predovˇsetk´ ym na takzvan´ u Rk -triedu rozdelen´ı a jej ˇspeci´ alne podtriedy, priˇcom uvádza aj ich z´ akladné vlastnosti. Hlavn´ ym ciel’om pr´ıspevku je predstavit’ moˇznosti odhadovania parametrov jednotliv´ ych rekurentn´ ych podtried rozdelen´ı pravdepodobnosti na z´ aklade d´ atového vektora. Ked’ˇze sa jedná o atypicky definované rozdelenia, odhadovanie parametrov rekurentn´ ych podtried je obvykle zaloˇzené na numerick´ ych metódach a napr´ıklad na numerickej minimaliz´ acii testovej ˇstatistiky Kolmogorovovho-Smirnovovho testu, Cramérovho-von Misesovho testu, pr´ıpadne inej funkcie odhadovan´ ych parametrov. V praktickej ˇcasti pr´ıspevku s´ u uvedené programové implement´ acie a porovnania spom´ınan´ ych metód odhadovania parametrov v rámci ˇstatistického softvéru R. Pod’akovanie: Táto práca bola podporená vedeck´ ym grantom VEGA 2/0047/15.

ˇ coviˇ Daniel Sevˇ c Riccati transformation method for solving Hamilton-Jacobi-Bellman equation FMFI UK, Mlynsk´ a dolina 6284, 842 48 Bratislava 4 Comenius University Bratislava [email protected] In this talk we present recent results on application of the Riccati transformation for solving the evolutionary Hamilton-Jacobi-Bellman equation arising from the stochastic dynamic optimal allocation problem. It turns out that the fully nonlinear Hamilton-Jacobi-Bellman equation governing evolution of the value function can be transformed into a quasi-linear parabolic equation. Its diffusion function is obtained as a value function of certain parametric convex optimization problem. We will show that point of discontinuity of this value function can be identified with transitions and changes of the optimal portfolio composition. We prove existence of classical solutions to the HJB equation. A numerical solution is then constructed by means of an implicit iterative finite volume numerical approximation scheme. As an application we present results of computing optimal strategies for a portfolio investment problem for German DAX stock index. This is a joint work with S. Kilianova.

ˇ Tereza Simkov´ a Multivariate L-moment homogeneity test for spatially correlated data PˇrF TUL, KAP, Studentská 1402/2, 461 17 Liberec 1 [email protected] Identification of homogeneous regions is a key task in regional frequency analysis to obtain adequate estimates of a given event. Recently Chebana and Ouarda (2007) have extended the univariate L-moment homogeneity test of Hosking and Wallis (1997) to the multivariate case. However, the proposed multivariate L-moment homogeneity test assumes intersite independence, although examples from practice demonstrate that intersite correlation may be expected for some kinds of data. Hence, the testing procedure of Chebana and Ouarda (2007) needs to be generalized: D-vine copulas are utilised to model intersite dependence when generating synthetic regions to overcome the problem of presence of cross-correlation between stations. Performed Monte Carlo simulations illustrates how intersite dependence impacts the multivariate L-moment homogeneity test by significant reducing the value of the heterogeneity measure. The results of simulations demonstrate the superiority of the proposed modification over the original procedure of Chebana and Ouarda (2007) since it improves the heterogeneity detection and avoids of misspecification of a studied region. 21


c ROBUST 2016

Literature [1] F. Chebana and T. B. M. J. Ouarda, ”Multivariate L-moment homogeneity test,”Water Resources Research, vol. 43, W08406, doi:10.1029/2006WR005639, 2007. [2] J. R. M. Hosking and J. R. Wallis, Regional Frequency Analysis: An Approach Based on L-Moments, Cambridge University Press, Cambridge, UK, 1997.

ˇ Zdenˇ ek Sulc Metodologie hodnocen´ı mˇ er podobnosti pro kategori´ aln´ı data na velk´ em mnoˇ zstv´ı datov´ ych soubor˚ u ˇ KE, N´ FIS VSE, am. W. Churchilla 4, 130 67 Praha 3 [email protected] Souˇca´st´ı vˇetˇsiny ˇcl´ ank˚ u zab´ yvaj´ıc´ıch se hodnocen´ım mˇer podobnosti b´ yvá hodnocen´ı jejich v´ ysledk˚ u na vybran´ ych reáln´ ych datov´ ych souborech, které obvykle poch´ azej´ı z dobˇre znám´ ych repositáˇr˚ u, a jsou tak srovnatelné s v´ ysledky jin´ ych v´ yzkumn´ık˚ u. Nˇekdy je ale potˇreba prozkoumat, ve kter´ ych konkrétn´ıch situac´ıch daná m´ıra podobnosti pod´ av´ a dobré v´ ysledky a kdy nikoliv. V takov´ ych pˇr´ıpadech je vhodné vyuˇz´ıt anal´ yzu zaloˇzenou na generovan´ ych souborech, kter´ a umoˇzn ˇuje tvorbu soubor˚ u s poˇzadovan´ ymi vlastnostmi. Vzhledem k tomu, ˇze je obvykle zapotˇreb´ı velkého mnoˇzstv´ı generovan´ ych soubor˚ u, vyvst´ av´ a zde otázka, jak zpracovat takové mnoˇzstv´ı soubor˚ u, aby bylo dosaˇzeno jednoduˇse interpretovateln´ ych v´ ysledk˚ u. Proto tento pˇr´ıspˇevek prezentuje metodologii hodnocen´ı mˇer podobnosti pro kategori´ aln´ı data, kter´ a umoˇzn ˇuje porovnán´ı kvality shlukován´ı zaloˇzené na intern´ıch hodnot´ıc´ıch kritéri´ıch na velkém mnoˇzstv´ı datov´ ych soubor˚ u. Tato metodologie m˚ uˇze b´ yt pouˇz´ıv´ ana bud’ samostatnˇe s pˇredem pˇripraven´ ymi datov´ ymi soubory, nebo spoleˇcnˇe s funkc´ı generuj´ıc´ı kategori´ aln´ı data. Oba typické zp˚ usoby pouˇzit´ı jsou v pˇr´ıspˇevku demonstrovány.

Ren´ ata Talsk´ a, Karel Hron, Jitka Machalov´ a, Eva Fiˇ serov´ a Kompoziˇ cn´ı regrese s funcion´ aln´ı z´ avisle promˇ ennou PˇrF UPOL, KMAAM, 17. listopadu 12, 771 46 Olomouc [email protected] Regresn´ı anal´ yza je hojnˇe pouˇz´ıvan´ y statistick´ y n´ astroj slouˇz´ıc´ı k modelován´ı vztahu mezi z´ avisle promˇennou a mnoˇzinou vysvˇetluj´ıc´ıch promˇenn´ ych (prediktor˚ u). Aplikace funkcionáln´ı regresn´ı anal´ yzy je nezbytn´ a v pˇr´ıpadˇe, kdy alespoˇ n jedna ze zm´ınˇen´ ych promˇenn´ ych má funkcionáln´ı charakter. Pˇrehled moˇzn´ ych pˇr´ıstup˚ u ke konstrukci regresn´ıch model˚ u s funkcionáln´ı z´ avisle promˇennou a skalárn´ımi prediktory byl pˇredstaven v [1]. Zaj´ımavou se vˇsak stáv´ a situace, kdy z´ avisle promˇenná je hustotou rozdˇelen´ı pravdˇepodobnost´ı, nebot’ prostor L2 (integrovateln´ ych funkc´ı s druhou mocninou), ve kterém je typicky funkcionáln´ı regrese provádˇena, nebere v u ´ vahu relativni charakter hustot. C´ılem tohoto pˇr´ıspˇevku je pˇredstavit funkcionáln´ı regresn´ı model s distribuˇcn´ı z´ avisle promˇennou s vyuˇzit´ım metodiky Bayesov´ ych prostor˚ u, tj. pˇr´ıstupu, kter´ y respektuje geometrické vlastnosti distribuˇcn´ıch dat [2, 3]. Speci´ alnˇe, protoˇze hustoty pˇredstavuj´ı funkcionáln´ı data nesouc´ı pouze relativn´ı informaci, podm´ınku jednotkového integrál lze vn´ımat jen jako jednu z ekvivalentn´ıch reprezentac´ı hustot (invariance na zmˇenu mˇeˇr´ıtka). Aby bylo moˇzné pouˇz´ıt metody funkcionáln´ı regrese, které byly navrˇzeny pro funkcionáln´ı data z prostoru L2 , zejména pak ty, které jsou zaloˇzené na B-splajnové reprezentaci, uchylujeme se k zobrazen´ı Bayesova prostoru do L2 prostˇrednictv´ım tzv. centrované log-pod´ılové (log-ratio) transformace. Prezentované teoretické poznatky bodou ilustrovány na re´ aln´ ych datech.

Literatura [1] J. Ramsay, B.W. Silverman (2005). Functional Data Analysis. Springer, Heidelberg. [2] K. Hron, A. Menafoglio, M. Templ, K. Hr˚ uzová, P. Filzmoser (2016). Simplicial principal component analysis for density functions in Bayes spaces. Computational Statistics and Data Analysis, 94, 330–350. [3] K. G. van den Boogaart, J.J. Egozcue, V. Pawlowsky-Glahn (2014). Bayes Hilbert spaces. Australian & New Zealand Journal of Statistics, 56(2), 171–194. Marie Turˇ ciˇ cov´ a Modelovan´ı kovariance v asimilaci dat odhadem prostorov´ e struktury gaussovsk´ eho markovsk´ eho n´ ahodn´ eho pole ´ AV CR, ˇ Pod Vod´ MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8; UI arenskou vˇeˇz´ı 271/2, 182 07 Praha 8 [email protected] 22


c ROBUST 2016

Chceme-li odhadnout kovarianˇcn´ı matici na z´ akladˇe n´ ahodného v´ ybˇeru, jehoˇz rozsah je velmi mal´ y v porovnán´ı s dimenz´ı jednotliv´ ych ˇclen˚ u, pak v´ ybˇerová kovarianˇcn´ı matice nen´ı dobr´ ym odhadem, nebot’ má velmi malou hodnost a m˚ uˇze obsahovat tzv. ruˇsivé korelace. Tento problém nastáv´ a napˇr´ıklad pˇri aplikaci filtraˇcn´ıch algoritm˚ u v pˇredpovˇedn´ıch modelech poˇcas´ı, kde je odhad kovarianˇcn´ı matice kl´ıˇcov´ ym prvkem kvalitn´ı pˇredpovˇedi, avˇsak rozd´ıl mezi dimenz´ı n´ ahodn´ ych vektor˚ u a rozsahem v´ ybˇeru je v ˇrádu tis´ıc˚ u. Vylepˇsen´ı odhadu kovarianˇcn´ı matice je moˇzné po zaveden´ı dodateˇcn´ ych pˇredpoklad˚ u, které vˇsak nesmˇej´ı b´ yt pro strukturu n´ ahodn´ ych vektor˚ u pˇr´ıliˇs omezuj´ıc´ı. V pˇr´ıspˇevku prezentujeme odhad kovarianˇcn´ı matice zaloˇzen´ y na identifikaci parametr˚ u prostorové struktury gaussovského markovského pole z n´ ahodného vzorku metodou maxim´ aln´ı vˇerohodnosti. Kovarianˇcn´ı matice se nevytv´ aˇr´ı pˇr´ımo, ale v´ ypoˇcty s kovarianc´ı tohoto pole mohou b´ yt realizovány ˇreˇsen´ım nehomogenn´ı stochastické dif´ uzn´ı rovnice metodou koneˇcn´ ych prvk˚ u. V´ ysledné procedury pro n´ asoben´ı matice a vektoru mohou b´ yt pouˇzity v asimilaci dat pˇr´ımo, nebo generován´ım vˇetˇs´ıho poˇctu nov´ ych n´ ahodn´ ych prvk˚ u s n´ asledn´ ym v´ ypoˇctem vylepˇsené v´ ybˇerové kovariance.

Krist´ yna Vaˇ nk´ atov´ a, Eva Fiˇ serov´ a Shlukov´ a anal´ yza ve smˇ es´ıch regresn´ıch model˚ u PˇrF UPOL, KMAAM, 17. listopadu 12, 771 46 Olomouc [email protected]; [email protected] Smˇesi lineárn´ıch regresn´ıch model˚ u jsou pokroˇcil´ ym n´ astrojem regresn´ı anal´ yzy, kter´ y je schopen pracovat s heterogenn´ımi daty a odhadovat regresn´ı parametry s vyuˇzit´ım podm´ınˇeného rozdˇelen´ı pravdˇepodobnosti vysvˇetlované promˇenné. Toto rozdˇelen´ı je d´ ano jako váˇzen´ y souˇcet pˇres vˇsechny komponenty obsaˇzené v dané smˇesi a obsahuje vˇsechny nezn´ amé parametry, které lze odhadnout pomoc´ı metody maxim´ aln´ı vˇerohodnosti. Vzhledem ke sloˇzitosti takového optimalizaˇcn´ıho problému byl vyvinut EM algoritmus umoˇznuj´ıc´ı v´ ypoˇcet maxim´ alnˇe vˇerohodn´ ych odhad˚ u z ne´ upln´ ych dat. Pˇresnost odhad˚ u a vymezen´ı jednotliv´ ych komponent se d´ a v nˇekter´ ych pˇr´ıpadech znaˇcnˇe vylepˇsit zahrnut´ım doprovodné promˇenné do modelu. Aplikace smˇes´ı regresn´ıch model˚ u lze nalézt v mnoha vˇedn´ıch odvˇetv´ıch, vˇcetnˇe biologie, genetiky, medic´ıny ˇci ekonomie, v jej´ımˇz rámci je moˇzné pozorovat napˇr´ıklad vztah mezi roˇcn´ı starobn´ı penz´ı poskytovanou státem a pˇr´ıjmem lid´ı straˇs´ıch 65 let.

Jakub Veˇ ceˇ ra Estimation of parameters in a planar segment process model with a biological application MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] In many applications systems of randomly dispersed segments in the plane or space are investigated. In biology such systems occur e. g. when using fluores- cent imaging of actin stress fibres in human mesenchymal stem cells from bone marrow. In materials research the microstructure of fibre-reinforced composites contain segments of small thickness. Typically the objects are not distributed purely randomly, which would correspond to the mathematical model called Poisson segment process. The aim is therefore to build stochastic models which involve some kind of interactions, which is a broad notion. Basically, such interactions can be attractive or repulsive, but in practical problems these can combine in various scales and also interactions with external deterministic components is frequent.

Ondˇ rej Venc´ alek Zobecnˇ en´ e line´ arn´ı modely nebo anal´ yza kompoziˇ cn´ıch dat? Podobnosti a rozd´ılnosti PˇrF UPOL, KMAAM, 17. listopadu 12, 771 46 Olomouc [email protected] Naˇse práce byla motivována praktick´ ym problémem anal´ yzy datového souboru obsahuj´ıc´ıho u ´ daje o poˇctech cyklist˚ u hospitalizovan´ ych po dopravn´ı nehodˇe. Ot´ azkou bylo, zda a jak se bˇehem 11 let, za nˇeˇz jsou u ´ daje k dispozici, zmˇenilo zastoupen´ı tˇr´ı vˇekov´ ych skupin mezi takto hospitalizovan´ ymi. Tradiˇcn´ı pˇr´ıstup k anal´ yze takovéhoto typu dat je zaloˇzen na pouˇzit´ı metodologie zobecnˇen´ ych lineárn´ıch model˚ u pro ordináln´ı z´ avisle promˇennou. Novˇe se ale prosazuje pohled na data tohoto typu jako na tzv. kompoziˇcn´ı data. Tento pˇr´ıstup je zameˇren na anal´ yzu informac´ı o pod´ılu jednotliv´ ych ˇca´st´ı na celku. V pˇr´ıspˇevku uk´ aˇzeme nejprve podobnosti obou pˇr´ıstup˚ u. Jedn´ım ze zobecnˇen´ ych lineárn´ıch model˚ u je tzv. adjacent-categories logit model, v nˇemˇz jsou modelovány logity pravdˇepodobnost´ı po sobˇe jdouc´ıch kategori´ı ln

π1 π2 , ln . π2 π3 23


c ROBUST 2016

Analogické v´ yrazy (v nichˇz jsou pravdˇepodobnosti nahrazeny relativn´ımi ˇcetnostmi) mohou b´ yt pouˇzity i coby logratio souˇradnice v rámci anal´ yzy kompoziˇcn´ıch dat. Zde jsou vˇsak preferovány ponˇekud odliˇsné, ortonormáln´ı souˇradnice. Ty odpov´ıdaj´ı v´ yraz˚ um √ π1 π2 π1 . ln , ln π2 π3 Z´ avislost tˇechto souˇradnic na ˇcase (ˇci jiné vysvˇetluj´ıc´ı promˇenné) je modelována pomoc´ı lineárn´ıho regresn´ıho modelu. Podstatné rozd´ılnosti v obou pˇr´ıstupech pom˚ uˇze objasnit vyˇsetˇren´ı asymptotick´ ych vlastnost´ı logratio souˇradnic. . .

Mojm´ır Vinkler, Stanislav Katina, Miroslav Sm´ıˇ sek Effect of denoising on brain atrophy measurements based on MRI for Alzheimer’s disease ´ MV, SK: PˇrF MU, UMS, Kotl´ aˇrsk´ a 2, 611 37 Brno MS: AXON Neuroscience SE [email protected] Alzheimer’s disease (AD) is a neurocognitive disorder with various level of atrophy of cerebral cortical regions and subcortical structures - mainly hippocampus. Volumetric measurements of hippocampus and its atrophy rate are promising tools in the determination of effect of disease-modifying treatment. Automatic segmentation of various cerebral structures visualized by MR and measurement of their volume is now freely available for clinical research of the natural course of the disease and effect of the treatment. However, due to inherent noise, variance of these measurement is high, making difficult reaching statistically valid conclusions. Using 140 MRI scans (28 patents, 5 visits) from randomized, placebo-controlled, parallel group, double-blinded, multi-centre Phase I clinical study we found that denoising with state of the art method prior to running FreeSurfer automatic segmentation reduced measurement error from 6.79% to 3.54% without introducing processing bias. Furthermore, additional temporal information reduced error to 2.50%. Lower error significantly reduced sample size required to detect differences in hippocampus atrophy between control (placebo) and treated group and also between left and right hippocampus. Although our results are not significant due to short study length and small sample size, general trend looks promising with respect to design, i.e. power analysis and sample size calculation, of further Phase II and III clinical studies. ´ Jan Amos V´ıˇ sek Are the bad leverage points the most difficult problem for estimating the underlying regression model? FSV UK, IES, Opletalova 26, 110 01 Praha 1 [email protected] A series of unsuccessful proposals of robust estimators hopefully with 50% breakdown point led to Pyrrhic victory by Andrew Siegel’s repeated median, see [17]. Nevertheless, feasible versions of 50% breakdown point estimators - the least median of squares (LMS) (see [14]) and the least trimmed squares (see [9]1 ) - were announced nearly immediately after it. They fulfilled the desire but the discontinuity of objective function and the presence of order statistics of the squared residuals in their definitions have made it difficult to study the properties of estimators in question. The proof of consistency of the former still exists only for special case and for the fully general proof of consistency of the latter we waited more than 20 years (and the proof is awfully involved, see [22]). On the other hand, efficient algorithms2 for computing both of them arrived rather soon. The proposal of S-estimator (see [16]) removed both these snags simultaneously preserving the high breakdown point and delivering simultaneously the proof of consistency, based on the results of [13]. A tax we had to pay for it was a restriction of the range of objective functions, but the restriction was quite acceptable. It required the objective function to be symmetric around zero and constant starting with some c > 0. The algorithms for computing S-estimators were implemented also nearly immediately but - due to the fact that they represented rather intensive computing - they are still studied (see e. g. [5], [6] and [19]). The extraordinary virtue of all these estimators was their “innate” scale- and regression-equivariance in contrast to 1 This reference on LTS is usually given although Peter Rousseeuw announced LTS only a few month after LMS. On the other hand, the first remark on possibility to compute something like LTS is in [8]. 2 The algorithms for LMS (see [4]) and LTS (see [1] or [23]) are efficient in a non-statistical sense, i. e. that they give hopefully tight approximations to the exact solutions of the corresponding extremal problems. The hope for it is supported by following: The estimate of underlying regression model for the group of datasets which has become benchmarks in robust regression, see [15], are such that the h-th order statistic of squared residuals in LM S-estimate is smaller that the h-th order statistic of squared residuals in LT S-estimate and vice versa, the sum of the first h-th order statistics of squared residuals in LT S-estimate is smaller than the sum of the first h-th order statistics of squared residuals in LM S-estimate. And it holds even for the case when we are able to give for LTS the exact solution, see [10] and [20].

24


c ROBUST 2016

M -estimators which require studentization, moreover the studentization by rather special estimator of standard deviation of error term3 . The estimator of scale has to be scale-equivariant and regression-invariant, see [3] and [11]. Shocking results by Thomas Hettmasperger and Simon Sheather (see [10], although they later proved to be wrong due to the bad algorithm they used for computing LMS, see [20]) revealed that the requirement on high breakdown point and/or zero-one objective function inevitably results in the high sensitivity to a small shift of “in-liers”, the drawback which cannot be removed without releasing the requirement on the extremely high breakdown point and zero-one objective function. That was the reason why an attempt of coping with this problem by offering a possibility of accommodating the level of robustness of the estimator to the level of contamination - the least weighted squares (LWS) - appeared (see [21]). The accommodation was enabled by appropriate adjustment of weights. In fact, the high speed of modern computational means allowed to select the weights-generating-function just tailored to the level and even to the character of contamination by a forward search, see [2]. It is plausible from the applications-point-of-view. The utilization of a generalized version of Glivenko theorem [7] (or Kolmogorov-Smirnov results, [12] or [18]) about the convergence of empirical distribution functions to the underlying one - generalized for the regression framework, see [24] - then simplified (in the sense of employment of√ much simpler and really applicable tools than the theory of empirical processes offers) the proofs of consistency, n-consistency, etc. Nevertheless, a disadvantage of LWS, mostly from the theoretical point of view, was the objective function - the only one, the quadratic function. Allowing for a general objecting function (even for an unbounded one) yielded the S-weighted estimators, see [25]. They inherited plausible properties of S-estimators as well as of LWS 4 , opening a chance to utilize a wide range of objective functions and simultaneously offering - by an appropriate selection of weight function - to adjust the estimator to the level and √ to the character of contamination. The contribution summarizes the conditions for the consistency, n-consistency (even under heteroscedasticity of error terms), asymptotic representation of SW -estimators (see [26]) and discusses the possibility of a “new” algorithm for computing them. The converted commas indicate that the trick for a plausible way for computing the estimator was in fact already employed in nineties for computing the M -estimators and is due to Jarom´ır Antoch, see [1]. A small collection of patterns of results of numerical studies of their behavior for moderate sample sizes will conclude the contribution. This is the most interesting part of the contribution because the results indicate that the widely spread idea that the most dangerous contamination for estimating regression model is represented by the leverage points need not be - sometimes - valid.

Literatura ´ V´ıˇsek (1991): Robust estimation in linear models and its computational aspects. Contri[1] Antoch, J., J. A. butions to Statistics: Computational Aspects of Model Choice, Springer Verlag, (1992), ed. J. Antoch, 39 104. [2] Atkinson, A. C., M. Riani, A. Cerioli (2004): Exploring Multivariate Data with the Forward Search. Springer Series in Statistics 2004, 31-88. [3] Bickel, P. J. (1975): One-step Huber estimates in the linear model. JASA 70, 428–433. [4] Boˇcek, P., P. Lachout (1993): Linear programming approach to LM S-estimation. Memorial volume of Comput. Statist. & Data Analysis 19(1995), 129 - 134. [5] Campbell, N. A., Lopuhaa, H. P., Rousseeuw, P. J. (1998): On calculation of a robust S-estimator of a covariance matrix. Statistics in medcine, 17, 2685 - 2695. [6] Desborges, R., Verardi, V. (2012): A robust instrumental-variable estimator. The Stata Journal (2012) 12, 169 -181. [7] Glivenko,V. I. (1933): Sulla determinazione empirica delle leggi di probabilita. Giorn. Ist.Ital. Attuari 4, 92. [8] Hampel, F. R. (1968): Contributions to the theory of robust estimation. Ph. D. thesis. University of California, Berkeley. [9] Hampel, F. R., E. M. Ronchetti, P. J. Rousseeuw, W. A. Stahel (1986): Robust Statistics – The Approach Based on Influence Functions. New York: J.Wiley & Son. [10] Hettmansperger, T. P., S. J. Sheather (1992): A Cautionary Note on the Method of Least Median Squares. The American Statistician 46, 79–83. [11] Jureˇcková, J., P. K. Sen (1984): On adaptive scale-equivariant M -estimators in linear models. Statistics and Decisions 2, Suppl. Issue No. 1. [12] Kolmogorov, A. (1950): Foundations of Probability. (English translation) Chelsea Publishing Co., New York, 1950. [13] Maronna, R. A., V. J. Yohai (1981): Asymptotic behaviour of general M –estimates for regression and scale with random carriers. Z. Wahrscheinlichkeitstheorie verw. Gebiete 58, 7–20. 3 Of course, it implicitly says that M -estimators assume the homoscedastic error terms which - especially for applications in social sciences - represents rather serious restriction. 4 It is rather simple to show that S-estimators are not special case of LWS and vice versa.

25


c ROBUST 2016

[14] Rousseeuw, P.J. (1984): Least median of square regression. JASA 79, 871-880. [15] Rousseeuw, P. J., A. M. Leroy (1987): Robust Regression and Outlier Detection. New York: J.Wiley & Sons. [16] Rousseeuw, P. J., V. Yohai (1984): Robust regressiom by means of S-estimators. In: Robust and Nonlinear Time Series Analysis. eds. J. Franke, W. H˝ ardle and R. D. Martin, Lecture Notes in Statistics No. 26 Springer Verlag, New York, 256-272. [17] Siegel, A. F. (1982): Robust regression using repeated medians. Biometrica, 69, 242 - 244. [18] Smirnov, N. (1939): On the estimation of discrepancy between empirical curves of distribution for two independent samples. Bull. Math. Univ. Moscow 2, 3 - 14. [19] Verardi, V., McCathie, A. (2012): The S-estimator of multivariate location and scatter in Stata. The Stata Journal (2012) 12, 299 - 307. ´ (1994): A cautionary note on the method of Least Median of Squares reconsidered, Transacti[20] V´ıˇsek, J. A. ons of the Twelfth Prague Conference on Information Theory, Statistical Decision Functions and Random Processes, Lachout, P. (ed), Academy of Sciences of the Czech Republic, Prague, 1994, 254 - 259. ´ (2000): Regression with high breakdown point. Robust 2000 (eds. J. Antoch & G. Dohnal, Union [21] V´ıˇsek, J. A. of Czech Mathematicians and Physicists), Prague: matfyzpress, 324 - 356. ´ (2006): The least trimmed squares. Part I - Consistency. Part II - √n-consistency. Part III [22] V´ıˇsek, J. A. Asymptotic normality and Bahadur representation. Kybernetika 42, 1 - 36, 181 - 202, 203 - 224. ´ (2006): Instrumental Weighted Variables - algorithm. Proceedings of the COMPSTAT 2006, eds. [23] V´ıˇsek, J. A. A. Rizzi & M. Vichi, Physica-Verlag, 777-786. ´ (2011): Empirical distribution function under heteroscedasticity. Statistics 45, 497-508. [24] V´ıˇsek, J. A. ´ (2015): S-weighted estimators. Proceedings of the 16th Conference on the Applied Stochastic [25] V´ıˇsek, J. A. Models, Data Analysis and Demographics 2015, 1031 - 1042. ´ (2016): Asymptotics of S-weighted estimators. Submitted toContributions to Theoretical and [26] V´ıˇsek, J. A. Applied Statistics In honor of Corrado Gini. Acknowledgement: Research was supported by the Czech Science Foundation project No. 13-01930S Robust methods for nonstandard situations, their diagnostics and implementations. Petr Volf O anal´ yze konkuruj´ıc´ıch si rizik s aplikac´ı na ˇ cas prvn´ıho g´ olu v fotbalov´ em utk´ an´ı ´ ˇ UTIA AV CR, Pod vod´ arenskou vˇeˇz´ı 4, 182 08 Praha 8 [email protected] V pˇr´ıspˇevku nejprve zopakuji z´ akladn´ı poznatky o problému konkurenˇcn´ıch rizik. Ten se vyskytuje v statistické anal´ yze pˇreˇzit´ı a zobecˇ nuje vlastnˇe schema n´ ahodného cenzorován´ı zprava v tom smyslu, ˇze konkurenˇcn´ı veliˇciny (zde tedy z´ aroveˇ n bˇeˇz´ıc´ı n´ ahodné ˇcasy do ”konkurenˇcn´ıch”událost´ı, tj. takov´ ych, ˇze z nich m˚ uˇze nastat jen jedna) mohou b´ yt vz´ ajemnˇe z´ avislé. V medic´ınsk´ ych problémech se vˇetˇsinou analyzuje incidence (tj. skuteˇcn´ y v´ yskyt) takov´ ychto ud´ alost´ı, ale zkoum´ an´ı vz´ ajemné souvislosti je zaj´ımavé jednak prakticky, a jednak i z hlediska model˚ u a anal´ yzy. Nyn´ı se na modelován´ı z´ avislosti n´ ahodn´ ych veliˇcin pouˇz´ıvaj´ı modely kopul´ı, tento trend pronikl i sem. D´ık ne´ uplnˇe pozorovan´ ym dat˚ um se ovˇsem m˚ uˇze stát, ˇze kompletn´ı model nen´ı identifikovateln´ y. Dalˇs´ı otázkou je v´ ybˇer kopuly, vhodnost lze ovˇeˇrit dodateˇcn´ ym testován´ım shody modelu s daty. I tˇemto otázkám se budu vˇenovat. Hlavn´ım c´ılem je pak zkusit model konkurenˇcn´ıch rizik uplatnit na ”konkuruj´ıc´ı si”2 n´ ahodné ˇcasy (2 t´ ym˚ u) do vstˇrelen´ı prvn´ı branky ve fotbalovém utk´ an´ı. Proto také pˇripomenu z´ akladn´ı pˇr´ıstupy k modelován´ı skore (i jeho v´ yvoje) z´ apasu a rozˇs´ıˇr´ım je právˇe o uvaˇzován´ı z´ avislosti intenzit sk´ orován´ı obou t´ ym˚ u. Praktická anal´ yza bude provedena na datech z jednoho roˇcn´ıku ˇceské Synot ligy. Viktor Witkovsk´ y Vybran´ e met´ ody a aplik´ acie ˇ statististickej inferencie zaloˇ zen´ e na numerickej inverzii charakteristickej funkcie ´ Ustav merania SAV, D´ ubravsk´ a cesta 9, 841 04 Bratislava [email protected] Ciel’om pr´ıspevku je prezentovat’ a ilustrovat’ vybrané metódy, algoritmy a ich aplikácie pre ˇstatistick´ u inferenciu zaloˇzen´ u na kombinovan´ı a invertovan´ı charakteristick´ ych funkci´ı (CF). Tradiˇcne s´ u charakteristické funkcie vyuˇz´ıvané ako jeden zo z´ akladn´ ych teoretick´ ych n´ astrojov pravdepodobnosti a matematickej ˇstatistiky. Práca s charakteristick´ ymi funkciami je ˇcastokrát v´ yhodnejˇsia a jednoduchˇsia oproti postupom zaloˇzen´ ym na priamej manipulácii s distribuˇcn´ ymi funkciami (CDF) resp. s ich hustotami rozdelenia (PDF). Menej frekventované je vˇsak priame vyuˇzitie charakteristick´ ych funkci´ı vo v´ ypoˇctovej resp. aplikovanej ˇstatistike. Jedn´ ym z dˆ ovodov je absencia spol’ahliv´ ych v´ ypoˇctov´ ych n´ astrojov pre prácu s charakteristick´ ymi funkciami v ˇstandardn´ ych softvérov´ ych 26


c ROBUST 2016

bal´ıkoch (napr. R, SAS, Matlab). Vo vˇseobecnosti, problematika numerického invertovania CF nar´ aˇza na komplik´ acie spojené s problémom integrovania osciluj´ ucich funkci´ı. Pokial’ vˇsak zostaneme na pˆ ode aplikovanej ˇstatistiky, ˇcastokrát uˇz vel’mi jednoduché numerické n´ astroje poskytuj´ u dostatoˇcne presné (aproximat´ıvne) v´ ysledky. V pr´ıspevku uvedieme jednoduché metódy a algoritmy pre numerické invertovanie charakteristick´ ych funkci´ı, zaloˇzené na Gil-Pelaezovej metóde invertovania CF a na pouˇzit´ı algoritmu pre r´ ychlu Fourierov´ u transformáciu (FFT). Aplikovatel’nost’ t´ ychto metód ilustrujeme na niekol’k´ ych pr´ıkladoch parametrickej ako aj neparametrickej ˇstatistickej inferencie (zaloˇzenej na empirick´ ych charakteristick´ ych funkciach). Pod’akovanie: Táto práca bola podporená Agent´ urou na podporu v´ yskumu a v´ yvoja APVV-15-0295.

Xeniya Yermolenko Non-unbiased two-sample nonparametric tests: Numerical example MFF UK, KPMS, Sokolovsk´ a 83, 186 75 Praha 8 [email protected] Many tests on vector or scalar parameters against two-sided alternatives are generally not finite-sample unbiased. They are unbiased only for symmetric distributions or under similar conditions. This was already noticed by [1], [4] and generally analyzed by [2], [3] and later by many others. While in univariate models the tests are unbiased against one-sample alternatives, such alternatives are not clearly characterized in the multivariate models. We shall numerically illustrate this important problem on the Wilcoxon test against two-sample alternative of shift in location, applied to a skew logistic distribution and unequal sample sizes.

Literature [1] Amrhein, P. (1995). An example of a two-sided Wilcoxon signed rank test which is not unbiased. Ann. Inst. Statist. Math. 47 167–170. [2] Jureˇcková, J., & Kalina, J. (2012). Nonparametric multivariate rank tests and their unbiasedness. Bernoulli 18, 229–251. [3] Jureˇcková, J. & Milhaud, X. (2003). Derivative in the mean of a density and statistical applications. IMS Lecture Notes 42, 217–232. [4] Sugiura, N., Murakami, H., Lee, S.K. & Maeda, Y. (2006). Biased and unbiased two-sided Wilcoxon tests for equal sample sizes. Ann. Inst. Statist. Math. 58, 93–100.

Mark´ eta Zikmundov´ a Procesy interaguj´ıc´ıch u ´ seˇ cek ˇ ´ VSCHT, Ustav matematiky, Studentská 6, 160 00 Praha 6 [email protected] Uvaˇzujme bodov´ y proces interaguj´ıc´ıch u ´seˇcek na omezené mnoˇzinˇe S ⊂ R2 dan´ y hustotou p(y|x) = c−1 x exp(x1 · N (Uy ), x2 · L(Uy ), x3 · I(Uy )), vzhledem k nˇejakému Poissonovu bodovému procesu u ´seˇcek se souˇcinovou m´ırou intenzity. Symbol N (Uy ) znaˇc´ı poˇcet pr˚ useˇc´ık˚ u vˇsech u ´seˇcek ve sjednocen´ı U konfigurace u ´seˇcek y. Obdobnˇe L odpov´ıdá celkové délce v U, I poˇctu izolovan´ ych u ´seˇcek a x = (x1 , x2 , x3 ) je parametr rozdˇelen´ı hustoty p. Tento pˇr´ıspˇevek se zab´ yvá odhadem parametru x a odhadem vybran´ ych charakteristik.

27

ROBUST 2016 Sborn ık abstrakt u

Recommend Documents