Z´ apadoˇ cesk´ a univerzita v Plzni Fakulta aplikovan´ ych vˇed Katedra matematiky
Statistick´ a anal´ yza sportovn´ıch v´ ysledk˚ u ´ RSK ˇ ´ PRACE ´ BAKALA A
Plzeˇ n, 2013
ˇ Kateˇ rina Sediv´ a
Prohl´ aˇ sen´ı Prohlaˇsuji, ˇze jsem svou bakal´aˇrskou pr´aci vypracovala samostatnˇe a pouˇzila jsem pouze podklady (literatura, software apod.) uveden´e v pˇriloˇzen´em seznamu.
V Plzni dne podpis
Podˇ ekov´ an´ı Na tomto m´ıstˇe bych chtˇela podˇekovat vedouc´ımu m´e bakal´aˇrsk´e pr´ace RNDr. Petrovi Stehl´ıkovi, Ph.D. za jeho cenn´e rady a ˇcas, kter´ y mi pˇri tvorbˇe t´eto pr´ace vˇenoval. D´ale bych r´ada podˇekovala Danielu Nov´akovi za poskytnut´ı dat pro zpracov´an´ı. Pˇredevˇs´ım bych vˇsak chtˇela podˇekovat ˇclen˚ um m´e rodiny a m´ ym nejbliˇzˇs´ım za bezmeznou podporu po celou dobu m´eho studia.
Abstrakt C´ılem t´eto pr´ace je zpracovat a analyzovat shrom´aˇzdˇen´a data h´azenk´aˇrsk´ ych soutˇeˇz´ı. Pro ˇ e zpracov´an´ı byla shrom´aˇzdˇena data z nejvyˇsˇs´ı muˇzsk´e h´azenk´aˇrsk´e soutˇeˇze v Nˇemecku a Cesk´ republice za posledn´ıch 10 sez´on, v letech 2002 - 2012. V prvn´ı f´azi praktick´e ˇca´sti pr´ace byly urˇceny z´akladn´ı statistiky a v n´asleduj´ıc´ı ˇca´sti pr´ace bylo provedeno testov´an´ı tˇr´ı hypot´ez pomoc´ı vhodn´ ych statistick´ ych test˚ u. Konkr´etnˇe se jednalo o hypot´ezy o normalitˇe vstˇrelen´ ych g´ol˚ u, o dynamice v soutˇeˇzi a o dynamice mezi obˇema soutˇeˇzemi. V dalˇs´ıch kapitol´ach praktick´e ˇc´asti byl proveden v´ ypoˇcet ranking˚ u pro jednotliv´e t´ ymy samostatnˇe za cel´e sledovan´e obdob´ı a samostatnˇe pro jednotliv´e sez´ony. Pˇredpovˇedi v´ ysledk˚ u z´apas˚ u z´ıskan´e na z´akladˇe porovn´an´ı ranking˚ u byly porovn´any se skuteˇcn´ ymi v´ ysledky. Kl´ıˇ cov´ a slova: h´azen´a, regresn´ı modely, ranking, Colley Matrix Model, Keener Ranking Model, Offense-Defense Model
Abstract The aim of this thesis is to collect and analyze results of handball matches. Assembling matches from 2002-2012, we construct a dataset consisting of 4674 matches from top men’s handball leagues in Germany and the Czech Republic. First, we present a concise overview of selected statistical methods for hypothesis testing and three ranking algorithms. Next, we provide basic descriptive statistics of the dataset and study hypotheses regarding the normality of the scoring, its dynamics within the game and within the season. Finally, rankings are computed and their prediction rates are studied. Key words: handball, regression model, ranking, Colley Matrix Model, Keener Ranking Model, Offense-Defense Model
Obsah ´ Uvod
1
1 Data z h´ azenk´ aˇ rsk´ ych soutˇ eˇ z´ı 1.1 Popis dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Nedokonal´a data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Z´akladn´ı statistick´e zpracov´an´ı dat . . . . . . . . . . . . . . . . . . . . . . . . .
2 2 2 4
2 Teoretick´ aˇ c´ ast k pouˇ zit´ ym test˚ um pro testov´ an´ı hypot´ ez 2.1 Testy normality dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Line´arn´ı regrese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Kontingenˇcn´ı tabulky a χ2 - test nez´avislosti a homogenity . . . . . . . . . . . .
7 7 7 9
3 Teoretick´ aˇ c´ ast k ranking˚ um 3.1 Colley Matrix Model . . . . . . . . . . . . . . . . . . . 3.2 Keener Ranking Model . . . . . . . . . . . . . . . . . . 3.3 Offense-Defense Model (ODM) . . . . . . . . . . . . . . 3.4 Porovn´an´ı hodnot ranking˚ u s re´aln´ ymi v´ ysledky z´apas˚ u
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
4 Testov´ an´ı hypot´ ez na re´ aln´ ych datech 4.1 Testy normality vstˇrelen´ ych g´ol˚ u . . . . . . . . . . . . . . . . . . . 4.1.1 Motivace k vytvoˇren´ı hypot´ezy . . . . . . . . . . . . . . . . 4.1.2 V´ ybˇer testu pro testov´an´ı hypot´ezy . . . . . . . . . . . . . . 4.1.3 Formulace hypot´ezy o normalitˇe dat . . . . . . . . . . . . . 4.2 Line´arn´ı z´avislost poˇctu g´ol˚ u a poˇctu kol . . . . . . . . . . . . . . . 4.2.1 Motivace k vytvoˇren´ı hypot´ezy . . . . . . . . . . . . . . . . 4.2.2 V´ ybˇer testu pro testov´an´ı hypot´ezy . . . . . . . . . . . . . . 4.2.3 Pˇredpoklady modelu a jejich ovˇeˇren´ı . . . . . . . . . . . . . 4.2.4 Formulace hypot´ezy o kladnosti smˇernicov´eho parametru . . 4.2.5 V´ ysledky testu . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.6 V´ ysledky regresn´ı anal´ yzy a diagnostiky: . . . . . . . . . . . 4.3 Z´avislost koneˇcn´eho v´ ysledku z´apasu na poloˇcasov´em sk´ore . . . . . 4.3.1 Motivace k vytvoˇren´ı hypot´ezy . . . . . . . . . . . . . . . . 4.3.2 V´ ybˇer test˚ u pro testov´an´ı hypot´ezy . . . . . . . . . . . . . . 4.3.3 Formulace hypot´ezy o z´avislosti koneˇcn´eho v´ ysledku z´apasu poˇctu g´ol˚ u v poloˇcase a pˇredpoklady modelu . . . . . . . . .
i
. . . .
. . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . na . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . rozd´ıl˚ u . . . . .
10 10 11 12 13 14 14 14 14 14 19 19 19 19 22 22 23 27 27 29 29
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
29 30 30 31 31
5 Rankingy na re´ aln´ ych datech 5.1 Colley Matrix Model . . . . . . . . . . . . . . . . . . . 5.1.1 V´ yhody a nev´ yhody modelu . . . . . . . . . . . 5.1.2 Intepretace v´ ysledk˚ u . . . . . . . . . . . . . . . 5.2 Keener Ranking Model . . . . . . . . . . . . . . . . . . 5.2.1 V´ yhody a nev´ yhody modelu . . . . . . . . . . . 5.2.2 Interpretace v´ ysledk˚ u. . . . . . . . . . . . . . . 5.3 Offense-Defense Model . . . . . . . . . . . . . . . . . . 5.3.1 V´ yhody a nev´ yhody modelu . . . . . . . . . . . 5.3.2 Interpretace v´ ysledk˚ u. . . . . . . . . . . . . . . 5.4 Porovn´an´ı hodnot ranking˚ u s re´aln´ ymi v´ ysledky z´apas˚ u
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
33 33 33 34 35 35 35 36 36 37 38
4.4
4.3.4 V´ ysledky test˚ u . . . . . . . . . . . . . . . Srovn´an´ı dynamiˇcnosti hry v ˇcesk´e a nˇemeck´e lize 4.4.1 Motivace k vytvoˇren´ı hypot´ezy . . . . . . 4.4.2 Formulace hypot´ezy . . . . . . . . . . . . 4.4.3 V´ ysledky testu . . . . . . . . . . . . . . .
. . . . .
. . . . .
Z´ avˇ er
44
Literatura
45
Obsah pˇ riloˇ zen´ eho CD
46
ii
Seznam obr´ azk˚ u 3.1
Vyhlazovac´ı funkce h(x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8
Histogram a empirick´a distribuˇcn´ı funkce-g´oly dom´ac´ı . . . . . . . . . . . . . Histogram a empirick´a distribuˇcn´ı funkce-g´oly host´e . . . . . . . . . . . . . . Histogram a empirick´a distribuˇcn´ı funkce-g´oly celkem . . . . . . . . . . . . . Boxplot graf pro jednotliv´a kola . . . . . . . . . . . . . . . . . . . . . . . . . Histogram relativn´ıch ˇcetnost´ı odchylek a p-p graf . . . . . . . . . . . . . . . Pr˚ umˇern´ y poˇcet g´ol˚ u v jednotliv´ ych kolech a pˇr´ısluˇsn´e kvartilov´e rozpˇet´ı . . Studentizovan´a rezidua a Cookova m´ıra . . . . . . . . . . . . . . . . . . . . . Vztah rozd´ıl˚ u g´ol˚ u v prvn´ım poloˇcase a na konci z´apasu/ve druh´em poloˇcase
. . . . . . . .
15 15 15 20 21 22 24 27
5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8
V´ yvoj ranking˚ u za cel´e obdob´ı . . . . . . . . . . . . . . . . . . . V´ yvoj ranking˚ u ve vyran´ ych sez´on´ach . . . . . . . . . . . . . . . V´ yvoj ranking˚ u za cel´e obdob´ı . . . . . . . . . . . . . . . . . . . V´ yvoj ranking˚ u ve vybran´ ych sez´on´ach . . . . . . . . . . . . . . V´ yvoj celkov´ ych ranking˚ u za celkov´e sledovan´e obdob´ı . . . . . V´ yvoj ranking˚ u obrany a u ´toku t´ ym˚ u ve vybran´ ych sez´on´ach . . V´ yvoj celkov´ ych ranking˚ u ve vybran´ ych sez´on´ach . . . . . . . . Hodnoty ranking˚ u t´ ymu dom´ac´ıch a t´ ymu host˚ u z´ıskan´e z Colley
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Matrix Model
34 35 36 36 37 38 38 39
iii
. . . . . . . .
Seznam tabulek 1.1 1.2 1.3
N´azvy t´ ym˚ u pouˇz´ıvan´e v ˇcesk´e lize . . . . . . . . . . . . . . . . . . . . . . . . . Z´akladn´ı statistick´e zpracov´an´ı dat (nˇemeck´a liga) . . . . . . . . . . . . . . . . . Z´akladn´ı statistick´e zpracov´an´ı dat (ˇcesk´a liga) . . . . . . . . . . . . . . . . . . .
4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 4.11 4.12 4.13 4.14 4.15
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . kdy je . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . v . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . po. . . . . . . . . . . . . . . . . . . . . . . . . . .
16 16 17 18 20 20 21 23 23 24 24 25 26 28
4.16 4.17 4.18 4.19 4.20 4.21 4.22 4.23
V´ ysledky Jarque-Bera testu pro jednotliv´e sez´ony . . . . . . . . . V´ ysledky Lilliefors testu pro jednotliv´e sez´ony . . . . . . . . . . . V´ ysledky Jarque-Bera testu pro jednotliv´a kola . . . . . . . . . . V´ ysledky Lilliefors testu pro jednotliv´a kola . . . . . . . . . . . . V´ ysledky testu o nulovosti stˇredn´ıch hodnot odchylek . . . . . . . V´ ysledky testu o shodnosti rozptyl˚ u odchylek . . . . . . . . . . . V´ ysledky test˚ u normality dat . . . . . . . . . . . . . . . . . . . . V´ ysledky testu ovˇeˇren´ı kladn´e line´arn´ı z´avislosti . . . . . . . . . . V´ ysledky testu o v´ yznamnosti odhadnut´ ych koeficient˚ u . . . . . . V´ ysledky testu v´ yznamnosti regrese . . . . . . . . . . . . . . . . . Z´apasy s nejvˇetˇs´ı Cookovo vzd´alenost´ı . . . . . . . . . . . . . . . V´ ysledky test˚ u pro jednotliv´e t´ ymy . . . . . . . . . . . . . . . . . V´ ysledky test˚ u pro jednotliv´e soutˇeˇzn´ı roˇcn´ıky . . . . . . . . . . . Hodnoty korelaˇcn´ıch koeficient˚ u pro jednotliv´e sez´ony . . . . . . . Hodnoty korelaˇcn´ıch koeficient˚ u pro jednotliv´e sez´ony, v z´apasech, loˇcase rozd´ıl maxim´alnˇe jeden g´ol . . . . . . . . . . . . . . . . . . Tabulka namˇeˇren´ ych ˇcetnost´ı . . . . . . . . . . . . . . . . . . . . Tabulka oˇcek´avan´ ych ˇcetnost´ı pro vyrovnan´e z´apasy . . . . . . . . Tabulka namˇeˇren´ ych ˇcetnost´ı . . . . . . . . . . . . . . . . . . . . Tabulka oˇcek´avan´ ych ˇcetnost´ı pro vyrovnan´e z´apasy . . . . . . . . Hodnoty namˇeˇren´ ych ˇcetnost´ı pro jednotliv´e skupiny . . . . . . . Hodnoty oˇcek´avan´ ych ˇcetnost´ı pro jednotliv´e skupiny . . . . . . . Hodnoty namˇeˇren´ ych ˇcetnost´ı pro jednotliv´e skupiny . . . . . . . Hodnoty oˇcek´avan´ ych ˇcetnost´ı pro jednotliv´e skupiny . . . . . . .
5.1 5.2 5.3 5.4 5.5 5.6
Tabulka poˇrad´ı vybran´ ych t´ ym˚ uv ´ Uspˇeˇsnost pˇredpovˇedi CMMC . . ´ eˇsnost pˇredpovˇedi CMMJ . . Uspˇ ´ eˇsnost pˇredpovˇedi KRMC . . Uspˇ ´ eˇsnost pˇredpovˇedi KRMJ . . Uspˇ ´ eˇsnost pˇredpovˇedi ODMC . . Uspˇ
. . . . . .
. . . . . .
. . . . . .
34 40 40 40 40 41
cel´em sledovan´em obdob´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
iv
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
3 5 6
28 29 30 30 30 31 31 32 32
5.7 5.8 5.9 5.10 5.11
´ eˇsnost Uspˇ ´ eˇsnost Uspˇ ´ eˇsnost Uspˇ ´ eˇsnost Uspˇ ´ eˇsnost Uspˇ
pˇredpovˇedi pˇredpovˇedi pˇredpovˇedi pˇredpovˇedi pˇredpovˇedi
ODMJ . . . . . . . . . . . . . . . . . . . . na z´akladˇe vˇsech model˚ u . . . . . . . . . . na z´akladˇe vˇsech model˚ u . . . . . . . . . . na z´akladˇe ODMJ se sn´ıˇzenou hranic´ı . . . na z´akladˇe vˇsech optimalizovan´ ych model˚ u
v
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
41 42 42 43 43
´ Uvod V´ ysledky sportovn´ıch z´apas˚ u jsou velmi zaj´ımavou oblast´ı pro statistickou anal´ yzu dat. V´ yhodou anal´ yzy tˇechto dat je dostupnost velk´eho mnoˇzstv´ı dat ve snadno interpretovateln´e formˇe. Tato pr´ace je zamˇeˇrena na v´ ysledky z´apas˚ u z muˇzsk´e h´azen´e, konkr´etnˇe z nˇemeck´e a ˇcesk´e nejvyˇsˇs´ı soutˇeˇze. H´azen´a byla vybr´ana proto, ˇze se jedn´a o dynamick´ y sport, kde v z´apasech pad´a velk´e mnoˇzstv´ı g´ol˚ u a je tedy moˇzno pˇredpokl´adat normalitu z´ıskan´ ych dat. V naˇsem pˇr´ıpadˇe se jedn´a o data za posledn´ıch deset let v obou soutˇeˇz´ıch, konkr´etnˇe 4674 odehran´ ych z´apas˚ u, proto tedy lze ˇr´ıci, ˇze m´ame k dispozici sluˇsn´e mnoˇzstv´ı dat. Podrobn´emu popisu datov´eho souboru, kter´ y byl v pr´aci zpracov´av´an a z´akladn´ım statistik´am bude vˇenov´ana Kapitola 1. Po kr´atk´em pˇredstaven´ı pouˇz´ıvan´ ych dat budou n´asledovat Kapitoly 2 a 3, ve kter´ ych je uvedena teoretick´a ˇca´st k pouˇzit´ ym statistick´ ym metod´am na testov´an´ı hypot´ez a metod´am pro v´ ypoˇcet ranking˚ u. Budou zde tedy tyto metody matematicky formulov´any a pops´any, tak jak budou d´ale pouˇzity pˇri praktick´em zpracov´an´ı dat. V Kapitole 4 je moˇzno nal´ezt praktick´e zpracov´an´ı z´ıskan´ ych dat. Nejprve byla testov´ana hypot´eza o tom, zda data maj´ı norm´aln´ı rozdˇelen´ı. D´ale byly testov´any tˇri n´asleduj´ıc´ı hypot´ezy: zda existuje line´arn´ı z´avislost mezi poˇctem g´ol˚ u a poˇctem odehran´ ych kol v sez´onˇe, zda koneˇcn´ y v´ ysledek z´avis´ı na poloˇcasov´em v´ ysledku a zda je nˇemeck´a h´azenk´aˇrsk´a liga dynamiˇctˇejˇs´ı neˇz ˇcesk´a h´azenk´aˇrsk´a liga. V posledn´ı Kapitole 5 budou urˇceny rankingy jednotliv´ ych t´ ym˚ u dle tˇr´ı zvolen´ ych model˚ u. Jedn´a se o Colley Matrix Model, Keener Ranking Model a Offense-Defense Model. Rankingy budou poˇc´ıt´any pro t´ ymy z nˇemeck´e h´azenk´aˇrsk´e soutˇeˇze za cel´e sledovan´e obdob´ı a tak´e pro jednotliv´e sez´ony. Hodnoty ranking˚ u jednotliv´ ych t´ ym˚ u budou vyuˇzity k porovn´an´ı s re´aln´ ymi v´ ysledky z´apas˚ u. Na z´akladˇe aktu´aln´ıch ranking˚ u budou pˇredpovˇezeny v´ ysledky z´apas˚ u a n´aslednˇe porovn´any s re´aln´ ymi v´ ysledky. V z´avˇeru pr´ace budou shrnuty zaj´ımav´e poznatky a v´ ysledky t´eto pr´ace.
1
Kapitola 1 Data z h´ azenk´ aˇ rsk´ ych soutˇ eˇ z´ı 1.1
Popis dat
Z´ıskan´a data pro statistickou anal´ yzu sportovn´ıch v´ ysledk˚ u jsou v´ ysledky z´apas˚ u v h´azen´e ˇ z nejvyˇsˇs´ı soutˇeˇze muˇz˚ u v Cesk´e republice a v Nˇemecku z let 2002-2012. V´ ysledky vˇsech z´apasu jsou z´ısk´ana od pana Daniela Nov´aka, administr´atora internetov´eho serveru The Czech Handball Server [6]. Z nˇemeck´e nejvyˇsˇs´ı muˇzsk´e soutˇeˇze je k dispozici 3060 v´ ysledk˚ u z´apas˚ u a z ˇcesk´e nejvyˇsˇs´ı muˇzsk´e soutˇeˇze 1614 v´ ysledk˚ u, dohromady tedy 4674 v´ ysledk˚ u z´apas˚ u. Pro kaˇzd´ y z´apas byly k dispozici tyto informace: datum a ˇcas utk´an´ı, n´azvy soupeˇr˚ u, urˇcen´ı dom´ac´ıho a hostuj´ıc´ıho celku, v´ ysledek v poloˇcase a na konci utk´an´ı, jm´ena rozhodˇc´ıch a identifikaˇcn´ı ˇc´ıslo z´apasu. Z tˇechto u ´daj˚ u bylo urˇceno nˇekolik dalˇs´ıch charakteristik utk´an´ı. Napˇr´ıklad rozd´ıl v´ ysledku utk´an´ı v prvn´ım poloˇcase, druh´em poloˇcase a tak´e na konci z´apasu. D´ale bylo ke kaˇzd´emu v´ ysledku pˇriˇrazeno v poloˇcase a tak´e na konci p´ısmeno V nebo P nebo R, kter´e urˇcuj´ı, zda dom´ac´ı celek v dan´e f´azi z´apasu vyhr´al, prohr´al nebo remizoval [6].
1.1.1
Nedokonal´ a data
Z´ıskan´a data byla po staˇzen´ı ze serveru nedokonal´a, proto bylo potˇreba data upravit. V nˇekolika pˇr´ıpadech se v datech objevil probl´em se ˇspatn´ ym pˇriˇrazen´ım u nˇekter´ ych v´ ysledk˚ u z´apas˚ u ke spr´avn´emu hrac´ımu kolu. Tento probl´em se podaˇrilo odhalit v okamˇziku, kdy bylo kontrolov´ano, zda v kaˇzd´em kole byl sehr´an odpov´ıdaj´ıc´ı poˇcet z´apas˚ u. Dalˇs´ım probl´emem byl z´apas v nˇemeck´e soutˇeˇzi, ke kter´emu byl pˇriˇrazen v´ ysledek 0:0. Tento z´apas byl proto z dalˇs´ıho zpracov´an´ı dat vyˇrazen. V´aˇznˇejˇs´ım probl´emem vˇsak bylo ˇcast´e pˇrejmenov´av´an´ı jednotliv´ ych t´ ym˚ u v soutˇeˇzn´ıch roˇcn´ıc´ıch. Tento probl´emov´ y jev, kter´ y byl s nejvˇetˇs´ı pravdˇepodobnost´ı zp˚ usobem ˇcast´ ym mˇenˇen´ım sponzor˚ u, se projevuje v ˇcesk´e nejvyˇsˇs´ı soutˇeˇzi, naopak v nˇemeck´e nejvyˇsˇs´ı soutˇeˇzi z˚ ust´avaj´ı n´azvy celk˚ u stejn´e ve vˇsech roˇcn´ıc´ıch. Veˇsker´e zmˇeny n´azv˚ u ˇcesk´ ych t´ ym˚ u jsou zobrazeny v Tabulce 1.1.
2
Tabulka 1.1: N´azvy t´ ym˚ u pouˇz´ıvan´e v ˇcesk´e lize N´ azev t´ ymu Radegast SKP Fr´ ydek-M´ıstek , HC Fr´ ydek-M´ıstek, SKP Fr´ ydek-M´ıstek, SKP ARCIMPEX Fr´ ydek-M´ıstek Plzeˇ n HSC Plzeˇ n, TJ Lokomotiva Plzeˇ n, SSK Talent M.A.T. Plzeˇ n Brno H´azen´a Brno, H´azen´a Brno s.r.o., KP Brno Karvin´a HC Ban´ık Karvin´a, HC Ban´ık Karvin´a s.r.o., HCB OKD Karvin´a Zubˇr´ı HC Zubˇr´ı HC Gum´arny Zubˇr´ı Hranice Cement Hranice, TJ Cement Hranice Jiˇc´ın CS CARGO HBC Jiˇc´ın, HBC RONAL Jiˇc´ın ˇ Farmakol Tatran Preˇsov, Tatran Preˇsov SK Preˇsov Lovosice HK Mˇesto Lovosice HK.A.S.A Mˇesto Lovosice Tˇreboˇ n TJ Jiskra Tˇreboˇ n, TJ Jiskra L´aznˇe Tˇreboˇ n Koˇsice 1. MHK Koˇsice Dv˚ ur kr´alov´e nad Labem 1. HK Dv˚ ur Kr´alov´e nad Labem Dukla Praha HC Dukla Praha Allrisk Praha Allrisk CAC Praha Hustopeˇce H´azen´a Legata Hustopeˇce Topolˇcany HC THP TOPVAR Topolˇcany Kopˇrivnice KH Kopˇrivnice Bardejov MHC Bardejov ˇ Povaˇzsk´a Bystrica Povaˇzsk´a Bystrica MSK Louny SHK Knauf-Chemiko Louny Pˇrerov Sokol HC Pˇrerov Kostelec na Han´e Sokol Kostelec na Han´e ˇ Bratislava SKP Bratislava ˇ Seˇcovce SKP Seˇcovce Bystˇrice pod Host´ ynem TJ Bystˇrice pod Host´ ynem Hlohovec TJ Drot’ovna Hlohovec Napajedla TJ Fatra Slavia Napajedla Mˇ esto Fr´ ydek M´ıstek
3
1.2
Z´ akladn´ı statistick´ e zpracov´ an´ı dat
V dalˇs´ı f´azi statistick´eho zpracov´an´ı dat byly urˇceny z´akladn´ı statistick´e charakteristiky. Pro jednotliv´e t´ ymy obou sledovan´ ych soutˇeˇz´ı byly spoˇcteny poˇcty vˇsech utk´an´ı, kter´e za sledovan´e obdob´ı jednotliv´ y t´ ym odehr´al. D´ale byly podrobnˇe sledov´any poˇcty v´ yher, poˇcty proher a poˇcty rem´ız a byl urˇcen jejich pod´ıl z celkov´eho poˇctu utk´an´ı. Jako doplˇ nkov´e informace byly spoˇcteny pr˚ umˇern´e poˇcty g´ol˚ u, kter´e t´ ym vstˇrelil na dom´ac´ı a na hostuj´ıc´ı palubovce. Posledn´ı informac´ı, kter´a je obsaˇzena v Tabulce 1.2 a 1.3, je poˇcet sez´on, kter´ y dan´ y t´ ym odehr´al a pr˚ umˇern´e poˇrad´ı, kter´eho za dobu sv´eho p˚ usoben´ı v soutˇeˇzi dos´ahl.
4
Bergischer HC Concordia Delitzsch DHC Rheinland Eintracht Hildesheim FA G¨ oppingen F¨ uchse Berlin GWD Minden HBW Balingen-Weilstetten HSG Ahlen-Hamm HSG D/M Wetzlar HSG D¨ usseldorf HSG Nordhorn HSG Wetzlar HSV Hamburg MT Melsungen Rhein-Neckar-L¨ owen SC Magdeburg SG Flensburg-Handewitt ¨ SG Kronau/Ostringen SG Wallau-Massenheim SG Willst¨ att/Schutterwald Stralsunder HV SV Post Schwerin TBV Lemgo ThSV Eisenach THW Kiel TSG Ludwigshafen-Friesenheim TSV Dormagen TSV Hannover-Burgdorf TuS N-L¨ ubbecke TUSEM Essen TV 05/07 H¨ uttenberg TV Großwallstadt VfL Gummersbach VfL Pfullingen Wilhelmshavener HV CELKEM
T´ ym
Poˇ cet utk´ an´ı 34 34 34 68 340 170 272 204 34 272 136 238 68 340 238 170 340 340 102 102 34 68 34 340 68 340 34 68 102 272 170 34 340 340 136 204 6120
Poˇ cet v´ yher 8 4 8 7 158 95 68 55 6 77 31 137 23 235 80 121 211 259 46 41 7 10 4 217 18 287 4 13 28 80 66 6 136 198 27 55 2826
Pod´ıl v´ yher 24% 12% 24% 10% 46% 56% 25% 27% 18% 28% 23% 58% 34% 69% 34% 71% 62% 76% 45% 40% 21% 15% 12% 64% 26% 84% 12% 19% 27% 29% 39% 18% 40% 58% 20% 27% 46%
Poˇ cet proher 25 28 26 60 153 62 181 133 25 170 96 84 39 79 140 39 111 65 50 48 25 54 29 100 45 38 27 48 66 168 87 23 169 112 94 127 2826
Pod´ıl proher 74% 82% 76% 88% 45% 36% 67% 65% 74% 63% 71% 35% 57% 23% 59% 23% 33% 19% 49% 47% 74% 79% 85% 29% 66% 11% 79% 71% 65% 62% 51% 68% 50% 33% 69% 62% 46%
Poˇ cet rem´ız 1 2 0 1 29 13 23 16 3 25 9 17 6 26 18 10 18 16 6 13 2 4 1 23 5 15 3 7 8 24 17 5 35 30 15 22 468
Pod´ıl rem´ız 3% 6% 0% 1% 9% 8% 8% 8% 9% 9% 7% 7% 9% 8% 8% 6% 5% 5% 6% 13% 6% 6% 3% 7% 7% 4% 9% 10% 8% 9% 10% 15% 10% 9% 11% 11% 8%
Pr˚ um.poˇ c. g´ ol˚ u venku 27,118 24,118 24,294 25,471 26,918 28,482 25,493 25,804 26,882 25,934 25,603 29,437 25,000 29,488 28,353 31,165 29,200 30,559 27,392 28,275 26,000 22,382 25,647 29,988 24,794 32,800 26,529 25,588 26,922 27,007 26,424 25,824 26,024 29,924 24,574 25,294 26,964
Pr˚ um.poˇ c. g´ ol˚ u doma 27,059 25,529 25,588 27,588 29,412 29,447 27,507 27,392 27,412 27,051 26,868 31,437 25,735 31,571 29,462 32,541 31,929 34,018 28,980 30,725 28,118 24,235 26,706 31,865 26,706 34,182 28,294 26,235 27,275 28,801 28,353 26,118 27,994 30,865 27,603 27,216 28,551
Poˇ cet sez´ on 1 1 1 2 10 5 8 6 1 8 4 7 2 10 7 5 10 10 3 3 1 2 1 10 2 10 1 2 3 8 5 1 10 10 4 6
Pr˚ umˇ er. poˇrad´ı 16,000 18,000 16,000 18,000 8,800 7,200 14,750 14,333 17,000 13,250 15,500 6,571 12,000 4,300 11,429 4,000 5,900 2,900 10,000 9,333 18,000 17,500 18,000 5,300 15,500 1,700 18,000 16,000 14,000 12,625 10,600 17,000 10,400 6,500 16,250 13,833
Tabulka 1.2: Z´akladn´ı statistick´e zpracov´an´ı dat (nˇemeck´a liga)
5
Koˇsice Dv˚ ur Kr´ alov´ e nad Labem Allrisk Praha Hranice Brno Hustopeˇ ce Jiˇ c´ın Karvin´ a Dukla Praha Zubˇr´ı Lovosice Trnava Kopˇrivnice Bardejov Povaˇ zsk´ a Bystrica Louny Fr´ ydek-M´ıstek Pˇrerov Kostelec na Han´ e Bratislava Seˇ covce Preˇsov Bystˇrice pod Host´ ynem Hlohovec Napajedla Tˇreboˇ n Plzeˇ n Nov´ e Z´ amky CELKEM
T´ ym
Poˇ cet utk´ an´ı 86 22 58 224 124 48 168 252 252 252 168 30 168 26 86 30 252 66 56 86 86 134 80 30 22 168 168 86 3228
Poˇ cet v´ yher 43 3 31 95 17 10 79 192 175 155 101 15 52 3 56 6 111 20 21 24 15 102 19 5 3 49 72 46 1520
Pod´ıl v´ yher 50% 14% 53% 42% 14% 21% 47% 76% 69% 62% 60% 50% 31% 12% 65% 20% 44% 30% 38% 28% 17% 76% 24% 17% 14% 29% 43% 53% 47%
Poˇ cet proher 39 19 22 114 101 37 70 47 56 78 60 15 106 22 26 21 127 44 33 55 68 26 57 24 18 113 86 36 1520
Pod´ıl proher 45% 86% 38% 51% 81% 77% 42% 19% 22% 31% 36% 50% 63% 85% 30% 70% 50% 67% 59% 64% 79% 19% 71% 80% 82% 67% 51% 42% 47%
Poˇ cet rem´ız 4 0 5 15 6 1 19 13 21 19 7 0 10 1 4 3 14 2 2 7 3 6 4 1 1 6 10 4 188
Pod´ıl rem´ız 5% 0% 9% 7% 5% 2% 11% 5% 8% 8% 4% 0% 6% 4% 5% 10% 6% 3% 4% 8% 3% 4% 5% 3% 5% 4% 6% 5% 6%
Pr˚ um.poˇ c. g´ ol˚ u venku 26,395 22,636 23,655 26,304 23,903 24,875 23,869 29,119 27,690 26,857 26,929 25,733 24,560 20,385 25,465 24,200 27,183 26,485 26,857 23,977 22,163 30,433 24,375 20,667 20,091 24,333 25,393 26,116 25,023
Pr˚ um.poˇ c. g´ ol˚ u doma 28,977 23,364 27,207 29,027 25,387 26,042 27,429 32,262 29,730 31,532 28,952 30,467 26,464 24,385 31,558 28,667 29,651 28,788 29,857 27,116 25,302 35,328 25,900 22,533 24,000 25,310 27,702 29,814 27,955
Poˇ cet sez´ on 3 1 2 9 5 2 7 10 10 10 7 1 7 1 3 1 10 3 2 3 3 5 3 1 1 7 7 3
Pr˚ umˇ er. poˇrad´ı 7,667 12,000 6,500 7,625 11,750 11,500 6,167 2,444 3,222 4,333 4,500 9,000 9,167 14,000 4,000 13,000 7,111 10,000 10,000 10,667 12,667 2,000 10,667 15,000 11,000 9,167 7,833 7,000
Tabulka 1.3: Z´akladn´ı statistick´e zpracov´an´ı dat (ˇcesk´a liga)
6
Kapitola 2 Teoretick´ aˇ c´ ast k pouˇ zit´ ym test˚ um pro testov´ an´ı hypot´ ez 2.1
Testy normality dat
Vˇetˇsina bˇeˇzn´ ych statistick´ ych metod pˇredpokl´ad´a, ˇze data, kter´a jsou zpracov´av´ana, poch´az´ı ze z´akladn´ıho souboru s norm´aln´ım rozdˇelen´ım. V pˇr´ıpadˇe, ˇze nen´ı normalita potvrzena, je tˇreba zv´ yˇsen´e opatrnosti pˇri interpretaci v´ ysledk˚ u statistick´ ych test˚ u. U nˇekter´ ych test˚ u je tento pˇredpoklad test˚ u velmi d˚ uleˇzit´ y, u jin´ ych vˇsak m´ırn´e odchylky od normality ovlivn´ı z´avˇery statistick´ ych test˚ u jen nepatrnˇe. Na poruˇsen´ı normality m˚ uˇze upozornit napˇr´ıklad skuteˇcnost, ˇze medi´an je vzd´alen´ y od hodnot pr˚ umˇern´ ych. Rychlou pˇredstavu o normalitˇe dat mohou d´ale poskytnou grafick´e metody. Mezi z´akladn´ı grafick´e metody patˇr´ı vykreslen´ı histogram˚ u relativn´ıch ˇcetnost´ı, empirick´e distribuˇcn´ı funkce, q-q grafy, p-p grafy, box-ploty a dalˇs´ı. Existuje cel´a ˇrada test˚ u normality, kter´e se liˇs´ı principem otestov´an´ı normality. Vˇsechny testy normality jsou zaloˇzeny na nulov´e hypot´eze H0 : n´ahodn´ y v´ ybˇer poch´az´ı z norm´aln´ıho 2 rozdˇelen´ı N (µ, σ ) oproti alternativn´ı hypot´eze H1 : n´ahodn´ y v´ ybˇer poch´az´ı z jin´eho rozdˇelen´ı. Nˇekter´e testy vych´az´ı z porovn´av´an´ı koeficient˚ u ˇsikmosti a ˇspiˇcatosti (napˇr. Jarque-Bera test, Shapiro-Wilk test), jin´e pracuj´ı s funkc´ı hustoty (napˇr. χ2 test dobr´e shody) nebo s distribuˇcn´ı funkc´ı (napˇr. Kolmogorov-Smirnov test, Lilliefors test) [5]. V t´eto pr´aci byly z grafick´ ych metod vyuˇzity boxploty, histogramy relativn´ıch ˇcetnost´ı a empirick´e distribuˇcn´ı funkce a z test˚ u byly vyuˇzity Jarque-Bera test a Lilliefors test.
2.2
Line´ arn´ı regrese
Jedn´ım z moˇzn´ ych zp˚ usob˚ u testov´an´ı hypot´ez je test o parametrech line´arn´ıho regresn´ıho modelu. Regresn´ı anal´ yza n´am umoˇzn ˇuje zkoumat a testovat z´avislost vysvˇetlovan´e promˇenn´e (napˇr. poˇcet g´ol˚ u v jednotliv´ ych z´apasech) a vysvˇetluj´ıc´ı promˇenn´e (napˇr. kolo sezony). Uvaˇzuje n´asleduj´ıc´ı line´arn´ı regresn´ı model: yi = β0 + β1 xi + i
(i = 1, 2, 3, ..., n)
7
kde • −∞ < β0 , β1 < +∞ jsou nezn´am´e parametry modelu; • xi jsou pozorovan´e hodnoty vysvˇetluj´ıc´ı promˇenn´e; • yi jsou pozorovan´e hodnoty vysvˇetlovan´e promˇenn´e; • i jsou nezn´ame n´ahodn´e odchylky. Obvykle se pracuje s n´asleduj´ıc´ımi pˇredpoklady na n´ahodn´e odchylky i [2, str. 40] (P1) stˇ redn´ı hodnota odchylek je nulov´ a, E(i ) = 0 pro vˇ sechna i = 1, 2, ..., n; (P2) rozptyl odchylek je shodn´ y, D(i ) = σ 2 pro vˇ sechna i = 1, 2, ..., n; (P3) veliˇ ciny i jsou navz´ ajem nez´ avisl´ e; pˇr´ıpadnˇe (P4) sloˇ zky i jsou nez´ avisl´ e n´ ahodn´ e veliˇ ciny a maj´ı norm´ aln´ı rozdˇ elen´ı, . Pˇredpoklad (P4) zahrnuje vˇsechny pˇredpoklady (P1)-(P3). Jak je uvedeno napˇr. v [7, str. 97], pokud jsou splnˇeny v´ yˇse uveden´e pˇredpoklady (P1)-(P4), pak odhady parametr˚ u β0 , β1 z´ıskan´e metodou nejmenˇs´ıch ˇctverc˚ u maj´ı norm´aln´ı rozdˇelen´ı a lze testovat jejich nenulovost. Pro ovˇeˇren´ı kladn´e line´arn´ı z´avislosti mezi vysvˇetluj´ıc´ı a vysvˇetlovanou promˇennou lze vych´azet z jednostrann´e hypot´ezy: [2, str. 60] H0 : β1 = β10 a H1 : β1 > β10 . Pˇri platnosti pˇredpoklad˚ u uveden´ ych v´ yˇse pouˇzijeme testovac´ı statistiku: t1 =
b1 − β10 SE(b1 )
kde • b1 je odhad parametru β1 z´ıskan´ y metodou nejmenˇs´ıch ˇctverc˚ u; • β10 je hodnota testovan´eho parametru, v naˇsem pˇr´ıpadˇe 0; • SE(b1 ) je odhad smˇerodatn´e odchylky b1 definov´an vztahem: s s2 SE(b1 ) = Pn ; 2 i=1 (xi − x) Pn
− ybi )2 je odhad parametru σ 2 . n−2 Hypot´ezu H0 : β1 = 0 zam´ıt´ame na hladinˇe v´ yznamnosti α pˇri jednostrann´e alternativˇe β1 > 0, jestliˇze pro v´ yˇse uvedenou statistiku t1 po dosazen´ı β10 = 0 plat´ı: t1 > t1−α (n − 2), kde t1−α (n − 2) je kvantil studentova rozdˇelen´ı se stupni volnosti (n − 2). Zam´ıtneme-li hypot´ezu H0 na zvolen´e hladinˇe v´ yznamnosti, ˇr´ık´ame, ˇze koeficient b1 (odhad hodnoty β1 ) se v´ yznamnˇe liˇs´ı od nuly a je kladn´ y. 2
• s =
i=1 (yi
8
2.3
Kontingenˇ cn´ı tabulky a χ2 - test nez´ avislosti a homogenity
Pro testov´an´ı nez´avislosti dvou n´ahodn´ ych veliˇcin se ˇcasto pouˇz´ıvaj´ı testy nez´avislosti zaloˇzen´e na dvourozmˇern´ ych kontingenˇcn´ıch tabulk´ach. Nulov´a hypot´eza H0 je v tomto pˇr´ıpadˇe formulov´ana takto: n´ahodn´a veliˇcina X a n´ahodn´a veliˇcina Y jsou nez´avisl´e. Pˇredpokladem pro vytvoˇren´ı kontingenˇcn´ıch tabulek je skuteˇcnost, ˇze n´ahodn´a veliˇcina X nab´ yv´a koneˇcnˇe mnoha hodnot (napˇr. v´ yhry, prohry, rem´ızy) a n´ahodn´a veliˇcina Y nab´ yv´a tak´e koneˇcnˇe mnoha hodnot (napˇr. 1, 0, −1). V i - t´em ˇra´dku a j - sloupci tabulky je poˇcet realizac´ı, ve kter´ ych ˇ n´ahodn´a veliˇcina X nab´ yv´a hodnoty i a n´ahodn´a veliˇcina Y nab´ yv´a hodnoty j. R´adkov´e souˇcty jsou oznaˇceny ni· a sloupcov´e n·j . P P (nij − oij )2 ni· · n·j . Testov´e krit´erium m´a tvar: , Oˇcek´avan´e ˇcetnosti jsou oznaˇceny oij = n oij kde se sˇc´ıt´a pˇres vˇsechny prvky kontingenˇcn´ı tabulky. Pˇri platnosti hypot´ezy H0 se testov´e krit´erium asymptoticky bl´ıˇz´ı rozdˇelen´ı χ2 se stupni volnosti ν = (r − 1)(c − 1), kde r je poˇcet ˇr´adk˚ u kontingenˇcn´ı tabulky a c je poˇcet sloupc˚ u kontingenˇcn´ı tabulky. Obvykle tedy poˇzadujeme, aby oˇcek´avan´e ˇcetnosti oij ≥ 5. Pokud hodnota testov´eho krit´eria je vˇetˇs´ı neˇz χ2ν=(r−1)(c−1) (1 − α), zam´ıt´ame hypot´ezu o nez´avislosti veliˇcin X a Y na hladinˇe v´ yznamnosti α. Nˇekdy se m˚ uˇze st´at, ˇze ˇr´adkov´e ˇcetnosti ni· jsou pˇredem stanoveny. Pak i - t´ y ˇr´adek tabulky m´a multinomick´e rozdˇelen´ı s parametry ni· , qi1 , . . . , qic , kde qi1 , . . . , qic jsou nˇejak´e pravdˇepodobnosti splˇ nuj´ıc´ı podm´ınku qi1 +, · · · + qic = 1. Vˇetˇsinou je pak tˇreba testovat hypot´ezu homogenity, kter´a ˇr´ık´a, ˇze pravdˇepodobnosti qi1 , . . . , qic nez´avisej´ı na ˇra´dkov´em indexu i, takˇze vˇsechny ˇr´adky matice (qij ) jsou stejn´e. Jak je uvedeno v [1, str. 282] lze i v tomto pˇr´ıpadˇe poˇc´ıtat testov´e kriterium χ2 podle stejn´eho vzorce jako u testu nez´avislosti. Hypot´eza homogenity se zam´ıt´a v pˇr´ıpadˇe, ˇze χ2 ≥ χ2ν=(r−1)(c−1) (1 − α).
9
Kapitola 3 Teoretick´ aˇ c´ ast k ranking˚ um Rankingov´e modely vych´az´ı z potˇreby urˇcit relativn´ı s´ılu sledovan´eho objektu vzhledem k ostatn´ım objekt˚ um. Tyto modely maj´ı ˇsirok´e vyuˇzit´ı, v praxi se s tˇemito modely setk´av´ame napˇr. pˇri urˇcov´an´ı s´ıly sportovn´ıch t´ ym˚ u, pˇri urˇcov´an´ı poˇrad´ı internetov´ ych odkaz˚ u, ve kter´em se kaˇzd´emu uˇzivateli objev´ı po zad´an´ı kl´ıˇcov´ ych slov do webov´ ych vyhled´avaˇc˚ u a podobnˇe. V r´amci t´eto pr´ace se rankingov´e modely vyuˇzij´ı pro urˇcen´ı predikov´an´ı v´ ysledk˚ u z´apas˚ u za vyuˇzit´ı urˇcen´e s´ıly jednotliv´ ych t´ ym˚ u. Pokud je k dispozici informace o aktu´aln´ı s´ıle obou t´ ymu, kter´e spolu sehraj´ı konkr´etn´ı z´apas, je moˇzno predikovat v´ ysledek tohoto z´apasu. Pro urˇcen´ı s´ıly t´ ym˚ u je nutno vych´azet z v´ ysledk˚ u vˇsech pˇredchoz´ıch z´apas˚ u. Pokud by se urˇcovala s´ıla jen ze z´apas˚ u, kter´e odehr´aly dva konkr´etn´ı t´ ymy proti sobˇe, byla by tato s´ıla znaˇcnˇe nepˇresn´a, nebot’ v h´azen´e hraj´ı proti sobˇe konkr´etn´ı t´ ymy pouze dvakr´at za sez´onu.
3.1
Colley Matrix Model
Tento model vytvoˇril Wesley Colley v roce 2002 a poprv´e byl pouˇzit pro urˇcen´ı s´ıly t´ ym˚ u americk´eho fotbalu [3, str. 15]. V modelu jsou vyuˇzity informace o poˇctu v´ yher a poˇctu proher t´ ymu. Pˇredpokl´ad´a se, ˇze rozlosov´an´ı t´ ym˚ u do soutˇeˇze je n´ahodn´e. Jako ni je oznaˇcen poˇcet z´apas˚ u odehran´ ych i - t´ ym t´ ymem a wi je poˇcet vyhran´ ych z´apas˚ u tohoto t´ ymu. Potom pravdˇewi + 1 . Pokud neexistuj´ı ˇza´dn´e podobnost, ˇze t´ ym i v ni + 1 z´apase vyhraje je urˇcena pod´ılem ni + 2 wi + 1 dalˇs´ı z´avislosti mezi wi a ni je ranking dan´eho t´ ymu urˇcen pr´avˇe t´ımto pod´ılem jako ri = . ni + 2 wi + ni − li wi − li ni Tv˚ urce modelu upravil wi do tvaru wi = = + , kde li je poˇcet proher 2 2 2 ni dan´eho t´ ymu a d´ale pˇredpokl´adal, ˇze zahrnuje s´ıly protihraj´ıc´ıch t´ ym˚ u. Pro zjednoduˇsen´ı 2 lze pˇredpokl´adat, ˇze tato hodnota je pro vˇsechny t´ ymy na poˇc´atku soutˇeˇzn´ıho roˇcn´ıku stejn´a, Pni 1 P i (i) ni ni tedy = j=1 a v pr˚ ubˇehu sez´ony se mˇen´ı podle aktu´aln´ıho v´ yvoje, tedy = nj=1 rj , 2 2 2 wi + 1 (i) kde rj je s´ıla j - t´eho protihraj´ıc´ıcho t´ ymu. Po dosazen´ı tˇechto vztah˚ u do rovnice ri = ni + 2 se z´ısk´a fin´aln´ı vztah pro i - t´ y t´ ym (ni + 2)ri −
ni X
(i)
rj = 1 +
j=1
10
(wi − li ) . 2
Uveden´ y vztah plat´ı pro vˇsechny t´ ymy, proto lze z´ıskat soustavu n rovnic, kde n je poˇcet t´ ym˚ u. Maticovˇe zaps´ano C n×n r = b, kde Cij =
−nji 2 + ni
pro i 6= j, pro i = j
a
(wi − li ) , 2 kde nji je poˇcet z´apas˚ u mezi i - t´ ym a j - t´ ym t´ ymem. Matici Cij naz´ yv´ame Colleyho matic´ı. Lze uk´azat, ˇze vektor r, kter´ y je ˇreˇsen´ım rovnice Cr = b, vˇzdy existuje, je urˇcen jednoznaˇcnˇe a je nez´aporn´ y [3]. Pˇri v´ ypoˇctu aktu´aln´ıho rankingu t´ ymu dle tohoto modelu se tedy postupuje v n´asleduj´ıc´ıch kroc´ıch: bi = 1 +
1. Sestaven´ı Colleyho matice C Cij =
−nji 2 + ni
pro i 6= j, . pro i = j
2. Sestaven´ı vektoru b bi = 1 +
(wi − li ) . 2
3. Vyˇreˇsen´ı rovnice Cr = b , kde vektor r obsahuje hodnotu rankingov´e s´ıly kaˇzd´eho t´ ymu.
3.2
Keener Ranking Model
Tento model vytvoˇril James P. Keener v roce 1993 a poprv´e byl pouˇzit pro odvozen´ı ranking˚ u t´ ym˚ u americk´eho fotbalu. Keener Ranking Model je zobecnˇen´ım tzv. pˇr´ım´e rankingov´e metody, kter´a vych´az´ı z n´asleduj´ıc´ıch pravidel. Necht’ rj jsou kladn´a ˇc´ısla ranking˚ u vyjadˇruj´ıc´ı s´ılu j t´eho t´ ymu, pak sk´ore si definovan´e vztahem n 1 X si = aij rj , ni j=1
kde aij jsou nez´aporn´a ˇc´ısla z´avisej´ıc´ı na s´ıle i - t´eho a j - t´eho t´ ymu (napˇr. poˇcet vstˇrelen´ ych g´ol˚ u), ni je poˇcet z´apas˚ u sehran´ y i - t´ ym t´ ymem a n je poˇcet t´ ym˚ u v soutˇeˇzi, vyjadˇruje aktu´aln´ı s´ılu i - t´eho t´ ymu. Matice A s prvky aij /ni se naz´ yv´a preferenˇcn´ı matice a lze pˇredpokl´adat, ˇze sk´ore si je u ´mˇern´e ranking˚ um t´ ymu, tedy Ar = λr, neboli r je vlastn´ım vektorem matice A. V pˇredchoz´ım jednoduˇsˇs´ım Colley Matrix Modelu byla br´ana v potaz jen v´ yhra a prohra t´ ymu a nez´aleˇzelo na poˇctu vstˇrelen´ ych a obdrˇzen´ ych g´ol˚ u. Keener Ranking Model je zaloˇzen na speci´aln´ım tvaru preferenˇcn´ı matice, kter´ y zohledˇ nuje poˇcet vstˇrelen´ ych a obdrˇzen´ ych g´ol˚ u. 11
Pokud Sij oznaˇcuje poˇcet g´ol˚ u, kter´e i - t´ y t´ ym vstˇrelil j - t´emu t´ ymu, pak prvek preferenˇcn´ı Sij matice Keener Ranking Modelu vych´az´ı z pomˇeru . Sij + Sji Model je zaloˇzen na Keenerovo matici Sij + 1 h pokud t´ ym Ti sehr´al jiˇz sehr´al z´apas s t´ ymem Tj , Kij = Sij + Sji + 2 0 jinak 1 1 1 p kde h je vyhlazovac´ı funkce“ ve tvaru h(x) = + sgn x − |2x − 1|. ” 2 2 2 Obr´azek 3.1: Vyhlazovac´ı funkce h(x)
Na Obr´azku 3.1 je uveden pr˚ ubˇeh vyhlazpovac´ı funkce h(x), kter´ y ukazuje, ˇze pouˇzit´ı t´eto funkce v modelu pˇridˇel´ı vˇetˇs´ı v´ahu tˇesn´ ym v´ yhr´am neˇz je v´aha, kter´a by odpov´ıdala pouˇzit´ı pomˇeru bez vyhlazovac´ı funkce. V ˇcl´anku [4] je dok´az´ano, ˇze vlastn´ı vektor r pˇr´ısluˇs´ıc´ı nejvˇetˇs´ımu vlastn´ımu ˇc´ıslu matice K je vektor hledan´ ych ranking˚ u.
3.3
Offense-Defense Model (ODM)
Model ODM vyuˇz´ıv´a dvou rankingov´ ych vektor˚ u, jednoho vytvoˇren´eho jako ranking obrany t´ ymu a jeden jako ranking u ´toku t´ ymu. [3, str. 25] Pro souhrnn´ y ranking t´ ymu je br´an pod´ıl tˇechto dvou ranking˚ u. Tento model vych´az´ı z matice sk´ore S, jej´ıchˇz prvky jsou tvoˇreny Sij , kter´e tak´e vyjadˇruj´ı poˇcet g´ol˚ u, kter´e t´ ym Ti vstˇrelil t´ ymu Tj . Matice S je upravena o malou chybu 0 < < 1 takto Sij + pokud t´ ym Ti jiˇz sehr´al z´apas s t´ ymem Tj Pij = . jinak 12
Rankingy obrany a u ´toku t´ ymu jsou z´ısk´any iteraˇcn´ım procesem podle vztah; d(0) = [1, 1, . . . , 1] "
1
o(k) = P T ·
1
(k−1)
d1 " d(k) = P ·
1 (k)
o1
,
,...,
d2
1 (k)
o2
(k−1)
1
,...,
#
(k−1)
dn 1
#
(k)
on
Tento iteraˇcn´ı proces je ukonˇcen v okamˇziku, kdy rankingov´e vektory d(k) a o(k) se jiˇz nemˇen´ı. V´ ysledky rankingov´ y vektor t´ ymu je z´ısk´an jako pod´ıl u ´toˇcn´eho a obrann´eho rankingu, tedy o1 o2 on r= . , ,..., d1 d2 dn Pˇri praktick´ ych v´ ypoˇctech se vyuˇz´ıvaj´ı n´asleduj´ıc´ı nastaven´ı = 0, 00001 a zastavovac´ı podm´ınka iterace ||d(k) − d(k−1) || < 0, 01 [3, str. 59].
3.4
Porovn´ an´ı hodnot ranking˚ u s re´ aln´ ymi v´ ysledky z´ apas˚ u
Jednou z moˇznost´ı jak vyuˇz´ıt hodnoty ranking˚ u jednotliv´ ych t´ ym˚ u je odhadov´an´ı v´ ysledk˚ u z´apas˚ u. Vzhledem k tomu, ˇze jednotliv´e rankingy nejsou normov´any, je tˇreba je pˇrev´est na pravdˇepodobnosti. Pˇredpokl´ad´a se, ˇze jsou k dispozici hodnoty ranking˚ u ri pro t´ ym i a hodnoty ranking˚ u rj pro t´ ym j, pak pravdˇepodobnost πij , ˇze t´ ym i zv´ıtˇez´ı nad t´ ymem j je d´ana vztahem ri πij = . ri + rj V t´eto pr´aci bude zvolen n´asleduj´ıc´ı postup srovn´av´an´ı ranking˚ u s re´aln´ ymi v´ ysledky z´apas˚ u: 1. na z´akladˇe ranking˚ u z´ıskan´ ych podle jednotliv´ ych model˚ u budou urˇceny pravdˇepodobnosti πij ; 2. pokud πij > 0.5 je predikov´ano v´ıtˇezstv´ı i - t´eho t´ ymu; 3. pokud πij < 0.5 je predikov´ano v´ıtˇezstv´ı j - t´eho t´ ymu; 4. rem´ızov´e v´ ysledky z´apas˚ u budou predikov´any pouze v pˇr´ıpadˇe kdy πij = 0.5, protoˇze tato situace je velmi neobvykl´a, je predikovan´ ych rem´ız velmi m´alo; 5. predikovan´e v´ ysledky z´apas˚ u budou porovn´any s re´aln´ ymi v´ ysledky z´apas˚ u. V dalˇs´ı f´azi bude prozkoum´ano, zda m´a na predikov´an´ı v´ ysledk˚ u z´apas˚ u vliv hodnota 0.5 stanoven´a jako hraniˇcn´ı bod.
13
Kapitola 4 Testov´ an´ı hypot´ ez na re´ aln´ ych datech 4.1 4.1.1
Testy normality vstˇ relen´ ych g´ ol˚ u Motivace k vytvoˇ ren´ı hypot´ ezy
Jak je uvedeno v teoretick´e ˇc´asti t´eto pr´ace, je pro celou ˇradu z´akladn´ıch statistick´ ych metod a postup˚ u potˇreba pˇredpoklad, aby data, na kter´ ych se tyto metody vyuˇz´ıvaj´ı, poch´azela z norm´aln´ıho rozdˇelen´ı. H´azen´a patˇr´ı mezi kolektivn´ı sporty, ve kter´ ych pad´a hodnˇe g´ol˚ u, lze pˇredpokl´adat, ˇze normalita bude splnˇena ˇcastˇeji neˇz u sport˚ u, ve kter´ ych pad´a m´enˇe g´ol˚ u jako napˇr´ıklad ve fotbale nebo hokeji.
4.1.2
V´ ybˇ er testu pro testov´ an´ı hypot´ ezy
Z cel´a ˇrady statistick´ ych metod a postup˚ u, kter´e slouˇz´ı k testov´an´ı normality, byly vybr´any dva testy (Jarque-Bera test a Lilliefors test), kaˇzd´ y zaloˇzen´ y na jin´em principu. Jarque-Bera test vyuˇz´ıv´a k testov´an´ı normality koeficienty ˇspiˇcatosti, Lilliefors test je zaloˇzen na porovn´av´an´ı distribuˇcn´ıch funkc´ı.
4.1.3
Formulace hypot´ ezy o normalitˇ e dat
Pˇri testov´an´ı t´eto hypot´ezy bylo vych´azeno ze z´akladn´ı hypot´ezy H0 : data poch´ az´ı z norm´aln´ıho rozdˇelen´ı oproti alternativn´ı hypot´eze H1 : data poch´az´ı z jin´eho rozdˇelen´ı. 4.1.3.1
V´ ysledky testu
Testy normality byly prov´adˇeny samostatnˇe pro g´oly dom´ac´ıch, g´oly host˚ u a tak´e dohromady pro vˇsechny g´oly, kter´e v z´apasech padly. Vykreslen´e histogramy relativn´ıch ˇcetnost´ı a distribuˇcn´ı funkce uveden´e na Obr´azc´ıch 4.1, 4.2, 4.3 naznaˇcuj´ı symetriˇcnost dat, ale je moˇzn´e, ˇze testy zam´ıtnou domnˇenku o normalitˇe dat. Testov´ana byla normalita jak souhrnnˇe pro vˇsechna data, tak pro jednotliv´a soutˇeˇzn´ı kola v r´amci vˇsech sez´on. Vˇsechny testy byly provedeny na hladinˇe v´ yznamnosti α = 5%. V´ ysledky test˚ u normality dat jsou uvedeny v Tabulk´ach 4.1, 4.2, 4.3, 4.4. V´ ysledky uveden´e v Tabulk´ach 4.1, 4.2, 4.3, 4.4 potvrzuj´ı domnˇenku, ˇze test zaloˇzen´ y na koeficientech ˇsikmosti a ˇspiˇcatosti (Jarque-Bera test) zam´ıtl normalitu v menˇs´ım poˇctu pˇr´ıpad˚ u 14
Obr´azek 4.1: Histogram a empirick´a distribuˇcn´ı funkce-g´oly dom´ac´ı
Obr´azek 4.2: Histogram a empirick´a distribuˇcn´ı funkce-g´oly host´e
Obr´azek 4.3: Histogram a empirick´a distribuˇcn´ı funkce-g´oly celkem
neˇz test zaloˇzen´ y na distribuˇcn´ı funkci (Lilliefors test). P-hodnoty test˚ u naznaˇcuj´ı, ˇze poruˇsen´ı normality nen´ı zas tak z´avaˇzn´e, v mnoha pˇr´ıpadech by na hladinˇe v´ yznamnosti α = 1% nebyla normalita zam´ıtnuta.
15
Tabulka 4.1: V´ ysledky Jarque-Bera testu pro jednotliv´e sez´ony sez´ony z´apasy g´oly dom´ac´ı g´oly host´e g´oly celkem p hypot´eza p hypot´eza p hypot´eza 2011-2012 306 0, 221 H0 0, 500 H0 0, 396 H0 2010-2011 305 0, 032 H1 0, 203 H1 0, 171 H0 2009-2010 306 0, 070 H0 0, 053 H1 0, 500 H0 2008-2009 306 0, 073 H0 0, 500 H1 0, 089 H0 2007-2008 306 0, 070 H0 0, 010 H1 0, 006 H1 2006-2007 306 0, 500 H0 0, 019 H1 0, 500 H0 2005-2006 306 0, 001 H1 0, 035 H1 0, 017 H1 2004-2005 306 0, 500 H0 0, 002 H1 0, 092 H0 2003-2004 306 0, 010 H1 0, 001 H1 0, 074 H0 2002-2003 306 0, 048 H1 0, 073 H1 0, 126 H0
Tabulka 4.2: V´ ysledky Lilliefors testu pro jednotliv´e sez´ony z´apasy g´oly dom´ac´ı g´oly host´e g´oly celkem p hypot´eza p hypot´eza p hypot´eza 2011-2012 306 0, 001 H1 0, 001 H1 0, 048 H1 2010-2011 305 0, 001 H1 0, 001 H1 0, 011 H1 2009-2010 306 0, 001 H1 0, 001 H1 0, 017 H1 2008-2009 306 0, 001 H1 0, 001 H1 0, 009 H1 2007-2008 306 0, 001 H1 0, 001 H1 0, 008 H1 2006-2007 306 0, 011 H1 0, 001 H1 0, 111 H0 2005-2006 306 0, 001 H1 0, 001 H1 0, 003 H1 2004-2005 306 0, 025 H1 0, 001 H1 0, 005 H1 2003-2004 306 0, 001 H1 0, 001 H1 0, 001 H1 2002-2003 306 0, 001 H1 0, 001 H1 0, 001 H1 sez´ony
16
Tabulka 4.3: V´ ysledky Jarque-Bera testu pro jednotliv´a kola kola z´apasy g´oly dom´ac´ı g´oly host´e g´oly celkem p hypot´eza p hypot´eza p hypot´eza 1 90 0, 224 H0 0, 301 H0 0, 326 H0 2 90 0, 133 H0 0, 106 H0 0, 500 H0 3 90 0, 412 H0 0, 500 H0 0, 207 H0 4 90 0, 151 H0 0, 011 H1 0, 057 H0 5 90 0, 235 H0 0, 500 H0 0, 453 H0 6 90 0, 250 H0 0, 027 H1 0, 500 H0 7 90 0, 500 H0 0, 209 H0 0, 459 H0 8 90 0, 500 H0 0, 094 H0 0, 120 H0 9 90 0, 500 H0 0, 500 H0 0, 186 H0 10 90 0, 057 H0 0, 032 H1 0, 500 H0 11 90 0, 500 H0 0, 278 H0 0, 500 H0 12 90 0, 358 H0 0, 248 H0 0, 500 H0 13 90 0, 135 H0 0, 001 H1 0, 053 H0 14 90 0, 172 H0 0, 236 H0 0, 059 H0 15 90 0, 103 H0 0, 221 H0 0, 403 H0 16 90 0, 001 H1 0, 075 H0 0, 001 H1 17 90 0, 444 H0 0, 370 H0 0, 034 H1 18 89 0, 100 H0 0, 384 H0 0, 259 H0 19 90 0, 500 H0 0, 500 H0 0, 424 H0 20 90 0, 205 H0 0, 500 H0 0, 500 H0 21 90 0, 126 H0 0, 046 H1 0, 415 H0 22 90 0, 056 H0 0, 002 H1 0, 158 H0 23 90 0, 369 H0 0, 500 H0 0, 208 H0 24 90 0, 500 H0 0, 500 H0 0, 500 H0 25 90 0, 182 H0 0, 017 H1 0, 500 H0 26 90 0, 500 H0 0, 500 H0 0, 500 H0 27 90 0, 298 H0 0, 295 H0 0, 500 H0 28 90 0, 001 H1 0, 500 H0 0, 132 H0 29 90 0, 126 H0 0, 149 H0 0, 500 H0 30 90 0, 500 H0 0, 222 H0 0, 500 H0 31 90 0, 466 H0 0, 010 H1 0, 134 H0 32 90 0, 500 H0 0, 053 H0 0, 382 H0 33 90 0, 225 H0 0, 094 H0 0, 500 H0 34 89 0, 290 H0 0, 500 H0 0, 477 H0
17
Tabulka 4.4: V´ ysledky Lilliefors testu pro jednotliv´a kola kola z´apasy g´oly dom´ac´ı g´oly host´e g´oly celkem p hypot´eza p hypot´eza p hypot´eza 1 90 0, 102 H0 0, 052 H0 0, 500 H0 2 90 0, 001 H1 0, 005 H1 0, 083 H0 3 90 0, 455 H0 0, 172 H0 0, 257 H0 4 90 0, 295 H0 0, 001 H1 0, 009 H1 5 90 0, 026 H1 0, 294 H0 0, 101 H0 6 90 0, 062 H0 0, 045 H1 0, 165 H0 7 90 0, 500 H0 0, 003 H1 0, 419 H0 8 90 0, 184 H0 0, 002 H1 0, 007 H1 9 90 0, 500 H0 0, 168 H0 0, 086 H0 10 90 0, 019 H1 0, 012 H1 0, 500 H0 11 90 0, 036 H1 0, 011 H1 0, 350 H0 12 90 0, 094 H0 0, 032 H1 0, 500 H0 13 90 0, 039 H1 0, 034 H1 0, 459 H0 14 90 0, 006 H1 0, 062 H0 0, 212 H0 15 90 0, 047 H1 0, 076 H0 0, 148 H0 16 90 0, 046 H1 0, 001 H1 0, 010 H1 17 90 0, 042 H1 0, 010 H1 0, 285 H0 18 89 0, 044 H1 0, 064 H0 0, 116 H0 19 90 0, 040 H1 0, 056 H0 0, 024 H1 20 90 0, 013 H1 0, 045 H1 0, 175 H0 21 90 0, 058 H0 0, 013 H1 0, 440 H0 22 90 0, 009 H1 0, 001 H1 0, 156 H0 23 90 0, 067 H0 0, 366 H0 0, 272 H0 24 90 0, 027 H1 0, 263 H0 0, 185 H0 25 90 0, 026 H1 0, 001 H1 0, 500 H0 26 90 0, 323 H0 0, 404 H0 0, 105 H0 27 90 0, 078 H0 0, 308 H0 0, 132 H0 28 90 0, 001 H1 0, 302 H0 0, 078 H0 29 90 0, 020 H1 0, 001 H1 0, 500 H0 30 90 0, 024 H1 0, 096 H0 0, 465 H0 31 90 0, 199 H0 0, 028 H1 0, 235 H0 32 90 0, 006 H1 0, 021 H1 0, 259 H0 33 90 0, 309 H0 0, 021 H1 0, 221 H0 34 89 0, 149 H0 0, 012 H1 0, 475 H0
18
4.2
Line´ arn´ı z´ avislost poˇ ctu g´ ol˚ u a poˇ ctu kol
4.2.1
Motivace k vytvoˇ ren´ı hypot´ ezy
H´azen´a je ve svˇetˇe ch´ap´ana jako jeden z nejrychlejˇs´ıch a nejdynamiˇctˇejˇs´ıch sport˚ u. V h´azenk´aˇrsk´ ych z´apasech pad´a hodnˇe g´ol˚ u a ˇcasto se mˇen´ı sk´ore. Byla sestavena hypot´eza, zda je pravidlem, ˇze v jednotliv´ ych roˇcn´ıc´ıch roste poˇcet g´ol˚ u s r˚ ustem poˇctu kol. Tato hypot´eza je zaloˇzena na pˇredpokladu, ˇze na zaˇca´tku soutˇeˇzn´ıho roˇcn´ıku jsou t´ ymy pˇripraveny velmi kvalitnˇe na sez´onu, maj´ı dostatek hr´aˇc˚ u, t´emˇeˇr ˇz´adn´ı hr´aˇci nejsou zranˇeni a vˇsechny t´ ymy maj´ı velkou motivaci vyhr´at utk´an´ı. Ovˇsem s pˇrib´ yvaj´ıc´ım poˇctem kol roste poˇcet zranˇen´ ych hr´aˇc˚ u a z´apasy se st´avaj´ı m´enˇe vyrovnan´ ymi. Tak´e se postupnˇe zaˇc´ın´a r´ ysovat fin´aln´ı poˇrad´ı t´ ym˚ u, a proto jak se lidovˇe ˇr´ık´a, v nˇekter´ ych z´apasech na konci sez´ony jiˇz nejde t´emˇeˇr o nic“. ”
4.2.2
V´ ybˇ er testu pro testov´ an´ı hypot´ ezy
Statistick´e ovˇeˇren´ı pravdivosti t´eto hypot´ezy bylo formulov´ano na z´akladˇe pˇredpokladu line´arn´ı z´avislosti poˇctu g´ol˚ u v jednotliv´ ych kolech a poˇctu odehran´ ych kol. Je uvaˇzov´an n´asleduj´ıc´ı line´arn´ı regresn´ı model: yi = β0 + β1 xi + i
(i = 1, 2, 3, ..., n)
kde • −∞ < β0 , β1 < +∞ jsou nezn´am´e parametry modelu; • xi vyjadˇruje kolo, ve kter´em byl z´apas sehr´an; • yi je poˇcet vˇsech g´ol˚ u v z´apase v dan´em kole; • i jsou nezn´ame n´ahodn´e odchylky.
4.2.3
Pˇ redpoklady modelu a jejich ovˇ eˇ ren´ı
Jak je uvedeno v Kapitole 2.2 v regresn´ıch modelech se pracuje s nˇekolika pˇredpoklady, kter´e byly v r´amci regresn´ı diagnostiky ovˇeˇreny [8]. Regresn´ı diagnostika byla provedena pro studentizovan´a rezidua. (P1) stˇ redn´ı hodnota odchylek je nulov´ a, E(i ) = 0 pro vˇ sechna i = 1, 2, ..., n; Nulovost stˇredn´ı hodnoty byla otestov´ana pomoc´ı jednov´ ybˇerov´eho testu stˇredn´ı hodnoty 2 pˇri nezn´am´em parametru σ (t-test hypot´ezy H0 : µ = 0 s alternativn´ı hypot´ezou H1 : µ 6= 0) [7, str. 55] (P2) rozptyl odchylek je shodn´ y, D(i ) = σ 2 pro vˇ sechna i = 1, 2, ..., n; Testy heteroskedasticity zamˇeˇren´e na dodrˇzen´ı pˇredpoklad˚ u konstantnosti rozptylu σ 2 (grafick´a anal´ yza rozptyl˚ u rezidu´ı, Goldfeld-Quandt˚ uv test). Zachycen´e boxploty pro jednotliv´a kola na Obr´azku 4.4 nesignalizuj´ı ˇza´dn´a silnˇe heteroskedastick´a data, v ˇza´dn´em z kol ve sledovan´em obdob´ı nen´ı variabilita v´ yznamnˇe vˇetˇs´ı. Homoskedasticita byla d´ale ovˇeˇrena Goldfeld-Quandtovo testem. [7, str. 109] 19
Tabulka 4.5: V´ ysledky testu o nulovosti stˇredn´ıch hodnot odchylek testov´a statistika kritick´ y obor p-hodnota pˇrijat´a hypot´eza 1.854 · 10−4 (−∞, −1, 961) ∪ (1, 961, ∞) 0, 999 H0
Obr´azek 4.4: Boxplot graf pro jednotliv´a kola
Tabulka 4.6: V´ ysledky testu o shodnosti rozptyl˚ u odchylek rozptyl v 1.-10. kole 49, 827 rozptyl v 25.-34. kole 50, 658 testovac´ı statistika F 0, 984 obor kritick´ ych hodnot (0, 863; 1, 121) p-hodnota testu 0, 804
V´ ysledky testu v Tabulce 4.6 potvrzuj´ı shodnost rozptyl˚ u v poˇctu vstˇrelen´ ych g´ol˚ u na zaˇc´atku sez´ony (prvn´ıch 10 kol) a na konci sez´ony (posledn´ıch 10 kol). (P3) veliˇ ciny i jsou nez´ avisl´ e; Tento pˇredpoklad nebyl statisticky testov´an, ale nez´avislost jednotliv´ ych mˇeˇren´ı je pˇredpokl´ad´ana z charakteru dat. (P4) sloˇ zky i maj´ı norm´ aln´ı rozdˇ elen´ı i ∼ N (0, σ 2 ). Ovˇeˇren´ı testu normality odchylek bylo ovˇeˇreno pomoc´ı Jarque-Bera testu a Lillieforsova testu [2, str. 57] a v r´amci standardnˇe pouˇz´ıvan´ ych postup˚ u regresn´ı diagnostiky byly testy provedeny se studentizovan´ ymi rezidui. V´ ysledky obou test˚ u jsou shrnuty v Tabulce 4.7.
Z Tabulky 4.7 je vidˇet, ˇze v´ ysledky obou test˚ u zam´ıtaj´ı normalitu odchylek dat. Grafick´a prezentace dat, kde na Obr´azku 4.5 je vykreslen´ y histogram relativn´ıch ˇcetnost´ı odchylek 20
Tabulka 4.7: V´ ysledky test˚ u normality dat testov´a statistika kritick´ y obor p-hodnota pˇrijat´a hypot´eza JB test 20, 962 (5, 971; ∞) 1 · 10−3 H1 −3 Lillenfors test 0, 023 (0, 016; ∞) 1 · 10 H1 dat a p-p graf, vˇsak naznaˇcuje, ˇze odchylky dat maj´ı rozdˇelen´ı velmi bl´ızk´e rozdˇelen´ı norm´aln´ımu. Vzhledem k velk´emu rozsahu dat je moˇzno pˇredpokl´adat asymptotickou normalitu odhad˚ u metodou nejmenˇs´ıch ˇctverc˚ u a d´ale pracovat i bez splnˇen´ı tohoto explicitn´ıho pˇredpokladu [2, str. 53]. Obr´azek 4.5: Histogram relativn´ıch ˇcetnost´ı odchylek a p-p graf
21
4.2.4
Formulace hypot´ ezy o kladnosti smˇ ernicov´ eho parametru
Pro ovˇeˇren´ı kladn´e line´arn´ı z´avislosti mezi kolem v sez´onˇe a poˇctem g´ol˚ u se vych´az´ı z n´asleduj´ıc´ıch hypot´ez: H0 : β1 = 0 a H1 : β1 > 0 . Pˇri platnosti pˇredpoklad˚ u uveden´ ych v´ yˇse byla pouˇzita testovac´ı statistika: t1 =
b1 , SE(b1 )
kterou porovn´av´ame s kritick´ ym oborem (t1−α (n − 2); +∞).
4.2.5
V´ ysledky testu
Test hypot´ezy byl proveden v matematick´em prostˇred´ı MATLAB pomoc´ı funkce regstats. N´aslednˇe byla provedena regresn´ı diagnostika rezidu´ı ei = yi − yb, kter´a slouˇz´ı k ovˇeˇren´ı pˇredpoklad˚ u (P1)-(P4) a d´ale byla zamˇeˇrena na n´asleduj´ıc´ı probl´emy: • test v´ yznamnosti odhadnut´ ych koeficient˚ u (t-test) β0 , β1 ; • test v´ yznamnosti regrese zaloˇzen´ y na koeficientu determinace R2 (F-test); • test detekce odlehl´ ych pozorov´an´ı (anal´ yza studentizovan´ ych rezidu´ı, Cookova m´ıra vlivu i-t´eho bodu na v´ yslednou regresi). V´ yˇse uveden´ y testovac´ı postup byl pouˇzit pro re´aln´a data ˇcesk´e a nˇemeck´e ligy a zde jsou uvedeny podrobn´e v´ ysledky zpracov´an´ı pro nˇemeckou muˇzskou nejvyˇsˇs´ı soutˇeˇz v h´azen´e (tzv. bundesliga) pro cel´e sledovan´e obdob´ı, tj. sezony od roku 2002 do roku 2011. D´ale byla provedena podrobn´a anal´ yza pro jednotliv´e soutˇeˇzn´ı sez´ony. N´asleduj´ıc´ı graf na Obr´azku 4.6 zachycuje pr˚ umˇern´ y poˇcet vstˇrelen´ ych g´ol˚ u (pr˚ umˇer je poˇc´ıt´an ze vˇsech odehran´ ych z´apas˚ u v i-t´em kole) a pˇr´ısluˇsn´e kvartilov´e rozpˇet´ı, kter´ y byl motivac´ı pro formulov´an´ı v´ yˇse uveden´e hypot´ezy. Obr´azek 4.6: Pr˚ umˇern´ y poˇcet g´ol˚ u v jednotliv´ ych kolech a pˇr´ısluˇsn´e kvartilov´e rozpˇet´ı
Metodou nejmenˇs´ıch ˇctverc˚ u byly odhadnuty parametry line´arn´ıho regresn´ıho modelu a byl z´ısk´an v´ ysledn´ y model ve tvaru: ybi = 56, 485 + 0, 064xi 22
kde ybi jsou odhadnut´e pr˚ umˇern´e poˇcty g´ol˚ u v jednotliv´ ych kolech a xi = 1, 2, . . . , 34 jsou jednotliv´a kola. V´ ysledky ovˇeˇren´ı kladn´e line´arn´ı z´avislosti jsou uvedeny v Tabulce 4.8 Tabulka 4.8: V´ ysledky testu ovˇeˇren´ı kladn´e line´arn´ı z´avislosti b1 SE(b1 ) t1 obor kritick´ ych hodnot W p-hodnota
0, 064 0, 013 4, 824 (1, 645; ∞) 3, 265 · 10−6
Protoˇze hodnota testov´e statistiky t1 leˇz´ı v oboru kritick´ ych hodnot, je na hladinˇe v´ yznamnosti α = 5% zam´ıtnuta hypot´eza H0 . Proto lze usuzovat, ˇze p˚ uvodnˇe formulovan´a hypot´eza o tom, ˇze s pˇrib´ yvaj´ıc´ım kolem se zvyˇsuje poˇcet vstˇrelen´ ych g´ol˚ u, je platn´a.
4.2.6
V´ ysledky regresn´ı anal´ yzy a diagnostiky:
4.2.6.1
Test na v´ yznamnosti odhadnut´ ych koeficient˚ u (t-test) β0 , β1
V´ ysledky testov´an´ı v´ yznamnosti odhadnut´ ych koeficient˚ u jsou shrnuty v Tabulce 4.9. Tabulka 4.9: V´ ysledky testu o v´ yznamnosti odhadnut´ ych koeficient˚ u
β0 β1
b SE(b) 56, 485 0, 265 0, 064 0, 013
db hb t p 55, 965 57, 005 212, 981 0 0, 038 0, 090 4, 824 1, 477 · 10−6
Statistick´e vyhodnocen´ı odhadnut´ ych parametr˚ u ukazuje, ˇze oba koeficienty β0 i β1 lze povaˇzovat za statisticky v´ yznamnˇe odliˇsn´e od 0. To ukazuj´ı jak p-hodnoty pˇr´ısluˇsn´ ych statistik, kter´e jsou menˇs´ı neˇz α = 5% tak i intervaly spolehlivosti na hladinˇe v´ yznamnosti α = 5% pro koeficienty, β0 ∈ (55, 965; 57, 005) a β1 ∈ (0, 013; 0, 090). 4.2.6.2
Test na v´ yznamnost regrese zaloˇ zen´ y na koeficientu determinace R2 (Ftest)
V´ ysledky testov´an´ı v´ yznamnosti regrese jsou shrnuty v Tabulce 4.10. 2 Pˇrestoˇze koeficient determinace R2 i jeho upraven´a varianta Radj je velmi mal´a a model proto nelze pouˇz´ıt pro pˇredpov´ıd´an´ı a vysvˇetlen´ı poˇctu g´ol˚ u, kter´e padnou v jednotliv´ ych z´apasech, p-hodnota F-testu ukazuje, ˇze model jako celek lze povaˇzovat za v´ yznamn´ y.
23
Tabulka 4.10: V´ ysledky testu v´ yznamnosti regrese R2 2 Radj F p
0, 008 0, 007 23, 270 1, 477 · 10−6
Obr´azek 4.7: Studentizovan´a rezidua a Cookova m´ıra
4.2.6.3
Test na detekci odlehl´ ych pozorov´ an´ı (anal´ yza studentizovan´ ych rezidu´ı, Cookova m´ıra vlivu i-t´ eho bodu na v´ yslednou regresy)
Z Obr´azku 4.7 je vidˇet, ˇze hodnoty studentizovan´ ych rezidu´ı i Cookovy vzd´alenosti jsou pro nˇekter´e z´apasy vysok´e, pˇresto se neprok´azalo, ˇze se jedn´a o statisticky v´ yznamn´a odlehl´a pozorov´an´ı. V Tabulce 4.11 je uvedeno 5 z´apas˚ u s nejvyˇsˇs´ı hodnotou Cookovy vzd´alenosti. Tabulka 4.11: Z´apasy s nejvˇetˇs´ı Cookovo vzd´alenost´ı Dom´ac´ı TV Großwallstadt SG FlensburgHandewitt SG WallauMassenheim THW Kiel MT Melsungen
Host´e VfL Gummersbach THW Kiel
sez´ona kolo g´olyD g´olyH 2007/2008 33 42 42 2006/2007 33 41 36
Cook 0, 005 0, 004
VfL Gummersbach
2004/2005
32
32
45
0, 003
FA G¨oppingen 2005/2006 SG Flensburg- 2007/2008 Handewitt
4 13
43 40
33 47
0, 003 0, 003
Z Tabulky 4.11 je vidˇet, ˇze z´apasy s nejvˇetˇs´ı Cookovou vzd´alenost´ı se odehr´aly nejv´ıce na konci soutˇeˇzn´ıho roˇcn´ıku.
24
t´ ym Bergischer HC Concordia Delitzsch DHC Rheinland Eintracht Hildesheim FA G¨ oppingen F¨ uchse Berlin GWD Minden HBW Balingen-Weilstetten HSG Ahlen-Hamm HSG D/M Wetzlar HSG D¨ usseldorf HSG Nordhorn HSG Wetzlar HSV Hamburg MT Melsungen Rhein-Neckar-L¨ owen SC Magdeburg SG Flensburg-Handewitt ¨ SG Kronau/Ostringen SG Wallau-Massenheim SG Willst¨ att/Schutterwald Stralsunder HV SV Post Schwerin TBV Lemgo ThSV Eisenach THW Kiel TSG Ludwigshafen-Friesenheim TSV Dormagen TSV Hannover-Burgdorf TuS N-L¨ ubbecke TUSEM Essen TV 05/07 H¨ uttenberg TV Großwallstadt VfL Gummersbach VfL Pfullingen Wilhelmshavener HV
z´ apasy 34 34 34 68 340 170 272 204 34 272 136 238 67 340 237 170 340 340 102 102 34 68 34 340 68 340 34 68 102 272 170 34 340 340 136 204
β0 60,824 52,829 52,481 57,353 55,488 55,216 54,390 55,392 56,727 55,542 56,485 57,387 54,488 55,849 59,438 58,611 57,916 58,719 55,916 58,494 52,882 56,176 52,091 57,798 54,166 58,653 55,968 55,005 57,624 56,442 55,015 54,636 54,240 57,361 52,786 56,033
β1 -0,185 0,237 0,117 0,052 0,040 0,092 0,095 0,029 0,054 0,007 -0,001 0,111 -0,064 0,100 0,049 0,085 0,043 0,061 0,046 0,069 0,311 -0,079 0,380 0,073 0,017 0,097 0,198 0,090 -0,024 0,073 0,095 0,056 0,034 0,094 0,172 -0,031
SE(b0 ) 2,143 2,138 2,226 1,818 0,760 1,059 0,876 0,939 2,093 0,806 1,170 0,882 1,696 0,777 1,033 0,978 0,794 0,794 1,549 1,621 2,421 1,963 1,932 0,744 1,715 0,848 2,428 1,438 1,284 0,862 0,972 2,199 0,726 0,778 1,324 1,050
SE(b1 ) 0,107 0,107 0,111 0,091 0,038 0,053 0,044 0,047 0,104 0,040 0,058 0,044 0,086 0,039 0,052 0,049 0,040 0,040 0,077 0,081 0,121 0,098 0,096 0,037 0,085 0,042 0,121 0,072 0,064 0,043 0,048 0,110 0,036 0,039 0,066 0,052
p (b0 ) 2, 921 · 10−24 2, 063 · 10−22 8, 588 · 10−22 1, 580 · 10−41 5, 816 · 10−209 1, 181 · 10−105 7, 701 · 10−162 2, 861 · 10−129 1, 215 · 10−23 2, 611 · 10−173 1, 257 · 10−86 1, 047 · 10−152 1, 295 · 10−41 8, 380 · 10−207 1, 644 · 10−140 2, 674 · 10−115 6, 989 · 10−209 7, 554 · 10−211 3, 618 · 10−59 3, 694 · 10−59 8, 570 · 10−21 6, 393 · 10−39 1, 419 · 10−23 1, 552 · 10−217 1, 444 · 10−41 1, 491 · 10−201 1, 685 · 10−21 8, 924 · 10−47 4, 617 · 10−68 9, 457 · 10−24 2, 439 · 10−111 1, 728 · 10−22 3, 357 · 10−212 2, 575 · 10−210 3, 294 · 10−76 4, 772 · 10−121
p-hodnota (b1 ) 0,093 0,034 0,299 0,567 0,287 0,083 0,030 0,538 0,607 0,869 0,983 0,012 0,460 0,010 0,345 0,084 0,276 0,124 0,551 0,393 0,015 0,422 0,000 0,051 0,839 0,022 0,111 0,216 0,710 0,089 0,051 0,612 0,350 0,016 0,010 0,558
R2 0,086 0,134 0,034 0,005 0,003 0,018 0,017 0,002 0,008 0,000 0,000 0,026 0,008 0,019 0,004 0,018 0,004 0,007 0,004 0,007 0,172 0,010 0,327 0,011 0,001 0,015 0,078 0,023 0,001 0,011 0,023 0,008 0,003 0,017 0,048 0,002
2 Radj 0,057 0,106 0,003 -0,010 0,000 0,012 0,014 -0,003 -0,023 -0,004 -0,007 0,022 -0,007 0,016 0,000 0,012 0,001 0,004 -0,006 -0,003 0,146 -0,005 0,306 0,008 -0,015 0,013 0,049 0,008 -0,009 0,007 0,017 -0,023 0,000 0,014 0,041 -0,003
p 0,093 0,034 0,299 0,567 0,287 0,083 0,030 0,538 0,607 0,869 0,983 0,012 0,460 0,010 0,345 0,084 0,276 0,124 0,551 0,393 0,015 0,422 0,000 0,051 0,839 0,022 0,111 0,216 0,710 0,089 0,051 0,612 0,350 0,016 0,010 0,558
D´ale byla provedena anal´ yza platnosti hypot´ezy o kladnosti smˇernicov´eho koeficientu tak´e pro jednotliv´e soutˇeˇzn´ı t´ ymy a jednotliv´e soutˇeˇzn´ı roˇcn´ıky. V´ ysledky jsou uvedeny v Tabulk´ach 4.12 a 4.13. Z tˇechto tabulek je vidˇet, ˇze uvedenou hypot´ezu H1 lze pˇrijmout pro 9 t´ ym˚ ua3 soutˇeˇzn´ı roˇcn´ıky, kter´e jsou v tabulce zv´ yraznˇeny ˇcervenou barvou. Tabulka 4.12: V´ ysledky test˚ u pro jednotliv´e t´ ymy
25
sez´ ona 2011-2012 2010-2011 2009-2010 2008-2009 2007-2008 2006-2007 2005-2006 2004-2005 2003-2004 2002-2003
z´ apasy 306 305 306 306 306 306 306 306 306 306
β0 56,955 55,879 55,738 59,388 56,837 57,843 59,443 54,578 54,913 53,251
β1 -0,019 0,053 0,051 -0,004 0,124 0,086 -0,054 0,185 0,048 0,169
SE(b0 ) 0,779 0,780 0,705 0,808 0,852 0,884 0,860 0,835 0,860 0,849
SE(b1 ) 0,039 0,039 0,035 0,040 0,042 0,044 0,043 0,042 0,043 0,042
p-hodnota (b0 ) 5, 211 · 10−195 4, 969 · 10−192 9, 834 · 10−205 1, 211 · 10−195 1, 415 · 10−183 4, 060 · 10−181 6, 694 · 10−188 5, 219 · 10−181 3, 302 · 10−178 5, 207 · 10−176
p-hodnota (b1 ) 0,619 0,175 0,149 0,923 0,004 0,053 0,214 0,000 0,260 0,000
R2 0,001 0,006 0,007 0,000 0,027 0,012 0,005 0,061 0,004 0,050
2 Radj -0,002 0,003 0,004 -0,003 0,024 0,009 0,002 0,058 0,001 0,047
p-hodnota 0,619 0,175 0,149 0,923 0,004 0,053 0,214 0,000 0,260 0,000
Tabulka 4.13: V´ ysledky test˚ u pro jednotliv´e soutˇeˇzn´ı roˇcn´ıky
26
4.3 4.3.1
Z´ avislost koneˇ cn´ eho v´ ysledku z´ apasu na poloˇ casov´ em sk´ ore Motivace k vytvoˇ ren´ı hypot´ ezy
Inspirac´ı k vytvoˇren´ı t´eto hypot´ezy bylo zamyˇslen´ı nad t´ım, zda v´ ysledky v prvn´ım a v druh´em poloˇcase spolu v´ yznamnˇe souvis´ı. Ve sportovn´ı terminologii se ˇcasto objevuje situace, kdy po pˇrest´avce mezi jednotliv´ ymi ˇca´stmi z´apas˚ u vstupuje do z´apasu jin´ y t´ ym“. Tato zmˇena se ” projevuje napˇr´ıklad t´ım, ˇze muˇzstvo do dalˇs´ı ˇca´sti z´apasu vstoup´ı vˇetˇs´ım z´apalem do hry a c´ılem otoˇcit nepˇr´ızniv´ y v´ yvoj z´apasu. Lze pˇredpokl´adat, ˇze zvl´aˇstˇe u z´apas˚ u, kter´e jsou po prvn´ım poloˇcase vyrovnan´e, budou t´ ymy v druh´em poloˇcase hr´at aktivnˇeji. Po tomto zamyˇslen´ı byly vytvoˇreny grafy uveden´e na Obr´azku 4.8, zachycuj´ıc´ı vztah mezi rozd´ıly poˇctu g´ol˚ u v prvn´ım poloˇcase a na konci z´apasu/ve druh´em poloˇcase. Velikost bublin zachycuje poˇcet z´apas˚ u s konkr´etn´ı kombinac´ı rozd´ılu poˇctu g´ol˚ u v poloˇcase a na konci/ve druh´em poloˇcase z´apasu. Pro vˇetˇs´ı pˇrehlednost jsou stejnˇe velk´e bubliny oznaˇceny stejnou barvou. Obr´azek 4.8: Vztah rozd´ıl˚ u g´ol˚ u v prvn´ım poloˇcase a na konci z´apasu/ve druh´em poloˇcase
Pˇredpokl´ad´a se siln´a vazba mezi rozd´ılem g´ol˚ u v poloˇcase a rozd´ılem g´ol˚ u na konci z´apasu, kter´e byla potvrzena tak´e vypoˇcten´ ymi korelaˇcn´ımi koeficienty, kter´e jsou uvedeny v Tabulce 4.14. Anal´ yzou dat bylo zjiˇstˇeno, ˇze pokud je rozd´ıl v poloˇcase dva a v´ıce g´ol˚ u, pak je korelace mezi rozd´ılem g´ol˚ u v poloˇcase a na konci z´apasu velmi vysok´a a naopak pokud je rozd´ıl v poloˇcase mal´ y (rozd´ıl je maxim´alnˇe jeden g´ol) je korelace statisticky neprok´az´ana. Lze tedy pˇredpokl´adat, ˇze pokud je rozd´ıl v poloˇcase mal´ y nebo je rem´ızov´ y stav, koneˇcn´ y v´ ysledek z´apasu je st´ale otevˇren´ y. Pˇrestoˇze jsou sledovan´e veliˇciny implicitnˇe z´avisl´e, byla z´avislost podrobnˇe otestov´ana a analyzov´ana. Byla sestavena hypot´eza, zda koneˇcn´ y v´ ysledek z´apasu z´avis´ı na rozd´ılu g´ol˚ u v poloˇcase. Z´akladn´ım pˇredpokladem t´eto hypot´ezy je fakt, ˇze t´ ym, kter´ y v poloˇcase vyhr´av´a je v´ıtˇezem i na konci z´apasu. Z Tabulky 4.14 jsou patrn´e vysok´e hodnoty korelaˇcn´ıch koeficient˚ u pro vˇsechny z´apasy, proto testov´an´ı bylo zamˇeˇreno pouze na otevˇren´e z´apasy. Jako otevˇren´e z´apasy byly 27
povaˇzov´any z´apasy, ve kter´ ych rozd´ıl v poloˇcase ˇcinil maxim´alnˇe jeden g´ol, jejichˇz hodnoty korelaˇcn´ıch koeficient˚ u jsou uvedeny v Tabulce 4.15, ze kter´e jsou patrn´e jejich niˇzˇs´ı hodnoty. Tak´e byla sestavena hypot´eza, zda v´ ysledek druh´eho poloˇcasu z´avis´ı na rozd´ılu poˇctu g´ol˚ u v poloˇcase. C´ılem t´eto hypot´ezy bylo analyzovat skuteˇcnost, zda minim´aln´ı v´ yhra v poloˇcase o jeden g´ol motivuje v´ıce druˇzstvo, kter´e v poloˇcase vyhr´av´a nebo prohr´av´a. Tabulka 4.14: Hodnoty korelaˇcn´ıch koeficient˚ u pro jednotliv´e sez´ony sezona z´apasy Pearson Kendall Spearman 2011-2012 306 0, 778 0, 601 0, 764 2010-2011 305 0, 797 0, 626 0, 790 2009-2010 306 0, 783 0, 608 0, 771 2008-2009 306 0, 822 0, 639 0, 801 2007-2008 306 0, 812 0, 638 0, 800 2006-2007 306 0, 777 0, 597 0, 754 2005-2006 306 0, 750 0, 554 0, 713 2004-2005 306 0, 764 0, 594 0, 752 2003-2004 306 0, 777 0, 596 0, 756 2002-2003 306 0, 735 0, 557 0, 718 celkem 3059 0, 780 0, 600 0, 762
Tabulka 4.15: Hodnoty korelaˇcn´ıch koeficient˚ u pro jednotliv´e sez´ony, v z´apasech, kdy je v poloˇcase rozd´ıl maxim´alnˇe jeden g´ol sezona z´apasy Pearson Kendall Spearman 2011-2012 88 0, 208 0, 168 0, 214 2010-2011 85 0, 166 0, 181 0, 231 2009-2010 94 0, 169 0, 142 0, 179 2008-2009 75 0, 369 0, 267 0, 336 2007-2008 78 0, 034 0, 059 0, 067 2006-2007 81 0, 153 0, 122 0, 150 2005-2006 93 0, 220 0, 181 0, 226 2004-2005 76 0, 205 0, 165 0, 204 2003-2004 76 0, 061 0, 059 0, 078 2002-2003 94 0, 022 0, 040 0, 052 celkem 841 0, 149 0, 129 2, 650 · 10−6
28
4.3.2
V´ ybˇ er test˚ u pro testov´ an´ı hypot´ ezy
Pro testov´an´ı hypot´ezy o z´avislosti koneˇcn´eho v´ ysledku byly vytvoˇreny kontingenˇcn´ı tabulky zachycuj´ıc´ı poˇcty z´apas˚ u, ve kter´ ych jsou z´apasy ˇclenˇeny ze dvou hledisek: podle rozd´ılu poˇctu g´ol˚ u v poloˇcase a podle stavu z´apasu (v´ yhra, prohra, rem´ıza). D´ale bylo pomoc´ı χ2 - testu nez´avislosti ovˇeˇrov´ano zda koneˇcn´ y v´ ysledek z´apasu, pˇr´ıpadnˇe v´ ysledek druh´eho poloˇcasu, z´avis´ı nebo nez´avis´ı na stavu z´apasu v poloˇcase.
4.3.3
Formulace hypot´ ezy o z´ avislosti koneˇ cn´ eho v´ ysledku z´ apasu na rozd´ıl˚ u poˇ ctu g´ ol˚ u v poloˇ case a pˇ redpoklady modelu
Pˇredpokl´adejme, ˇze koneˇcn´ y v´ ysledek z´apasu je diskr´etn´ı n´ahodn´a veliˇcina X, kter´a nab´ yv´a hodnot Prohra, V´ yhra, Rem´ıza a Y je diskr´etn´ı n´ahodn´a veliˇcina vyjadˇruj´ıc´ı rozd´ıl g´ol˚ u v poloˇcase z´apasu, kter´a nab´ yv´a hodnot 1, 0, −1. Testujeme hypot´ezu H0 : X a Y jsou nez´avisl´e proti alternativn´ı hypot´eze H1 : X a Y nejsou nez´avisl´e. Kritickou hodnotu tohoto testu porovn´av´ame s kvantily χ2 - rozdˇelen´ı. Tento postup je vˇsak zaloˇzen na limitn´ım chov´an´ı krit´eria. Ke shodˇe s limitn´ım rozdˇelen´ı se vyˇzaduje, aby vˇsechny teoretick´e ˇcetnosti byly vˇetˇs´ı neˇz 5. Tento pˇredpoklad byl v naˇsem pˇr´ıpadˇe splnˇen, proto nebylo tˇreba sluˇcovat ˇz´adn´e ˇra´dky ani sloupce dohromady.
4.3.4
V´ ysledky test˚ u
Nejprve byl proveden test z´avislosti koneˇcn´eho v´ ysledku a rozd´ılu poˇctu g´ol˚ u v poloˇcase. V Tabulk´ach 4.16 a 4.17 je pouˇzito n´asleduj´ıc´ı znaˇcen´ı: V (na konci) znamen´a v´ yhra t´ ymu na konci z´apasu, R (na konci) znamen´a rem´ızov´ y stav na konci z´apasu a P (na konci) znamen´a prohra t´ ymu na konci z´apasu. Tabulka 4.16: Tabulka namˇeˇren´ ych ˇcetnost´ı V (na konci) R (na konci) P (na konci) celkem -1 100 34 111 245 0 159 34 102 295 1 185 35 81 301 celkem 444 103 294 841
Za pomoci Tabulek 4.16 a 4.17 byla urˇcena hodnota testov´eho krit´eria χ2 = 24, 854. Jelikoˇz je tato hodnota vˇetˇs´ı neˇz kritick´a hodnota χ24 (α = 0, 05) = 9, 490, byla zam´ıtnuta hypot´eza H0 , ˇze v´ ysledek na konci z´apasu a minim´aln´ı rozd´ıly poˇctu g´ol˚ u v poloˇcase jsou nez´avisl´e veliˇciny. V druh´e f´azi byl postup zopakov´an pro testov´an´ı z´avislosti v´ ysledku druh´eho poloˇcasu a rozd´ılu poˇctu g´ol˚ u v poloˇcase. V Tabulk´ach 4.18 a 4.19 je pouˇzito n´asleduj´ıc´ı znaˇcen´ı: V (2.poloˇcas) znamen´a v´ yhra t´ ymu ve druh´em poloˇcase z´apasu, R (2.poloˇcas) znamen´a rem´ızov´ y stav ve druh´em poloˇcase z´apasu a P (2.poloˇcas) znamen´a prohra t´ ymu ve druh´em poloˇcase z´apasu. V Tabulk´ach 4.18 a 4.19 jsou opˇet zachyceny namˇeˇren´e a oˇcek´avan´e ˇcetnosti pro jednotliv´e studovan´e stavy. Porovn´an´ı hodnoty testov´eho krit´eria χ2 = 5, 233 a kritick´e hodnoty testu 29
Tabulka 4.17: Tabulka oˇcek´avan´ ych ˇcetnost´ı pro vyrovnan´e z´apasy V (na konci) R (na konci) P (na konci) celkem -1 129,346 30,006 85,648 245 0 155,743 36,130 103,127 295 1 158,911 36,864 105,225 301 celkem 444 103 294
Tabulka 4.18: Tabulka namˇeˇren´ ych ˇcetnost´ı
-1 0 1 celkem
V (2. poloˇcas) R (2. poloˇcas) P (2. poloˇcas) celkem 134 22 89 245 159 34 102 295 143 42 116 301 436 98 307 841
Tabulka 4.19: Tabulka oˇcek´avan´ ych ˇcetnost´ı pro vyrovnan´e z´apasy V (2. poloˇcas) R (2. poloˇcas) P (2. poloˇcas) celkem -1 127,015 28,549 89,435 245 0 152,937 34,376 107,687 295 1 156,048 35,075 109,878 301 celkem 436 98 307
ysledek druh´eho poloˇcasu je nez´avisl´ y χ24 (α = 0, 05) = 9, 490 byla pˇrijata hypot´eza H0 , ˇze v´ na rozd´ılu poˇctu g´ol˚ u po prvn´ım poloˇcase. To posiluje domnˇenku, ˇze z´apasy, kter´e v poloˇcase konˇc´ı mal´ ym rozd´ılem poˇctu g´ol˚ u, jsou st´ale otevˇren´e a ve sportovn´ı terminologii lze ˇr´ıci, ˇze se zaˇc´ın´a hr´at znovu od zaˇca´tku.
4.4 4.4.1
Srovn´ an´ı dynamiˇ cnosti hry v ˇ cesk´ e a nˇ emeck´ e lize Motivace k vytvoˇ ren´ı hypot´ ezy
V Nˇemecku patˇr´ı h´azen´a k nejpopul´arnˇejˇs´ım kolektivn´ım sport˚ um, velk´ y z´ajem o ni projevuj´ı nejen div´aci, ale tak´e sponzoˇri. Nˇemeck´a bundesliga je ˇrazena mezi nejlepˇs´ı h´azenk´aˇrsk´e ligy svˇeta a v z´apasech je vidˇet velk´a taktick´a vyzr´alost cel´eho t´ ymu, coˇz je nejvˇetˇs´ı odliˇsnost od ˇcesk´e extraligy. Jednou z moˇznost´ı, kde se tato odliˇsnost m˚ uˇze projevit, je vˇetˇs´ı nasazen´ı t´ ym˚ u a t´ım i ˇcastˇejˇs´ı zmˇena stavu z´apasu mezi prvn´ım poloˇcasem a koneˇcn´ ym v´ ysledkem z´apasu. Pro tuto hypot´ezu byly vyuˇzity opˇet z´apasy, kter´e maj´ı v poloˇcase otevˇren´e sk´ore (rozd´ıl maxim´alnˇe jeden g´ol), ve kter´ ych by se tato skuteˇcnost mohla nejv´ıce projevit. 30
4.4.1.1
V´ ybˇ er testu pro testov´ an´ı hypot´ ezy
Z´apasy byly rozdˇeleny do dev´ıti skupin podle poloˇcasov´eho v´ ysledku a v´ ysledku na konci z´apasu. Skupin V-V znamen´a v´ yhra t´ ymu v poloˇcase nejv´ yˇse o jeden g´ol a v´ yhra t´ ymu na konci z´apasu, skupina P-V znamen´a prohru t´ ymu nejv´ yˇse o jeden g´ol v poloˇcase a v´ yhru t´ ymu na konci z´apasu, atd. Pro testov´an´ı srovn´an´ı dynamiˇcnosti nˇemeck´e a ˇcesk´e ligy byl vybr´an χ2 - test homogenity, kter´ y porovn´aval ˇcetnosti z´apas˚ u v jednotliv´ ych skupin´ach v ˇcesk´e a nˇemeck´e lize.
4.4.2
Formulace hypot´ ezy
Jako nulov´a hypot´eza je uvaˇzov´ana hypot´eza H0 : rozdˇelen´ı do jednotliv´ych skupin je homogenn´ı v ˇcesk´e a nˇemeck´e lize oproti alternativn´ı hypot´eze H1 : rozdˇelen´ı do jednotliv´ych skupin nen´ı homogenn´ı v ˇcesk´e a nˇemeck´e lize.
4.4.3
V´ ysledky testu
V Tabulk´ach 4.20 a 4.21 jsou uvedeny namˇeˇren´e a oˇcek´avan´e ˇcetnosti pro jednotliv´e skupiny z´apas˚ u. Z tˇechto tabulek byla urˇcena hodnota testov´eho krit´eria χ2 = 8, 478 a tato hodnota byla porovn´ana s kritickou hodnotou testu χ28 (α = 5%) = 15, 500. Protoˇze χ2 = 8, 478 < 15, 500, nebyla zam´ıtnuta hypot´eza H0 , ˇze rozloˇzen´ı do jednotliv´ ych skupin v nˇemeck´e a ˇcesk´e lize je shodn´e. Tabulka 4.20: Hodnoty namˇeˇren´ ych ˇcetnost´ı pro jednotliv´e skupiny
Nˇemecko ˇ CR celkem
V-V V-R V-P R-V 185 35 81 159 90 8 24 62 275 43 105 221
R-R R-P P-V 34 102 100 11 38 42 45 140 142
P-R P-P 34 111 18 53 52 164
celkem 841 346 1187
Tabulka 4.21: Hodnoty oˇcek´avan´ ych ˇcetnost´ı pro jednotliv´e skupiny Nˇ emecko ˇ CR celkem
V-V 194,840 80,160 275
V-R 30,466 12,534 43
V-P 74,393 30,607 105
R-V 156,580 64,420 221
R-R 31,883 13,117 45
R-P 99,191 40,809 140
P-V 100,608 41,392 142
P-R 36,842 15,158 52
P-P 116,195 47,805 164
celkem 841 346
Pˇri dalˇs´ım testov´an´ı byly z´apasy rozdˇeleny podle toho, zda na konci z´apasu byl v´ ysledek stejn´ y nebo rozd´ıln´ y oproti poloˇcasov´eho stavu (napˇr. zda se t´ ymu, kter´ y vyhr´aval v poloˇcase, podaˇrilo tuto v´ yhru udrˇzet i na konci z´apasu). Z´apasy s rem´ızov´ ym stavem v poloˇcase byly pro tuto anal´ yzu vynech´any. Namˇeˇren´e a oˇcek´avan´e ˇcetnosti jednotliv´ ych skupin z´apas˚ u jsou uvedeny v Tabulk´ach 4.22 a 4.23. Z tˇechto tabulek byla urˇcena hodnota testov´eho krit´eria χ2 = 2, 942 a tato hodnota byla porovn´ana s kritickou hodnotou testu χ21 (α = 5%) = 3, 840. Protoˇze χ2 = 2, 942 < 3, 840, nem˚ uˇze 31
Tabulka 4.22: Hodnoty namˇeˇren´ ych ˇcetnost´ı pro jednotliv´e skupiny zachov´an´ı poloˇcasov´eho stavu zmˇena poloˇcasov´eho stavu celkem Nˇemecko 296 250 546 ˇ CR 143 92 235 celkem 439 342 781
Tabulka 4.23: Hodnoty oˇcek´avan´ ych ˇcetnost´ı pro jednotliv´e skupiny zachov´an´ı poloˇcasov´eho stavu zmˇena poloˇcasov´eho stavu celkem Nˇemecko 306,907 239,093 546 ˇ CR 132,093 102,907 235 celkem 439 342
b´ yt zam´ıtnuta hypot´eza H0 , ˇze rozloˇzen´ı do jednotliv´ ych skupin dle zachov´an´ı poloˇcasov´eho stavu na konci z´apasu je v ˇcesk´e a nˇemeck´e lize shodn´e. Na z´akladˇe v´ ysledk˚ u test˚ u nem˚ uˇze b´ yt potvrzena domnˇenka, ˇze pravdˇepodobnosti jednotliv´ ych skupin z´apas˚ u ˇclenˇen´ ych podle v´ ysledku v prvn´ım poloˇcase a ve druh´em poloˇcase/na konci z´apasu je v ˇcesk´e a nˇemeck´e soutˇeˇzi odliˇsn´ y.
32
Kapitola 5 Rankingy na re´ aln´ ych datech Pomoc´ı tˇr´ı model˚ u, kter´e jsou uvedeny v teoretick´e ˇc´asti t´eto pr´ace, byly vypoˇcteny rankingy jednotliv´ ych t´ ym˚ u v kaˇzd´e sez´onˇe a tak´e za cel´e sledovan´e obdob´ı pro nˇemeckou soutˇeˇz. V´ yraznou nev´ yhodou tˇechto model˚ u je to, ˇze nezohledˇ nuj´ı ˇcasov´ y faktor jednotliv´ ych z´apas˚ u, tedy v´ ysledek z´apasu z pˇredch´azej´ıc´ıho t´ ydne m´a stejnou v´ahu jako napˇr´ıklad v´ ysledek z´apasu odehran´eho pˇred p˚ ul rokem. Modely proto zachycuj´ı sp´ıˇse dlouhodobou s´ılu t´ ymu, nikoliv aktu´aln´ı. Lze tedy oˇcek´avat, ˇze predikce v´ ysledk˚ u zaloˇzen´a na hodnot´ach ranking˚ u poˇc´ıtan´ ych pro cel´e sledovan´e obdob´ı bude m´enˇe spolehliv´a neˇz predikce vych´azej´ıc´ı z ranking˚ u sezonn´ıch. Sezonn´ı rankingy by mˇely v´ıce odpov´ıdat aktu´aln´ı s´ıle t´ ym˚ u. Pro ilustraci v´ ysledk˚ u modelu budou vyuˇzity rankingy pro tˇri nej´ uspˇeˇsnˇejˇs´ı t´ ymy podle pr˚ umˇern´eho poˇrad´ı ve sledovan´em obdob´ı a kter´e byly nasazeny ve vˇsech soutˇeˇzn´ıch roˇcn´ıc´ıch. Konkr´etnˇe se bude jednat o t´ ymy THW Kiel, SG Flensburg-Handewitt a HSV Hamburg. V´ ysledn´e hodnoty ranking˚ u byly vyuˇzity pro pˇredpovˇed’ v´ ysledku z´apas˚ u a porovn´an´ı predikovan´ ych v´ ysledk˚ u s re´aln´ ymi v´ ysledky.
5.1 5.1.1
Colley Matrix Model V´ yhody a nev´ yhody modelu
Mezi z´akladn´ı v´ yhody tohoto modelu patˇr´ı jeho jednoduchost a snadn´a interpretovatelnost z´ıskan´ ych ranking˚ u. Hlavn´ım pˇredpokladem tohoto modelu je n´ahodnost rozlosov´an´ı t´ ym˚ u do jednotliv´ ych roˇcn´ık˚ u soutˇeˇze. V pˇr´ıpadˇe, ˇze v nˇemeck´e lize se vyuˇz´ıv´a stejn´ y syst´em rozlosov´an´ı t´ ymu do soutˇeˇzn´ıho roˇcn´ıku jako v ˇcesk´e lize, nem˚ uˇze b´ yt tento pˇredpoklad splnˇen, a proto v´ ysledky mohou b´ yt ovlivnˇeny. Hlavnˇe mohou b´ yt ovlivnˇeny rankingy, kter´e jsou urˇceny v poˇca´teˇcn´ıch kolech soutˇeˇze. Dalˇs´ı nev´ yhodou tohoto modelu je fakt, ˇze pˇri vytv´aˇren´ı ranking˚ u model nepˇriˇrazuje vˇetˇs´ı v´ahu z´apas˚ um, ve kter´ ych m´a t´ ym silnˇejˇs´ıho soupeˇre a naopak niˇzˇs´ı v´ahu z´apas˚ um, kter´e t´ ym sehraje se slabˇs´ım soupeˇrem. Tento model pracuje pouze s v´ ysledkem z´apasu prohra, v´ yhra a rem´ıze, proto nezohledˇ nuje kolika g´olov´ y byl rozd´ıl branek na konci z´apasu, coˇz je zp˚ usobeno jednoduchost´ı tohoto modelu. Veˇsker´e v´ ypoˇcty ranking˚ u jsou uloˇzeny v CD pˇr´ıloze t´eto bakal´aˇrsk´e pr´ace.
33
5.1.2
Intepretace v´ ysledk˚ u
Tabulka 5.1 zachycuje poˇrad´ı tˇr´ı nej´ uspˇeˇsnˇejˇs´ıch t´ ymu nˇemeck´e soutˇeˇze v kaˇzd´e sez´onˇe za cel´e sledovan´e obdob´ı. Za nej´ uspˇeˇsnˇejˇs´ı lze povaˇzovat t´ ym THW Kiel, kter´ y na poˇca´tku sledovan´eho obdob´ı, tedy v sez´onˇe 2002-2003, obsadil 6. pˇr´ıˇcku a od n´asleduj´ıc´ı sez´ony do konce sledovan´eho obdob´ı byl nejh˚ uˇre druh´ y. Naproti tomu t´ ym SG Flensburg-Handewitt na zaˇc´atku sledovan´eho obdob´ı byl u ´spˇeˇsnˇejˇs´ı a naopak v pr˚ ubˇehu se postupnˇe zhorˇsoval. U t´ ym HSV Hamburg lze vysledovat sp´ıˇse opaˇcnou tendenci pr˚ ubˇehu poˇrad´ı ve sledovan´em obdob´ı. Tabulka 5.1: Tabulka poˇrad´ı vybran´ ych t´ ym˚ u v cel´em sledovan´em obdob´ı THW Kiel SG Flensburg-Handewitt HSV Hamburg
02-03 6 2 8
03-04 2 1 5
04-05 1 2 6
05-06 1 2 10
06-07 1 3 2
07-08 1 2 3
08-09 1 6 2
09-10 1 3 2
10-11 2 6 1
11-12 1 2 4
V n´asleduj´ıc´ım Obr´azku 5.1 je zachycen ˇcasov´ y pr˚ ubˇeh v´ yvoje ranking˚ u za cel´e sledovan´e obdob´ı, coˇz vyjadˇruje v´ yˇse zm´ınˇen´e dlouhodob´e tendence s´ıly jednotliv´ ych t´ ym˚ u. Obr´azek 5.1: V´ yvoj ranking˚ u za cel´e obdob´ı
Pro dalˇs´ı anal´ yzu v´ yvoje ranking˚ u byly vybr´any sez´ony 2006-2007 a 2007-2008. Tyto sez´ony byly vybr´any, protoˇze vybran´e t´ ymy obsadily prvn´ı tˇri pozice. V Obr´azku 5.2 je zobrazen v´ yvoj ranking˚ u vybran´ ych t´ ymu ve vybran´ ych sez´on´ach. O sez´onˇe 2006-2007 lze ˇr´ıci, ˇze v prvn´ı tˇretinˇe sez´ony byl pr˚ ubˇeh mezi tˇremi vybran´ ymi t´ ymy nap´ınav´ y a vyrovnan´ y. Naopak od 15. kola doˇslo k poklesu v´ ykonnosti t´ ymu SG FlensburgHandewitt a bylo zˇrejm´e, ˇze uˇz se nezapoj´ı do boj˚ u o prvn´ı m´ısto soutˇeˇze. Boj o prvn´ı pˇr´ıˇcku prob´ıhal tedy mezi t´ ymy HSV Hamburg a THW Kiel a byl nerozhodnut´ y aˇz do konce soutˇeˇze, kde v posledn´ım kole dos´ahly oba t´ ymy shodn´eho rankingov´eho ohodnocen´ı. O koneˇcn´em poˇrad´ı mezi tˇemito dvˇema t´ ymy mohl rozhodnout napˇr´ıklad jen jeden prohran´ y z´apas t´ ymu HSV Hamburg. 34
Obr´azek 5.2: V´ yvoj ranking˚ u ve vyran´ ych sez´on´ach
V sez´onˇe 2007-2008 doˇslo k rozhoduj´ıc´ımu okamˇziku v boji o prvn´ı pˇr´ıˇcku pˇribliˇznˇe v 22. kole, kdy byly dominance t´ ymu THW Kiel zˇrejm´a a d´ale prob´ıhal boj pouze o druhou pˇr´ıˇcku v soutˇeˇzi. Tento boj svedly t´ ymy HSV Hamburg a SG Flensburg-Handewitt, kter´e po posledn´ım kole opˇet dos´ahly stejn´eho rankingov´eho ohodnocen´ı. Skuteˇcnost, ˇze t´ ym SG Flensburg-Handewitt skonˇcil v koneˇcn´em poˇrad´ı na druh´e pˇr´ıˇcce, byla zˇrejmˇe zp˚ usobena lepˇs´ımy v´ ysledky z´apas˚ u tohoto t´ ymu v posledn´ıch kolech sez´ony.
5.2 5.2.1
Keener Ranking Model V´ yhody a nev´ yhody modelu
Tento model se od Colleyho modelu liˇs´ı zejm´ena t´ım, ˇze je zaloˇzen na poˇctu vstˇrelen´ ych a obdrˇzen´ ych g´ol˚ u g´ol˚ u. Nav´ıc neline´arn´ı sloˇzka modelu vyj´adˇrena funkc´ı h(x) zd˚ urazˇ nuje pozici dominantn´ıho t´ ymu, kter´ y v pˇr´ıpadˇe jasn´eho v´ıtˇezstv´ı hraje s lehkost´ı a t´ım p´adem je rozd´ıl poˇctu g´ol˚ u na konci z´apasu daleko markantnˇejˇs´ı. Nev´ yhodou tohoto model je jeho poˇca´teˇcn´ı variabilita, kter´a se projevuje v poˇc´ateˇcn´ıch kolech soutˇeˇze. Dalˇs´ı nev´ yhodou je, ˇze velk´e mnoˇzstv´ı vstˇrelen´ ych branek v h´azen´e ovlivˇ nuje hodnotu ranking˚ u dle tohoto modelu a v´ ysledn´ y ranking nejsilnˇejˇs´ıch t´ ym˚ u je velmi podobn´ y.
5.2.2
Interpretace v´ ysledk˚ u
V Obr´azku 5.3 je zachycen ˇcasov´ y pr˚ ubˇeh v´ yvoje ranking˚ u za cel´e sledovan´e obdob´ı, coˇz vyjadˇruje v´ yˇse zm´ınˇen´e dlouhodob´e tendence s´ıly jednotliv´ ych t´ ym˚ u. Pro dalˇs´ı anal´ yzu v´ yvoje ranking˚ u byly opˇet vybr´any sez´ony 2006-2007 a 2007-2008. Pro ilustraci byl vybr´an jeden ze slabˇs´ıch t´ ymu, konkr´etnˇe MT Melsungen. V Obr´azku 5.4 je zobrazen v´ yvoj ranking˚ u vybran´ ych t´ ymu ve vybran´ ych sez´on´ach. Na Obr´azku 5.4 je vidˇet, ˇze tento model nen´ı schopen rozliˇsit s´ılu u t´ ym˚ u, kter´e stˇr´ıl´ı podobnˇe vysok´ y poˇcet g´ol˚ u. Naopak s´ılu slabˇs´ıho t´ ymu je schopen zachytit velmi dobˇre.
35
Obr´azek 5.3: V´ yvoj ranking˚ u za cel´e obdob´ı
Obr´azek 5.4: V´ yvoj ranking˚ u ve vybran´ ych sez´on´ach
5.3 5.3.1
Offense-Defense Model V´ yhody a nev´ yhody modelu
Pˇri v´ ypoˇctu obrann´ ych a u ´toˇcn´ ych ranking˚ u vych´az´ıme z pˇredpokladu, ˇze vyˇsˇs´ı u ´toˇcn´ y ranking odpov´ıd´a vyˇsˇs´ı u ´toˇcn´e s´ıle t´ ymu a tedy vyˇsˇs´ımu poˇctu vstˇrelen´ ych g´ol˚ u, naopak niˇzˇs´ı obrann´ y ranking vypov´ıd´a o vˇetˇs´ı obrann´e s´ıle t´ ymu a tedy niˇzˇs´ımu poˇctu obdrˇzen´ ych g´ol˚ u. Nev´ yhodou tohoto modelu je fakt, ˇze optim´aln´ı ranking je z´ısk´av´an iteraˇcn´ım procesem. Konvergence procesu v´ ypoˇctu ranking˚ u je garantov´ana Sinkhorn-Knoppovo vˇetou [3, str. 33]. Pˇredpoklady t´eto vˇety jsou pro matici sk´ore Sij takov´e, ˇze vˇsechny ˇra´dkov´e i sloupcov´e souˇcty jsou kladn´e. Tento pˇredpoklad nemus´ı b´ yt splnˇen v prvn´ıch kolech sez´ony, kdy nˇekter´ y z t´ ym˚ u nem´a sehran´ y ani jeden z´apas. V tomto modelu je tento nedostatek eliminov´an pˇriˇcten´ım mal´e kladn´e chyby . Dalˇs´ı nev´ yhodou modelu je kromˇe volby pro v´ ypoˇcet rankingu modelu tak´e volba zastavuj´ıc´ı podm´ınky iteraˇcn´ıho procesu. Problematice citlivosti modelu na volbu a volbu zastavovac´ı podm´ınky je vˇenov´an ˇcl´anek [3, str. 35]. Pro potˇreby praktick´ ych v´ ypoˇctu bylo voleno 36
= 0, 00001 a zastavovac´ı podm´ınky ||d(k) − d(k−1) || < 0, 01. V´ yhodou tohoto modelu je zejm´ena to, ˇze pro urˇcen´ı celkov´eho rankingu t´ ymu mus´ı b´ yt urˇceny tak´e jednotliv´e rankingy obrany a u ´toku, kter´e je moˇzno vyuˇz´ıt pro podrobnˇejˇs´ı anal´ yzu s´ıly t´ ymu.
5.3.2
Interpretace v´ ysledk˚ u
Na Obr´azku 5.5, kter´ y zachycuje v´ yvoj rankingu za cel´e sledovan´e obdob´ı, je zˇrejm´a citlivost modelu v zaˇc´atc´ıch jednotliv´ ych sez´on, proto je tento model vyuˇzitelnˇejˇs´ı pro v´ ypoˇcet rankingu pouze v jednotliv´ ych sez´on´ach, kdy nedoch´az´ı ke zmˇenˇe t´ ym˚ u, kter´e hraj´ı danou sez´onu. Obr´azek 5.5: V´ yvoj celkov´ ych ranking˚ u za celkov´e sledovan´e obdob´ı
Pro ilustraci v´ yvoje ranking˚ u byla vybr´ana sez´ona 2006-2007. D´ale byl vybr´an tak´e t´ ym MT Melsungem jako z´astupce slabˇs´ıch t´ ym˚ u. V Obr´azku 5.6 je zobrazen v´ yvoj obrann´ ych a u ´toˇcn´ ych ranking˚ u vybran´ ych t´ ymu ve vybran´ ych sez´on´ach. Zachycen´e rankingy u ´toku a obrany ukazuj´ı, ˇze napˇr´ıklad t´ ym HSV Hamburg m´a lepˇs´ı obranu oproti t´ ymu THW Kiel, ale jeho u ´toˇcn´a s´ıla je menˇs´ı neˇz u THW Kiel, proto m´a celkov´ y ranking (na vykreslen´ y na Obr´azku 5.7) niˇzˇs´ı a byl tak´e ve vybran´e sez´onˇe m´enˇe u ´spˇeˇsn´ y.
37
Obr´azek 5.6: V´ yvoj ranking˚ u obrany a u ´toku t´ ym˚ u ve vybran´ ych sez´on´ach
Obr´azek 5.7: V´ yvoj celkov´ ych ranking˚ u ve vybran´ ych sez´on´ach
5.4
Porovn´ an´ı hodnot ranking˚ u s re´ aln´ ymi v´ ysledky z´ apas˚ u
V´ ysledn´e hodnoty ranking˚ u byly vyuˇzity pro pˇredpovˇed’ v´ ysledku z´apas˚ u a porovn´an´ı predikovan´ ych v´ ysledk˚ u s re´aln´ ymi v´ ysledky. Byly porovn´av´any v´ ysledky z model˚ u: 1. Colley Matrix Model pro cel´e obdob´ı (CMMC) 2. Colley Matrix Model pro jednotliv´e sezo´ ny (CMMJ) 3. Keener Ranking Model pro cel´e obdob´ı (KRMC) 4. Keener Ranking Model pro jednotliv´e sezo´ ny (KRMJ) 5. Offense-Defense Model pro cel´e obdob´ı (ODMC) 6. Offense-Defense Model pro jednotliv´e sez´ony (ODMJ) 38
Na n´asleduj´ıc´ım Obr´azku 5.8 jsou pro ilustraci zachyceny rankingy t´ ymu host˚ u a t´ ymu dom´ac´ıch urˇcen´e dle CMMC. Barevnˇe jsou zn´azornˇeny jednotliv´e koneˇcn´e stavy z´apas˚ u, modr´a odpov´ıd´a v´ yhˇre host˚ u, zelen´a v´ yhˇre dom´ac´ıch a ˇcerven´a rem´ızov´emu stavu. Obr´azek 5.8: Hodnoty ranking˚ u t´ ymu dom´ac´ıch a t´ ymu host˚ u z´ıskan´e z Colley Matrix Model
Z´apasy, kter´e skonˇcily rem´ızou (ˇcervenˇe zn´azornˇen´e), jsou rozm´ıstˇeny po cel´em prostoru, coˇz naznaˇcuje, ˇze predikovatelnost rem´ızy na z´akladˇe ranking˚ u a z nich odvozen´ ych pravdˇepodobnost´ı je problematick´a. Proto nebyly rem´ızov´e z´apasy v t´eto pr´aci predikov´any. Jedinou v´ yjimkou byly situace, kdy rankingy obou t´ ym˚ u byly shodn´e, coˇz byl velmi ˇr´ıdk´ y jev. Nejprve bylo vych´azeno z hraniˇcn´ı hodnoty pravdˇepodobnosti v´ yhry dom´ac´ıch πij = 0.5, coˇz znamen´a, ˇze pokud pravdˇepodobnost v´ yhry dom´ac´ıch byla vˇetˇs´ı neˇz 0.5 byla predikov´ana v´ yhra dom´ac´ıch, pokud pravdˇepodobnost v´ yhry dom´ac´ıch byla menˇs´ı neˇz 0.5 byla predikov´ana v´ yhra host˚ u a pokud byla pravdˇepodobnost rovna pˇresnˇe hodnotˇe 0.5, byla predikov´ana rem´ıza. ´ Uspˇeˇsnost predikce byla mˇeˇrena poˇctem, resp. procentem, shody predikovan´eho a re´aln´eho v´ ysledku. Celkov´a u ´spˇeˇsnost predikce na z´akladˇe Colley Matrix Modelu pro cel´e obdob´ı byla 68, 73%, pro jednotliv´e sezony 68, 14%; na z´akladˇe Keener Ranking Modelu pro cel´e obdob´ı byla 67, 52%, pro jednotliv´e sezony 61, 73% a na z´akladˇe Offense-Defense Modelu pro cel´e obdob´ı byla 67, 06%, pro jednotliv´e sezony 68, 53%. V´ ysledky ukazuj´ı, ˇze u ´spˇeˇsnosti predikce podle jednotliv´ ych model˚ u jsou si velmi bl´ızk´e. Neoˇcek´avanˇe se uk´azalo, ˇze predikce z´ıskan´a na z´akladˇe nejjednoduˇsˇs´ıho modelu (Colley Matrix Model) byla nej´ uspˇeˇsnˇejˇs´ı. V n´asleduj´ıc´ıch Tabulk´ach 5.2, 5.3, 5.4, 5.5, 5.6 a 5.7 jsou zachyceny podrobn´e v´ ysledky pro vˇsechny modely. Je zde vˇzdy zachycen poˇcet z´apas˚ u, kter´e skonˇcily dan´ ych stavem a procentu´aln´ı vyj´adˇren´ı predikovan´ ych v´ ysledk˚ u pro sledovan´e koneˇcn´e stavy z´apas˚ u. Procentu´aln´ı u ´spˇeˇsnost pˇredpovˇedi v´ yhry dom´ac´ıch se pohybovala v rozmez´ı od 55, 11% do 69, 20%, v´ yhry host˚ u v rozmez´ı od 80, 04% do 86, 89%. Pˇredpovˇedi rem´ız byly dle oˇcek´av´an´ı ne´ uspˇeˇsn´e.
39
´ eˇsnost pˇredpovˇedi CMMC Tabulka 5.2: Uspˇ re´aln´e v´ ysledky v´ ysledek poˇcet % rem´ıza 234 7,65 v´ yhra dom´ac´ıch 1789 58,46 v´ yhra host˚ u 1037 33,89
% predikovan´ ych v´ ysledk˚ u rem´ıza v´ yhra dom´ac´ıch v´ yhra host˚ u 0,85 43,16 55,98 0,39 69,20 30,41 0,00 16,78 83,22
´ eˇsnost pˇredpovˇedi CMMJ Tabulka 5.3: Uspˇ re´aln´e v´ ysledky v´ ysledek poˇcet % rem´ıza 234 7,65 v´ yhra dom´ac´ıch 1789 58,46 v´ yhra host˚ u 1037 33,89
% predikovan´ ych v´ ysledk˚ u rem´ıza v´ yhra dom´ac´ıch v´ yhra host˚ u 1,28 41,88 56,84 1,29 67,47 31,25 0,58 15,04 84,38
´ eˇsnost pˇredpovˇedi KRMC Tabulka 5.4: Uspˇ re´aln´e v´ ysledky v´ ysledek poˇcet % rem´ıza 234 7,65 v´ yhra dom´ac´ıch 1789 58,46 v´ yhra host˚ u 1037 33,89
% predikovan´ ych v´ ysledk˚ u rem´ıza v´ yhra dom´ac´ıch v´ yhra host˚ u 0,85 44,44 54,70 0,39 67,41 32,20 0,00 17,26 82,74
´ eˇsnost pˇredpovˇedi KRMJ Tabulka 5.5: Uspˇ re´aln´e v´ ysledky v´ ysledek poˇcet % rem´ıza 234 7,65 v´ yhra dom´ac´ıch 1789 58,46 v´ yhra host˚ u 1037 33,89
% predikovan´ ych v´ ysledk˚ u rem´ıza v´ yhra dom´ac´ıch v´ yhra host˚ u 0,85 34,62 64,53 1,12 55,11 43,77 0,48 12,63 86,89
40
´ eˇsnost pˇredpovˇedi ODMC Tabulka 5.6: Uspˇ re´aln´e v´ ysledky v´ ysledek poˇcet % rem´ıza 234 7,65 v´ yhra dom´ac´ıch 1789 58,46 v´ yhra host˚ u 1037 33,89
% predikovan´ ych v´ ysledk˚ u rem´ıza v´ yhra dom´ac´ıch v´ yhra host˚ u 2,56 41,03 56,41 3,24 67,97 28,79 3,47 16,49 80,04
´ eˇsnost pˇredpovˇedi ODMJ Tabulka 5.7: Uspˇ re´aln´e v´ ysledky v´ ysledek poˇcet % rem´ıza 234 7,65 v´ yhra dom´ac´ıch 1789 58,46 v´ yhra host˚ u 1037 33,89
% predikovan´ ych v´ ysledk˚ u rem´ıza v´ yhra dom´ac´ıch v´ yhra host˚ u 1,28 42,74 55,98 1,23 68,64 30,13 0,87 15,62 83,51
41
V dalˇs´ı f´azi byla br´ana v u ´vahu predikce vˇsech model˚ u a v´ ysledek z´apasu byl pˇredpovˇezen na z´akladˇe nejˇcastˇeji se objevuj´ıc´ı predikce koneˇcn´eho stavu. Tedy pokud napˇr´ıklad ˇctyˇri ze ˇsesti model˚ u pˇredpovˇedˇely v´ yhru dom´ac´ıch, byla pˇredpovˇezena v´ yhra dom´ac´ıch. Pokud modely pˇredpovˇedˇely v´ ysledek nerozhodnˇe (tedy tˇri pˇredpovˇedˇely v´ yhru dom´ac´ıch a tˇri v´ yhru host˚ u), byla pˇredpovˇezena v´ yhra dom´ac´ıch, nebot’ lze oˇcek´avat v´ yhodu dom´ac´ıho prostˇred´ı. Pˇri takto z´ıskan´ ych pˇredpovˇed´ıch byla pˇredpovˇed’ spr´avn´a v 70, 13% z´apas˚ u. Podrobnˇejˇs´ı informace jsou shrnuty v n´asleduj´ıc´ı Tabulce 5.9. Z t´eto tabulky je vidˇet, ˇze vyuˇzit´ı informac´ı ze vˇsech model˚ u ´ eˇsnost pˇredpovˇedi na z´akladˇe vˇsech model˚ Tabulka 5.8: Uspˇ u re´aln´e v´ ysledky v´ ysledek poˇcet % rem´ıza 234 7,65 v´ yhra dom´ac´ıch 1789 58,46 v´ yhra host˚ u 1037 33,89
% predikovan´ ych v´ ysledk˚ u rem´ıza v´ yhra dom´ac´ıch v´ yhra host˚ u 0,85 47,44 51,71 1,06 71,72 27,22 0,29 16,68 83,03
umoˇznilo zlepˇsit pˇredpovˇed’ v´ yhry dom´ac´ıch na 71, 72% a v´ yhry host˚ u na 83, 03%. Na z´avˇer byl zkoum´an vliv hraniˇcn´ı hodnoty 0.5 na u ´spˇeˇsnost predikce v´ ysledku z´apasu. Lze pˇredpokl´adat, ˇze i v h´azen´e je podstatn´a v´ yhoda dom´ac´ıho prostˇred´ı. V takov´emto pˇr´ıpadˇe by optim´aln´ı hraniˇcn´ı hodnota byla menˇs´ı neˇz 0.5, tedy byla predikov´ana v´ yhra i t´ ymu, kter´ y m´a pravdˇepodobnost v´ yhry v dom´ac´ım prostˇred´ı o nˇeco menˇs´ı neˇz 0.5 , ale vˇetˇs´ı neˇz zvolen´a optim´aln´ı hodnota. Simulaˇcnˇe byly otestov´any hodnoty bl´ızk´e 0.5, konkr´etnˇe hodnoty od 0, 4 do 0, 6. na z´akladˇe v´ ysledk˚ u byly urˇceny optim´aln´ı hodnoty hraniˇcn´ıch bod˚ u pro jednotliv´e modely. Shrnut´ı je uvedeno v Tabulce 5.9. ´ eˇsnost pˇredpovˇedi na z´akladˇe vˇsech model˚ Tabulka 5.9: Uspˇ u model CMMC CMMJ KRMC KRMJ ODMC ODMJ
optim´aln´ı hraniˇcn´ı hodnota % u ´spˇeˇsnˇe pˇredpovˇezen´ ych z´apas˚ u 0, 432 71, 80 0, 435 71, 57 0, 459 69, 25 0, 458 66, 96 0, 480 70, 29 0, 481 72, 03
Z Tabulky je zˇrejm´e, ˇze ve vˇsech modelech se projevila v´ yhoda dom´ac´ıho prostˇred´ı, coˇz znamen´a, ˇze optim´aln´ı hraniˇcn´ı hodnota byla menˇs´ı neˇz 0.5. Sn´ıˇzen´ı hraniˇcn´ı hodnoty vedlo ve vˇsech ˇsesti modelech ke zv´ yˇsen´ı u ´spˇeˇsnosti predikce v´ ysledk˚ u. Jako nej´ uspˇeˇsnˇejˇs´ı byl povaˇzov´an Offense-Defense Model, kter´ y ranking odhadoval na z´akladˇe v´ ysledk˚ u jednotliv´ ych sez´on. I kdyˇz rankingy urˇcovan´e pro jednotliv´e sez´ony by mˇely vyjadˇrovat aktu´aln´ı formu t´ ymu a predikce v´ ysledk˚ u dle nich by mˇely b´ yt pˇresnˇejˇs´ı, potvrdil se tento pˇredpoklad jen u Offense-Defense Modelu. 42
Pro ilustraci jsou uvedeny podrobn´e v´ ysledky nej´ uspˇeˇsnˇejˇs´ıho modelu se sn´ıˇzenou hranic´ı rozhodov´an´ı o v´ ysledku z´apasu v Tabulce 5.10. ´ eˇsnost pˇredpovˇedi na z´akladˇe ODMJ se sn´ıˇzenou hranic´ı Tabulka 5.10: Uspˇ re´aln´e v´ ysledky v´ ysledek poˇcet % rem´ıza 234 7,65 v´ yhra dom´ac´ıch 1789 58,46 v´ yhra host˚ u 1037 33,89
% predikovan´ ych v´ ysledk˚ u rem´ıza v´ yhra dom´ac´ıch v´ yhra host˚ u 0,43 69,66 29,91 0,84 82,28 16,88 0,87 28,64 70,49
V koneˇcn´e f´azi byl pouˇzit postup, kdy v´ ysledn´ y predikovan´ y stav byl odvozen ze vˇsech model˚ u. U model˚ u byly voleny optim´aln´ı hraniˇcn´ı hodnoty uveden´e v´ yˇse a v´ ysledek byl opˇet predikov´an podle nejˇcastˇeji se objevuj´ıc´ıho predikovan´eho stavu. T´ımto postupem se zv´ yˇsila u ´spˇeˇsnost predikce na 72, 29%. Podrobn´e v´ ysledky jsou uvedeny v Tabulce 5.11. ´ eˇsnost pˇredpovˇedi na z´akladˇe vˇsech optimalizovan´ Tabulka 5.11: Uspˇ ych model˚ u re´aln´e v´ ysledky v´ ysledek poˇcet % rem´ıza 234 7,65 v´ yhra dom´ac´ıch 1789 58,46 v´ yhra host˚ u 1037 33,89
% predikovan´ ych v´ ysledk˚ u rem´ıza v´ yhra dom´ac´ıch v´ yhra host˚ u 0,00 75,64 24,36 0,17 88,26 11,57 0,48 38,48 61,04
43
Z´ avˇ er Tato pr´ace byla zamˇeˇrena na anal´ yzu v´ ysledk˚ u z´apas˚ u z muˇzsk´e h´azen´e. Jako datov´e zdroje byly pouˇzity v´ ysledky z´apas˚ u v nˇemeck´e a ˇcesk´e nejvyˇsˇs´ı soutˇeˇzi z let 2002-2012. Celkovˇe bylo k dispozice 3060 v´ ysledk˚ u z´apas˚ u z nˇemeck´e soutˇeˇze a 1614 v´ ysledk˚ u z´apas˚ u z ˇcesk´e nejvyˇsˇs´ı soutˇeˇze. Nejprve byla data upravena. Zejm´ena bylo tˇreba sjednotit n´azvy t´ ym˚ u v ˇcesk´e soutˇeˇzi, protoˇze se v pr˚ ubˇehu sledovan´eho obdob´ı ˇcasto mˇenily. N´aslednˇe byla provedeno z´akladn´ı statistick´e zpracov´an´ı dat. Teoretick´e postupy a modely byly shrnuty v Kapitol´ach 2 a 3. V tˇechto kapitol´ach lze naj´ıt z´akladn´ı informace o pouˇzit´ ych metod´ach , formulace metod ve formˇe, ve kter´e byly d´ale vyuˇz´ıv´any v praktick´e ˇca´sti t´eto pr´ace. V Kapitole 4 je vˇzdy nejprve uvedena motivace k vytvoˇren´ı t´e konkr´etn´ı hypot´ezy, n´aslednˇe je zd˚ uvodnˇe v´ ybˇer testu pro testov´an´ı hypot´ezy, jej´ı matematick´e formulace a interpretov´any z´ıskan´e v´ ysledky testu. V´ ysledky testov´an´ı normality dat ukazuj´ı, ˇze poruˇsen´ı normality nen´ı pˇri vysok´ ych poˇctech g´ol˚ u, kter´e v h´azen´e padaj´ı, z´avaˇzn´ ym probl´emem, protoˇze v ˇradˇe pˇr´ıpad˚ u nebyla normalita dat zam´ıtnuta. Dalˇs´ı hypot´eza byla zamˇeˇrena na identifikaci line´arn´ı z´avislosti poˇctu g´ol˚ u na poˇctu odehran´ ych kol. Z v´ ysledk˚ u test˚ u lze usuzovat, ˇze hypot´eza o tom, ˇze s pˇrib´ yvaj´ıc´ıch poˇctem kol se zvyˇsuje tak´e poˇcet vstˇrelen´ ych g´ol˚ u je platn´a. Dalˇs´ı studovan´a hypot´eza se zamˇeˇrila na z´avislost koneˇcn´eho v´ ysledku z´apasu na poloˇcasov´em sk´ore. Podrobn´a anal´ yza uk´azala, ˇze u z´apas˚ u, kde rozd´ıl v poloˇcase je nejv´ yˇse jeden g´ol, jsou koneˇcn´e v´ ysledky nez´avisl´e na rozd´ılu poˇctu g´ol˚ u v prvn´ım poloˇcase. To pos´ılilo domnˇenku, ˇze z´apasy, kter´e v poloˇcase konˇc´ı mal´ ym rozd´ılem v poˇctu g´ol˚ u jsou otevˇren´e aˇz do konce z´apasu. Jako posledn´ı byla srovn´av´ana dynamiˇcnost hry v ˇcesk´e a nˇemeck´e lize. Dynamiˇcnost byla porovn´av´ana podle toho, jak ˇcasto v ˇcesk´e a v nˇemeck´e lize doch´az´ı ke zmˇenˇe stavu z´apasu mezi prvn´ım poloˇcasem a koneˇcn´ ych v´ ysledkem z´apasu. V´ ysledky test˚ u uk´azaly, ˇze domnˇenka o tom, ˇze v nˇemeck´e lize doch´az´ı k ˇcastˇejˇs´ı zmˇenˇe stavu mezi v´ ysledkem v poloˇcase a na konci z´apasu, se nepotvrdila. V posledn´ı Kapitole 5 bylo provedeno hodnocen´ı s´ıly jednotliv´ ych t´ ym˚ u z nˇemeck´e soutˇeˇze na z´akladˇe tˇrech rankingov´ ych model˚ u. Jednalo se o Colley Matrix Model, Keener Ranking Model a Offense-Defense Model. Byly odhadnuty rankingy pro jednotliv´e t´ ymy a z tˇechto ranking˚ u byl odhadnut v´ ysledek konkr´etn´ıho z´apasu. Tyto predikovan´e v´ ysledky byly porovn´any s re´aln´ ymi v´ ysledky z´apas˚ u. Pro jednotliv´e modely se u ´spˇeˇsnost predikce pohybovala v rozmez´ı od 61, 73% do 72, 29%.Jako nej´ uspˇeˇsnˇejˇs´ı byl pˇri pevnˇe zvolen´e rozhodovac´ı hranici zhodnocen Colley Matrix Model s u ´spˇeˇsnost´ı odhadu 68, 73%. Pokud byly br´ana v u ´vahu v´ yhoda dom´ac´ıho prostˇred´ı, tedy optimalizov´ana rozhodovac´ı hranice, za nej´ uspˇeˇsnˇejˇs´ı byl povaˇzov´an OffenseDefense Model s u ´spˇeˇsnost´ı 72, 03%. Pokud byly vyuˇzity pro predikci v´ ysledk˚ u z´apas˚ u v´ ystupy ze vˇsech model˚ u, byla u ´spˇeˇsnost predikce 72, 29%.
44
Literatura [1] Jiˇr´ı Andˇel. Z´aklady matematick´e statistiky. Matfyzpress, 2007. [2] Tom´aˇs Cipra. Ekonometrie. Ekopress, 2008. [3] Anjela Yuryevna Govan. Ranking Theory with Application to Popular Sports. Doctor Thesis of North Carolina State University, 2008. [4] P. James Keener. The Perron-Frobenius Theorem and the Ranking of Football Teams. Siam Review, 1993. [5] Luk´aˇs Kotlorz. Testy normality. Bakal´aˇrsk´a pr´ace MFF UK, 2012. [6] Daniel Nov´ak. The Czech Handball Server.
[cit. 29. 10. 2012]. [7] Jiˇr´ı Reif. Metody matematick´e statistiky. Z´apadoˇcesk´a univerzita, 2004. [8] Karel Zv´ara. Regrese. Matfyzpress, 2009.
45
Obsah pˇ riloˇ zen´ eho CD 1. hlavnitext.pdf -soubor obsahuj´ıc´ı text bakal´aˇrsk´e pr´ace 2. 1-Nˇ emeck´ a handbalov´ a soutˇ eˇ z.xlsx-soubor obsahuj´ıc´ı z´akladn´ı statistick´e zpracov´an´ı dat pro nˇemeckou soutˇeˇz ˇ 3. 2-Cesk´ a handbalov´ a soutˇ eˇ z.xlsx-soubor obsahuj´ıc´ı z´akladn´ı statistick´e zpracov´an´ı dat pro ˇceskou soutˇeˇz 4. dataNem.mat-soubor obsahuj´ıc´ı data pro pr´aci v Matlabu 5. hypoteza01.m-soubor obsahuj´ıc´ı program pro testy normality 6. hypoteza02.m-soubor obsahuj´ıc´ı program pro testy line´arn´ı z´avislosti 7. hypoteza03.m-soubor obsahuj´ıc´ı program pro testy z´avislosti koneˇcn´eho v´ ysledku na poloˇcasov´em sk´ore 8. ColleyMatrixModel.m a ColleyMatrixModelRocni.m-soubory obsahuj´ıc´ı program pro v´ ypoˇcty ranking˚ u dle Colley Matrix Modelu 9. KeenerModel.m a KeenerModelRocni.m-soubory obsahuj´ıc´ı program pro v´ ypoˇcty ranking˚ u dle Keener Ranking Modelu 10. OffenseDefenseModel.m a OffenseDefenseModeR.m-soubory obsahuj´ıc´ı program pro v´ ypoˇcty ranking˚ u dle Offense-Defense Modelu 11. Ranking.mat-soubor obsahuj´ıc´ı data pro pr´aci s rankingy 12. predikce.m-soubor obsahuj´ıc´ı program pro predikci v´ ysledk˚ u z´apas˚ u
46