Vysoká škola ekonomická v Praze Národohospodářská fakulta
E KONOMIE TENISU : NOVÉ EMPIRICKÉ TESTY TEORIE MINIMAXU (P R Á C E S T U D E N T Ů B A K A L Á Ř S K É H O S T U D I A )
Barbora Kuncová
Počet znaků:
35 927
Kontakt:
[email protected], 602543444 Číslo bankovního účtu: 179661561/0600 Podpis autora:
Abstrakt: Cílem této práce je empiricky testovat teorii minimaxu pomocí reálných dat z tenisových utkání. Práce vychází z předpokladu, že podání je pro hráče ve hře stěžejním faktorem a ovlivňuje následnou délku výměny. Z těchto předpokladů je vyvozena hypotéza, že podávající hráč hraje v souladu s teorií minimaxu tím více, čím kratší jsou délky výměn následujících po podání. Tato hypotéza je nejprve ověřena prostřednictvím regresní analýzy, poté pro posílení platnosti jejích výsledků ještě pomocí Pearsonova chí-kvadrát testu o rovnosti dvou distribucí. Na základě obou metod je tato hypotéza potvrzena.
Abstract: The objective of the thesis is to test empirically the Minimax Theorem with the help of real data from tennis matches. The thesis is based on the assumption that the serve is the crucial factor of a game for a player and that it influences the length of the following exchange. Based on these assumptions a hypothesis is deduced stating that according to the minimax hypothesis, a server plays the more, the shorter the exchanges following serve are. The hypothesis is first verified by a regression analysis and then, to strengthen the validity of its results, with the help of the Pearson’s chi-square goodness-of-fit test for equality of two distributions. The hypothesis is finally confirmed based on these two methods.
JEL classification: C72, C79, D01. Keywords: Minimax Theorem, tennis, serve.
Obsah ÚVOD....................................................................................................................................................... 1 1
MODEL A DATA ............................................................................................................................. 2 1.1
TEORETICKÝ MODEL ........................................................................................................... 2
1.2
DATA ......................................................................................................................................... 3
1.2.1
POUŽITÉ PROMĚNNÉ .................................................................................................. 4
1.2.2
POPIS DAT ...................................................................................................................... 6
1.3
EKONOMETRICKÝ MODEL .................................................................................................. 7
2
KVANTIFIKACE MODELU ........................................................................................................... 9
3
DALŠÍ OVĚŘENÍ HYPOTÉZY ..................................................................................................... 13
ZÁVĚR ................................................................................................................................................... 16 ZDROJE ................................................................................................................................................. 17 ZDROJE STATISTICKÝCH DAT ........................................................................................................ 17
ÚVOD Teorii minimaxu lze považovat za jeden ze základních stavebních kamenů teorie her. Mnoho ekonomů se proto snaží zjistit, jestli se lidé skutečně chovají tak, jak tato teorie předvídá. V minulosti byla teorie minimaxu empiricky ověřována nejprve prostřednictvím dat získaných z laboratorních experimentů, viz například O’Neil (1987). Jejich výsledky však nebyly příliš v souladu s teoretickými předpoklady minimaxu. Walker a Wooders (2001) došli k závěru, že je to způsobeno tím, že účastníci experimentů nejsou dostatečně zkušení a motivovaní v rámci konkrétní nepředvídatelné hry. Sportovní zápasy je možné, oproti uměle vytvořeným podmínkám v laboratoři, považovat za přirozený experiment. Data ze zápasů profesionálních sportovců by proto měla posloužit jako vhodnější nástroj pro testování teorie minimaxu. Na rozdíl od laboratorních experimentů jsou sportovci ve skutečném zápase vysoce motivováni vítězstvím. Zároveň jsou jejich zkušenosti v daném oboru na vysoké profesionální úrovni, protože sportu věnují většinu svého života. Vybraní účastníci laboratorních experimentů na rozdíl od nich byli s pravidly konkrétní hry seznámeni jen krátce. Tenis lze považovat za případ strategické hry s nulovým součtem, kdy jeden hráč může získat bod pouze za předpokladu, že druhý hráč ho ztratí. Preference obou hráčů jsou tedy v tomto případě diametrálně odlišné, a proto hra jednotlivých hráčů musí být nepředvídatelná. Jako vůbec první se o ověření teorie minimaxu na tenisových datech pokusili Walker a Wooders (2001). Svoji analýzu založili na jednoduchém herně-teoretickém modelu, ve kterém se podávající tenista rozhoduje, zda svůj servis umístí doleva či doprava. Přijímající hráč se naopak snaží odhadnout, jakým směrem podání bude směřovat. K otestování teorie minimaxu použili Pearsonův chí-kvadrát test o rovnosti dvou distribucí. Prostřednictvím dat z deseti mužských zápasů došli k závěru, že hra hráčů byla v souladu s teorií. Problémem jejich výsledků však bylo, že podání jednotlivých hráčů byla sériově závislá. Hsu et al. (2007) vycházeli z identického modelu a předpokladů jako Walker a Wooders (2001). O silnější podporu teorie minimaxu se pokusili rozšířením datasetu. V jejich práci jsou analyzovány nejen mužské, ale i ženské a juniorské zápasy. Použitím stejných testů dospěli k přesvědčivějšímu potvrzení teorie minimaxu. Podařilo se jim totiž prokázat také to, že jednotlivá podání byla sériově nezávislá. Tato práce se snaží navázat na zmíněné články zabývající se testováním teorie minimaxu na tenisových datech. Jejím cílem je ověřit tuto teorii inovativním způsobem, a to na základě odlišné hypotézy a metody. Pomocí dat o jednotlivých podáních a výměnách je zde nejprve prostřednictvím regresní analýzy testovaná hypotéza, že podávající hráč hraje v souladu s teorií minimaxu tím více, čím kratší jsou délky výměn následujících po podání. Následně je pro posílení výsledků plynoucích z regresní analýzy tato hypotéza ověřena pomocí Pearsonova chí-kvadrát testu o rovnosti dvou distribucí. Na základě obou metod je testovaná hypotéza potvrzena.
1
1 MODEL A DATA V této části práce je nejprve představen teoretický model a testovaná hypotéza. Poté jsou podrobně popsány jednotlivé proměnné, které jsou použity pro kvantifikaci modelu. V poslední části této kapitoly je uvedena konečná podoba odhadovaného modelu.
1.1 TEORETICKÝ MODEL Teoretický model vychází ze dvou základních předpokladů: 1) Aby hra podávajícího hráče byla v souladu s teorií minimaxu, musí být pravděpodobnost získání bodu stejná nezávisle na tom, kam hráč dané podání umístí. 2) Podání je pro hráče stěžejním faktorem. Jeho zdařilost výrazně ovlivňuje, zda podávající hráč získá bod. Z předpokladů je vyvozena hypotéza testovaná v této práci: •
Hra hráče je v souladu s teorií minimaxu tím více, čím důležitější roli má jeho podání pro získání každého bodu.
Důležitost podání je však faktor, který není přímo měřitelný. Důležitost servisu pro zisk bodu je zde proto vyjádřena pomocí délky výměny, která po podání následuje. Předchozí hypotéza může být tedy modifikována následovně:
•
Hra hráče je v souladu s teorií minimaxu tím více, čím kratší jsou výměny, protože tím je podání důležitější pro získání bodu.
V této práci je nejprve zkoumaný následující vztah:
point_won = f (left; deuce; player)
Proměnná point_won zde vyjadřuje, zda podávající hráč získal bod, či ho ztratil. Proměnné left a deuce udávají, jakým směrem bylo podání umístěno. Player označuje podávajícího hráče. První předpoklad teoretického modelu, že pravděpodobnost získání bodu by pro podávajícího hráče měla být stejná nezávisle na směru jeho podání, bude ověřen prostřednictvím proměnné left. Tato proměnná v podstatě vyjadřuje, jak může hráč ovlivnit zisk bodu tím, jakým směrem umístí podání. Vliv této proměnné by proto v ideálním případě neměl být téměř žádný. 2
Následně je do rovnice přidána proměnná length_of_rally, která udává délku výměny následující po podání.
point_won = f (left; deuce; length_of_rally; player)
V případě platnosti testované hypotézy by se po zařazení proměnné length_of_rally do modelu měl vliv proměnné left ještě snížit. Výsledky by pak měly být více v souladu s teorií minimaxu, než v případě předešlé rovnice. Zároveň se dá předpokládat, že s rostoucí délkou výměny se důležitost podání bude snižovat, bude se tedy snižovat i pravděpodobnost, že podávající hráč získá bod. Vztah mezi proměnnými point_won a length_of_rally by tedy měl být nepřímo úměrný.
1.2 DATA Pro kvantifikaci modelu jsou použita reálná data z tenisových utkání, která byla získána z oficiálních webových stránek dvou Grandslamových turnajů uskutečněných v roce 2011 - French open a US Open. K dispozici byly statistiky pro 254 různých zápasů.1 V práci jsou analyzovány pouze první servisy.2 Druhá podání jsou z důvodu jejich relativně nízkého podílu na celkovém množství servisů vynechána. Veškeré následující údaje jsou proto získány výhradně ze statistik zohledňujících pouze první servisy, výměny uskutečněné po druhém servisu jsou zcela vypuštěny.
Aby byla zvolená utkání vhodná pro testování minimaxu, musely být splněny následující předpoklady3: • •
vítězství v zápase musí být pro oba hráče důležité – tzn., že aktéři zápasu musí být dostatečně motivováni vítězstvím oba hráči se musí navzájem dobře znát, aby měli dobrou představu o tom, jak vysoké jsou jejich pravděpodobnosti π, že ze svého servisu získají bod
•
zápasy musí být tak dlouhé, aby obsahovaly dostatečné množství výměn
1
S dalšími turnaji ani s jinými ročníky zvolených turnajů nebylo možné pracovat, protože pro ně nejsou takto podrobná data k dispozici. Díky i tak vysokému množství dostupných zápasů není tento fakt pro práci nijak limitující. 2 Stejně jako v předchozích studiích ověřujících teorii minimaxu na tenisových datech – viz Walker, Wooders, 2001. 3 Jedná se o stejné předpoklady, jaké si zvolili Walker, Wooders, 2001.
3
První předpoklad je považován za splněný, protože Grandslamové turnaje, které se uskutečňují pouze čtyřikrát do roka, jsou nejprestižnější a nejlépe finančně ohodnocené.4 Každý z hráčů by měl proto mít dostatečnou motivaci dostat se do dalšího kola nezávisle na tom, o jakou fázi turnaje se jedná. Druhý předpoklad je brán taktéž jako splněný, protože každý hráč či hráčka se musí na okruhu ATP či WTA nejprve nějakou dobu pohybovat, než je schopný kvalifikovat se na takto prestižní turnaj. Třetí předpoklad byl dodržen jednoduše tím, že byly vynechány zápasy, které byly předčasně ukončeny např. z důvodu zranění jednoho z hráčů. Délka regulérně dokončených zápasů je jinak považována za dostačující.5 1.2.1 POUŽITÉ PROMĚNNÉ Celkem bylo zpracováno 12 mužských a 12 ženských zápasů pro každý z turnajů, datový set se tedy skládá dohromady ze 48 utkání.6 Každý z těchto zápasů byl rozebrán bod po bodu a u každého z míčků byly zjištěny následující proměnné: • • • • •
point_won left deuce avg_length player
Proměnná point_won vyjadřuje, zda podávající hráč získal bod. V případě, že se tak stalo, nabývá hodnoty 1, v opačném případě, tedy v případě, že bod získal soupeř, nabývá hodnoty 0. Proměnná left vyjadřuje, do jaké části čtverce, vymezeného pro dané podání, byl servis umístěn. V případě servisu směřujícího do levé části čtverce, nabývá tato binární proměnná hodnoty 1, v případě servisu doprava hodnoty 0. Deuce je proměnná, která označuje, do které části kurtu podávající hráč umístil svoje podání.7 Pokud je podání umístěno do pravé strany hřiště z pohledu přijímajícího hráče, jedná se o podání do tzv. „deuce court“ a tato proměnná nabývá hodnoty 1. V opačném případě, tedy podání do levé strany hřiště, se jedná o podání do „ad court“ a tato proměnná je rovna 0.
4
Např. na French open bylo v roce 2011 hráčům a hráčkám dohromady vyplaceno 12 064 000 euro (oběma skupinám stejně), jen za účast v prvním kole každý z hráčů obdržel 15 000 euro, za účast v každém dalším kole byla odměna navýšena téměř na dvojnásobek výše odměny z předchozího kola. 5 Záměrně nebyly vybírány pouze nejdelší zápasy s nejvyššími počty výměn, protože by mohlo dojít k nepříznivému ovlivnění výsledků z důvodu zkreslení výběru dat. 6 Kromě výše zmíněných požadavků výběr zápasů nevyžadoval žádná další kritéria, proto jsem se pro lepší systematičnost zaměřila zejména na závěrečná kola turnajů – zpracovány jsou především zápasy 4. kola, čtvrtfinále, semifinále a finále. 7 Dle tenisových pravidel musí jít podání vždy křížem, tzn., že hráč, který podává z pravé strany hřiště, musí svůj servis umístit do levé strany hřiště ze svého pohledu - do pravé z pohledu přijímajícího hráče.
4
Pro lepší pochopení toho, jaké má hráč možnosti při podání, slouží následující obrázek:
L AD COURT
L P
PŘIJÍMAJÍCÍ HRÁČ
PODÁVAJÍCÍ HRÁČ
L DEUCE COURT
P
Obrázek 1 – Schéma hřiště
Z obrázku vyplývá, že při podání jednoho hráče mohou nastat pouze čtyři následující situace: 1) 2) 3) 4)
Podání je umístěno do „ad court“ doleva. Podání je umístěno do „ad court“ doprava. Podání je umístěno do „deuce court“ doleva. Podání je umístěno do „deuce court“ doprava.
Délka výměny, vyjádřená počtem úderů obou hráčů, byla nejprve získána pro každé podání zvlášť. Následně byla zprůměrována s ohledem na to, zda se jednalo o podání do ad či deuce court a zda podávající hráč získal bod či ho ztratil. V další části této práce je proto uvažována průměrná délka výměny (avg_length). Dummy proměnná player označuje, o kterého podávajícího hráče se jedná. Vzhledem k tomu, že datový set obsahuje údaje o 48 zápasech, ve kterých proti sobě logicky nastoupilo 96 hráčů,8 bylo vytvořeno 95 dummy proměnných.
8
Skutečných hráčů se však v datasetu nachází méně. Většina z nich totiž odehrála více než jedno utkání, proto z důvodu odlišení jednotlivých zápasů může vzniknout pro jednoho konkrétního hráče více dummy proměnných.
5
1.2.2 POPIS DAT V následující tabulce jsou uvedeny popisné statistiky jednotlivých proměnných:
Tabulka 1 – Popisné statistiky proměnných
Proměnná
n
point_won
3761
avg_length
Průměr
Sm. odch.
n (=0)
n (=1)
1,0000
1193
2568
4,0000
5,0000
-
-
0,0000
1,0000
1,0000
1871
1890
0,0000
1,0000
1,0000
1821
1940
Min
Max
Q1
Medián
0,68280
0,0000
1,0000
0,46545
0,0000
1,0000
3761
4,1909
1,0000
11,143
1,6979
2,8333
left
3761
0,50253
0,0000
1,0000
0,50006
deuce
3761
0,51582
0,0000
1,0000
0,49982
Q3
Z deskriptivních statistik vyplývá, že pro všechny proměnné jsou k dispozici všechna pozorování. Dohromady je sledováno 3761 servisů ve 48 zápasech. Jedinou kvantitativní proměnnou zde zastupuje avg_length. Průměrná délka výměny se pohybovala od 1 do 11,143 úderů. Téměř stejná hodnota průměru a mediánu naznačuje, že se zde nevyskytují žádné extrémní hodnoty. V případě zbývajících proměnných se jedná o tzv. binární proměnné, které nabývají pouze hodnot 0 či 1. Z proměnné point_won můžeme vypozorovat, že v 68,28 % podání získal bod servírující hráč, což potvrzuje předpoklad, že podání je skutečně důležité pro zisk bodu. Z popisné statistiky proměnné left je patrné, že počet servisů směřujících doprava či doleva je zhruba stejný. U proměnné deuce můžeme vypozorovat, že nepatrně vyšší počet servisů míří právě do tzv. „deuce court“. Příčinou v tomto případě bude fakt, že servisem do „deuce court“ jsou zahájeny vždy liché výměny.9 Dummy proměnné pro jednotlivé hráče zde statisticky popsány nejsou z důvodu jejich vysokého počtu.
9
Poté v případě, že daná hra byla složena právě z pěti výměn, bylo do „deuce court“ umístěno o jeden servis více než do „ad court“.
6
V následujícím grafu je znázorněno, jaký podíl všech podání připadl na muže a ženy:
Celkový počet podání 2500 2000 1500 Celkový počet podání
1000 500 0 ŽENY
MUŽI Graf 1 – Celkový počet podání
Jak je patrné z grafu, ve sledovaných zápasech muži uvedli do hry větší množství servisů (60,76 %) než ženy, přestože počet zápasů byl zvolen v obou kategoriích stejný. Je to způsobeno odlišnými pravidly pro mužská a ženská utkání. Muži hrají na tři vítězné sety, kdežto ženy pouze na dva.10 Podání tenistek většinou nebývá tak důrazné jako podání tenistů.11 Proto je zde provedena analýza nejprve všech zápasů dohromady, poté pro každou skupinu zvlášť. Na základě slabšího podání žen se dá totiž předpokládat, že je pro ně servis méně důležitým faktorem než pro muže. Proto by výsledky ženských zápasů měly být o něco méně v souladu s teorií minimaxu, než výsledky mužů.
1.3 EKONOMETRICKÝ MODEL V této části práce je navržena empirická analýza výše uvedeného teoretického modelu. Cílem práce je otestovat hypotézu, že hra hráče je v souladu s teorií minimaxu tím více, čím kratší jsou výměny následující po podání.
10
Ženy v každém zápase odehrají 2-3 sety, kdežto muži 3-5 setů. Měřítkem pro toto tvrzení může být například rychlost servisů. V případě mužů je daleko vyšší, což se dá poměrně jednoduše zjistit z tenisových statistik. 11
7
Ověření bude provedeno pomocí následujících dvou regresních rovnicí:
point_won = β0 + β1left + β2deuce + β3playeri + u ( ROVNICE 1 )
point_won = β0 + β1left + β2deuce + β3avg_length + β4playeri + u ( ROVNICE 2 )
První z rovnic je zformulovaná jako základní regrese. V druhé rovnici je navíc zařazena proměnná avg_length. Aby výsledky analýzy byly v souladu s teorií minimaxu, měly by být po přidání proměnné avg_length do modelu z výsledků patrné následující skutečnosti: 1) Koeficient u proměnné left by se měl ještě snížit. Tím by byla potvrzena hypotéza, že výsledky jsou v souladu s teorií minimaxu tím více, čím kratší jsou délky výměn. 2) Zároveň by se měl prokázat předpokládaný negativní vztah mezi proměnnými point_won a avg_length. Pravděpodobnost, že podávající hráč získá bod, by se měla s rostoucí délkou výměn snižovat. Je patrné, že v obou rovnicích se v roli závislé proměnné nachází kvalitativní proměnná point_won. V případě takto specifikovaného modelu se jedná o tzv. lineární pravděpodobnostní model.12
12
Tato podoba modelu je zde zvolena z důvodu následné snazší interpretace výsledků než v případě nelineárních modelů.
8
2 KVANTIFIKACE MODELU Použití lineárního pravděpodobnostního modelu s sebou přináší problém existence heteroskedasticity. Obě regresní rovnice proto jsou odhadnuty pomocí metody nejmenších čtverců s robustními standardními chybami odhadů, pomocí níž lze předejít nadhodnocování či podhodnocování standardních chyb.
V následující tabulce jsou uvedeny výsledky obou výše zmíněných regresí:13 Tabulka 2 – Výsledky regresí odhadnutých pro všechny zápasy dohromady
Model 1: OLS, za použití pozorování 1 – 3761 nezávisle proměnná
směrodatná chyba
koeficient
const left deuce avg_length
p – value
Model 2: OLS, za použití pozorování 1 - 3761 nezávisle proměnná
0,629488
0,062005
-0,00287574
0,0155554
0,85334
left
0,0538791
0,0151993
0,00040 ***
deuce
-
koeficient determinace
-
<0,00001*** const
0,055369
avg_length
koeficient
směrodatná chyba
p - value
1,97779
0,0334591
<0,00001***
0,00101677
0,0109149
0,92579
-0,00135009
0,0108667
0,90113
-0,255215
0,00482425
<0,00001***
koeficient determinace
0,531717
Regresní rovnice s odhadnutými parametry mohou být zapsány následujícím způsobem:
point_won = 0,629488 – 0,00287574left + 0,0538791deuce + β3playeri ( ROVNICE 1 )
point_won = 1,97779 + 0,00101677left – 0,00135009deuce – 0,255215avg_length + β4playeri ( ROVNICE 2 )
13
Model 1 uvádí výsledky odhadu první regresní rovnice (ROVNICE 1), model 2 druhé regresní rovnice (ROVNICE 2).
9
Dále byly obě regresní rovnice odhadnuty zvlášť pro muže a ženy. V tabulce 3 jsou uvedeny výsledky pro mužské zápasy, v tabulce 4 pro ženské zápasy.
Tabulka 3 – Výsledky regresí odhadnutých pouze pro mužské zápasy
Model 1 – muži: OLS, za použití pozorování 1 – 2285 nezávisle proměnná const
koeficient
směrodatná chyba
Model 2 - muži: OLS, za použití pozorování 1 - 2285
p – value
nezávisle proměnná
0,616888
0,0623887
<0,00001***
const
left
0,0128243
0,0193384
0,50730
left
deuce
0,0665177
0,0190599
0,00049 ***
deuce
avg_length
-
-
koeficient determinace
-
avg_length
0,048005
koeficient
směrodatná chyba
p - value
1,98406
0,0402347
<0,00001***
0,00908763
0,0121358
0,45404
-0,00085688
0,0125306
0,94549
-0,257086
0,00628727
<0,00001***
koeficient determinace
0,610847
Tabulka 4 – Výsledky regresí odhadnutých pouze pro ženské zápasy
Model 1 – ženy: OLS, za použití pozorování 1 – 1476 nezávisle proměnná const left deuce avg_length
koeficient
směrodatná chyba
Model 2 - ženy: OLS, za použití pozorování 1 - 1476
p – value
nezávisle proměnná
2,93e-07 ***
const
0,619645
0,120256
-0,0255616
0,0259337
0,3245
left
0,0362707
0,0250170
0,1473
deuce
-
koeficient determinace
-
0,053541
avg_length
koeficient
směrodatná chyba
p - value
1,54804
0,0994616
1,45e-050 ***
-0,0116559
0,0203736
0,5673
-0,00125839
0,0196887
0,9490
-0,251241
0,0084370
6,59e-152 ***
koeficient determinace
0,416585
10
Interpretace výsledků je v případě těchto modelů14 poněkud odlišná od klasických lineárních modelů. Výsledky lze vyjádřit pouze pravděpodobnostním způsobem. Koeficient u proměnné left se ve všech modelech jeví jako velmi nevýznamný. To, zda podávající hráč získá bod, tato proměnná neovlivňuje prakticky vůbec, což je v souladu s teorií minimaxu. Jak již bylo zmíněno výše, tato teorie je totiž založena na předpokladu, že hráč by měl mít stejnou pravděpodobnost, že při svém servisu získá bod, ať ho umístí jakýmkoliv směrem. Nejvýznamnější15 je koeficient u proměnné left v první regresní rovnici odhadnuté pouze pro ženské zápasy. Tam by se jeho vliv dal interpretovat tak, že v případě, kdy hráčka umístí podání doleva, je její šance na získání bodu nižší o 0,0255616, než kdyby ho umístila doprava. To, že koeficient left je nejvyšší právě u žen, by se dalo vysvětlit tím, že v ženských zápasech nehraje podání tak důležitou roli jako u mužů. Proto se hra žen odchyluje od teorie minimaxu o něco více než hra mužů. V mužských zápasech naopak při umístění podání doleva má hráč šanci o 0,0128243 vyšší, než při podání doprava. V případě obou skupin dohromady je pravděpodobnost, že podávající hráč získá bod, o 0,00287574 nižší v případě, že svůj servis umístí doleva, než kdyby ho umístil doprava. Proměnná avg_length je ve všech modelech signifikantní na 1% hladině významnosti. Na základě tohoto zjištění může být potvrzen předpoklad, že průměrná délka výměny má skutečně vliv na to, zda podávající hráč získá bod. Vztah mezi těmito proměnnými je, jak bylo předpokládáno, negativní. Se zvyšující se délkou výměny se totiž snižuje pravděpodobnost, že podávající hráč získá bod. Odhadnutý vliv avg_length na závislou proměnnou se pohybuje od - 0,251241 u žen do - 0,257086 u mužů. V případě obou skupin dohromady z koeficientu plyne, že když se zvýší průměrná délka výměny o jednotku, sníží se pravděpodobnost zisku bodu o 0,255215. V případě žen je tento vliv nepatrně nižší, což může být způsobeno opět tím, že servis v ženských zápasech není tolik důležitým faktorem jako v případě mužských zápasů. Pokud je zde jako měřítko důležitosti servisu v konkrétním zápase uvažována průměrná délka výměny, pak by v ženských zápasech měla být vyšší než v mužských. Z následujícího grafu 2 lze vypozorovat, že tomu tak skutečně je. V případě ženských zápasů je tato délka v průměru 4,26 úderu za výměnu, kdežto v mužských zápasech byla nepatrně nižší.
14 15
Jedná se o tzv. lineární pravděpodobnostní modely, jak již bylo zmíněno výše. Spíše by se hodilo říci „nejméně nevýznamný“, p-hodnota je vyšší než 0,3.
11
Průměrná délka výměny 4,5
4,26
4,14
4 3,5 3 2,5 Průměrná délka výměny
2 1,5 1 0,5 0 ŽENY
MUŽI
Graf 2 – Průměrná délka výměny
Po přidání proměnné avg_length do modelu je patrné, že se koeficient u proměnné left snížil. V případě všech zápasů dohromady je teď pravděpodobnost, že podávající hráč získá bod, naopak vyšší při podání doleva než při podání doprava, a to o 0,00101677. V absolutním čísle se však šance, že hráč ovlivní umístěním servisu jedním konkrétním směrem výsledek, snížila o více jak dvojnásobek. Pokud jsou zvažovány mužské a ženské zápasy zvlášť, má koeficient u proměnné left to samé znaménko jako v prvním modelu, opět se však relativní pravděpodobnost získání bodu spíše z jedné strany snižuje. Na základě těchto výsledků může být tedy jednak potvrzen předpoklad, že průměrná délka výměny ovlivňuje, zda podávající hráč získá bod. Zároveň můžeme potvrdit hlavní testovanou hypotézu, že hra hráče je v souladu s teorií minimaxu tím více, čím kratší je průměrná délka výměny. Je totiž patrné, že po přidání proměnné avg_length do regrese jsou výsledky více v souladu s teorií minimaxu, protože koeficient u proměnné left se snížil. Koeficient determinace, který měří míru shody odhadnutého modelu s empirickými daty, je v případě prvního modelu velmi nízký. Nezávisle na tom, zda se jedná o muže, ženy či obě skupiny dohromady, se pohybuje lehce nad pěti procenty. Po přidání proměnné avg_length se tento koeficient výrazně zvýší. Nejmarkantnější nárůst je zaznamenán při použití dat pouze z mužských zápasů, poté lze pomocí této specifikace modelu vysvětlit 61 % variability proměnné point_won. Nízké hodnoty tohoto koeficientu však v tomto případě nejsou problémem, cílem práce totiž není vysvětlit jednotlivé determinanty ovlivňující zisk bodu.
12
3 DALŠÍ OVĚŘENÍ HYPOTÉZY Pro posílení platnosti výsledků plynoucích z výše provedené regresní analýzy, je v následující části práce testovaná hypotéza ověřena i pomocí Pearsonova chí-kvadrát testu o rovnosti dvou distribucí.16 Nulová hypotéza v tomto testu je, že pravděpodobnost, že podávající hráč získá bod je stejná, nezávisle na tom, kam je umístěn servis. Z mého datasetu byly vybírány dle průměrné délky výměny nejkratší a nejdelší zápasy. Podle mého předpokladu by měly být zápasy s nižší průměrnou délkou výměny více v souladu s teorií minimaxu než zápasy s vyšší průměrnou délkou výměny. Nejprve byly vybrány čtyři mužské zápasy pro každou ze skupin, tj. čtyři nejkratší a čtyři nejdelší zápasy. Pro každý zápas zvlášť byla vypočítána Pearsonova statistika a s ní spojená p-hodnota. V následujících tabulkách 5 a 6 jsou uvedeny výsledky testování vybraných mužských zápasů. Tabulka 5 – Výsledky testu pro hráče s nejnižší průměrnou délkou zápasu
Zápas
Podávající Court
Relativní vyjádření
Podání
Průměrná délka L
P
2,923 2,5
10 4
15 13
25 17
2,097
13
12
A
2,8336
6
5
Beck Beck
D A
2,577 2,869
5 8
Melzer
D
1,696
Melzer
A
1,522
Federer Federer
D A
3,063 3,429
Tsonga
D
Tsonga
P
L
P
10 10
50% 100%
66,7% 76,9%
0,694 1,121
0,404657 0,289729
25
48%
12
11
92,3%
91,7%
0,003
0,952933
11
54,5%
45,5%
5
4
83,3%
80%
0,02
0,886508
12 2
17 10
29,4% 80%
70,6% 20%
2 5
10 1
40% 62,5%
83,3% 50%
3,192 0,104
*0,073989 0,746886
6
6
12
50%
50%
4
5
66,7%
83,3%
0,444
0,504985
12
1
13
92,3%
7,7%
7
1
58,3%
100%
0,677
0,410593
12 14
11 10
23 24
52,2% 58,3%
47,8% 41,7%
9 12
9 8
75% 85,7%
81,8% 80%
0,157 0,137
0,692103 0,711138
3,68
9
10
19
47,4%
52,6%
6
8
66,7%
80%
0,434
0,509893
A
3,368
7
7
14
50%
50%
5
6
71,4%
85,7%
0,424
0,514828
Djokovic Djokovic
D A
4,394 4,638
13 7
5 5
18 12
72,2% 58,3%
27,8% 41,7%
11 5
5 5
84,6% 71,4%
100% 100%
0,865 1,714
0,352236 0,19043
Dolgopolov
D
2,235
1
12
13
7,7%
92,3%
1
11
100%
91,7%
0,09
0,763824
Dolgopolov
A
2,714
7
5
12
58,3%
41,7%
4
2
57,1%
40%
0,343
0,558185
US open
D
Djokovic
L
phodnota
5 4
US open
Djokovic
P
Pears. statistika
60% 76,5%
French open
D A
L
Míra vítězství
40% 23,5% % 52%
French open
Gasquet Gasquet
L+P
Počet vyhraných podání
16
Pomocí stejného testu, který byl použit k ověření teorie minimaxu v předchozích studiích - viz Walker a Wooders (2001) či Hsu et al. (2007).
13
Tabulka 6 – Výsledky testu pro hráče s nejvyšší průměrnou délkou zápasu
Zápas
Podávající
Court
Relativní vyjádření
Podání
Prům. délka L
P
L+P
L
P
Počet vyhraných podání L
P
Míra vítězství
L
P
Pears. statistika
p– hodnota
Fish Fish
D A
2,588 4,318
6 13
11 7
17 20
35,3% 65%
64,7% 35%
6 8
8 3
100% 61,5%
72,7% 42,9%
0,158 0,423
Simon
D
6,931
4
23
27
14,8%
85,2%
4
18
100%
78,3%
1,067
0,30158
Simon
A
6,368
5
13
18
27,8%
72,2%
3
9
60%
69,2%
0,138
0,709815
Murray Murray
D A
3,333 3,774
9 14
14 13
23 27
39,1% 51,9%
60,9% 48,1%
7 8
10 11
77,8% 57,1%
71,4% 84,6%
0,115 2,444
0,735039 0,118277
Chela
D
6,757
9
10
19
47,4%
52,6%
5
6
55,6%
60%
0,038
0,844674
Chela
A
8,229
16
8
24
66,7%
33,3%
7
6
43,8%
75%
2,098
0,147501
Murray Murray
D A
4,567 4,097
12 2
14 20
26 22
46,2% 9,1%
53,8% 90,9%
11 2
11 12
91,7% 100%
78,6% 60%
0,851 1,257
0,356216 0,262193
Nadal
D
5
10
11
21
47,6%
52,4%
9
9
90%
81,8%
0,286
0,59256
Nadal
A
5,514
5
15
20
25%
75%
4
11
80%
73,3%
0,089
0,765594
Djokovic Djokovic
D A
5,359 6,25
16 17
17 15
33 32
48,5% 53,1%
51,5% 46,9%
11 10
10 12
68,8% 58,8%
58,8% 80%
0,351 1,66
0,553564 0,197156
Tipsarevic
D
5,026
20
14
34
58,8%
41,2%
16
11
80%
78,6%
0,01
0,919242
Tipsarevic
A
5
15
15
30
50%
50%
9
8
60%
53,3%
0,136
0,7
French open
French open
US open
US open
Z výsledků testů pro obě skupiny mužských zápasů je patrné, že pouze v jednom případě je možné zamítnout nulovou hypotézu na 10-ti procentní hladině významnosti.17 V zápasech, v nichž průměrná délka výměny byla nejnižší, je celková p-hodnota, vypočtená ze součtu jednotlivých Pearsonových statistik (10,422) s 16 stupni volnosti, 0,843659. V případě zápasů, v nichž průměrná délka výměny byla nejvyšší, celková Pearsonova statistika nabývá hodnoty 13,169 a jí náležící phodnota je 0,660366. Ani pro jednu ze skupin proto nezamítáme hypotézu, že hráči hráli v souladu s teorií minimaxu. Navíc je patrné, že p-hodnota je vyšší pro zápasy s nižší délkou výměny. Proto i na základě Pearsonova testu může být pro mužské zápasy potvrzeno, že skutečně platí hypotéza, že hráči hrají v souladu s teorií minimaxu tím více, čím kratší je délka výměny.
Dále bude proveden ten samý test pro ženské zápasy, které byly vybrány stejným způsobem jako mužské zápasy. V následujících tabulkách 7 a 8 jsou uvedeny jeho výsledky.
17
Zápas je označen hvězdičkou *.
14
0,158654 0,423139
Tabulka 7 – Výsledky testu pro hráčky s nejnižší průměrnou délkou zápasu
Zápas
Podávající
Court
L French open
French open
US open
US open
Relativní vyjádření
Podání
Prům. délka
Li Li
D A
3,695 2,307
Kvitová
D
Kvitová
A
Sharapova Sharapova
P
L+P
L
P
Počet vyhraných podání L
P
Míra vítězství
L
Pears. statistika
p– hodnota
P
4 7
8 8
12 15
33,3% 46,7%
66,7% 53,3%
3 5
4 6
75% 71,4%
50% 75%
0,686 0,024
0,407626 0,875996
3,153
9
10
19
47,4%
52,6%
4
6
44,4%
3,207
15
5
20
75%
25%
8
4
53,3%
60%
0,46
0,497739
80%
1,111
0,291941
D A
3 3,448
3 9
15 6
18 15
16,7% 60%
83,3% 40%
3 4
13 4
100% 44,4%
86,7% 60%
0,45 0,714
0,502335 0,398025
Radwanska
D
4,218
10
5
15
66,7%
33,3%
7
Radwanska
A
3,96
8
10
18
44,4%
55,6%
4
2
70%
40%
1,25
0,263552
7
50%
70%
0,748
0,387094
Williams S. Williams S.
D A
2,421 2,75
6 6
10 10
16 16
37,5% 37,5%
62,5% 62,5%
4 6
9 8
66,7% 100%
90% 80%
1,34 1,371
0,247004 0,241567
Ivanovic
D
2,077
3
7
10
30%
70%
2
6
66,7%
85,7%
0,476
0,490153
Ivanovic
A
3
4
6
10
40%
60%
3
5
75%
83,3%
0,104
0,746886
Williams S. Williams S.
D A
2,625 2,529
2 3
15 9
17 12
11,8% 25%
88,2% 75%
2 3
14 8
100% 100%
93,3% 88,9%
0,142 0,364
0,70663 0,546494
Pavlyuchenko
D
3
10
7
17
58,8%
41,2%
6
3
60%
42,9%
0,486
0,485845
Pavlyuchenko
A
2,625
3
8
11
27,3%
72,7%
2
5
66,7%
62,5%
0,016
0,898195
Tabulka 8 – Výsledky testu pro hráčky s nejvyšší průměrnou délkou zápasů
Zápas
Podávající
Court
L French open
French open
US open
US open
Sharapova Sharapova
D A
5,053 4,619
Petkovic
D
Petkovic
A
Petkovic Petkovic
Relativní vyjádření
Podání
Prům. délka
P
L+P
L
P
Počet vyhraných podání L
P
Míra vítězství
L
Pears. statistika
phodnota
P
5 14
6 1
11 15
45,5% 93,3%
54,5% 6,7%
2 8
3 0
40% 57,1%
50% 0%
0,11 1,224
0,740144 0,268481
5,294
7
5
12
58,3%
41,7%
2
1
28,6%
20%
0,114
0,735317
5,478
11
5
16 68,75% 31,25%
7
2
63,6%
40%
0,780
0,377026
D A
4,5 5,103
14 10
12 10
26 20
53,8% 50%
46,2% 50%
10 4
10 6
71,4% 40%
83,3% 60%
0,516 0,8
0,472607 0,371093
Kirilenko
D
4,968
10
8
18
55,6%
44,4%
6
5
60%
62,5%
0,012
0,913906
Kirilenko
A
3,536
10
14
24
41,7%
58,3%
6
10
60%
71,4%
0,343
0,558185
Niculescu Niculescu
D A
5,897 4,986
6 1
2 11
8 12
75% 8,3%
25% 91,7%
4 0
1 6
66,7% 0%
50% 54,5%
0,178 1,091
0,67329 0,29627
Kerber
D
7,772
6
2
8
75%
25%
2
2
33,3%
100%
2,667
0,10247
Kerber
A
6,15
8
4
12
66,7%
33,3%
5
4
62,5%
100%
2
0,157299
Wozniacki Wozniacki
D A
7,447 7,382
18 13
6 5
24 18
75% 72,2%
25% 27,8%
14 8
5 1
77,8% 61,5%
83,3% 20%
0,084 2,492
0,771671 0,114404
Kuznets
D
4,405
14
27
41
34,1%
65,9%
7
19
50%
70,4%
1,649
0,199101
Kuznets
A
6,075
15
18
33
45,5%
54,5%
6
7
40%
38,9%
0,004
0,948139
15
Z výsledků ženských zápasů je patrné, že ani v jednom případě nebylo možné zamítnout nulovou hypotézu. V případě zápasů s nejkratší průměrnou délkou výměny je celková Pearsonova statistika, vypočítaná jako součet jednotlivých Pearsonových statistik, 9,743. K ní náležící p-hodnota je 0,87972. V zápasech s nejdelší průměrnou délkou výměny nabývá Pearsonova statistika hodnoty 14,065 a p-hodnota je 0,593899. Proto i v případě ženských zápasů nemůžeme zamítnout nulovou hypotézu, že hráčky hrají v souladu s teorií minimaxu. Stejně jako v mužských zápasech je p-hodnota vyšší u zápasů s kratší průměrnou délkou výměny. Na základě těchto výsledků může být rovněž potvrzena hypotéza testovaná v této práci, že hráčky hrají v souladu s teorií minimaxu tím více, čím kratší je průměrná délka výměny. Na rozdíl od prvního způsobu testování hypotézy prostřednictvím regresní analýzy, zde nebyl potvrzen předpoklad, že hra žen je méně v souladu s teorií minimaxu než hra mužů. V případě ženských zápasů s nejkratší délkou výměny je p-hodnota vyšší než u stejné kategorie mužských zápasů. Výsledky žen se proto zdají být naopak více v souladu s teorií minimaxu než výsledky mužů. Toto však může být způsobeno konkrétním výběrem utkání, která byla zvolena na základě průměrné délky výměny za celý zápas. Z předchozích tabulek vyplývá, že dílčí průměry pro jednotlivé hráče a strany hřiště jsou v rámci jednoho zápasu v některých případech poměrně odlišné. Zde by proto vznikl prostor pro rozšíření datasetu a vhodnější výběr utkání, jejichž průměrné délky by byly více jednotné.
ZÁVĚR Tato práce navazuje na předešlé studie, jejichž záměrem bylo empiricky ověřit, zda tenisté hrají v souladu s teorií minimaxu. Stejného cíle je zde dosaženo prostřednictvím odlišné hypotézy i metody. Výsledkem práce je potvrzení hypotézy, že tenisté hrají v souladu s teorií minimaxu tím více, čím kratší jsou délky výměn následujících po podání. Tato hypotéza je ověřena nejprve pomocí regresní analýzy, zároveň je potvrzena i prostřednictvím Pearsonova chí-kvadrát testu o rovnosti dvou distribucí. V práci byla použita data získaná z oficiálních statistik dvou Grandslamových turnajů uskutečněných v roce 2011 – French open a US open. Byl sestaven ekonometrický model, jehož prostřednictvím bylo dokázáno, že podání je pro hráče skutečně důležitou součástí hry. Proto jeho úspěšnost znatelně ovlivňuje délku výměny, a tím i pravděpodobnost, že podávající hráč získá bod. Ze stejných utkání, na nichž byla provedena regresní analýza, byly dále vybrány zápasy, v nichž průměrná délka výměny dosahovala nejnižších a nejvyšších hodnot. Pomocí Pearsonova testu o rovnosti dvou distribucí bylo dokázáno, že v případě zápasů s nejnižší průměrnou délkou výměny, jsou výsledky více v souladu s teorií minimaxu, než v případě zápasů s nejdelší délkou výměny. Přestože k dosažení výsledků byly použity dvě odlišné metody, v obou případech bylo dosaženo stejného závěru, a to potvrzení testované hypotézy.
16
ZDROJE HSU, S-H., HUANG, Ch-Y., TANG, Ch-T.: Minimax play at Wimbledon: Comment, The American Economic Review, Vol. 97, No. 1, 2007, pp. 517-523.
O’NEILL, B.: Nonmetric Test of the Minimax Theory of Two-person Zerosum Games, Proceedings of the National Academy of Sciences, Vol. 84, 1987, pp. 2106-2109.
WALKER, M., WOODERS, J.: Minimax Play at Wimbledon, The American Economic Review, Vol. 91, No. 5, 2001, pp. 1521-1538.
ZDROJE STATISTICKÝCH DAT
Data o jednotlivých podáních ze zápasů US open: http://2011.usopen.org/en_US/scores/cmatch/index.html?promo=subnav Data o délkách výměn ze zápasů US open: http://2011.usopen.org/en_US/pointstream/ps_console.html# Data o jednotlivých podáních ze zápasů French open: http://2011.rolandgarros.com/en_FR/scores/cmatch/index.html Data o délkách výměn za zápasů French open: http://2011.rolandgarros.com/en_FR/scores/pointstream/index.html
17