A 2016-os magyar teljesítménytúrák adatainak elemzése Ferenci Tamás,
[email protected] 2017. február 12. Bevezető gondolatok és számítástechnikai megjegyzések A magyar teljesítménytúrák adatainak elemzése nem nehéz feladat, ugyanis a Teljesítménytúrázók Társasága (http://www.teljesitmenyturazoktarsasaga.hu/) van olyan kedves és minden évben egy – számítógéppel is jól feldolgozható – Excel-táblában összefoglalja a túrák összes fontos adatát. Ezek közül most hármat fogok felhasználni: a távot, a szintet (össz-szintemelkedés) és a túra tájegységét (hegységét). Az egyetlen „számítástechnikai” nehézség a túra tájegységének meghatározása: sajnos az Excel-tábla (nem tudom milyen oknál fogva, de ilyen szempontból nagyon peches módon) egyetlen dolgot nem tartalmaz, a tájegységet. A probléma megoldását az tette lehetővé, hogy az online túranaptár viszont megadja minden túrához a hegységet, és szerencsére az ott szereplő túranév pontosan ugyanaz, mint ami az Excel-táblában is megjelenik. Ilyen módon, számítógéppel letöltve a túranaptárat, össze tudtam kapcsolni a túrákat a tájegységekkel (is). A távnál és a szintnél csak azokat az értékeket fogadtam el, melyek értelmes számot tartalmaztak, így azok a túratávok, ahol például az intervallum jellegű megadás („20-25 km’‘) vagy pontatlan érték („kb. 15 km”) szerepelt, nem jelennek meg a mostani elemzésekben. A tájegységek kapcsán egy definíciós problémába futottam: bizonyos túrákhoz több hegység is fel van sorolva, mert a túra útvonala mindent érinti, így adódik a kérdés, hogy ezeket a túrákat melyik hegységhez soroljam az elemzésekben. . . ? Jobb híján úgy döntöttem, hogy ilyen esetekben a túrát mindegyik tájegységhez hozzárendelem. (Így egy túra többször is megjelenik az ilyen elemzésekben; annyiszor, ahány hegységet érint.) Ennek a módszernek nyilvánvaló hátránya ez a többszöröződés, ám jobbat nem tudtam tenni. Az elemzésből kizártam azokat a túratávokat, amelyek nem voltak gyalogosan teljesíthetőek (a jellegben nem szerepelt a „Gy” betű), amelyekhez nem volt tájegység, táv vagy szint (ez utóbbi kettő a fenti értelemben) megadva, amelyiknél a megadott táv 0 méter volt, és azokat, amelyek külföldön zajlottak, akár csak részben is, tehát külföldi helyszín1 is szerepelt a tájegységek között. Az elemzés R statisztikai környezet alatt készült, a vizualizáció lattice csomaggal, a jelentés pedig knitr-rel, RMarkdown formátumban. A kódot úgy írtam meg, hogy a lehető legáltalánosabb legyen (így például könnyen alkalmazható legyen más évekre is). A teljes forráskódot, és a reprodukálható jelentést közzétettem Github-on, a következő repozitóriumban: https://github.com/tamas-ferenci/TTT_TuraStatisztika. A jelentés elérhető PDF formátumban a következő címen: https://github.com/tamas-ferenci/TTT_ TuraStatisztika/blob/master/TTT_TuraStatisztika_Report.pdf (letölthető a jobb oldalt felül lévő Download feliratú gombbal).
Táv, szint- és hegységadatok egyváltozós elemzése Az adatbázis eredetileg 2452 túratávot tartalmaz. Ebből a nem gyalogos túratávokat kizárva marad 2166, a hegység nélkülieket és külföldieket kizárva 1780, táv vagy szint nélkülieket és 0 távúakat kizárva pedig 1766. A túrák megoszlását tájegység szerint – egyelőre még a bevezetőben írt összevonás nélkül – a következő ábra mutatja: 1 A következő tájegységek voltak a külföldiek: Ausztria, Bihar-hegység, Csehország, Erdély, Horvátország, Lengyelország, Németország, Románia, Szerbia, Szlovákia, Szlovénia, Ukrajna (Kárpátalja).
1
Aggteleki karszt Aggteleki karszt Cserehát Alföld Bakony Bakony Kemeneshát−Kemesesalja Balaton, Balaton−felvidék Balaton, Balaton−felvidék Bakony Börzsöny Börzsöny Pilis és Visegrádi−hg. Budai−hg. Budai−hg. Budai−hg. Gerecse Budai−hg. Gerecse Pilis és Visegrádi−hg. Budai−hg. Pilis és Visegrádi−hg. Budai−hg. Pilis és Visegrádi−hg. Börzsöny Budapest Budapest Gödöllõi−dombság Bükk Cserehát Cserhát Cserhát Börzsöny Gerecse Gerecse Pilis és Visegrádi−hg. Gerecse Vértes Göcsej Gödöllõi−dombság Gödöllõi−dombság Budapest Karancs, Medves, Heves−Borsodi−dombság Kemeneshát−Kemesesalja Keszthelyi−hegység Keszthelyi−hegység Balaton, Balaton−felvidék Kõszegi−hegység Mátra Mátra Mátraalja Mátraalja Mátraalja Mátra Mecsek Mecsek Zselic Mezõföld Õrség Pilis és Visegrádi−hg. Pilis és Visegrádi−hg. Budai−hg. Pilis és Visegrádi−hg. Gerecse Sokoró Somló Somogy Soproni−hegység Szekszárdi−dombság Szekszárdi−dombság Mecsek Velencei−hegység Vértes Villányi−hegység Zalai−dombság Zemplén Zselic 0
100
200
Túrák száma [db] 2
300
Jól látszik a rengeteg, több tájon áthaladó túra (és ebből adódóan a nagyon kis számok). Áttekinthetőbb képet kapunk a bevezetőben vázolt összevonás után:
Aggteleki karszt Alföld Bakony Balaton, Balaton−felvidék Börzsöny Budai−hg. Budapest Bükk Cserehát Cserhát Gerecse Göcsej Gödöllõi−dombság Karancs, Medves, Heves−Borsodi−dombság Kemeneshát−Kemesesalja Keszthelyi−hegység Kõszegi−hegység Mátra Mátraalja Mecsek Mezõföld Õrség Pilis és Visegrádi−hg. Sokoró Somló Somogy Soproni−hegység Szekszárdi−dombság Velencei−hegység Vértes Villányi−hegység Zalai−dombság Zemplén Zselic 0
100
200
300
400
Túrák száma [db] A túratávok hosszainak eloszlását a következő ábra mutatja (hisztogramon). Mivel van egy-két extrém hosszú túratáv, melyek miatt a legtöbb túrát tartalmazó régió elég kicsire össze lenne nyomva, így a jobb oldalon külön látható a 100 km-nél rövidebb túratávokra az eloszlás:
3
30
25
Megoszlás [%]
Megoszlás [%]
30
20
20
15
10
10 5
0
0 0
50
100
150
0
20
40
Táv [km]
60
80
100
Táv [km]
Konkrétan kiemelve, számszerűen a legrövidebb túratávok: Túra neve
Dátum
Táv [km]
Szint [m]
Mered. [‰]
Hegység
Óbudavár 0,1 Éjjel
03. 19.
0,1
5
50
Óbudavár 0,1 - A legeslegrövidebb túra
05. 08.
0,1
5
50
Decathlon Mátra Túra Törp túra 1 Kálvária Kör Óbudavár 1
04. 02.
1
0
0
Balaton, Balaton-felvidék Balaton, Balaton-felvidék Bakony Mátra
04. 02. 05. 08.
1,16 1,5
120 40
103 27
Villányi-hegység Balaton, Balaton-felvidék Bakony
És a leghosszabbak: Túra neve
Dátum
Táv [km]
Szint [m]
Mered. [‰]
Hegység
Mecseki Mátrix 130 Galyavár 140 3x50
04. 16. 11. 25. 10. 21.
135 140,22 153,9
3570 9120 4996
26 65 32
Vadrózsa 160 Galyavár 110 mérföld (177 km)
09. 10. 11. 25.
165,48 177,12
6277 11520
38 65
Mecsek Mátra Budai-hg. Pilis és Visegrádi-hg. Mátraalja Mátra Mátra
A túratávok szintjeinek eloszlása, hasonlóan jobb oldalon csak a 3000 méternél kisebb szintemelkedésű túratávok eloszlása ábrázolva:
4
30
80
25
Megoszlás [%]
Megoszlás [%]
60
40
20
15
10
20 5
0
0 0
2000
4000
6000
8000
10000
12000
0
500
Szint [m]
1000
1500
2000
2500
3000
Szint [m]
A legnagyobb szintemelkedésű túratávok (a legalacsonyabbakat nincs értelme kitáblázni, hiszen több tucat van, aminél ez nulla): Túra neve
Dátum
Táv [km]
Szint [m]
Mered. [‰]
Hegység
Mátra 115 Vadrózsa 160
06. 04. 09. 10.
121,02 165,48
6020 6277
50 38
Galyavár 110 Galyavár 140 Galyavár 110 mérföld (177 km)
11. 25. 11. 25. 11. 25.
110,7 140,22 177,12
7200 9120 11520
65 65 65
Mátra Mátraalja Mátra Mátra Mátra Mátra
Táv- és szintadatok együttes elemzése Érdekes kérdés annak vizsgálata, hogy a táv és a szintemelkedés hogyan oszlik meg, ha együtt vizsgáljuk őket, nem külön-külön, tehát ha egyszerre vesszük figyelembe, hogy mennyi egy túratáv távja és szintje. Annál is inkább, mert ezek nagyon természetesen adnak egy új paramétert (figyelmes szemlélő már az előbbi táblázatokban is észrevehette őket): a túratáv meredekségét, ami a szint és a táv hányadosa. (Ha az előbbit méterben mérjük, utóbbit kilométerben, akkor a meredekséget ezrelékben (‰) kapjuk meg.) Ez ilyen formában egyfajta „átlagos” meredekség, ami messze nem tökéletes mutató, hiszen a valóságban az is számít ugyancsak, hogy az emelkedések hogyan oszlanak meg a túra útvonalán, de ezekből az adatokból ez a legjobb, amit ki tudunk számolni. A táv- és szintadatok egy kézenfekvő ábrázolása a szóródási diagram: minden pont egy túratáv, a vízszintes koordinátája a távja, a függőleges a szintje. Íme ez a 2016-os magyar teljesítménytúra-naptárra (az áttekinthetőség kedvéért a korábban használt 100 km-es és 3000 méteres szűkítéssel):
5
100‰80‰
Szint [m]
3000
60‰ 50‰
40‰
30‰
2500
25‰
2000
20‰
1500
15‰
1000
10‰
500
5‰
20
40
60
80
100
Táv [km] Az ábra egy további extrát is tartalmaz: mivel a szint és a táv meghatározza a meredekséget, így ez a fenti síkban is feltüntethető. Ez az ábra meg is teszi ezt: halvány vonalak jelzik az adott meredekséghez tartozó táv–szint kombinációkat (a végén feltüntetve a meredekség számszerű értékét is). Ilyen módon az ábrán nem csak a táv és a szint, de a meredekség is érzékelhető. A rend kedvéért azért nézzük meg a meredekségnek is az eloszlását:
6
Megoszlás [%]
25 20 15 10 5 0 0
20
40
60
80
100 120
Meredekség [‰] A legmeredekebb túratávok (a legkevésbé meredekek ezúttal sem túl érdekesek): Túra neve
Dátum
Táv [km]
Szint [m]
Mered. [‰]
Hegység
Európai sporthét 2016 - Esti sétatúra Nyikom-csúcsfutás Nyikom-csúcs túra és vetélkedő Kálvária Kör Őszi Hazajáró 1,6km vezetett túra
09. 14.
2,1
160
76
Budai-hg.
04. 10. 04. 10.
7,1 7,1
600 600
85 85
Mátra Mátra
04. 02. 10. 30.
1,16 1,6
120 177
103 111
Villányi-hegység Pilis és Visegrádi-hg.
Látható, hogy ezek jórészt igen rövid túrák, így jöhetett ki az extrém meredekség, ezért érdekes lehet megnézni a legmeredekebb túrákat csak azon túratávok körében, melyek legalább 10 km hosszúak: Túra neve Kékes 2x Bükk 900-as csúcsai Galyavár Félmaraton Galyavár 110 mérföld (177 km) Galyavár 110 Galyavár 80 Galyavár Maraton Galyavár 60 Galyavár 140 Dr. Téry Ödön nehéz teljesítménytúra
Dátum
Táv [km]
Szint [m]
Mered. [‰]
Hegység
08. 07. 11. 11.
06. 30. 26. 25.
20,1 32 22,14 177,12
1227 2000 1440 11520
61 62 65 65
Mátra Bükk Mátra Mátra
11. 11. 11. 11. 11. 11.
25. 26. 26. 26. 25. 19.
110,7 81,18 44,28 59,04 140,22 11,7
7200 5280 2880 3840 9120 770
65 65 65 65 65 66
Mátra Mátra Mátra Mátra Mátra Pilis és Visegrádi-hg.
7
A tájegység bevonása az elemzésbe Egészítsük ki most a fenti elemzéseket a tájegységgel! A táv és szint együttes elemzésének megbontása még hegység szerint is áttekinthetetlen lenne, ezért vizsgáljuk őket külön-külön. A teljesítménytúrák távjainak eloszlása, tájegység szerint (boxplottal2 ábrázolva, ezúttal is 100 km-re szűkítve az ábrát):
Aggteleki karszt Alföld Bakony Balaton, Balaton−felvidék Börzsöny Budai−hg. Budapest Bükk Cserehát Cserhát Gerecse Göcsej Gödöllõi−dombság Karancs, Medves, Heves−Borsodi−dombság Kemeneshát−Kemesesalja Keszthelyi−hegység Kõszegi−hegység Mátra Mátraalja Mecsek Mezõföld Õrség Pilis és Visegrádi−hg. Sokoró Somló Somogy Soproni−hegység Szekszárdi−dombság Velencei−hegység Vértes Villányi−hegység Zalai−dombság Zemplén Zselic 0
20
40
60
80
100
Táv [km] A túratávok szintemelkedéseinek eloszlása boxploton, tájegység szerint (itt is 3000 méterre szűkítve az ábrát): 2 A boxploton az adatok eloszlását egy – közepén pöttyöt tartalmazó – doboz, és az abból kinyúló antennák adják meg. Az értelmezéséhez azt kell tudni, hogy a pötty az adatok felezőpontjánál van (tehát annál az értéknél, amire igaz, hogy az adatok fele kisebb nála, fele nagyobb), ezt szokás mediánnak nevezni, a doboz alja és teteje pedig az alsó és felső negyedelőpontnál (aminél az adatok negyede kisebb és háromnegyede nagyobb, illetve háromnegyede kisebb, negyede nagyobb), ezt hívják alsó és felső kvartilisnek. Például a Mátránál a doboz alja 17,8 km-nél, a teteje 46,8 km-nél, a pötty pedig 29,9 km-nél van; ez azt jelenti, hogy a mátrai túrák negyede rövidebb 17,8 km-nél, háromnegyedük hosszabb ennél, a túrák fele rövidebb 29,9 km-nél, felük hosszabb, végül háromnegyedük rövidebb 46,8 km-nél, és csak negyedük hosszabb ennél is. Ilyen módon a boxplot jól érzékelhetővé teszi, hogy milyenek egy adott hegységben az „átlagos’‘hosszak (minél jobbrább van a pötty, annál hosszabbak a túrák), és azt is, hogy ebben mennyi a szóródás (minél szélesebb a doboz, annál nagyobb). A dobozból kinyúló antennák a nagyon kilógó értékek nélküli minimumot és maximumot jelzik, az antennákon túli egyes karikák pedig ezeket a nagyon eltérő értéket mutató túrákat (a „nagyon kilógás” egy bevett statisztikai definícióját használva).
8
Aggteleki karszt Alföld Bakony Balaton, Balaton−felvidék Börzsöny Budai−hg. Budapest Bükk Cserehát Cserhát Gerecse Göcsej Gödöllõi−dombság Karancs, Medves, Heves−Borsodi−dombság Kemeneshát−Kemesesalja Keszthelyi−hegység Kõszegi−hegység Mátra Mátraalja Mecsek Mezõföld Õrség Pilis és Visegrádi−hg. Sokoró Somló Somogy Soproni−hegység Szekszárdi−dombság Velencei−hegység Vértes Villányi−hegység Zalai−dombság Zemplén Zselic 0
500
1000
1500
Szint [m] A meredekségek eloszlása pedig:
9
2000
2500
3000
Aggteleki karszt Alföld Bakony Balaton, Balaton−felvidék Börzsöny Budai−hg. Budapest Bükk Cserehát Cserhát Gerecse Göcsej Gödöllõi−dombság Karancs, Medves, Heves−Borsodi−dombság Kemeneshát−Kemesesalja Keszthelyi−hegység Kõszegi−hegység Mátra Mátraalja Mecsek Mezõföld Õrség Pilis és Visegrádi−hg. Sokoró Somló Somogy Soproni−hegység Szekszárdi−dombság Velencei−hegység Vértes Villányi−hegység Zalai−dombság Zemplén Zselic 0
20
40
60
80
100
Meredekség [‰]
Mindhárom tényező együttes elemzése Mint az előbb is említettem, a táv- és szintadatok együttes eloszlása eleve több mint ezer adatot jelent, ha ezeket még a több tucatnyi tájegység szerint is megbontjuk, az teljesen áttekinthetetlen lenne. Éppen ezért a következőkben egy új trükköt alkalmazok: nem az egyes túrákat ábrázolom, hanem a hegységenkénti átlagokat! Azaz minden hegységre kiszámolom, hogy az adott hegységet érintő túráknak mennyi a közepes hossza és a közepes szintje, és ezeket ábrázolom (a már megszokott formában, szóródási diagramként, feltüntetve a meredekségeket is). Hogy az esetleges nagyon kilógó értékű túrák ne húzzák el az átlagot, középértékként inkább a mediánt használjuk:
10
100‰ 80‰
60‰
50‰ 45‰ 40‰ Mátra
35‰ Pilis és Visegrádi−hg.
1000
Medián szint [m]
30‰ Börzsöny Zemplén Bükk
25‰
Karancs, Medves, Heves−Borsodi−dombság Cserhát Mátraalja Villányi−hegység Mecsek Gerecse
20‰
Szekszárdi−dombság Somló Keszthelyi−hegység
500
15‰
Budai−hg. Aggteleki karszt Cserehát Balaton, Balaton−felvidék Bakony Sokoró Zalai−dombság Velencei−hegység Soproni−hegység Vértes Kõszegi−hegység Zselic
10‰
Gödöllõi−dombság Göcsej Õrség Kemeneshát−Kemesesalja
5‰ Mezõföld Budapest
5
10
Somogy
15
20
Medián táv [km]
11
Alföld
25
30