ˇ e republiky Akademie vˇed Cesk´ ´ Ustav teorie informace a automatizace Academy of Sciences of the Czech Republic Institute of Information Theory and Automation
RESEARCH REPORT
Lubom´ır Nevaˇril, Ludv´ık Tesaˇr Odhadov´ an´ı d´ elky fronty vozidel na kˇriˇ zovatce na z´ akladˇ e mˇ eˇren´ı pomoc´ı indukˇ cn´ıch detektor˚ u
No. 2137
October 20, 2005
´ ˇ P.O.Box 18, 182 08 Prague, Czech Republic UTIA AV CR, Tel: (+420)266052422, Fax: (+420)286890378, Url: http://www.utia.cas.cz, E-mail:
[email protected]
This report constitutes an unrefereed manuscript which is intended to be submitted for publication. Any opinions and conclusions expressed in this report are those of the author(s) and do not necessarily represent the views of the institute.
1
Contents Pˇ redmluva
3
´ 1 Uvod 1.1 Z´akladn´ı pojmy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4 6
2 Metody odhadov´ an´ı d´ elky kolony 2.1 Metoda odhadov´an´ı d´elky kolony pomoc´ı line´arn´ı regrese 2.2 Metoda odhadov´an´ı pozice kolony v˚ uˇci detektoru . . . . ´ 2.2.1 Uvod . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Varianta 1 . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Varianta 2 . . . . . . . . . . . . . . . . . . . . . . 2.2.4 Varianta 3 . . . . . . . . . . . . . . . . . . . . . . 2.2.5 Varianta 4 . . . . . . . . . . . . . . . . . . . . . . 2.2.6 Shrnut´ı . . . . . . . . . . . . . . . . . . . . . . . 2.3 Metoda odhadov´an´ı d´elky kolony pomoc´ı “pln´ıc´ıho ˇcasu”
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
8 8 11 11 12 13 15 17 25 26
3 Z´ avˇ er
29
4 Pˇ r´ılohy
31
5 Podˇ ekov´ an´ı
43
2
Pˇ redmluva Tato pr´ace vznikla jako souˇc´ast studia prvn´ıho z autor˚ u na Fakultˇe jadern´e a fyzik´alnˇe ˇ inˇzen´ yrsk´e, CVUT. Tato v´ yzkumn´a zpr´ava je draft verz´ı reˇserˇsn´ı pr´ace, a protoˇze shrnuje ˇc´ast pr´ace obou spoluautor˚ u, rozhodli jsme se ji podat jako spoleˇcnou v´ yzkumnou zpr´avu. Prvn´ı autor je autorem reˇserˇsn´ı pr´ace, jej´ıˇz fin´aln´ı verze bude pod´ana na FJFI ˇ CVUT, druh´ y z autor˚ u je ˇskolitelem. Lubom´ır Nevaˇril Ludv´ık Tesaˇr
3
´ 1 Uvod V posledn´ıch letech u n´as, ale i v jin´ ych zem´ıch cel´eho svˇeta prudce vzr˚ ust´a poˇcet osobn´ıch i n´akladn´ıch vozidel a s t´ım souvisej´ıc´ı intenzita provozu na pozemn´ıch komunikac´ıch. Probl´emy dopravn´ı z´acpy se pak negativnˇe projevuj´ı zejm´ena v centrech velk´ ych mˇest, kde hustota provozu ˇcasto i mnohon´asobnˇe pˇrevyˇsuje kapacitu, na kterou byly tyto oblasti p˚ uvodnˇe dimenzov´any. Vznikaj´ı tak v nˇekter´ ych pˇr´ıpadech i mnohasetmetrov´e kolony, kter´e jsou psychologickou z´atˇeˇz´ı nejen pro ˇridiˇce, ale tak´e m´ıstn´ı obyvatele. Ti jsou vystavov´ani nadmˇern´emu hluku a zhorˇsen´emu ˇzivotn´ımu prostˇred´ı zp˚ usoben´emu ˇskodliv´ ymi exhalacemi z vozidel. Jedn´ım ze zp˚ usob˚ u sn´ıˇzen´ı automobilov´eho provozu v dan´e oblasti je postaven´ı alternativn´ıho spojen´ı, kter´e se j´ı vyh´ yb´a. Takov´eto ˇreˇsen´ı je vˇsak obvykle velice n´akladn´e a ne vˇzdy dostateˇcnˇe u ´ˇcinn´e. Nav´ıc m˚ uˇze b´ yt v nˇekter´ ych pˇr´ıpadech neuskuteˇcniteln´e. Jinou moˇznost´ı je zaveden´ı hromadn´e dopravy. I zde se vˇsak ukazuje, ˇze navzdory jej´ım v´ yhod´am je st´ale mnoho ˇridiˇc˚ u, kteˇr´ı d´avaj´ı pˇrednost osobn´ım automobil˚ um. Hromadn´a doprava na sebe nem˚ uˇze pˇrevz´ıt funkci n´akladn´ı dopravy a m´a nˇekter´a dalˇs´ı omezen´ı, popsan´a je detailnˇeji napˇr´ıklad v [1] nebo [9]. Zcela jin´ y pˇr´ıstup nab´ız´ı myˇslenka pokusit se zv´ yˇsit p˚ uvodn´ı kapacitu pozemn´ıch komunikac´ı v zat´ıˇzen´ ych oblastech zaveden´ım efektivnˇejˇs´ıho zp˚ usobu ˇr´ızen´ı dopravy. Prvn´ım krokem k tomu bylo zaveden´ı svˇeteln´ ych signalizaˇcn´ıch zaˇr´ızen´ı (neboli “semafor˚ u”) na kˇriˇzovatk´ach. V prvn´ı f´azi se pouˇz´ıvaly sign´aly s ˇcasov´ ymi intervaly nemˇenn´e d´elky. Pozdˇeji se zaˇcalo vyuˇz´ıvat moˇznosti mˇenit d´elku sign´al˚ u v r´amci nˇekolika pˇrednastaven´ ych hodnot v z´avislosti na denn´ı dobˇe, podle informac´ı z´ıskan´ ych dlouhodob´ ym sledov´an´ım dopravn´ıho provozu na dan´em m´ıstˇe. V dneˇsn´ı dobˇe se pak st´ale ˇcastˇeji zaˇc´ınaj´ı prosazovat syst´emy (napˇr´ıklad MOTION1 , TRANSIT, SCATS a dalˇs´ı), kter´e upravuj´ı d´elky sign´al˚ u semaforu podle potˇreby aktu´aln´ıho stavu dopravy, k jehoˇz zjiˇstˇen´ı pouˇz´ıvaj´ı odhad˚ u zaloˇzen´ ych na datech z´ıskan´ ych z r˚ uzn´ ych dopravn´ıch detektor˚ u. O probl´emech ˇr´ızen´ı dopravy tˇemito, ale i jin´ ymi modern´ımi zp˚ usoby existuje velk´e mnoˇzstv´ı literatury, obecnˇejˇs´ı jsou [1], [9], [10], [11]. Pˇritom pro n´as se jako d˚ uleˇzit´e jev´ı syst´emy zaloˇzen´e na soustav´ach mikroregion˚ u [12], [13], [14], [15], [16], neboˇt se pouˇz´ıvaj´ı v ˇradˇe evropsk´ ych mˇest, mezi nimiˇz figuruje tak´e Praha. Pro tyto metody m´a velk´ y v´ yznam odhad d´elky kolon na kˇriˇzovatk´ach, kter´ ym se zab´ yv´a napˇr´ıklad [6], [13], [14]. Pˇritom ˇc´ast v dneˇsn´ı dobˇe pouˇz´ıvan´ ych a pomˇernˇe dobˇre funguj´ıc´ıch metod je 1
Method for the Optimalisation of Traffic signals In Online controlled Networks
4
zaloˇzena na klasick´em Kalmanovˇe filtru [7]. Vyskytuj´ı se vˇsak tak´e jin´e pˇr´ıstupy, neboˇt v nˇekter´ ych pˇr´ıpadech se z´avislost d´elky kolony na mˇeˇren´ ych datech ukazuje b´ yt silnˇe neline´arn´ı. ´ Ukolem popsat nebo navrhnout metodu na odhadov´an´ı d´elky kolony se zab´ yv´a tak´e tato pr´ace. Ve zbytku u ´vodn´ı ˇc´asti jsou zm´ınˇeny nˇekter´e pojmy d˚ uleˇzit´e pro pochopen´ı dalˇs´ıho textu. Druh´a ˇc´ast se zab´ yv´a vlastn´ım odhadov´an´ım d´elek kolon, pˇriˇcemˇz prvn´ı a druh´a popisovan´a metoda byly navrˇzeny tak, aby byly pouˇziteln´e na syst´emu sledov´an´ı a ˇr´ızen´ı dopravy pouˇz´ıvan´em v Praze. V ˇc´asti pˇr´ılohy jsou pak uvedeny nˇekter´e grafy, obr´azky a tabulky, kter´e nebylo moˇzno kv˚ uli jejich velikosti um´ıstit pˇr´ımo do textu.
5
1.1
Z´ akladn´ı pojmy
V t´eto ˇc´asti je uveden pˇrehled pojm˚ u, kter´e se budou vyskytovat d´ale v textu a jejichˇz znalost je d˚ uleˇzit´a k pochopen´ı popisovan´ ych princip˚ u. Definice 1 (D´elka kolony) Pod pojmem aktu´aln´ı d´elka kolony vozidel v dan´em j´ızdn´ım pruhu (nˇekdy struˇcnˇeji pouze “d´elka kolony” nebo “kolona”) budeme rozumˇet vzd´ alenost konce posledn´ıho stoj´ıc´ıho vozidla v tomto pruhu od hranice kˇriˇzovatky, v dan´em libovoln´em ˇcasov´em okamˇziku. Pokud pˇr´ıjezdov´e rameno kˇriˇzovatky m´ a v´ıce neˇz jeden j´ızdn´ı pruh, pˇredpokl´ ad´ ame, ˇze d´elky kolon v kaˇzd´em z nich jsou pˇribliˇznˇe stejn´e. Pro nˇekter´e u ´ˇcely budeme d´elku kolony vztahovat pouze k urˇcit´ym zvolen´ym ˇcasov´ym okamˇzik˚ um, tato skuteˇcnost bude vˇzdy na dan´em m´ıstˇe zd˚ uraznˇena. Definice 2 (Detektory) Pojem detektory (nebude-li uvedeno jinak) bude oznaˇcovat indukˇcn´ı smyˇcky um´ıstˇen´e v pozemn´ı komunikaci a napojen´e na dopravn´ı poˇc´ıtaˇc. Tyto smyˇcky jsou schopn´e detekovat pˇr´ıtomnost vozidla nach´azej´ıc´ıho se nad nimi na principu elektromagnetick´e indukce. Um´ıstˇen´ı tˇechto detektor˚ u pro kˇriˇzovatku 084 je schematicky zn´ azornˇeno na obr´ azku 4.18. Kˇriˇzovatky jsou vybaveny vˇetˇsinou dvˇema detektory v kaˇzd´em j´ızdn´ım pruhu. Prvn´ı b´yv´a um´ıstˇen bl´ıˇze k hranici kˇriˇzovatky (obvykle 20 – 50 metr˚ u) a naz´yv´a se “prodluˇzovac´ı detektor”. Druh´y, vzd´ alenˇejˇs´ı, b´yv´ a um´ıstˇen ve vzd´ alenosti 100 – 200 metr˚ u od hranice kˇriˇzovatky a naz´yv´ a se “strategick´y detektor”. Definice 3 (Obsazenost) Obsazenost detektoru (nebo tak´e pouze obsazenost) je veliˇcina mˇeˇren´ a automaticky pomoc´ı indukˇcn´ıch detektor˚ u a poskytovan´ a dopravn´ım poˇc´ıtaˇcem v 90 sekundov´ych intervalech. Vyjadˇruje pomˇer ˇcasu, kdy se nad detektorem vyskytovalo vozidlo, k celkov´e dobˇe intervalu a je ud´av´ana v procentech. Definice 4 (Intenzita) Intenzita dopravn´ıho proudu (zkr´acenˇe intenzita) je veliˇcina mˇeˇren´ a automaticky pomoc´ı indukˇcn´ıch detektor˚ u a poskytovan´a dopravn´ım poˇc´ıtaˇcem v 90 sekundov´ych intervalech. Vyjadˇruje poˇcet vozidel, kter´e projely nad detektorem bˇehem uplynul´eho intervalu. Ud´ av´a se ve v jednotk´ach [vozidla · hodina−1 ]. Definice 5 (Data) Pro u ´ˇcely navrˇzen´ı a otestov´an´ı metod na odhadov´ an´ı d´elek kolon byla provedena mˇeˇren´ı nˇekter´ych veliˇcin, v t´eto pr´aci souhrnnˇe oznaˇcovan´ych pojmem data. Jedn´ a se o mˇeˇren´ı na kˇriˇzovatce ulic Vltavsk´a a Hoˇrejˇs´ı n´ abˇreˇz´ı v dopravn´ıch sch´ematech oznaˇcovan´e ˇc´ıslem 084 (viz obr´azek 4.18), v pˇr´ıjezdov´em rameni leˇz´ıc´ım v ulici Hoˇrejˇs´ı n´ abˇreˇz´ı. Automaticky (tj. pomoc´ı indukˇcn´ıch detektor˚ u) byly mˇeˇreny veliˇciny obsazenost a intenzita, ruˇcnˇe d´elky kolon a ˇcasy zelen´eho a ˇcerven´eho sign´ alu semaforu. Ruˇcn´ı mˇeˇren´ı bylo provedeno ve dnech 4. 8. 2003 aˇz 8. 8. 2003 (tj. pondˇel´ı aˇz p´ atek) v dopoledn´ıch hodin´ ach 6
(pˇribliˇznˇe od 6. do 10. hodiny dopoledn´ı). Podle dne, ve kter´em byla data namˇeˇrena, na nˇe bude pozdˇeji v textu odkazov´ano jako na “pondˇeln´ı” aˇz “p´ ateˇcn´ı” mˇeˇren´ı. Hodnoty d´elek kolon byly zaznamen´av´any v 60 sekundov´ych intervalech. Definice 6 (Kongesce) Kongesce nebo tak´e dopravn´ı kongesce je pouze jin´y v´yraz pro dopravn´ı z´ acpu. Form´ alnˇe lze ˇr´ıci, ˇze u ´sek pozemn´ı komunikace je ve stavu kongesce, pokud ˇcas j´ızdy t´ımto u ´sekem v´yznamnˇe pˇrevyˇsuje ˇcas j´ızdy za bˇeˇzn´ych podm´ınek. Definice 7 (Znaˇcen´ı) Mˇejme x, y n´ahodn´e veliˇciny, f(x,y) sdruˇzenou hustotu pravdˇepodobnosti. Potom stˇredn´ı hodnotu n´ ahodn´e veliˇciny y budeme znaˇcit E(y), podm´ınˇenou hustotu pravdˇepodobnosti y za pˇredpokladu pevn´e hodnoty x = x0 oznaˇc´ıme jako f (y|x0 ) nebo f (y|x = x0 ).
7
2 Metody odhadov´ an´ı d´ elky kolony 2.1
Metoda odhadov´ an´ı d´ elky kolony pomoc´ı line´ arn´ı regrese
Anal´ yzy z´avislosti d´elky kolony na obsazenosti a intenzitˇe ukazuj´ı, ˇze tento vztah sice nen´ı line´arn´ı, ale ˇze se v urˇcit´em omezen´em rozmez´ı d´a line´arn´ı z´avislost´ı nahradit. Proto se m˚ uˇzeme pokusit vyuˇz´ıt k pˇribliˇzn´emu odhadnut´ı d´elky kolony line´arn´ı regrese. Obecn´a teorie regrese se zab´ yv´a u ´lohou pˇredpovˇedi hodnot jedn´e nebo v´ıce n´ahodn´ ych veliˇcin y1 , ..., ym na z´akladˇe mˇeˇren´ı hodnot jin´ ych n´ahodn´ ych veliˇcin x1 , ..., xn . Pro snazˇs´ı pochopen´ı v´ yznamu pˇredchoz´ı vˇety ho m˚ uˇzeme ilustrovat n´asleduj´ıc´ım pˇr´ıkladem. Mˇejme kovovou tyˇc d´elky l0 za teploty t0 a sledujme zmˇenu jej´ı d´elky pˇri r˚ uzn´ ych n´ahodn´ ych teplot´ach. Z fyziky v´ıme, ˇze mezi zmˇenou d´elky tyˇce ∆l a zmˇenou teploty ∆t existuje funkˇcn´ı z´avislost ve tvaru ∆l = l0 α · ∆t
(2.1)
kde α je koeficient d´elkov´e teplotn´ı roztaˇznosti. Na tento experiment se m˚ uˇzeme d´ıvat tak´e jako na pozorov´an´ı dvojice n´ahodn´ ych veliˇcin “prodlouˇzen´ı tyˇce” a “zmˇena teploty”. Pro u ´ˇcely pˇredpovˇedi prodlouˇzen´ı tyˇce na z´akladˇe znalosti zmˇeny teploty tedy staˇc´ı nal´ezt funkˇcn´ı z´avislost (tj. urˇcit α) ∆l na ∆t, o n´ıˇz jsme vˇedˇeli, ˇze existuje. ´ Uloha regrese je ovˇsem obecnˇejˇs´ı. M˚ uˇzeme se totiˇz pokusit pˇredpov´ıdat hodnoty n´ahodn´e veliˇciny y na z´akladˇe mˇeˇren´ı x1 , ..., xn , aniˇz bychom pˇredpokl´adali existenci funkˇcn´ı z´avislosti2 y = y(x1 , ..., xn ). Mˇejme napˇr´ıklad naklonˇenou rovinu se “zvlnˇen´ ym” povrchem parametrizovan´ ym veliˇcinou θ ∈ {1, 2, ..., n}. Pouˇstˇejme vˇzdy z jednoho m´ısta na povrchu naklonˇen´e roviny kuliˇcku, kter´a nakonec spadne do jedn´e z n + 2 krabic um´ıstˇen´ ych v jedn´e ˇradˇe pod touto rovinou. Aˇt povrch roviny je konstruov´an tak, aby pro kaˇzdou z moˇzn´ ych hodnot θ vˇzdy kuliˇcka skonˇcila se stejnou pravdˇepodobnost´ı v nˇekter´e trojici sousedn´ıch krabic. Potom n´ahodnou veliˇcinu “poˇrad´ı krabice, ve kter´e skonˇcila kuliˇcka” urˇcitˇe nelze povaˇzovat za funkci parametru θ. Pˇritom se ale tato z´avislost d´a do urˇcit´e m´ıry aproximovat funkˇcn´ı z´avislost´ı. To je pr´avˇe u ´kolem regrese. M´ame tedy n´ahodnou veliˇcinu y, jej´ıˇz hodnoty chceme odhadovat z mˇeˇren´ı hodnot x1 , ..., xn pomoc´ı odhadnut´ı funkce y = y(x1 , ..., xn ) . Ot´azkou z˚ ust´av´a, jak´ ym zp˚ usobem tuto funkci naj´ıt. N´asleduj´ıc´ı definice a vˇety jsou pˇrevzaty z literatury [4], kde lze tak´e 2
Takov´ato snaha nemus´ı b´ yt nutnˇe nelogick´a, jak by se mohlo na prvn´ı pohled zd´at.
8
naj´ıt jejich d˚ ukazy. V praxi velmi ˇcast´ ym zp˚ usobem je hled´an´ı odhadu s minim´aln´ı stˇredn´ı kvadratickou chybou. Oznaˇcme jeˇstˇe (x1 , ..., xn ) = x a f (x ) odhadovanou funkci. Vˇ eta 1 Aˇt M(x) znaˇc´ı podm´ınˇenou stˇredn´ı hodnotu E(y|x). Potom v´yraz E[y − f (x)]2 je minim´ aln´ı, pr´avˇe kdyˇz f (x) = M (x). Definice 8 Funkci M (x) z vˇety 1 naz´yv´ ame regresn´ı funkci y na x1 , ..., xn a jej´ı stˇredn´ı kvadratick´ a chyba je rovna pr´avˇe E[y − f (x)]2 . Poˇzadavek, aby byla stˇredn´ı kvadratick´a chyba minim´aln´ı ovˇsem nen´ı jedin´e krit´erium, podle kter´eho lze stanovit funkci f (x ). Oznaˇcme %(y, f ) =
cov(y, f ) σf σy
(2.2)
korelaci n´ahodn´ ych veliˇcin y a f (σf a σy znaˇc´ı odmocniny rozptyl˚ u pˇr´ısluˇsn´ ych veliˇcin, cov(y, f ) jejich kovarianci). Potom m˚ uˇzeme na hledanou funkci f poloˇzit podm´ınku, aby maximalizovala v´ yraz 2.2. Vˇ eta 2 Mˇejme funkci M (x) z vˇety 1. Potom %(y, M ) ≥ 0 %(y, M ) ≥ %(y, f )
kde f je libovoln´y jin´y odhad
(2.3)
Z d˚ ukazu pˇredchoz´ı vˇety (uveden´ y v [4], str. 303) plyne, ˇze korelace %(y, f ) nab´ yv´a sv´eho maxima pokud %(M, f ) = 1, tedy pokud je f line´arn´ı funkc´ı M , ˇcili i pro samotnou funkci M . Tedy regresn´ı funkce nejen minimalizuje stˇredn´ı kvadratickou chybu, ale z´aroveˇ n i maximalizuje korelaci %(y, f ) pˇres vˇsechny odhady f . Je-li regresn´ı funkce line´arn´ı, potom ji lze urˇcit pomˇernˇe snadno, staˇc´ı k tomu zn´at stˇredn´ı hodnoty, rozptyly a kovariance n´ahodn´ ych veliˇcin y, x1 , ..., xn . Lze ji zapsat ve tvaru M (x) = a + b1 · x1 + ... + bn · xn , aby platilo Cb = c a = E(y) − bT E(x)
(2.4)
Pˇritom b = (b1 , ..., bn ), C je kovarianˇcn´ı matice promˇenn´ ych x1 , ..., xn a c je vektor kovarianc´ı y s x1 , ..., xn . V takov´em pˇr´ıpadˇe mluv´ıme (podle definice v [4], str. 304) o line´arn´ı regresi. Regresn´ı funkce m˚ uˇze b´ yt ovˇsem sloˇzitˇejˇs´ı a v takov´em pˇr´ıpadˇe je jej´ı nalezen´ı podstatnˇe obt´ıˇznˇejˇs´ı. M˚ uˇzeme se vˇsak spokojit s t´ım, ˇze nebudeme hledat pˇr´ımo regresn´ı funkci, ale pouze jej´ı nejlepˇs´ı odhad mezi line´arn´ımi funkcemi. N´avod k tomu d´av´a n´asleduj´ıc´ı vˇeta. Vˇ eta 3 Line´arn´ı funkce definovan´a v 2.4 minimalizuje v´yraz E[y − f (x)]2 mezi vˇsemi line´ arn´ımi funkcemi. Z´aroveˇ n maximalizuje v´yraz 2.2 (opˇet mezi line´ arn´ımi funkcemi). 9
Ot´azkou ale nad´ale z˚ ust´av´a, jak´ ym zp˚ usobem z namˇeˇren´ ych dat urˇcit koeficienty a a b. Pro pˇr´ıpad line´arn´ı regrese je tento probl´em detailnˇeji pops´an v [2], parametry se odhaduj´ı metodou nejmenˇs´ıch ˇctverc˚ u. My vyuˇzijeme n´asleduj´ıc´ı tvrzen´ı. Vˇ eta 4 Mˇejme matici ˇc´ısel X ∈ Rn,k , n > k, vektor Y ∈ Rn . Potom v´yraz (Y − −Xb)T (Y − Xb) nab´yv´a sv´eho minima pˇres b ∈ Rk pr´ avˇe kdyˇz b = (XT X)−1 XT Y
(2.5)
Za urˇcit´ ych dalˇs´ıch pˇredpoklad˚ u se d´a uk´azat, ˇze vektor b z v´ yrazu 2.5 je nestrann´ ym odhadem parametru b z rovnic 2.4, popˇr´ıpadˇe dalˇs´ı zaj´ımav´e vlastnosti. Ty pro n´as ovˇsem nejsou tolik d˚ uleˇzit´e, neboˇt v naˇsem pˇr´ıpadˇe o regresn´ı funkci v´ıme, ˇze by mohla b´ yt alespoˇ n “ˇc´asteˇcnˇe line´arn´ı”, a proto budou vˇsechna tato tvrzen´ı platit pouze pˇribliˇznˇe. Nyn´ı uˇz m˚ uˇzeme vyzkouˇset metodu na re´aln´ ych datech. Jako matici X zvol´ıme data z detektor˚ u, za vektor Y ale dosad´ıme d´elky kolon vyhlazen´e pomoc´ı exponenci´aln´ıho zapom´ın´an´ı podle vztahu Y¯1 = Y1 Y¯k+1 = αYk + (1 − α)Y¯k
(2.6)
(kde jsme zvolili α = 0, 5 a index k prob´ıh´a pˇres vˇsechny namˇeˇren´e d´elky kolon) neboˇt odhad parametr˚ u touto metodou je znaˇcnˇe citliv´ y na n´ahl´e zmˇeny v d´elce kolony, kter´e nav´ıc mohou b´ yt zp˚ usobeny nepˇresnost´ı ruˇcn´ıho mˇeˇren´ı. Grafy pr˚ ubˇeh˚ u odhadnut´e d´elky kolony a kolony vyhlazen´e exponenci´aln´ım zapom´ın´an´ım jsou uvedeny v pˇr´ıloze na obr´azc´ıch 4.13, 4.14, 4.16 a 4.17. M˚ uˇzeme si na nich vˇsimnout, ˇze pro pondˇel´ı a p´atek, kdy byly kolony kr´atk´e, se odhady pomˇernˇe dobˇre shoduj´ı se skuteˇcnost´ı, zat´ımco ve ˇctvrtek a stˇredu m˚ uˇzeme pozorovat v´ yznamnˇejˇs´ı odchylky, zejm´ena pro dlouh´e kolony. To je ovˇsem v´ ysledek, kter´ y se oˇcek´aval, neboˇt samotn´e hodnoty obsazenosti a intenzity na detektorech nenesou informaci o stavu kolony, kter´a sah´a daleko za tyto detektory. Tyto grafy ovˇsem zobrazuj´ı odhady d´elky kolony, kter´e byly provedeny na stejn´e mnoˇzinˇe dat, na kter´ ych byly odhadnuty tak´e parametry pro line´arn´ı regresi. Obr´azek 4.15 zobrazuje pr˚ ubˇeh d´elky p´ateˇcn´ı kolony a jej´ıho odhadu pomoc´ı parametr˚ u “nauˇcen´ ych” na pondˇelku. V [2] je popsan´a konstrukce testu, kter´ y se pouˇz´ıv´a k testov´an´ı hypot´ezy H0 (promˇenn´a y nez´avis´ı na veliˇcinˇe xi , ve smyslu znaˇcen´ı z rovnice 2.4), oproti alternativˇe H1 (promˇenn´a y z´avis´ı na veliˇcinˇe xi ). Tento test je zaloˇzen na testovac´ı statistice ti = q
|bi |
i ∈ {2, 3, ..., n}
s2 · vi,i
(2.7)
kde n je poˇcet nez´avisle promˇenn´ ych (xi , i ∈ n ˆ ), ze kter´ ych odhadujeme funkci y, bi jsou sloˇzky vektoru b z rovnice 2.5, vi,i jsou diagon´aln´ı prvky matice (XT X)−1 a s2 = P 2 P P P = Yi − b1 Yi − b2 Xi,2 Yi − ... − bn Xi,n Yi , vˇsechno znaˇcen´ı ve smyslu rovnice 10
2.5. Pˇritom z toho, jak je test konstruov´an se d´a volnˇe ˇr´ıci, ˇze ˇc´ım vˇetˇs´ı je hodnota ti , t´ım vˇetˇs´ı je pravdˇepodobnost, ˇze y z´avis´ı na xi (neboˇt pro niˇzˇs´ı hladinu v´ yznamnosti testu se kvantil studentova rozdˇelen´ı, se kter´ ym je hodnota ti srovn´av´ana, posouv´a po re´aln´e ose smˇerem doprava). Vzhledem k naˇsim pˇredpoklad˚ um o z´avislosti d´elky kolony na mˇeˇren´ ych datech bude tento test platit pouze pˇribliˇznˇe, nem´a proto smysl testovat z´avislost jednotliv´ ych dat z detektor˚ u pro r˚ uzn´e hladiny v´ yznamnosti testu. M˚ uˇzeme ale vyuˇz´ıt pˇredchoz´ıho poznatku a sledovat, pro kter´a data bude pˇr´ısluˇsn´a hodnota statistiky ti nejvˇetˇs´ı. Ukazuje se, ˇze pro stˇredu a ˇctvrtek, kdy kolony byly nejdelˇs´ı, jsou z tohoto hlediska nejd˚ uleˇzitˇejˇs´ımi daty obsazenosti strategick´ ych detektor˚ u. Celkovˇe lze ˇr´ıci, ˇze tato metoda splnila oˇcek´av´an´ı nen´aroˇcn´eho zp˚ usobu odhadov´an´ı d´elky kolony. Na obr´azku 4.15 vid´ıme pomˇernˇe dobrou shodu odhadu se skuteˇcn´ ym pr˚ ubˇehem kolony, a to i v pˇr´ıpadˇe, ˇze parametry pouˇzit´e pro tento odhad byly z´ısk´any pomoc´ı mˇeˇren´ı z jin´eho dne s podobn´ ym pr˚ ubˇehem d´elky kolony. Lze tedy usuzovat, ˇze pˇredpoklad pˇribliˇznˇe line´arn´ı z´avislosti d´elky kolony na mˇeˇren´ ych datech je opr´avnˇen´ y a ˇze metodu lze pouˇz´ıt s pomˇernˇe uspokojiv´ ymi v´ ysledky.
2.2 2.2.1
Metoda odhadov´ an´ı pozice kolony v˚ uˇ ci detektoru ´ Uvod
Jeden z ne pˇr´ıliˇs komplikovan´ ych zp˚ usob˚ u je odhadovat, zda kolona aut konˇc´ı jeˇstˇe pˇred dan´ ym detektorem, nebo aˇz za n´ım. Protoˇze jsou v Praze kˇriˇzovatky vybaveny vˇetˇsinou dvˇema detektory (v r˚ uzn´e vzd´alenosti od hranice kˇriˇzovatky) v kaˇzd´em pˇr´ıjezdov´em rameni, bude se jednat o metodu, kter´a rozliˇsuje tˇri stupnˇe d´elky kolony. Z´akladn´ı myˇslenka t´eto metody je n´asleduj´ıc´ı. Pokud kolona aut sah´a aˇz po detektor, mˇelo by nˇekter´e auto st´at pˇr´ımo nad n´ım a detektor pak vyk´aˇze vysokou obsazenost. Skuteˇcnost je vˇsak trochu komplikovanˇejˇs´ı a pro vyuˇzit´ı je potˇreba tuto myˇslenku trochu upravit. Uˇz ze zbˇeˇzn´e anal´ yzy dat z detektor˚ u si lze povˇsimnout, ˇze i v pˇr´ıpadˇe, kdy kolona aut sah´a daleko za detektor, nemus´ı b´ yt obsazenost nutnˇe 100%. Data jsou totiˇz poskytov´ana detektorem pravidelnˇe v 90 sekundov´ ych intervalech, kter´e nejsou nijak synchronizov´any se svˇeteln´ ymi sign´aly na kˇriˇzovatce. M˚ uˇze pak nastat situace, kdy se auta ze ˇ zadn´ı ˇc´asti kolony pˇremistuj´ı pˇres detektor smˇerem ke kˇriˇzovatce, aby zaplnily m´ısto po autech, kter´a odjela na zelenou. Situace je naznaˇcena na obr´azku 2.1. Tedy namˇeˇren´a obsazenost bude odpov´ıdat proj´ıˇzdˇej´ıc´ım vozidl˚ um a bude oproti maxim´aln´ı moˇzn´e hodnotˇe o nˇeco niˇzˇs´ı. D´ale pak m˚ uˇze nastat situace, kdy kolona aut sice sah´a aˇz za detektor, ale kdy dvˇe sousedn´ı auta, kter´a stoj´ı nejbl´ıˇze k detektoru, maj´ı mezi sebou pˇr´ıliˇs velk´ y rozestup a ani jedno nestoj´ı nad detektorem. V takov´em pˇr´ıpadˇe detektor zaznamen´a n´ızkou obsazenost zkresluj´ıc´ı v´ ysledek metody. Tato situace je naznaˇcena na obr´azku 2.2. Tyto a dalˇs´ı n´ahodn´e jevy pak mohou m´ıt vliv na data pˇrich´azej´ıc´ı z detektor˚ u. 11
Figure 2.1: Zmˇena obsazenosti zp˚ usoben´a pˇresunem vozidel v r´amci kolony
Figure 2.2: Zkreslen´ı obsazenosti zp˚ usoben´e velk´ ym odstupem dvou vozidel Metoda se bude rozhodovat na z´akladˇe obsazenosti, kterou bude porovn´avat s urˇcitou v´ yznaˇcnou hodnotou (z pˇredchoz´ıho odstavce lze usuzovat, ˇze bude pravdˇepodobnˇe menˇs´ı neˇz 100%). Je tedy nutn´e tuto v´ yznaˇcnou hodnotu vhodn´ ym zp˚ usobem urˇcit. Pojmenujme d´ale tuto hodnotu “mezn´ı hodnotou obsazenosti” nebo tak´e “mezn´ı obsazenost´ı”.
2.2.2
Varianta 1
Prvn´ı z moˇznost´ı, kter´e se nab´ızej´ı, je pokusit se tuto hodnotu naj´ıt v literatuˇre. V [1] je zhruba nast´ınˇena metoda detekce kongesc´ı, kter´a se rozhodne signalizovat dopravn´ı z´acpu, pokud hodnota obsazenosti detektoru v dan´em ˇcasov´em intervalu pˇrekraˇcuje 70%. Zkusme tedy tuto hodnotu pˇrevz´ıt a otestovat metodu na skuteˇcn´ ych datech ze stˇredeˇcn´ıho mˇeˇren´ı. Nejprve se pod´ıvejme na u ´daje z prodluˇzovac´ıch detektor˚ u, vzd´alen´ ych 41 metr˚ u od hranice kˇriˇzovatky. Jsou dva, pro kaˇzd´ y j´ızdn´ı pruh jeden, proto jako obsazenost uvaˇzujme pr˚ umˇer jimi ud´avan´ ych hodnot. Nyn´ı uˇz jen staˇc´ı spoˇc´ıtat, v kolika pˇr´ıpadech by metoda rozhodla spr´avnˇe. Jsou to pˇr´ıpady, kdy: • obsazenost je nad a vˇcetnˇe 70% a z´aroveˇ n kolona je delˇs´ı neˇz 41 metr˚ u, • obsazenost je pod 70% a z´aroveˇ n d´elka kolony je kratˇs´ı neˇz 41 metr˚ u. Ostatn´ı pˇr´ıpady povaˇzujeme za nespr´avn´e rozhodnut´ı. Uˇcin´ıme-li tak, zjist´ıme ˇze: • pro obsazenost nad a vˇcetnˇe 70% je 40 ze 40 pˇredpovˇed´ı spr´avn´ ych (tj. kolona delˇs´ı neˇz 41 m), u ´spˇeˇsnost 100%,
12
• pro obsazenost pod 70% je 9 z 88 pˇredpovˇed´ı spr´avn´ ych (tj. kolona kratˇs´ı neˇz 41 m), u ´spˇeˇsnost pˇribliˇznˇe 10%. Celkov´a u ´spˇeˇsnost metody na tˇechto datech z prodluˇzovac´ıch detektor˚ u pak vych´az´ı pˇribliˇznˇe 38% (49 spr´avn´ ych pˇredpovˇed´ı ze 128 celkem). Nyn´ı si vezmˇeme strategick´e detektory a zopakujme pro nˇe cel´ y postup. Jako v´ ysledek pak dostaneme: • pro obsazenost nad a vˇcetnˇe 70% je 1 z 1 pˇredpovˇedi spr´avn´a (tj. kolona delˇs´ı neˇz 146 m), u ´spˇeˇsnost 100%, • pro obsazenost pod 70% je 22 ze 127 pˇredpovˇed´ı spr´avn´ ych (tj. kolona kratˇs´ı neˇz 146 m), u ´spˇeˇsnost pˇribliˇznˇe 17%. Celkov´a u ´spˇeˇsnost metody na tˇechto datech ze strategick´ ych detektor˚ u pak vych´az´ı pˇribliˇznˇe 18% (23 spr´avn´ ych pˇredpovˇed´ı ze 128 celkem). Metoda tedy sice funguje, ale jiˇz na z´akladˇe zde uveden´ ych v´ ysledk˚ u lze usuzovat, ˇze lze jej´ı odhady zpˇresnit. Chyby mohou b´ yt zp˚ usobeny napˇr´ıklad pr˚ umˇerov´an´ım dat ze dvou detektor˚ u vˇzdy do jedn´e hodnoty. Dalˇs´ım zdrojem chyb m˚ uˇze b´ yt skuteˇcnost, ˇze v p˚ uvodn´ı metodˇe uveden´e v literatuˇre [1] byla kˇriˇzovatka vybavena takzvan´ ymi “kongescenˇcn´ımi detektory” speci´alnˇe upraven´ ymi tak, aby eliminovali nedostatky bˇeˇzn´ ych detektor˚ u, projevuj´ıc´ı se v situaci zn´azornˇen´e na obr´azku 2.2. V neposledn´ı ˇradˇe pak mus´ıme uv´aˇzit, ˇze p˚ uvodn´ı metoda je urˇcena pouze k detekci kongesce, nikoli k odhadov´an´ı d´elky kolony. Jak si lze snadno vˇsimnout, je hodnota 70% silnˇe nadhodnocena. Podle tabulek 4.2 na stranˇe 32 a 4.3 na stranˇe 33 sah´a kolona za detektor uˇz pˇri mnohem niˇzˇs´ıch hodnot´ach obsazenosti.
2.2.3
Varianta 2
Jak bylo naznaˇceno ve shrnut´ı pˇredchoz´ı metody, velk´a ˇc´ast jej´ıch nespr´avn´ ych rozhodnut´ı spoˇc´ıvala v pˇr´ıliˇs hrub´em odhadu hodnoty mezn´ı obsazenosti. M˚ uˇzeme tedy vyuˇz´ıt poznatku, ˇze hodnota obsazenosti 70% byla nadsazen´a a pokusit se ji urˇcit l´epe. M˚ uˇzeme se napˇr´ıklad pokusit seˇradit obsazenosti podle velikosti a pak z nich vybrat nejniˇzˇs´ı moˇznou, pro kterou jeˇstˇe podle namˇeˇren´ ych dat sahala kolona aˇz za detektor. Popˇr´ıpadˇe aˇz druhou nejniˇzˇs´ı, abychom ˇc´asteˇcnˇe eliminovali n´ahodn´e chyby. Vezmˇeme nyn´ı tuto upravenou metodu a otestujme ji nejprve na stejn´ ych datech jako pˇredchoz´ı. Pro prodluˇzovac´ı detektor m˚ uˇzeme z tabulky 4.2 vyˇc´ıst mezn´ı hodnotu obsazenosti 42,5% (tj. nejniˇzˇs´ı hodnota pˇri kter´e kolona sah´a za detektor z takov´ ych hodnot, pro kter´e existuje pr´avˇe jedna vyˇsˇs´ı hodnota obsazenosti, pro kterou kolona konˇc´ı uˇz pˇred detektorem). Uvaˇzujme nyn´ı obdobnˇe jako v prvn´ı variantˇe. Metoda by rozhodla spr´avnˇe, pokud: • obsazenost je nad a vˇcetnˇe 42,5% a z´aroveˇ n kolona je delˇs´ı neˇz 41 metr˚ u, • obsazenost je pod 42,5% a z´aroveˇ n d´elka kolony je kratˇs´ı neˇz 41 metr˚ u.
13
Spoˇcteme-li nyn´ı jednotliv´a rozhodnut´ı, dostaneme, ˇze: • pro obsazenost nad a vˇcetnˇe 42,5% je 115 z 1163 pˇredpovˇed´ı spr´avn´ ych (tj. kolona delˇs´ı neˇz 41 m), u ´spˇeˇsnost pˇribliˇznˇe 99%, • pro obsazenost pod 42,5% je 8 z 12 pˇredpovˇed´ı spr´avn´ ych (tj. kolona kratˇs´ı neˇz 41 m), u ´spˇeˇsnost pˇribliˇznˇe 67%. Celkov´a u ´spˇeˇsnost pro prodluˇzovac´ı detektory je pˇribliˇznˇe 96% (123 spr´avn´ ych v´ ysledk˚ u ze 128 celkem). Podobnˇe pro strategick´e detektory m˚ uˇzeme vyˇc´ıst mezn´ı hodnotu obsazenosti (stejn´ ym postupem jako pro prodluˇzovac´ı detektor) 42%. Spoˇctˇeme opˇet jednotliv´a rozhodnut´ı a dostaneme: • pro obsazenost nad a vˇcetnˇe 42% je 82 z 83 pˇredpovˇed´ı spr´avn´ ych (tj. kolona delˇs´ı neˇz 146 m), u ´spˇeˇsnost pˇribliˇznˇe 99%, • pro obsazenost pod 42% je 21 ze 45 pˇredpovˇed´ı spr´avn´ ych (tj. kolona kratˇs´ı neˇz 146 m), u ´spˇeˇsnost pˇribliˇznˇe 47%. Celkov´a u ´spˇeˇsnost pro strategick´e detektory je pˇribliˇznˇe 80% (103 spr´avn´ ych v´ ysledk˚ u z 128 celkem). Je vidˇet, ˇze takto modifikovan´a metoda je zat´ım mnohem u ´spˇeˇsnˇejˇs´ı neˇz jej´ı pˇredchoz´ı varianta. Mus´ıme si vˇsak uvˇedomit, ˇze jsme ji testovali na stejn´ ych datech, na kter´ ych jsme ji “nauˇcili” (tj. ˇze mezn´ı hodnoty obsazenost´ı byly stanoveny podle stejn´ ych dat na kter´ ych jsme metodu pozdˇeji zkouˇseli). Vˇsimnˇeme si jeˇstˇe jednoho faktu: aˇckoli byly mezn´ı hodnoty obsazenosti stanovov´any pro prodluˇzovac´ı i strategick´e detektory zvl´aˇsˇt, jsou v´ ysledky podobn´e (42,5% v prvn´ım pˇr´ıpadˇe a 42% ve druh´em). To nab´ız´ı myˇslenku, ˇze existuje urˇcit´a univerz´aln´ı mezn´ı hodnota obsazenosti platn´a pro tuto metodu nez´avisle na konkr´etn´ım detektoru, popˇr´ıpadˇe dalˇs´ıch vnˇejˇs´ıch vlivech.4 Abychom tedy mohli metodu l´epe zhodnotit, otestujeme ji jeˇstˇe na datech z ostatn´ıch dn˚ u. Pouˇzit´ım mezn´ıch hodnot urˇcen´ ych ze stˇredeˇcn´ıch dat dostaneme pro jednotliv´e dny: • Pondˇel´ı: u ´spˇeˇsnost na prodluˇzovac´ıch detektorech pˇribliˇznˇe 65%, na strategick´ ych pˇribliˇznˇe 93%, ´ y: u • Uter´ ´spˇeˇsnost na prodluˇzovac´ıch detektorech pˇribliˇznˇe 60%, na strategick´ ych pˇribliˇznˇe 93%, • Stˇreda: u ´spˇeˇsnost na prodluˇzovac´ıch detektorech pˇribliˇznˇe 96%, na strategick´ ych pˇribliˇznˇe 80%, ˇ je chybn´a, vypl´ To, ˇze pr´ avˇe jedna pˇredpovˇed yv´a pˇr´ımo z volby mezn´ı hodnoty obsazenosti. Stejn´ y pˇr´ıpad nastane i pro strategick´e detektory. Toto ovˇsem nemus´ı platit, pokud uˇz urˇcenou mezn´ı hodnotu pouˇzijeme na data z jin´ ych dn˚ u. 4 Existence takov´eto univerz´ aln´ı hodnoty nen´ı na prvn´ı pohled zˇrejm´a. Kaˇzd´ y detektor m˚ uˇze b´ yt ovlivˇ nov´an hned nˇekolika lok´ aln´ımi vlivy jako napˇr´ıklad kol´ıs´an´ım intenzity provozu bˇehem dne ˇci bˇehem r˚ uzn´ ych dn˚ u v t´ ydnu, vlastn´ı konstrukc´ı kˇriˇzovatky a pˇrilehl´ ych pozemn´ıch komunikac´ı a podobnˇe. 3
14
ˇ • Ctvrtek: u ´spˇeˇsnost na prodluˇzovac´ıch detektorech pˇribliˇznˇe 80%, na strategick´ ych pˇribliˇznˇe 81%, • P´atek: u ´spˇeˇsnost na prodluˇzovac´ıch detektorech pˇribliˇznˇe 68%, na strategick´ ych pˇribliˇznˇe 90%. Z takov´ ych v´ ysledk˚ u bychom mohli usoudit, ˇze popisovan´a metoda je opravdu mnohem lepˇs´ı neˇz pˇredchoz´ı varianta, jednalo by se vˇsak o z´avˇer pˇredˇcasn´ y. Totiˇz v urˇcen´ı spr´avn´e mezn´ı hodnoty st´ale spoˇc´ıv´a probl´em. To, ˇze metoda pouˇz´ıv´a druhou nejniˇzˇs´ı obsazenost a ne jinou, je jenom snaha aspoˇ n ˇc´asteˇcnˇe eliminovat n´ahodn´e vlivy, avˇsak bez matematick´eho podkladu. Skuteˇcnost, ˇze se metoda uˇcila na datech ze stˇredy byla tak´e n´ahodn´a, den byl vybr´an losem. Pokud by byl vybr´an ˇctvrtek nebo p´atek, vyˇsla by stejn´ ym zp˚ usobem mezn´ı hodnota rovna pˇribliˇznˇe 60%, pokud by bylo vybr´ano pondˇel´ı nebo u ´ter´ y, pak by se mezn´ı hodnota pohybovala dokonce kolem 80%. To znamen´a, ˇze modifikovan´a metoda by d´avala horˇs´ı v´ ysledky neˇz jej´ı p˚ uvodn´ı verze. Na druhou stranu je vˇsak z tˇechto v´ ysledk˚ u patrn´e, ˇze poloˇz´ıme-li pevnˇe mezn´ı hodnotu na pˇribliˇznˇe 40% (podobnˇe jako jsme v p˚ uvodn´ı variantˇe metody pˇrevzali z literatury hodnotu 70%), dostaneme celkem pˇresnou metodu na odhadov´an´ı pozice kolony v˚ uˇci detektoru.
2.2.4
Varianta 3
Opusˇtme nyn´ı na chv´ıli snahy o urˇcen´ı mezn´ı obsazenosti a pod´ıvejme se na probl´em jin´ ym pohledem. Pro u ´ˇcely t´eto podkapitoly bude vhodnˇejˇs´ı, jak uvid´ıme n´ıˇze, jin´a definice kolony, respektive jej´ı d´elky. Pod pojmem d´elka kolony zde budeme rozumˇet vzd´alenost posledn´ıho auta stoj´ıc´ıho v kolonˇe od hranice kˇriˇzovatky v okamˇziku5 zaˇc´atku zelen´eho sign´alu, respektive konce ˇcerven´eho sign´alu6 . Zkusme situaci na pˇr´ıjezdov´em rameni kˇriˇzovatky modelovat n´asleduj´ıc´ım zp˚ usobem. Pˇredpokl´adejme nejprve, ˇze intervaly zas´ıl´an´ı dat z detektor˚ u jsou synchronizov´any se sign´aln´ım cyklem semaforu, kter´ y zaˇc´ın´a ˇcerven´ ym a konˇc´ı zelen´ ym sign´alem. Pˇresnˇeji, ˇze data o obsazenosti bˇehem ˇcerven´e a za n´ı n´asleduj´ıc´ı zelen´e dost´av´ame vˇzdy na konci t´eto zelen´e. Potom celkovou obsazenost detektoru za dan´ y interval m˚ uˇzeme rozdˇelit na n´asleduj´ıc´ı pˇr´ıspˇevky: • pˇr´ıspˇevek od aut proj´ıˇzdˇej´ıc´ıch volnˇe pˇres detektor (bˇehem ˇcerven´e nebo zelen´e), • pˇr´ıspˇevek od aut, kter´e se bˇehem ˇcerven´eho sign´alu zaˇradily na konec kolony a stoj´ı nad detektorem (kolona pˇresahuje detektor), • pˇr´ıspˇevek od aut, kter´e bˇehem zelen´e st´ale jeˇstˇe stoj´ı nad detektorem a ˇcekaj´ı, aˇz auta pˇred nimi uvoln´ı cestu. 5
Tato definice se od p˚ uvodn´ı liˇs´ı pouze jej´ım ˇcasov´ ym urˇcen´ım, ovˇsem i tato mal´a zmˇena vyˇzaduje opatrnˇejˇs´ı pˇr´ıstup pˇri navrhov´ an´ı a posl´eze ovˇeˇrov´an´ı funkˇcnosti metody. 6 Mezi zelen´ ym a ˇcerven´ ym sign´ alem b´ yv´a obvykle jeˇstˇe oranˇzov´ y sign´al, jeho d´elka je vˇsak v pomˇeru k d´elce cel´eho sign´ alov´eho cyklu kr´ atk´ a a pro naˇse u ´ˇcely ji lze zanedbat.
15
Tedy m˚ uˇzeme pˇredpokl´adat obsazenost ve tvaru: obsazenost =
c¯ − k1 + k2 · z + k3 + k4 τ
(2.8)
Kde τ je d´elka intervalu, c¯ je doba ˇcerven´e, bˇehem kter´e st´ala kolona za detektor, k1 je funkce d´elky kolony a konstrukˇcn´ıch vlastnost´ı kˇriˇzovatky (napˇr´ıklad vzd´alenost detektoru od semaforu) souvisej´ıc´ı s pˇresunem aut v r´amci kolony na zaˇc´atku ˇcerven´e, k2 a k3 jsou opˇet funkce konstrukˇcn´ıch vlastnost´ı kˇriˇzovatky souvisej´ıc´ı s voln´ ym pr˚ ujezdem vozidel bˇehem zelen´eho a ˇcerven´eho sign´alu (v tomto poˇrad´ı) a funkce intenzity pˇr´ıjezdu vozidel do kˇriˇzovatky, z znaˇc´ı d´elku zelen´e a k4 je opˇet funkce konstrukˇcn´ıch vlastnost´ı kˇriˇzovatky souvisej´ıc´ı s opoˇzdˇen´ ym odjezdem vozidla stoj´ıc´ıho nad detektorem v˚ uˇci poˇc´atku zelen´eho sign´alu. Urˇcen´ı koeficient˚ u k1 aˇz k4 by mohlo v´est k dalˇs´ı modifikaci metody, popˇr´ıpadˇe ke zpˇresnˇen´ı v´ ysledk˚ u metody n´ıˇze popsan´e. Jak ovˇsem uvid´ıme d´ale, jsou data jeˇz m´ame k dispozici pro tento u ´ˇcel nevhodn´a. Pro dalˇs´ı u ´vahy tyto koeficienty zanedb´ame. Pokud tedy namˇeˇren´a obsazenost za interval je vˇetˇs´ı neˇz pomˇer doby ˇcerven´e k cel´emu intervalu, m˚ uˇzeme pˇredpokl´adat, ˇze po celou dobu ˇcerven´e st´alo nad detektorem auto a tedy kolona sah´a aˇz za detektor uˇz na konci zelen´e. Oznaˇcme jeˇstˇe c dobu ˇcerven´e. Potom rozhodnut´ı metody vypad´a n´asledovnˇe: namˇeˇren´a obsazenost ≥
c ⇒ Kolona konˇc´ı za detektorem c+z
Podobnˇe, i kdyˇz nepˇresnˇe, m˚ uˇzeme pro rozhodov´an´ı metody pouˇz´ıt i opaˇcn´ y smˇer implikace: c ⇒ Kolona konˇc´ı pˇred detektorem namˇeˇren´a obsazenost < c+z Bohuˇzel ve skuteˇcnosti intervaly sign´aln´ıho pl´anu semaforu a intervaly zas´ıl´an´ı dat z detektor˚ u jsou na sobˇe nez´avisl´e a ani nen´ı moˇzn´e zaˇr´ıdit, aby tomu bylo jinak7 . Proto se mus´ıme spokojit s t´ım, ˇze si zvol´ıme vlastn´ı ˇcasov´ y interval, pokud moˇzno dostateˇcnˇe dlouh´ y, aby se v nˇem vystˇr´ıdalo alespoˇ n nˇekolik ˇcerven´ ych a zelen´ ych sign´al˚ u. Nerovnosti pro rozhodov´an´ı metody staˇc´ı pozmˇenit tak, ˇze do ˇcitatele d´ame souˇcet vˇsech d´elek ˇcerven´ ych v r´amci tohoto dlouh´eho intervalu a do jmenovatele jeho d´elku. Potom m˚ uˇzeme pˇredpokl´adat, ˇze informace od cel´ ych p´ar˚ u “ˇcerven´a - zelen´a” bude m´ıt vˇetˇs´ı v´ahu neˇz od sign´al˚ u, kter´e byly na konc´ıch naˇseho intervalu oˇr´ıznuty. Z´aroveˇ n vˇsak tento interval nesm´ı b´ yt pˇr´ıliˇs dlouh´ y, neboˇt metoda pak pr˚ umˇeruje d´elku kolony pˇres vˇsechny okamˇziky poˇc´atk˚ u ˇcerven´eho sign´alu. Pokud by d´elka kolony bˇehem tohoto intervalu silnˇe kol´ısala, metoda by nebyla schopna tyto v´ ykyvy zachytit. Jeˇstˇe pˇredt´ım, neˇz metodu otestujeme na re´aln´ ych datech si mus´ıme uvˇedomit, ˇze z mˇeˇren´ı m´ame k dispozici pouze d´elky kolon v ˇcasov´ ych odstupech 60 sekund. Uˇz samotn´e toto mˇeˇren´ı je dosti nepˇresn´e, neboˇt je provedeno ve smyslu naˇs´ı p˚ uvodn´ı definice d´elky kolony (tedy vzd´alenost posledn´ıho stoj´ıc´ıho auta od kˇriˇzovatky v dan´em okamˇziku bez ohledu na poˇcet aut mezi kˇriˇzovatkou a t´ımto autem). Abychom mˇeli 7
Takov´ yto z´ asah do funkce jiˇz nainstalovan´eho ˇr´ıd´ıc´ıho syst´emu na kˇriˇzovatk´ach pˇredstavuje z hlediska spr´avce tohoto syst´emu vˇetˇsinou nepˇrijateln´e finanˇcn´ı v´ ydaje
16
v´ ysledky metody s ˇc´ım porovnat, mus´ıme tyto nepˇr´ıliˇs pˇresn´e u ´daje jeˇstˇe d´ale pˇrepoˇc´ıtat do okamˇzik˚ u konce zelen´eho sign´alu a d´ale pak zpr˚ umˇerovat pˇres vˇsechny takov´e okamˇziky v r´amci naˇseho intervalu. Abychom data u ´plnˇe neznehodnotili, pouˇzijeme pˇri pˇrepoˇctu d´elek z minutov´ ych odstup˚ u v´aˇzen´eho pr˚ umˇeru podle vzd´alenosti od nejbliˇzˇs´ıch zn´am´ ych hodnot. Tedy pro d1 d´elku kolony v ˇcase t1 a d2 d´elku kolony v ˇcase t2 = t1 + 60 sekund, vypoˇc´ıt´ame nezn´amou d´elku kolony d v ˇcase t jako d=
(t − t1 ) (t2 − t) · d1 + · d2 60 60
(2.9)
Z tˇechto hodnot jiˇz pak spoˇc´ıt´ame obyˇcejn´ y pr˚ umˇer v r´amci kaˇzd´eho intervalu. Jako data z detektor˚ u v dan´em intervalu budeme br´at pr˚ umˇer z obsazenost´ı v okamˇzic´ıch, kter´e spadaj´ı do tohoto intervalu. Stanovme nyn´ı d´elku intervalu na 360 sekund (ˇctyˇrikr´at d´ele neˇz je z´akladn´ı interval pˇr´ıchodu dat z detektor˚ u) a pod´ıvejme se na v´ ysledky metody na datech z u ´tern´ıho mˇeˇren´ı a prodluˇzovac´ıch detektor˚ u. V tabulce 4.1 vid´ıme, ˇze 17 z 22 pˇredpovˇed´ı, tj. pˇribliˇznˇe 77% bylo spr´avn´ ych. Z´aroveˇ n vid´ıme, ˇze vˇsechny chyby kter´ ych se metoda dopustila, nastaly pˇri kolonˇe sahaj´ıc´ı za detektor, aˇckoli pr´avˇe za pˇredpokladu kolony za detektor (kv˚ uli zanedb´an´ım) by mˇela metoda d´avat pˇresnˇejˇs´ı v´ ysledky, neˇz pokud tento pˇredpoklad splnˇen nen´ı. To by mohlo znamenat, ˇze koeficient k1 v rovnici 2.8 je d˚ uleˇzitˇejˇs´ı neˇz ostatn´ı zanedban´e koeficienty. Nen´ı ovˇsem moˇzn´e tuto domnˇenku ovˇeˇrit, neboˇt k tomu je k dispozici m´alo vhodn´ ych dat.
2.2.5
Varianta 4
V t´eto ˇc´asti se opˇet vr´at´ıme k pokus˚ um o urˇcen´ı mezn´ı hodnoty obsazenosti, na z´akladˇe kter´e bychom mohli urˇcit, zda kolona sah´a aˇz za detektor, nebo konˇc´ı-li uˇz pˇred n´ım. V kapitole 2.2.3 jsme uˇz uvedli, ˇze hodnota 40% vyhovuje celkem dobˇre, z´aroveˇ n vˇsak v´ıme, ˇze zp˚ usob nalezen´ı t´eto hodnoty byl pˇr´ıliˇs citliv´ y na v´ ychylky v namˇeˇren´ ych datech a v praxi velice obt´ıˇznˇe pouˇziteln´ y. Zde se pokus´ıme navrhnout spolehliv´ y zp˚ usob, jak´ ym tuto hodnotu urˇcit, popˇr´ıpadˇe ji jeˇstˇe zpˇresnit. Teorie Abychom l´epe pochopili, jak metoda funguje, projdˇeme si nejprve nˇekter´e z´akladn´ı pojmy, kter´e budeme potˇrebovat. Pˇredstavme si n´asleduj´ıc´ı pokus. Mˇejme krabici s barevn´ ymi kuliˇckami z nichˇz nˇekter´e jsou b´ıl´e. Pˇredpokl´adejme ˇze v´ıme, ˇze pravdˇepodobnost ˇ 0,2 nebo 0,8. Po vytaˇzen´ı 4 koul´ı (s vracen´ım, tj. tahy vytaˇzen´ı b´ıl´e koule je bud jsou nez´avisl´e) jsme zjistili, ˇze jen jedna z nich byla b´ıl´a, ostatn´ı mˇeli jinou barvu. N´ahodn´a veliˇcina “vytaˇzen´ı k b´ıl´ ych koul´ı v n taz´ıch” m´a binomick´e rozdˇelen´ı s hustotou pravdˇepodobnosti P (k): !
n k P (k) = p (1 − p)n−k k 17
(2.10)
Dosazen´ım do tohoto vzorce pak spoˇc´ıt´ame, ˇze pro p = 0, 2 by pravdˇepodobnost naˇseho v´ ysledku byla pˇribliˇznˇe 40%, zat´ımco pro p = 0, 8 pouze 3%. Rozhodnut´ı pˇriklonit se k variantˇe, ˇze p = 0, 2 je celkem rozumn´e, neboˇt pˇredpokl´ad´ame, ˇze ze vˇsech moˇzn´ ych v´ ysledk˚ u pokusu sp´ıˇse nastane ten s nejvˇetˇs´ı pravdˇepodobnost´ı. Pozmˇen ˇme jeˇstˇe pˇredpoklad pokusu tak, ˇze na zaˇc´atku pouze v´ıme, ˇze p ∈ (0, 1). Nyn´ı nem˚ uˇzeme za p postupnˇe dosazovat tak jako v pˇredchoz´ım pˇr´ıpadˇe, neboˇt moˇzn´ ych hodnot je nespoˇcetnˇe mnoho. Zato vˇsak m˚ uˇzeme na pravdˇepodobnost P pohl´ıˇzet jako na funkci parametru p za pˇredpokladu, ˇze k = 1 (a dalˇs´ıch podm´ınek dan´ ych pokusem, zde n = 4). Probl´em se tedy redukuje na nalezen´ı extr´emu funkce P vzhledem k promˇenn´e p. Pokud funkce P je diferencovateln´a, staˇc´ı vyˇreˇsit rovnici ∂P (p, n = 4, k = 1) =0 ∂p
(2.11)
ysledek, kter´ y jsme oˇcek´avali. Rovnici Uˇcin´ıme-li tak, dostaneme ˇze p = 41 . To je ovˇsem v´ 2.11 se tak´e ˇcasto ˇr´ık´a vˇerohodnostn´ı rovnice8 . Princip odhad˚ u parametr˚ u zaloˇzen´ y na hled´an´ı takov´e hodnoty parametru, kter´a maximalizuje pravdˇepodobnost z´ıskan´eho v´ ysledku experimentu, se naz´ yv´a metoda maxim´aln´ı vˇerohodnosti, v literatuˇre t´eˇz ˇcasto oznaˇcovan´a zkratkou “MLE”. Metoda maxim´aln´ı vˇerohodnosti je jednou z nejˇcastˇejˇs´ıch metod uˇz´ıvan´ ych pˇri hled´an´ı ˇ odhad˚ u, proto si uvedme alespoˇ n nˇekter´e jej´ı z´akladn´ı vlastnosti, tak jak jsou pops´any v literatuˇre [2],[3],[4],[5]. Definice 9 Mˇejme X = (X1 , ..., Xn ) realizaci n´ ahodn´e veliˇciny, f (x, θ) sdruˇzenou hustotu pravdˇepodobnosti, θ parametr, c ∈ (0, 1) re´ alnou konstantu. Potom funkci definovanou jako L(θ|x = X) = c · f (X, θ) (2.12) nazveme vˇerohodnostn´ı funkc´ı a odhad θˆ parametru θ definovan´y jako θˆ = arg sup L(θ|x = X)
(2.13)
θ
nazveme maxim´alnˇe vˇerohodn´ym odhadem parametru θ. M˚ uˇze se st´at, ˇze supremum nen´ı dosaˇziteln´e, v takov´em pˇr´ıpadˇe lze definovat “t´emˇeˇr ˆ pro kter´e plat´ı maxim´alnˇe vˇerohodn´ y odhad” jako takov´e θ, ˆ = X) ≥ c · sup L(θ|x = X) L(θ|x
(2.14)
θ
Ani existenci tohoto odhadu nelze vˇzdy zaruˇcit, to se vˇsak st´av´a jen ve v´ yjimeˇcn´ ych pˇr´ıpadech. 8
Pokud by odhadovan´ y parametr byl v´ıcerozmˇern´ y, ˇreˇsili bychom soustavu rovnic z´ıskan´ ych derivac´ı apriorn´ı hustoty pravdˇepodobnosti podle jednotliv´ ych sloˇzek vektoru parametru.
18
Vˇ eta 5 Mˇejme f (x, θ) hustotu pravdˇepodobnosti, θ parametr. Existuje-li eficientn´ı9 odhad parametru θ, pak je tento odhad koˇrenem vˇerohodnostn´ı rovnice. To v praxi znamen´a, ˇze pokud hled´ame eficientn´ı odhad, m˚ uˇzeme se omezit na hled´an´ı jen v mnoˇzinˇe koˇren˚ u vˇerohodnostn´ı rovnice. Definice 10 Mˇejme parametr θ z parametrick´eho prostoru. Aˇt n´ ahodn´y vektor X = = (X1 , ..., Xn ) m´a hustotu pravdˇepodobnosti f (x, θ). Statistiku S = (S1 , ..., Sk ); k ≤ n nazveme postaˇcuj´ıc´ı pro parametr θ, pr´ avˇe kdyˇz existuje takov´ a nez´ aporn´ a mˇeˇriteln´a funkce g(s, θ) promˇenn´ych s = (s1 , ..., sk ) a takov´ a nez´ aporn´ a mˇeˇriteln´ a funkce h(x), ˇze skoro vˇsude vzhledem k dan´e m´ıˇre plat´ı f (x, θ) = g(S(x), θ) · h(x)
(2.15)
Z t´eto definice je zˇrejm´e, ˇze postaˇcuj´ıc´ı statistika existuje vˇzdy, cenn´a je ale takov´a, kter´a m´a poˇcet sloˇzek co nejmenˇs´ı. Vˇ eta 6 Odhad metodou maxim´aln´ı vˇerohodnosti je vˇzdy funkc´ı postaˇcuj´ıc´ı statistiky. Volnˇe bychom tedy mohli ˇr´ıct, ˇze pˇri maxim´alnˇe vˇerohodn´ ych odhadech neztr´ac´ıme ˇz´adnou informaci z pozorov´an´ı namˇeˇren´ ych pˇri prov´adˇen´ı experimentu. Vˇ eta 7 Nechˇt je vˇerohodnostn´ı funkce diferencovateln´ a a aˇt jsou splnˇeny jeˇstˇe nˇekter´e dalˇs´ı pˇredpoklady (pˇresnˇe viz [4] str. 406). Potom vˇerohodnostn´ı rovnice m´ a pro n → ∞ s pravdˇepodobnost´ı 1 ˇreˇsen´ı, kter´e je konzistentn´ım odhadem10 . Tedy maxim´alnˇe vˇerohodn´e odhady by mˇely odhadovan´ y parametr aproximovat pomˇernˇe dobˇre, nen´ı to vˇsak zaruˇceno pro mal´a n. Vˇ eta 8 Aˇt θˆ je konzistentn´ı ˇreˇsen´ı vˇerohodnostn´ı rovnice, θ0 je skuteˇcn´ a hodnota parametru, ˇ a at jsou splnˇeny pˇredpoklady pˇredchoz´ı vˇety. Potom pro n → ∞ √ h 1 dl i n (θˆ − θ0 )i(θ0 ) − → 0 podle pravdˇepodobnosti n dθ0
(2.16)
kde i(θ) znaˇc´ı Fisherovu informaci o parametru θ obsaˇzenou v jednom pozorov´ an´ı. Pˇredchoz´ı vˇeta tedy ˇr´ık´a, ˇze maxim´alnˇe vˇerohodn´e odhady jsou asymptoticky norm´aln´ı a asymptoticky eficientn´ı11 . Nˇekter´e dalˇs´ı zaj´ımav´e vlastnosti maxim´alnˇe vˇerohodn´ ych odhad˚ u, kter´e vˇsak pˇresahuj´ı r´amec tohoto textu, lze rovnˇeˇz naj´ıt v literatuˇre uveden´e v pˇredchoz´ıch odstavc´ıch. 9
Odhad parametru nazveme eficientn´ım pr´avˇe kdyˇz m´a ze vˇsech ostatn´ıch odhad˚ u minim´aln´ı rozptyl. Tj. ˇze konverguje podle pravdˇepodobnosti ke skuteˇcn´e hodnotˇe odhadovan´eho parametru. 11 V´ıce o eficienci a asymptotick´e eficienci odhad˚ u se lze doˇc´ıst v [4] str. 388–392. 10
19
1 0.9
P(kolona za detektor)
0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0
0.2
0.4
0.6
obsazenost
0.8
1
Figure 2.3: Tvar z´avislosti pravdˇepodobnosti, ˇze kolona sah´a za detektor, na obsazenosti detektoru Aplikace Maxim´alnˇe vˇerohodn´e odhady se tedy jev´ı jako dobr´ y zp˚ usob odhadu parametr˚ u a mohli bychom se pokusit je vyuˇz´ıt k urˇcen´ı mezn´ı hodnoty obsazenosti pro naˇs´ı metodu. K tomu vˇsak mus´ıme nejprve vytvoˇrit model situace na pˇr´ıjezdov´em rameni kˇriˇzovatky a zav´est do nˇej parametr, kter´ y se pak pokus´ıme odhadnout. ˇ Provedme n´asleduj´ıc´ı u ´vahu. Ze zkuˇsenosti oˇcek´av´ame, ˇze pokud detektor vyk´aˇze n´ızkou obsazenost, bude s velkou pravdˇepodobnost´ı kolona konˇcit uˇz pˇred detektorem. Pro velice mal´e obsazenosti bychom mohli pˇredpokl´adat, ˇze kolona jistˇe nedosahuje detektoru. Jev´ı se vˇsak rozumnˇejˇs´ı nepovaˇzovat jev, kdy kolona i pˇri n´ızk´e obsazenosti sah´a za detektor za jev nemoˇzn´ y, neboˇt t´ımto zp˚ usobem bychom pˇredem vylouˇcili nˇekter´e nepˇredv´ıdan´e ud´alosti jako napˇr´ıklad poruchu detektoru anebo prost´e n´ahodn´e chyby mˇeˇren´ı. D´ale pak jistˇe m˚ uˇzeme pˇredpokl´adat, ˇze s rostouc´ı hodnotou obsazenosti bude r˚ ust pravdˇepodobnost toho, ˇze kolona sah´a aˇz za detektor, a to aˇz do okamˇziku, kdy obsazenost dos´ahne hodnoty 100%. Tedy kˇrivka, popisuj´ıc´ı z´avislost pravdˇepodobnosti jevu, kdy kolona sah´a za detektor, v z´avislosti na obsazenosti detektoru, bude m´ıt tvar kˇrivky zn´azornˇen´e na obr´azku 2.3. Moˇzn´ ych popis˚ u kˇrivky s takov´ ymto tvarem je v´ıce, pro naˇse u ´ˇcely jsme zvolili funkci P (x) definovanou jako P (x) = 1 + tanh[b + a(tan(πx − P (0) = 0,
π ))] 2
∀x ∈ (0, 1)
(2.17)
P (1) = 2
kter´a vznikla zkombinov´an´ım vhodn´eho tvaru funkce hyperbolick´eho tangens a zmˇenou jej´ıho definiˇcn´ıho oboru na interval h0, 1i pomoc´ı funkce tangens. Pˇritom a ≥ 0 a b jsou re´aln´e parametry. Jak je d´ale vidˇet z konstrukce funkce P , parametr a souvis´ı s jej´ı “strmost´ı”, zat´ımco parametr b ovlivˇ nuje polohu inflexn´ıho bodu, tedy vlastnˇe kˇrivku “posouv´a” doprava(b < 0) nebo doleva(b > 0). Poznamenejme jeˇstˇe, ˇze vˇzdy, kdyˇz se v n´asleduj´ıc´ım textu budeme odkazovat na funkci obsahuj´ıc´ı v´ yraz tanh[b + a(tan(πx − 20
π ))] 2
(2.18)
budeme m´ıt na mysli funkci dodefinovanou hodnotou 0 pro x = 0 a hodnotou 2 pro x = 1. Nyn´ı je na ˇradˇe rozhodnout, podle jak´eho krit´eria budeme ze znalost´ı funkce P (tj. znalost´ı hodnot parametr˚ u a a b) urˇcovat hodnotu mezn´ı obsazenosti. I zde m´ame v´ıce moˇznost´ı. Jak uˇz bylo ˇreˇceno, hodnota funkce P pˇri hodnotˇe obsazenosti x vlastnˇe popisuje, jak moc je pˇri dan´e obsazenosti pravdˇepodobn´e, ˇze kolona sah´a za detektor. Tud´ıˇz jedna z moˇznost´ı je stanovit urˇcitou hodnotu pravdˇepodobnosti (napˇr´ıklad 90%), kter´a bude vyjadˇrovat naˇsi m´ıru jistoty12 , a k n´ı potom naj´ıt hodnotu obsazenosti x tak, aby P (x) = 0, 9 (2.19) maxx∈h0,1i P (x) Postupme d´ale, k samotn´emu hled´an´ı hodnot parametr˚ u. K vyuˇzit´ı metody maxim´aln´ı vˇerohodnosti budeme muset funkci P definovanou vztahem 2.17 upravit tak, aby splˇ novala podm´ınky na hustotu pravdˇepodobnosti. Tvar funkce P , tak jak je nakreslen na obr´azku 2.3, se d´a ch´apat tak´e jako pravdˇepodobnost jevu, ˇze detektor vyk´aˇze danou obsazenost za pˇredpokladu, ˇze kolona sah´a za detektor. To nemus´ı b´ yt na prvn´ı pohled tak jasn´e, staˇc´ı si ale pˇredstavit situaci, ˇze bychom provedli dostateˇcnˇe velk´ y poˇcet mˇeˇren´ı dvojic obsazenost - pozice kolony. Pˇredpokl´adejme, ˇze ˇz´adn´a hodnota obsazenosti nenast´av´a ˇcastˇeji neˇz jin´a13 . Nyn´ı pro kaˇzdou hodnotu obsazenosti vynesme do jednoho grafu ˇcetnosti pˇr´ıpad˚ u, kdy kolona sahala za detektor a do druh´eho grafu pˇr´ıpady, kdy kolona konˇcila pˇred detektorem. Protoˇze z´aroveˇ n pro kaˇzdou hodnotu obsazenosti je pravdˇepodobnost kolony sahaj´ıc´ı za detektor u ´mˇern´a funkci P , bude prvn´ı graf vˇernˇe popisovat funkci P , zat´ımco druh´ y funkci 1 − P . Na tyto grafy se pak (po pˇren´asoben´ı vhodnou konstantou) m˚ uˇzeme tak´e d´ıvat jako na pravdˇepodobnosti urˇcit´ ych hodnot obsazenosti podm´ınˇen´ ych stavem kolony (tj. pˇred nebo za detektor). Jako z´aklad pro hledanou hustotu pravdˇepodobnosti bychom tedy mohli vz´ıt funkci f (x, y) s definiˇcn´ım oborem {0, 1} × h0, 1i, kde x ∈ h0, 1i, y ∈ {0, 1}, f (x, 0) = P (x), f (x, 1) = 1 − P (x). To je vˇsak t´emˇeˇr zbyteˇcn´e, staˇc´ı si zapamatovat, ˇze funkce je dvourozmˇern´a, ale pracovat pouze s jednou jej´ı sloˇzkou14 . M´ame tedy funkci P (x) definovanou vztahem 2.17. Abychom z n´ı vyrobili hustotu pravdˇepodobnosti, potˇrebujeme ji nanormovat, tedy naj´ıt konstantu K (kter´a m˚ uˇze b´ yt funkc´ı parametr˚ u a a b) tak aby platilo Z1
K(a, b) · 1 + tanh [b + a(tan(πx −
0
π ))] dx 2
(2.20)
12 Hodnota 90% znamen´ a, ˇze pro nalezenou mezn´ı hodnotu a vˇsechny vyˇsˇs´ı obsazenosti (z monotonie funkce P ) bude pravdˇepodobnost ˇspatn´eho rozhodnut´ı jen 10%. 13 Tento pˇredpoklad nemus´ı b´ yt spr´ avn´ y, pokud se jedn´a o kˇriˇzovatky extr´emnˇe zat´ıˇzen´e, nebo naopak m´alo pouˇz´ıvan´e, neboˇt pak se obsazenosti pohybuj´ı ˇcastˇeji v nˇekter´ ych vysok´ ych nebo n´ızk´ ych hodnot´ach. V takov´em pˇr´ıpadˇe bychom vˇsak mohli na z´akladˇe dlouhodob´ ych pozorov´an´ı odhadnout rozdˇelen´ı hodnot obsazenosti jakoˇzto n´ ahodn´e veliˇciny, ze kter´eho bychom pak uˇz snadno urˇcili rozdˇelen´ı podm´ınˇen´e stavem kolony pˇred nebo za detektorem 14 Pr´ace s dvourozmˇernou hustotu by se projevila pouze jin´ ym normalizaˇcn´ım faktorem (aby hustota pravdˇepodobnosti po integraci d´ avala jedniˇcku), v tomto pˇr´ıpadˇe poloviˇcn´ım, postup v´ ypoˇctu by z˚ ustal stejn´ y.
21
2 1.8 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0 −15
hodnoty integrálu 1 + tanh(b/7) −10
−5
0
parametr b
5
10
15
Figure 2.4: Numericky spoˇc´ıtan´e hodnoty integr´alu v 2.21 a jejich aproximace Tedy staˇcilo by poloˇzit konstantu K rovnou K(a, b) =
1 R1 0
(2.21)
1 + tanh [b + a(tan(πx − π2 ))] dx
Explicitn´ı vyj´adˇren´ı integr´alu ve vzorci 2.21 v z´avislosti na parametrech a, b se n´am vˇsak nepovedlo nal´ezt. M˚ uˇzeme ale zkusit napoˇc´ıtat tento integr´al numericky pro nˇekter´e hodnoty parametr˚ u. Parametr a nen´ı pro naˇsi metodu tak d˚ uleˇzit´ y jako parametr b, m˚ uˇzeme se proto spokojit s t´ım, ˇze si zvol´ıme hodnotu parametru a pevnˇe. Hodnota a = 3 se jev´ı z hlediska “strmosti” funkce P (x) jako vhodn´a. Zobrazme si hodnoty integr´alu ze vzorce 2.21 pro nˇekter´e hodnoty parametru b (a = 3 pevnˇe) do grafu. Mohli bychom se pokusit tyto hodnoty proloˇzit napˇr´ıklad polynomem, ovˇsem jak vid´ıme na obr´azku 2.4, z´avislost integr´alu na parametru b pˇripom´ın´a funkci hyperbolick´ y tangens. M˚ uˇzeme se proto pokusit aproximovat integr´al pr´avˇe v tomto tvaru. Pokud pro rozmez´ı b ∈ h−15, 15i 15 pouˇzijeme jako aproximaci integr´alu v 2.21 funkci b I(b) = 1 + tanh( ) 7
(2.22)
zjist´ıme, ˇze Z1 π ≤ 0, 1 1 + tanh [b + 3(tan(πx − ))] dx − I(b) 0
2
∀b ∈ h−15, 15i
(2.23)
To m˚ uˇzeme tvrdit, neboˇt integr´al v 2.21 je spojitou a monot´onn´ı (rostouc´ı) funkc´ı parametru b. Spojitost plyne ihned z vlastnosti integr´alu. Monotonie plyne z n´asleduj´ıc´ıho. Hyperbolick´ y tangens je rostouc´ı funkc´ı, proto pro libovoln´e b1 < b2 plat´ı π π 1 + tanh [b1 + 3(tan(πx − ))] < 1 + tanh [b2 + 3(tan(πx − ))] ∀x ∈ h0, 1i (2.24) 2 2 15
Tento interval byl zvolen podle tvaru kˇrivky P (x) z 2.17. Pro krajn´ı body intervalu je “posunut´ı” kˇrivky takov´e, ˇze mezn´ı hodnoty jim odpov´ıdaj´ıc´ı by byly velmi nepravdˇepodobn´e. Nicm´enˇe pokud by parametr n´ahodou pˇrekroˇcil tento interval, nen´ı to probl´em. Aproximace bude st´ale pomˇernˇe dobˇre fungovat, pouze s trochu menˇs´ı pˇresnost´ı.
22
35
max[ abs(1/K’ − 1/K) ]
30 25 20 15 10 5 0 −15
−10
−5
0
parametr b
5
10
15
Figure 2.5: Odchylka odhadu normovac´ı konstanty K’ od skuteˇcn´e hodnoty K Tedy integrand obsahuj´ıc´ı b1 je menˇs´ı neˇz integrand obsahuj´ıc´ı b2 v cel´em oboru integrace, z ˇcehoˇz uˇz jasnˇe plyne monotonie integr´alu z 2.21. Kdybychom m´ısto funkce I(b) pouˇzili jako aproximaci polynom, dostali bychom sice na intervalu b ∈ h−15, 15i o nˇeco menˇs´ı odchylku (0.08 pro polynom 7. stupnˇe), avˇsak uˇz pˇri mal´em pˇrekroˇcen´ı tohoto intervalu by odchylka naopak prudce vzrostla. Nyn´ı se pod´ıvejme trochu bl´ıˇze, jak chyba aproximace integr´alu ovlivn´ı v´ ypoˇcet. Zjistili jsme uˇz, ˇze pro b ∈ h−15, 15i nepˇres´ahne rozd´ıl integr´alu a jeho aproximace hodnotu 0,1. Z´aroveˇ n vˇsak tyto funkce vystupuj´ı jako jmenovatel zlomku, proto v´ ysledn´a chyba v urˇcen´ı konstanty K ze vzorce 2.21 bude z´aviset tak´e na hodnotˇe integr´alu z 2.21. Tento integr´al nab´ yv´a hodnot bl´ızk´ ych nule pro mal´a b, pro kter´e bude chyba nejvˇetˇs´ı. To je d˚ usledek skuteˇcnosti, ˇze derivace K podle sv´eho jmenovatele je pro jmenovatele bl´ızk´eho nule velmi velk´a, a i mal´e zmˇeny tohoto jmenovatele se projev´ı jako velk´a zmˇena hodnoty K. Nav´ıc podle pr˚ ubˇehu odchylky funkce I(b) od skuteˇcn´e hodnoty integr´alu, zn´azornˇen´e v grafu na obr´azku 4.12 vid´ıme, ˇze tato odchylka je velk´a pr´avˇe pro mal´e hodnoty parametru b. Z obr´azku 2.5, kter´ y popisuje odchylku normovac´ı konstanty K od skuteˇcn´e hodnoty, lze vyˇc´ıst, ˇze pro kladn´e hodnoty parametru b bude tato odchylka zanedbateln´a. Naopak pro z´aporn´e hodnoty parametru b (pˇribliˇznˇe pro b = −6 a niˇzˇs´ı), kde funkˇcn´ı hodnoty I(b) jsou niˇzˇs´ı neˇz skuteˇcn´a hodnota integr´alu, dostaneme konstantu K mnohem vˇetˇs´ı, neˇz by ve skuteˇcnosti mˇela b´ yt. T´ım ale vlastnˇe umˇele “zv´ yˇs´ıme pravdˇepodobnost” vˇsech jev˚ u popisovan´ ych funkc´ı P (x) z 2.17. Protoˇze se ale metoda maxim´aln´ı vˇerohodnosti snaˇz´ı vˇzdy maximalizovat pravdˇepodobnost namˇeˇren´eho v´ ysledku experimentu, m˚ uˇze se pro dostateˇcnˇe mal´a b st´at, ˇze metoda bude “navyˇsovat pravdˇepodobnost” v´ ysledku ne na z´akladˇe informace mˇeˇren´ı, ale prost´ ym sniˇzov´an´ım hodnoty parametru b a t´ım p´adem zvyˇsov´an´ım hodnoty konstanty K. Metoda m´a tedy tendenci pro dostateˇcnˇe mal´a b preferovat niˇzˇs´ı hodnoty tohoto parametru. Vezmˇeme tedy nyn´ı jako hledanou hustotu pravdˇepodobnosti funkci f (x, b) =
π 1 · 1 + tanh [b + 3(tan(πx − ))] 2 1 + tanh( 7b )
(2.25)
Potom uˇz staˇc´ı pouze vz´ıt jednotliv´e namˇeˇren´e hodnoty obsazenosti xi , postupnˇe je dosa23
dit do vztahu 2.25 a souˇcinem tˇechto funkc´ı vytvoˇrit sdruˇzenou hustotu pravdˇepodobnosti. Jen si jeˇstˇe mus´ıme uvˇedomit, ˇze pro pˇr´ıpad kolony sahaj´ıc´ı pˇred detektor m´a hustota pravdˇepodobnosti tvar 1 − f (x, b). Tedy pro sdruˇzenou hustotu pravdˇepodobnosti plat´ı F (b) = F1 (b) · F2 (b), kde F1 = F2 =
Y
f (xi , b)
Y
[1 − f (xi , b)]
∀xi ∈ M1 ∀xi ∈ M2
(2.26) (2.27)
kde M1 je mnoˇzina vˇsech namˇeˇren´ ych obsazenost´ı, pro kter´e kolona sahala za detektor, obdobnˇe M2 mnoˇzina obsazenost´ı, pro kter´e kolona konˇcila pˇred detektorem. Pot´e mus´ıme naj´ıt maximum funkce F (b). Vzhledem ke sloˇzitosti jej´ıho z´apisu se pˇriklon´ıme k numerick´emu ˇreˇsen´ı. Jakmile nalezneme hodnotu parametru b, ve kter´em se toto maximum nab´ yv´a, dosad´ıme ho do funkce f (x, b). Pot´e nalezneme (dosazen´ım za x hodnotu 1) maximum funkce f a z nˇej vypoˇc´ıt´ame 90%. Potom uˇz pouze staˇc´ı vypoˇc´ıtat, opˇet jen numericky, ve kter´em bodˇe funkce f (x, b) dos´ahne 90% sv´eho maxima a tuto hodnotu oznaˇcit za mezn´ı obsazenost. My jsme tyto v´ ypoˇcty provedli pro u ´ter´ y na prodluˇzovac´ıch detektorech, ve stˇredu a ve ˇctvrtek na prodluˇzovac´ıch i strategick´ ych detektorech a v pondˇel´ı na prodluˇzovac´ıch detektorech. V´ ysledky odhad˚ u mezn´ıch obsazenost´ı byly n´asleduj´ıc´ı: ´ y, prodluˇzovac´ı detektory, odhad mezn´ı obsazenosti: 40%, • Uter´ • Stˇreda, prodluˇzovac´ı detektory, odhad mezn´ı obsazenosti (redukovan´a data): 56%, • Stˇreda, strategick´e detektory, odhad mezn´ı obsazenosti (redukovan´a data): 33%, ˇ • Ctvrtek, prodluˇzovac´ı detektory, odhad mezn´ı obsazenosti (redukovan´a data): 35%, ˇ • Ctvrtek, strategick´e detektory, odhad mezn´ı obsazenosti (redukovan´a data): 22%, • Pondˇel´ı, prodluˇzovac´ı detektory, odhad mezn´ı obsazenosti: 36%. Pˇritom v´ ypoˇcty ze stˇredeˇcn´ıch a ˇctvrteˇcn´ıch dat byly provedeny zkuˇsebnˇe na zredukovan´ ych datech (byla pouˇzita pˇribliˇznˇe tˇretina vˇsech namˇeˇren´ ych dat). Pro tyto dny byly v´ ypoˇcty provedeny jeˇstˇe jednou na kompletn´ıch datech s tˇemito v´ ysledky: • Stˇreda, prodluˇzovac´ı detektory, odhad mezn´ı obsazenosti: 49%, • Stˇreda, strategick´e detektory, odhad mezn´ı obsazenosti: 32%, ˇ • Ctvrtek, prodluˇzovac´ı detektory, odhad mezn´ı obsazenosti: 34%, ˇ • Ctvrtek, strategick´e detektory, odhad mezn´ı obsazenosti: 38%.
24
Zde vid´ıme, ˇze odhady z prodluˇzovac´ıch detektor˚ uvu ´ter´ y a ze strategick´ ych detektor˚ u ve stˇredu, kter´e se p˚ uvodnˇe podstatnˇe liˇsily od ostatn´ıch odhad˚ u, se pˇri pouˇzit´ı v´ıce dat zlepˇsily. Tento jev by se dal spojovat s faktem, ˇze vˇetˇsina “dobr´ ych” vlastnost´ı maxim´alnˇe vˇerohodn´ ych odhad˚ u, jak jsou popisov´any v prvn´ı ˇc´asti t´eto sekce je pouze asymptotick´a, tj. plat´ı pro dostateˇcnˇe velk´ y poˇcet mˇeˇren´ı. D´ale si m˚ uˇzeme povˇsimnout, ˇze vˇetˇsina odhad˚ u se pohybuje v rozmez´ı 30% aˇz 40%, coˇz je v´ ysledek, kter´ y odpov´ıd´a oˇcek´av´an´ım, kter´e jsme zm´ınili uˇz na konci sekce 2.2.3. Z´aroveˇ n je vidˇet, ˇze metoda odhadla t´emˇeˇr ve vˇsech pˇr´ıpadech, nez´avisle na pouˇzit´ ych datech, podobn´e mezn´ı obsazenosti, a to i v pˇr´ıpadech, kdy zp˚ usob navrhovan´ y v sekci 2.2.3 selhal. M˚ uˇzeme tedy tvrdit, ˇze tato verze metody je odolnˇejˇs´ı v˚ uˇci chyb´am mˇeˇren´ı nebo jin´ ym n´ahodn´ ym vliv˚ um. Z v´ ypoˇct˚ u na prodluˇzovac´ıch detektorech z u ´ter´ y a stˇredy a na strategick´ ych detektorech ze stˇredy jsou v pˇr´ıloze zobrazeny grafy pr˚ ubˇeh˚ u funkc´ı F (b) a f (x, b = arg maxb∈R (F )) (obr´azky 4.8, 4.9, 4.10, 4.11, 4.6, 4.7). Na grafu na obr´azku 4.6 z v´ ypoˇctu z u ´ter´ y si m˚ uˇzeme povˇsimnout n´asleduj´ıc´ı skuteˇcnosti. Funkce nem´a ˇz´adn´e v´ yrazn´e maximum a m´a pomˇernˇe “exotick´ y” pr˚ ubˇeh. Norm´alnˇe bychom oˇcek´avali jedno v´ yrazn´e maximum a funkˇcn´ı hodnoty v ostatn´ıch bodech bl´ızk´e nule. Fakt, ˇze tomu tak nen´ı, m˚ uˇzeme povaˇzovat jednak za zn´amku nepˇresnosti u ´tern´ıch dat, ale tak´e za varov´an´ı, ˇze se v nˇekter´ ych dopravn´ıch situac´ıch ned´a spol´ehat na mezn´ı obsazenost jako jedin´e krit´erium pozice kolony.
2.2.6
Shrnut´ı
Jak je vidˇet z principu metody, je pouˇziteln´a nejen pro sadu dvou detektor˚ u, ale pro jakoukoli kˇriˇzovatku s alespoˇ n jedn´ım detektorem. Pouˇzit´ı vˇetˇs´ıho poˇctu detektor˚ u v kratˇs´ıch vz´ajemn´ ych vzd´alenostech by pomohlo zpˇresnit v´ ysledky t´eto metody (ve smyslu poˇctu rozezn´avan´ ych vzd´alenost´ı konce kolony od hranice kˇriˇzovatky), ovˇsem z praktick´eho (zejm´ena finanˇcn´ıho) hlediska je tato myˇslenka nerealizovateln´a. Nav´ıc pˇrid´an´ı dalˇs´ıch detektor˚ u by byl i po technologick´e str´ance n´aroˇcn´ y z´akrok do syst´em˚ u na kˇriˇzovatce jiˇz nainstalovan´ ych, pˇritom vˇsak existuj´ı dalˇs´ı pˇribliˇznˇe stejnˇe n´aroˇcn´e z´asahy (napˇr´ıklad zmˇena frekvence nebo obsahu informac´ı dod´avan´ ych detektory), kter´e by pomohli metodu zpˇresnit v´ıce, popˇr´ıpadˇe by vedli na pˇresnˇejˇs´ı modifikaci. Z´aroveˇ n lze konstatovat, ˇze v´ ysledky d´avan´e touto metodou jsou pomˇernˇe spolehliv´e. Jak si m˚ uˇzeme povˇsimnout, poˇcet spr´avn´ ych odhad˚ u pozice kolony ve shrnut´ı druh´e varianty se pohyboval mezi 60% aˇz 93%. To se m˚ uˇze v porovn´an´ı s v´ ysledky metody zaloˇzen´e na Kalmanovˇe filtru [7] a uveden´ ymi v [13] nebo [14] zd´at jako pomˇernˇe ˇspatn´a shoda s re´aln´ ymi daty, ovˇsem nahl´ednut´ım do t´eto literatury lze zjistit, ˇze metoda pˇredpokl´ad´a znalost nˇekter´ ych dalˇs´ıch veliˇcin, pouˇz´ıv´a jin´ y pˇredpoklad fyzick´e konstrukce kˇriˇzovatky a je testov´ana na jin´ ych datech, neˇz metoda popisovan´a v t´eto pr´aci. D´ale se n´am ve ˇctvrt´e variantˇe nakonec podaˇrilo naj´ıt zp˚ usob odhadov´an´ı mezn´ı hodnoty obsazenosti pro pˇr´ıpady, ˇze by hodnota 40% byla pro nˇekterou kˇriˇzovatku shled´ana jako nevyhovuj´ıc´ı. Skuteˇcnosti, ˇze ne pˇri vˇsech odhadech odpov´ıdaly v´ ysledky naˇs´ım oˇcek´av´an´ım nemus´ı b´ yt nutnˇe zp˚ usobeny nepˇresnostmi metody. Je potˇreba si 25
uvˇedomit, ˇze samotn´e z´ısk´av´an´ı ruˇcnˇe mˇeˇren´ ych dat jak´ ymi jsou d´elka kolony nebo ˇcasy ˇcerven´eho sign´alu je pomˇernˇe n´aroˇcn´ yu ´kol a tud´ıˇz jsou tato data zat´ıˇzena chybami.
2.3
Metoda odhadov´ an´ı d´ elky kolony pomoc´ı “pln´ıc´ıho ˇ casu”
V tomto odd´ıle se zm´ın´ıme o dalˇs´ım zp˚ usobu odhadov´an´ı d´elek kolon, tak jak je pops´an v literatuˇre [6]. Tato metoda se zamˇeˇruje na probl´em detekce dopravn´ı kongesce, k jehoˇz ˇreˇsen´ı vyuˇz´ıv´a pr´avˇe odhady o d´elk´ach kolony. Od ostatn´ıch metod detekce dopravn´ı z´acpy se liˇs´ı pˇredevˇs´ım t´ım, ˇze se snaˇz´ı odhadovat d´elku kolony na kˇriˇzovatk´ach, kde detektory jsou um´ıstˇeny pouze bl´ızko k hranici kˇriˇzovatky (ve vzd´alenosti pˇribliˇznˇe 10 aˇz 50 metr˚ u) a z jejichˇz dat je tud´ıˇz obt´ıˇzn´e rekonstruovat dopravn´ı situaci ve vzd´alenostech zhruba 100 metr˚ u od kˇriˇzovatky a d´ale, jej´ıˇz urˇcen´ı je k detekci kongesce kl´ıˇcov´e. D´ale se tato metoda d´a vyuˇz´ıt k urˇcen´ı saturaˇcn´ıho toku nebo v´ yznamn´ ych odchylek v propustnosti kˇriˇzovatky zp˚ usoben´ ych n´ahodn´ ymi poruchami zvnˇejˇsku. Kl´ıˇcov´ ym pro tyto aplikace vˇsak z˚ ust´av´a zp˚ usob, kter´ ym metoda na z´akladˇe dat z detektor˚ u odhaduje kolonu, jej´ıˇz d´elka nˇekolikr´at pˇrevyˇsuje vzd´alenost tˇechto detektor˚ u od kˇriˇzovatky. Metoda vych´az´ı z pˇredstavy, ˇze dopravn´ı proud v oblasti detektoru je silnˇe ovlivnˇen aktu´aln´ım sign´alem na kˇriˇzovatce. Pro popis tohoto proudu se jev´ı jako vhodn´e n´asleduj´ıc´ı dvˇe veliˇciny: • “Pln´ıc´ı ˇcas” (vzhledem k detektoru), definovan´ y jako ˇcas, kter´ y ubˇehne od zaˇc´atku ˇcerven´eho sign´alu do okamˇziku, kdy je detektor nepˇretrˇzitˇe obsazen, • D´elka obsazenosti detektoru bˇehem zelen´eho sign´alu. Zp˚ usob odhadov´an´ı d´elky kolony je zaloˇzen na pˇredpokladu jej´ı souvislosti s pln´ıc´ım ˇcasem podle n´asleduj´ıc´ı myˇslenky. Pokud kolona sah´a dostateˇcnˇe daleko za detektor, napln´ı se na zaˇc´atku ˇcerven´eho sign´alu prostor mezi kˇriˇzovatkou a detektorem auty mnohem rychleji, neˇz by tomu bylo v pˇr´ıpadˇe n´ahodnˇe pˇrij´ıˇzdˇej´ıc´ıch aut. V prvn´ım pˇr´ıpadˇe bude tedy pln´ıc´ı ˇcas kratˇs´ı neˇz urˇcit´a doba, kter´a je konstantou pro danou kˇriˇzovatku, z´avis´ı na jej´ı fyzick´e konstrukci a d´a se experiment´alnˇe urˇcit. Nechˇt dt0 znaˇc´ı tuto konstantu, dt aktu´alnˇe namˇeˇren´ y pln´ıc´ı ˇcas. Potom situaci, kdy pln´ıc´ı ˇcas byl kratˇs´ı neˇz dt0 lze popsat pomoc´ı δ = 1 pro dt ≤ dt0 δ = 0 pro dt > dt0
(2.28)
¯ n pro n-t´ D´ale lze zav´est veliˇciny δ¯n a L y ˇcasov´ y okamˇzik jako δ¯n = aδ · δn + (1 − aδ ) · δ¯n−1 ¯ n = aL · Ln + (1 − aL ) · Ln−1 L
26
(2.29)
vyhlazen´ım pr˚ ubˇeh˚ u charakteristiky δ a d´elek kolon L pomoc´ı exponenci´aln´ıho zapom´ın´an´ı pˇres sledovan´e ˇcasov´e okamˇziky t1 aˇz tn . Pˇritom aδ a aL jsou vhodnˇe zvolen´e konstanty z intervalu (0,1). Ukazuje se, ˇze existuje souvislost mezi frekvenc´ı jevu, kdy ¯ n na δ¯n lze pomˇernˇe dobˇre aproximovat δ = 1 a d´elkou kolony, neboˇt z´avislost veliˇciny L pˇr´ımkou ¯ n = m · δ¯n L (2.30) kde m je koeficient z´ıskan´ y line´arn´ı regres´ı. Experimenty ukazuj´ı, ˇze se tento koeficient mus´ı stanovit pro kaˇzd´ y detektor zvl´aˇsˇt. Nen´ı ovˇsem nutn´e ho pro kaˇzd´ y detektor 16 napoˇc´ıt´avat dopˇredu. Za urˇcit´ ych podm´ınek je moˇzn´e, aby metoda sama vhodnˇe upravovala hodnotu koeficientu m podle aktu´aln´ı dopravn´ı situace. Princip u ´pravy spoˇc´ıv´a v n´asleduj´ıc´ı myˇslence. Aˇt qn znaˇc´ı poˇcet vozidel, kter´e opustily kˇriˇzovatku bˇehem intervalu (tn−1 , tn ). Pokud pro ˇcasov´ y okamˇzik tn je δn = 1, existuje velk´a pravdˇepodobnost, ˇze auta, kter´a naplnila prostor mezi detektorem a kˇriˇzovatkou, byla souˇc´ast´ı skupiny vozidel pˇresouvaj´ıc´ı se v r´amci kolony. V tom pˇr´ıpadˇe vˇsak musela tato skupina ˇc´ıtat nejm´enˇe qn vozidel. Pro Lav pr˚ umˇern´ y poˇcet vozidel mezi kˇriˇzovatkou a detektorem mus´ı platit Ln ≥ Lav + qn
(2.31)
Tato nerovnost obsahuje dalˇs´ı informaci o d´elce kolony, kter´a m˚ uˇze ale nemus´ı b´ yt v souladu s rovnic´ı 2.30. Koeficient m se pak poˇc´ıt´a ze vzorce mn =
an bn
(2.32)
kde se v pˇr´ıpadˇe neshody obou vztah˚ u 2.30 a 2.31 klade an−1 · (k − 1) + (Lav + qn ) · δ¯n k bn−1 · (k − 1) + δ¯n2 = k
an = bn
(2.33)
V pˇr´ıpadˇe shody se ponech´av´a an = an−1 a bn = bn−1 , tedy koeficient m z˚ ust´av´a beze zmˇeny. Pˇritom k je vhodnˇe zvolen´a konstanta, ud´avaj´ı se dobr´e v´ ysledky pro hodnotu k = 100. Dalˇs´ı vyuˇzit´ı metody spoˇc´ıv´a v moˇznosti odhadovat saturaˇcn´ı tok kˇriˇzovatkou, tedy maxim´aln´ı mnoˇzstv´ı vozidel kter´e m˚ uˇze kˇriˇzovatkou za dan´ y ˇcas projet. K odstranˇen´ı v´ ychylek ve vstupn´ıch datech a zahrnut´ı pouze tˇech odhad˚ u u kter´ ych je jist´e, ˇze kolona nestihne bˇehem jednoho zelen´eho sign´alu projet kˇriˇzovatkou cel´a, je pak pro tento u ´ˇcel 17 vhodn´e pouˇz´ıt nˇekter´ y druh filtrace, napˇr´ıklad Kalman˚ uv filtr , nebo nˇekter´e jeho modifikace. V´ yjimeˇcn´e dopravn´ı situace a poruchy plynulosti dopravy zp˚ usoben´e n´ahodn´ ymi vlivy se pak daj´ı sledovat pomoc´ı mˇeˇren´ı dob obsazenosti bˇehem zelen´eho sign´alu a 16 17
Pokud jsou mˇeˇreny poˇcty vozidel, kter´e odjely z kˇriˇzovatky bˇehem pˇredchoz´ıho ˇcasov´eho intervalu. V´ıce o tomto filtru se lze doˇc´ıst napˇr´ıklad v [7] nebo [8].
27
porovn´av´an´ım, do jak´e m´ıry souhlas´ı s hodnotami odpov´ıdaj´ıc´ımi odhadnut´ ym d´elk´am kolon. Zp˚ usob odhadov´an´ı d´elky kolon pouˇz´ıvan´ y touto metodou je zaj´ımav´ y zejm´ena svou nen´aroˇcnost´ı na vstupn´ı data a d´ale pak schopnost´ı odhadovat d´elku kolony nˇekolikr´at pˇrevyˇsuj´ıc´ı vzd´alenost detektoru od kˇriˇzovatky. Naneˇstˇest´ı jsme nemˇeli moˇznost otestovat metodu na vlastn´ıch datech, neboˇt bylo provedeno pˇr´ıliˇs m´alo ruˇcn´ıch mˇeˇren´ı pln´ıc´ıch ˇcas˚ u. Myˇslenka t´eto metody nebyla d´ale rozv´ıjena tak´e z d˚ uvodu, ˇze aˇckoli se automatick´e mˇeˇren´ı pln´ıc´ıch ˇcas˚ u jev´ı jako nepˇr´ıliˇs sloˇzit´a z´aleˇzitost, stav´ı se firmy spravuj´ıc´ı techniku t´ ykaj´ıc´ı se detektor˚ u a jejich monitorov´an´ı k moˇznosti pˇreprogramovat ˇradiˇce detektor˚ u k poskytov´an´ı nov´ ych veliˇcin negativnˇe.
28
3 Z´ avˇ er Tato pr´ace pojedn´av´a o uˇzˇs´ım oboru dopravn´ı problematiky, souvisej´ıc´ım s ˇr´ızen´ım provozu na svˇetelnˇe ˇr´ızen´ ych kˇriˇzovatk´ach pomoc´ı syst´emu mikroregion˚ u, pro kter´ y je odhad aktu´aln´ı d´elky kolony na kˇriˇzovatce nezbytn´ ym. Je v n´ı pops´ano nˇekolik principielnˇe odliˇsn´ ych zp˚ usob˚ u, jak´ ymi se lze k probl´emu odhadov´an´ı d´elky kolony stavˇet. Pˇritom u kaˇzd´eho z nich jsou uvedeny jeho klady i z´apory, kde jako krit´erium k hodnocen´ı slouˇzila nejen pˇresnost metody pˇri testov´an´ı na re´aln´ ych datech, ale tak´e n´aroˇcnost na mˇeˇren´a data, s ohledem na syst´em mˇeˇren´ı veliˇcin dopravn´ıho proudu pouˇz´ıvan´ yv Praze. K u ´ˇcelu odhadov´an´ı d´elky kolony pouze ze znalosti obsazenosti a intenzity v 90 sekundov´ ych intervalech18 byly postupnˇe navrˇzeny tˇri metody. Prvn´ı z nich byla metoda zaloˇzen´a na line´arn´ı regresi. Jak uˇz plyne pˇr´ımo z jej´ıho principu, tato metoda nedok´aˇze zachytit neline´arn´ı ˇc´ast z´avislosti d´elky kolony na mˇeˇren´ ych veliˇcin´ach obsazenosti a intenzity. M˚ uˇze b´ yt ovˇsem pouˇzita sice jako ponˇekud hrub´ y, zato vˇsak velmi nen´aroˇcn´ y zp˚ usob odhadu d´elky kolony. Popˇr´ıpadˇe ji m˚ uˇzeme s v´ yhodou vyuˇz´ıt v pˇr´ıpadech, kdy m´ame k dispozici mˇeˇren´ı tak´e jin´ ych veliˇcin a snaˇz´ıme se ovˇeˇrit, zda tato nov´a mˇeˇren´ı pˇrin´aˇsej´ı nˇejakou informaci o d´elce kolony. Druh´a metoda (popsan´a v kapitole 2.2.4) neodhaduje pˇr´ımo d´elku kolony, ale jej´ı pozici v˚ uˇci detektoru. K tomu vyuˇz´ıv´a modelu vych´azej´ıc´ıho z pˇredstavy o pˇredpokl´adan´e dobˇe st´an´ı vozidla nach´azej´ıc´ıho se v kolonˇe nad detektorem, v pomˇeru k d´elce zvolen´eho ˇcasov´eho intervalu a v z´avislosti na d´elce ˇcerven´eho sign´alu. Jak bylo naznaˇceno uˇz v 2.2.4, v´ ysledky t´eto metody by se mohli jeˇstˇe zpˇresnit, pokud by bylo k dispozici dostateˇcn´e mnoˇzstv´ı mˇeˇren´ı k urˇcen´ı parametr˚ u pouˇzit´eho modelu, kter´e byly ˇ prozat´ım zanedb´any. C´asteˇcnou nev´ yhodou t´eto metody je ovˇsem potˇreba znalosti d´elky ˇcerven´eho sign´alu, kter´a nen´ı bˇeˇznˇe mˇeˇren´a automaticky a kterou by bylo nutno v pˇr´ıpadˇe, ˇze by ji nebylo moˇzno do automatick´eho mˇeˇren´ı zahrnout, nˇejak´ ym zp˚ usobem odhadovat. Tˇret´ı metoda (kapitola 2.2.3) opˇet odhaduje pozici kolony v˚ uˇci detektoru, v tomto pˇr´ıpadˇe na z´akladˇe mezn´ı obsazenosti, jiˇz se pokouˇs´ı odhadnout na z´akladˇe vytvoˇren´ı parametrick´eho modelu, jehoˇz parametr je pak odhadov´an metodou maxim´aln´ı vˇerohodnosti. Tato metoda je velmi nen´aroˇcn´a na vstupn´ı data, neboˇt vyuˇz´ıv´a pouze hodnoty obsazenosti. Z´aroveˇ n, jak se ukazuje podle v´ ysledk˚ u testov´an´ı na re´aln´ ych datech, d´av´a velice spolehliv´e v´ ysledky. 18
To jsou jedin´e automaticky mˇeˇren´e veliˇciny syst´emem pouˇz´ıvan´ ym v Praze.
29
Dalˇs´ım c´ılem do budoucna je zpˇresnit odhady d´elky kolony pomoc´ı vytvoˇren´ı vhodn´eho modelu, do nˇehoˇz budou vhodn´ ym zp˚ usobem zahrnuty vˇsechny mˇeˇren´e veliˇciny19 . D´ale by bylo moˇzn´e pokusit se, vzhledem k neline´arn´ım vztah˚ um mezi pouˇz´ıvan´ ymi veliˇcinami, nahradit ˇcasto pouˇz´ıvan´ y line´arn´ı Kalman˚ uv filtr nˇekterou z neline´arn´ıch metod, napˇr´ıklad Bayesovsk´ ym “bootstrap” filtrem.
19
Existuj´ı studie, kter´e ukazuj´ı, ˇze d´elka kolony je z´avisl´a na vˇsech mˇeˇren´ıch, jeˇz m´ame k dispozici a jejich nevyuˇzit´ım se pˇripravujeme o informaci v nich obsaˇzenou
30
4 Pˇ r´ılohy Table 4.1: Vstupn´ı hodnoty a v´ ysledky odhadu metody zaloˇ zen´ e na porovn´ av´ an´ı obsazenosti detektor˚ u s pod´ılem d´ elky ˇ cerven´ eho sign´ alu k celkov´ e d´ elce intervalu pr˚ umˇ ern´ a obsazenost [%] 35,5 38,6 34,3 26,8 48,0 34,6 36,8 73,1 67,5 65,5 36,3 51,9 36,3 48,4 54,4 33,8 30,8 20,9 34,4 65,1 38,1 20,1
pod´ıl ˇ cerven´ eho sign´ alu [%] 38,3 48,9 49,2 53,9 51,9 48,3 60,8 60,0 56,9 54,2 61,1 55,8 68,9 51,1 56,4 51,7 58,1 52,8 55,0 49,4 61,1 46,4
31
pr˚ umˇ ern´ a d´ elka kolony [m] 50,0 6,0 14,8 26,2 23,8 2,3 28,3 83,3 68,7 67,5 16,2 47,7 78,8 43,1 40,0 34,1 11,9 17,7 59,9 60,5 11,0 6,3
spr´ avn´ y odhad? ne ano ano ano ano ano ano ano ano ano ano ne ne ne ano ano ano ano ne ano ano ano
Table 4.2: Sestupnˇ e seˇ razen´ e obsazenosti prodluˇ zovac´ıch detektor˚ u a jim odpov´ıdaj´ıc´ı d´ elky kolon ze stˇ redeˇ cn´ıho mˇ eˇ ren´ı obsazenost [%] 87,5 84,5 84 82,5 82 82 81 79,5 79 79 78,5 78,5 78 78 78 77,5 77 77 76,5 76,5 76 76 76 75,5 75,5 75 74 74 73 73 73 72 71,5 71,5 71 71 70,5 70,5 70,5 70,5 69,5 69,5 69 68,5 68,5 68,5 68 67,5 67 66,5 66,5 66,5 66,5 66,5 66 66 65,5 65,5 65,5 65 65 63,5 63 63
d´ elka kolony [m] 880 460 815 550 330 330 140 825 560 655 140 660 430 895 550 185 85 430 400 490 550 530 775 675 815 380 270 450 580 400 850 430 550 230 350 635 200 550 630 670 215 415 400 285 200 500 230 415 750 505 490 650 405 850 220 605 230 600 780 650 530 550 600 830
obsazenost [%] 63 62,5 62,5 62,5 62,5 62,5 62,5 62 62 61,5 61,5 61,5 61 61 61 61 60 60 60 59,5 59,5 59,5 58,5 58 58 57,5 57 56 55,5 55 55 55 54 54 54 53,5 53,5 53 53 51 49,5 49,5 49 48 48 48 47 45,5 45,5 45,5 43 42,5 41 41 39,5 37 36,5 36 34,5 34 29 29 23 15,5
32
d´ elka kolony [m] 470 220 655 555 500 505 750 475 55 500 550 185 880 900 415 430 470 825 850 510 540 395 420 360 465 900 650 15 330 80 690 400 80 430 390 650 120 560 760 870 585 950 530 60 375 510 70 180 520 305 65 860 50 30 150 0 0 10 90 20 50 40 26 20
Table 4.3: Sestupnˇ e seˇ razen´ e obsazenosti strategick´ ych detektor˚ u a jim odpov´ıdaj´ıc´ı d´ elky kolon ze stˇ redeˇ cn´ıho mˇ eˇ ren´ı obsazenost [%] 85 67,5 64,5 63,5 63 62 62 61 61 60,5 59 59 58,5 57,5 57,5 57,5 57 56,5 54 53,5 53 53 53 53 52,5 52,5 52,5 52 52 51,5 51,5 51,5 51,5 50,5 50,5 50,5 50,5 50 50 50 49,5 49,5 49 49 49 48,5 48,5 48,5 48,5 48 48 47,5 47,5 47,5 47,5 47,5 47 47 47 46,5 46 46 46 45,5
d´ elka kolony [m] 880 900 655 285 550 490 825 815 895 330 530 550 760 330 550 550 550 200 470 775 605 400 830 430 375 560 415 555 500 660 860 400 430 430 650 580 690 350 670 750 550 585 650 475 900 230 600 390 395 430 400 505 450 470 500 850 650 635 305 510 220 600 870 550
obsazenost [%] 45,5 45,5 45 44,5 44,5 44 43,5 43,5 43,5 43,5 43,5 43 43 43 42,5 42,5 42,5 42 42 41,5 41,5 41 41 40,5 40 40 39,5 39 39 38,5 38 38 36,5 35 34,5 34 33,5 33,5 33,5 31,5 31 30 23,5 22,5 18 16,5 14 12 11,5 10 10 9,5 8,5 8,5 8,5 8,5 8 8 8 8 8 8 6 5,5
33
d´ elka kolony [m] 420 185 815 415 460 230 185 230 510 405 650 360 750 380 140 270 850 415 825 675 120 500 400 540 655 850 505 630 530 140 330 950 880 490 780 220 520 530 55 215 560 465 430 200 70 15 65 40 85 180 50 80 80 10 150 0 50 60 26 0 20 90 30 20
−13
1
x 10
0
−1
−2
F(b)
−3
−4
−5
−6
−7
−8 −6
−4
−2
0
parametr b
2
4
6
8
Figure 4.6: Z´avislost sdruˇzen´e hustoty pravdˇepodobnosti na parametru b, data z u ´ter´ y, prodluˇzovac´ı detektory
1.6
1.4
1.2
f(x,b=2.0639)
1
0.8
0.6
0.4
0.2
0
0
0.1
0.2
0.3
0.4
0.5 obsazenost
0.6
0.7
0.8
0.9
1
Figure 4.7: Pr˚ ubˇeh pravdˇepodobnosti jevu, ˇze kolona konˇc´ı pˇri dan´e obsazenosti za detektorem, data z u ´ter´ y, prodluˇzovac´ı detektory
34
10
14
x 10
12
10
F(b)
8
6
4
2
0
−2
−1
0
1
2
3
4
5
6
parametr b
Figure 4.8: Z´avislost sdruˇzen´e hustoty pravdˇepodobnosti na parametru b, data ze stˇredy, prodluˇzovac´ı detektory
2 1.8 1.6 1.4
f(x,b=0.5356)
1.2 1 0.8 0.6 0.4 0.2 0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
obsazenost
Figure 4.9: Pr˚ ubˇeh pravdˇepodobnosti jevu, ˇze kolona konˇc´ı pˇri dan´e obsazenosti za detektorem, data ze stˇredy, prodluˇzovac´ı detektory
35
12
10
F(b)
8
6
4
2
0
1.5
2
2.5
3
3.5
4
4.5
5
5.5
6
parametr b
Figure 4.10: Z´avislost sdruˇzen´e hustoty pravdˇepodobnosti na parametru b, data ze stˇredy, strategick´e detektory
1.5
f(x,b=2.9023)
1
0.5
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
obsazenost
Figure 4.11: Pr˚ ubˇeh pravdˇepodobnosti jevu, ˇze kolona konˇc´ı pˇri dan´e obsazenosti za detektorem, data ze stˇredy, strategick´e detektory
36
0.1 0.09
absolutní hodnota odchylky I(b) od integrálu
0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 −15
Figure 0
4.12:
−5
Absolutn´ı
0 parametr b
hodnota
5
odchylky
10
15
funkce
I(b)
od
1 + tanh [b + 3(tan(πx − π2 ))] dx
250 kolona odhad
200
délka kolony [m]
R1
−10
150
100
50
0
0
10
20
30
40 t [s/90]
50
60
70
80
Figure 4.13: Pondˇel´ı: skuteˇcn´a a odhadnut´a d´elka kolony
37
integr´alu
200 kolona odhad
180 160
délka kolony [m]
140 120 100 80 60 40 20 0
0
10
20
30
40 t [s/90]
50
60
70
80
Figure 4.14: P´atek: skuteˇcn´a a odhadnut´a d´elka kolony
250
kolona odhad
délka kolony [m]
200
150
100
50
0
0
10
20
30
40 t [s/90]
50
60
70
80
Figure 4.15: P´atek: skuteˇcn´a a odhadnut´a d´elka kolony za pomoc´ı parametr˚ u ˇ “nauˇcen´ ych” na pondelku
38
700
kolona odhad
600
délka kolony [m]
500
400
300
200
100
0
0
10
20
30
40 t [s/90]
50
60
70
80
Figure 4.16: Stˇreda: skuteˇcn´a a odhadnut´a d´elka kolony
700
kolona odhad
600
délka kolony [m]
500
400
300
200
100
0
0
10
20
30
40 t [s/90]
50
60
70
80
ˇ Figure 4.17: Ctvrtek: skuteˇcn´a a odhadnut´a d´elka kolony
39
Figure 4.18: Polohopis kˇriˇzovatky 084
40
Bibliography ˇ ıd´ıc´ı syst´emy silniˇcn´ı dopravy, vydavatelstv´ı CVUT, ˇ [1] Pˇribyl P., Mach R.: R´ Praha, 2003 [2] Andˇel J.: Matematick´a statistika, SNTL, Praha,1978 [3] Andˇel J.: Statistick´e metody, MATFYZPRESS, Praha, 1998 [4] Rao C. R.: Line´arn´ı metody statistick´e indukce a jejich aplikace, Academia, Praha, 1978 ˇ ˇ [5] Kvˇetoˇ n K., Militk´ y J.: Neline´arn´ı regrese, CSVTS CVUT, Praha, 1984 [6] M¨ uck J.: “Using detectors near the stop-line to estimate traffic flows”, TEC, no. December, pp. 429–434, 2002 [7] Peterka V.: “Bayesian approach to system identification”, in Trends and progress in system identification (P. Eikhoff ed.), pp. 239–304, Pergamon Press, Oxford, 1981 ˇ ˇ [8] Havlena V., Stecha J.: Modern´ı teorie ˇr´ızen´ı, vydavatelstv´ı CVUT, Paha, 1996 [9] Pˇribyl P., Sv´ıtek M.: Inteligentn´ı dopravn´ı syst´emy, BEN – technick´a literatura, Praha, 2001 [10] Jirava P., Slab´ y P.: Pozemn´ı komunikace 10 – dopravn´ı inˇzen´ yrstv´ı, vydavatelˇ stv´ı CVUT, Praha, 1997 [11] Kratochv´ılov´a J., Nagy I.: “Bibliographic search for optimization methods of ˇ Praha, 2003 signal traffic control”, Tech. Rep. 2081, UTIA AV CR, [12] Kratochv´ılov´a J., Nagy I.: “Traffic control of microregion”, in CMP’04: Multiple participant decision making; Theory, algorithms, software and applications, Andr´ ysek J., K´arn´ y M., Krac´ık J., Eds., Adelaide, May 2004, pp. 161–171, Advanced knowledge international [13] Kratochv´ılov´a J., Nagy I.: “Model dopravn´ı mikrooblasti”, Automatizace, vol. 47, no. 12, pp. 752 – 758, 2004 41
[14] Kratochv´ılov´a J., Nagy I.: “Traffic model of a microregion”, in IFAC world congress, Preprints, IFAC, Ed. IFAC, Praha, 2005 [15] Kratochv´ılov´a J., Nagy I.: “Lok´aln´ı ˇr´ızen´ı mˇestsk´e dopravy”, Tech. Rep 2101, ˇ Praha, 2004 UTIA AV CR, [16] Kratochv´ılov´a J., Nagy I.: “Sestaven´ı obecn´e metodologie pro zad´av´an´ı ˇ 2004 line´arn´ıho modelu dopravn´ı mikrooblasti”, Tech. Rep. 2105, UTIA AV CR
42
5 Podˇ ekov´ an´ı Pr´ace byla podporov´ana projektem ministerstva dopravy 1F43A/003/120 a grantem ˇ MSMT 1M0572.
43