FAR 2-38. Non-confidential Česky
Investiční strategie na základě scoringu Andrej Chomič Faunus Analytics Research Překlád z Ruštiny
Úvod V první části se popisuje pojem scoringu, uvádějí se příklady použití scoringu pro vyřešení praktických úloh v různých oblastech podnikání. Druhá část je zaměřena na použití technologií scoringu pro vybudování a optimalizaci investičních strategií, pro přijetí obchodních rozhodnutí a pro řízení rizik na finančních trzích (příkladem bude sloužit trh FOREX). Materiál tohoto článku zahrnuje základní teoretické principy, které jsou používány pro výzkum a vývoj v rámci projektu Faunus Asset Management.
Definice scoringu Nech máme cílový objekt, který se charakterizuje svým minulým a současným stavem. Tímto objektem může být finanční trh, klient banky, produktový segment atd. Nechme také, že tento objekt má některou charakteristiku, která přijímá pouze 2 hodnoty. Označme tuto binární charakteristiku za cílovou proměnnou. Zajímá nás budoucí hodnota cílové proměnné. Scoringem tudíž je hodnocení pravděpodobností budoucích hodnot cílové proměnné podle známé historie stavů objektu.
Aplikace scoringu Výše jsme uvedli formální definici scoringu. Pro lepší pochopení aplikovaného významu scoringu je účelné probrat příklady jeho využití.
Kreditní scoring Hodnocení rizik spojených s poskytováním a správou půjček v bankovní činnosti se nazývá kreditní (úvěrový) scoring. Vyčleňují se scoring úvěrové žádosti (application scoring) a scoring chování (behavior scoring). Rozebereme první typ kreditního scoringu. V tomto případě je objektem žádost o úvěr. Stavem objektu je charakteristika žadatele, například: věk, povolání, současné pracovní místo, stáže na současném pracovním místě, průměrný příjem za poslední rok atd. Pokud žadatel (applicant) již dříve dostával půjčky, pak nejdůležitější charakteristikou je historie splacení těchto úvěrů. Je důležité spojovat a porovnávat příjem žadatele, jeho současné výdaje, sumu a předpokládanou dobu splacení příslušného úvěru. Vyčlenění potenciálně důležitých charakteristik žádosti o úvěr a žadatele není jednoduchou úlohou, která v sobě spojuje tvůrčí přístup a přísnost statistické analýzy. Touto úlohou se zabývají analytici, kteří se dobře orientují v bankovní činnosti.
Copyright © 2011 Faunus Analytics. Všechna práva vyhrazena.
Cílovou proměnnou je defolt z úvěru. Defolt se může uskutečnit nebo neuskutečnit. Tzn., že jsou na místě dvě reálné hodnoty cílové proměnné. Zde se potýkáme s druhou komplikací – s volbou cílové proměnné. Definice defoltu je ve skutečnosti nejednoznačná. Definice defoltu jako nemožností vymoci dluh soudní cestou je pro byznys proces řízení rizik špatně přijatelná. Příliš mnoho času uplývá mezi prvními příznaky blížícího se problému a právně uznaným defoltem. Daleko cennější je určení defoltu jako prodlení ve splacení úvěru delší než 6 měsíců. Jsou možné i jiné definice defoltu.
Scoring v telekomunikačních společnostech Telekomunikační byznys je byznysem vysoce konkurenčním. Praxe ukazuje, že získávání klientů je mnohem dražší než jejich udržení. Proto je velmi důležité včas identifikovat již podle raných příznaků potenciální možnost přechodu klienta ke konkurenci. Scoring se může používat pro udržení klientů. Objektem scoringu je abonent, který se charakterizuje personálními daty, historii využití služeb. Cílovou proměnnou je odmítnutí klientem služeb společnosti. A zase definice cílové proměnné není triviální úlohou. Specifikou telekomu je, že abonent velmi vzácně píše žádost o odmítnutí služeb, častěji jednoduše je přestává využívat. Lze to identifikovat podle nulového trafiku. I přesto nulový trafik za konkrétní období může být způsoben například dovolenou nebo pracovní cestou abonentu. Jako dostatečně dobrá definice odlivu může sloužit příznak absence trafiku a jakékoliv další aktivity abonenta za období delší než 3 měsíce.
Scoring pro investiční strategie na FOREX Formalizace trhu Objektem scoringu může také být finanční trh. Rozebereme v této souvislosti měnový trh FOREX. Volba charakteristik historie trhu a cílové proměnné je komplikovanou úlohou. Je potřeba zvolit hloubku historie kotací, timeframe, způsob redukování počtu proměnných a mnoho dalšího. Zde v nejobecnějším tvaru popišme jeden z možných přístupů k formalizaci úlohy scoringu FOREX. Historie kotací s některým zjednodušením může být prezentována jako množství hodnot kotací, oddělených přes časová období s permanentní periodou. Časová období lze očíslovat. Pak historie kotací může být prezentována jako časová řada
rate = rate[t], rate[t+1], ..., rate[t+n], rate[t+n+1] Při prognózování kotací měnového páru jsou nám známé hodnoty kotací rate[t], rate[t+1], ..., rate[t+n] a je potřeba udělat prognózu některých důležitých „vlastností“, a společně s tím zdůraznit, že pro praktické potřeby není nutní prognózovat samotnou hodnotu kotací.
Copyright © 2011 Faunus Analytics. Všechna práva vyhrazena.
Volba cílové proměnné scoringu Volba cílové proměnné je často spojena s kompromisem. V ideálu samozřejmě bychom chtěli mít model, který dostatečně přesně prognózuje kotace za každou minutu na období 2-3 let. Bohužel, model tohoto typu není možné vybudovat. Proto je potřeba zjednodušovat definici úlohy s cílem dodržet kompromis mezi zjednodušením modelování a aplikovanou významností výsledku. Toto je tvůrčí úloha, která v sobě obsahuje element svévole výběru. Například, lze určit cílovou proměnnou jako znak změny kotace měnového páru za období určitého trvání.
Pro FOREX je důležité umět prognózovat znak změny kotací. Ale prakticky je hodně důležitější prognózování významných změn kotací, umožňujících pokrývat brokerské komise a spready. Scoringový model se optimalizuje na historických příkladech. Algoritmy optimalizace scoringových modelů umožňují přidávat příkladům vah číselné nezáporné hodnoty. Pokud určíme každému příkladu váhu prognózování pro případy významných změn kotací.
, pak vylepší model přesnost
Lze nabídnout i rozšířenou variantu určení váhy příkladu . Při rozšířené variantě se část příkladů s nedostatečně výrazným chováním trhu nebo anomálními vychrleními (s větší mírou „šumu“ a menším podílem užitečných informací) neučástní optimalizace scoringového modelu. Praxe ukazuje, že podobná strategie filtrace „šumu“ umožňuje zlepšit přesnost modelování.
Scoring trhu Prognóza měnového páru se zjednodušeně omezuje na prognózu znaku změny kotace. Výsledkem prognózy je hodnocení pravděpodobnosti možných výstupů.
Kde: 1. rate - historie kotace měnového páru 2. TRANSFORM - funkce transformace historie kotací 3. SCORING_MODEL - model scoringu, umožňující podle transformované historie vyhodnotit pravděpodobnost budoucího růstu kotací.
Copyright © 2011 Faunus Analytics. Všechna práva vyhrazena.
Předzpracování dat Jedná z variant předzpracování historie kotací
Nabízený způsob transformace je jednoduchý ve své realizaci a zároveň odstraňuje některé efekty nestacinarity časových řad FOREX. Pro redukci vlivu vychrlení a heteroskedascisity (proměnlivosti volatility) lze používat logaritmování:
V případě však, že počítáme s tím, že prudké kolísání kurzu v minulosti je důležité pro prognózu v budoucnu, pak lze použit umocňování:
Výsledkem transformace je také časová řada, odvozená od časové řady kotací.
Struktura modelu Jako model scoringu SCORING_MODEL se může používat logistická regrese. Funkce logistické regrese:
Kde: 1. 2. 3.
- logistická funkce - lineární funkce
x - vektor prediktorů. V případě FOREX je to výsledek transformace časové řady
kotací. 4. - vektor koeficientů regrese. Koeficienty regrese se hodnotí specializovanými algoritmy optimalizace. Většina programů statistické analýzy zahrnuje hotové realizace algoritmů vybudování regrese.
Copyright © 2011 Faunus Analytics. Všechna práva vyhrazena.
Obrázek 1 – Příklad grafu logistické funkce
Důležitou vlastností logistické funkce je monotónnost a omezenost číselným úsekem (0,1). Všechno toto umožňuje interpretovat logistickou regresi jako hodnocení pravděpodobnosti. Struktura scoringového modelu se neomezuje pouze na logistickou regresi. Například, scoringový model lze vybudovat na základě umělé neuronové sítě nebo dalších řešení.
Hodnocení parametrů Scoringový model se staví pro skupinu objektů jedné třídy. Odlišuje to scoringový model od modelu časové řady. Při prognózování časových řad se ve finále buduje zvláštní model pro každou časovou řadu, anebo jediný model pro nevelkou skupinu časových řad (vícerozměrné prognózování časových řad). Ve scoringu jeden univerzální model se aplikuje na nekonečně velkou skupinu objektů. Segmentace obchodních nástrojů FOREX se může uskutečňovat podle různých kriterií. Například, podle úrovně likvidity, podle typu kotováného objektu (měna, kov, ropa atd.). Jsou možná i jiná kriteria segmentace. Konkrétně pro FOREX to znamená, že není nutné prognózovat EUR/USD jedním modelem, a AUD/CHF pak druhým. Lze tyto měnové páry sloučit podle příznaku vysoké likvidity a shodné volatility, a dále používat pro prognózování jediný univerzální model. Scoringový model není něčím neměnným. Model musí počítat se změnami tržních zákonitostí. Proto parametry modelu je nutno periodicky nebo podle události opakovaně optimalizovat s ohledem na nová data. Optimalizace parametrů se provádí na datech minulých pozorování. Ale účelem optimalizace parametrů modelu je prakticky přijatelná přesnost prognóz na nových datech. Abychom kontrolovali očekávanou přesnost modelu na nových datech, je potřeba část známých příkladů vyčlenit pro testování. V jednoduché variantě trainingové a testové množství příkladů může být vytvořeno jednou náhodným výběrem. Lze rovněž do testového množství zapojovat pouze příklady za poslední období pozorování. Lze též pro training modelu využívat pouze příklady za období pozorování, která předcházejí období testování (walk forward analysis). Doporučujeme využívat cross-testování (cross validation). Cross-testování předpokládá rozdělení celého období pozorování na rovnocenné úseky. Každý úsek období pozorování se jeden po druhém stává testovým obdobím, kdežto ostatní – obdobím trainingovým. Výsledky testování zvláštních úseků se zprůměrňují.
Copyright © 2011 Faunus Analytics. Všechna práva vyhrazena.
Přijetí obchodních rozhodnutí Obchodník vždy má na FOREXu 4 varianty řešení: 1. 2. 3. 4.
Otevřít dlouhou pozici Otevřít krátkou pozici Uzavřít všechny současné pozice na obchodní nástroj Neotevírat dodatečnou pozici na obchodní nástroj
Obchodník může nevstupovat na trh s preferencí absence zisku před alternativou neúměrně vysokých rizik ztrát. Pro pochopení ve které situaci je lepší vstupovat na trh, lze využit analýzy křivky ziskovosti. Tržní situaci lze charakterizovat jedním číslem – hodnocením pravděpodobnosti, které je realizováno pomocí scoringového modelu. Tím pádem může být úloha omezena na výběr limitní hodnoty pravděpodobnosti. Tento limit je zvykem ve scoringu jmenovat prahem odseknutí. Jak bude popsáno dále, pro FOREX se používají 2 meze odseknutí: práh vstupu na trh a práh výstupu z trhu. Algoritmus výběru prahu vstupu na trh může být následující: 1. Uvádí se omezení na očekávané statistické charakteristiky obchodování 2. Historické příklady z testového množství (viz sekci „Scoring trhu / Hodnocení parametrů“) se zařazují do žebříčku podle klesání maximálního testového hodnocení pravděpodobnosti. Připomínáme, že scoringový model hodnotí pravděpodobnost 2 nespolečných událostí - růstu a snížení kotací. 3. Pro každou prahovou variantu vstupu na trh se určuje: a. očekávaná průměrná a nejmenší ziskovost, při otevření pozic v případě překročení pravděpodobnosti prahu vstupu na trh v nejpřijatelnějším směru b. očekávané množství operací za období c. očekávaný maximální drawdown za období d. jiné očekávané obchodování
statistické
charakteristiky
výsledků
budoucího
4. Vynechávají se prahové varianty vstupu na trh, pří kterých statistické charakteristiky obchodování neodpovídají stanoveným omezením 5. Ze zbývajících prahových variant vstupu na trh pak volíme variantu, která přináší maximální očekávanou ziskovost.
Copyright © 2011 Faunus Analytics. Všechna práva vyhrazena.
Obrázek 2 – Výběr meze odseknutí (cutoff) podle křivky ziskovosti .
Kromě řešení úlohy výběru okamžiku vstupu na trh, je také důležité vědět vhodný okamžik výstupu z trhu. Pro to je potřeba zavést druhý práh odseknutí – práh výstupu z trhu. Tento práh je vždycky očividně menší než práh vstupu na trh. Při optimalizaci prahu výstupu z trhu je velmi důležité počítat se spreadem a s brokerskou komisí. Práh výstupu z trhu nesmí být příliš blízko prahové hodnotě vstupu na trh. Jinak může vzniknout riziko otevření velkého podílu pozic otevíraných na krátké časové období. Čas udržení pozic může být nedostatečný pro pokrytí průměrnou ziskovosti podle pozic spreadů a brokerských komisí. V tomto případě bude samozřejmě broker spokojený, ale obchodník bude nést ztráty Scoring vytváří prognózu trhu pro omezené období. Pozice musí být každopádně uzavřena po skončení doby platnosti prognózy. Kromě prahů odseknutí nelze také zapomínat na tradiční prostředek kontroly rizik – stopúrovně a řízení objemů pozic (money management). Takže, v minimální variantě jsme napočítali pět parametrů procedury přijetí obchodních rozhodnutí: 1. 2. 3. 4. 5.
Práh vstupu na trh Práh výstupu z trhu Limitní úroveň ztrát na pozici (stop loss) Limitní úroveň zisku na pozici (take profit) Objem pozice
Tyto parametry jsou navzájem propojeny. Optimalita hodnoty jednoho parametru závisí na zvolených hodnotách jiných parametrů. Proto se tyto parametry musí optimalizovat společně. Pro redukci výpočtů lze používat metody skenování podle mříže, pseudogradientního odtoku, náhodného hledání, genetických algoritmů. Stejně jako v případě hodnocení parametrů scoringového modelu (viz sekci „Scoring trhu / Hodnocení parametrů“), je třeba vyčlenit testové období, na kterém se budou hodnotit očekávané charakteristiky budoucího obchodování.
Copyright © 2011 Faunus Analytics. Všechna práva vyhrazena.
Kontaktní informace Andrej Chomič Faunus Analytics Research +7 495 648-69-18 (Moskva, Ruská Federace)
[email protected] www.faunusanalytics.com
Copyright © 2011 Faunus Analytics. Všechna práva vyhrazena.