Enhancement of the Altman approach using multiple discrimination analysis Bc. Radek Mitáček, department of statistics and operational research, Faculty of business and economics, Mendel university in Brno,
[email protected] Abstrakt Nosnou myšlenkou práce je testování nového přístupu k vytvoření tzv. Altmanova modelu, jenž se hojně využívá při finanční analýze a to na reálných datech. Prostředkem k tomuto je vytvoření 2. lineární diskriminační funkce za účelem lepšího rozlišení dat, která nejsou klasickou lineární diskriminační funkcí rozlišována jasně. Využití metody vedlo k významnému zlepšení celkových výsledků u klasifikační i predikční schopnosti konečného modelu, významně tedy zlepšilo jeho schopnost rozlišovat bankrotní a bonitní společnosti. Vzhledem k experimentální povaze přístupu je i přes poměrně jasnou logiku přístupu doporučeno k výsledkům přistupovat opatrně a provést testování a opakování metody na dalších souborech dat.
Klíčová slova Finanční analýza, bankrotní model, vícerozměrná diskriminační analýza
Abstract The main aim of this paper is to exam a new approach to the creation of Altman model, which is widely used for the financial analysis using real data. The main way to do this is to set up a second canonical discriminant function in order to improve distinction of the data which was not distinguished properly at first time. Using of this approach lead to significant improvement of results in terms of the classification and prediction capability of the model. This means it better understood which firms were going to bankrupt and which are not. Due to the experimental nature of this approach, is it recommended to be cautious when interpreting the results and to do few more tests using different data even though the logic of the approach is easy to use and understand.
Key Words Financial analysis, bankruptcy model, multivariate discrimination analysis
Úvod Finanční analýza je již poměrně dlouhou dobu jednou ze základních metod zkoumání bonity podniku. Je často využívána mnohými zájmovými skupinami pocházejícími jak z vnitřního prostředí, tedy ze samotné společnost (management, vlastníci,…), tak i z prostředí vnějšího (věřitelé, dodavatelé,…). Prvním významným počinem na poli výzkumu byl článek zabývající se využitím diskriminační analýzy k určování bonity firem (Altman, 1968). Díky vysoké přesnosti predikce se článek setkal se velkým ohlasem a na jeho základě bylo napsáno mnoho článků zabývajících se rozšířením modelu, případně ověřováním na datech z jiných trhů či doby (Altman, Haldeman, Narayanan, 1977). S ohledem na dynamiku současného tržního a prostředí a rozdíly v jednotlivých zemích je nutno neustále přehodnocovat stávající modely a v rozpětí několika let je aktualizovat. To vede ke tvorbě modelů s různou mírou přesnosti. Pro srovnání je možno vzít modely IN zkonstruované na Českou republiku (Vochozka, 2011).
Cíle a metodologie Cílem příspěvku je tedy otestovat metodu, díky níž by se zvýšila kvalita modelu bez ohledu na povahu dat, ze kterých bude konstruován. Ke tvorbě modelu a následnému zlepšování budou použita data získaná z databáze Amadeus. Jedná se o české výrobní akciové společnosti. Soubor dat byl rozdělen na 2 části, trénovací a testovací. Trénovací data slouží k vybudování modelu, testovací k otestování schopnosti predikce. Data musela být očištěna o velké množství pozorování vzhledem k jejich extrémnímu charakteru, tj. příliš vysoké či nízké oproti průměru skupiny. Celkem bylo k trénování vybráno 54 pozorování, u kterých je a priori známý jejich stav a pro něž které bylo z finančních výkazů spočítáno 22 převážně poměrových ukazatelů. Ty byly vybrány na základě odborné literatury (Kislingerová, 2008). Metodou pro tvorbu bankrotního modelu byla diskriminační analýza (Hebák, 2007). Data byla zpracována v softwaru STATISTICA.
Výsledky Na data byla aplikována diskriminační analýza a byl vytvořen model sestávající z níže popsaných proměnných:
Debt Ratio I
Rentabilita tržeb
ROE
Mzdová náročnost tržeb
Finanční páka
Doba inkasa pohledávek
Pro určení klasifikace modelu byla určena data, z nich byl model vystavěn. Pro určení testování úspěšnosti predikce aneb schopnosti určovat firmy, u nichž není původně známo, zdali zbankrotují či nikoliv bylo vybráno 42 společností, z toho 17 bankrotních a 25 bonitních. Úspěšnost klasifikace byla zjištěna 92,59 %. Úspěšnost predikce byla zjištěna 47,62 %. Nyní se pokusíme kvalitu modelu zlepšit. Použijeme k tomu níže nastíněných teoretických předpokladů, které se pak budeme pokoušet demonstrativně předvést, popřípadě prokázat. Základem je alespoň elementární znalost principů diskriminační analýzy. S ohledem na způsob výpočtu kanonické diskriminační funkce, který je realizován prostřednictvím minimalizováním vnitroskupinové variability a maximalizováním variability meziskupinové, tzn. hledáním shluků bodů, které jsou projekcí bodů reprezentujících jednotlivá pozorování na přímku, lze předpokládat, že můžou nastat případy, kdy se proměnné, které se při daném množství pozorování jeví významnými pro diskriminaci, při významně odlišném počtu pozorování stanou zcela nevýznamnými a naopak. To je dáno změnou proměnných, díky kterým se data v m-rozměrném prostoru shlukují (m je počet proměnných). Na základě tohoto předpokladu se pokusíme namodelovat 2. lineární diskriminační funkci, která nám pomůže v lepším rozhodování, nazvěme ji diskriminací 2. úrovně a původní diskriminaci diskriminací 1. úrovně. Pozorování, která jsme úspěšně určili pomocí 1. úrovně diskriminace, nás již nemusejí zajímat. Zaměříme se pouze na pozorování, která se umístila v šedé zóně. Možným postupem je v tomto případě neúspěšně klasifikovaných pozorování je potom aplikace další diskriminační analýzy za účelem doklasifikace. V případě, že bychom chtěli modelovat lineární diskriminační funkci pouze za účelem klasifikace stávajících případů, můžeme ignorovat uměle vytvořenou šedou zónu, všech-na správně klasifikovaná pozorování z prvního kroku se odeberou a LDA se provádí pouze na skutečně špatně klasifikovaných pozorováních. Nezřídka lze pak zkombinováním těchto dvou diskriminačních funkcí dosáhnout modelu s klasifikační schopností 100 %. To je možné díky již předem známému zařazení firem. Jsme si jisti, která pozorování v případě nutnosti nechat diskriminovat modelem na hlubší úrovni (v případě nutnosti je možné namodelovat velmi mnoho úrovní, u modelů na hlubších úrovních by ale zřejmě velmi snadno docházelo přinejmenším k porušování před-pokladů s ohledem na nižší počet pozorování).
V případě, že bychom od modelu očekávali i predikční schopnost, nelze využít diskriminační funkce 2. řádu vytvořenou pouze pomocí špatně klasifikovaných pozorování z tréninkové množiny. Nemáme totiž předem informaci o tom, do které množiny, pozorování ze souboru, který nebyl použit pro vytvoření rozhodovací-ho pravidla, spadá. Po vypočítání skóre a následném zařazení si tudíž nejsme vědomi toho, jestli bylo pozorování na první úrovni určeno dobře či ne, proto nemůžeme rozhodnout o případném využití další LDF. Pokud se rozhodneme, že chceme používat model i pro predikce, musíme pro vytvoření lineární diskriminační funkce 2. řádu použít všechna pozorování, která se nacházejí v tzv. „šedé zóně". Ta je konstruována na základě pozorování, u nichž při klasifikaci došlo k chybám I. či II. typu. Krajními body intervalu jsou hraniční body intervalů bezchybné klasifikace. Použití LDF 2. řádu k predikci je pak založeno na výše popsané hypotéze, že firmy neznámého původu z dané množiny (bonitní, bankrotní), jejichž Z skóre náleží do šedé zóny, trpí stejnými problémy s hodnotami proměnných jako firmy, na kterých bylo pravidlo vytvářeno. To znamená, že by s nimi tvořili stejné shluky dle příslušnosti a jsou dobře diskriminovatelné danou funkcí. Podmínkou jsou nesystémové změny ve struktuře firem, kvůli nimž by poměrové ukazatele nabývaly extrémních hodnot. Před samotnou predikcí je tudíž nutné srovnat hodnoty u zkoumaných firem například s intervaly příslušných proměnných, na kterých byl model vybudován. V případě zjištění extrémů je pravděpodobné, že model nebude u těchto firem predikovat správně, stejně jako u modelu na první úrovni diskriminace. Na druhou stranu nepoužitelnost těchto dat náš už sama o sobě varuje, že se jedná o firmu v nestandardní situaci. Abychom mohli využít výše popsaný princip v praxi, je nutné určit šedou zónu původního modelu. Do ní v našem případě spadá z původního trénovacího souboru 14 firem, 8 bankrotních a 6 bonitních. Na základě těchto dat byl vytvořen model 2. řádu, ve kterém figurují proměnné:
ROA (VH za účetní období/AKT)
Pracovní kapitál na aktiva
Doba obratu aktiv (tržby výrobky+ služby)
Můžeme vidět, že model byl skutečně postaven na základě jiných proměnných než model původní. Mohli bychom tedy prohlásit, že data se skutečně mohou shlukovat prostřednictvím různých proměnných při různých množství pozorování. Za účelem verifikace úspěšnosti byla určena klasifikační matice, která určila správně 100 % pozorování. Z testovacích dat spadalo do šedé zóny u prvního modelu 13 pozorování, 10 bonitních a 3 bankovní. Tato data byla
užita ke zjištění kvality predikce, modelu 2. úrovně. Správně bylo určeno 38,46 % firem. Tato úspěšnost je však pouze na 2. úrovni modelu. Celkovou úroveň predikce analýzy musíme určit jako spojení úspěšnosti na první i druhé úrovni s ohledem na data, která propadla šedou zónou napoprvé. Celkem bylo správně určeno 25 pozorování z celkových 42, kombinovaná úspěšnost je tedy ve výši 59,52 %.
Diskuze Za účelem validace naší myšlenky byl vybudován 2. diskriminační model. Jeho zobecnitelnost je diskutabilní s ohledem na velmi nízký počet pozorování použitých k modelování. Výsledky, které nám nabízí, jsou velmi zajímavé. Dvouúrovňový model má klasifikační schopnost 100 %. Predikční schopnosti se nám zvýšily téměř o 11,9 %. Model 2. úrovně byl vystavěn pomocí jiných proměnných, čímž se nám potvrdila hypotéza o rozdílném shlukování. Zajímavým by bylo srovnání efektivnosti této metody s metodami jinými, zejména těmi, které se zabývají transformací dat (Vaníček, 2011). Její nespornou výhodou je jednoduchost v logice i aplikaci, nenarušení vztahů mezi proměnnými a podle prvních, zdaleka tedy ne úplně průkazných pokusů, i velká účinnost. Nevýhodou pak může být právě nízký počet pozorování, která případně zbydou při pokusu o další modelování a počtem proměnných, které by měly vstupovat do modelování. Čím více nekorelovaných proměnných, tím větší šance vytvoření rozdílných shluků. U velkých datových souborů by v případě bylo možné zkonstruovat i více než dvě kanonické diskriminační funkce, využití této metody by mohlo společně s kombinací metod dalších vést k velmi zajímavým výsledkům. Ani tato metoda však nezabrání dalším problémů, které se dotýkají dat, ale jsou poněkud jiného charakteru. Hlavním z nich je nejspíše stacionarita poměrových ukazatelů, kdy se v čase mění jejich charakter a model tak ztrácí na důvěryhodnosti.
Závěr Konečná úspěšnost predikce dosáhla díky využití inovativního přístupu na číslo 59,22 %. Hlavním přínosem práce je otestování použitelnosti výše zmíněného postupu, který predikci zlepšil o 11,9 %. Klasifikační schopnost modelu byla dokonce zlepšena na 100 %, což je nevídaný výsledek, zvláště když předpoklady modelu nebyly splněny optimálně. Tento postup čeká ještě mnoho dalších testů a zkoumání, velmi zajímavé by bylo jej porovnat s jinými metodami zlepšování vlastností modelů, případně jej s nimi zkombinovat.
Literatura ALTMAN, E. (Sep., 1968), Financial ratios, discriminant analysis and the prediction of corporate Bankruptcy, The journal of finance, Vol. 23, No. 4 pp. 589-609 ALTMAN,E. I. HALDEMAN, R. G.; NARAYANAN, P., 1977: ZETA analysis: A new model to identify bankruptcy risk of corporations. Journal of Banking and Finance, Vol. 1, No. 1pp. 29–51. HEBÁK, PETR A KOL, 2007: Vícerozměrné statistické metody (1). Praha: Informatorium, 256 s. ISBN 978-80-7333-056-9. KISLINGEROVÁ, EVA A JIŘÍ HNILICA. 2008: Finanční analýza: krok za krokem. 2. vyd. Praha: C.H. Beck, xiii, 135 s. C.H. Beck pro praxi. ISBN 978-80-7179-713-5. VANÍČEK, ROMAN. 2011: Zlatá pravidla financování a tvorba diskriminační funkce. Brno, Diplomová práce. Masarykova Univerzita, Ekonomicko-správní fakulta VOCHOZKA, MAREK. 2011: Metody komplexního hodnocení podniku. 1. vyd. Praha: Grada Publishing, 246 s. Finance (Grada). ISBN 978-80-247-3647-1.