5. mezinárodní konference Řízení a modelování finančních rizik VŠB-TU Ostrava, Ekonomická fakulta, katedra Financí
Ostrava 8. - 9. září 2010
Logit vs probit model při determinaci souhrnných ukazatelů výkonnosti bank1 Petr Gurný, Martin Gurný 2
Abstrakt Určování pravděpodobnosti úpadku (PD) se řadí mezi jeden z klíčových úkolů risk managementu. Tento parametr nehraje důležitou roli pouze při určování bonity dlužníka, ale také například při oceňování kreditních derivátů. V tomto příspěvku budeme diskutovat možnost určování PD pomocí credit-scoring modelů, a to konkrétně pomocí logit a probit modelu. Po představení teoretických východisek odhadneme v aplikační části oba modely na vzorku tří set amerických komerčních bank. Tyto modely budeme následně aplikovat jak na původní vzorek, tak také na kontrolní vzorek 100 amerických komerčních bank. Cílem příspěvku je určit PD vybraných amerických bank pomocí odhadnutého logit a probit modelu, diskutovat výhody a nevýhody obou modelů a srovnat dosažené výsledky. Klíčová slova Pravděpodobnost úpadku, logit model, probit model.
1. Úvod Určování bonity dlužníka, tedy určování jeho pravděpodobnosti úpadku (PD), je v současné době finanční krize v centru pozornosti spousty bank a ratingových agentur. A to nejen určování PD nefinančních institucí, ale zejména určování bonity finančních ústavů. Tento parametr hraje dále klíčovou roli v určování ratingů, oceňování dluhových instrumentů, jakými jsou např. kreditní deriváty, a při kalkulaci ekonomického a regulatorního kapitálu dle Basel II. Tyto důvody vedou k tomu, že je téma určování PD v centru pozornosti jak podnikatelské, tak akademické sféry. Mezi nejrozšířenější modely používané k určování bonity dlužníků patří tzv. credit-scoring modely. To jsou obecně vícerozměrné modely, které jako vstupy používají hlavní finanční indikátory, kterým následně dle konkrétního použitého modelu přiřazují váhy, tak, aby co nejlépe odrážely jejich relativní významnost při předpovědi defaultu. Credit-scoring modely se člení do několika kategorií (blíže viz Green (2008) nebo Engelmann and Rauhmeier (2006)). Statistická metodologie pro tyto procesy byla představena již autory jako jsou Fischer (1936) a Durand (1941), o rozvoj a aplikaci těchto modelů se dále zasloužil zejména Beaver (1966) a Altman (1968). V rámci České republiky patří mezi nejznámější model tzv. IN model, viz Neumaierová a Neumaier (2002).
1
Tento článek vznikl za finanční podpory Studentské grantové soutěže EkF, VŠB-TU Ostrava v rámci projektu SP/2010102 „Určování pravděpodobnosti úpadku finančních institucí na bázi credit-scoring modelů a za pomocí Lévyho procesů a copula funkcí“ 2 Ing. Petr Gurný, VŠB – Technická univerzita Ostrava, Ekonomická fakulta, katedra Financí, Sokolská 33, 701 21 Ostrava 1, e-mail:
[email protected]. Bc. Martin Gurný, VŠB – Technická univerzita Ostrava, Ekonomická fakulta, katedra Financí, Sokolská 33, 701 21 Ostrava 1, e-mail:
[email protected].
5. mezinárodní konference Řízení a modelování finančních rizik VŠB-TU Ostrava, Ekonomická fakulta, katedra Financí
Ostrava 8. - 9. září 2010
Tento příspěvek bude dále věnován regresní podskupině credit-scoring modelů, konkrétně logit a probit modelu, a to v aplikaci na finanční instituce. Modely sloužící k určování PD finančních institucí nejsou natolik rozvinuty jako modely k určování PD nefinančních institucí, nicméně některé výzkumy sloužící k určování bonity bank pomocí finančních ukazatelů již existují, viz např. Peresetsky and Karminsky (2008) a Gurný and Gurný (2009). Cílem tohoto příspěvku je odhadnout modely pro určování pravděpodobnosti úpadku bank z údajů amerického trhu pomocí logit a probit modelu a graficky demonstrovat rozdíly mezi nimi. Příspěvek bude strukturován následovně. V metodologické části bude nejprve detailněji představen logit a probit model včetně odhadů parametrů. Tato metodologická východiska budou dále aplikována na vzorek 300 amerických komerčních bank, budou odhadnuty a porovnány oba modely, které budou následně aplikovány na kontrolní vzorek čítající 100 amerických komerčních bank.
2. Logit model, probit model Jak již bylo uvedeno výše, logit a probit modely jsou vícerozměrné statistické modely sloužící k předpovědi pravděpodobnosti defaultu, přičemž jako vstupy se využívají hlavní ekonomické a finanční ukazatele. Tyto modely zachycují vztah mezi závislou proměnnou Y (dichotomická proměnná) a jednou nebo více nezávislými proměnnými X. Vysvětlovaná proměnná, , je dána
1 jestliže default nastane , 0 jestliže default nenastane
a dále předpokládejme, že pravděpodobnost 1 je dána a tedy že 0 je dána pravděpodobností 1 :
1 s pravděpodobností . 0 s pravděpodobností 1
Cílem je tedy modelovat pravděpodobnost , že default nastane, specifikováním následujícího modelu ! " #$ %,
kde $ jsou jednotlivé finanční indikátory a ! a # jsou odhadované parametry.
Existuje řada možností, jak specifikovat , v tomto článku se ale zaměříme na logistickou a probistickou transformaci, tedy na logit a probit model. Logit model
exp ! " #$ % 1 , 1 " exp ! " #$ % 1 " exp ! #$ %
5. mezinárodní konference Řízení a modelování finančních rizik VŠB-TU Ostrava, Ekonomická fakulta, katedra Financí
Ostrava 8. - 9. září 2010
Probit model (
12345
67
1
1 exp , - . / 0-. 2 √2+
Vzhledem k nelineárním vlastnostem těchto modelů není možné při odhadu parametrů využít klasickou OLS (ordinary least squares) metodu, nýbrž je nutné maximalizovat funkci věrohodnosti. Při dané pravděpodobnosti , můžeme formulovat pravděpodobnostní funkci jako =
;5
9 : ><
1 %<6;5 .
Z čistě výpočetních důvodů je vhodnější maximalizovat logaritmus této funkce, tedy =
=
><
><
ln 9 ? ln " ? 1 % ln 1 %. Konkrétně tedy pro logit a probit model: logit model =
=
><
><
1 1 ln 9 ? ln , / " ? 1 % ln ,1 /, 1 " exp ! #$ % 1 " exp ! #$ % probit model =
ln 9 ? ln @( ><
12345
67
1
=
12345 1 1 1 exp , - . / 0-A " ? 1 % ln @( exp , - . / 0-A 2 2 √2+ √2+ 67 ><
Maximalizací těchto funkcí získáme odhady parametrů ! a #.
3. Aplikační část V této části budou výše uvedené metodologické poznatky aplikovány na vzorek 300 amerických komerční bank a bude odhadnut logit a probit model pro určování PD bankovních institucí. Dále budou graficky demonstrovány rozdíly mezi oběma modely a následně budou oba modely aplikovány na kontrolní vzorek 100 amerických komerčních bank. 3.1 Vstupní data Jak již bylo uvedeno v úvodu, budeme v tomto příspěvku pracovat se vzorkem 300 amerických komerčních bank. První nezbytným krokem je rozdělení tohoto vzorku na dvě skupiny bank, zdefaultované a nezdefaultované. Definovat default lze řadou různých způsobů, v tom příspěvku budou za zdefaultované banky považovány ty, které se dostaly do likvidace, případně ty, kterým k přežití musel pomoct stát. Vzorky bank pro obě tyto skupiny byly
5. mezinárodní konference Řízení a modelování finančních rizik VŠB-TU Ostrava, Ekonomická fakulta, katedra Financí
Ostrava 8. - 9. září 2010
vybírány náhodně na základě veřejně dostupných informací.3 Druhým krokem je určení finančních indikátorů (nezávislých proměnných). Zde byly brány v úvahu finanční ukazatele ze všech hlavních oblastí řízení bank (velikost banky, rentabilita, efektivita, kvalita aktiv a kapitálová přiměřenost), blíže viz Karminsky and Peresetsky (2008). V tabulce 1 jsou uvedeny střední hodnoty vybraných finančních indikátorů pro obě skupiny bank. nezdefaultované banky zdefaultované banky fin. indikátory stř. hodnoty fin. Indikátory stř. hodnoty fin. Indikátory stř. hodnoty fin. Indikátory stř. hodnoty x 1 : LTA x 9 : PE OI x 1 : LTA x 9 : PE OI 15,804 23,21% 11,917 26,62% x 2 : YAEA x 10 : PL GL x 2 : YAEA x 10 : PL GL 5,81% 3,71% 6,65% 15,15% x 3 : CIBL x 11 : LLR GL x 3 : CIBL x 11 : LLR GL 3,30% 1,96% 3,69% 3,24% x 4 : NIM x 12 : PL EQ LLR x 4 : NIM x 12 : PL EQ LLR 3,56% 27,42% 3,15% 39,09% x 5 : ROAA x 13 : T1 x 5 : ROAA x 13 : T1 1,14% 10,70% -4,31% 7,84% x 6 : ROAE x 14 : EQ TA x 6 : ROAE x 14 : EQ TA 7,62% 10,92% -68,13% 5,58% x 7 : IE II x 15 : CAR x 7 : IE II x 15 : CAR 37,87% 12,60% 55,43% 8,35% x 8 : CIR x 16 : D EQ x 8 : CIR x 16 : D EQ 86,81% 7,862 115,54% 15,317
Tab.č. 1: Střední hodnoty finančních indikátorů pro obě skupiny bank
3.2 Odhad modelů Aplikací metodologických východisek z teoretické části na uvedená vstupní data byly odvozeny následující modely: logit model
1 , 1 " exp 7,96 66,87$., " 88,37$G, 45,38$<J, %
probit model (
12345
67
1
1 exp , - . / 02 √2+
! " #$ % 2,2 " 2$., 12,9$G, " 25,8$<J, ΦL2,2 " 2$., 12,9$G, " 25,8$<J, M,
kde $. , $G a $<J značí YAEA (yield on average interest earning assets), ROAA (return on average assets) a PL GL (problem loans on gross loans).4 Tyto modely byly nejprve zpětně aplikovány na výchozí vzorek bank s cílem určit jejich odhadnuté PD. V tabulce 2 a 3 jsou uvedeny odhadnuté střední hodnoty PD (zleva pro logit a probit model) pro obě skupiny bank ze vzorku, na obrázcích 1 a 2 jsou pak graficky znázorněny odhadnuté PD pro každou konkrétní banku ze vzorku (na ose x jsou pořadová čísla bank, kde zhruba prvních 145 bank jsou banky nezdefaultované), opět pro oba modely. nezdafaultované banky stř. hodnoty zdefaultované banky stř. hodnoty 11,28% 90,40% PD PD
Tab.č.2: Střední hodnoty PD (logit model)
3 4
nezdafaultované banky stř. hodnoty zdefaultované banky stř. hodnoty 14,32% 82,50% PD PD
Tab.č.3: Střední hodnoty PD (probit model)
www.federalreserve.gov, www.failedbankreporter.com při eliminaci jednotlivých ukazatelů byla využita stepwise metoda
5. mezinárodní konference Řízení a modelování finančních rizik VŠB-TU Ostrava, Ekonomická fakulta, katedra Financí
Ostrava 8. - 9. září 2010
Z uvedených hodnot v tabulkách a z grafických výsledků je zřejmé, že přestože oba modely rozdělují obě skupiny bank docela dobře (11,28 % a 90,4 % pro logit model, 14,32 % a 82,5 % pro probit model, respektive), vhodnějším modelem pro určování pravděpodobnosti úpadků je v tomto případě logit model. Obr.č.1: Odhadnuté PD (logit model)
Obr.č.2: Odhadnuté PD (probit model)
logit model
probit model
100,00%
100,00%
90,00%
90,00%
80,00%
80,00%
70,00%
70,00%
60,00%
60,00%
50,00%
50,00%
40,00%
40,00%
30,00%
30,00%
20,00%
20,00%
10,00%
10,00%
0,00%
0,00% 0
50
100
150
Non - default banks
200
250
300
0
50
100
Default banks
150 Non-default
200
250
300
Default
Graficky demonstrovat rozdíly mezi oběma modely můžeme také pomocí závislosti tzv. z-score, ! " #$ % , a pravděpodobnosti úpadku. Výsledky můžeme pozorovat na obrázku 3, na obrázku 4 pak ve výřezu pak koncové hodnoty. Obr.č.3: logit vs probit model
Obr.č.4: logit vs probit model (koncové hodnoty)
logit vs probit
logit vs probit 0,20%
100,00%
logit
60,00%
probit 40,00% 20,00% 0,00% -10,00
prob. of default
prob. of default
80,00%
0,15% logit probit
0,10%
0,05%
0,00% -5,00
0,00
5,00
10,00
-9,50
-9,00
Score
-8,50
-8,00
-7,50
-7,00
Score
Z grafických výsledků je vidět, že oba modely mají podobný průběh a kvalitativně dávají obdobné výsledky. Hlavní rozdíl mezi nimi pak spočívá v tom, že logistická regrese (logit model) vykazuje mírně těžší konce. 3.3 Aplikace odhadnutých modelů na kontrolní vzorek bank Dalším krokem je aplikace odhadnutých modelů na kontrolní vzorek 100 amerických komerčních bank, které nebyly obsaženy v původním vzorku, s cílem ověřit úspěšnost odhadnutých modelů. Výsledky jsou opět prezentovány na střeních hodnotách PD (tabulka 4 a 5) pro oba modely a na obrázcích 5 a 6 na grafických vyjádřeních konkrétních PD pro každou banku (na ose x jsou opět pořadová čísla bank, kde prvních 50 bank jsou banky nezdefaultované). nezdefaultované banky PD
stř. hodnoty zdefaultované banky stř. hodnoty 8,44% 85,50% PD
Tab.č.2: Střední hodnoty PD (logit model)
nezdefaultované banky PD
stř. hodnoty zdefaultované banky stř. hodnoty 13,94% 72,79% PD
Tab.č.3: Střední hodnoty PD (probit model)
Z uvedených hodnot je opět patrné, že lepších výsledků při aplikaci na kontrolní vzorek dosahuje logit model, u nezdefaultovaných bank se výsledky oproti odhadnutému modelu o něco zlepšily. Naopak u probit modelu se výsledky pro obě skupiny bank staly mírně horšími.
5. mezinárodní konference Řízení a modelování finančních rizik VŠB-TU Ostrava, Ekonomická fakulta, katedra Financí Obr.č.5: Odhadnuté PD (logit model)
Ostrava 8. - 9. září 2010
Obr.č.6: Odhadnuté PD (probit model)
logit model
probit model
100,0%
100,0%
90,0%
90,0%
80,0%
80,0%
70,0%
70,0%
60,0%
60,0%
50,0%
50,0%
40,0%
40,0%
30,0%
30,0%
20,0%
20,0%
10,0%
10,0%
0,0%
0,0% 0
10
20
30
40
Non - default banks
50
60 Default banks
70
80
90
100
0
10
20
30
40
Non - default banks
50
60
70
80
90
100
Default banks
4. Závěr Pravděpodobnost úpadku jako klíčový parametr při určování ratingu, oceňování kreditních derivátů a určování kapitálové přiměřenosti se v současné době doznívající finanční krize dostává do centra zájmu jak podnikové tak akademické sféry. Tento příspěvek je věnován možnostem určování pravděpodobnosti úpadku komerčních bank dle tzv. credit-scoring modelů, a to konkrétně pomocí regresních logit a probit modelů. Ze vzorku 300 amerických bank byly odhadnuty dva modely, které byly následně zpětně aplikovány na původní vzorek bank a dále byly použity k ověření na kontrolním vzorku 100 amerických komerčních bank. Z dosažených a předložených výsledků lze říci, že oba modely dávají kvalitativně podobné výsledky, přesto hodnoty o logit modelu vycházejí o něco lépe. Hlavní rozdílem obou modelů jsou pak mírně těžší konce u logit modelu.
Literatura [1]
ALTMAN, E. I. Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy. Journal of Finance, September, 1968, 589-609. [2] ALTMAN, E. I., at al. Application of Classification Techniques in Business, Banking and Finance. JAI Press, Greenwich, 1981. [3] BALTHAZAR, L. From Basel 1 to Basel 3: The Integration of State-of-the-Art Risk Modeling in Banking Regulation. New York: Palgrave Macmillan, 2006. 294 p. [4] BEAVER, W. Financial ratios as predictors of failures. Empirical Research in Accounting: Selected Studies – 1966, supplement to Journal of Accounting Research, 4, 1967, 71-111. [5] DURAND, B. Risk elements in consumer installments financing. Working paper, 1941, NBER. [6] ENGELMANN, B., RAUHMEIER, R. (Eds.) (2006): The Basel II Risk Parameters. Springer Verlag, 2006. [7] FISHER, R. The use of multiple measurements in taxonomic problems. Annals of Eugenics, 7, 1936, 179-188. [8] GREEN, W. (2008): Econometric Analysis. 6th ed. Prentice Hall, 2008. [9] GURNÝ, P., GURNÝ, M. (2009): Estimation of PD of financial institutions within linear discriminant analysis. Mathematical Methods in Economics. CZU Praha, 2009. [10] JAKUBÍK, P., TEPLÝ, P. (2008): The Prediction of Corporate Bankruptcy and Czech Economy΄s Financial Stability through Logit Analysis. Institute of Economic Studies Working Paper, no. 19., 2008. [11] KARMINSKY, A., PERESETSKY, A. Models for Moody’s bank rating, BOFIT Discussion Papers 17, 2007.
5. mezinárodní konference Řízení a modelování finančních rizik VŠB-TU Ostrava, Ekonomická fakulta, katedra Financí
Ostrava 8. - 9. září 2010
[12] NEUMAIEROVÁ, I., NEUMAIER, I. (2002). Výkonnost a tržní hodnota firmy. Praha: Grada Publishing. [13] PERETSKY, A., KARMINSKY, A. (2008): Models for Moody’s bank rating, BOFIT Discussion Papers 17, 2008. [14] QUEEN, M., ROLL, R. Firm mortality: using market indicators to predict survival. Financial Analysts Journal 3, 1987, 9–26. [15] RESTI, A., SIRONI, A. Risk management and Shareholders’ value in banking. Chichester: Wiley, 2007, 782 p. [16] SANTOMERO, A., VISNO, J. D. Estimating the probability of failure for commercial banks and the banking system. Journal of Banking and Finance 1, 1977, 185–215.
Summary One of the most important tasks in the risk management, rating estimation, pricing of credit derivatives and many others key financial fields is the correct determination of probability of default (PD) of particular financial subjects. In this paper a possibility of determination of financial institution’s PD according to credit scoring models is discussed. First, in theoretical part, we will briefly introduce the two categories of credit scoring models, which will be afterwards used in application part – logit model and probit model. In the main part of the paper we will work with the sample of almost three hundreds of commercial US banks which will be separate into the groups of defaulted and non-defaulted banks on the basis of historical information. Subsequently, we will stepwise apply the above mentioned models on this sample to derive two models for estimation of PD. The goal of the paper is estimation of the PD of chosen US banks by means of the logit and probit model, discussion of the drawbacks and advantages of these models and comparison of the reached results.