Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Диплом ВТБ24 кредитоспособность физических лиц.doc
Скачиваний:
184
Добавлен:
27.03.2016
Размер:
991.74 Кб
Скачать

3.2. Разработка проекта управления рисками кредитования заемщиков – физических лиц

Для оценки и анализа кредитных рисков заемщиков физических лиц в ПАО «ВТБ 24» предлагается использовать логико-вероятностную (ЛВ) теорию риска с группами несовместных событий (ГНС), которая отвечает требованиям соглашения «Базель II» к методам количественной оценки кредитных рисков и резервирования. ЛВ-теория риска с ГНС превосходит существующие скоринговые методики по точности, устойчивости и прозрачности, снижает кредитные потери банка и повышает его конкурентоспособность.

Кредитование является основным видом деятельности банков. Каждый банк индивидуален, так как обслуживает различных клиентов в разных районах и регионах, отраслях и сферах банковских услуг, и должен иметь ЛВ-модели кредитного риска физических и юридических лиц, построенные на собственной статистике. Индивидуальности банков способствует также конкуренция.

В настоящее время на рынке имеются скоринговые методики и программные продукты для оценки кредитного риска на основе линейного и квадратичного дискриминантного анализа, нейронных сетей и data mining. ЛВ-теория кредитного риска с ГНС разительно отличается от распространенных скоринговых методик и имеет следующие особенности: использование логического сложения событий вместо арифметического сложения баллов или других показателей;

- адекватная логическая формулировка сценария кредитного риска;

- применение базы знаний по кредитам в виде системы логических уравнений вместо традиционной базы данных;

- построение логической и вероятностных моделей кредитного риска;

- определение вероятностей событий с учетом ГНС и формулы Байеса;

- корректная формулировка целевой функции для идентификации модели риска по статистическим данным;

- использование специальных логических Software.

- абсолютная прозрачность в оценке и анализе риска кредита, множества кредитов банка и самой модели риска;

- возможность управлять кредитным риском, изменяя асимметрию распознавания хороших и плохих кредитов, число параметров и градаций, описывающих кредит.

Оценка и анализ кредитных рисков состоят из двух частей:

1) построение модели кредитного риска по статистике банка, вычисление атрибутов риска множества кредитов банка и анализ кредитной деятельности банка;

2) оценка риска кредита заемщика, вычисление атрибутов риска и анализ риска кредита.

Логико-вероятностная модель кредитного риска имеет следующие достоинства:

- в два раза большая точность в распознавании хороших и плохих кредитов;

- в семь раз большая робастность (устойчивость классификации кредитов);

Изложим основные положения ЛВ-теории риска неуспеха:

Описание кредита. Кредит описывается параметрами, каждый из которых имеет градации. На практике число параметров может быть до 40, а число градаций в параметре - до 30. Например, кредиты физических лиц в одном из банков описывались следующими признаками (параметрами) и их градациями (табл. 21).

Параметр успешности кредита - Y(2 градации).

Параметры кредита:

Z-l - срок кредита (4 градации);

Z2 - сумма кредита (6);

Таблица 21 - Параметры и градации кредитов физических лиц

Номер признака

Наименование градации

Номер градации

Градации параметра

1

Срок кредита

1

До 6 месяцев

2

От 6 месяцев до 1,5 года

3

От 1,5 года до 5 лет

4

От 5 до 15 лет

2

Сумма кредита

1

До 45 000 руб.

2

От 45 000 до 100 000 руб.

3

От 100 000 до 200 000 руб.

4

От 200 000 до 300 000 руб.

5

От 300 000 до 500 000 руб.

6

Более 500 000 руб.

3

Цель кредита

1

Экспресс-кредиты

2

Потребительский

3

На приобретение жилья

4

Кредитная история в банке

1

Добросовестная кредитная история

2

Приемлемая кредитная история

3

Не пользовался кредитами

5

Владение пластиковыми карта­ми банка

1

Нет карты

2

VIS£ Electron (Cirus/Maestro, ICB-card)

3

VISA Classic (Eurocard/MasterCard Mass)

6

Жилищные условия

1

Наличие в собственности дома, квартиры

2

Проживает в муниципальной квартире, арендует квартиру

3

Другие варианты

7

Наличие в собственности дорогостоящего имущества

1

Нет такого имущества

2

Автомобиль, приобретенный не ранее чем за 3 года до обращения за кредитом

3

Рыночные ценные бумаги на сумму, эквивалентную не менее $1000

8

Возраст заемщика

1

18-25 лет

2

26-50 лет

3

50-75 лет

9

Должностной уровень

1

Менеджер высшего звена, руководитель фирмы

2

Менеджер среднего звена, начальник отдела

3

Специалист высокой квалификации

4

Специалист

10

Стабильность занятости (период работы в указанной компании)

1

До 2 лет

2

От 2 до 4 лет

3

От 4 до 6 лет

4

Свыше 6 лет

11

Доход чистый по основному месту работы

1

До 10 000 руб.

2

От 10 000 до 15 000 руб.

3

От 15 000 до 30 000 руб.

4

От 30 000 до 50 000 руб.

5

От 50 000 и более

12

Количество неработающих членов семьи

1

Нет таковых

2

Менее 2

3

2 и более

Z3 - цель кредита (3);

Z4 - кредитная история в банке (3);

Z5 - владение пластиковыми картами банка (4);

Z6 - жилищные условия (3);

Z7 - наличие дорогостоящего имущества (3);

Z8 - возраст заемщика (3);

Z9 - должностной уровень (4);

Z10 - стабильность занятости (время работы в указанной компании) (4);

Zn - доход по месту работы (5);

Z12 - количество неработающих в семье (3).

Представление статистики банка по кредитам. Статистические данные по кредитам банка рассматриваются как база данных (БД). Однако в ЛВ-теории риска база данных должна быть преобразована в базу знаний (БЗ).

Значения параметров, имеющих непрерывные значения (срок, сумма кредита, возраст и т.д.), разбиваются на интервалы, которым присваиваются номера или градации (параметры 1, 2, 8, 10, 11). То есть целые и дробные значения параметров и параметра эффективности кредита заменены дискретными значениями (градациями).

Данные по кредитам ПАО «ВТБ 24» представляются в табличном виде (табл. 22).

Таблица 22 - Представление статистики по кредитам в виде табличных БД и БЗ

Номер кредита

Параметр 1, Z

Параметр j, Zj

Параметр n, Zn

Параметр эффективности креди­та, Y

1

...

...

2

...

...

...

...

...

i

...

Zjr

...

...

Yr

...

...

...

N

...

...

В строках находятся кредиты i = 1, 2, ..., N. В столбцах таблицы находятся параметры кредита Z1, ..., Zj, ..., Zn.

В свою очередь параметры имеют градации Zjr, r = 1, 2, ..., Nj, j = 1, 2,..., n, находящиеся в клетках таблицы. В последнем столбце находится параметр эффективности кредита Y, имеющий две градации: градация 1 («хороший», кредит возвращен) или градация 0 («плохой», кредит не возвращен).

Таким образом, в таблице выделяются конечные и счетные множества кредитов, параметров для описания кредита и градаций для каждого параметра.

Параметры и градации рассматриваются как случайные величины или события-параметры и события-градации, приводящие с определенной вероятностью к неуспеху кредита. События-градации для каждого параметра образуют ГНС, для которой используются неклассические правила теории вероятностей и формула Байеса.

События-параметры и события-градации обозначим логическими переменными и будем применять к ним правила логического исчисления. В итоге мы получаем систему логических уравнений с левой и правой частями, или систему логических высказываний, или табличную базу знаний.

С каждой логической переменной левой и правой части БЗ свяжем вероятности ее истинности и ложности. Наибольшее возможное число разных событий-кредитов равно произведению чисел градаций N1, N2, ..., Nj, ..., Nn в параметрах, описывающих кредит. Число кредитов в статистике банка должно быть не меньше 20 х n, где n - число параметров для описания кредитов.

Сценарий риска неуспеха кредита является адекватным, ассоциативным и формулируется для всего множества возможных событий (разных кредитов). Неуспех кредита происходит, если возникают какое-либо одно, два или все инициирующие события-параметры. Заметим, что ни одна из известных скоринговых методик не использует такой сценарий риска.

Структурная модель кредитного риска, представленная на рис. 8, описывает многокомпонентную систему из множества кредитов, отдельных кредитов, параметров кредита и градаций параметров.

┌────────────────────┐

┌──────────────────────────────┤ Множество кредитов ├────────────────────┐

│ └─────────┬──────────┘ │

│ │ │

▼ ▼ ▼

┌─────┴────┐ ┌────┴─────┐ ┌────┴─────┐

│ Кредит 1 │ ... ┌──────────┤ Кредит i ├───┐ ... │ Кредит N │

└──────────┘ │ └─┬──────┬─┘ │ └──────────┘

│ │ │ │

┌───────────────┘ │ │ └──────────────┐

│ │ │ │

▼ ▼ ▼ ▼

┌───────┴────┐ ┌──────────┴──┐ ├───────────┐ ┌────┴─────────────────┐

│ Параметр 1 │ ... │ Параметр j │...│Параметр n │ │Параметр успешности Y │

└────────────┘ └┬────┬──┬────┘ └───────────┘ └──┬──┬────────────┬───┘

┌─────────────────────────┘ │ │ ┌─────────┘ │ │

▼ ┌──────────┘ ▼ ▼ ▼ ▼

┌─────────┴────┐ ┌──────────▼───┐ ┌─────┴─────┐ ┌────────┴─┐ ┌──────┴───┐ ┌────┴──────┐

│ Градация 1 │...│ Градация r │...│Градация Nj│ │Градация 1│...│Градация r│...│Градация Nj│

└──────────────┘ └──────────────┘ └───────────┘ └──────────┘ └──────────┘ └───────────┘

Рис. 8. Структурная модель (граф-модель) кредитного риска

Она соответствует сценарию риска неуспеха кредита и описанию кредита с помощью градации параметров. Структурную модель риска называют еще граф-моделью риска. События-параметры и итоговое событие связаны логическими связями «Или». События-градации для каждого события-параметра составляют ГНС.

Событиям-параметрам и событиям-градациям поставлены в соответствие логические переменные с теми же идентификаторами. Логическая переменная Zj равна 1 с вероятностью Рj, если параметр j привел к неуспеху, и равна 0 с вероятностью Qj = 1 - Pj в противном случае. Логическая переменная Zjr, соответствующая градации r параметра j, равна 1 с вероятностью Pjr и равна 0 с вероятностью Qjr = 1 - Pjr. Вектор Z(i) = (Z1 ..., Zj,..., Zn) описывает объект z из таблицы. При задании объекта z вместо логических переменных Z1, ..., Zj, ..., Zn подставляются переменные Zjr для градаций признаков именно этого объекта i. Используется логическое сложение событий.

Логическая функция (Л-модель) риска неуспеха кредита:

Y = Z1 v Z2 v ... v Zj v ... v Zn. (4)

Л-модель риска неуспеха кредита после ее ортогонализации:

Y = Z1 v Z2Z1 v Z3Z2Z1 v ... (5)

В-модель (В-полином) риска неуспеха кредита:

P = P1 + P2Q1 + P3Q1Q2 + ... (6)

«Арифметика» В-модели риска такова, что для события Y величина риска находится в пределах [0,1] при любых значениях вероятностей инициирующих событий-параметров.

Схема классификации кредитов приведена на рис. 9.

«Хорошие» кредиты │ «Плохие» кредиты │

──┼────────────┼──────────────────────────┼────────────────┼───────────────────┼─

│ │ │ │ │

0 Pmin Pad Pmax 1

Рис. 9. Схема классификации кредитов

Риск кредита вычисляется на вероятностной модели кредитного риска, если известны вероятности событий-градаций. Последние определяются при идентификации ЛВ-модели кредитного риска по статистическим данным банка. При решении задачи идентификации вычисляется также допустимый риск Pad по заданному коэффициенту асимметрии распознавания хороших и плохих кредитов.

Задача идентификации В-модели риска сформулирована следующим образом.

Заданы: таблица статистических данных о кредитах, имеющая N кредитов, из которых Ng хороших и Nb плохих кредитов, и В-модель риска (3).

Требуется определить: вероятности Pjr, r = 1, 2, ..., Nj, j = 1, 2, ..., n событий-градаций и допустимый риск Pad, разделяющий кредиты на хорошие и плохие.

Целевая функция: максимизация числа корректно классифицируемых кредитов:

F = Nbb + Ngg, ─► MAXPir (7)

где Ngg, Nbb - соответственно числа кредитов, классифицируемых как хорошие и плохие и статистикой, и В-моделью (совпадающие оценки).

Из выражения (4) следует, что точность В-модели риска в классификации хороших Еg и плохих кредитов Еb и в целом Еm равна:

Eg = (Ng - Ngg) / Ng, (8)

Eb = (Nb - Nbb) / Nb;

Em = (N - F) / N.

Допустимый риск Pad определяется при заданном отношении некорректно классифицируемых хороших и плохих кредитов из-за неэквивалентности ущерба при их неправильной классификации:

Egb = (Ng - Ngg) / (Nb - Nbb). (9)

Задача идентификации является нелинейной задачей оптимизации и решается алгоритмическим итеративным методом с использованием моделирования Монте-Карло или градиентов.

Прозрачность риска кредита и результатов оценки и анализа кредитной деятельности банка обеспечивается вычислением вкладов параметров и градаций в риск кредита, в средний риск всего множества кредитов банка и в точность (целевую функцию) модели кредитного риска. Вклады определяются вычислением разности между значениями характеристик после идентификации ЛВ-модели и значений этих характеристик при придании соответствующим вероятностям событий-градаций нулевых значений.

Таким образом, на каждом уровне структурной модели риска вычисляются следующие характеристики (атрибуты) кредитного риска:

1) количественные оценки риска градации параметра кредита:

- вероятность неуспеха для кредита;

- относительная вероятность неуспеха среди градаций параметра;

- вероятность-частота в множестве кредитов;

- вклад в точность модели риска;

2) количественные оценки риска параметра кредита:

- средняя вероятность неуспеха;

- структурный вес и значимость в модели риска;

- вклад в риск кредита;

- вклад в средний риск множества кредитов;

3) количественные оценки риска кредита:

- риск неуспеха;

- возможные потери;

- цена за риск;

- вклад в риск множества кредитов;

4) количественные оценки риска множества кредитов:

- допустимый риск;

- средний риск;

- коэффициент асимметрии распознавания хороших и плохих кредитов;

- средние потери;

- допустимые потери;

- число кредитов;

- число опасных кредитов;

- энтропия рисков опасных кредитов.

Эти атрибуты полностью определяют риск и используются для управления кредитной деятельностью банка. По результатам анализа атрибутов риска градаций, параметров, кредитов и множества кредитов возможно оптимизировать саму модель кредитного риска для повышения ее точности с определением оптимального числа параметров, градаций в каждом параметре и асимметрии распознавания хороших и плохих кредитов.

ПАО «ВТБ 24» может использовать простую формулу для цены (процента) за риск кредита:

Ci = Cad + k (Prisk - Pad), (10)

где Сi - стоимость i-го кредита; Cad - цена за допустимый риск;

k - коэффициент.

Технология построения и использования ЛВ-модели кредитного риска включает в себя ряд операций.

1. Табличное «стандартное» представление статистических данных о кредитах.

2. Построение сценарной и структурной моделей кредитного риска.

3. Определение событий-параметров и событий-градаций.

4. Определение групп несовместных событий (ГНС).

5. Дискретизация распределений случайных событий-градаций.

6. Построение логической модели кредитного риска.

7. Ортогонализация логической модели кредитного риска.

8. Построение вероятностной модели кредитного риска.

9. Идентификация (оптимизация) В-модели кредитного риска по статистике банка с учетом ГНС и формулы Байеса.

10. Выбор коэффициента асимметрии распознавания хороших и плохих объектов.

11. Определение допустимого кредитного риска.

12. Вычисление количественных атрибутов риска для градаций, параметров, кредита и множества кредитов.

13. Анализ кредитной деятельности банка по значениям атрибутов риска.

14. Управление кредитной деятельностью банка с назначением оптимального числа параметров, градаций в каждом параметре и асимметрии распознавания кредитов.

Рассмотрим варианты представленной методики:

1. ПАО «ВТБ 24» представляет статистические данные по выданным ранее кредитам. Файл со статистикой в обезличенном виде создается банком самостоятельно, затем архивируется и отправляется по e-mail. Обновление статистики и построение новой ЛВ-модели кредитного риска проводятся периодически через 1-4 квартала.

Форма обезличенного файла по статистике кредитов банка:

N

n

N1, N2, ..., Nn

Y1 Z11 Z21 ... Zn1

Y1 Y12 Z22 ... Zn2

....................

YN ZN2 ZN2 ... ZNn,

где N - число кредитов;

n - число параметров;

N1, N2, ..., Nn - число градаций в каждом параметре;

Y11, Y2, ..., YN - признак успешности кредита (1 - «хороший»; 0 - «плохой»);

Z11, ..., ZNn - значение градаций параметров.

Данные ПАО «ВТБ 24» служат для обучения ЛВ-модели риска. Числа хороших и плохих кредитов подсчитываются по файлу автоматически. Также подсчитываются числа одинаково описанных кредитов и устанавливается, какие градации параметров не используются для описания кредитов. Это позволяет контролировать данные заказа 1 и результаты обучения ЛВ-модели риска. Для кредитного риска юридических лиц категории клиентов представляются в виде градаций 1, 2, 3, ... параметра «Категория клиента». Этот параметр располагается в последнем столбце таблицы, и для него вычисляются дополнительные атрибуты риска.

Построение В-модели кредитного риска банка занимает время до 12 часов. Определяются атрибуты риска для градаций, параметров и множества кредитов, а также показатели качества (атрибуты) модели риска: ее точность и асимметрия распознавания. Для юридических лиц для «категорий клиентов» вычисляются дополнительно следующие атрибуты: частота категорий во всех кредитах, в плохих и хороших кредитах, а также среднее значение риска кредитов для категорий. Это позволяет оценить адекватность разделения клиентов на категории.