Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
АНИ ДИПЛ (1).doc
Скачиваний:
23
Добавлен:
13.02.2015
Размер:
331.78 Кб
Скачать

3.2. Применение аналитических инструментов Data Mining для оценки кредитоспособности заемщика в Сбербанке

Вообще говоря, влияние макроэкономики редко учитывается при оценке кредитного риска. Исследование влияния макроэкономических показателей на риск неплатежа с помощью средств Data Mining показало, что, к примеру, увеличение ВВП на 1% уменьшает на 1% кредитный риск, увеличение уровня безработицы на 1% увеличивает на 0.7% кредитный риск.

Таким образом, целью данного пункта работы, является разработка нового метода проведения анализа личных данных заёмщиков банков рынка потребительского кредитования для определения их кредитоспособности. Рассмотрим подробнее, описание предлагаемого нами метода оценки кредитоспособности заёмщика с использованием средств Data Mining.

Суть метода заключается в комплексном использовании средств DataMining. В нашем работе использовались методы анализа системы бизнес-аналитики DeductorStudio: замена данных (замена значений по таблице подстановки, которая содержит пары, состоящие из исходного значения и выходного значения), калькулятор (возможность задавать формулы для полей, назначение у которых является выходным, а так же добавлять новые поля), фильтрация (указывается условие, по которому нужно выполнить отбор для данного поля).

Для реализации предложенного метода использовалась таблица с клиентской базой банка. Состав и содержание данных таблицы вытекают из понятия кредитоспособности, т.е. они должны отразить финансово-хозяйственное состояние физических лиц с точки зрения эффективности размещения и использования заёмных средств и всех средств вообще, оценить способность и готовность заёмщика совершать платежи и погашать кредиты в заранее определённые сроки. Важную роль в определении кредитоспособности физического лица играет не столько его способность возвратить долг, сколько готовность возвращать кредит и уплачивать проценты вовремя. Готовность эта у всех различна и зависит она от личных особенностей каждого человека. Этими особенностями могут быть образование, социальный класс, семейное положение, стаж работы и т. д.

Таблица с клиентской базой банка содержит в себе следующие данные:

  1. Дата – дата поступления данных о клиенте для последующего анализа кредитоспособности.

  2. Фамилия заёмщика.

  3. Имя заёмщика.

  4. Отчество заёмщика.

  5. Сумма кредита – размер желаемой ссуды.

  6. Размер ежемесячного платежа.

  7. Количество лет проживания в регионе.

  8. Социальный статус

  9. Социальный статус супруга (наличие постоянной работы).

  10. Образование – высшее/среднее/неоконченное высшее.

  11. Стаж работы – количество лет работы.

  12. Личный доход в месяц после налогообложения (для пенсионеров – размер пенсии).

  13. Рыночная стоимость автомобиля.

  14. Рыночная стоимость недвижимости.

  15. Наличие положительной кредитной истории – своевременные выплаты долга с процентами.

  16. Заключение из нарко- и психодиспансера.

  17. Наличие судимости.

  18. Размер отягощения алиментными обязанностями.

  19. Количество детей.

  20. Наличие освобождения от воинской обязанности.

Применение средств Data Mining.

На этом этапе работы активно используется средство прогнозного моделирования и извлечения знаний DeductorStudio, которое включает в себя алгоритмы решения задач DataMining: ассоциация, кластеризация, классификация и регрессия. Применяются также алгоритмы машинного обучения и математической статистики, неоднократно показавшие свою эффективность при решении практических задач в системах бизнес-аналитики: нейронные сети, деревья решений, логистическая регрессия и др. В предложенном нами методе используются некоторые из этих функций:

  1. «замена данных», которая необходима для вычисления оценки кредитоспособности заёмщика, к числовому формату (например, значение «высшее» в поле «образование» заменить на значение 3, а «среднее» на 2);

  2. «калькулятор», необходимый для определения с помощью математического аппарата оценки кредитоспособности заёмщика;

  3. «фильтрация», позволяет оставлять в наборе данных только ту информацию, которая удовлетворяет заданным условиям.

Подробное описание каждого из вышеперечисленных действий представлено ниже.

Замена данных.

Для использования функции «замена данных», необходимой для реализации предложенного метода, необходимо создать таблицу подстановки. По таблице подстановки производится замена значений, она содержит пары, состоящие из исходного значения и выходного значения. Например, 3 – «высшее образование», 2 – «среднее образование». Для получения точного достоверного результата работы метода необходимо воспользоваться таблицей подстановки (табл. 3).

Таблица 3 - Таблица подстановки для клиентской базы Сбербанка

Поле таблицы

Старое значение

Новое значение

Социальный статус супруга

не работает

0

работает

1

Образование

начальное

1

среднее

2

среднее специальное(техническое)

3

высшее

4

несколько высших

5

Наличие положительной кредитной истории

нет

0

да

1

Заключение из нарко- и психодиспансера

выявлены отклонения/стоит на учёте

0

отклонений не выявлено/ на учёте не стоит

1

Наличие судимости

ранее судим

0

не судим

1

Наличие освобождения от воинской обязанности

нет

1

есть

2

Для каждого значения исходного набора данных ищется соответствие среди исходных значений таблицы подстановки. Если соответствие найдено, то значение меняется на соответствующее выходное значение из таблицы подстановки. Если значение не найдено в таблице, оно может быть либо заменено значением, указанным для замены «по умолчанию», либо оставлено без изменений (если такое значение не указано). Кроме того, можно указать значения, которые нужно вставить вместо пустых ячеек.

Вычисление оценки кредитоспособности заемщика.

Расчёт оценки кредитоспособности состоит из двух частей:

  1. расчёт коэффициента связанного с денежными показателями – CI (Cash indicators);

  2. расчёт коэффициента не связанного с денежными показателями – QI (Qualitative indicators).

Оценка кредитоспособности находится путём сложения этих двух коэффициентов.

Определение выходных данных – категории заёмщика

Заключительным этапом анализа кредитоспособности заёмщиков, является отнесение их к определённым категориям заёмщика. В описываемом методе для определения категории заёмщика по вычисленной оценке его кредитоспособности используется такой инструмент DeductorStudioкак «Фильтрация». Данный инструмент позволят оставлять в наборе данных только те данные, которые удовлетворяют заданным условиям. Структура условия достаточно проста: поле, по значению которого будет производиться фильтрация; собственно условие (знак сравнения и значения с которым сравнивать); логическая операция (логическое «И» или «ИЛИ») в случае сложных условий.

Для определения категории заёмщика, необходимо разбить его оценку кредитоспособности на интервалы (группы) с помощью инструмента «Фильтрация». В предложенном нами методе используется три категории в силу удобства использования такой классификации, т.е. некоторые потенциальные заёмщики будут отнесены к категории «неудовлетворительны», некоторые к «удовлетворительны», а остальные к «рискованным». Нами предложена следующая шкала определение категории кредитоспособности потенциальных клиентов:

  1. Если оценка кредитоспособности больше чем 2,5, то такие заёмщики будут называться «Клиент банка» – физическое лицо, обладающее кредитоспособностью, удовлетворительной для банка.

  2. Если оценка кредитоспособности больше 1, но меньше 2,5, то такие заёмщики будут называться «Сомнительный клиент банка» – физическое лицо, обладающее кредитоспособностью, частично удовлетворительной для банка. В данном случае банк может выдать кредит с риском его возврата.

  3. Если оценка кредитоспособности меньше чем 1, то такие заёмщики будут называться «Не клиент банка» – результаты исследования настоятельно рекомендуют не выдавать кредит такому физическому лицу.

Предложенная шкала является гибкой. Так, если банк не желает рисковать, выдавая потребительские кредиты, то он может повышать коэффициент изменения категории кредитоспособности заёмщика на более высокий уровень. В другом случае, если банк нацелен на повышение количества выданных кредитов, – на низкий уровень.