Добавил:

dsk72289 vk.com СтудСклад КубГУ vk.com/studskladrn Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Кубанский Государственный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Laboratornaya_rabota_4

.pdf

Скачиваний:

Добавлен:

11.08.2019

Размер:

719.21 Кб

Скачать

☆

<<< < Предыдущая 12 / 22

11 exp(0,56611) = 1,761 раза выше по сравнению с тем, у кого опыт работы до года. А если опыт свыше 3 лет, то шансы увеличиваются в ехр(1,00276) = 2,726 раза.

Визуализатор ROC-кривая выводит график ROC-кривой, на котором по умолчанию отображаются положение текущего порога отсечения, а также значения чувствительности и специфичности, показатель AUC и типы событий (рис.16). Площадь под кривой равна 0,90 на обучающем множестве и 0,91 – на тестовом, что говорит об очень хорошей предсказательной способности построенной модели.

Рис.16. График ROC-кривой скоринговой модели

Однако оптимальная точка для данной модели не равна 0,78. Максимальная суммарная чувствительность и специфичность достигается в точке 0,76 (для расчета и отображения оптимальной точки необходимо в меню кнопки Тип оптимальной точки выбрать пункт Максимум) (рис.17).

Рис.17. Оптимальная точка Максимум

Для установки нового порога отсечения, равного 0,76, следует перенастроить узел-обработчик логистической регрессии. В этой точке Se = 87 %, Sp = 86 %, что означает: 87% благонадежных заемщиков будут выявлены классификатором, а 100-86 = 14% недобросовестных заемщиков получат кредит. На тестовом множестве наблюдается похожая картина: Se –

85%, Sp = 88%.

В общем случае, проецируя определения чувствительности и специфичности на скоринг (и учитывая, что класс заемщика «хороший» соответствует положительному исходу), можно заключить, что скоринговая модель с высокой специфичностью соответствует консервативной кредитной политике (чаще происходит отказ в выдаче кредита), а с высокой чувствительностью – политике рискованных кредитов. В первом случае минимизируется кредитный риск, связанный с потерями ссуды и процентов и с дополнительными расходами на возвращение кредита, а во втором – коммерческий риск, связанный с упущенной выгодой. Это хорошо иллюстрирует визуализатор Таблица сопряженности (рис.18), которая есть не что иное, как матрица классификации.

а)

б)

Рис.18. Таблицы сопряженности: а – рабочая выборка, б – тестовая выборка

Из таблицы видно, что на обучающем множестве модель чаще отказывала в выдаче кредита «хорошим» заемщикам (224 ошибочных случаев), чем выдавала кредит «плохим» (рис.18, а). На тестовом множестве наблюдается примерно та же картина (см. рис.18, б). Если такая ситуация не устраивает, можно снизить порог отсечения и добиться того, чтобы модель чаще выдавала положительное решение. Процент отказов уменьшится, но возрастет и кредитный риск. Поэтому выбор точки отсечения зависит от поставленных целей – снизить долю «плохих» кредитов или увеличить кредитный портфель, выдавая больше займов.

Визуализатор «Что-если» позволяет увидеть, как будет вести себя построенная модель при подаче на ее вход тех или иных данных. Иначе говоря, проводится эксперимент, в котором, изменяя значения входных полей логистической регрессии, аналитик наблюдает за изменением значений на выходе. Возможность анализа по принципу «Что, если» особенно ценна, поскольку позволяет исследовать правильность работы системы, достоверность полученных результатов, а также ее устойчивость. Визуализатор «Что-если» включает табличное и графическое представления, которые формируются одновременно (рис.19).

Рис.19. Визуализатор «Что-если»

Вверхней части табличного представления отображаются входные поля, а в нижней – выходные и расчетные. Изменяя значения входных полей, аналитик дает команду выполнить расчет и наблюдает рассчитанные значения выходов логистической регрессии.

Вграфическом представлении визуализатора «Что-если» по горизонтальной оси диаграммы откладывается весь диапазон значений текущего поля выборки, а по вертикальной – значения соответствующих выходов модели. На диаграмме «Что-если» видно, при каком значении входа изменяется значение на соответствующем выходе. Если, например, во всем диапазоне входных значений выходное значение для данного поля не изменялось, то диаграмма будет представлять собой горизонтальную прямую

линию. В нашем случае установлена графическая зависимость изменения кредитного рейтинга конкретного клиента от коэффициента О/Д (все остальные входы – константы). Видно, что с увеличением О/Д рейтинг практически линейно падает.

При желании от модели логистической регрессии несложно перейти к скоринговой карте, для чего нужно перевести коэффициенты логистической регрессии в линейную шкалу.

Окончательный сценарий будет иметь следующий вид (рис.20).

Рис.20. Сценарий построения скоринговой модели

<<< < Предыдущая 12 / 22

Соседние файлы в папке Жаркова

#
11.08.201963.19 Кб193.1.docx
#
11.08.2019170.84 Кб45laboratornaya_rabota_1.pdf
#
11.08.2019263.9 Кб21Laboratornaya_rabota_10.pdf
#
11.08.2019328.35 Кб34laboratornaya_rabota_2.pdf
#
11.08.2019296.53 Кб35Laboratornaya_rabota_3.pdf
#
11.08.2019719.21 Кб41Laboratornaya_rabota_4.pdf
#
11.08.20191.36 Mб36Laboratornaya_rabota_5.pdf
#
11.08.2019222.49 Кб45Laboratornaya_rabota_8.pdf
#
11.08.2019223.9 Кб25Laboratornaya_rabota_9.pdf
#
11.08.2019389.81 Кб28Laboratornaya_rabota_N_1.pdf