
2047
.pdf
ных проблем (именно к такими проблемам следует отнести проблемы, связанные с социальными и экономическими системами) [50, 151].
С точки зрения программной реализации СППР представляют собой человеко-машинные комплексы, предназначенные для оказания помощи ЛПР, при решении плохоформализуемых и слабоструктурированных задач в различных проблемных областях. То есть это диалоговая автоматизированная система, использующая правила принятия решений и соответствующие модели с базами данных, а также интерактивный компьютерный процесс моделирования [151].
Общая схема ИСППР, предлагаемая в [151], включает также: помощь ЛПР при оценке состояния управляемой системы и воздействий на нее; выявление предпочтений ЛПР; генерацию возможных решений; оценку возможных альтернатив, исходя из предпочтений ЛПР; анализ последствий принимаемых решений и выбор лучшего с точки зрения ЛПР.
Основные компоненты рассматриваемой технологии, которая определяет структуру разрабатываемой ИСППР представлены на рис. 2.3.
Сбор экспериментальных данных |
|
|
Систематизация данных |
|
|
Поиск модели, объясняющей |
|
|
имеющиеся данные |
|
|
Проверка полученной модели |
|
|
практикой |
|
Да |
|
|
|
Качество модели |
Нет |
Достаточно |
приемлемое? |
|
имеющихся данных |
Да |
|
Нет |
|
|
|
Эксплуатация |
|
Добавление/исключение фактов |
Добавление новых данных
Рис. 2.3. Основные компоненты информационной технологии ИСППР
30

Рис. 2.4. Структура ИСППР (начало)
31

Рис. 2.4. Структура ИСППР (окончание)
В соответствии с представленной технологией была разработана структура ИСППР, которая отражает основные особенности постав-
ленной задачи, а именно, принятия решения о возможности выдачи кредита на основе оценки кредитоспособности соискателя, как совокупной оценки рисков, связанных с субъективным кредитным поведением через определение СПП соискателя, выраженное вербально
32
через СЗП, и рисков, оцененных на основе его платежеспособности
(рис. 2.4). При разработке структуры ИСППР учтены особенности предметной области исследования.
Первоочередной задачей является выявление смысловых ассоциаций или, в терминологии положений семантического эксперимента, слов-значений-признаков (СЗП), образующих семантический слой субъективного опыта – СПП, а также генеза смысла в области кредитных монетарных отношений.
Таким образом, предложенная концепция системы оценки рисков розничного кредитования позволяет перейти от оценки рисков на основе платежеспособности соискателя кредита, исходя только из его финансовой состоятельности, к оценке его кредитоспособности, как совокупной оценке платежеспособности и оценки субъективного кредитного поведения, трактуемой как желание, соединенное с возможностью своевременно погасить выданное обязательство.
Разработанная структура ИСППР отражает основные особенности поставленной задачи принятия решения о выдаче кредита на основании оценки кредитоспособности соискателя через определение СПП соискателя, выраженное вербально через СЗП, и рисков, оцененных на основании платежеспособности соискателя. Это позволяет повысить эффективность процесса оценки соискателя кредита как основного в поддержке принятия решений.
33
Глава 3. ИЗВЛЕЧЕНИЕ И СТРУКТУРИРОВАНИЕ ЗНАНИЙ, ОТРАЖАЮЩИХ СУБЪЕКТИВНОЕ КРЕДИТНОЕ ПОВЕДЕНИЕ
В данной главе определено решение задач по построению СПП КЗ: выбор и применение метода, определение структуры типологии СПП КЗ на основании статистического анализа результатов ассоциативного эксперимента, идентификация и интерпретация образующих СПП слов-значений признаков (СЗП), определяющих типологию КЗ. Разработан алгоритм извлечения и структурирования знаний, отражающих субъективное кредитное поведение с целью автоматизированного формирования анкеты КЗ, который позволяет учитывать отличительные особенности данных, полученных в результате ассоциативного эксперимента, и осуществлять актуальный анализ данных на базе графовой модели типологии КЗ с применением продукционной базы правил (БП).
3.1. Определение структуры СПП для формирования анкеты КЗ
В свете предложенной концепции и в соответствии со структурой, поддерживающей ее, для задачи выявления СПП «хорошего»/«плохого» КЗ на первом этапе следует разработать инструментарий извлечения знаний, что, по мнению авторов [33, 44], является на сегодняшний день существенной проблемой применительно к данной задаче.
Общий алгоритм построения СПП включает три главных этапа: выбор и применение метода; представление структуры семантического пространства; идентификация и интерпретация выделенных структур, кластеров, групп объектов и т.д.
На первом этапе выявления СПП в рассматриваемой предметной области был использован промежуточный вид семантического ассоциативного эксперимента – метод свободных описаний модальных стимулов [27].
Ассоциативный эксперимент состоит в предложении дать на стимулы свободные ассоциации. Такой метод позволяет, что особенно важно на этапе определения СЗП, снять эффект «навязывания» категорий.
34
Целью первого экспериментального исследования является определение структуры СПП путем обобщения ассоциаций с действием «кредит».
Планирование семантического эксперимента осуществлялось с учетом методики, изложенной в работах [27, 107, 122].
При планировании эксперимента обеспечена репрезентативность выборок, которая определяет внешнюю валидность эксперимента ниже перечисленными ограничениями: выборка потенциально «хороших» заемщиков является направленной, то есть респондентами являются случайно выбранные заемщики при условии, что они уже брали кредит и вернули его вовремя; выборка потенциально «плохих» заемщиков является направленной, то есть ответить на вопросы предложено респондентам, которые по тем или иным причинам не вернули кредит вовремя; выборки являются неоднородными по возрасту, полу и образованию; время эксперимента ограничено: испытуемым было предложено дать ассоциативный ряд на стимул «кредит» в течение десяти минут.
Внутренняя валидность эксперимента определяется наложением на выборки четких анкетируемых социально-демографических признаков: пол, возраст, образование, наличие детей.
В результате проведения эксперимента были получены данные, отражающие действие «кредит» в виде ассоциативных рядов, данных респондентами.
Социально-демографические признаки выбраны на основании рекомендаций данных в литературе по социологии и психодиагностике [38, 45, 47, 54, 85], анализа анкет банков и ограниченных возможностей проведения эксперимента: пол – «мужчина» и «женщина»; образование: высшее и средне-специальное; семейное положение: «есть дети», «нет детей»; возраст – до 25 лет, от 25 до 35 лет, от 35 до 45 лет, старше 45 лет. В эксперименте участвовало: всего респондентов – 1520 человек. Выборки сформированы по обозначенным социально-демографическим признакам и наиболее существенному признаку «хорошая/плохая» кредитная история (табл. П.1.1, П.1.2).
Для обработки эксперимента приняты обозначения.
Пусть Y – множество респондентов, Z – множество признаков. Каждый респондент в результате анкетирования дал ряд из ассоциаций, связанных с действием «кредит». Обозначим А – множество всех ассоциаций, данных всеми респондентами, K – количество ассоциаций, участвующих в анализе. Для подготовки данных к анализу
35

были выполнены следующие преобразования: каждому респонденту y Y ставится в соответствие вектор-строка, состоящая из двух подстрок (рис. 3.1).
СПП кре- |
Социально-демографические признаки заемщика |
Кредитная |
|||||||
дитного |
история |
||||||||
заемщика |
|
|
|
|
заемщика |
||||
|
|
|
|
|
|
|
|
|
|
|
СЗП |
Пол |
Образование |
Наличие де- |
Возраст |
|
|||
|
тей |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
A |
|
Z |
||
|
|
Рис. 3.1. Вектор-строка: |
||
A – множество векторов вида |
a |
a1,...,ai ,...,aK , |
||
ai |
1, если слово респондентом названо; |
|||
|
|
|
|
|
|
0, если слово респондентом не названо. |
|||
Множество существенных признаков Z R Z1 Z2 Z3 Z4 , |
||||
где |
|
|
|
|
R r1,r2 , |
r1 |
1 , респондент имеет «хорошую» кредитную |
||
|
историю; |
|||
|
r2 |
0, респондент имеет «плохую» кредитную ис- |
||
Z1 z1,z2 , |
торию. |
|||
z1 |
1, респондент мужчина; |
|||
Z2 z1,z2 , |
z2 |
2, респондент женщина. |
||
z1 |
1, респондент имеет среднее спец. образова- |
|||
|
ние; |
|||
Z3 z1,z2 , |
z2 2, респондент имеет высшее образование. |
|||
z1 |
1, респондент имеет детей; |
|||
Z4 z1,z2,z3,z4 , |
z2 2, респондент не имеет детей; |
|||
z1 |
1, возраст респондента до 25 лет; |
|||
|
z2 |
2, возраст респондента от 25 до 35 лет; |
||
|
z3 3, возраст респондента от 35 до 45 лет; |
|||
|
z4 |
4, возраст респондента свыше 45 лет. |
36
Следует отметить, что выборка респондентов с «плохой» кредитной историей составила 20 человек, что обусловило необходимость дополнения выборки «виртуальными» респондентами. Для создания ассоциативных рядов, данных «виртуальными» респондентами, из полученной в ходе эксперимента выборки, были выбраны респонденты с «плохой» кредитной историей, сгруппированные по социальнодемографическим признакам. Следует определить количество данных ассоциаций респондентами с «плохой» кредитной историей kiВmax и
kВi min , далее задаться числом «виртуальных» респондентов. Случай-
ным образом задается количество ассоциаций kRandВ , которое лежит в
интервале kiВmax kRandВ |
kiВmin . Далее, из подмножества ассоциаций |
|
AВ случайным образом выбираются AВ |
(процедура генерации вы- |
|
|
Rand |
|
борки реализована в приложении MS SQL Server 2005). Таким образом, полученная выборка респондентов с «плохой» кредитной историей составила 100 человек.
Для определения структуры СПП, которое представляет собой пространство СЗП, отражающее субъективное кредитное поведение в связи с социально-демографическими признаками, выдвигаются предположения:
наличие значительных различий в распределении частот СЗП в выборках, представленных по существенным признакам: по имеющейся кредитной истории («хорошая кредитная история» и «плохая кредитная история»); по полу («мужчины» и «женщины»);
наличие сколько-нибудь значительных различий в распределении частот слов-значений в направленных выборках «мужчины» и «женщины» по признакам: возраст, социальное положение – наличие образования.
Фактически, задача состоит в условном разделении множества ответов (обобщение ассоциаций с действием «кредит») на группы, которые определяют принадлежность респондента к определенной социально-демографической группе с «хорошей» или «плохой» кредитной историей.
Анализ данных осуществлен при помощи программного продук-
та Statistica 6.1.
Задача 1. Выявление различий в уровне исследуемого признака – отношение респондентов к действию «кредит» в соответствующих
37
выборках по имеющейся кредитной истории: «хорошая кредитная история» и «плохая кредитная история».
Рассмотрим две смешанные по социально-демографическим признакам выборки, но отличные по значимому признаку – «хорошая кредитная история»(1) и «плохая кредитная история»(2). Поскольку необходимо учитывать наличие неравных по объему выборок, а именно, с «хорошей кредитной историей»(1) nG=1500 человек и «плохой кредитной историей»(2) nG=100 человек, перейдем к относительным частотам встречаемости ассоциаций w, соответствующим каждой группе.
Сформулируем гипотезы:
H0 респонденты принадлежат к одной группе ;
H1 респонденты принадлежат к разным группам .
Принадлежность к одной группе означает, что существенных
различий между распределениями w(1)и w(2) нет, противное утверждение означает наличие существенных различий в распределениях
w(1) и w(2) .
Выбор критериев как правил, обеспечивающих принятие или отклонение гипотез, осуществлен в соответствии с методиками, изложенными в работе [122]. При проверке гипотез по критерию знаков G и T–критерия Вилкоксона отвергнута гипотеза H0, ( p 0,001). Это означает, что респонденты выборки «хорошая кредитная история»(1) отличны в своем представлении действия «кредит» нежели респонденты выборки «плохая кредитная история»(2).
Следует отметить, что рассматриваемые ассоциации возможно условно сгруппировать в рассматриваемых выборках в соответствии с терминологией психодиагностики личности [27] на:
имеющие положительный оттенок (например: «удовольствие», «радость» и т.п.);
имеющие нейтральный оттенок или отражающие рациональное поведение (например: «проценты», «платеж» и т.п.);
означающие упрощение решения проблемы («удобно», «просто», и т.п.);
означающие преувеличение своих возможностей («выгода», «нет проблем» и т.п.);
имеющие негативное отношение (например: «зависимость», «мошенничество» и т.п.);
38
означающие, что потребности превышают возможности (например: «желания», «подарки» и т.п.).
Таким образом, получили упорядоченные выборки по означенным шести группам признаков. Отличия в представлении действия «кредит» значительны и имеют тенденцию, а именно, большим значениям относительных частот ассоциаций, имеющим положительный оттенок, для респондентов выборки «хорошая кредитная история» соответствует значительно меньшие, до полного отсутствия словзначений этой категории, у респондентов выборки «плохая кредитная история». Большим значениям относительных частот встречаемости ассоциаций, означающих упрощение решения проблемы, а также означающих преувеличение своих возможностей, для респондентов выборки «хорошая кредитная история» соответствует значительно меньшие у респондентов выборки «плохая кредитная история». Но, с другой стороны, меньшим значениям относительных частот встречаемости ассоциаций, имеющих нейтральный оттенок или отражающих рациональное поведение, соответствуют значительно большие, чем у респондентов выборки «хорошая кредитная история». То есть респондентам из выборки «хороших» заемщиков свойственно преувеличивать положительную сторону, у «плохих» заемщиков более выражен негативный оттенок, что вполне объяснимо обстоятельствами, в которых они находятся в данный момент времени.
Задача 2. Выявление различий в уровне исследуемого признака – отношение респондентов к действию «кредит» в соответствующих выборках по полу: «мужчины» и «женщины».
Выборки: «мужчины»(3) и «женщины»(4) являются смешанными по всем другим признакам. Далее аналогично первому пункту следует перейти к относительным частотам встречаемости слов-значений.
Сформулируем гипотезы:
H0 респонденты принадлежат к одной группе ;
H1 респонденты принадлежат к разным группам .
Принадлежность к одной группе означает, что существенных различий между распределениями w(3) и w(4) нет, противное утверждение означает наличие существенных различий между распределениями w(3) и w(4) .
При проверке гипотез по критерию знаков G и T–критерия Вилкоксона отвергнута гипотеза H0, ( p 0,0025). Это означает, что рес-
39