Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

текст(all)

.pdf
Скачиваний:
44
Добавлен:
12.04.2015
Размер:
1.72 Mб
Скачать

В) Адаптивность. Нейронные сети обладают способностью адаптировать свои синаптические веса к изменениям окружающей среды. В частности, нейронные сети, обученные действовать в определѐнной среде, могут быть легко переучены для работы в условиях незначительных колебаний параметров среды. Более того, для работы в нестационарной среде могут быть созданы нейронные сети, изменяющие синаптические веса в реальном времени.

Г) Очевидность ответа. В контексте задачи классификации образов можно разработать нейронную сеть, собирающую информацию не только для определения конкретного класса, но и для увеличения достоверности принимаемого решения. Впоследствии эта информация может использоваться для исключения сомнительных решений, что повысит продуктивность нейронной сети.

Д) Контекстная информация. Каждый нейрон сети потенциально может быть подвержен влиянию всех остальных ее нейронов. Как следствие, существование нейронной сети непосредственно связано с контекстной информацией.

Е) Отказоустойчивость. Нейронные сети, облаченные в форму электроники, потенциально отказоустойчивы. Это значит, что при неблагоприятных условиях их производительность падает незначительно. Таким образом, при незначительном повреждении нейронной сети, существенных «сбоев» в работе не произойдѐт.

Ж) Масштабируемость. Параллельная структура нейронных сетей потенциально ускоряет решение некоторых задач.

З) Единообразие анализа и проектирования. Нейронные сети являются универсальным механизмом обработки информации. Это означает, что одно и то же проектное решение нейронной сети может использоваться во многих предметных областях.

И) Аналогия с нейробиологией. Строение нейронных сетей определяется аналогией с человеческим мозгом, который является живым доказательством того, что отказоустойчивые параллельные вычисления не только физически реализуемы, но и являются быстрым и мощным инструментом решения задач.

На наш взгляд, нейронные сети представляют собой новую и весьма перспективную вычислительную технологию, дающую новые подходы к исследованию динамических задач в финансовой области. Первоначально нейронные сети открыли новые воз-

41

можности в области распознавания образов, затем к этому прибавились статистические и основанные на методах искусственного интеллекта средства поддержки принятия решений и решения задач в сфере финансов. Попытаемся дать авторскую характеристику понятия нейронных сетей применительно к процессу организации банковского кредитования. В нашем понимании нейронная сеть – это кибернетический процесс обработки информации о заѐмщике, основанный на методе предварительного обучения, а также накапливающий вновь приобретѐнные знания с целью последующего определения уровня кредитоспособности клиента. Данное определение отличается от традиционного, предлагаемого специалистами в области информационных технологий. В данном случае мы не ставили перед собой задачи раскрывать технологический процесс функционирования нейронной сети. Сформулированное нами определение нацелено на то, чтобы показать сущность процесса нейронной сети при использовании еѐ в процессе определения уровня кредитоспособности.

Проведя обобщѐнный анализ публикаций в зарубежной прессе, посвящѐнных решению проблем из области управления финансами, мы выявили небывалый взлѐт интереса к использованию нейронных сетей в банковской деятельности. Общие темпы роста можно сравнить лишь с распространением персональных компьютеров в конце 80-х годов, причѐм инициаторами бурного роста применений нейронных сетей, как правило, являются самые крупные и солидные кредитные организации, для которых это не только вопрос престижа – использование самой перспективной и наукоѐмкой информационной технологии, но и возможность разнообразить свои традиционные возможности в самых различных областях финансовой деятельности. Безусловно, во все времена объектом повышенного интереса и предметом многочисленных исследований банков являлись такие области, как прогнозирование финансовых событий, автоматизация оценки кредитоспособности клиента, экспертная оценка эффективности инвестиций в тот или иной проект и многое другое. В настоящее время распространение нейросетевых гибридных экспертных систем достигло такого уровня, что по отдельным, самым удачным, нейросетевым экспертным системам банки начинают засекречивать информацию и крайне неохотно распространяют получаемые при этом научные результаты.

42

Популярность нейронных сетей, на наш взгляд, объяснима с той точки зрения, что они более эффективно решают те задачи, которые всегда вызывали интерес банков, но успешное решение которых сдерживалось недостаточно эффективным использованием информационных и вычислительных ресурсов. Финансовые традиционные экспертные системы, по существу, основаны на «инерционном анализе», т.е. используют довольно прямолинейные статистические модели. Нейронные же сети по своей основе нелинейны, не требуют глубокого понимания связей между исходными данными и результатами и обещают большие преимущества перед традиционными методами. Многочисленные эксперименты показывают, что адаптивные сети на коротком промежутке времени всегда лучше предсказывают, чем стандартные «линейные» модели.

В настоящее время многие зарубежные исследовательские центры и кредитные организации проводят работы по исследованию и применению нейросетевой технологии для решения задач прогнозирования финансового состояния потенциальных клиен- тов-заѐмщиков и вероятности их банкротства.

С нашей точки зрения, характерным примером успешного применения нейронных вычислений в банковской сфере является управление кредитными рисками. Как известно, до выдачи кредита банки проводят сложные статистические расчѐты по финансовой надѐжности заѐмщика, чтобы оценить вероятность собственных убытков от несвоевременного возврата финансовых средств. Такие расчѐты обычно базируются на оценке кредитной истории, динамике развития компании, стабильности еѐ основных финансовых показателей и многих других факторов. Некото-

рые крупные банки США (Bank of America, Chase Manhattan Bank of New York) уже опробовали метод нейронных вычислений и пришли к выводу, что та же задача по уже проделанным расчѐтам подобного рода решается быстрее и точнее. Например, в одном из случаев оценки 100 тыс. банковских счетов новая система, построенная на базе нейронных вычислений, определила свыше 90% потенциальных неплательщиков [128].

Способность к моделированию нелинейных процессов, работе с зашумлѐнными данными и адаптивность дают возможность применения нейронных сетей для решения широкого класса финансовых задач. В последние несколько лет в России на основе

43

нейронных сетей было разработано много программных систем для применения в таких вопросах, как операции на товарном рынке, оценка вероятности банкротства банка, оценка кредитоспособности предприятий и т.д.

Программные продукты нейронных сетей охватывают самые разнообразные области вычислительных процессов: распознавание образов, обработка зашумлѐнных данных, дополнение образов, ассоциативный поиск, классификация, оптимизация, прогноз, диагностика, обработка сигналов, абстрагирование, управление процессами, сегментация данных, сжатие информации и т.д.

Несмотря на то, что финансовый рынок в России ещѐ не стабилизирован, рассуждая с математической точки зрения, всѐ-таки можно заметить появление фирм, нуждающихся в использовании статистических методов, отличных от традиционных, а также появление на рынке программных продуктов и вычислительной техники нейропакетов для эмуляции нейронных сетей на компьютерах серии IBM и даже специализированных нейроплат на базе заказных нейрочипов. В частности, в России уже успешно функционирует один из первых мощных нейрокомпьютеров для финансового применения – CNAPS PC/128 на базе 4-х нейроБИС фирмы Alaptive Solutions. По данным фирмы «Тора-центр», в число организаций, использующих нейронные сети для решения своих задач, уже вошли Центробанк, МЧС, МНС, более 30 банков и более 60 финансовых компаний. Некоторые из этих организаций уже опубликовали результаты своей деятельности в области использования нейрокомпьютинга [137].

Применение нейросетевых технологий кредитными организациями Приморского края в настоящее время не распространено. С нашей точки зрения, данное обстоятельство связано с рядом объективных причин: во-первых, отсутствием среди банковских служащих грамотных специалистов, имеющих достаточный уровень знаний в области нейронных сетей; во-вторых, незнание руководства коммерческих банков о преимуществах применения программных продуктов нейронных сетей в процессе оценки кредитоспособности заѐмщиков. На наш взгляд, решение данных проблем представляется довольно простым: местные университеты выпускают достаточное количество специалистов, обладающих теоретическими и практическими знаниями в вопросах нейронных сетей. Коммерческим банкам необходимо только устано-

44

вить договорные отношения с учебными заведениями о дополнительной специализации данных выпускников в области коммерческого кредитования. Что касается заинтересованности руководства кредитных организаций в применении нейронных сетей, то, на наш взгляд, это – временные трудности. В настоящее время в центральных регионах страны применение нейросетевых пакетов приобретает всѐ большую популярность, следовательно, через небольшой промежуток времени заинтересованность в применении данных технологических разработок возникнет и в нашем крае.

В области теории нейронных сетей российская научная школа, которая развивается уже в течение 30 лет, имеет определѐнный приоритет по сравнению с зарубежными исследованиями. Теория нейронных сетей – алгоритмический базис нейрокомпьютеров.

Общая методика синтеза многослойных нейронных сетей была разработана сотрудниками Научного центра нейрокомпьютеров ещѐ в конце 60-х годов и постоянно развивалась в течение 30 лет. В результате в России сформировалось направление в области теории нейронных сетей, которое по ряду параметров превосходит уровень зарубежных работ. Например, были разработаны методы адаптивной настройки нейронных сетей с произвольным видом нейрона и произвольным числом слоев, с различными видами связей между слоями, с различными видами критериев оптимизации, с различными ограничениями на весовые коэффициенты нейронных сетей.

Реализованные в известных зарубежных нейропакетах нейросетевые парадигмы имеют, по крайней мере, два серьѐзных недостатка:

а) они реализуют нейросетевой алгоритм, не адекватный выбранной задаче;

б) достигают локального эффекта на первом этапе использования без возможности улучшения для повышения качества решения задачи.

Нейросетевое предсказание банкротств основано на статистической обработке конкретных примеров банкротств. В такой постановке задача нейросети – самой стать экспертом, определяющим финансовую стабильность корпорации, основываясь исключительно на объективной информации – показателях финан-

45

совой отчѐтности. Обычно от нейросети требуется оценить вероятность банкротства через определѐнный промежуток времени (например через год или через два года) по доступной на данный момент финансовой отчѐтности. В качестве входов используют финансовые индикаторы – отношения балансовых статей, наиболее полно отражающие определѐнные стороны финансового положения фирмы. Изучив опыт сравнительного анализа прогноза банкротств различными методиками, мы выявили:

а) нейросетевое моделирование обеспечивает наилучшую точность предвидения банкротств: порядка 90%, по сравнению с 80–85% точностью для других статистических методик (дискриминантный анализ, логистический анализ и т.д.);

б) при желании можно повысить «подозрительность» нейросети, обеспечив точность выявления банкротов вплоть до 99% – за счѐт снижения требований к ошибкам второго рода (классификации нормальной фирмы как банкрота). Это достигается путѐм увеличения веса ошибки первого рода (классификации банкрота как нормальной фирмы). В зависимости от конкретной практической задачи «подозрительность» сети можно произвольно регулировать;

в) банкротство можно уверенно предсказывать за несколько лет до его фактического наступления, причѐм точность предсказания за два года практически не отличается от точности предсказания за год. Таким образом, неявные сигналы неблагополучия присутствуют в финансовой отчѐтности фирмы задолго до еѐ краха.

Полезность обучения сети на примерах как финансово устойчивых, так и обанкротившихся фирм состоит также в том, что такая сеть вырабатывает дискриминантную функцию – численный показатель финансового здоровья фирмы, меру еѐ устойчивости. Однако устойчивость не является единственно возможным критерием оценки деятельности фирмы. Важно, кроме того, не только состояние фирмы на настоящий момент, но и характеристики существующих тенденций. Здесь значимым может оказаться другой набор факторов, дающий другую оценочную функцию. Так, высокая доходность может обеспечить повышение надѐжности в будущем. Между тем, неясно каким образом можно обучать нейросеть на «будущий успех» при отсутствии такого же чѐткого критерия успеха, каким является банкротство для неудачи.

46

На наш взгляд, эти объективные трудности можно преодолеть, если принять во внимание деятельность конкурирующих предприятий. И именно в сопоставлении с этим сообществом можно говорить о сильных и слабых сторонах еѐ деятельности. Данное обстоятельство определяет возможность комплексной оценки финансового состояния фирмы путѐм систематического сравнения еѐ показателей с показателями остальных участников данного рынка. Такой подход не требует знания готовых расчѐтов, т.к. основан на обучении без учителя (сети Кохонена).

Сравнительный анализ финансового состояния фирм, в отличие от рейтингования, предполагает введение не одной, а нескольких оценочных координат. Это позволяет лучше использовать имеющуюся информацию, более точно позиционировать фирму среди остальных. С другой стороны, для обозримости результатов сравнительного анализа, количество параметров сравнения должно быть по возможности минимальным. В узком смысле «обозримость» требует введения не более двух координат – чтобы относительная позиция фирмы могла быть представлена точкой на двумерной карте, а различные финансовые показатели могли быть визуализированы в виде двумерных поверхностей.

С математической точки зрения эта задача сводится к оптимальному сжатию информации о финансовом состоянии фирмы, т.е. отображении информации минимальным числом параметров при заданном уровне огрубления или минимизации потерь информации при заданном числе обобщенных координат. Для целей визуализации выгодно ограничиться двухпараметрическим представлением. Это уже является значительным преимуществом по сравнению с однопараметрическим рейтингом.

Следующим из возможных методов применения нейронных сетей является решение задачи классификации. Задача классификации представляет собой задачу отнесения образца к одному из нескольких попарно не пересекающихся множеств. Примером таких задач может быть, например, задача определения кредитоспособности клиента банка, задача определения жизнеспособных и склонных к банкротству фирм и т.д. Данный метод также является одним из важнейших в области применения нейронных сетей.

При решении задач классификации необходимо отнести имеющиеся статические единицы (характеристики ситуации на

47

рынке, информация о клиенте) к определѐнным классам. Возможны несколько способов представления данных. Наиболее распространѐнным является способ, при котором статистическая единица представляется вектором. Компоненты этого вектора представляют собой различные характеристики единицы, которые влияют на принятие решения о том, к какому классу можно отнести данное предприятие. Таким образом, на основании некоторой информации о примере необходимо определить, к какому классу его можно отнести. Классификатор относит объект к одному из классов в соответствии с определѐнным разбиением N-мерного пространства, которое называется пространством входов, и размерность этого пространства является количеством компонент вектора.

Прежде всего нужно определить уровень сложности системы. В реальных задачах часто возникает ситуация, когда количество образцов ограничено, что осложняет определение сложности задачи. Можно выделить три основных уровня сложности. Первый (самый простой) – когда классы можно разделить прямыми линиями (или гиперплоскостями, если пространство входов имеет размерность больше двух) – так называемая линейная разделимость. Во втором случае классы невозможно разделить линиями (плоскостями), но их можно отделить с помощью более сложного деления – нелинейная разделимость. В третьем случае классы пересекаются и можно говорить только о вероятностной разделимости.

В идеальном варианте после предварительной обработки мы должны получить линейно разделимую задачу, так как после этого значительно упрощается построение классификатора. К сожалению, при решении реальных задач мы имеем ограниченное количество образцов, на основании которых и производится построение классификатора. При этом мы не можем провести такую предобработку данных, при которой будет достигнута линейная разделимость образцов.

Однако при применении нейронных сетей в практических задачах возникает ряд проблем. Во-первых, заранее не известно, какой сложности (размера) может потребоваться сеть для достаточно точной реализации отображения. Эта сложность может оказаться чрезмерно высокой, что потребует сложной архитектуры сетей. Так, М. Минский и И. Пайперт в своей работе «Персеп-

48

троны» доказали, что простейшие однослойные нейронные сети способны решать только линейно-разделимые задачи [61]. Это ограничение преодолимо при использовании многослойных нейронных сетей. В общем виде можно сказать, что в сети с одним скрытым слоем вектор, соответствующий входному образцу, преобразуется скрытым слоем в некоторое новое пространство, которое может иметь другую размерность, а затем гиперплоскости, соответствующие нейронам выходного слоя, разделяют его на классы. Таким образом, сеть распознает не только характеристики исходных данных, но и «характеристики характеристик», сформированные скрытым слоем.

Для построения классификатора необходимо определить, какие параметры влияют на принятие решения о том, к какому классу принадлежит образец. При этом могут возникнуть две проблемы. Во-первых, если количество параметров мало, то может возникнуть ситуация, при которой один и тот же набор исходных данных соответствует примерам, находящимся в разных классах. Тогда невозможно обучить нейронную сеть, и система не будет корректно работать (невозможно найти минимум, который соответствует такому набору исходных данных). Исходные данные обязательно должны быть непротиворечивы. Для решения этой проблемы, на наш взгляд, необходимо увеличить размерность пространства признаков (количество компонент входного вектора, соответствующего образцу). Но при увеличении размерности пространства признаков может возникнуть ситуация, когда число примеров может стать недостаточным для обучения сети, и она вместо обобщения просто запомнит примеры из обучающей выборки и не сможет корректно функционировать. Таким образом, при определении признаков необходимо найти компромисс с их количеством.

Далее необходимо определить способ представления входных данных для нейронной сети, т.е. определить способ нормирования. Нормировка необходима, поскольку нейронные сети работают с данными, представленными числами в диапазоне 0…1, а исходные данные могут иметь произвольный диапазон или вообще быть нечисловыми данными. При этом возможны различные способы, начиная от простого линейного преобразования в требуемый диапазон и заканчивая многомерным анали-

49

зом параметров и нелинейной нормировкой в зависимости от влияния параметров друг на друга.

Задача классификации при наличии двух классов может быть решена на сети с одним нейроном в выходном слое, который может принимать одно из двух значений 0 или 1, в зависимости от того, к какому классу принадлежит образец. При наличии нескольких классов возникает проблема, связанная с представлением этих данных для выхода сети.

Наиболее простым способом представления выходных данных в таком случае является вектор, компоненты которого соответствуют различным номерам классов. При этом i-я компонента вектора соответствует i-му классу. Все остальные компоненты при этом устанавливаются в 0. Тогда, например, второму классу будет соответствовать 1 на 2 выходе сети и 0 на остальных. При интерпретации результата обычно считается, что номер класса определяется номером выхода сети, на котором появилось максимальное значение. Например, если в сети с тремя выходами мы имеем вектор выходных значений (0,2; 0,6; 0,4), то мы видим, что максимальное значение имеет вторая компонента вектора, значит класс, к которому относится этот пример, – 2-й. При таком способе кодирования иногда вводится также понятие уверенности сети в том, что пример относится к этому классу.

Наиболее простой способ определения уверенности заключается в определении разности между максимальным значением выхода и значением другого выхода, которое является ближайшим к максимальному. Например, для рассмотренного выше примера уверенность сети в том, что пример относится ко второму классу, определится как разность между второй и третьей компонентой вектора и будет равна 0,6 – 0,4 = 0,2. Соответственно, чем выше уверенность, тем больше вероятность того, что сеть дала правильный ответ. Этот метод кодирования является самым простым, но не всегда самым оптимальным способом представления данных.

Известны и другие способы. Например, выходной вектор представляет собой номер кластера, записанный в двоичной форме. Тогда при наличии 8-ми классов нам потребуется вектор из 3- х элементов, и, скажем, 3-му классу будет соответствовать вектор (0; 1; 1). Но при этом в случае получения неверного значения на одном из выходов мы можем получить неверную классификацию

50