- •4 Методы разделения в пространстве признаков
- •4.1 Линейные методы разделения
- •4.2 Разделение в диагностическом пространстве
- •4.3 Метод потенциальных функций и метод потенциалов
- •4.4 Метод стохастической аппроксимации
- •4.4.1 Условие сходимости алгоритма последовательных приближений.
- •4.4.2 Структура алгоритма нахождения весового вектора.
- •4.5 Оптимизация системы информационных показателей качества трансформаторного масла, для технического эксплуатационного контроля маслонаполненного энергетического оборудования
- •4.6. Вопросы для контроля
- •4.7 Литература к разделу
- •4.7.1 Основная литература
- •4.7.2 Дополнительная литература
4.2 Разделение в диагностическом пространстве
Ранее рассматривались линейные разделяющие функции. Во многих случаях можно получить эффективное разделение (распознавание), используя разделяющие функции более сложного вида [4.1].
4.2.1 Разделяющая функция общего вида и диагностическое пространство.
Рассматривается распознавание образов двух классов (диагнозов D1 и D2) с помощью разделяющей функции общего вида [4.1]:
(4.42)
причем
при
f(x)>0
;
при
f(x)<0
(4.43)
где х – вектор, изображающий объект в пространстве признаков.
В равенстве (4.42) скалярные функции векторного аргумента φi(x) выбираются заранее, коэффициенты λi подлежат определению. Введем в рассмотрение диагностическое пространство размерности ν, координаты точек которого
zi = φ,(x) (i = 1, 2, , v). (4.44)
В обычном пространстве признаков объект характеризуется вектором х {x1, x2,..., xN} или «расширенным» вектором х{x1, x2,..., xN, 1}. В диагностическом пространстве объект описывается вектором z = х{z1, z2,..., zv}. Равенство (4.44) устанавливает преобразование пространства признаков в диагностическое пространство. Такое преобразование целесообразно, если позволяет более просто осуществить разделение областей диагнозов.
4.2.2 Построение разделяющей функции.
Разделяющая функция будет построена, если определены коэффициенты λi. Эти коэффициенты могут быть найдены в процессе обучения с помощью показа образцов из обучающей последовательности [4.1]. Наиболее простой способ – использование алгоритмов для линейной разделяющей функции в диагностическом пространстве.
После первого образца x(1) или в диагностическом пространстве образца z(1) разделяющая функция в диагностическом пространстве
(4.45)
соответственно в пространстве признаков
(4.46)
Для (n + l)-гo приближения разделяющей функции можно записать
(n
= 0, 1, 2, ...), (4.47)
где при
x(n+1)
D1
(4.48)
При x(n+1) D1 принимается
(4.49)
Отметим, что f(0)(x)=0, а значения f(1) (x) определяются равенством (4.46). Для коэффициентов разложения λi (компонентов весового вектора) в равенстве (4.42) получаем следующие значения в процессе последовательных приближений:
(4.50)
причем при n=0 λi(0)=0. Если существует линейное paзделение в диагностическом пространстве (при конечном значении v) или представление (4.42) в пространстве признаков, то указанная процедура приводит к (конечному) вектору λ. Из условия существования конечного вектора следует
(4.51)
Это ограничение существенно для бесконечномерного диагностического пространства (v = ∞).
4.2.3 Выбор функций φі(х).
Функции φі(х) должны обеспечивать возможность представления в виде ряда (4.42) достаточно широкого класса функций, так как сама разделяющая функция заранее неизвестна. Естественно, что для разделяющих функций сложного вида число членов ряда (4.42) должно возрастать и в пределе диагностическое пространство будет бесконечным:
(4.52)
В силу условия (4.51) λi → 0 при i → ∞. Для функций скалярного аргумента х разложение (4.52) заведомо возможно для всех практически встречающихся функций
(4.53)
В этом случае в качестве функций {φі(х)} может быть выбрана какая-либо полная система ортогональных функций (например, разложение в ряд Фурье и т. п.). Для скалярных функций векторного аргумента возможно разложение по ортогональным функциям более сложной структуры. Однако в практических задачах использование ортогональных функций не обязательно, так как ряд (4.24) всегда должен иметь конечное число членов. Один из простейших способов образования функции φі(х) выражается равенством
(4.54)
Если в правой части равенства (4.54) оставить только первый член, получаем обычную линейную разделяющую функцию. Можно использовать размерность диагностического пространства v большую, чем размерность пространства признаков N. Тогда первая группа признаков представляет функции вида (4.54), вторая группа содержит попарные комбинации двух признаков xi + xj, xi – xj , xi xj и их степени и т. п. Возможен и другой подход к выбору «координатных» функций, если принять
(4.55)
При удачном выборе функций φі(х) размерность диагностического пространства может оказаться небольшой.
4.2.4 Использование диагностических комплексов (симптомов).
Один из важных способов преобразования пространства признаков в диагностическое пространство – использование логических функций. Очень часто диагностическое значение имеет не наличие или отсутствие какого-либо признака, а появление или непоявление некоторого комплекса признаков. Предположим, объект характеризуется тремя простыми признаками х1, х2, х3, причем наличию признаков соответствует 1, отсутствию – 1 (0 означает отсутствие обследования).
Предположим, для диагноза Di характерно наличие первого или второго признака и отсутствие третьего. Тогда можно выбрать одномерное диагностическое пространство
(4.56)
Разделяющая функция в этом случае будет чрезвычайно простой: при z>0 x D1 при z<0 x D2. При использовании диагностических комплексов диагностическое пространство обычно описывается простыми (бинарными) признаками (наличие или отсутствие комплексов). В алгоритме обучения распознавания образов «Кора» используются комплексы простых признаков типа (4.56) – конъюнкции нескольких признаков.
С помощью перебора различных конъюнкций (заранее выбранной размерности) для признаков объектов (примеров), входящих в обучающие последовательности, находят диагностически ценные комплексы признаков. Диагностически ценным считается признак, которым обладают некоторые объекты одного класса и ни один из объектов другого класса. Более ценным признается комплекс, который встречается в большом числе объектов обучающей последовательности данного класса.
Если обратно v наиболее значимых признаков, то можно построить линейную разделяющую функцию
(4.57)
где λi = 1 – для признаков первого состояния и λi = –1 – для признаков второго состояния.
Эта разделяющая функция относит объект к одному из двух состояний, в зависимости от числа признаков данного состояния, которым обладает объект. Если он имеет признаков первого состояния больше, чем второго, то объект относится к первому состоянию.
Аналогично при f (z) > 0 z D1; при f (z) < 0 z D1. Таким образом, алгоритм «Кора» может быть отнесен к алгоритмам с линейной разделяющей функцией в диагностическом пространстве.
4.2.5 Метод трубок
Объект
описывается простыми признаками
и представляет собой одну из вершин
N-мерного
единичного куба, 1 – наличие признака,
0 – отсутствие признака.
Различаются два состояния
.
Для образования характерного
для каждого состояния комплекса признаков
используются
объекты из обучающих последовательностей
[4.3].
Если
– некоторый объект (точка в пространстве
признаков), то трубкой
с
центром в точке
и радиусом
называется множество точек, для которых
расстояние до центра
(4.58)
Признаки считаются существенными, если частота их появления
(4.59)
В
практических расчетах можно принимать
Процесс
распознавания состоит в построении
трубок для элементов (объектов) обучающих
последовательностей
Для построения трубок Т
используется
итерационный алгоритм. Выбирается
произвольный элемент из обучающей
последовательности,
например
находится радиус трубки r
такой, для которого
разность
становится наибольшей (
– число объектов, входящих в множество
А).
В
трубке сохраняются
только существенные признаки. Таким
образом, в
трубку могут входить объекты, имеющие
комплекс определенных признаков,
находящийся в окрестности центра трубки.
Трубка
называется чистой, если в нее входят
некоторые из объектов
данного состояния и не входят объекты
другого состояния.
Предъявленный для распознавания объект
относится к состоянию
если он входит в трубки состояния
и не входит в трубки состояния
.
Используемый метод оценки существенности
признаков [условие (4.59)]
можно улучшить, если
сопоставить частоты появления признаков
при двух состояниях.
Существенными следует признать признаки,
частоты
встречаемости которых для двух состояний
заметно различаются.
В заключение отметим, что в настоящее время достаточно эффективные общие процедуры отыскания диагностически ценных комплексов отсутствуют, однако часто инженерные и интуитивные соображения, особенно в задачах технической и медицинской диагностики, помогают найти диагностически ценные комплексы и существенно снизить размерность диагностического пространства. Отметим также методы теории подобия, позволяющие образовывать безразмерные комплексы признаков.
