Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Раздел_4.doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
1.42 Mб
Скачать

4.2 Разделение в диагностическом пространстве

Ранее рассматривались линейные разделяющие функции. Во многих случаях можно получить эффективное разделение (распознавание), используя разделяющие функции более сложного вида [4.1].

4.2.1 Разделяющая функция общего вида и диагностическое пространство.

Рассматривается распознавание образов двух классов (диагнозов D1 и D2) с помощью разделяющей функции общего вида [4.1]:

(4.42)

причем

при f(x)>0 ; при f(x)<0 (4.43)

где х – вектор, изображающий объект в пространстве признаков.

В равенстве (4.42) скалярные функции векторного аргумента φi(x) выбираются заранее, коэффициенты λi подлежат определению. Введем в рассмотрение диагностическое пространство размерности ν, координаты точек которого

zi = φ,(x) (i = 1, 2, , v). (4.44)

В обычном пространстве признаков объект характеризуется вектором х {x1, x2,..., xN} или «расширенным» вектором х{x1, x2,..., xN, 1}. В диагностическом пространстве объект описывается вектором z = х{z1, z2,..., zv}. Равенство (4.44) устанавливает преобразование пространства признаков в диагностическое пространство. Такое преобразование целесообразно, если позволяет более просто осуществить разделение областей диагнозов.

4.2.2 Построение разделяющей функции.

Разделяющая функция будет построена, если определены коэффициенты λi. Эти коэффициенты могут быть найдены в процессе обучения с помощью показа образцов из обучающей последовательности [4.1]. Наиболее простой способ – использование алгоритмов для линейной разделяющей функции в диагностическом пространстве.

После первого образца x(1) или в диагностическом пространстве образца z(1) разделяющая функция в диагностическом пространстве

(4.45)

соответственно в пространстве признаков

(4.46)

Для (n + l)-гo приближения разделяющей функции можно записать

(n = 0, 1, 2, ...), (4.47)

где при x(n+1) D1

(4.48)

При x(n+1) D1 принимается

(4.49)

Отметим, что f(0)(x)=0, а значения f(1) (x) определяются равенством (4.46). Для коэффициентов разложения λi (компонентов весового вектора) в равенстве (4.42) получаем следующие значения в процессе последовательных приближений:

(4.50)

причем при n=0 λi(0)=0. Если существует линейное paзделение в диагностическом пространстве (при конечном значении v) или представление (4.42) в пространстве признаков, то указанная процедура приводит к (конечному) вектору λ. Из условия существования конечного вектора следует

(4.51)

Это ограничение существенно для бесконечномерного диагностического пространства (v = ∞).

4.2.3 Выбор функций φі(х).

Функции φі(х) должны обеспечивать возможность представления в виде ряда (4.42) достаточно широкого класса функций, так как сама разделяющая функция заранее неизвестна. Естественно, что для разделяющих функций сложного вида число членов ряда (4.42) должно возрастать и в пределе диагностическое пространство будет бесконечным:

(4.52)

В силу условия (4.51) λi → 0 при i → ∞. Для функций скалярного аргумента х разложение (4.52) заведомо возможно для всех практически встречающихся функций

(4.53)

В этом случае в качестве функций {φі(х)} может быть выбрана какая-либо полная система ортогональных функций (например, разложение в ряд Фурье и т. п.). Для скалярных функций векторного аргумента возможно разложение по ортогональным функциям более сложной структуры. Однако в практических задачах использование ортогональных функций не обязательно, так как ряд (4.24) всегда должен иметь конечное число членов. Один из простейших способов образования функции φі(х) выражается равенством

(4.54)

Если в правой части равенства (4.54) оставить только первый член, получаем обычную линейную разделяющую функцию. Можно использовать размерность диагностического пространства v большую, чем размерность пространства признаков N. Тогда первая группа признаков представляет функции вида (4.54), вторая группа содержит попарные комбинации двух признаков xi + xj, xi – xj , xi xj и их степени и т. п. Возможен и другой подход к выбору «координатных» функций, если принять

(4.55)

При удачном выборе функций φі(х) размерность диагностического пространства может оказаться небольшой.

4.2.4 Использование диагностических комплексов (симптомов).

Один из важных способов преобразования пространства признаков в диагностическое пространство – использование логических функций. Очень часто диагностическое значение имеет не наличие или отсутствие какого-либо признака, а появление или непоявление некоторого комплекса признаков. Предположим, объект характеризуется тремя простыми признаками х1, х2, х3, причем наличию признаков соответствует 1, отсутствию – 1 (0 означает отсутствие обследования).

Предположим, для диагноза Di характерно наличие первого или второго признака и отсутствие третьего. Тогда можно выбрать одномерное диагностическое пространство

(4.56)

Разделяющая функция в этом случае будет чрезвычайно простой: при z>0 x D1 при z<0 x D2. При использовании диагностических комплексов диагностическое пространство обычно описывается простыми (бинарными) признаками (наличие или отсутствие комплексов). В алгоритме обучения распознавания образов «Кора» используются комплексы простых признаков типа (4.56) – конъюнкции нескольких признаков.

С помощью перебора различных конъюнкций (заранее выбранной размерности) для признаков объектов (примеров), входящих в обучающие последовательности, находят диагностически ценные комплексы признаков. Диагностически ценным считается признак, которым обладают некоторые объекты одного класса и ни один из объектов другого класса. Более ценным признается комплекс, который встречается в большом числе объектов обучающей последовательности данного класса.

Если обратно v наиболее значимых признаков, то можно построить линейную разделяющую функцию

(4.57)

где λi = 1 – для признаков первого состояния и λi = –1 – для признаков второго состояния.

Эта разделяющая функция относит объект к одному из двух состояний, в зависимости от числа признаков данного состояния, которым обладает объект. Если он имеет признаков первого состояния больше, чем второго, то объект относится к первому состоянию.

Аналогично при f (z) > 0 z D1; при f (z) < 0 z D1. Таким образом, алгоритм «Кора» может быть отнесен к алгоритмам с линейной разделяющей функцией в диагностическом пространстве.

4.2.5 Метод трубок

Объект описывается простыми признаками и представляет собой одну из вершин N-мерного единичного куба, 1 – наличие признака, 0 – отсутствие признака. Различаются два состояния . Для образования характерного для каждого состояния комплекса признаков используются объекты из обучающих последовательностей [4.3].

Если – некоторый объект (точка в пространстве признаков), то трубкой с центром в точке и радиусом называется множество точек, для которых расстояние до центра

(4.58)

Признаки считаются существенными, если частота их появления

(4.59)

В практических расчетах можно принимать

Процесс распознавания состоит в построении трубок для элементов (объектов) обучающих последовательностей Для построения трубок Т используется итерационный алгоритм. Выбирается произвольный элемент из обучающей последовательности, например находится радиус трубки r такой, для которого разность становится наибольшей ( – число объектов, входящих в множество А). В трубке сохраняются только существенные признаки. Таким образом, в трубку могут входить объекты, имеющие комплекс определенных признаков, находящийся в окрестности центра трубки.

Трубка называется чистой, если в нее входят некоторые из объектов данного состояния и не входят объекты другого состояния. Предъявленный для распознавания объект относится к состоянию если он входит в трубки состояния и не входит в трубки состояния . Используемый метод оценки существенности признаков [условие (4.59)] можно улучшить, если сопоставить частоты появления признаков при двух состояниях. Существенными следует признать признаки, частоты встречаемости которых для двух состояний заметно различаются.

В заключение отметим, что в настоящее время достаточно эффективные общие процедуры отыскания диагностически ценных комплексов отсутствуют, однако часто инженерные и интуитивные соображения, особенно в задачах технической и медицинской диагностики, помогают найти диагностически ценные комплексы и существенно снизить размерность диагностического пространства. Отметим также методы теории подобия, позволяющие образовывать безразмерные комплексы признаков.